Как удалить \xa0 из супа в beautifulsoup python ⇐ Python
-
Anonymous
Как удалить \xa0 из супа в beautifulsoup python
В настоящее время я использую Beautifulsoup для анализа HTML-кода веб-страницы.
Чтобы получить текст из элемента, я использую атрибут «.text»: пример: soup.find('p', {'class': 'example'}).text
Но проблема в том, что иногда в результате я получаю «\xa0»: пример: "некоторый текст «\xa0text\xa0»"
Я попробовал использовать функцию replace: пример: soup = BeautifulSoup(driver.page_source.replace('\xa0', ''), "lxml")
ПРИМЕЧАНИЕ. **Я не хочу использовать функцию для каждой анализируемой строки, я бы хотел, чтобы эти символы были уже очищены с самого начала.
В настоящее время я использую Beautifulsoup для анализа HTML-кода веб-страницы.
Чтобы получить текст из элемента, я использую атрибут «.text»: пример: soup.find('p', {'class': 'example'}).text
Но проблема в том, что иногда в результате я получаю «\xa0»: пример: "некоторый текст «\xa0text\xa0»"
Я попробовал использовать функцию replace: пример: soup = BeautifulSoup(driver.page_source.replace('\xa0', ''), "lxml")
ПРИМЕЧАНИЕ. **Я не хочу использовать функцию для каждой анализируемой строки, я бы хотел, чтобы эти символы были уже очищены с самого начала.
Мобильная версия