Как удалить \xa0 из супа в beautifulsoup python

Как удалить \xa0 из супа в beautifulsoup python ⇐ Python

1 сообщение • Страница 1 из 1

Anonymous

Как удалить \xa0 из супа в beautifulsoup python

Сообщение Anonymous » 04 янв 2024, 19:57

В настоящее время я использую Beautifulsoup для анализа HTML-кода веб-страницы.

Чтобы получить текст из элемента, я использую атрибут «.text»: пример: soup.find('p', {'class': 'example'}).text

Но проблема в том, что иногда в результате я получаю «\xa0»: пример: "некоторый текст «\xa0text\xa0»"

Я попробовал использовать функцию replace: пример: soup = BeautifulSoup(driver.page_source.replace('\xa0', ''), "lxml")

ПРИМЕЧАНИЕ. **Я не хочу использовать функцию для каждой анализируемой строки, я бы хотел, чтобы эти символы были уже очищены с самого начала.

Anonymous

1 сообщение • Страница 1 из 1

Вернуться в «Python»