Кодек 'charmap' не может декодировать байт 0x8d в позиции 33222: символы отображаются в <undefined> [дубликат]

Кодек 'charmap' не может декодировать байт 0x8d в позиции 33222: символы отображаются в [дубликат] ⇐ Python

1 сообщение • Страница 1 из 1

Anonymous

Кодек 'charmap' не может декодировать байт 0x8d в позиции 33222: символы отображаются в [дубликат]

Цитата

Сообщение Anonymous » 20 окт 2024, 07:24

Я пытаюсь проанализировать очень длинный HTML-файл с помощью lxml через BeautifulSoup. Я знаю, что кодировка символов html-файла — UTF-8 со спецификацией, но всякий раз, когда я пытаюсь запустить содержимое = f.read(), я получаю следующую ошибку:

'charmap' codec can't decode byte 0x8d in position 33222: character maps to

Это первый (и проблемный) фрагмент моего кода:

from bs4 import BeautifulSoup

with open("doc.html", "r") as f:

contents = f.read()

soup = BeautifulSoup(contents, 'lxml')

print(soup.h2)
print(soup.head)
print(soup.li)

Это сообщение об ошибке:

UnicodeDecodeError Traceback (most recent call last)
in
3 with open("doc.html", "r") as f:
4
----> 5 contents = f.read()
6
7 soup = BeautifulSoup(contents, 'lxml')

~\Anaconda3\lib\encodings\cp1252.py in decode(self, input, final)
21 class IncrementalDecoder(codecs.IncrementalDecoder):
22 def decode(self, input, final=False):
---> 23 return codecs.charmap_decode(input,self.errors,decoding_table)[0]
24
25 class StreamWriter(Codec,codecs.StreamWriter):

UnicodeDecodeError: 'charmap' codec can't decode byte 0x8d in position 33222: character maps to

Подробнее здесь: https://stackoverflow.com/questions/594 ... aps-to-und

1729398294

Anonymous

Я пытаюсь проанализировать очень длинный HTML-файл с помощью lxml через BeautifulSoup. Я знаю, что кодировка символов html-файла — UTF-8 со спецификацией, но всякий раз, когда я пытаюсь запустить содержимое = f.read(), я получаю следующую ошибку:

'charmap' codec can't decode byte 0x8d in position 33222: character maps to 

Это первый (и проблемный) фрагмент моего кода:



from bs4 import BeautifulSoup

with open("doc.html", "r") as f:

contents = f.read()

soup = BeautifulSoup(contents, 'lxml')

print(soup.h2)
print(soup.head)
print(soup.li)


Это сообщение об ошибке:

    UnicodeDecodeError                        Traceback (most recent call last)
 in 
3 with open("doc.html", "r") as f:
4
----> 5     contents = f.read()
6
7     soup = BeautifulSoup(contents, 'lxml')

~\Anaconda3\lib\encodings\cp1252.py in decode(self, input, final)
21 class IncrementalDecoder(codecs.IncrementalDecoder):
22     def decode(self, input, final=False):
---> 23         return codecs.charmap_decode(input,self.errors,decoding_table)[0]
24
25 class StreamWriter(Codec,codecs.StreamWriter):

UnicodeDecodeError: 'charmap' codec can't decode byte 0x8d in position 33222: character maps to 
 

Подробнее здесь: [url]https://stackoverflow.com/questions/59444702/charmap-codec-cant-decode-byte-0x8d-in-position-33222-character-maps-to-und[/url]

Ответить Пред. тема След. тема

1 сообщение • Страница 1 из 1

Быстрый ответ

Заголовок:

Имя пользователя:

Изменение регистра текста:

Смайлики

Ещё смайлики…

К этому ответу прикреплено по крайней мере одно вложение.

Если вы не хотите добавлять вложения, оставьте поля пустыми. Можно прикреплять файлы, перетаскивая их в окно сообщения.

Максимально разрешённый размер вложения: 15 МБ.

Имя файла:

Комментарий к файлу:

Имя файла	Комментарий к файлу	Размер	Статус

Похожие темы

Ответы

Просмотры

Последнее сообщение

UnicodeDecodeError: кодек 'charmap' не может декодировать байт 0x81 в позиции 55: символы отображаются в

Последнее сообщение Anonymous « 03 дек 2024, 18:00
Добавлено в форуме Python

Anonymous » 03 дек 2024, 18:00 » в форуме Python

Я новичок в Python и надеюсь, что кто-нибудь объяснит мне, что означает сообщение об ошибке.

Если быть точным, у меня есть некоторый код Python и SPSS, объединенный вместе, сохраненный в Atom, который был создан моим бывшим коллегой. Теперь,...

0 Ответы

33 Просмотры

Последнее сообщение Anonymous
03 дек 2024, 18:00
Mimic3: UnicodeDecodeError: кодек 'charmap' не может декодировать байт 0x90 в позиции 707: символы отображаются в <undef

Последнее сообщение Anonymous « 13 ноя 2024, 17:31
Добавлено в форуме Python

Anonymous » 13 ноя 2024, 17:31 » в форуме Python

Я хочу загрузить mimic3 для своего проекта Tts, но всегда получаю сообщение об ошибке
File C:\Python311\Lib\pathlib.py , line 1059, in read_text
return f.read()
^^^^^^^^
File C:\Python311\Lib\encodings\cp1252.py , line 23, in decode
return...

0 Ответы

44 Просмотры

Последнее сообщение Anonymous
13 ноя 2024, 17:31
Как исправить ошибку «UnicodeDecodeError: кодек «charmap» не может декодировать байт 0x9d в позиции 29815: символы отобр

Последнее сообщение Anonymous « 03 окт 2024, 14:59
Добавлено в форуме Python

Anonymous » 03 окт 2024, 14:59 » в форуме Python

В настоящий момент я пытаюсь заставить программу Python 3 выполнять некоторые манипуляции с текстовым файлом, заполненным информацией, через Spyder IDE/GUI. Однако при попытке прочитать файл я получаю следующую ошибку:

File , line 77, in...

0 Ответы

41 Просмотры

Последнее сообщение Anonymous
03 окт 2024, 14:59
Кодек 'charmap' не может кодировать символы в позициях 214–215: символы сопоставляются с

Последнее сообщение Anonymous « 29 сен 2024, 07:43
Добавлено в форуме Python

Anonymous » 29 сен 2024, 07:43 » в форуме Python

Я пытаюсь перевести текст с английского с турецкого, используя библиотеку Googletrans, и просто распечатать его. Но иногда я получаю эту ошибку. Я не смог решить эту проблему.
Код:
lin = translator.translate(line, dest= tr , src= en )
print(lin)...

0 Ответы

18 Просмотры

Последнее сообщение Anonymous
29 сен 2024, 07:43
Кодек «utf-8» не может декодировать байт 0xf3 в позиции 85: неверный байт продолжения [дубликат]

Последнее сообщение Anonymous « 05 авг 2024, 20:14
Добавлено в форуме Python

Anonymous » 05 авг 2024, 20:14 » в форуме Python

У меня есть служба fastapi с подключением к pgadmin POSTGRESQL.
Этот код — это то, как я вызываю базу данных в модуле служб:
def get_agencies(self):
result = self.db.query(AgencyModel).all()
return result

Но служба возвращает такую ошибку:...

0 Ответы

39 Просмотры

Последнее сообщение Anonymous
05 авг 2024, 20:14

Вернуться в «Python»