Как открыть файл с некодированными символами utf-8? ⇐ Python
-
Anonymous
Как открыть файл с некодированными символами utf-8?
Я хочу открыть текстовый файл (.dat) в Python и получаю следующую ошибку: Кодек «utf-8» не может декодировать байт 0x92 в позиции 4484: неверный начальный байт но файл закодирован с использованием utf-8, поэтому, возможно, есть какой-то символ, который невозможно прочитать. Мне интересно, есть ли способ решить эту проблему, не вызывая каждый странный символ? Потому что у меня довольно большой текстовый файл, и мне потребуются часы, чтобы найти незакодированный символ в кодировке Utf-8.
Вот мой код
импортировать кодеки f = codecs.open('compounds.dat',coding='utf-8') для строки в f: если "InChI=1S/C11H8O3/c1-6-5-9(13)10-7(11(6)14)3-2-4-8(10)12/h2-5" в строке: печать (строка) файл поиска.закрыть()
Я хочу открыть текстовый файл (.dat) в Python и получаю следующую ошибку: Кодек «utf-8» не может декодировать байт 0x92 в позиции 4484: неверный начальный байт но файл закодирован с использованием utf-8, поэтому, возможно, есть какой-то символ, который невозможно прочитать. Мне интересно, есть ли способ решить эту проблему, не вызывая каждый странный символ? Потому что у меня довольно большой текстовый файл, и мне потребуются часы, чтобы найти незакодированный символ в кодировке Utf-8.
Вот мой код
импортировать кодеки f = codecs.open('compounds.dat',coding='utf-8') для строки в f: если "InChI=1S/C11H8O3/c1-6-5-9(13)10-7(11(6)14)3-2-4-8(10)12/h2-5" в строке: печать (строка) файл поиска.закрыть()
Мобильная версия