Кодирование данных SAS в формате ANSI в Python ⇐ Python
-
Гость
Кодирование данных SAS в формате ANSI в Python
Я пытаюсь импортировать данные SAS объемом 4 ГБ в Python. Внутри находится информация о фирмах, включая названия и другие коды. Однако, похоже, произошла ошибка с кодировкой.
Я пытаюсь использовать read_sas в пакете pandas. Однако когда я использую encoding = "UTF-8", появляется сообщение об ошибке: "кодек 'utf-8' не может декодировать байт 0xc2 в позиции 249: неожиданный конец данных "
И я также пытаюсь указать encoding = "mbcs", потому что когда я использую содержимое процедуры для проверки моего файла sas, он говорит, что файл закодирован в формате ANSI. Но в названиях компаний (которые для меня являются наиболее важными объектами) отображаются такие символы. >
Есть ли у вас идеи, как мне решить проблему? Любое возможное решение приветствуется.
Спасибо!
Я пытаюсь импортировать данные SAS объемом 4 ГБ в Python. Внутри находится информация о фирмах, включая названия и другие коды. Однако, похоже, произошла ошибка с кодировкой.
Я пытаюсь использовать read_sas в пакете pandas. Однако когда я использую encoding = "UTF-8", появляется сообщение об ошибке: "кодек 'utf-8' не может декодировать байт 0xc2 в позиции 249: неожиданный конец данных "
И я также пытаюсь указать encoding = "mbcs", потому что когда я использую содержимое процедуры для проверки моего файла sas, он говорит, что файл закодирован в формате ANSI. Но в названиях компаний (которые для меня являются наиболее важными объектами) отображаются такие символы. >
Есть ли у вас идеи, как мне решить проблему? Любое возможное решение приветствуется.
Спасибо!
Мобильная версия