Кодирование данных SAS в формате ANSI в PythonPython

Программы на Python
Ответить
Гость
 Кодирование данных SAS в формате ANSI в Python

Сообщение Гость »


Я пытаюсь импортировать данные SAS объемом 4 ГБ в Python. Внутри находится информация о фирмах, включая названия и другие коды. Однако, похоже, произошла ошибка с кодировкой.

Я пытаюсь использовать read_sas в пакете pandas. Однако когда я использую encoding = "UTF-8", появляется сообщение об ошибке: "кодек 'utf-8' не может декодировать байт 0xc2 в позиции 249: неожиданный конец данных "

И я также пытаюсь указать encoding = "mbcs", потому что когда я использую содержимое процедуры для проверки моего файла sas, он говорит, что файл закодирован в формате ANSI. Но в названиях компаний (которые для меня являются наиболее важными объектами) отображаются такие символы. >

Есть ли у вас идеи, как мне решить проблему? Любое возможное решение приветствуется.

Спасибо!
Ответить

Быстрый ответ

Изменение регистра текста: 
Смайлики
:) :( :oops: :roll: :wink: :muza: :clever: :sorry: :angel: :read: *x)
Ещё смайлики…
   
К этому ответу прикреплено по крайней мере одно вложение.

Если вы не хотите добавлять вложения, оставьте поля пустыми.

Максимально разрешённый размер вложения: 15 МБ.

Вернуться в «Python»