Polars (Python) не может прочитать символ Юникода U+2019Python

Программы на Python
Ответить
Anonymous
 Polars (Python) не может прочитать символ Юникода U+2019

Сообщение Anonymous »

У меня есть файл JSON, который я пытаюсь прочитать в кадре данных Polars, но постоянно получаю сообщение об ошибке. Мне удалось привязать это к конкретному персонажу, но я не знаю, что с этим делать. Файл JSON больше, но вот файл, урезанный до одной пары ключей:
[
{
"questionId": 123,
"question": "I’m sorry to hear that"
}
]

И вот где я пытаюсь прочитать и проанализировать это:
df = pl.read_json('file.json', infer_schema_length=None)
Что выдает это сообщение об ошибке: Polars.Exceptions.ComputeError: InvalidUtf8 в символе 0
Когда я меняю


символ на обычный ключевой символ ', тогда он нормально считывает содержимое файла, поэтому я думаю, что это символ.
Как мне прочитать содержимое в Polars? Вероятно, возникнут проблемы с загрузкой в ​​базу данных?
Текст из файла file.json:
[
{
"questionId": 92467,
"question": "I’m sorry to hear that you were not satisfied with your [[ENTER PRODUCT NAME HERE]] . Can you provide us some details about why you were not satisfied?"
}
]

Шестнадцатеричный дамп:
0000: 5b 0d 0a 20 20 7b 0d 0a 20 20 20 20 22 71 75 65 [ { "que
0010: 73 74 69 6f 6e 49 64 22 3a 20 39 32 34 36 37 2c stionId": 92467,
0020: 0d 0a 20 20 20 20 22 71 75 65 73 74 69 6f 6e 22 "question"
0030: 3a 20 22 49 e2 80 99 6d 20 73 6f 72 72 79 20 74 : "I...m sorry t
0040: 6f 20 68 65 61 72 20 74 68 61 74 20 79 6f 75 20 o hear that you
0050: 77 65 72 65 20 6e 6f 74 20 73 61 74 69 73 66 69 were not satisfi
0060: 65 64 20 77 69 74 68 20 79 6f 75 72 20 5b 5b 45 ed with your [[E
0070: 4e 54 45 52 20 50 52 4f 44 55 43 54 20 4e 41 4d NTER PRODUCT NAM
0080: 45 20 48 45 52 45 5d 5d 20 2e 20 20 43 61 6e 20 E HERE]] . Can
0090: 79 6f 75 20 70 72 6f 76 69 64 65 20 75 73 20 73 you provide us s
00A0: 6f 6d 65 20 64 65 74 61 69 6c 73 20 61 62 6f 75 ome details abou
00B0: 74 20 77 68 79 20 79 6f 75 20 77 65 72 65 20 6e t why you were n
00C0: 6f 74 20 73 61 74 69 73 66 69 65 64 3f 22 0d 0a ot satisfied?"
00D0: 20 20 7d 0d 0a 5d } ]


Подробнее здесь: https://stackoverflow.com/questions/798 ... cter-u2019
Ответить

Быстрый ответ

Изменение регистра текста: 
Смайлики
:) :( :oops: :roll: :wink: :muza: :clever: :sorry: :angel: :read: *x)
Ещё смайлики…
   
К этому ответу прикреплено по крайней мере одно вложение.

Если вы не хотите добавлять вложения, оставьте поля пустыми.

Максимально разрешённый размер вложения: 15 МБ.

Вернуться в «Python»