У меня есть файл JSON, который я пытаюсь прочитать в кадре данных Polars, но постоянно получаю сообщение об ошибке. Мне удалось привязать это к конкретному персонажу, но я не знаю, что с этим делать. Файл JSON больше, но вот файл, урезанный до одной пары ключей:
[
{
"questionId": 123,
"question": "I’m sorry to hear that"
}
]
И вот где я пытаюсь прочитать и проанализировать это:
df = pl.read_json('file.json', infer_schema_length=None)
Что выдает это сообщение об ошибке: Polars.Exceptions.ComputeError: InvalidUtf8 в символе 0
Когда я меняю
’
символ на обычный ключевой символ ', тогда он нормально считывает содержимое файла, поэтому я думаю, что это символ.
Как мне прочитать содержимое в Polars? Вероятно, возникнут проблемы с загрузкой в базу данных?
Текст из файла file.json:
[
{
"questionId": 92467,
"question": "I’m sorry to hear that you were not satisfied with your [[ENTER PRODUCT NAME HERE]] . Can you provide us some details about why you were not satisfied?"
}
]
Шестнадцатеричный дамп:
0000: 5b 0d 0a 20 20 7b 0d 0a 20 20 20 20 22 71 75 65 [ { "que
0010: 73 74 69 6f 6e 49 64 22 3a 20 39 32 34 36 37 2c stionId": 92467,
0020: 0d 0a 20 20 20 20 22 71 75 65 73 74 69 6f 6e 22 "question"
0030: 3a 20 22 49 e2 80 99 6d 20 73 6f 72 72 79 20 74 : "I...m sorry t
0040: 6f 20 68 65 61 72 20 74 68 61 74 20 79 6f 75 20 o hear that you
0050: 77 65 72 65 20 6e 6f 74 20 73 61 74 69 73 66 69 were not satisfi
0060: 65 64 20 77 69 74 68 20 79 6f 75 72 20 5b 5b 45 ed with your [[E
0070: 4e 54 45 52 20 50 52 4f 44 55 43 54 20 4e 41 4d NTER PRODUCT NAM
0080: 45 20 48 45 52 45 5d 5d 20 2e 20 20 43 61 6e 20 E HERE]] . Can
0090: 79 6f 75 20 70 72 6f 76 69 64 65 20 75 73 20 73 you provide us s
00A0: 6f 6d 65 20 64 65 74 61 69 6c 73 20 61 62 6f 75 ome details abou
00B0: 74 20 77 68 79 20 79 6f 75 20 77 65 72 65 20 6e t why you were n
00C0: 6f 74 20 73 61 74 69 73 66 69 65 64 3f 22 0d 0a ot satisfied?"
00D0: 20 20 7d 0d 0a 5d } ]
Подробнее здесь: https://stackoverflow.com/questions/798 ... cter-u2019
Polars (Python) не может прочитать символ Юникода U+2019 ⇐ Python
Программы на Python
-
Anonymous
1767826239
Anonymous
У меня есть файл JSON, который я пытаюсь прочитать в кадре данных Polars, но постоянно получаю сообщение об ошибке. Мне удалось привязать это к конкретному персонажу, но я не знаю, что с этим делать. Файл JSON больше, но вот файл, урезанный до одной пары ключей:
[
{
"questionId": 123,
"question": "I’m sorry to hear that"
}
]
И вот где я пытаюсь прочитать и проанализировать это:
df = pl.read_json('file.json', infer_schema_length=None)
Что выдает это сообщение об ошибке: Polars.Exceptions.ComputeError: InvalidUtf8 в символе 0
Когда я меняю
’
символ на обычный ключевой символ ', тогда он нормально считывает содержимое файла, поэтому я думаю, что это символ.
Как мне прочитать содержимое в Polars? Вероятно, возникнут проблемы с загрузкой в базу данных?
Текст из файла file.json:
[
{
"questionId": 92467,
"question": "I’m sorry to hear that you were not satisfied with your [[ENTER PRODUCT NAME HERE]] . Can you provide us some details about why you were not satisfied?"
}
]
Шестнадцатеричный дамп:
0000: 5b 0d 0a 20 20 7b 0d 0a 20 20 20 20 22 71 75 65 [ { "que
0010: 73 74 69 6f 6e 49 64 22 3a 20 39 32 34 36 37 2c stionId": 92467,
0020: 0d 0a 20 20 20 20 22 71 75 65 73 74 69 6f 6e 22 "question"
0030: 3a 20 22 49 e2 80 99 6d 20 73 6f 72 72 79 20 74 : "I...m sorry t
0040: 6f 20 68 65 61 72 20 74 68 61 74 20 79 6f 75 20 o hear that you
0050: 77 65 72 65 20 6e 6f 74 20 73 61 74 69 73 66 69 were not satisfi
0060: 65 64 20 77 69 74 68 20 79 6f 75 72 20 5b 5b 45 ed with your [[E
0070: 4e 54 45 52 20 50 52 4f 44 55 43 54 20 4e 41 4d NTER PRODUCT NAM
0080: 45 20 48 45 52 45 5d 5d 20 2e 20 20 43 61 6e 20 E HERE]] . Can
0090: 79 6f 75 20 70 72 6f 76 69 64 65 20 75 73 20 73 you provide us s
00A0: 6f 6d 65 20 64 65 74 61 69 6c 73 20 61 62 6f 75 ome details abou
00B0: 74 20 77 68 79 20 79 6f 75 20 77 65 72 65 20 6e t why you were n
00C0: 6f 74 20 73 61 74 69 73 66 69 65 64 3f 22 0d 0a ot satisfied?"
00D0: 20 20 7d 0d 0a 5d } ]
Подробнее здесь: [url]https://stackoverflow.com/questions/79862746/polars-python-is-unable-to-read-unicode-character-u2019[/url]
Ответить
1 сообщение
• Страница 1 из 1
Перейти
- Кемерово-IT
- ↳ Javascript
- ↳ C#
- ↳ JAVA
- ↳ Elasticsearch aggregation
- ↳ Python
- ↳ Php
- ↳ Android
- ↳ Html
- ↳ Jquery
- ↳ C++
- ↳ IOS
- ↳ CSS
- ↳ Excel
- ↳ Linux
- ↳ Apache
- ↳ MySql
- Детский мир
- Для души
- ↳ Музыкальные инструменты даром
- ↳ Печатная продукция даром
- Внешняя красота и здоровье
- ↳ Одежда и обувь для взрослых даром
- ↳ Товары для здоровья
- ↳ Физкультура и спорт
- Техника - даром!
- ↳ Автомобилистам
- ↳ Компьютерная техника
- ↳ Плиты: газовые и электрические
- ↳ Холодильники
- ↳ Стиральные машины
- ↳ Телевизоры
- ↳ Телефоны, смартфоны, плашеты
- ↳ Швейные машинки
- ↳ Прочая электроника и техника
- ↳ Фототехника
- Ремонт и интерьер
- ↳ Стройматериалы, инструмент
- ↳ Мебель и предметы интерьера даром
- ↳ Cантехника
- Другие темы
- ↳ Разное даром
- ↳ Давай меняться!
- ↳ Отдам\возьму за копеечку
- ↳ Работа и подработка в Кемерове
- ↳ Давай с тобой поговорим...
Мобильная версия