Более того, файл представляет собой однострочную строку.
Файл заканчивается многочисленными ....\x00\ x00\x00
Я пробовал много вариантов чтения файла JSON с контролем ошибок и ручным декодированием, но все равно не могу проанализировать данные в кадре данных pandas.
Последняя идея, на которой я остановился: прочитать по строке:
Код: Выделить всё
with open('data.json', 'r', encoding='utf-8') as f:
dt = f.read()
Есть ли другие варианты, такие как частичное чтение файла или автоматическое исправление ошибок в структуре json?
Я тоже пробовал такой подход :
Код: Выделить всё
import json
import re
class LazyDecoder(json.JSONDecoder):
def decode(self, s, **kwargs):
regex_replacements = [
(re.compile(r'([^\\])\\([^\\])'), r'\1\\\\\2'),
(re.compile(r',(\s*])'), r'\1'),
]
for regex, replacement in regex_replacements:
s = regex.sub(replacement, s)
return super().decode(s, **kwargs)
with open(r'data.json') as result:
data = json.load(result, cls=LazyDecoder, strict=False)
Подробнее здесь: https://stackoverflow.com/questions/793 ... -json-file
Мобильная версия