Как преобразовать файл csv в файл ipc со стрелкой apache со словарной кодировкойPython

Программы на Python
Ответить Пред. темаСлед. тема
Anonymous
 Как преобразовать файл csv в файл ipc со стрелкой apache со словарной кодировкой

Сообщение Anonymous »

Я пытаюсь использовать pyarrow для преобразования CSV в IPC со стрелкой Apache с включенным словарным кодированием. Появится следующее для преобразования CSV в файл IPC со стрелкой:

Код: Выделить всё

file = "./in.csv"
arrowFile = "./out.arrow"
with pa.OSFile(arrowFile, 'wb') as arrow:
with pa.csv.open_csv(file) as reader:
with pa.RecordBatchFileWriter(arrow, reader.schema) as writer:
for batch in reader:
writer.write_batch(batch)
Я попробовал использовать словарную кодировку следующим образом:

Код: Выделить всё

convert_options = pa.csv.ConvertOptions(auto_dict_encode = True)
with pa.OSFile(arrowFile, 'wb') as arrow:
with pa.csv.open_csv(file, convert_options=convert_options) as reader:
with pa.RecordBatchFileWriter(arrow, reader.schema) as writer:
for batch in reader:
writer.write_batch(batch)
Но я получаю следующую ошибку:

Код: Выделить всё

File "pyarrow/ipc.pxi", line 507, in pyarrow.lib._CRecordBatchWriter.write_batch
File "pyarrow/error.pxi", line 92, in pyarrow.lib.check_status
pyarrow.lib.ArrowInvalid: Dictionary replacement detected when writing IPC file format. Arrow IPC files only support a single non-delta dictionary for a given field across all batches.
Как исправить код для использования словарной кодировки?

Подробнее здесь: https://stackoverflow.com/questions/792 ... y-encoding
Реклама
Ответить Пред. темаСлед. тема

Быстрый ответ

Изменение регистра текста: 
Смайлики
:) :( :oops: :roll: :wink: :muza: :clever: :sorry: :angel: :read: *x)
Ещё смайлики…
   
К этому ответу прикреплено по крайней мере одно вложение.

Если вы не хотите добавлять вложения, оставьте поля пустыми.

Максимально разрешённый размер вложения: 15 МБ.

  • Похожие темы
    Ответы
    Просмотры
    Последнее сообщение

Вернуться в «Python»