Производительность чтения таблицы Delta при использовании API Python delta-rs?Python

Программы на Python
Ответить Пред. темаСлед. тема
Anonymous
 Производительность чтения таблицы Delta при использовании API Python delta-rs?

Сообщение Anonymous »


Я пытаюсь прочитать Дельта-таблицу, используя библиотеку delta-rs (Python).

В таблице миллионы записей, и нам хотелось часто читать ее с помощью вызова Rest API (только определенные записи, на основе запроса).

Итак, я проверял библиотеку delta-rs. Поскольку в нем миллионы записей, производительность чтения не очень хорошая.

Он читает всю таблицу и преобразует ее в Pandas DF (прежде чем я смогу фильтровать по моему запросу).

Есть ли способ читать только те записи, которые мне нужны, вместо чтения всей таблицы и последующей фильтрации (например, очистка столбцов, предикат и т. д.)

Обновление: я следил за этой проблемой (https://github.com/delta-io/delta-rs/issues/631) и смог добиться хорошей производительности, преобразовав DeltaTable в набор данных PyArrow и затем используйте Duckdb для фильтрации.
Реклама
Ответить Пред. темаСлед. тема

Быстрый ответ

Изменение регистра текста: 
Смайлики
:) :( :oops: :roll: :wink: :muza: :clever: :sorry: :angel: :read: *x)
Ещё смайлики…
   
К этому ответу прикреплено по крайней мере одно вложение.

Если вы не хотите добавлять вложения, оставьте поля пустыми.

Максимально разрешённый размер вложения: 15 МБ.

  • Похожие темы
    Ответы
    Просмотры
    Последнее сообщение
  • Подключение и аутентификация к Delta Lake в Azure Data Lake Storage Gen 2 с использованием API Python delta-rs
    Anonymous » » в форуме Python
    0 Ответы
    36 Просмотры
    Последнее сообщение Anonymous
  • Участник группы Delta Delta Expand
    Anonymous » » в форуме C#
    0 Ответы
    4 Просмотры
    Последнее сообщение Anonymous
  • Участник группы Delta Delta Expand
    Anonymous » » в форуме C#
    0 Ответы
    5 Просмотры
    Последнее сообщение Anonymous
  • Несоответствие точности временной метки при чтении таблицы Delta от ADLS Gen2 с Python (Pandas/Polars)
    Anonymous » » в форуме Python
    0 Ответы
    2 Просмотры
    Последнее сообщение Anonymous
  • Трансформатор кодер-декодер хорошая производительность обучения, плохая производительность авторегрессии
    Anonymous » » в форуме Python
    0 Ответы
    95 Просмотры
    Последнее сообщение Anonymous

Вернуться в «Python»