При сравнении двух считанных данных от DataFrames из Delta я получаю выход, они разные, и я не могу точно определить приPython

Программы на Python
Ответить Пред. темаСлед. тема
Anonymous
 При сравнении двух считанных данных от DataFrames из Delta я получаю выход, они разные, и я не могу точно определить при

Сообщение Anonymous »

У меня есть ситуация, когда DataFrame сначала сохраняется в Parquet, а затем в Delta. Мне нужно было изучить другой формат, поскольку сохранение в одном файле занимает значительное время. Я в основном использую Plain Pyspark и Python при решении этих проблем. Я нашел различия, поэтому я удалил все столбцы с пустыми значениями. После вычитания DataFrames я получил пустые результаты. < /P>
Далее я работал с Deltas. Несмотря на удаление дополнительных столбцов с пустыми значениями, я все еще не получал пустых данных данных после вычитания. Однако, когда я выбрал одну запись из каждого из вычтенных данных и копировал выходы в Excel, они возвращались как идентичные после запуска команды if. /> К сожалению, я не могу поделиться данными из -за чувствительности бизнеса. < /p>

Подробнее здесь: https://stackoverflow.com/questions/797 ... are-differ
Реклама
Ответить Пред. темаСлед. тема

Быстрый ответ

Изменение регистра текста: 
Смайлики
:) :( :oops: :roll: :wink: :muza: :clever: :sorry: :angel: :read: *x)
Ещё смайлики…
   
К этому ответу прикреплено по крайней мере одно вложение.

Если вы не хотите добавлять вложения, оставьте поля пустыми.

Максимально разрешённый размер вложения: 15 МБ.

  • Похожие темы
    Ответы
    Просмотры
    Последнее сообщение
  • При сравнении двух данных DataFrames с Derta, я получаю выходные данные, они разные, и я не могу точно определить причин
    Anonymous » » в форуме Python
    0 Ответы
    5 Просмотры
    Последнее сообщение Anonymous
  • Производительность чтения таблицы Delta при использовании API Python delta-rs?
    Anonymous » » в форуме Python
    0 Ответы
    37 Просмотры
    Последнее сообщение Anonymous
  • Подключение и аутентификация к Delta Lake в Azure Data Lake Storage Gen 2 с использованием API Python delta-rs
    Anonymous » » в форуме Python
    0 Ответы
    36 Просмотры
    Последнее сообщение Anonymous
  • Участник группы Delta Delta Expand
    Anonymous » » в форуме C#
    0 Ответы
    4 Просмотры
    Последнее сообщение Anonymous
  • Участник группы Delta Delta Expand
    Anonymous » » в форуме C#
    0 Ответы
    6 Просмотры
    Последнее сообщение Anonymous

Вернуться в «Python»