При сравнении двух считанных данных от DataFrames из Delta я получаю выход, они разные, и я не могу точно определить при

При сравнении двух считанных данных от DataFrames из Delta я получаю выход, они разные, и я не могу точно определить при ⇐ Python

1 сообщение • Страница 1 из 1

Anonymous

При сравнении двух считанных данных от DataFrames из Delta я получаю выход, они разные, и я не могу точно определить при

Цитата

Сообщение Anonymous » 14 авг 2025, 14:57

У меня есть ситуация, когда DataFrame сначала сохраняется в Parquet, а затем в Delta. Мне нужно было изучить другой формат, поскольку сохранение в одном файле занимает значительное время. Я в основном использую Plain Pyspark и Python при решении этих проблем. Я нашел различия, поэтому я удалил все столбцы с пустыми значениями. После вычитания DataFrames я получил пустые результаты. < /P>
Далее я работал с Deltas. Несмотря на удаление дополнительных столбцов с пустыми значениями, я все еще не получал пустых данных данных после вычитания. Однако, когда я выбрал одну запись из каждого из вычтенных данных и копировал выходы в Excel, они возвращались как идентичные после запуска команды if. /> К сожалению, я не могу поделиться данными из -за чувствительности бизнеса. < /p>

Подробнее здесь: https://stackoverflow.com/questions/797 ... are-differ

1755172623

Anonymous

Подробнее здесь: [url]https://stackoverflow.com/questions/79735323/while-comparing-two-dataframes-read-from-delta-i-receive-output-they-are-differ[/url]

Ответить Пред. тема След. тема

1 сообщение • Страница 1 из 1

Быстрый ответ

Заголовок:

Имя пользователя:

Изменение регистра текста:

Смайлики

Ещё смайлики…

К этому ответу прикреплено по крайней мере одно вложение.

Если вы не хотите добавлять вложения, оставьте поля пустыми. Можно прикреплять файлы, перетаскивая их в окно сообщения.

Максимально разрешённый размер вложения: 15 МБ.

Имя файла:

Комментарий к файлу:

Имя файла	Комментарий к файлу	Размер	Статус

Похожие темы

Ответы

Просмотры

Последнее сообщение

При сравнении двух данных DataFrames с Derta, я получаю выходные данные, они разные, и я не могу точно определить причин

Последнее сообщение Anonymous « 14 авг 2025, 14:18
Добавлено в форуме Python

Anonymous » 14 авг 2025, 14:18 » в форуме Python

У меня есть ситуация, когда DataFrame сначала сохраняется в Parquet, а затем в Delta. Мне нужно было изучить другой формат, поскольку сохранение в одном файле занимает значительное время. Я нашел различия, поэтому я удалил все столбцы с пустыми...

0 Ответы

5 Просмотры

Последнее сообщение Anonymous
14 авг 2025, 14:18
Производительность чтения таблицы Delta при использовании API Python delta-rs?

Последнее сообщение Anonymous « 03 янв 2024, 15:54
Добавлено в форуме Python

Anonymous » 03 янв 2024, 15:54 » в форуме Python

Я пытаюсь прочитать Дельта-таблицу, используя библиотеку delta-rs (Python).

В таблице миллионы записей, и нам хотелось часто читать ее с помощью вызова Rest API (только определенные записи, на основе запроса).

Итак, я проверял библиотеку...

0 Ответы

37 Просмотры

Последнее сообщение Anonymous
03 янв 2024, 15:54
Подключение и аутентификация к Delta Lake в Azure Data Lake Storage Gen 2 с использованием API Python delta-rs

Последнее сообщение Anonymous « 19 сен 2024, 14:47
Добавлено в форуме Python

Anonymous » 19 сен 2024, 14:47 » в форуме Python

Я пытаюсь подключиться и пройти проверку подлинности в существующей разностной таблице в Azure Data Lake Storage Gen 2 с помощью API Python Delta-rs. Я нашел библиотеку Delta-rs из этого вопроса StackOverflow: Delta Lake независимо от Apache Spark?...

0 Ответы

36 Просмотры

Последнее сообщение Anonymous
19 сен 2024, 14:47
Участник группы Delta Delta Expand

Последнее сообщение Anonymous « 10 июл 2025, 18:01
Добавлено в форуме C#

Anonymous » 10 июл 2025, 18:01 » в форуме C#

Я пытаюсь прочитать участники DisplayName, mail , используя
eq '{groupId}'&$expand=members($select=id,displayName,mail)

Но я получаю только идентификатор только. Как получить также имя DisplayName ? Я знаю участники@delta свойство содержит только...

0 Ответы

4 Просмотры

Последнее сообщение Anonymous
10 июл 2025, 18:01
Участник группы Delta Delta Expand

Последнее сообщение Anonymous « 16 июл 2025, 00:52
Добавлено в форуме C#

Anonymous » 16 июл 2025, 00:52 » в форуме C#

Я пытаюсь прочитать участники DisplayName, mail , используя
eq '{groupId}'&$expand=members($select=id,displayName,mail)

Но я получаю только идентификатор только. Как получить также имя DisplayName ? Я знаю участники@delta свойство содержит только...

0 Ответы

6 Просмотры

Последнее сообщение Anonymous
16 июл 2025, 00:52

Вернуться в «Python»