Конвертируйте Spark DataFrame в Pandas DataFrame? - Цифровое Кемерово

Конвертируйте Spark DataFrame в Pandas DataFrame? ⇐ Python

Ответить Пред. тема След. тема

1 сообщение • Страница 1 из 1

Anonymous

Конвертируйте Spark DataFrame в Pandas DataFrame?

Цитата

Сообщение Anonymous » 10 июл 2025, 04:11

В Databricks я создал Spark DataFrame и должен конвертировать его в DataFrame Pandas, < /p>

Код: Выделить всё

 sdf = spark.sql('select * from my_tbl')
pdf = sdf.toPandas()
< /code>
Но получил ошибку: < /p>
ArrowInvalid: Casting from timestamp[us, tz=America/New_York] to timestamp[ns] would result in out of bounds timestamp: 253402214400000000
File , line 1
----> 1 pdf=sdf.toPandas()

Мне просто интересно, как это исправить, или есть в любом случае, чтобы сгенерировать DataFrame Panda, непосредственно вызывая SQL в данных DataBricks?

Подробнее здесь: https://stackoverflow.com/questions/781 ... -dataframe

Реклама

1752109870

Anonymous

 В Databricks я создал Spark DataFrame и должен конвертировать его в DataFrame Pandas, < /p>
[code] sdf = spark.sql('select * from my_tbl')
pdf = sdf.toPandas()
< /code>
Но получил ошибку: < /p>
ArrowInvalid: Casting from timestamp[us, tz=America/New_York] to timestamp[ns] would result in out of bounds timestamp: 253402214400000000
File , line 1
----> 1 pdf=sdf.toPandas()
[/code]
Мне просто интересно, как это исправить, или есть в любом случае, чтобы сгенерировать DataFrame Panda, непосредственно вызывая SQL в данных DataBricks?  

Подробнее здесь: [url]https://stackoverflow.com/questions/78123175/convert-a-spark-dataframe-to-pandas-dataframe[/url]

Ответить Пред. тема След. тема

1 сообщение • Страница 1 из 1

Быстрый ответ

Заголовок:

Имя пользователя:

Изменение регистра текста:

Смайлики

Ещё смайлики…

К этому ответу прикреплено по крайней мере одно вложение.

Если вы не хотите добавлять вложения, оставьте поля пустыми. Можно прикреплять файлы, перетаскивая их в окно сообщения.

Максимально разрешённый размер вложения: 15 МБ.

Имя файла:

Комментарий к файлу:

Имя файла	Комментарий к файлу	Размер	Статус

Похожие темы

Ответы

Просмотры

Последнее сообщение

Оболочка Spark: spark.executor.extraJavaOptions не разрешено устанавливать параметры Spark.

Последнее сообщение Anonymous « 24 сен 2024, 08:55
Добавлено в форуме Python

Anonymous » 24 сен 2024, 08:55 » в форуме Python

Я создал эту программу Spark Shell, но при ее запуске возникла ошибка:
Windows PowerShell
Copyright (C) Microsoft Corporation. All rights reserved.

Install the latest PowerShell for new features and improvements!

PS...

0 Ответы

56 Просмотры

Последнее сообщение Anonymous
24 сен 2024, 08:55
Ошибка Spark EOF (чтение паркета из S3) — преобразование Spark в Pandas

Последнее сообщение Anonymous « 25 июл 2024, 03:53
Добавлено в форуме Python

Anonymous » 25 июл 2024, 03:53 » в форуме Python

Я считываю около 1 миллиона строк, хранящихся в S3 в виде файлов паркета, в кадр данных (данные размером 900 МБ в корзине). Фильтрация фрейма данных на основе значений и последующее преобразование в фрейм данных Pandas. Здесь задействованы две...

0 Ответы

22 Просмотры

Последнее сообщение Anonymous
25 июл 2024, 03:53
Добавить новый столбец с Pandas API на Spark to DataFrame

Последнее сообщение Anonymous « 17 июн 2025, 21:17
Добавлено в форуме Python

Anonymous » 17 июн 2025, 21:17 » в форуме Python

Контекст: я пытаюсь добавить новый столбец в DataFrame, который был изначально создан с помощью Spark Parquet -файла, а затем преобразован в DataFrame, используя Pandas API на Spark следующим образом:
import pyspark.pandas as ps

df =...

0 Ответы

8 Просмотры

Последнее сообщение Anonymous
17 июн 2025, 21:17
Добавить новый столбец с Pandas API на Spark to DataFrame

Последнее сообщение Anonymous « 17 июн 2025, 21:17
Добавлено в форуме Python

Anonymous » 17 июн 2025, 21:17 » в форуме Python

Контекст: я пытаюсь добавить новый столбец в DataFrame, который был изначально создан с помощью Spark Parquet -файла, а затем преобразован в DataFrame, используя Pandas API на Spark следующим образом:
import pyspark.pandas as ps

df =...

0 Ответы

6 Просмотры

Последнее сообщение Anonymous
17 июн 2025, 21:17
Добавить новый столбец с Pandas API на Spark to DataFrame

Последнее сообщение Anonymous « 26 июн 2025, 07:31
Добавлено в форуме Python

Anonymous » 26 июн 2025, 07:31 » в форуме Python

Контекст: я пытаюсь добавить новый столбец в DataFrame, который был изначально создан с помощью Spark Parquet -файла, а затем преобразован в DataFrame, используя Pandas API на Spark следующим образом:
import pyspark.pandas as ps

df =...

0 Ответы

4 Просмотры

Последнее сообщение Anonymous
26 июн 2025, 07:31

Вернуться в «Python»

Programmiererforum