Как упаковать сценарий Pyspark + Delta Lake в Exe с Pyinstaller

Как упаковать сценарий Pyspark + Delta Lake в Exe с Pyinstaller ⇐ Python

1 сообщение • Страница 1 из 1

Anonymous

Как упаковать сценарий Pyspark + Delta Lake в Exe с Pyinstaller

Цитата

Сообщение Anonymous » 26 авг 2025, 02:56

Я пытаюсь преобразовать свой сценарий pyspark в исполняемый (.exe) файл с использованием Pyinstaller.
Сценарий работает нормально в Python, но после конвертации в EXE и выполнение его, я получаю следующую ошибку: < /p>

Код: Выделить всё

 'JavaPackage' object is not callable
Traceback (most recent call last):
File "job8.py", line 34, in 
.getOrCreate()
File "pyspark\sql\session.py", line 559, in getOrCreate
File "pyspark\sql\session.py", line 635, in __init__
TypeError: 'JavaPackage' object is not callable
< /code>
Вот мой фрагмент кода pyspark: < /p>
import logging
import traceback
from pyspark.sql import SparkSession
from pyspark.sql import functions as F
import re
import time
from pyspark.sql.functions import to_date, col, to_timestamp, trim

log_file = "C:\\BI\\Data\\gdelta_job.log"
logging.basicConfig(
filename=log_file,
level=logging.INFO,
format='%(asctime)s - %(levelname)s - %(message)s'
)

try:
spark = SparkSession \
.builder \
.appName("Delta with PySpark") \
.config('spark.jars.packages', 'io.delta:delta-spark_2.12:3.1.0') \
.config("spark.sql.extensions", "io.delta.sql.DeltaSparkSessionExtension") \
.config("spark.sql.catalog.spark_catalog", "org.apache.spark.sql.delta.catalog.DeltaCatalog") \
.config("spark.sql.legacy.timeParserPolicy", "LEGACY") \
.config("spark.driver.memory", "4g") \
.config("spark.sql.warehouse.dir", "C:\\BI\\Data\\") \
.master("local[*]") \
.enableHiveSupport() \
.getOrCreate()

except Exception as e:
print(e)
logging.error(f"Spark job failed: {e}")
< /code>
А вот команда Pyinstaller, которую я использовал для преобразования скрипта: < /p>
pyinstaller --onefile Job8.py ^
--add-data "C:\BI\Program Files\Python\Python310\Lib\site-packages\pyspark\errors;pyspark\errors"

Не могли бы вы помочь разрешить ошибку и преобразовать в файл exe

Подробнее здесь: https://stackoverflow.com/questions/797 ... yinstaller

1756166190

Anonymous

 Я пытаюсь преобразовать свой сценарий pyspark в исполняемый (.exe) файл с использованием Pyinstaller.
Сценарий работает нормально в Python, но после конвертации в EXE и выполнение его, я получаю следующую ошибку: < /p>
[code] 'JavaPackage' object is not callable
Traceback (most recent call last):
File "job8.py", line 34, in 
.getOrCreate()
File "pyspark\sql\session.py", line 559, in getOrCreate
File "pyspark\sql\session.py", line 635, in __init__
TypeError: 'JavaPackage' object is not callable
< /code>
Вот мой фрагмент кода pyspark: < /p>
import logging
import traceback
from pyspark.sql import SparkSession
from pyspark.sql import functions as F
import re
import time
from pyspark.sql.functions import to_date, col, to_timestamp, trim

log_file = "C:\\BI\\Data\\gdelta_job.log"
logging.basicConfig(
filename=log_file,
level=logging.INFO,
format='%(asctime)s - %(levelname)s - %(message)s'
)

try:
spark = SparkSession \
.builder \
.appName("Delta with PySpark") \
.config('spark.jars.packages', 'io.delta:delta-spark_2.12:3.1.0') \
.config("spark.sql.extensions", "io.delta.sql.DeltaSparkSessionExtension") \
.config("spark.sql.catalog.spark_catalog", "org.apache.spark.sql.delta.catalog.DeltaCatalog") \
.config("spark.sql.legacy.timeParserPolicy", "LEGACY") \
.config("spark.driver.memory", "4g") \
.config("spark.sql.warehouse.dir", "C:\\BI\\Data\\") \
.master("local[*]") \
.enableHiveSupport() \
.getOrCreate()

except Exception as e:
print(e)
logging.error(f"Spark job failed: {e}")
< /code>
А вот команда Pyinstaller, которую я использовал для преобразования скрипта: < /p>
pyinstaller --onefile Job8.py ^
--add-data "C:\BI\Program Files\Python\Python310\Lib\site-packages\pyspark\errors;pyspark\errors"
[/code]
Не могли бы вы помочь разрешить ошибку и преобразовать в файл exe  

Подробнее здесь: [url]https://stackoverflow.com/questions/79746281/how-to-package-a-pyspark-delta-lake-script-into-an-exe-with-pyinstaller[/url]

Ответить Пред. тема След. тема

1 сообщение • Страница 1 из 1

Быстрый ответ

Заголовок:

Имя пользователя:

Изменение регистра текста:

Смайлики

Ещё смайлики…

К этому ответу прикреплено по крайней мере одно вложение.

Если вы не хотите добавлять вложения, оставьте поля пустыми. Можно прикреплять файлы, перетаскивая их в окно сообщения.

Максимально разрешённый размер вложения: 15 МБ.

Имя файла:

Комментарий к файлу:

Имя файла	Комментарий к файлу	Размер	Статус

Похожие темы

Ответы

Просмотры

Последнее сообщение

Подключение и аутентификация к Delta Lake в Azure Data Lake Storage Gen 2 с использованием API Python delta-rs

Последнее сообщение Anonymous « 19 сен 2024, 14:47
Добавлено в форуме Python

Anonymous » 19 сен 2024, 14:47 » в форуме Python

Я пытаюсь подключиться и пройти проверку подлинности в существующей разностной таблице в Azure Data Lake Storage Gen 2 с помощью API Python Delta-rs. Я нашел библиотеку Delta-rs из этого вопроса StackOverflow: Delta Lake независимо от Apache Spark?...

0 Ответы

36 Просмотры

Последнее сообщение Anonymous
19 сен 2024, 14:47
Azure Data Lake Gen 2 и Python копируют файлы в папках Data Lake

Последнее сообщение Anonymous « 15 мар 2024, 07:22
Добавлено в форуме Python

Anonymous » 15 мар 2024, 07:22 » в форуме Python

Использование примеров, приведенных здесь: Мне удалось подключиться к моему экземпляру Azure Data Lake и просмотреть структуру каталогов/файлов. Выполните несколько простых операций. Все хорошо.

Следующий шаг: я загрузил большой файл в озеро...

0 Ответы

77 Просмотры

Последнее сообщение Anonymous
15 мар 2024, 07:22
Запись формата Delta в Data Lake в AWS S3

Последнее сообщение Anonymous « 26 мар 2024, 09:23
Добавлено в форуме Python

Anonymous » 26 мар 2024, 09:23 » в форуме Python

Моя цель — загрузить данные в дельта-формате в озеро данных AWS S3.
Я должен отметить, что мне удалось загрузить файлы (паркет) в это озеро данных, а также я могу написать дельта-формат в моя локальная машина, но когда я пытаюсь записать...

0 Ответы

38 Просмотры

Последнее сообщение Anonymous
26 мар 2024, 09:23
Как создать дельта-таблицу с помощью автономного озера Delta Lake и записать данные

Последнее сообщение Anonymous « 30 сен 2024, 12:46
Добавлено в форуме JAVA

Anonymous » 30 сен 2024, 12:46 » в форуме JAVA

Я могу прочитать дельта-таблицу, созданную в Amazon S3, с помощью автономного API, но не могу создать дельта-таблицу и вставить в нее данные. В приведенной ниже ссылке на озеро Дельта упоминается использование устройства чтения и записи Zappy,...

0 Ответы

20 Просмотры

Последнее сообщение Anonymous
30 сен 2024, 12:46
Delta Lake для настройки ноутбуков AWS Glue

Последнее сообщение Anonymous « 01 мар 2025, 15:37
Добавлено в форуме Python

Anonymous » 01 мар 2025, 15:37 » в форуме Python

Я бы хотел настроить формат Delta Lake на AWS Glue и выполнить простую ETL с помощью df.write.format ( delta ). Mode ( Overwrite ). Сохранить. (s3) может ли кто-нибудь предоставить мне код копии-паста для этого?{
--datalake-formats : delta
}...

0 Ответы

8 Просмотры

Последнее сообщение Anonymous
01 мар 2025, 15:37

Вернуться в «Python»