Py4JJavaError: произошла ошибка при вызове z:org.apache.spark.api.python.PythonRDD.runJob при запуске Spark на локальном

Py4JJavaError: произошла ошибка при вызове z:org.apache.spark.api.python.PythonRDD.runJob при запуске Spark на локальном ⇐ Python

1 сообщение • Страница 1 из 1

Anonymous

Py4JJavaError: произошла ошибка при вызове z:org.apache.spark.api.python.PythonRDD.runJob при запуске Spark на локальном

Цитата

Сообщение Anonymous » 27 дек 2024, 09:57

У меня есть следующий фрагмент кода

Код: Выделить всё

vertices = df1.select(F.explode(F.array('issuer_id_indexed', 'receiver_id_indexed'))) \
.distinct() \
.rdd.map(lambda row: row[0])  # Transform the exploded values into an RDD

# Create an index for each vertex
vertices_with_index = vertices.zipWithIndex().map(lambda x: (x[1], x[0]))  # Swap to (index, value)

# Convert the RDD to a DataFrame with column names 'id' and 'node'
vertex_df = vertices_with_index.toDF(["id", "node"])

# Show the resulting DataFrame
vertex_df.show()

Когда я пытаюсь запустить приведенный выше код, я получаю сообщение об ошибке или отслеживание ниже.

Похоже, ошибка возникает, когда я вызываю функцию toDF в моем vertices_with_index, чтобы преобразовать ее из pyspark.rdd.PipelinedRDD< /strong> в кадр данных Spark.
В настоящее время я пытаюсь запустить Pyspark на своем локальном компьютере и безуспешно пробовал выполнить следующие действия, чтобы попытаться устранить эту ошибку:

Убедился, что мои переменные env верны
Установил более раннюю версию Java 8
Увеличил количество ресурсов, переданных Spark.

Любая помощь будет очень признательна.

Подробнее здесь: https://stackoverflow.com/questions/793 ... python-pyt

1735282626

Anonymous

У меня есть следующий фрагмент кода
[code]vertices = df1.select(F.explode(F.array('issuer_id_indexed', 'receiver_id_indexed'))) \
.distinct() \
.rdd.map(lambda row: row[0])  # Transform the exploded values into an RDD

# Create an index for each vertex
vertices_with_index = vertices.zipWithIndex().map(lambda x: (x[1], x[0]))  # Swap to (index, value)

# Convert the RDD to a DataFrame with column names 'id' and 'node'
vertex_df = vertices_with_index.toDF(["id", "node"])

# Show the resulting DataFrame
vertex_df.show()
[/code]
Когда я пытаюсь запустить приведенный выше код, я получаю сообщение об ошибке или отслеживание ниже.
[img]https://i.sstatic.net/cm1aq4gY.png[/img]

Похоже, ошибка возникает, когда я вызываю функцию [b]toDF[/b] в моем [b]vertices_with_index[/b], чтобы преобразовать ее из pyspark.rdd.PipelinedRDD< /strong> в кадр данных Spark.
В настоящее время я пытаюсь запустить Pyspark на своем локальном компьютере и безуспешно пробовал выполнить следующие действия, чтобы попытаться устранить эту ошибку:
[list]
[*]Убедился, что мои переменные env верны
[*]Установил более раннюю версию Java 8
[*]Увеличил количество ресурсов, переданных Spark.
[/list]
Любая помощь будет очень признательна. 

Подробнее здесь: [url]https://stackoverflow.com/questions/79311117/py4jjavaerror-an-error-occurred-while-calling-zorg-apache-spark-api-python-pyt[/url]

Ответить Пред. тема След. тема

1 сообщение • Страница 1 из 1

Быстрый ответ

Заголовок:

Имя пользователя:

Изменение регистра текста:

Смайлики

Ещё смайлики…

К этому ответу прикреплено по крайней мере одно вложение.

Если вы не хотите добавлять вложения, оставьте поля пустыми. Можно прикреплять файлы, перетаскивая их в окно сообщения.

Максимально разрешённый размер вложения: 15 МБ.

Имя файла:

Комментарий к файлу:

Имя файла	Комментарий к файлу	Размер	Статус

Похожие темы

Ответы

Просмотры

Последнее сообщение

Py4JJavaError: произошла ошибка при вызове z:org.apache.spark.api.python.PythonRDD.collectAndServe. (проблема с PySpark)

Последнее сообщение Anonymous « 24 ноя 2024, 15:55
Добавлено в форуме Python

Anonymous » 24 ноя 2024, 15:55 » в форуме Python

from pyspark.sql import SparkSession

spark = SparkSession.builder.config( spark.driver.host ,

localhost ).appName( MyApp ).getOrCreate()

data =

rdd = spark.sparkContext.parallelize(data)

def days_convert(dict_key):
return bcDays.value...

0 Ответы

35 Просмотры

Последнее сообщение Anonymous
24 ноя 2024, 15:55
Py4jjavaerror: произошла ошибка при вызове none.org.apache.spark.api.java.javasparkcontext

Последнее сообщение Anonymous « 16 мар 2025, 00:06
Добавлено в форуме Python

Anonymous » 16 мар 2025, 00:06 » в форуме Python

Кто -нибудь знает, почему я получаю эту ошибку в ноутбуках Юпитера ??? Я пытался загрузить свою модель Tensorflow в Apache Spark Vis Sparlflowbut, я не могу понять, как преодолеть эту ошибку. Любая помощь будет очень оценена.from...

0 Ответы

81 Просмотры

Последнее сообщение Anonymous
16 мар 2025, 00:06
Py4jjavaerror: произошла ошибка при вызове none.org.apache.spark.api.java.javasparkcontext

Последнее сообщение Anonymous « 31 июл 2025, 00:25
Добавлено в форуме Python

Anonymous » 31 июл 2025, 00:25 » в форуме Python

Кто -нибудь знает, почему я получаю эту ошибку в ноутбуках Юпитера ??? Я пытался загрузить свою модель Tensorflow в Apache Spark Vis Sparlflowbut, я не могу понять, как преодолеть эту ошибку. Любая помощь будет очень оценена.from...

0 Ответы

3 Просмотры

Последнее сообщение Anonymous
31 июл 2025, 00:25
Py4JJavaError: произошла ошибка при вызове o42.save. : com.google.common.util.concurrent.ExecutionError: java.lang.Unsat

Последнее сообщение Anonymous « 28 июл 2024, 21:02
Добавлено в форуме JAVA

Anonymous » 28 июл 2024, 21:02 » в форуме JAVA

Полное сообщение об ошибке:
Py4JJavaError: An error occurred while calling o42.save.
: com.google.common.util.concurrent.ExecutionError: java.lang.UnsatisfiedLinkError: org.apache.hadoop.io.nativeio.NativeIO$Windows.access0(Ljava/lang/String;I)Z...

0 Ответы

24 Просмотры

Последнее сообщение Anonymous
28 июл 2024, 21:02
Py4JException: конструктор org.apache.spark.sql.SparkSession([класс org.apache.spark.SparkContext, класс java.util.HashM

Последнее сообщение Anonymous « 16 сен 2024, 12:30
Добавлено в форуме Python

Anonymous » 16 сен 2024, 12:30 » в форуме Python

Я пытаюсь запустить сеанс Spark в Jupyter Notebook на компьютере EC2 Linux с помощью кода Visual Studio. Мой код выглядит следующим образом:
from pyspark.sql import SparkSession
spark = SparkSession.builder.appName( spark_app ).getOrCreate()...

0 Ответы

76 Просмотры

Последнее сообщение Anonymous
16 сен 2024, 12:30

Вернуться в «Python»