Код: Выделить всё
from pyspark.sql import SparkSession
pyspark = SparkSession.builder.master("local[8]").appName("example").getOrCreate()
Код: Выделить всё
Traceback (most recent call last):
File "C:/Users/Example/test.py", line 6, in
.getOrCreate()
File "C:\Users\Example\AppData\Roaming\Python\Python313\site-packages\pyspark\sql\session.py", line 497, in getOrCreate
sc = SparkContext.getOrCreate(sparkConf)
File "C:\Users\Example\AppData\Roaming\Python\Python313\site-packages\pyspark\context.py", line 515, in getOrCreate
SparkContext(conf=conf or SparkConf())
File "C:\Users\Example\AppData\Roaming\Python\Python313\site-packages\pyspark\context.py", line 201, in __init__
SparkContext._ensure_initialized(self, gateway=gateway, conf=conf)
File "C:\Users\Example\AppData\Roaming\Python\Python313\site-packages\pyspark\context.py", line 436, in _ensure_initialized
SparkContext._gateway = gateway or launch_gateway(conf)
File "C:\Users\Example\AppData\Roaming\Python\Python313\site-packages\pyspark\java_gateway.py", line 107, in launch_gateway
raise PySparkRuntimeError(
pyspark.errors.exceptions.base.PySparkRuntimeError: [JAVA_GATEWAY_EXITED] Java gateway process exited before sending its port number.
Код: Выделить всё
spark = SparkSession.builder \
.master("local[8]") \
.appName("test") \
.config("spark.sql.warehouse.dir", "file:///C:/tmp") \
.getOrCreate()
Код: Выделить всё
spark = SparkSession.builder \
.appName("example") \
.config("spark.ui.showConsoleProgress", "false") \
.config("spark.driver.extraJavaOptions", "-Dlog4j.debug") \
.getOrCreate()
Я попробовал удалить и переустановить PySpark, Python и Java, а также удалить другие установленные мной версии. Для PySpark я попробовал как pip uninstall pyspark, так и pip uninstall pyspark py4j (а затем, конечно же, изменил удаление на установку, чтобы переустановить его). Ни одна из этих вещей или чего-либо, предложенного в вопросах ниже, не остановила ошибку и не изменила ее вообще. Что происходит и как это исправить, чтобы не выдавалось сообщение об ошибке?
[*]Это не дубликат Исключения: процесс шлюза Java завершился раньше отправка номера порта pyspark, ошибка Java. Процесс шлюза Java завершился до отправки номера порта или ошибка Pyspark: процесс шлюза Java завершился до отправки номера порта, поскольку у них другая обратная трассировка, и предлагаемые решения не работают.< /li>
Это не так дубликат инициализации. Исключение: процесс шлюза Java завершился до отправки номера порта, поскольку у меня нет Hadoop и я использую совместимую версию Java.
[*]Это не дубликат PySpark: «Исключение: процесс шлюза Java завершился до отправки драйверу номера порта», потому что я не использую Macbook или Linux, и ни одно из решений не работает.
[*]Это тоже не так. дубликат PySparkRuntimeError: [JAVA_GATEWAY_EXITED] Процесс шлюза Java завершился до отправки номера порта, потому что я (все еще) не использую Macbook.
[*]Это не дубликат ошибки с pyspark «Процесс шлюза Java завершен перед отправкой номера порта», поскольку у меня нет Hadoop, пользователь сталкивается с ошибкой при установке, а не при запуске, и потому что у него возникают другие ошибки, которых нет у меня.
[*] Этот не является дубликатом структурированной потоковой передачи + Kafka: RuntimeError: процесс шлюза Java завершился до отправки номера порта + Не удалось найти источник данных: kafka, поскольку у меня нет kafka.
[*]Это не является дубликатом создания sparkContext в Google Colab, выдает: `RuntimeError: процесс шлюза Java завершился до отправки номера порта`, потому что я не в Google Colab.
[*]Это не так. дубликат Исключения: процесс шлюза Java завершился перед отправкой драйверу номера порта при создании сеанса Spark в Python или pyspark.sql.utils.AnalysisException: не удалось найти источник данных: kafka, поскольку в этих вопросах содержится другая ошибка.
Подробнее здесь: https://stackoverflow.com/questions/793 ... s-port-num
Мобильная версия