«Не удалось найти источник данных: mongodb» при попытке подключить pyspark к MongoDB.

«Не удалось найти источник данных: mongodb» при попытке подключить pyspark к MongoDB. ⇐ JAVA

1 сообщение • Страница 1 из 1

Anonymous

«Не удалось найти источник данных: mongodb» при попытке подключить pyspark к MongoDB.

Цитата

Сообщение Anonymous » 02 июл 2024, 13:28

Я не очень хорошо разбираюсь в пакетах Python и Java, поэтому, пожалуйста, потерпите.
У меня возникли некоторые проблемы со следующим кодом в моем блокноте Jupyter. >

Код: Выделить всё

import pyspark
from pyspark.sql import SparkSession
import pyspark.sql.functions as f
from pyspark.sql.functions import explode,col
from pyspark.conf import SparkConf
from pymongo.mongo_client import MongoClient
from pymongo.server_api import ServerApi

uri = "mongodb://localhost:27017/connection1"

spark = SparkSession \
.builder \
.master("local") \
.appName("Tesi") \
.config("spark.mongodb.read.connection.uri", uri) \
.config("spark.mongodb.write.connection.uri", uri) \
.config('spark.jars.packages', 'org.mongodb.spark:mongo-spark-connector_2.13:10.3.0') \
.config("spark.driver.bindAddress", "127.0.0.1")\
.getOrCreate()

df = spark.read \
.format("mongodb") \
.option("uri", uri) \
.option("database", "local") \
.option("collection", "electricity_readings") \
.load()

Выполнение этого кода вызывает следующее исключение:

Код: Выделить всё

An error occurred while calling o213.load.
: org.apache.spark.SparkClassNotFoundException: [DATA_SOURCE_NOT_FOUND] Failed to find the data source: mongodb.

Исследуя проблему, я нашел несколько возможных решений, но ничего не помогает, поэтому либо моя проблема другая, либо я делаю что-то не так, и я думаю, что это последнее , поэтому мне нужна помощь, чтобы завершить настройку этого проекта.
Это соответствующие переменные среды.

< li>PYSPARK_HOME = C:\Users\filos\AppData\Roaming\Python\Python39\site-packages\pyspark
SPARK_HOME = C:\Spark\spark-3.5.1-bin- Hadoop3
JAVA_HOME = C:\Progra~1\Java\jdk-18.0.1.1
Путь содержит указанные выше переменные с соответствующими папками bin< /li>
HADOOP_HOME = C:\Hadoop (он содержит только папку bin с winutils.exe)

Нет CLASSPATH или JAVA_CLASSPATH установлен. Я загрузил файлы jar для mongo-spark и поместил их в папку %PYSPARK_HOME%\jars, надеясь, что банки будут прочитаны оттуда, но это не сработало. Я поместил их в созданную мной отдельную папку (C:\Progra~1\Java\jars) и установил для переменной CLASSPATH этот адрес, но вместо этого сработало следующее исключение.

Код: Выделить всё

An error occurred while calling None.org.apache.spark.api.java.JavaSparkContext.
: java.io.IOException: Failed to connect to xxx/xxx.xxx.x.x:59587
...
Caused by: java.net.ConnectException: Connection refused: no further information
...

Это также сработает, если я помещу mongo-spark-connector_2.13-10.3.0.jar в папку C:\Program Files\Java\jre-1.8\lib. Эта проблема характерна не только для ячейки с отправленным мной кодом: предыдущая ячейка с другим чтением SparkSession из файла json также вызывает такое же исключение при запуске.
Я считаю, что загруженные мной jar-файлы должны быть куда-то помещены, и, возможно, необходимо установить переменную CLASSPATH, чтобы читать эти jar-файлы, но я не уверен, как это сделать, поскольку простое помещение случайной папки с jar-файлами в качестве значения для CLASSPATH вызывает исключение.

Подробнее здесь: https://stackoverflow.com/questions/786 ... ark-to-mon

1719916102

Anonymous

Я не очень хорошо разбираюсь в пакетах Python и Java, поэтому, пожалуйста, потерпите.
У меня возникли некоторые проблемы со следующим кодом в моем блокноте Jupyter. >
[code]import pyspark
from pyspark.sql import SparkSession
import pyspark.sql.functions as f
from pyspark.sql.functions import explode,col
from pyspark.conf import SparkConf
from pymongo.mongo_client import MongoClient
from pymongo.server_api import ServerApi

uri = "mongodb://localhost:27017/connection1"

spark = SparkSession \
.builder \
.master("local") \
.appName("Tesi") \
.config("spark.mongodb.read.connection.uri", uri) \
.config("spark.mongodb.write.connection.uri", uri) \
.config('spark.jars.packages', 'org.mongodb.spark:mongo-spark-connector_2.13:10.3.0') \
.config("spark.driver.bindAddress", "127.0.0.1")\
.getOrCreate()

df = spark.read \
.format("mongodb") \
.option("uri", uri) \
.option("database", "local") \
.option("collection", "electricity_readings") \
.load()
[/code]
Выполнение этого кода вызывает следующее исключение:
[code]An error occurred while calling o213.load.
: org.apache.spark.SparkClassNotFoundException: [DATA_SOURCE_NOT_FOUND] Failed to find the data source: mongodb.
[/code]
Исследуя проблему, я нашел несколько возможных решений, но ничего не помогает, поэтому либо моя проблема другая, либо я делаю что-то не так, и я думаю, что это последнее , поэтому мне нужна помощь, чтобы завершить настройку этого проекта.
Это соответствующие переменные среды.
[list]
< li>PYSPARK_HOME = C:\Users\filos\AppData\Roaming\Python\Python39\site-packages\pyspark
[*]SPARK_HOME = C:\Spark\spark-3.5.1-bin- Hadoop3
[*]JAVA_HOME = C:\Progra~1\Java\jdk-18.0.1.1
[*]Путь содержит указанные выше переменные с соответствующими папками bin< /li>
HADOOP_HOME = C:\Hadoop (он содержит только папку bin с winutils.exe)
[/list]
Нет CLASSPATH или JAVA_CLASSPATH установлен. Я загрузил файлы jar для mongo-spark и поместил их в папку %PYSPARK_HOME%\jars, надеясь, что банки будут прочитаны оттуда, но это не сработало. Я поместил их в созданную мной отдельную папку (C:\Progra~1\Java\jars) и установил для переменной CLASSPATH этот адрес, но вместо этого сработало следующее исключение.
[code]An error occurred while calling None.org.apache.spark.api.java.JavaSparkContext.
: java.io.IOException: Failed to connect to xxx/xxx.xxx.x.x:59587
...
Caused by: java.net.ConnectException: Connection refused: no further information
...
[/code]
Это также сработает, если я помещу mongo-spark-connector_2.13-10.3.0.jar в папку C:\Program Files\Java\jre-1.8\lib. Эта проблема характерна не только для ячейки с отправленным мной кодом: предыдущая ячейка с другим чтением SparkSession из файла json также вызывает такое же исключение при запуске.
Я считаю, что загруженные мной jar-файлы должны быть куда-то помещены, и, возможно, необходимо установить переменную CLASSPATH, чтобы читать эти jar-файлы, но я не уверен, как это сделать, поскольку простое помещение случайной папки с jar-файлами в качестве значения для CLASSPATH вызывает исключение. 

Подробнее здесь: [url]https://stackoverflow.com/questions/78696453/failed-to-find-the-data-source-mongodb-while-trying-to-connect-pyspark-to-mon[/url]

Ответить Пред. тема След. тема

1 сообщение • Страница 1 из 1

Быстрый ответ

Заголовок:

Имя пользователя:

Изменение регистра текста:

Смайлики

Ещё смайлики…

К этому ответу прикреплено по крайней мере одно вложение.

Если вы не хотите добавлять вложения, оставьте поля пустыми. Можно прикреплять файлы, перетаскивая их в окно сообщения.

Максимально разрешённый размер вложения: 15 МБ.

Имя файла:

Комментарий к файлу:

Имя файла	Комментарий к файлу	Размер	Статус

Похожие темы

Ответы

Просмотры

Последнее сообщение

Как решить проблему «Не удалось настроить источник данных: атрибут URL не указан, и встроенный источник данных не может

Последнее сообщение Гость « 20 сен 2023, 17:53
Добавлено в форуме JAVA

Гость » 20 сен 2023, 17:53 » в форуме JAVA

Я пытаюсь реализовать вызов open-fiegn из модуля обмена валют в конвертацию валют, но застрял на этой ошибке. Может ли кто-нибудь помочь мне с этим? Я проверил другой ответ и попытался добавить...

0 Ответы

129 Просмотры

Последнее сообщение Гость
20 сен 2023, 17:53
Не удалось настроить источник данных: атрибут «url» не указан, и встроенный источник данных не может быть настроен.

Последнее сообщение Anonymous « 18 сен 2024, 14:29
Добавлено в форуме JAVA

Anonymous » 18 сен 2024, 14:29 » в форуме JAVA

Я работаю над примером Spring Boot Batch с MongoDB и уже запустил сервер mongod.

Когда Я запускаю приложение и получаю сообщение об ошибке ниже.

Есть какие-нибудь указания по устранению этой проблемы?

***************************
APPLICATION...

0 Ответы

34 Просмотры

Последнее сообщение Anonymous
18 сен 2024, 14:29
Не удалось настроить источник данных: атрибут «url» не указан, и встроенный источник данных не настроен. Причина: не уда

Последнее сообщение Anonymous « 19 сен 2024, 19:43
Добавлено в форуме JAVA

Anonymous » 19 сен 2024, 19:43 » в форуме JAVA

Я создаю первый проект весенней загрузки с помощью Eclipse, я создал проект с помощью Spring Initilizr. теперь я получаю эту ошибку: «Не удалось настроить источник данных: атрибут «url» не указан, и встроенный источник данных не может быть настроен....

0 Ответы

28 Просмотры

Последнее сообщение Anonymous
19 сен 2024, 19:43
Не удалось настроить источник данных: атрибут «url» не указан, и встроенный источник данных не может быть указан.

Последнее сообщение Anonymous « 23 окт 2024, 17:53
Добавлено в форуме JAVA

Anonymous » 23 окт 2024, 17:53 » в форуме JAVA

Я пытаюсь создать Restful API с помощью Springboot, но столкнулся со следующей ошибкой:

Не удалось настроить источник данных: атрибут 'url' имеет значение не указано, и встроенный источник данных не может быть настроен.
Причина: не удалось...

0 Ответы

46 Просмотры

Последнее сообщение Anonymous
23 окт 2024, 17:53
Не удалось настроить источник данных: атрибут «url» не указан, и встроенный источник данных не может быть указан.

Последнее сообщение Anonymous « 24 окт 2024, 03:57
Добавлено в форуме JAVA

Anonymous » 24 окт 2024, 03:57 » в форуме JAVA

Я пытаюсь создать Restful API с помощью Springboot, но столкнулся со следующей ошибкой:

Не удалось настроить источник данных: атрибут 'url' имеет значение не указано, и встроенный источник данных не может быть настроен.
Причина: не удалось...

0 Ответы

30 Просмотры

Последнее сообщение Anonymous
24 окт 2024, 03:57

Вернуться в «JAVA»