«Запись Spark-PySpark Redshift JDBC: нет подходящего драйвера / ClassNotFoundException: com.amazon.redshift.jdbc42.Ошибк

«Запись Spark-PySpark Redshift JDBC: нет подходящего драйвера / ClassNotFoundException: com.amazon.redshift.jdbc42.Ошибк ⇐ JAVA

1 сообщение • Страница 1 из 1

Anonymous

«Запись Spark-PySpark Redshift JDBC: нет подходящего драйвера / ClassNotFoundException: com.amazon.redshift.jdbc42.Ошибк

Цитата

Сообщение Anonymous » 23 дек 2024, 12:31

Я пытаюсь записать DataFrame из Spark (PySpark) в бессерверный кластер Amazon Redshift с помощью драйвера Redshift JDBC.
Я постоянно сталкиваюсь с ошибками, связанными с драйвером: р>

Код: Выделить всё

•   java.sql.SQLException: No suitable driver

•   java.lang.ClassNotFoundException: com.amazon.redshift.jdbc42.Driver

Что я пробовал:

Код: Выделить всё

1.  Setup:

•   Spark version: (e.g., Spark 3.3.1)

•   Hadoop AWS packages: --packages org.apache.hadoop:hadoop-aws:3.3.1,com.amazonaws:aws-java-sdk-bundle:1.11.901

•   Redshift JDBC driver: RedshiftJDBC42-2.1.0.30.jar downloaded from Amazon’s official site.

2.  spark-submit command:

spark-submit

--conf spark.driver.bindAddress=127.0.0.1

--conf spark.driver.host =127.0.0.1

--driver-memory 4g

--packages org.apache.hadoop:hadoop-aws:3.3.1,com.amazonaws:aws-java-sdk-bundle:1.11.901

--jars /path/to/RedshiftJDBC42-2.1.0.30 .jar

--drive-class-path /path/to/RedshiftJDBC42-2.1.0.30.jar

my_script.py
Я попробовал добавить --driver-class-path, чтобы драйвер виден водителю. Файл JAR определенно существует по указанному пути.

Код: Выделить всё

3.  In the Python Code:

jdbc_url = "jdbc:redshift://:5439/dev"
(df.write
.format("jdbc")
.option ("url", jdbc_url)
.option("dbtable", "public.my_staging_table")
.option("user", os.environ["REDSHIFT_USER"])
.option("пароль", os.environ["REDSHIFT_PASSWORD"])
.option("driver", "com.amazon.redshift.jdbc42.Driver ")
.mode("append")
.save())
Код работает нормально до тех пор, пока .save(), после чего я получаю сообщение «Нет подходящего драйвера» или исключение ClassNotFoundException для класса драйвера Redshift.
Что я знаю:

Код: Выделить всё

•   The Redshift JDBC driver class should be com.amazon.redshift.jdbc42.Driver.

•   I’ve seen suggestions to use --driver-class-path plus --jars to ensure the driver is on both driver and executor classpaths.

•   If I remove --driver-class-path, I sometimes get ClassNotFoundException. With it, I still get No suitable driver.

•   My AWS credentials and S3 reading works fine (I can read JSON from S3). The problem occurs only at the JDBC write to Redshift step.

Вопросы:

Код: Выделить всё

•   Is there another configuration step needed to ensure Spark recognizes the Redshift driver?

•   Do I need to specify any additional spark configs for the JDBC driver?

•   Are there known compatibility issues with this Redshift driver version and Spark/Hadoop versions?

•   Should I consider a different Redshift driver JAR or a different approach (like spark-redshift or redshift-jdbc42-no-awssdk JAR)?

Будем очень признательны за любые рекомендации по устранению ошибок «Нет подходящего драйвера» и ClassNotFoundException при записи в Redshift через JDBC в Spark.

Подробнее здесь: https://stackoverflow.com/questions/792 ... dexception

1734946278

Anonymous

Я пытаюсь записать DataFrame из Spark (PySpark) в бессерверный кластер Amazon Redshift с помощью драйвера Redshift JDBC.
Я постоянно сталкиваюсь с ошибками, связанными с драйвером: р>
[code]•   java.sql.SQLException: No suitable driver

•   java.lang.ClassNotFoundException: com.amazon.redshift.jdbc42.Driver
[/code]
Что я пробовал:
[code]1.  Setup:

•   Spark version: (e.g., Spark 3.3.1)

•   Hadoop AWS packages: --packages org.apache.hadoop:hadoop-aws:3.3.1,com.amazonaws:aws-java-sdk-bundle:1.11.901

•   Redshift JDBC driver: RedshiftJDBC42-2.1.0.30.jar downloaded from Amazon’s official site.

2.  spark-submit command:
[/code]
spark-submit

--conf spark.driver.bindAddress=127.0.0.1

--conf spark.driver.host =127.0.0.1

--driver-memory 4g

--packages org.apache.hadoop:hadoop-aws:3.3.1,com.amazonaws:aws-java-sdk-bundle:1.11.901

--jars /path/to/RedshiftJDBC42-2.1.0.30 .jar

--drive-class-path /path/to/RedshiftJDBC42-2.1.0.30.jar

my_script.py
Я попробовал добавить --driver-class-path, чтобы драйвер виден водителю. Файл JAR определенно существует по указанному пути.
[code]3.  In the Python Code:
[/code]
jdbc_url = "jdbc:redshift://:5439/dev"
(df.write
.format("jdbc")
.option ("url", jdbc_url)
.option("dbtable", "public.my_staging_table")
.option("user", os.environ["REDSHIFT_USER"])
.option("пароль", os.environ["REDSHIFT_PASSWORD"])
.option("driver", "com.amazon.redshift.jdbc42.Driver ")
.mode("append")
.save())
Код работает нормально до тех пор, пока .save(), после чего я получаю сообщение «Нет подходящего драйвера» или исключение ClassNotFoundException для класса драйвера Redshift.
Что я знаю:
[code]•   The Redshift JDBC driver class should be com.amazon.redshift.jdbc42.Driver.

•   I’ve seen suggestions to use --driver-class-path plus --jars to ensure the driver is on both driver and executor classpaths.

•   If I remove --driver-class-path, I sometimes get ClassNotFoundException. With it, I still get No suitable driver.

•   My AWS credentials and S3 reading works fine (I can read JSON from S3). The problem occurs only at the JDBC write to Redshift step.
[/code]
Вопросы:
[code]•   Is there another configuration step needed to ensure Spark recognizes the Redshift driver?

•   Do I need to specify any additional spark configs for the JDBC driver?

•   Are there known compatibility issues with this Redshift driver version and Spark/Hadoop versions?

•   Should I consider a different Redshift driver JAR or a different approach (like spark-redshift or redshift-jdbc42-no-awssdk JAR)?
[/code]
Будем очень признательны за любые рекомендации по устранению ошибок «Нет подходящего драйвера» и ClassNotFoundException при записи в Redshift через JDBC в Spark. 

Подробнее здесь: [url]https://stackoverflow.com/questions/79270604/spark-pyspark-redshift-jdbc-write-no-suitable-driver-classnotfoundexception[/url]

Ответить Пред. тема След. тема

1 сообщение • Страница 1 из 1

Быстрый ответ

Заголовок:

Имя пользователя:

Изменение регистра текста:

Смайлики

Ещё смайлики…

К этому ответу прикреплено по крайней мере одно вложение.

Если вы не хотите добавлять вложения, оставьте поля пустыми. Можно прикреплять файлы, перетаскивая их в окно сообщения.

Максимально разрешённый размер вложения: 15 МБ.

Имя файла:

Комментарий к файлу:

Имя файла	Комментарий к файлу	Размер	Статус

Похожие темы

Ответы

Просмотры

Последнее сообщение

«Запись Spark-PySpark Redshift JDBC: нет подходящего драйвера / ClassNotFoundException: com.amazon.redshift.jdbc42.Ошибк

Последнее сообщение Anonymous « 18 дек 2024, 02:02
Добавлено в форуме JAVA

Anonymous » 18 дек 2024, 02:02 » в форуме JAVA

Я пытаюсь записать DataFrame из Spark (PySpark) в бессерверный кластер Amazon Redshift с помощью драйвера Redshift JDBC.
Я постоянно сталкиваюсь с ошибками, связанными с драйвером: р>
• java.sql.SQLException: No suitable driver

•...

0 Ответы

20 Просмотры

Последнее сообщение Anonymous
18 дек 2024, 02:02
Имя хоста для LocalStack Redshift для драйвера JDBC Amazon Redshift

Последнее сообщение Anonymous « 14 ноя 2024, 19:53
Добавлено в форуме JAVA

Anonymous » 14 ноя 2024, 19:53 » в форуме JAVA

Я установил LocalStack на своем компьютере с Windows и начал с redshift и нескольких других сервисов.
Затем я создал кластер и базу данных.
>awslocal redshift describe-clusters --cluster-identifier my-cluster
{
Clusters :
}

В качестве адреса...

0 Ответы

18 Просмотры

Последнее сообщение Anonymous
14 ноя 2024, 19:53
Какое исключение мы получаем от SQL Server и драйвера jdbc Sybase точно так же, как мы получаем для драйвера Oracle JDBC

Последнее сообщение Anonymous « 20 ноя 2024, 15:32
Добавлено в форуме JAVA

Anonymous » 20 ноя 2024, 15:32 » в форуме JAVA

У меня есть приложение Spring Boot, в котором я подключаюсь к базам данных SQL Server, Sybase, Oracle и MySQL, чтобы получить подробную информацию о метаданных. При сборе количества строк в таблицах с приведенным ниже кодом в Oracle...

0 Ответы

25 Просмотры

Последнее сообщение Anonymous
20 ноя 2024, 15:32
Для моей программы Java не найдено никакого подходящего драйвера SQLite JDBC [Duplicate]

Последнее сообщение Anonymous « 30 май 2025, 17:41
Добавлено в форуме JAVA

Anonymous » 30 май 2025, 17:41 » в форуме JAVA

У меня есть проблема с подключением моей программы Java к базе данных SQLite в моих программах. Для той же цели я создал каталог с 5 файлами в нем:

sqlite-jdbc-3.7.2.jar.zip
sqlite-jdbc-3.7.2.jar
main.java> /> main.class
testdb

Файл...

0 Ответы

4 Просмотры

Последнее сообщение Anonymous
30 май 2025, 17:41
Какое исключение мы получаем от SQL Server и драйвера jdbc Sybase, точно так же, как мы получаем для драйвера Oracle JDB

Последнее сообщение Anonymous « 12 дек 2024, 20:15
Добавлено в форуме JAVA

Anonymous » 12 дек 2024, 20:15 » в форуме JAVA

У меня есть приложение Spring Boot, в котором я подключаюсь к базам данных SQL Server, Sybase, Oracle и MySQL, чтобы получить подробную информацию о метаданных. При сборе количества строк в таблицах с приведенным ниже кодом в Oracle...

0 Ответы

25 Просмотры

Последнее сообщение Anonymous
12 дек 2024, 20:15

Вернуться в «JAVA»