Невозможно загрузить транзакционную таблицу Hive в фрейм данных с помощью Spark2.Python

Программы на Python
Ответить Пред. темаСлед. тема
Anonymous
 Невозможно загрузить транзакционную таблицу Hive в фрейм данных с помощью Spark2.

Сообщение Anonymous »

Я пытаюсь загрузить транзакционную таблицу куста в фрейм данных PySpark, но получаю сообщение об ошибке:

py4j.protocol.Py4JJavaError: произошла ошибка при вызове o086.showString.
Вызвано: java.util.concurrent.ExecutionException: java.lang.NumberFormatException: для входной строки: «0289756_0000»

Использование SparkSession.builder и попытка загрузки в фрейм данных.
Есть ли способ загрузить транзакционную таблицу в фрейм данных?
Версия Spark: 2.1.0.2.6.0.3-8

Версия Python: 2.7.5
Я попробовал загрузить таблицу с помощью SparkSession.builder( ).
Я ожидал, что он вернет объект DataFrame.
spark = SparkSession.builder \
.appName(application_name) \
.config("spark.jars", "path/to/jar") \
.enableHiveSupport() \
.getOrCreate()

df = spark.read \
.format("jdbc") \
.option("url", jdbc_url) \
.option("dbtable", "database.table") \
.options(**properties) \
.load()

df.show() # Returns error above every time


Подробнее здесь: https://stackoverflow.com/questions/791 ... ing-spark2
Реклама
Ответить Пред. темаСлед. тема

Быстрый ответ

Изменение регистра текста: 
Смайлики
:) :( :oops: :roll: :wink: :muza: :clever: :sorry: :angel: :read: *x)
Ещё смайлики…
   
К этому ответу прикреплено по крайней мере одно вложение.

Если вы не хотите добавлять вложения, оставьте поля пустыми.

Максимально разрешённый размер вложения: 15 МБ.

  • Похожие темы
    Ответы
    Просмотры
    Последнее сообщение

Вернуться в «Python»