Код: Выделить всё
driver_manager = spark._sc._gateway.jvm.java.sql.DriverManager
connection = driver_manager.getConnection(args["sql_server_jdbc_url"], database_username, database_user_password)
exec_statement = connection.prepareCall("EXEC SP")
exec_statement.execute()
result = exec_statement.getResultSet()
from pyspark.sql import SQLContext, DataFrame
sqlContext = SQLContext(sparkContext=spark.sparkContext, sparkSession=spark)
df = DataFrame(result, sqlContext)
df.printSchema()
ищем указатели на то, как преобразовать результаты хранимой процедуры в фрейм данных pySpark.
Пробовал этот Pyspark Jupyter — фрейм данных, созданный в коде Java, а не в коде Python
Подробнее здесь: https://stackoverflow.com/questions/785 ... -dataframe
Мобильная версия