Как читать коллекцию Azure CosmosDb в Databricks и записывать в Spark DataFrame

Как читать коллекцию Azure CosmosDb в Databricks и записывать в Spark DataFrame ⇐ Python

1 сообщение • Страница 1 из 1

Anonymous

Как читать коллекцию Azure CosmosDb в Databricks и записывать в Spark DataFrame

Цитата

Сообщение Anonymous » 26 окт 2024, 01:30

Я запрашиваю коллекцию CosmosDb и могу распечатать результаты. Когда я пытаюсь сохранить результаты в Spark DataFrame, это не удается.

Ссылался на этот сайт в качестве примера:

Как читать данные из Azure CosmosDB в Python

Выполнили точные шаги по ссылке выше. Кроме того, попробуйте следующее

Код: Выделить всё

 df = spark.createDataFrame(dataset)

Это вызывает следующую ошибку:

ValueError: некоторые типы не могут быть определены после вывода

ValueError
Traceback (последний вызов, последний)

в ()

25 print (набор данных)

26

---> 27 df = spark.createDataFrame(набор данных)

28 df.show()

29

/databricks/spark/python/pyspark/sql/session.py в createDataFrame(self, data,schema, sampleRatio,verifySchema)

808 rdd, Schema = self._createFromRDD(data.map(prepare), Schema, SampleRatio)

809 else:

--> 810 rdd , Schema = self._createFromLocal(map(prepare, data), Schema)

811 jrdd = self._jvm.SerDeUtil.toJavaArray(rdd._to_java_object_rdd())

812 jdf = self._jsparkSession.applySchemaToPythonRDD(jrdd.rdd(), Schema.json())

/databricks/spark/python/pyspark/sql/session.py в _createFromLocal(self, data, Schema)

440 запись временных файлов.

441 """

--> 442 данных, схема = self ._wrap_data_schema(данные, схема)

443 return self._sc.parallelize(данные), схема

Но если вы хотите сохранить это как Spark DataFrame

, мы будем очень признательны за любую помощь. спасибо!!!>

Подробнее здесь: https://stackoverflow.com/questions/559 ... rk-datafra

1729895442

Anonymous

Я запрашиваю коллекцию CosmosDb и могу распечатать результаты.  Когда я пытаюсь сохранить результаты в Spark DataFrame, это не удается.

Ссылался на этот сайт в качестве примера:

Как читать данные из Azure CosmosDB в Python

Выполнили точные шаги по ссылке выше. Кроме того, попробуйте следующее

[code] df = spark.createDataFrame(dataset)
[/code]

Это вызывает следующую ошибку:


ValueError: некоторые типы не могут быть определены после вывода

ValueError
Traceback (последний вызов, последний)

в ()

25 print (набор данных)

26

---> 27 df = spark.createDataFrame(набор данных)

28 df.show()

29 

/databricks/spark/python/pyspark/sql/session.py в createDataFrame(self, data,schema, sampleRatio,verifySchema)

808 rdd, Schema = self._createFromRDD(data.map(prepare), Schema, SampleRatio)

809 else:

--> 810 rdd , Schema = self._createFromLocal(map(prepare, data), Schema)

811 jrdd = self._jvm.SerDeUtil.toJavaArray(rdd._to_java_object_rdd())

812 jdf = self._jsparkSession.applySchemaToPythonRDD(jrdd.rdd(), Schema.json()) 

/databricks/spark/python/pyspark/sql/session.py в _createFromLocal(self, data, Schema)

440 запись временных файлов.

441 """

--> 442 данных, схема = self ._wrap_data_schema(данные, схема)

443 return self._sc.parallelize(данные), схема 


Но если вы хотите сохранить это как Spark DataFrame

, мы будем очень признательны за любую помощь.  спасибо!!!> 

Подробнее здесь: [url]https://stackoverflow.com/questions/55937765/how-to-read-azure-cosmosdb-collection-in-databricks-and-write-to-a-spark-datafra[/url]

Ответить Пред. тема След. тема

1 сообщение • Страница 1 из 1

Быстрый ответ

Заголовок:

Имя пользователя:

Изменение регистра текста:

Смайлики

Ещё смайлики…

К этому ответу прикреплено по крайней мере одно вложение.

Если вы не хотите добавлять вложения, оставьте поля пустыми. Можно прикреплять файлы, перетаскивая их в окно сообщения.

Максимально разрешённый размер вложения: 15 МБ.

Имя файла:

Комментарий к файлу:

Имя файла	Комментарий к файлу	Размер	Статус

Похожие темы

Ответы

Просмотры

Последнее сообщение

Оболочка Spark: spark.executor.extraJavaOptions не разрешено устанавливать параметры Spark.

Последнее сообщение Anonymous « 24 сен 2024, 08:55
Добавлено в форуме Python

Anonymous » 24 сен 2024, 08:55 » в форуме Python

Я создал эту программу Spark Shell, но при ее запуске возникла ошибка:
Windows PowerShell
Copyright (C) Microsoft Corporation. All rights reserved.

Install the latest PowerShell for new features and improvements!

PS...

0 Ответы

52 Просмотры

Последнее сообщение Anonymous
24 сен 2024, 08:55
Скопируйте модель машинного обучения из одной рабочей области Azure Databricks в другую рабочую область Databricks.

Последнее сообщение Anonymous « 08 окт 2024, 12:11
Добавлено в форуме Python

Anonymous » 08 окт 2024, 12:11 » в форуме Python

Я запустил приведенный ниже код для экспорта модели ML в mlflow на основе Azure Databricks , но, похоже, получаю эту ошибку: Хост или токен MLflow настроены неправильно .
Я не могу понять, в чем проблема. URL-адрес рабочей области и токен PAT...

0 Ответы

36 Просмотры

Последнее сообщение Anonymous
08 окт 2024, 12:11
Скопируйте модель машинного обучения из одной рабочей области Azure Databricks в другую рабочую область Databricks.

Последнее сообщение Anonymous « 08 окт 2024, 13:11
Добавлено в форуме Python

Anonymous » 08 окт 2024, 13:11 » в форуме Python

Я выполнил приведенный ниже код для экспорта модели машинного обучения в mlflow на основе Azure Databricks , но, похоже, получаю эту ошибку
MLflow host or token is not configured correctly

Я не могу понять, в чем проблема. URL-адрес рабочей области...

0 Ответы

27 Просмотры

Последнее сообщение Anonymous
08 окт 2024, 13:11
Скопируйте модель машинного обучения из одной рабочей области Azure Databricks в другую рабочую область Databricks.

Последнее сообщение Anonymous « 09 окт 2024, 08:20
Добавлено в форуме Python

Anonymous » 09 окт 2024, 08:20 » в форуме Python

Я выполнил приведенный ниже код для экспорта модели машинного обучения в mlflow на основе Azure Databricks , но, похоже, получаю эту ошибку
MLflow host or token is not configured correctly

Я не могу понять, в чем проблема. URL-адрес рабочей области...

0 Ответы

30 Просмотры

Последнее сообщение Anonymous
09 окт 2024, 08:20
Скопируйте модель машинного обучения из одной рабочей области Azure Databricks в другую рабочую область Databricks.

Последнее сообщение Anonymous « 09 окт 2024, 20:22
Добавлено в форуме Python

Anonymous » 09 окт 2024, 20:22 » в форуме Python

Я запустил приведенный ниже код для экспорта модели машинного обучения в млпоток на основе Azure Databricks , но, похоже, получаю эту ошибку

Хост или токен MLflow настроены неправильно

Я не могу понять, в чем проблема. URL-адрес рабочей области и...

0 Ответы

19 Просмотры

Последнее сообщение Anonymous
09 окт 2024, 20:22

Вернуться в «Python»