Эффективный SQL-запрос с помощью pandas с использованием databricks-sql-python

Эффективный SQL-запрос с помощью pandas с использованием databricks-sql-python ⇐ Python

1 сообщение • Страница 1 из 1

Anonymous

Эффективный SQL-запрос с помощью pandas с использованием databricks-sql-python

Цитата

Сообщение Anonymous » 08 дек 2024, 02:24

Databricks позволяет выполнять SQL-запросы через API с использованием пакета databricks-sql-python.
Существует два способа создания объекта соединения, который можно поместить в pd. read_sql_query(sql, con=connection). Мне интересно, какой из них лучше с точки зрения производительности и надежности при выполнении SQL-запросов из панд:

Создание Python DB API 2.0 с помощью

Создание Python DB API 2.0 с помощью

p>
Код: Выделить всё
```
from databricks import sql

connection = sql.connect(server_hostname=host, http_path=http_path)
```
это работает, но выдает следующее предупреждение:
Код: Выделить всё
```
UserWarning: pandas only supports SQLAlchemy connectable (engine/connection) or
database string URI or sqlite3 DBAPI2
connection. Other DBAPI2 objects are not tested. Please consider using SQLAlchemy.
```
В коде реализации похоже, что они используют pyarrow, что мне кажется эффективным способом создания DataFrames панд. Однако предупреждение немного отпугивает.
Другая альтернатива — использовать SQLAlchemy, у которой есть соединитель databricks, предоставляемый тот же пакет,
Код: Выделить всё
```
from sqlalchemy import create_engine

engine = create_engine(f"databricks://

Подробнее здесь: [url]https://stackoverflow.com/questions/79235310/efficient-sql-query-with-pandas-using-databricks-sql-python[/url]
```

1733613899

Anonymous

Databricks позволяет выполнять SQL-запросы через API с использованием пакета databricks-sql-python.
Существует два способа создания объекта соединения, который можно поместить в pd. read_sql_query(sql, con=connection). Мне интересно, какой из них лучше с точки зрения производительности и надежности при выполнении SQL-запросов из панд:
[list]
[*]Создание Python DB API 2.0 с помощью

Создание Python DB API 2.0 с помощью

 p>
[code]from databricks import sql

connection = sql.connect(server_hostname=host, http_path=http_path)
[/code]
это работает, но выдает следующее предупреждение:
[code]UserWarning: pandas only supports SQLAlchemy connectable (engine/connection) or
database string URI or sqlite3 DBAPI2
connection. Other DBAPI2 objects are not tested. Please consider using SQLAlchemy.
[/code]
В коде реализации похоже, что они используют pyarrow, что мне кажется эффективным способом создания DataFrames панд. Однако предупреждение немного отпугивает.

[*]Другая альтернатива — использовать SQLAlchemy, у которой есть соединитель databricks, предоставляемый тот же пакет,
[code]from sqlalchemy import create_engine

engine = create_engine(f"databricks://

Подробнее здесь: [url]https://stackoverflow.com/questions/79235310/efficient-sql-query-with-pandas-using-databricks-sql-python[/url]

Ответить Пред. тема След. тема

1 сообщение • Страница 1 из 1

Быстрый ответ

Заголовок:

Имя пользователя:

Изменение регистра текста:

Смайлики

Ещё смайлики…

К этому ответу прикреплено по крайней мере одно вложение.

Если вы не хотите добавлять вложения, оставьте поля пустыми. Можно прикреплять файлы, перетаскивая их в окно сообщения.

Максимально разрешённый размер вложения: 15 МБ.

Имя файла:

Комментарий к файлу:

Имя файла	Комментарий к файлу	Размер	Статус

Похожие темы

Ответы

Просмотры

Последнее сообщение

Эффективный SQL-запрос с помощью pandas с использованием databricks-sql-python

Последнее сообщение Anonymous « 29 ноя 2024, 00:07
Добавлено в форуме Python

Anonymous » 29 ноя 2024, 00:07 » в форуме Python

Databricks позволяет выполнять SQL-запросы через API с использованием пакета databricks-sql-python.
Существует два способа создания объекта соединения, который можно поместить в pd. read_sql_query(sql, con=connection). Мне интересно, какой из них...

0 Ответы

14 Просмотры

Последнее сообщение Anonymous
29 ноя 2024, 00:07
Эффективный SQL-запрос с помощью pandas с использованием databricks-sql-python

Последнее сообщение Anonymous « 02 дек 2024, 15:45
Добавлено в форуме Python

Anonymous » 02 дек 2024, 15:45 » в форуме Python

Databricks позволяет выполнять SQL-запросы через API с использованием пакета databricks-sql-python.
Существует два способа создания объекта соединения, который можно поместить в pd. read_sql_query(sql, con=connection). Мне интересно, какой из них...

0 Ответы

16 Просмотры

Последнее сообщение Anonymous
02 дек 2024, 15:45
Эффективный SQL-запрос с помощью pandas с использованием databricks-sql-python

Последнее сообщение Anonymous « 03 дек 2024, 18:17
Добавлено в форуме Python

Anonymous » 03 дек 2024, 18:17 » в форуме Python

Databricks позволяет выполнять SQL-запросы через API с использованием пакета databricks-sql-python.
Существует два способа создания объекта соединения, который можно поместить в pd. read_sql_query(sql, con=connection). Мне интересно, какой из них...

0 Ответы

21 Просмотры

Последнее сообщение Anonymous
03 дек 2024, 18:17
Подключитесь к Delta Table из приложения Dash DataBricks с использованием DataBricks Connect

Последнее сообщение Anonymous « 12 фев 2025, 15:51
Добавлено в форуме Python

Anonymous » 12 фев 2025, 15:51 » в форуме Python

Я создаю свое первое приложение Dash в приложениях DataBricks (Azure). Я хочу извлечь данные из таблицы Delta в той же учетной записи. Приложение развертывается без ошибки, но когда я загружаю его, я получаю ошибку «Была проблема, подключающаяся к...

0 Ответы

21 Просмотры

Последнее сообщение Anonymous
12 фев 2025, 15:51
Databricks не может найти файл csv внутри колеса, которое я установил при запуске из блокнота Databricks.

Последнее сообщение Anonymous « 31 мар 2024, 17:51
Добавлено в форуме Python

Anonymous » 31 мар 2024, 17:51 » в форуме Python

Я изучаю Spark, поэтому в качестве задачи нам нужно было создать колесо локально, а затем установить его в Databricks (я использую Azure Databricks) и протестировать его, запустив из блокнота Databrick. Эта программа предполагает чтение файла CSV...

0 Ответы

92 Просмотры

Последнее сообщение Anonymous
31 мар 2024, 17:51

Вернуться в «Python»