Получение больших наборов данных из SAP HANA с использованием hdbcli в Python выполняется очень медленно.

Получение больших наборов данных из SAP HANA с использованием hdbcli в Python выполняется очень медленно. ⇐ Python

1 сообщение • Страница 1 из 1

Anonymous

Получение больших наборов данных из SAP HANA с использованием hdbcli в Python выполняется очень медленно.

Цитата

Сообщение Anonymous » 10 фев 2026, 10:50

Я пытаюсь получить данные из базы данных SAP HANA с помощью Python. Я использую библиотеку hdbcli для подключения к HANA и pandas для чтения данных. Основным требованием моего варианта использования является эффективное получение больших наборов данных из SAP HANA с использованием пакетной (частичной) выборки.
Однако получение даже относительно небольшого количества записей происходит очень медленно. Например, получение 10 000 строк занимает более 60 секунд, что кажется необычно большим.
Ниже приведен код, который я использую.

Код: Выделить всё

from hdbcli import dbapi
import pandas as pd

connection = dbapi.connect(
address="**-----------**",
port="**-----------**",
user="**-----------**",
password="**-----------**"
)

cursor = connection.cursor()
cursor.arraysize = 50000

query = "SELECT * FROM table_name LIMIT 10000"
df_iter = pd.read_sql_query(query, connection, chunksize=10000)

records = []

for df_chunk in df_iter:
records.extend(df_chunk.to_dict("records"))

Существуют ли какие-либо рекомендуемые настройки или рекомендации по повышению производительности выборки из SAP HANA в Python?
Будем очень признательны за любые рекомендации или предложения.>

Подробнее здесь: https://stackoverflow.com/questions/798 ... -very-slow

1770709834

Anonymous

Я пытаюсь получить данные из базы данных SAP HANA с помощью Python. Я использую библиотеку [b]hdbcli[/b] для подключения к HANA и [b]pandas[/b] для чтения данных. Основным требованием моего варианта использования является эффективное получение больших наборов данных из SAP HANA с использованием пакетной (частичной) выборки.
Однако получение даже относительно небольшого количества записей происходит очень медленно. Например, получение 10 000 строк занимает более 60 секунд, что кажется необычно большим.
Ниже приведен код, который я использую.
[code]from hdbcli import dbapi
import pandas as pd

connection = dbapi.connect(
address="**-----------**",
port="**-----------**",
user="**-----------**",
password="**-----------**"
)

cursor = connection.cursor()
cursor.arraysize = 50000

query = "SELECT * FROM table_name LIMIT 10000"
df_iter = pd.read_sql_query(query, connection, chunksize=10000)

records = []

for df_chunk in df_iter:
records.extend(df_chunk.to_dict("records"))
[/code]
Существуют ли какие-либо рекомендуемые настройки или рекомендации по повышению производительности выборки из SAP HANA в Python?
Будем очень признательны за любые рекомендации или предложения.> 

Подробнее здесь: [url]https://stackoverflow.com/questions/79884813/fetching-large-datasets-from-sap-hana-using-hdbcli-in-python-is-very-slow[/url]