Получение больших наборов данных из SAP HANA с использованием hdbcli в Python выполняется очень медленно.Python

Программы на Python
Ответить
Anonymous
 Получение больших наборов данных из SAP HANA с использованием hdbcli в Python выполняется очень медленно.

Сообщение Anonymous »

Я пытаюсь получить данные из базы данных SAP HANA с помощью Python. Я использую библиотеку hdbcli для подключения к HANA и pandas для чтения данных. Основным требованием моего варианта использования является эффективное получение больших наборов данных из SAP HANA с использованием пакетной (частичной) выборки.
Однако получение даже относительно небольшого количества записей происходит очень медленно. Например, получение 10 000 строк занимает более 60 секунд, что кажется необычно большим.
Ниже приведен код, который я использую.

Код: Выделить всё

from hdbcli import dbapi
import pandas as pd

connection = dbapi.connect(
address="**-----------**",
port="**-----------**",
user="**-----------**",
password="**-----------**"
)

cursor = connection.cursor()
cursor.arraysize = 50000

query = "SELECT * FROM table_name LIMIT 10000"
df_iter = pd.read_sql_query(query, connection, chunksize=10000)

records = []

for df_chunk in df_iter:
records.extend(df_chunk.to_dict("records"))
Существуют ли какие-либо рекомендуемые настройки или рекомендации по повышению производительности выборки из SAP HANA в Python?
Будем очень признательны за любые рекомендации или предложения.>

Подробнее здесь: https://stackoverflow.com/questions/798 ... -very-slow
Ответить

Быстрый ответ

Изменение регистра текста: 
Смайлики
:) :( :oops: :roll: :wink: :muza: :clever: :sorry: :angel: :read: *x)
Ещё смайлики…
   
К этому ответу прикреплено по крайней мере одно вложение.

Если вы не хотите добавлять вложения, оставьте поля пустыми.

Максимально разрешённый размер вложения: 15 МБ.

Вернуться в «Python»