Я столкнулся с проблемой производительности команды PostgreSQL COPY при ее локальном запуске. Мой удаленный внутренний сервер приложений и мой локальный компьютер имеют одинаковые характеристики (оба с твердотельными накопителями, одинаковой оперативной памятью и ядрами ЦП). Сама база данных PostgreSQL размещена на другом удаленном сервере, и доступ к базе данных возможен только через определенное интернет-соединение, включенное в белый список.
Проблема в том, что команда COPY выполняется слишком часто. на моей локальной машине медленнее, чем на удаленном сервере, хотя обе среды очень похожи. Мой локальный компьютер подключен к Интернету из белого списка, который также работает быстро.
Вот фрагмент моего кода:
import psycopg2
import glob
import os
from multiprocessing import Pool
from functools import partial
def get_connection(env):
conn = psycopg2.connect(f"""postgresql://{env["USER"]}:{env["PASSWORD"]}@{env["HOST"]}:{env["PORT"]}/{env["NAME"]}""")
try:
yield conn
finally:
conn.close()
def copy_from(file_path: str, table_name: str, env, column_string: str):
with get_connection(env) as connection:
with connection.cursor() as cursor:
with open(file_path, "r") as f:
query = f"COPY {table_name} ({column_string}) FROM STDIN WITH (FORMAT CSV, HEADER FALSE, DELIMITER ',', NULL '')"
cursor.copy_expert(query, f)
connection.commit()
if __name__ == "__main__":
file_path_list = sorted(glob.glob(os.path.join(file_path, "*.csv")))
with Pool(cores_to_use) as p:
p.map(partial(copy_from, table_name=table_name, env=env, column_string=column_string), file_path_list)
Локальный компьютер
Linux Ubuntu 22.04 LTS с Seqrite EndPoint Security Результат трассировки:
HIT 1:
< ul>
Шлюз: ~3,5 мс
Промежуточные переходы: от 6,5 мс до 27,9 мс
Конечные переходы: от 7,0 мс до 10,1 мс
[*]HIT 2:
Шлюз: ~1,6 мс
Промежуточные переходы: от 5,5 мс до 40,7 мс
Конечные переходы: 7,7 мс до 12,7 мс
Удаленный сервер
ОС: Linux Ubuntu Результат трассировки:
HIT 1:
Шлюз: от ~0,2 до 0,7 мс
Промежуточные переходы: все ответы либо недоступны, либо < 1 мс
[*]HIT 2< /strong>:
Шлюз: от ~0,6 до 0,7 мс
Промежуточные переходы: все ответы либо недоступны или < 1 мс
Вопросы:
Почему команда COPY может работать медленнее локально, несмотря на схожие характеристики и быстрое подключение к Интернету?
Существуют ли такие проблемы какие-либо конкретные оптимизации или конфигурации, которые мне следует проверить на своем локальном компьютере, чтобы повысить производительность?
Может ли задержка сети или другие факторы влиять на локальную производительность, и если да, то как я могу решить эту проблему?< /li>
Будем очень признательны за любые идеи и предложения!
Я столкнулся с проблемой производительности команды PostgreSQL COPY при ее локальном запуске. Мой удаленный внутренний сервер приложений и мой локальный компьютер имеют одинаковые характеристики (оба с твердотельными накопителями, одинаковой оперативной памятью и ядрами ЦП). Сама база данных PostgreSQL размещена на другом удаленном сервере, и доступ к базе данных возможен только через определенное интернет-соединение, включенное в белый список. Проблема в том, что команда COPY выполняется слишком часто. на моей локальной машине медленнее, чем на удаленном сервере, хотя обе среды очень похожи. Мой локальный компьютер подключен к Интернету из белого списка, который также работает быстро. Вот фрагмент моего кода: [code]import psycopg2 import glob import os from multiprocessing import Pool from functools import partial
def copy_from(file_path: str, table_name: str, env, column_string: str): with get_connection(env) as connection: with connection.cursor() as cursor: with open(file_path, "r") as f: query = f"COPY {table_name} ({column_string}) FROM STDIN WITH (FORMAT CSV, HEADER FALSE, DELIMITER ',', NULL '')" cursor.copy_expert(query, f) connection.commit()
if __name__ == "__main__": file_path_list = sorted(glob.glob(os.path.join(file_path, "*.csv"))) with Pool(cores_to_use) as p: p.map(partial(copy_from, table_name=table_name, env=env, column_string=column_string), file_path_list) [/code] [b]Локальный компьютер[/b] Linux Ubuntu 22.04 LTS с Seqrite EndPoint Security [b]Результат трассировки:[/b] [list] [*][b]HIT 1[/b]: < ul> Шлюз: ~3,5 мс [*]Промежуточные переходы: от 6,5 мс до 27,9 мс [*]Конечные переходы: от 7,0 мс до 10,1 мс [/list]
[*][b]HIT 2[/b]: [list] Шлюз: ~1,6 мс [*]Промежуточные переходы: от 5,5 мс до 40,7 мс [*]Конечные переходы: 7,7 мс до 12,7 мс [/list]
[b]Удаленный сервер[/b] ОС: Linux Ubuntu [b]Результат трассировки:[/b] [list] [*][b]HIT 1[/b]:
Шлюз: от ~0,2 до 0,7 мс [*]Промежуточные переходы: все ответы либо недоступны, либо < 1 мс [/list]
[*][b]HIT 2< /strong>: [list] Шлюз: от ~0,6 до 0,7 мс [*]Промежуточные переходы: все ответы либо недоступны или < 1 мс [/list]
Вопросы:[/b] [list] [*]Почему команда COPY может работать медленнее локально, несмотря на схожие характеристики и быстрое подключение к Интернету? [*]Существуют ли такие проблемы какие-либо конкретные оптимизации или конфигурации, которые мне следует проверить на своем локальном компьютере, чтобы повысить производительность? Может ли задержка сети или другие факторы влиять на локальную производительность, и если да, то как я могу решить эту проблему?< /li> [/list] Будем очень признательны за любые идеи и предложения!
Я столкнулся с проблемой производительности команды PostgreSQL COPY при ее локальном запуске. Мой удаленный внутренний сервер приложений и мой локальный компьютер имеют одинаковые характеристики (оба с твердотельными накопителями, одинаковой...
Я столкнулся с проблемой производительности команды PostgreSQL COPY при ее локальном запуске. Мой удаленный внутренний сервер приложений и мой локальный компьютер имеют одинаковые характеристики (оба с твердотельными накопителями, одинаковой...
Я столкнулся с проблемой производительности команды PostgreSQL COPY при ее локальном запуске. В частности, мои файлы .csv находятся на моем локальном компьютере, и я отправляю их на удаленный сервер PostgreSQL с помощью COPY. И мой удаленный...
Как вы можете видеть в прилагаемом скриншоте, описан следующий код, чтобы вызвать конструктор копирования, когда OBJ1 копируется с возвращающим значением из вызова MyClass :: createObject . Однако выход показывает, что конструктор по умолчанию...
Следующий код показывает, что конструктор по умолчанию (а не конструктор копии) вызывается, когда obj1 инициализируется копированием с возвращающим значением из вызова в MyClass :: createObject . Что я заметил, так это то, что в таком случае адрес...