Переменное время отклика при одновременных вызовах API с помощью API ChatCompletion OpenAI

Переменное время отклика при одновременных вызовах API с помощью API ChatCompletion OpenAI ⇐ Python

1 сообщение • Страница 1 из 1

Anonymous

Переменное время отклика при одновременных вызовах API с помощью API ChatCompletion OpenAI

Цитата

Сообщение Anonymous » 03 окт 2024, 17:46

У меня наблюдается переменное время отклика при одновременных вызовах API OpenAI ChatCompletion API с использованием Python ThreadPoolExecutor. Хотя я реализовал параллельные запросы для трех разных запросов, время выполнения этих трех запросов значительно различается: некоторые занимают гораздо больше времени, чем другие, несмотря на то, что все они запускаются одновременно.
Например, время ответа составляет:

2,58 секунды
4,44 секунды
12,00 секунды

Окружение

Модель: GPT-4o-mini
Уровень: 1
Средний размер токена: I /P = 5000 , O/p = ~300

Мне нужны идеи по оптимизации этих вызовов для получения дополнительной информации. согласованное время ответа и любые стратегии эффективного управления одновременными запросами к API.
def main(input_data):

example_op= input_data['output_format']
actual_prompt = input_data['prompt']
text = input_data['text']
filename = input_data['file_name']

start = time.time()
completion = openai.ChatCompletion.create(
model='gpt-4o-mini',
messages = [
{'role': "system", "content": SYSTEM},
{'role': "user", "content": EXAMPLE_PROMPT},
{'role': "assistant", "content": json.dumps(example_op)},
{'role': "user", "content": actual_prompt.format(text)}
] ,
temperature = 0,
max_tokens = 1000

)
end = time.time()
print('Time taken : ', end-start)
return completion

prompts = [
{"output_format" : EXAMPLE_OUTPUT_EXPERIENCE , "prompt" : ACTUAL_PROMPT_EXPERIENCE, "text" : text, "file_name" : 'filename' },
{"output_format" : EXAMPLE_OUTPUT_EDUCATION , "prompt" : ACTUAL_PROMPT_EDUCATION, "text" : text, "file_name" : 'filename'},
{"output_format" : EXAMPLE_OUTPUT_PI , "prompt" : ACTUAL_PROMPT_PI, "text" : text, "file_name" : 'filename'} ]

from concurrent.futures import ThreadPoolExecutor

with ThreadPoolExecutor(max_workers=3)as executer:
response = executer.map(main1, prompts)
res =

Подробнее здесь: https://stackoverflow.com/questions/790 ... letion-api

1727966780

Anonymous

У меня наблюдается переменное время отклика при одновременных вызовах API OpenAI ChatCompletion API с использованием Python ThreadPoolExecutor. Хотя я реализовал параллельные запросы для трех разных запросов, время выполнения этих трех запросов значительно различается: некоторые занимают гораздо больше времени, чем другие, несмотря на то, что все они запускаются одновременно.
Например, время ответа составляет:
[list]
[*]2,58 секунды
[*]4,44 секунды
[*]12,00 секунды
[/list]
Окружение
[list]
[*]Модель: GPT-4o-mini

[*]Уровень: 1

[*]Средний размер токена: I /P = 5000 , O/p = ~300

[/list]
Мне нужны идеи по оптимизации этих вызовов для получения дополнительной информации. согласованное время ответа и любые стратегии эффективного управления одновременными запросами к API.
def main(input_data):

example_op= input_data['output_format']
actual_prompt = input_data['prompt']
text = input_data['text']
filename = input_data['file_name']

start = time.time()
completion = openai.ChatCompletion.create(
model='gpt-4o-mini',
messages = [
{'role': "system", "content": SYSTEM},
{'role': "user", "content": EXAMPLE_PROMPT},
{'role': "assistant", "content": json.dumps(example_op)},
{'role': "user", "content": actual_prompt.format(text)}
] ,
temperature = 0,
max_tokens = 1000

)
end = time.time()
print('Time taken : ', end-start)
return completion

prompts = [
{"output_format" : EXAMPLE_OUTPUT_EXPERIENCE , "prompt" : ACTUAL_PROMPT_EXPERIENCE, "text" : text, "file_name" : 'filename' },
{"output_format" : EXAMPLE_OUTPUT_EDUCATION , "prompt" : ACTUAL_PROMPT_EDUCATION, "text" : text, "file_name" : 'filename'},
{"output_format" : EXAMPLE_OUTPUT_PI , "prompt" : ACTUAL_PROMPT_PI, "text" : text, "file_name" : 'filename'}            ]

from concurrent.futures import ThreadPoolExecutor

with ThreadPoolExecutor(max_workers=3)as executer:
response = executer.map(main1, prompts)
res = [i for i in response]
 

Подробнее здесь: [url]https://stackoverflow.com/questions/79050184/variable-response-times-in-concurrent-api-calls-with-openais-chatcompletion-api[/url]

Ответить Пред. тема След. тема

1 сообщение • Страница 1 из 1

Быстрый ответ

Заголовок:

Имя пользователя:

Изменение регистра текста:

Смайлики

Ещё смайлики…

К этому ответу прикреплено по крайней мере одно вложение.

Если вы не хотите добавлять вложения, оставьте поля пустыми. Можно прикреплять файлы, перетаскивая их в окно сообщения.

Максимально разрешённый размер вложения: 15 МБ.

Имя файла:

Комментарий к файлу:

Имя файла	Комментарий к файлу	Размер	Статус

Похожие темы

Ответы

Просмотры

Последнее сообщение

Переменное время отклика при одновременных вызовах API с помощью API ChatCompletion OpenAI

Последнее сообщение Anonymous « 03 окт 2024, 13:52
Добавлено в форуме Python

Anonymous » 03 окт 2024, 13:52 » в форуме Python

У меня наблюдается переменное время отклика при одновременных вызовах API OpenAI ChatCompletion API с использованием Python ThreadPoolExecutor. Хотя я реализовал параллельные запросы для трех разных запросов, время выполнения этих трех запросов...

0 Ответы

24 Просмотры

Последнее сообщение Anonymous
03 окт 2024, 13:52
Ошибка OpenAI API: «Вы пытались получить доступ к openai.ChatCompletion, но это больше не поддерживается в openai>=1.0.0

Последнее сообщение Anonymous « 10 окт 2024, 14:17
Добавлено в форуме Python

Anonymous » 10 окт 2024, 14:17 » в форуме Python

В настоящее время я работаю над чат-ботом, и, поскольку я использую Windows 11, он не позволяет мне перейти на более новую библиотеку OpenAI или понизить ее версию. Могу ли я заменить функцию ChatCompletion чем-то другим, чтобы она работала в моей...

0 Ответы

230 Просмотры

Последнее сообщение Anonymous
10 окт 2024, 14:17
Ошибка API OpenAI: «Вы пытались получить доступ к openai.ChatCompletion, но это больше не поддерживается в openai>=1.0.0

Последнее сообщение Anonymous « 11 дек 2024, 23:33
Добавлено в форуме Python

Anonymous » 11 дек 2024, 23:33 » в форуме Python

В настоящее время я работаю над чат-ботом, и, поскольку я использую Windows 11, он не позволяет мне перейти на более новую библиотеку OpenAI или понизить ее версию. Могу ли я заменить функцию ChatCompletion чем-то другим, чтобы она работала в моей...

0 Ответы

58 Просмотры

Последнее сообщение Anonymous
11 дек 2024, 23:33
Создайте функцию для openai и ChatCompletion в Python.

Последнее сообщение Гость « 20 сен 2023, 22:48
Добавлено в форуме Python

Гость » 20 сен 2023, 22:48 » в форуме Python

Я пытаюсь создать простую функцию, которая будет принимать сообщение (строку) и передавать его в openai.ChatCompletion.create(), но когда я использую F-строку, она возвращает ошибка объекта. Я не очень знаком с отладкой Python, поэтому немного...

0 Ответы

24 Просмотры

Последнее сообщение Гость
20 сен 2023, 22:48
OpenAI без атрибута Chatcompletion, вы имели в виду «Завершение»

Последнее сообщение Гость « 14 окт 2023, 12:09
Добавлено в форуме Python

Гость » 14 окт 2023, 12:09 » в форуме Python

Кажется, я не могу понять, в чем проблема, я использую версию 0.28.1:

Из того, что я прочитал, мне следует использовать ChatCompletion, а не Completion, поскольку это поддерживают gpt-4 и 3.5-turbo.

response = openai.ChatCompletion.create(...

0 Ответы

67 Просмотры

Последнее сообщение Гость
14 окт 2023, 12:09

Вернуться в «Python»