При использовании Asyncio для выполнения 4 запросов Gemini-1.5-Flash дает код ошибки: 429-Ресурс был истощен, resource_e

При использовании Asyncio для выполнения 4 запросов Gemini-1.5-Flash дает код ошибки: 429-Ресурс был истощен, resource_e ⇐ Python

1 сообщение • Страница 1 из 1

Anonymous

При использовании Asyncio для выполнения 4 запросов Gemini-1.5-Flash дает код ошибки: 429-Ресурс был истощен, resource_e

Цитата

Сообщение Anonymous » 20 фев 2025, 01:38

Я пытаюсь использовать Gemini-1.5-flash , для обработки 4 текста, используя Async Way.
def generate_readable_transcript(transcript: str, model: str, converter: OpenCC) -> str:
readable_transcript = asyncio.run(_generate_readable_transcript(
transcript = transcript,
model = model,
converter = converter
))

return readable_transcript

async def _generate_readable_transcript(transcript: str, model: str, converter: OpenCC) -> str:
try:
valid_models = ['gpt-4o-mini', 'gemini-1.5-flash']

if model not in valid_models:
raise RuntimeError(f"Unsupported model: {model}.")

system_prompt = (
"You are an assistant that improves the readability of text by adding proper capitalization, "
"punctuation, and line breaks without adding or removing any words or content."
)

if model == "gemini-1.5-flash":
client = AsyncOpenAI(
base_url="https://generativelanguage.googleapis.com/v1beta/",
api_key=GEMINI_KEY
)

# https://firebase.google.com/docs/vertex ... ini-models
limit = 8192 * 0.9
gemeni_client = genai.Client(api_key=GEMINI_KEY)
encoding = None
else:
client = AsyncOpenAI(api_key=OPEN_AI_KEY)

# https://platform.openai.com/docs/models
limit = 16384 * 0.9
gemeni_client = None
encoding = tiktoken.encoding_for_model(model)

start_time = time.time()
texts = split_text_by_token_limit(
text=transcript,
limit=limit,
gemeni_client=gemeni_client,
encoding=encoding
)
end_time = time.time()
time_ms = (end_time - start_time) * 1000 # Convert to milliseconds
print(f"Time taken for split_text_by_token_limit: {time_ms:.2f} ms")
print(f"{len(texts)} splitted text

")

# Define an async helper to process one chunk.
async def process_chunk(idx: int, text: str) -> (int, str):
user_prompt = (
f"Please rewrite the following text with proper capitalization, punctuation, and line breaks "
f"without adding or removing any words or content:\n\n{text}"
)
print(f"Chunk {idx} processing...

")

#if idx == 1:
# raise Exception("Simulated exception in chunk 2")

response = await client.chat.completions.create(
model=model,
temperature=0,
response_format={"type": "text"},
messages=[
{"role": "system", "content": system_prompt},
{"role": "user", "content": user_prompt}
]
)
result = response.choices[0].message.content

message = f"Chunk {idx} processed

"
print(message)

return idx, result

# Launch all chunk processing tasks concurrently.
tasks = [asyncio.create_task(process_chunk(idx, text))
for idx, text in enumerate(texts)]
try:
results = await asyncio.gather(*tasks)
except Exception as e:
print(f"Exception during chunk processing: {e}")
for task in tasks:
task.cancel()
return None

print(f"{len(results)} results

")

if len(results) != len(texts):
print("Chunk processing failed

")
return None

# Sort results by index to preserve sequential order.
results.sort(key=lambda x: x[0])
response_content = "\n\n".join(res for idx, res in results)
response_content = response_content.strip()
< /code>
Тем не менее, модель Gemini-1.5-flash < /code> всегда дает мне ошибку < /p>

Исключение во время обработки куски : Код ошибки: 429 - [{'error':
{'код': 429, 'Message': 'Ресурс был истощен (например. 'Resource_exhausted'}}] < /p>
< /blockquote>
Я проверяю свою квоту. Это все еще хорошо для меня выглядит. Кажется, что мне разрешено выполнять 2000 запросов одновременно. Спасибо.

Подробнее здесь: https://stackoverflow.com/questions/794 ... error-code

1740004700

Anonymous

 Я пытаюсь использовать Gemini-1.5-flash , для обработки 4 текста, используя Async Way. 
def generate_readable_transcript(transcript: str, model: str, converter: OpenCC) -> str:
readable_transcript = asyncio.run(_generate_readable_transcript(
transcript = transcript,
model = model,
converter = converter
))

return readable_transcript

async def _generate_readable_transcript(transcript: str, model: str, converter: OpenCC) -> str:
try:
valid_models = ['gpt-4o-mini', 'gemini-1.5-flash']

if model not in valid_models:
raise RuntimeError(f"Unsupported model: {model}.")

system_prompt = (
"You are an assistant that improves the readability of text by adding proper capitalization, "
"punctuation, and line breaks without adding or removing any words or content."
)

if model == "gemini-1.5-flash":
client = AsyncOpenAI(
base_url="https://generativelanguage.googleapis.com/v1beta/",
api_key=GEMINI_KEY
)

# https://firebase.google.com/docs/vertex-ai/gemini-models
limit = 8192 * 0.9
gemeni_client = genai.Client(api_key=GEMINI_KEY)
encoding = None
else:
client = AsyncOpenAI(api_key=OPEN_AI_KEY)

# https://platform.openai.com/docs/models
limit = 16384 * 0.9
gemeni_client = None
encoding = tiktoken.encoding_for_model(model)

start_time = time.time()
texts = split_text_by_token_limit(
text=transcript,
limit=limit,
gemeni_client=gemeni_client,
encoding=encoding
)
end_time = time.time()
time_ms = (end_time - start_time) * 1000  # Convert to milliseconds
print(f"Time taken for split_text_by_token_limit: {time_ms:.2f} ms")
print(f"{len(texts)} splitted text 🍰")

# Define an async helper to process one chunk.
async def process_chunk(idx: int, text: str) -> (int, str):
user_prompt = (
f"Please rewrite the following text with proper capitalization, punctuation, and line breaks "
f"without adding or removing any words or content:\n\n{text}"
)
print(f"Chunk {idx} processing... 🍰")

#if idx == 1:
#    raise Exception("Simulated exception in chunk 2")

response = await client.chat.completions.create(
model=model,
temperature=0,
response_format={"type": "text"},
messages=[
{"role": "system", "content": system_prompt},
{"role": "user", "content": user_prompt}
]
)
result = response.choices[0].message.content

message = f"Chunk {idx} processed 🍰"
print(message)

return idx, result

# Launch all chunk processing tasks concurrently.
tasks = [asyncio.create_task(process_chunk(idx, text))
for idx, text in enumerate(texts)]
try:
results = await asyncio.gather(*tasks)
except Exception as e:
print(f"Exception during chunk processing: {e}")
for task in tasks:
task.cancel()
return None

print(f"{len(results)} results 🍰")

if len(results) != len(texts):
print("Chunk processing failed 🤡")
return None

# Sort results by index to preserve sequential order.
results.sort(key=lambda x: x[0])
response_content = "\n\n".join(res for idx, res in results)
response_content = response_content.strip()
< /code>
Тем не менее, модель Gemini-1.5-flash < /code> всегда дает мне ошибку < /p>

Исключение во время обработки куски : Код ошибки: 429 - [{'error':
{'код': 429, 'Message': 'Ресурс был истощен (например. 'Resource_exhausted'}}] < /p>
< /blockquote>
Я проверяю свою квоту. Это все еще хорошо для меня выглядит.  Кажется, что мне разрешено выполнять 2000 запросов одновременно. Спасибо. 
  

Подробнее здесь: [url]https://stackoverflow.com/questions/79452945/when-using-asyncio-to-make-4-requests-to-gemini-1-5-flash-it-gives-error-code[/url]

Ответить Пред. тема След. тема

1 сообщение • Страница 1 из 1

Быстрый ответ

Заголовок:

Имя пользователя:

Изменение регистра текста:

Смайлики

Ещё смайлики…

К этому ответу прикреплено по крайней мере одно вложение.

Если вы не хотите добавлять вложения, оставьте поля пустыми. Можно прикреплять файлы, перетаскивая их в окно сообщения.

Максимально разрешённый размер вложения: 15 МБ.

Имя файла:

Комментарий к файлу:

Имя файла	Комментарий к файлу	Размер	Статус

Похожие темы

Ответы

Просмотры

Последнее сообщение

При использовании Asyncio для выполнения 4 запросов Gemini-1.5-Flash дает код ошибки: 429-Ресурс был истощен, resource_e

Последнее сообщение Anonymous « 20 фев 2025, 06:10
Добавлено в форуме Python

Anonymous » 20 фев 2025, 06:10 » в форуме Python

Я пытаюсь использовать Gemini-1.5-flash , для обработки 4 текста, используя Async Way.
def generate_readable_transcript(transcript: str, model: str, converter: OpenCC) -> str:
readable_transcript = asyncio.run(_generate_readable_transcript(...

0 Ответы

13 Просмотры

Последнее сообщение Anonymous
20 фев 2025, 06:10
429 Ресурс был истощен (например, проверка квоты): как обработать 429 ошибок, несмотря на то, что придерживаюсь уровня A

Последнее сообщение Anonymous « 17 май 2025, 17:32
Добавлено в форуме Python

Anonymous » 17 май 2025, 17:32 » в форуме Python

Я работаю с API (Gemini 1.5 Pro), который имеет предел 1000 вызовов в минуту на ключ API (по крайней мере, это говорит об этом). Мне нужно обработать 14 000 записей из файла Excel как можно быстрее. В пределах предела скорости.
Однако, даже с одним...

0 Ответы

15 Просмотры

Последнее сообщение Anonymous
17 май 2025, 17:32
Ресурс 429 исчерпан (например, квота проверки): как обрабатывать ошибки 429, несмотря на соблюдение ограничений скорости

Последнее сообщение Anonymous « 08 дек 2024, 01:39
Добавлено в форуме Python

Anonymous » 08 дек 2024, 01:39 » в форуме Python

Я работаю с API (Gemini 1.5 Pro), который имеет ограничение скорости в 1000 вызовов в минуту на один ключ API (по крайней мере, там так указано). Мне нужно как можно быстрее обработать 14 000 записей из файла Excel.
Чтобы справиться с ограничениями...

0 Ответы

22 Просмотры

Последнее сообщение Anonymous
08 дек 2024, 01:39
Ресурс 429 исчерпан (например, квота проверки): как обрабатывать ошибки 429, несмотря на соблюдение ограничений скорости

Последнее сообщение Anonymous « 08 дек 2024, 10:42
Добавлено в форуме Python

Anonymous » 08 дек 2024, 10:42 » в форуме Python

Я работаю с API (Gemini 1.5 Pro), который имеет ограничение скорости в 1000 вызовов в минуту на один ключ API (по крайней мере, там так указано). Мне нужно как можно быстрее обработать 14 000 записей из файла Excel.
Чтобы справиться с ограничениями...

0 Ответы

33 Просмотры

Последнее сообщение Anonymous
08 дек 2024, 10:42
Обработка 429 Слишком много ошибок запросов с Google Gemini API в приложении на стороне клиента next.js

Последнее сообщение Anonymous « 21 июн 2025, 17:18
Добавлено в форуме Javascript

Anonymous » 21 июн 2025, 17:18 » в форуме Javascript

Я сталкиваюсь с ошибкой 429 слишком много запросов при использовании пакета @Google/Genai для генерации вопросов интервью в приложении Next.js на стороне клиента. Ошибка сохраняется, несмотря на реализацию механизма повторной попытки, и,...

0 Ответы

25 Просмотры

Последнее сообщение Anonymous
21 июн 2025, 17:18

Вернуться в «Python»