В настоящее время я использую модель Gemini 1.5 Pro на уровне бесплатного пользования, которая предположительно имеет ограничение скорости в 2 запроса в минуту (RPM). Однако мне удалось отправить около 10 сообщений менее чем за минуту, и все они прошли без каких-либо ошибок или ограничений.
Я несколько раз проверял документацию и обнаружил, что четко указано, что ограничение должно составлять 2 об/мин на бесплатном плане. Может ли существовать льготный период, мягкое ограничение или какой-либо другой механизм, позволяющий обрабатывать всплески запросов? Возможно, лимит измеряется по-другому (например, используются токены, а не запросы API)?
Любая информация о том, как применяются ограничения скорости Gemini (или почему они не соблюдаются в моем случае) был бы очень признателен. Спасибо!
import google.generativeai as genai
genai.configure(api_key="KEY")
model = genai.GenerativeModel("gemini-1.5-pro")
response = model.generate_content("Explain how LLM works")
print(response.text)
Подробнее здесь: https://stackoverflow.com/questions/793 ... -without-e
Почему я без ошибок превышаю ограничение скорости уровня бесплатного пользования (2 об/мин) для Gemini 1.5 Pro? ⇐ Python
-
- Похожие темы
- Ответы
- Просмотры
- Последнее сообщение
-
-
Проблема с интеграцией ChatGPT с учетной записью уровня бесплатного пользования
Anonymous » » в форуме JAVA - 0 Ответы
- 43 Просмотры
-
Последнее сообщение Anonymous
-
-
-
Gemini возвращает ошибку: 400 Многоходовой чат не включен для моделей/gemini-pro-vision
Anonymous » » в форуме Python - 0 Ответы
- 142 Просмотры
-
Последнее сообщение Anonymous
-