Я использую следующий код для запуска запроса (с некоторыми изображениями и текстом) в Google Gemini. В системной инструкции четко указано: 1) использовать инструмент и 2) предоставить результаты мышления и действительно ли он использовал инструмент в своей работе.
Код: Выделить всё
parts = []
for image in images:
with open(image, "rb") as f:
parts.append(types.Part.from_bytes(mime_type="image/jpeg", data=f.read()))
parts.append(types.Part.from_text(text=text_part))
contents = [
types.Content(
role="user",
parts=parts
),
]
tools = [
types.Tool(googleSearch=types.GoogleSearch()),
]
generate_content_config = types.GenerateContentConfig(
thinking_config = types.ThinkingConfig(
thinking_budget=-1,
),
tools=tools,
system_instruction=[
types.Part.from_text(text=system_instruction),
],
)
raw_result = ""
for chunk in self.client.models.generate_content_stream(
model=self.model,
contents=contents,
config=generate_content_config,
):
if chunk.text:
raw_result += chunk.text
Вы можете использовать предоставленный инструмент для улучшения информации. В своих рассуждениях укажите, используете ли вы этот инструмент, какие поисковые запросы вы выполняли и каковы были их результаты.
Верните свои рассуждения и окончательный результат JSON в формате ниже. Все поля должны быть заполнены значением, даже если это значение представляет собой пустую строку "".
Результаты дают мне достоверную информацию, но на самом деле мне нужно заставить его выполнять поиск в реальном времени, как показано в документации, и я не могу понять, как подтвердить, добился ли я успеха через API.
Я понимаю, что Gemini может решать, когда и как использовать Google Search для улучшения результатов, но есть ли способ узнать, было ли это сделано через API?
Подробнее здесь: https://stackoverflow.com/questions/797 ... i-provided
Мобильная версия