Гранит 3.3: 8b с Ollama - LLM никогда не вызывает предоставленные инструменты во время взаимодействия в чате

Гранит 3.3: 8b с Ollama - LLM никогда не вызывает предоставленные инструменты во время взаимодействия в чате ⇐ Python

1 сообщение • Страница 1 из 1

Anonymous

Гранит 3.3: 8b с Ollama - LLM никогда не вызывает предоставленные инструменты во время взаимодействия в чате

Цитата

Сообщение Anonymous » 23 июл 2025, 11:35

Я использую Granite 3.3: 8b через Ollama (последнюю версию) и реализовал функцию, чтобы вызвать мою LLM с некоторыми аргументами, такими как Format_Schema и инструменты .
ollama версия 0.9.6
def run_prompt(messages, model: str, format_schema = None, tools: dict[str, Callable] = None) -> str:
conversation = messages.copy()

while True:
try:
# Send the request to the Ollama server
response: ChatResponse = client.chat(
model=model,
messages=conversation,
format=format_schema.model_json_schema() if format_schema else None,
tools=list(tools.values()) if tools else None,
stream=False,
)

message = response.message

# Check if the message contains tool calls
if message.tool_calls:
for tool_call in message.tool_calls:
logger.info(f"Tool call detected: {tool_call.function.name}")
if function_to_call := tools.get(tool_call.function.name):
logger.info(f"Calling tool: {tool_call.function.name}")
output = function_to_call(**tool_call.function.arguments)
conversation.append({
'role': 'tool',
'name': tool_call.function.name,
'content': output
})
else:
logger.warning(f"Tool not found: {tool_call.function.name}")

# Continue loop to get next message after tool call result
continue

# Final response received
return message.get('content')

except requests.RequestException as e:
logger.error(f"Error running prompt: {e}")
raise
< /code>
Я передаю функцию таким образом: < /p>

Код: Выделить всё

available_tools = {
'rag_search': rag_search,
}
< /code>
где rag_search < /code> является вызовом.
Это то, на что выглядит функция: < /p>
def rag_search(query: str, top_k: int = 5) -> list:
"""
Perform a semantic search over indexed documentation or CSV descriptions.

This tool retrieves the most relevant textual documents or file descriptions
based on a natural language query. It is used to ground reasoning steps in
up-to-date or domain-specific context.

Args:
query (str): Natural language question or goal.
top_k (int, optional): Maximum number of relevant documents to return.

Returns:
list: A list of documents, each with its source, content, and metadata.
"""
results = retriever.semantic_search(query, top_k)
return [
{
"source": r.metadata.get("source", "Unknown"),
"content": r.page_content,
"metadata": r.metadata,
} for r in results
]

Я вызываю run_prompt

Код: Выделить всё

        # Compose LLM prompt
user_input = {
"input_json": json.loads(query),
}

messages = [
{"role": "system", "content": SYSTEM_PROMPT},
{"role": "user", "content": json.dumps(user_input, indent=2, ensure_ascii=False)}
]

response = ""

for _ in range(MAX_RETRIES):
response = run_prompt(
messages=messages,
model=OLLAMA_MODEL,
format_schema=Agent4Output,
tools=available_tools
)

Однако, независимо от того, что я пытаюсь, LLM никогда не запускает какой -либо звонок для инструментов (т.е. message.tool_calls всегда пуст).
Вот пример того, что я отправляю в качестве пользователя ввода:

Код: Выделить всё

You are a data visualization assistant.

You MUST use the tool rag_search before returning ANY JSON.
TOOLS AVAILABLE:
- rag_search(query: str): use this to get info about chart types.

STRICT WORKFLOW:
1. For each possible chart (bar, pie, line, etc.), you MUST call rag_search with a query like "bar chart" or "pie chart".
2.  Wait for the tool result.
3. Then build the JSON "visualisations" using that info.

[...]
< /code>
Вот ответ от LLM с этой подсказкой: < /p>
model='granite3.3:8b' created_at='2025-07-23T08:22:36.686825Z' done=True done_reason='stop' total_duration=24844374458 load_duration=47660708 prompt_eval_count=808 prompt_eval_duration=8809000292 eval_count=164 eval_duration=15971681708 message=Message(role='assistant', content='{[...]}', thinking=None, images=None, tool_calls=None)

кто -нибудь столкнулся с этой проблемой раньше или знает, что может отсутствовать в моей настройке или подсказке, чтобы сделать модель фактически использовать инструменты?
Спасибо за вашу помощь!

Подробнее здесь: https://stackoverflow.com/questions/797 ... hat-intera

1753259735

Anonymous

 Я использую Granite 3.3: 8b через Ollama (последнюю версию) и реализовал функцию, чтобы вызвать мою LLM с некоторыми аргументами, такими как Format_Schema  и инструменты . 
ollama версия 0.9.6 
def run_prompt(messages, model: str, format_schema = None, tools: dict[str, Callable] = None) -> str:
conversation = messages.copy()

while True:
try:
# Send the request to the Ollama server
response: ChatResponse = client.chat(
model=model,
messages=conversation,
format=format_schema.model_json_schema() if format_schema else None,
tools=list(tools.values()) if tools else None,
stream=False,
)

message = response.message

# Check if the message contains tool calls
if message.tool_calls:
for tool_call in message.tool_calls:
logger.info(f"Tool call detected: {tool_call.function.name}")
if function_to_call := tools.get(tool_call.function.name):
logger.info(f"Calling tool: {tool_call.function.name}")
output = function_to_call(**tool_call.function.arguments)
conversation.append({
'role': 'tool',
'name': tool_call.function.name,
'content': output
})
else:
logger.warning(f"Tool not found: {tool_call.function.name}")

# Continue loop to get next message after tool call result
continue

# Final response received
return message.get('content')

except requests.RequestException as e:
logger.error(f"Error running prompt: {e}")
raise
< /code>
Я передаю функцию таким образом: < /p>
[code]available_tools = {
'rag_search': rag_search,
}
< /code>
где rag_search < /code> является вызовом.
Это то, на что выглядит функция: < /p>
def rag_search(query: str, top_k: int = 5) -> list:
"""
Perform a semantic search over indexed documentation or CSV descriptions.

This tool retrieves the most relevant textual documents or file descriptions
based on a natural language query. It is used to ground reasoning steps in
up-to-date or domain-specific context.

Args:
query (str): Natural language question or goal.
top_k (int, optional): Maximum number of relevant documents to return.

Returns:
list: A list of documents, each with its source, content, and metadata.
"""
results = retriever.semantic_search(query, top_k)
return [
{
"source": r.metadata.get("source", "Unknown"),
"content": r.page_content,
"metadata": r.metadata,
} for r in results
]
[/code]
Я вызываю run_prompt [code]        # Compose LLM prompt
user_input = {
"input_json": json.loads(query),
}

messages = [
{"role": "system", "content": SYSTEM_PROMPT},
{"role": "user", "content": json.dumps(user_input, indent=2, ensure_ascii=False)}
]

response = ""

for _ in range(MAX_RETRIES):
response = run_prompt(
messages=messages,
model=OLLAMA_MODEL,
format_schema=Agent4Output,
tools=available_tools
)
[/code]
Однако, независимо от того, что я пытаюсь, LLM никогда не запускает какой -либо звонок для инструментов (т.е. message.tool_calls  всегда пуст).
Вот пример того, что я отправляю в качестве пользователя ввода: 
[code]You are a data visualization assistant.

You MUST use the tool rag_search before returning ANY JSON.
TOOLS AVAILABLE:
- rag_search(query: str): use this to get info about chart types.

STRICT WORKFLOW:
1. For each possible chart (bar, pie, line, etc.), you MUST call rag_search with a query like "bar chart" or "pie chart".
2.  Wait for the tool result.
3. Then build the JSON "visualisations" using that info.

[...]
< /code>
Вот ответ от LLM с этой подсказкой: < /p>
model='granite3.3:8b' created_at='2025-07-23T08:22:36.686825Z' done=True done_reason='stop' total_duration=24844374458 load_duration=47660708 prompt_eval_count=808 prompt_eval_duration=8809000292 eval_count=164 eval_duration=15971681708 message=Message(role='assistant', content='{[...]}', thinking=None, images=None, tool_calls=None)
[/code]
кто -нибудь столкнулся с этой проблемой раньше или знает, что может отсутствовать в моей настройке или подсказке, чтобы сделать модель фактически использовать инструменты? 
Спасибо за вашу помощь!  

Подробнее здесь: [url]https://stackoverflow.com/questions/79711548/granite-3-38b-with-ollama-llm-never-invokes-provided-tools-during-chat-intera[/url]

Ответить Пред. тема След. тема

1 сообщение • Страница 1 из 1

Быстрый ответ

Заголовок:

Имя пользователя:

Изменение регистра текста:

Смайлики

Ещё смайлики…

К этому ответу прикреплено по крайней мере одно вложение.

Если вы не хотите добавлять вложения, оставьте поля пустыми. Можно прикреплять файлы, перетаскивая их в окно сообщения.

Максимально разрешённый размер вложения: 15 МБ.

Имя файла:

Комментарий к файлу:

Имя файла	Комментарий к файлу	Размер	Статус

Похожие темы

Ответы

Просмотры

Последнее сообщение

Использование Haystack и Ollama. ModuleNotFoundError: нет модуля с именем «ollama».

Последнее сообщение Anonymous « 01 окт 2024, 17:35
Добавлено в форуме Python

Anonymous » 01 окт 2024, 17:35 » в форуме Python

Здесь я использую пример с веб-сайта haystack
Я использовал поэзию, чтобы добавить ollama-haystack
Я запускаю следующее код с использованием Python 3.12.3 в WSL2 Ubuntu 24.04
from haystack_integrations.components.embedders.ollama import...

0 Ответы

33 Просмотры

Последнее сообщение Anonymous
01 окт 2024, 17:35
Использование Haystack и Ollama. ModuleNotFoundError: нет модуля с именем «ollama».

Последнее сообщение Anonymous « 01 окт 2024, 18:35
Добавлено в форуме Python

Anonymous » 01 окт 2024, 18:35 » в форуме Python

Здесь я использую пример с веб-сайта haystack
Я использовал поэзию, чтобы добавить ollama-haystack
Я запускаю следующее код с использованием Python 3.12.3 в WSL2 Ubuntu 24.04
from haystack_integrations.components.embedders.ollama import...

0 Ответы

55 Просмотры

Последнее сообщение Anonymous
01 окт 2024, 18:35
Размещение Ollama на ноутбуке Kaggle с помощью Ngrok: OpenWebUI не подключается к клиенту Ollama

Последнее сообщение Anonymous « 30 ноя 2024, 13:15
Добавлено в форуме Python

Anonymous » 30 ноя 2024, 13:15 » в форуме Python

Я размещаю Ollama на ноутбуке Kaggle и использую Ngrok для создания туннеля, позволяющего мне подключаться к клиенту Ollama на моем локальном компьютере через командную строку. Туннель Ngrok работает как положено, и я могу через него...

0 Ответы

30 Просмотры

Последнее сообщение Anonymous
30 ноя 2024, 13:15
Проблема с ошибкой Langchain (LLM HuggingFaceEmbedding OLLAMA)

Последнее сообщение Anonymous « 28 окт 2024, 12:30
Добавлено в форуме Python

Anonymous » 28 окт 2024, 12:30 » в форуме Python

Я новичок в мире искусственного интеллекта и машинного обучения. Просто пытаюсь запачкать руки простой программой ответов на вопросы.
У меня есть программа, показанная ниже, которая принимает PDF-файл в качестве входных данных и должна отвечать на...

0 Ответы

24 Просмотры

Последнее сообщение Anonymous
28 окт 2024, 12:30
Проблема с ошибкой Langchain (LLM HuggingFaceEmbedding OLLAMA)

Последнее сообщение Anonymous « 31 окт 2024, 14:05
Добавлено в форуме Python

Anonymous » 31 окт 2024, 14:05 » в форуме Python

Я новичок в мире искусственного интеллекта и машинного обучения. Просто пытаюсь запачкать руки простой программой ответов на вопросы.
У меня есть программа, показанная ниже, которая принимает PDF-файл в качестве входных данных и должна отвечать на...

0 Ответы

28 Просмотры

Последнее сообщение Anonymous
31 окт 2024, 14:05

Вернуться в «Python»