Вызов функции LLM завершается сбоем из-за неправильного определения намерения при вводе произвольного текста пользовател

Вызов функции LLM завершается сбоем из-за неправильного определения намерения при вводе произвольного текста пользовател ⇐ Python

1 сообщение • Страница 1 из 1

Anonymous

Вызов функции LLM завершается сбоем из-за неправильного определения намерения при вводе произвольного текста пользовател

Цитата

Сообщение Anonymous » 26 мар 2026, 21:39

Я создаю помощника по операциям на базе искусственного интеллекта, используя LLM (Groq / LLaMA 3) с вызовом функций. Система предназначена для ввода произвольного текста пользователя, обнаружения намерений, извлечения аргументов, а затем вызова соответствующей внутренней функции (например, Approv_Completion, update_priority и т. д.).
Однако я столкнулся с серьезной проблемой с надежностью обнаружения намерений.

Проблема
LLM часто неправильно классифицирует намерения пользователя, особенно если вводимые данные короткие, двусмысленные или диалоговые. Это приводит к:

Выбирается неправильная функция
Необходимые аргументы собираются неправильно
Вызов функции завершается неудачно из-за отсутствия или неправильных параметров

Пример
Ввод пользователя:

Код: Выделить всё

approve

Ожидаемое поведение:

Система должна распознать это как неоднозначное действие
Запросить разъяснения (например, выполнить действие вместо запроса ИЛИ запросить Issue_id)

Фактическое Поведение:

LLM иногда направляет его в функцию запроса.
Или вызывает Approved_Completion без обязательных аргументов.
Или выдает противоречивые результаты при разных запусках.

Другой случай
Ввод пользователя:

Код: Выделить всё

make it high priority

Ожидается:

Код: Выделить всё

update_priority(issue_id=?, priority="HIGH")

Фактическое:

Намерение иногда определяется как query_function
Или не удается извлечь приоритет
Или происходит сбой из-за отсутствия Issue_id, даже если он был указан ранее в разговоре

Текущий подход

Использование маршрутизации на основе подсказок LLM с вызовом инструментов
Передача истории разговоров для контекста
Использование модели для:

Обнаружения намерение
Извлечение аргументов
Обработка последующих действий, таких как «это», «эта проблема»

Почему это проблема
В производстве это ведет к:

Ненадежной автоматизации
Нарушенным рабочим процессам
Плохому пользовательскому опыту

Что я ищу
Что лучше всего сделать эта система надежна в производстве?
В частности:

Следует ли мне избегать полной зависимости от LLM для обнаружения намерений?
Рекомендуется ли гибридный подход (на основе правил + LLM)?
Как Вы обрабатываете:
- Неоднозначные входные данные, такие как «одобрить», «переназначить»
- Последующие действия, такие как «это», «тот»
Следует ли мне реализовать конечный автомат (например, Redis) для сбора аргументов вместо использования памяти LLM?

Цель
Я хочу построить систему, в которой:

Обнаружение намерений является детерминированным
Сбор аргументов надежный
Вызовы функций никогда не завершаются сбоем из-за отсутствия параметров

Tech Stack

Python (FastAPI)
Groq (LLaMA 3)
Вызов функций через схемы инструментов
Redis (для памяти сеанса)

1774550358

Anonymous

Я создаю помощника по операциям на базе искусственного интеллекта, используя LLM (Groq / LLaMA 3) с вызовом функций. Система предназначена для ввода произвольного текста пользователя, обнаружения намерений, извлечения аргументов, а затем вызова соответствующей внутренней функции (например, Approv_Completion, update_priority и т. д.).
Однако я столкнулся с серьезной проблемой с [b]надежностью обнаружения намерений[/b].

[b]Проблема[/b]
LLM часто [b]неправильно классифицирует намерения пользователя[/b], особенно если вводимые данные короткие, двусмысленные или диалоговые. Это приводит к:
[list]
[*]Выбирается неправильная функция

[*]Необходимые аргументы собираются неправильно

[*]Вызов функции завершается неудачно из-за отсутствия или неправильных параметров

[/list]

[b]Пример[/b]
[b]Ввод пользователя:[/b]
[code]approve
[/code]
[b]Ожидаемое поведение:[/b]
[list]
[*]Система должна распознать это как неоднозначное действие

[*]Запросить разъяснения (например, выполнить действие вместо запроса ИЛИ запросить Issue_id)

[/list]
[b]Фактическое Поведение:[/b]
[list]
[*]LLM иногда направляет его в функцию запроса.

[*]Или вызывает Approved_Completion без обязательных аргументов.

[*]Или выдает противоречивые результаты при разных запусках.

[/list]

[b]Другой случай[/b]
[b]Ввод пользователя:[/b]
[code]make it high priority
[/code]
[b]Ожидается:[/b]
[code]update_priority(issue_id=?, priority="HIGH")
[/code]
[b]Фактическое:[/b]
[list]
[*]Намерение иногда определяется как query_function

[*]Или не удается извлечь приоритет

[*]Или происходит сбой из-за отсутствия Issue_id, даже если он был указан ранее в разговоре

[/list]

[b]Текущий подход[/b]
[list]
[*]Использование маршрутизации на основе подсказок LLM с вызовом инструментов

[*]Передача истории разговоров для контекста

[*]Использование модели для:

Обнаружения намерение

[*]Извлечение аргументов

[*]Обработка последующих действий, таких как «это», «эта проблема»

[/list]



[b]Почему это проблема[/b]
В производстве это ведет к:
[list]
[*]Ненадежной автоматизации

[*]Нарушенным рабочим процессам

[*]Плохому пользовательскому опыту

[/list]

[b]Что я ищу[/b]
Что лучше всего сделать эта система [b]надежна в производстве[/b]?
В частности:
[list]
[*]Следует ли мне [b]избегать полной зависимости от LLM для обнаружения намерений[/b]?

[*]Рекомендуется ли [b]гибридный подход (на основе правил + LLM)[/b]?

[*]Как Вы обрабатываете:
[list]
Неоднозначные входные данные, такие как «одобрить», «переназначить»

[*]Последующие действия, такие как «это», «тот»

[/list]

[*]Следует ли мне реализовать [b]конечный автомат (например, Redis)[/b] для сбора аргументов вместо использования памяти LLM?

[/list]

[b]Цель[/b]
Я хочу построить систему, в которой:
[list]
[*]Обнаружение намерений является детерминированным

[*]Сбор аргументов надежный

[*]Вызовы функций никогда не завершаются сбоем из-за отсутствия параметров

[/list]

[b]Tech Stack[/b]
[list]
[*]Python (FastAPI)

[*]Groq (LLaMA 3)

[*]Вызов функций через схемы инструментов

[*]Redis (для памяти сеанса)

[/list]