Моя цель — поддерживать контекст разговора и состояние агента на протяжении нескольких ходов, чтобы агент мог запомнить предпочтения пользователя и предыдущие решения. Однако я не уверен, как эффективно хранить этот контекст и управлять им, не отправляя всю историю каждый раз в API (что становится дорогостоящим и медленным).
Что я пробовал
- Добавление истории разговоров к каждому запросу (работает, но становится слишком большим)
- Использование простого списка «важных сообщений» и обрезка старых
- Сохранение состояния в локальной базе данных и повторная отправка только выбранных частей
Когда я обрезаю историю слишком агрессивно, агент теряет контекст (например, предыдущие настройки пользователя). Когда я отправляю полную историю, задержка и стоимость API становятся проблематичными.
Что я ищу
- Лучшие практики управления состоянием и контекстом при разработке агентов ИИ
- Способы суммирования или сжатия контекста без потери важной информации
- Примеры архитектурных шаблонов (например, модули памяти, внедрения, векторные хранилища), которые хорошо работают с OpenAI API
Я ожидаю, что агент:
- Поддерживает контекст при длительных взаимодействиях
- Избегает избыточности или нерелевантная история в запросах API
- Будьте эффективны как с точки зрения производительности, так и с точки зрения затрат
Подробнее здесь: https://stackoverflow.com/questions/798 ... openai-api
Мобильная версия