У меня есть тысячи файлов PPTX, и я хочу создать чат-бота, который запрашивает данные файла PPTX. Поскольку эти файлы PPTX большие, я решил использовать следующий подход:
Прочитайте все файлы PPTX и сгенерируйте сводку каждого файла PPTX.
Сохраните сводку каждого файла PPTX в базу данных векторов вместе с метаданными исходного документа.
Запросите базу данных векторов на основе запроса пользователя.
Передайте запрос и возвращенные документы в LLM, чтобы получить окончательный результат.
Верните окончательный результат и исходный документ(ы) пользователю.
Я использую UnstructuredPowerPointLoader для загрузки файлов PPTX и создания сводки каждого файла с помощью load_summarize_chain. Цепочка возвращает мне строку.
Как я могу сохранить выходные данные load_summarize_chain в векторной базе данных (chromadb) вместе с метаданными.
Также дайте мне знать если этот подход верен. Любой пример кода будет очень полезен.
Подробнее здесь: https://stackoverflow.com/questions/782 ... -vector-db
Сохранение сводки документа в векторной базе данных ⇐ Python
-
- Похожие темы
- Ответы
- Просмотры
- Последнее сообщение
-
-
Неожиданное поведение при получении сводки чата с помощью Mesibo SDK в Котлине
Anonymous » » в форуме Android - 0 Ответы
- 12 Просмотры
-
Последнее сообщение Anonymous
-