Множественный источник документов для базы знаний llm

Множественный источник документов для базы знаний llm ⇐ Python

1 сообщение • Страница 1 из 1

Anonymous

Множественный источник документов для базы знаний llm

Цитата

Сообщение Anonymous » 23 мар 2026, 17:54

Хотим иметь бот llm с базой знаний.
2 источника: вся веб-ссылка и несколько PDF-файлов.
Webdocs => Использование langchain Sitemaploader позволяет получить данные в виде документов.
Pdf => Использование langchain pypdf-загрузчика позволяет получить данные в виде документов.
Docs = webdocs + pdfdocs.

Код: Выделить всё

Faiss.fromdocuments(docs,openaiembeddings)
faiss.savelocally()
Qa=Retreivalqachain.fromdocuments(llm=chatopenai,)

Проблема: Не на должном уровне ответы или кажется, что у меня иногда возникают галлюцинации.
Запрос: Если я хочу тренироваться с использованием двух источников: веб-ссылки и PDF-файлов, какова наилучшая процедура?
Я ожидаю подробного руководства и ответа, чтобы лучше узнать механизм.>

1774277660

Anonymous

Хотим иметь бот llm с базой знаний.
2 источника: вся веб-ссылка и несколько PDF-файлов.
Webdocs => Использование langchain Sitemaploader позволяет получить данные в виде документов.
Pdf => Использование langchain pypdf-загрузчика позволяет получить данные в виде документов.
Docs = webdocs + pdfdocs.
[code]Faiss.fromdocuments(docs,openaiembeddings)
faiss.savelocally()
Qa=Retreivalqachain.fromdocuments(llm=chatopenai,)
[/code]
[b]Проблема:[/b] Не на должном уровне ответы или кажется, что у меня иногда возникают галлюцинации.
[b]Запрос:[/b] Если я хочу тренироваться с использованием двух источников: веб-ссылки и PDF-файлов, какова наилучшая процедура?
Я ожидаю подробного руководства и ответа, чтобы лучше узнать механизм.>