Почему мой локальный конвейер OCR + RAG приводит к низкой производительности поиска?Python

Программы на Python
Ответить
Anonymous
 Почему мой локальный конвейер OCR + RAG приводит к низкой производительности поиска?

Сообщение Anonymous »

Я создаю локальную систему обработки документов, используя:
- OCR для отсканированных PDF-файлов
- Внедрения для индексирования
- RAG для поиска и ответов на вопросы
Однако я наблюдаю проблемы с качеством извлечения и задержкой при объединении результатов OCR с встраиваниями.
Для пример:
- Текст OCR зашумлен и влияет на качество внедрения.
- Результаты поиска непоследовательны по схожим запросам.
- Производительность снижается при работе с большими наборами документов.
Каковы общие причины этих проблем в таком конвейере и как их можно устранить?
Ответить

Быстрый ответ

Изменение регистра текста: 
Смайлики
:) :( :oops: :roll: :wink: :muza: :clever: :sorry: :angel: :read: *x)
Ещё смайлики…
   
К этому ответу прикреплено по крайней мере одно вложение.

Если вы не хотите добавлять вложения, оставьте поля пустыми.

Максимально разрешённый размер вложения: 15 МБ.

Вернуться в «Python»