Почему мой локальный конвейер OCR + RAG приводит к низкой производительности поиска? - Цифровое Кемерово

Почему мой локальный конвейер OCR + RAG приводит к низкой производительности поиска? ⇐ Python

Ответить

1 сообщение • Страница 1 из 1

Anonymous

Почему мой локальный конвейер OCR + RAG приводит к низкой производительности поиска?

Цитата

Сообщение Anonymous » 30 мар 2026, 22:24

Я создаю локальную систему обработки документов, используя:
- OCR для отсканированных PDF-файлов
- Внедрения для индексирования
- RAG для поиска и ответов на вопросы
Однако я наблюдаю проблемы с качеством извлечения и задержкой при объединении результатов OCR с встраиваниями.
Для пример:
- Текст OCR зашумлен и влияет на качество внедрения.
- Результаты поиска непоследовательны по схожим запросам.
- Производительность снижается при работе с большими наборами документов.
Каковы общие причины этих проблем в таком конвейере и как их можно устранить?

1774898659

Anonymous

Я создаю локальную систему обработки документов, используя:
- OCR для отсканированных PDF-файлов
- Внедрения для индексирования
- RAG для поиска и ответов на вопросы
Однако я наблюдаю проблемы с качеством извлечения и задержкой при объединении результатов OCR с встраиваниями.
Для пример:
- Текст OCR зашумлен и влияет на качество внедрения.
- Результаты поиска непоследовательны по схожим запросам.
- Производительность снижается при работе с большими наборами документов.
Каковы общие причины этих проблем в таком конвейере и как их можно устранить?

Ответить

1 сообщение • Страница 1 из 1

Быстрый ответ

Заголовок:

Имя пользователя:

Изменение регистра текста:

Смайлики

Ещё смайлики…

К этому ответу прикреплено по крайней мере одно вложение.

Если вы не хотите добавлять вложения, оставьте поля пустыми. Можно прикреплять файлы, перетаскивая их в окно сообщения.

Максимально разрешённый размер вложения: 15 МБ.

Имя файла:

Комментарий к файлу:

Имя файла	Комментарий к файлу	Размер	Статус

Вернуться в «Python»