Я создаю веб-приложение на .Net и PostgreSql.
Одним из требований является загрузка большого количества документов, например 200, которые могут быть в нескольких форматах, таких как pdf, doc, rtf, odt.
В настоящее время я храню их в Elasticsearch.
Поэтому, когда документ загружается Я использую Toxy nuget пакет для извлечения всего текста документа и его индексации в Elasticsearch.
Файлы могут иметь размер не более 50 МБ, а количество документов может составлять около 100-200 страниц.
В настоящее время это работает хорошо, но мне нужно в результате вернуть также место/страницу, на которой было найдено совпадение с поиском.
Любые предложения или идеи, что бы это могло быть хороший подход сделать это?
И какова наилучшая практика: полнотекстовое индексирование или частичное/постраничное индексирование документов в ElasticSearch.
Подробнее здесь: https://stackoverflow.com/questions/792 ... t-indexing
Полный документ Elasticsearch или постраничное индексирование текста ⇐ C#
-
- Похожие темы
- Ответы
- Просмотры
- Последнее сообщение
-
-
Spring Data Elasticsearch Массовое индексирование/удаление – миллионы записей
Anonymous » » в форуме JAVA - 0 Ответы
- 16 Просмотры
-
Последнее сообщение Anonymous
-
-
-
Индексирование в Elasticsearch локально с помощью biosentvec TimeoutError
Anonymous » » в форуме Python - 0 Ответы
- 19 Просмотры
-
Последнее сообщение Anonymous
-
-
-
Вложенные агрегаты Elasticsearch с данными Spring elasticsearch 5.2
Anonymous » » в форуме Elasticsearch aggregation - 0 Ответы
- 1223 Просмотры
-
Последнее сообщение Anonymous
-