Как я могу правильно извлечь текст из файла PDF, чтобы сохранить его в индексе упругого поиска? - Цифровое Кемерово

Как я могу правильно извлечь текст из файла PDF, чтобы сохранить его в индексе упругого поиска? ⇐ C#

Ответить

1 сообщение • Страница 1 из 1

Anonymous

Как я могу правильно извлечь текст из файла PDF, чтобы сохранить его в индексе упругого поиска?

Цитата

Сообщение Anonymous » 29 июн 2025, 18:38

Я работаю над проектом C#/Blazor, который извлекает текст из PDF-файлов и хранит его в индексе Elasticsearch для полнотекстового поиска. Например, точки пуль и заголовки извлекаются по линии по линии без какой-либо четкой структуры. < /P>
Есть ли способ сохранить логическую компоновку при извлечении текста из этих pdfs? индивидуально. Это делает текст трудным для поиска и чтения после индексированного.

Код: Выделить всё

try
{
using var reader = new PdfReader(file.Path);
using var pdf = new PdfDocument(reader);

for (var i = 1; i  

Подробнее здесь: [url]https://stackoverflow.com/questions/79678583/how-can-i-properly-extract-text-from-a-pdf-file-to-store-it-in-a-elastic-search[/url]

1751211506

Anonymous

 Я работаю над проектом C#/Blazor, который извлекает текст из PDF-файлов и хранит его в индексе Elasticsearch для полнотекстового поиска. Например, точки пуль и заголовки извлекаются по линии по линии без какой-либо четкой структуры. < /P>
Есть ли способ сохранить логическую компоновку при извлечении текста из этих pdfs? индивидуально. Это делает текст трудным для поиска и чтения после индексированного.[code]try
{
using var reader = new PdfReader(file.Path);
using var pdf = new PdfDocument(reader);

for (var i = 1; i  

Подробнее здесь: [url]https://stackoverflow.com/questions/79678583/how-can-i-properly-extract-text-from-a-pdf-file-to-store-it-in-a-elastic-search[/url]

Ответить

1 сообщение • Страница 1 из 1

Быстрый ответ

Заголовок:

Имя пользователя:

Изменение регистра текста:

Смайлики

Ещё смайлики…

К этому ответу прикреплено по крайней мере одно вложение.

Если вы не хотите добавлять вложения, оставьте поля пустыми. Можно прикреплять файлы, перетаскивая их в окно сообщения.

Максимально разрешённый размер вложения: 15 МБ.

Имя файла:

Комментарий к файлу:

Имя файла	Комментарий к файлу	Размер	Статус

Вернуться в «C#»