Есть ли способ сохранить логическую компоновку при извлечении текста из этих pdfs? индивидуально. Это делает текст трудным для поиска и чтения после индексированного.
Код: Выделить всё
try
{
using var reader = new PdfReader(file.Path);
using var pdf = new PdfDocument(reader);
for (var i = 1; i
Подробнее здесь: [url]https://stackoverflow.com/questions/79678583/how-can-i-properly-extract-text-from-a-pdf-file-to-store-it-in-a-elastic-search[/url]
Мобильная версия