Я работаю над проектом C#/Blazor, который извлекает текст из PDF-файлов и хранит его в индексе Elasticsearch для полнотекстового поиска. Например, точки пуль и заголовки извлекаются по линии по линии без какой-либо четкой структуры. < /P>
Есть ли способ сохранить логическую компоновку при извлечении текста из этих pdfs? индивидуально. Это делает текст трудным для поиска и чтения после индексированного.
try
{
using var reader = new PdfReader(file.Path);
using var pdf = new PdfDocument(reader);
for (var i = 1; i
Подробнее здесь: [url]https://stackoverflow.com/questions/79678583/how-can-i-properly-extract-text-from-a-pdf-file-to-store-it-in-a-elastic-search[/url]
Я работаю над проектом C#/Blazor, который извлекает текст из PDF-файлов и хранит его в индексе Elasticsearch для полнотекстового поиска. Например, точки пуль и заголовки извлекаются по линии по линии без какой-либо четкой структуры. < /P> Есть ли способ сохранить логическую компоновку при извлечении текста из этих pdfs? индивидуально. Это делает текст трудным для поиска и чтения после индексированного.[code]try { using var reader = new PdfReader(file.Path); using var pdf = new PdfDocument(reader);
Я работаю над проектом C#/Blazor, который извлекает текст из PDF-файлов и хранит его в индексе Elasticsearch для полнотекстового поиска. Например, точки пуль и заголовки извлекаются по линии по линии без какой-либо четкой структуры.
Есть ли способ...
Я работаю над проектом C#/Blazor, который извлекает текст из PDF-файлов и хранит его в индексе Elasticsearch для полнотекстового поиска. Например, точки пуль и заголовки извлекаются по линии по линии без какой-либо четкой структуры.
Есть ли способ...
Нужно решение для преобразования PDF-файла, где каждая страница представляет собой изображение, а страница может содержать текст, таблицу или их комбинацию, в PDF-файл с возможностью поиска.
Мне Я использовал ABBY FineReader Online, который отлично...
Нужно решение для преобразования PDF-файла, где каждая страница представляет собой изображение, а страница может содержать текст, таблицу или их комбинацию, в PDF-файл с возможностью поиска.
Мне Я использовал ABBY FineReader Online, который...