Попробовал PdfPig (https://github.com/UglyToad/PdfPig), используя
Код: Выделить всё
using PdfDocument document = PdfDocument.Open(stream, SkiaRenderingParsingOptions.Instance );
string ptxt = "";
foreach(PdfPath p in page.Paths)
ptxt += p.ToString();
Console.WriteLine(ptxt);
UglyToad.PdfPig.Graphics.PdfPath
Как преобразовать такие PDF-файлы в обычный текст? Если прямое преобразование невозможно, как преобразовать PDF-файл в изображение для передачи в OCR?
Файлы PDF также могут содержать текстовые объекты, из которых текст можно извлечь напрямую.
PdfPig предоставляет коллекцию Paths, которую можно использовать для извлечения каждого объекта Path.
Как преобразовать каждый объект Path в изображение? Исходный код PDF Viewer должен содержать это.
Как использовать OpenCv или SkiaSharp для этого преобразования?
Это приложение .NET 9 ASP.NET MVC.
Подробнее здесь: https://stackoverflow.com/questions/798 ... le-to-text
Мобильная версия