Как преобразовать пути в PDF-файле в текст

Как преобразовать пути в PDF-файле в текст ⇐ C#

1 сообщение • Страница 1 из 1

Anonymous

Как преобразовать пути в PDF-файле в текст

Цитата

Сообщение Anonymous » 11 ноя 2025, 00:46

Файлы PDF (пример https://github.com/user-attachments/fil ... sproff.pdf) не содержат ни изображений, ни текста. Текст, видимый на странице, отображается как путь.
Попробовал PdfPig (https://github.com/UglyToad/PdfPig), используя

Код: Выделить всё

using PdfDocument document = PdfDocument.Open(stream, SkiaRenderingParsingOptions.Instance );
string ptxt = "";
foreach(PdfPath p in page.Paths)
ptxt += p.ToString();
Console.WriteLine(ptxt);

Вывод:

UglyToad.PdfPig.Graphics.PdfPath

Как преобразовать такие PDF-файлы в обычный текст? Если прямое преобразование невозможно, как преобразовать PDF в изображение для передачи в OCR?
Это приложение .NET 9 ASP.NET MVC.

Подробнее здесь: https://stackoverflow.com/questions/798 ... le-to-text

1762811198

Anonymous

Файлы PDF (пример https://github.com/user-attachments/files/23436471/stainlessproff.pdf) не содержат ни изображений, ни текста. Текст, видимый на странице, отображается как путь.
Попробовал PdfPig (https://github.com/UglyToad/PdfPig), используя
[code]using PdfDocument document = PdfDocument.Open(stream, SkiaRenderingParsingOptions.Instance );
string ptxt = "";
foreach(PdfPath p in page.Paths)
ptxt += p.ToString();
Console.WriteLine(ptxt);
[/code]
Вывод:

UglyToad.PdfPig.Graphics.PdfPath

Как преобразовать такие PDF-файлы в обычный текст? Если прямое преобразование невозможно, как преобразовать PDF в изображение для передачи в OCR?
Это приложение .NET 9 ASP.NET MVC. 

Подробнее здесь: [url]https://stackoverflow.com/questions/79816076/how-to-convert-paths-in-pdf-file-to-text[/url]