Когда я извлекаю текст с помощью iText7, символы гуджарати заменяются нечитаемым текстом.
Моя программа на C#:
Код: Выделить всё
using (var pdfReader = new PdfReader(file.OpenReadStream()))
using (var pdfDoc = new iText.Kernel.Pdf.PdfDocument(pdfReader){
var sb = new StringBuilder();
for (int page = 1; page
Подробнее здесь: [url]https://stackoverflow.com/questions/79795733/how-do-i-correctly-extract-gujarati-text-and-math-symbols-from-pdf-using-itext7[/url]
Мобильная версия