Когда я извлекаю текст с помощью iText7, символы гуджарати заменяются нечитаемой формой.
Я использовал программу C# с приведенным ниже кодом:
Код: Выделить всё
using (var pdfReader = new PdfReader(file.OpenReadStream()))
using (var pdfDoc = new iText.Kernel.Pdf.PdfDocument(pdfReader){
var sb = new StringBuilder();
for (int page = 1; page
Подробнее здесь: [url]https://stackoverflow.com/questions/79795733/how-to-correctly-extract-gujarati-text-and-math-symbols-from-pdf-using-itext7-in[/url]
Мобильная версия