Как правильно извлечь текст и математические символы гуджарати из PDF с помощью iText7 на C#? [закрыто]

Как правильно извлечь текст и математические символы гуджарати из PDF с помощью iText7 на C#? [закрыто] ⇐ C#

1 сообщение • Страница 1 из 1

Anonymous

Как правильно извлечь текст и математические символы гуджарати из PDF с помощью iText7 на C#? [закрыто]

Цитата

Сообщение Anonymous » 21 окт 2025, 14:20

У меня есть PDF-файл, содержащий текст на гуджарати, английский язык, математические формулы и химические символы.
Когда я извлекаю текст с помощью iText7, символы гуджарати заменяются нечитаемой формой.
Я использовал программу C# с приведенным ниже кодом:

Код: Выделить всё

using (var pdfReader = new PdfReader(file.OpenReadStream()))
using (var pdfDoc = new iText.Kernel.Pdf.PdfDocument(pdfReader){
var sb = new StringBuilder();
for (int page = 1; page 

Подробнее здесь: [url]https://stackoverflow.com/questions/79795733/how-to-correctly-extract-gujarati-text-and-math-symbols-from-pdf-using-itext7-in[/url]

1761045633

Anonymous

У меня есть PDF-файл, содержащий текст на гуджарати, английский язык, математические формулы и химические символы.
Когда я извлекаю текст с помощью iText7, символы гуджарати заменяются нечитаемой формой.
Я использовал программу C# с приведенным ниже кодом:
[code]using (var pdfReader = new PdfReader(file.OpenReadStream()))
using (var pdfDoc = new iText.Kernel.Pdf.PdfDocument(pdfReader){
var sb = new StringBuilder();
for (int page = 1; page 

Подробнее здесь: [url]https://stackoverflow.com/questions/79795733/how-to-correctly-extract-gujarati-text-and-math-symbols-from-pdf-using-itext7-in[/url]

Ответить

1 сообщение • Страница 1 из 1