Как извлечь подробные строки из текста [закрыто]

Как извлечь подробные строки из текста [закрыто] ⇐ C#

1 сообщение • Страница 1 из 1

Anonymous

Как извлечь подробные строки из текста [закрыто]

Цитата

Сообщение Anonymous » 13 июн 2025, 09:18

Строка содержит текстовые строки из документа PDF, полученного из PDF с использованием PDFPIG.
Document содержит заголовок строки, заголовок страницы, детализацию, нижний колонтитул страницы и сводные части.
Структура документа: < /p>

Код: Выделить всё

Title
Page 1 header
Details
Page 1 footer
...
Page N header
Details
Page N footer
Summary
< /code>
Пример: < /p>
string text = @"Invoice  123
Page 1
Name    Quantity   Sum
Item 1  12.22  3334.44
Item N  44.44   755.55
MyCompany
Myaddress
Page 2
Name    Quantity       Sum
Item N+1  222.22   333.44
Item X    44.44     44.00
Summary: 34433.44
MyCompany
Myaddress";
< /code>
заголовок и нижний колонтитул одинаковы на каждой странице.
Процедура экстракции получает два параметра: < /p>

  Заголовок />  Возвращает строки между ними. < /p>
Поскольку заголовки появляются несколько раз между
как удалить извлечение дубликатов строк, так что остается только последняя дубликата? < /p>
Результат должен быть: < /p>
Item 1  12.22    333
Item N  44.44   755.55
...
Item N+1  222.22    333
Item X    44.44     44.00

Использование ASP .NET MVC CORE и C# 9

Подробнее здесь: https://stackoverflow.com/questions/796 ... -from-text

1749795499

Anonymous

 Строка содержит текстовые строки из документа PDF, полученного из PDF с использованием PDFPIG.
Document содержит заголовок строки, заголовок страницы, детализацию, нижний колонтитул страницы и сводные части.
Структура документа: < /p>
[code]Title
Page 1 header
Details
Page 1 footer
...
Page N header
Details
Page N footer
Summary
< /code>
Пример: < /p>
string text = @"Invoice  123
Page 1
Name    Quantity   Sum
Item 1  12.22  3334.44
Item N  44.44   755.55
MyCompany
Myaddress
Page 2
Name    Quantity       Sum
Item N+1  222.22   333.44
Item X    44.44     44.00
Summary: 34433.44
MyCompany
Myaddress";
< /code>
заголовок и нижний колонтитул одинаковы на каждой странице.
Процедура экстракции получает два параметра: < /p>

  Заголовок />  Возвращает строки между ними. < /p>
Поскольку заголовки появляются несколько раз между
как удалить извлечение дубликатов строк, так что остается только последняя дубликата? < /p>
Результат должен быть: < /p>
Item 1  12.22    333
Item N  44.44   755.55
...
Item N+1  222.22    333
Item X    44.44     44.00
[/code]
Использование ASP .NET MVC CORE и C# 9  

Подробнее здесь: [url]https://stackoverflow.com/questions/79662108/how-to-extract-detail-rows-from-text[/url]