Document содержит заголовок строки, заголовок страницы, детализацию, нижний колонтитул страницы и сводные части.
Структура документа: < /p>
Код: Выделить всё
Title
Page 1 header
Details
Page 1 footer
...
Page N header
Details
Page N footer
Summary
< /code>
Пример: < /p>
string text = @"Invoice 123
Page 1
Name Quantity Sum
Item 1 12.22 3334.44
Item N 44.44 755.55
MyCompany
Myaddress
Page 2
Name Quantity Sum
Item N+1 222.22 333.44
Item X 44.44 44.00
Summary: 34433.44
MyCompany
Myaddress";
< /code>
заголовок и нижний колонтитул одинаковы на каждой странице.
Процедура экстракции получает два параметра: < /p>
Заголовок /> Возвращает строки между ними. < /p>
Поскольку заголовки появляются несколько раз между
как удалить извлечение дубликатов строк, так что остается только последняя дубликата? < /p>
Результат должен быть: < /p>
Item 1 12.22 333
Item N 44.44 755.55
...
Item N+1 222.22 333
Item X 44.44 44.00
Подробнее здесь: https://stackoverflow.com/questions/796 ... -from-text