Я создаю приложение C ++, которое извлекает видимый текст из Microsoft PowerPoint .ppt и Microsoft Publisher .pub файлы. Эти форматы находятся в проприетарной бинарной структуре (в отличие от XML на основе .pptx ), и я хочу понять, как разобрать эти форматы вручную в моем собственном коде. /> Проанализируйте двоичную структуру для поиска и извлечения видимого текста, показанного
в слайдах (для .ppt) или страниц (для .pub). < /li>
Обработайте множество таких файлов в каталоге. Я не ищу сторонних библиотек в настоящее время-я хочу справиться с синтаксиком.
Подробнее здесь: https://stackoverflow.com/questions/795 ... -c-by-pars
Мобильная версия