Как я могу извлечь видимый текст из бинарных файлов .ppt и .pub, используя C ++, анализируя структуру файла? [закрыто]

Как я могу извлечь видимый текст из бинарных файлов .ppt и .pub, используя C ++, анализируя структуру файла? [закрыто] ⇐ C++

1 сообщение • Страница 1 из 1

Anonymous

Как я могу извлечь видимый текст из бинарных файлов .ppt и .pub, используя C ++, анализируя структуру файла? [закрыто]

Цитата

Сообщение Anonymous » 18 апр 2025, 08:35

Я создаю приложение C ++, которое извлекает видимый текст из Microsoft PowerPoint .ppt и Microsoft Publisher .pub файлы. Эти форматы находятся в проприетарной бинарной структуре (в отличие от XML на основе .pptx ), и я хочу понять, как разобрать эти форматы вручную в моем собственном коде. /> Проанализируйте двоичную структуру для поиска и извлечения видимого текста, показанного
в слайдах (для .ppt) или страниц (для .pub). < /li>
Обработайте множество таких файлов в каталоге. Я не ищу сторонних библиотек в настоящее время-я хочу справиться с синтаксиком.

Подробнее здесь: https://stackoverflow.com/questions/795 ... -c-by-pars

1744954530

Anonymous

 Я создаю приложение C ++, которое извлекает видимый текст из Microsoft PowerPoint .ppt  и Microsoft Publisher .pub  файлы. Эти форматы находятся в проприетарной бинарной структуре (в отличие от XML на основе .pptx ), и я хочу понять, как разобрать эти форматы вручную в моем собственном коде. />  Проанализируйте двоичную структуру для поиска и извлечения видимого текста, показанного
в слайдах (для .ppt) или страниц (для .pub). < /li>
 Обработайте множество таких файлов в каталоге. Я не ищу сторонних библиотек в настоящее время-я хочу справиться с синтаксиком.  

Подробнее здесь: [url]https://stackoverflow.com/questions/79580411/how-can-i-extract-visible-text-from-binary-ppt-and-pub-files-using-c-by-pars[/url]

Ответить

1 сообщение • Страница 1 из 1