Как извлечь текст из файлов .ppt и .pub с помощью C ++?C++

Программы на C++. Форум разработчиков
Ответить
Anonymous
 Как извлечь текст из файлов .ppt и .pub с помощью C ++?

Сообщение Anonymous »

Я разрабатываю приложение C ++, которое необходимо извлечь весь видимый текст из Microsoft PowerPoint .ppt файлы и Microsoft Publisher .pub файлы. Эти форматы являются как двоичными, так и более сложными для обработки, чем новые форматы на основе XML, такие как .pptx .
Цель состоит в том, чтобы прочитать каждый файл, анализировать его содержимое и извлечь текстовые данные непосредственно в C ++. Это включает в себя чтение нескольких файлов из каталога и обработку каждого из них для извлечения любого текста, отображаемого в слайдах или страницах. Методы обработки этих типов файлов, изначально в C ++, были бы полезны.

Подробнее здесь: https://stackoverflow.com/questions/795 ... es-using-c
Ответить

Быстрый ответ

Изменение регистра текста: 
Смайлики
:) :( :oops: :roll: :wink: :muza: :clever: :sorry: :angel: :read: *x)
Ещё смайлики…
   
К этому ответу прикреплено по крайней мере одно вложение.

Если вы не хотите добавлять вложения, оставьте поля пустыми.

Максимально разрешённый размер вложения: 15 МБ.

Вернуться в «C++»