Я получил тест при приеме на работу, моя задача - прочитать несколько файлов .doc. Кто-нибудь знает библиотеку для этого? Я начал с чистого кода Python:
Я получил тест при приеме на работу, моя задача - прочитать несколько файлов .doc. Кто-нибудь знает библиотеку для этого? Я начал с чистого кода Python:
[code]f = open('test.doc', 'r') f.read() [/code]
но это не возвращает понятную строку, мне нужно преобразовать ее в utf-8
Изменить: я просто хочу получить текст из этого файла
Я получил тест при приеме на работу, моя задача - прочитать несколько файлов .doc. Кто-нибудь знает библиотеку для этого? Я начал с необработанного кода Python:
f = open('test.doc', 'r')
f.read()
но это не возвращает понятную строку, мне нужно...
Я пытаюсь прочитать Google Doc, используя API Google Docs. Однако для публичных файлов Google Docs я не имею доступа к идентификатору документа, и я не могу получить указанный идентификатор от автора. В частности, я пытаюсь прочитать этот документ...
Я планирую написать Docgenerator API. Лучше ли писать как плагин Maven или написать его на языке сценариев, чтобы его легче запустить в трубопроводе Gitlabs. Что быстрее выполнить? Java или go
Я читал файлы .docx, защищенные паролем, с помощью org.apache.poi.poifs.filesystem.POIFSFileSystem следующим образом
FileInputStream fis = new FileInputStream(path)
POIFSFileSystem fs = new POIFSFileSystem(fis)
EncryptionInfo info = new...
Я использую Visualstudio 2010 и пытаюсь преобразовать файл word.docx в файл .pdf, и локально он работает нормально, но во время выполнения на сервере отображается ошибка:
Could not load file or assembly 'office, Version=14.0.0.0, Culture=neutral,...