Я пытаюсь преобразовать файлы docx в PDF с использованием кода ниже: < /p>
import os
import time
import datetime
import win32com.client
import traceback
import zoneinfo
import gc
def dlt():
tz_at = zoneinfo.ZoneInfo('UTC')
datetime_at = datetime.datetime.now(tz_at)
return datetime_at.strftime("%Y-%m-%d %H:%M:%S")
def convert(word, in_file, out_file):
in_path = os.path.abspath(in_file)
out_path = os.path.abspath(out_file)
doc = None
try:
print('[{}] Start convert {}'.format(dlt(), in_path))
doc = word.Documents.Open(in_path, OpenAndRepair=True,ReadOnly=False)
doc.SaveAs(out_path, FileFormat=17)
print('[{}] Convert {} Done!'.format(dlt(), out_path))
except Exception as e:
traceback.print_exc()
finally:
if doc is not None:
try:
doc.Close()
doc = None
gc.collect()
except:
print('Failed to close doc {}'.format(out_path))
def get_word_object():
try:
w = win32com.client.GetActiveObject("Word.Application")
print("Running Word instance found, returning object")
except:
w = win32com.client.Dispatch('Word.Application')
print("No running Word instances, returning new instance")
return w
def loop():
while True:
w = get_word_object()
for f in os.listdir():
if not f.startswith('~$') and f.endswith('.docx'):
o = f.replace('.docx', '.pdf')
if not os.path.isfile(o):
convert(w, f, o)
time.sleep(1)
if __name__ == '__main__':
loop()
и это работает хорошо, но не для поврежденных файлов!
Есть ли способ исправить поврежденный файл при открытии или до этого, как в Microsoft Word делаете?
Я попробовал параметр OpenAndRepair, но проблема не решена.
doc = word.Documents.Open(in_path, OpenAndRepair=True,ReadOnly=False)
Подробнее здесь: https://stackoverflow.com/questions/793 ... com-python
Восстановите поврежденные текстовые файлы с помощью win32com python ⇐ Python
-
- Похожие темы
- Ответы
- Просмотры
- Последнее сообщение
-
-
Как обнаружить поврежденные/поврежденные изображения (необрезанные и обрезанные)
Anonymous » » в форуме Python - 0 Ответы
- 25 Просмотры
-
Последнее сообщение Anonymous
-