Восстановите поврежденные текстовые файлы с помощью win32com python

Восстановите поврежденные текстовые файлы с помощью win32com python ⇐ Python

1 сообщение • Страница 1 из 1

Anonymous

Восстановите поврежденные текстовые файлы с помощью win32com python

Цитата

Сообщение Anonymous » 27 янв 2025, 12:55

Я пытаюсь преобразовать файлы docx в PDF с использованием кода ниже: < /p>
import os
import time
import datetime
import win32com.client
import traceback
import zoneinfo
import gc

def dlt():
tz_at = zoneinfo.ZoneInfo('UTC')
datetime_at = datetime.datetime.now(tz_at)
return datetime_at.strftime("%Y-%m-%d %H:%M:%S")

def convert(word, in_file, out_file):
in_path = os.path.abspath(in_file)
out_path = os.path.abspath(out_file)
doc = None
try:
print('[{}] Start convert {}'.format(dlt(), in_path))
doc = word.Documents.Open(in_path, OpenAndRepair=True,ReadOnly=False)
doc.SaveAs(out_path, FileFormat=17)
print('[{}] Convert {} Done!'.format(dlt(), out_path))
except Exception as e:
traceback.print_exc()
finally:
if doc is not None:
try:
doc.Close()
doc = None
gc.collect()
except:
print('Failed to close doc {}'.format(out_path))

def get_word_object():
try:
w = win32com.client.GetActiveObject("Word.Application")
print("Running Word instance found, returning object")
except:
w = win32com.client.Dispatch('Word.Application')
print("No running Word instances, returning new instance")
return w

def loop():
while True:
w = get_word_object()
for f in os.listdir():
if not f.startswith('~$') and f.endswith('.docx'):
o = f.replace('.docx', '.pdf')
if not os.path.isfile(o):
convert(w, f, o)
time.sleep(1)

if __name__ == '__main__':
loop()

и это работает хорошо, но не для поврежденных файлов!
Есть ли способ исправить поврежденный файл при открытии или до этого, как в Microsoft Word делаете?
Я попробовал параметр OpenAndRepair, но проблема не решена.
doc = word.Documents.Open(in_path, OpenAndRepair=True,ReadOnly=False)

Подробнее здесь: https://stackoverflow.com/questions/793 ... com-python

1737971741

Anonymous

 Я пытаюсь преобразовать файлы docx в PDF с использованием кода ниже: < /p>
import os
import time
import datetime
import win32com.client
import traceback
import zoneinfo
import gc

def dlt():
tz_at = zoneinfo.ZoneInfo('UTC')
datetime_at = datetime.datetime.now(tz_at)
return datetime_at.strftime("%Y-%m-%d %H:%M:%S")

def convert(word, in_file, out_file):
in_path = os.path.abspath(in_file)
out_path = os.path.abspath(out_file)
doc = None
try:
print('[{}] Start convert {}'.format(dlt(), in_path))
doc = word.Documents.Open(in_path, OpenAndRepair=True,ReadOnly=False)
doc.SaveAs(out_path, FileFormat=17)
print('[{}] Convert {} Done!'.format(dlt(), out_path))
except Exception as e:
traceback.print_exc()
finally:
if doc is not None:
try:
doc.Close()
doc = None
gc.collect()
except:
print('Failed to close doc {}'.format(out_path))

def get_word_object():
try:
w = win32com.client.GetActiveObject("Word.Application")
print("Running Word instance found, returning object")
except:
w = win32com.client.Dispatch('Word.Application')
print("No running Word instances, returning new instance")
return w

def loop():
while True:
w = get_word_object()
for f in os.listdir():
if not f.startswith('~$') and f.endswith('.docx'):
o = f.replace('.docx', '.pdf')
if not os.path.isfile(o):
convert(w, f, o)
time.sleep(1)

if __name__ == '__main__':
loop()

и это работает хорошо, но не для поврежденных файлов!
Есть ли способ исправить поврежденный файл при открытии или до этого, как в Microsoft Word делаете?
Я попробовал параметр OpenAndRepair, но проблема не решена.
doc = word.Documents.Open(in_path, OpenAndRepair=True,ReadOnly=False)
 

Подробнее здесь: [url]https://stackoverflow.com/questions/79390308/repair-corrupted-word-files-with-win32com-python[/url]