Я старался неделями, чтобы просто получить файл DOCX от Google Drive, используя их API. Я понимаю, как это сделать, чтобы использовать метод Get_media, который сработал, и я могу получить байтовый поток. Однако каждый метод, который я использовал для преобразования этого в текст, не удался. Все, что мне нужно, это текст из файла DOCX в Google Drive, поэтому, если у кого -то есть какие -либо предложения, которые были бы чрезвычайно оценены. < /P>
Код: Выделить всё
service = build("drive", "v3", credentials=creds)
file_id = real_file_id
request = service.files().get_media(fileId=file_id)
file = io.BytesIO()
downloader = MediaIoBaseDownload(file, request)
done = False
while done is False:
status, done = downloader.next_chunk()
print(f"Download {int(status.progress() * 100)}.")
Это дает мне байты файла, но когда я пытаюсь декодировать, я получаю недопустимые байты продолжения, а затем, даже игнорируя ошибки, это все равно не работает. Если кто-то делал это раньше или может мне помочь, я буду ОЧЕНЬ признателен.
Подробнее здесь:
https://stackoverflow.com/questions/793 ... -get-media