Учитывая качество результатов в браузере, я считаю, что проблема связана не с LLMWhisperer, а со всеми последующие действия, которые я совершаю для записи вывода запроса в файл. Кроме того, команда шепота(), которая отправляет запрос OCR и возвращает результат, не имеет параметров, связанных с языком или кодировкой.
Я неопытный программист и не понимаю, что мне делать. может отсутствовать. Может ли кто-нибудь подсказать, как скорректировать мою стратегию, чтобы правильно сохранить специальные символы?
Код: Выделить всё
from unstract.llmwhisperer.client import LLMWhispererClient
client = LLMWhispererClient(base_url="https://llmwhisperer-api.unstract.com/v1", api_key="my-api-key")
whisper = client.whisper(file_path="my-file-path",
processing_mode="ocr", pages_to_extract="1")
extracted_text = whisper["extracted_text"]
with open("transcript.txt", "w", encoding='utf8') as file:
file.write(extracted_text)
Подробнее здесь: https://stackoverflow.com/questions/791 ... isperer-py
Мобильная версия