Эффективная тонкая настройка OCR

Эффективная тонкая настройка OCR ⇐ Python

1 сообщение • Страница 1 из 1

Anonymous

Цитата

Сообщение Anonymous » 09 апр 2025, 17:26

Я работаю над проектом, который включает в себя чрезвычайно большое количество PDF. Каждый PDF является изображением обычного документа офисного типа. Каждая страница PDF хранится отдельный файл. Есть ли способ сделать это быстрее (то есть с более низким вычислительным временем), чем мой текущий подход? < /p>

С помощью проекта такого размера любое небольшое улучшение производительности приведет к значительному снижению затрат на вычисление /время. В настоящее время призыв к Tesseract занимает примерно 2-3 порядка больше времени, чем все другие шаги обработки в проекте. Я лишил Python от этого вызова для ясности. < /P>

ghostscript -o image.tiff -q -r300x300 -sCompression=none -sDEVICE=tiffgray page.pdf
< /code>

Затем я запускаю по существу следующую процедуру. < /p>

def ocr( image ):
import tesseract, cv2.cv as cv

# Load Tesseract
api = tesseract.TessBaseAPI()
api.Init(".","eng",tesseract.OEM_DEFAULT)
api.SetPageSegMode(tesseract.PSM_AUTO)

# Load and OCR the image file
cv_image = cv.LoadImage(image, cv.CV_LOAD_IMAGE_GRAYSCALE)
tesseract.SetCvImage(cv_image, api)

# Return the text
return api.GetUTF8Text()
< /code>

Я немного упростил для ясности. Например, я на самом деле не загружаю Tesseract для каждого файла. Я обрабатываю исключения и т. Д. Однако различия не имеют значения, поскольку 99,9% случаев используется в вызове API.getUtf8text ().>

Подробнее здесь: https://stackoverflow.com/questions/161 ... finetuning

1744208776

Anonymous

 Я работаю над проектом, который включает в себя чрезвычайно большое количество PDF. Каждый PDF является изображением обычного документа офисного типа. Каждая страница PDF хранится отдельный файл. Есть ли способ сделать это быстрее (то есть с более низким вычислительным временем), чем мой текущий подход? < /p>

С помощью проекта такого размера любое небольшое улучшение производительности приведет к значительному снижению затрат на вычисление /время. В настоящее время призыв к Tesseract занимает примерно 2-3 порядка больше времени, чем все другие шаги обработки в проекте. Я лишил Python от этого вызова для ясности. < /P>

ghostscript -o image.tiff -q -r300x300 -sCompression=none -sDEVICE=tiffgray page.pdf
< /code>

Затем я запускаю по существу следующую процедуру. < /p>

def ocr( image ):
import tesseract, cv2.cv as cv

# Load Tesseract
api = tesseract.TessBaseAPI()
api.Init(".","eng",tesseract.OEM_DEFAULT)
api.SetPageSegMode(tesseract.PSM_AUTO)

# Load and OCR the image file
cv_image = cv.LoadImage(image, cv.CV_LOAD_IMAGE_GRAYSCALE)
tesseract.SetCvImage(cv_image, api)

# Return the text
return api.GetUTF8Text()
< /code>

Я немного упростил для ясности. Например, я на самом деле не загружаю Tesseract для каждого файла. Я обрабатываю исключения и т. Д. Однако различия не имеют значения, поскольку 99,9% случаев используется в вызове API.getUtf8text ().> 

Подробнее здесь: [url]https://stackoverflow.com/questions/16136835/efficient-ocr-finetuning[/url]

Ответить Пред. тема След. тема

1 сообщение • Страница 1 из 1

Быстрый ответ

Заголовок:

Имя пользователя:

Изменение регистра текста:

Смайлики

Ещё смайлики…

К этому ответу прикреплено по крайней мере одно вложение.

Если вы не хотите добавлять вложения, оставьте поля пустыми. Можно прикреплять файлы, перетаскивая их в окно сообщения.

Максимально разрешённый размер вложения: 15 МБ.

Имя файла:

Комментарий к файлу:

Имя файла	Комментарий к файлу	Размер	Статус

Похожие темы

Ответы

Просмотры

Последнее сообщение

Эффективная тонкая настройка OCR

Последнее сообщение Anonymous « 09 апр 2025, 06:43
Добавлено в форуме Python

Anonymous » 09 апр 2025, 06:43 » в форуме Python

Я работаю над проектом, который включает в себя чрезвычайно большое количество PDF. Каждый PDF является изображением обычного документа офисного типа. Каждая страница PDF хранится отдельный файл. Есть ли способ сделать это быстрее (то есть с более...

0 Ответы

2 Просмотры

Последнее сообщение Anonymous
09 апр 2025, 06:43
Тонкая настройка GliNER — потери при проверке не регистрируются

Последнее сообщение Anonymous « 02 июл 2024, 15:44
Добавлено в форуме Python

Anonymous » 02 июл 2024, 15:44 » в форуме Python

Я пытаюсь выполнить точную настройку с помощью этого блокнота: GLiNER/examples/finetune.ipynb в main · urchade/GLiNER (github.com)
Однако в журналах отображается только ' loss' , что, как я предполагаю, является потерей набора обучающих данных, но...

0 Ответы

15 Просмотры

Последнее сообщение Anonymous
02 июл 2024, 15:44
Тонкая настройка TrOCR в чипе Mac M4 (MPS)

Последнее сообщение Anonymous « 14 янв 2025, 18:42
Добавлено в форуме Python

Anonymous » 14 янв 2025, 18:42 » в форуме Python

У меня возникла проблема при переключении моего устройства на MPS. Мое обучение проходит без проблем на процессоре, но когда я настраиваю устройство на MPS, я получаю следующую ошибку:
RuntimeError: view size is not compatible with input tensor's...

0 Ответы

22 Просмотры

Последнее сообщение Anonymous
14 янв 2025, 18:42
Тонкая настройка предварительно предварительно проведенной модели с квантованием и усилителем: ошибка масштаба «пытается

Последнее сообщение Anonymous « 26 фев 2025, 01:39
Добавлено в форуме Python

Anonymous » 26 фев 2025, 01:39 » в форуме Python

Я пытаюсь точно настроить предварительную модель с ограниченным VRAM. Чтобы достичь этого, я использую квантование и автоматическую смешанную точность (AMP). Тем не менее, я сталкиваюсь с проблемой, которую я не могу решить. Не могли бы вы помочь...

0 Ответы

8 Просмотры

Последнее сообщение Anonymous
26 фев 2025, 01:39
Встроить/вставить/добавить данные JSON OCR, сгенерированные Google Cloud Vision (OCR)», в файл PDF и сделать PDF доступн

Последнее сообщение Anonymous « 25 июн 2024, 00:40
Добавлено в форуме Php

Anonymous » 25 июн 2024, 00:40 » в форуме Php

Я использую Google Cloud Vision API (OCR) для обнаружения текста в файлах PDF с помощью библиотеки PHP API. Оптическое распознавание текста выполнено идеально, и я сохранил полный набор выходных файлов JSON (например, output-1-to-2.json) с полными...

0 Ответы

40 Просмотры

Последнее сообщение Anonymous
25 июн 2024, 00:40

Вернуться в «Python»