PDF-файл, отсканированный с помощью OCR [закрыто]

PDF-файл, отсканированный с помощью OCR [закрыто] ⇐ Python

1 сообщение • Страница 1 из 1

Anonymous

PDF-файл, отсканированный с помощью OCR [закрыто]

Цитата

Сообщение Anonymous » 16 сен 2024, 23:16

Мне нужно извлечь информацию с помощью OCR из двух отсканированных PDF-файлов ниже. Я пробовал использовать традиционные инструменты оптического распознавания символов, а также запускал модели из Layout Parser, например PubLay, а также пытался создать собственный шаблон с помощью Label Studio, но это не сработало. Мне рекомендовали использовать PubLay для макетов с несколькими столбцами. Как его настроить и выполнить извлечение информации?
Пример PDF-документа представлен на этих двух изображениях.

Подробнее здесь: https://stackoverflow.com/questions/789 ... canned-pdf

1726517777

Anonymous

Мне нужно извлечь информацию с помощью OCR из двух отсканированных PDF-файлов ниже. Я пробовал использовать традиционные инструменты оптического распознавания символов, а также запускал модели из Layout Parser, например PubLay, а также пытался создать собственный шаблон с помощью Label Studio, но это не сработало. Мне рекомендовали использовать PubLay для макетов с несколькими столбцами. Как его настроить и выполнить извлечение информации?
Пример PDF-документа представлен на этих двух изображениях.
[img]https://i.sstatic.net/CbQaE85r.jpg[/img]
[img]https://i.sstatic.net/Ddx2jXX4.jpg [/img]
 

Подробнее здесь: [url]https://stackoverflow.com/questions/78991667/ocr-scanned-pdf[/url]

Ответить Пред. тема След. тема

1 сообщение • Страница 1 из 1

Быстрый ответ

Заголовок:

Имя пользователя:

Изменение регистра текста:

Смайлики

Ещё смайлики…

К этому ответу прикреплено по крайней мере одно вложение.

Если вы не хотите добавлять вложения, оставьте поля пустыми. Можно прикреплять файлы, перетаскивая их в окно сообщения.

Максимально разрешённый размер вложения: 15 МБ.

Имя файла:

Комментарий к файлу:

Имя файла	Комментарий к файлу	Размер	Статус

Похожие темы

Ответы

Просмотры

Последнее сообщение

PDF-файл, отсканированный с помощью OCR [закрыто]

Последнее сообщение Anonymous « 17 сен 2024, 20:18
Добавлено в форуме Python

Anonymous » 17 сен 2024, 20:18 » в форуме Python

Мне нужно извлечь информацию с помощью OCR из двух отсканированных PDF-файлов ниже. Я пробовал использовать традиционные инструменты оптического распознавания символов, а также запускал модели на Python, а также пытался создать собственный шаблон,...

0 Ответы

7 Просмотры

Последнее сообщение Anonymous
17 сен 2024, 20:18
Встроить/вставить/добавить данные JSON OCR, сгенерированные Google Cloud Vision (OCR)», в файл PDF и сделать PDF доступн

Последнее сообщение Anonymous « 25 июн 2024, 00:40
Добавлено в форуме Php

Anonymous » 25 июн 2024, 00:40 » в форуме Php

Я использую Google Cloud Vision API (OCR) для обнаружения текста в файлах PDF с помощью библиотеки PHP API. Оптическое распознавание текста выполнено идеально, и я сохранил полный набор выходных файлов JSON (например, output-1-to-2.json) с полными...

0 Ответы

40 Просмотры

Последнее сообщение Anonymous
25 июн 2024, 00:40
Встроить/вставить/добавить данные JSON OCR, сгенерированные Google Cloud Vision (OCR)», в файл PDF и сделать PDF доступн

Последнее сообщение Anonymous « 13 июл 2024, 14:46
Добавлено в форуме Php

Anonymous » 13 июл 2024, 14:46 » в форуме Php

Я использую Google Cloud Vision API (OCR) для обнаружения текста в файлах PDF с помощью библиотеки PHP API. Оптическое распознавание текста выполнено идеально, и я сохранил полный набор выходных файлов JSON (например, output-1-to-2.json) с полными...

0 Ответы

24 Просмотры

Последнее сообщение Anonymous
13 июл 2024, 14:46
Встроить/вставить/добавить данные JSON OCR, сгенерированные Google Cloud Vision (OCR)», в файл PDF и сделать PDF доступн

Последнее сообщение Anonymous « 14 июл 2024, 00:01
Добавлено в форуме Php

Anonymous » 14 июл 2024, 00:01 » в форуме Php

Я использую Google Cloud Vision API (OCR) для обнаружения текста в файлах PDF с помощью библиотеки PHP API. Оптическое распознавание текста выполнено идеально, и я сохранил полный набор выходных файлов JSON (например, output-1-to-2.json) с полными...

0 Ответы

36 Просмотры

Последнее сообщение Anonymous
14 июл 2024, 00:01
Встраивайте/вставляйте/добавляйте данные OCR JSON, сгенерированные Google Cloud Vision (OCR) в файл PDF, и делайте PDF д

Последнее сообщение Anonymous « 17 ноя 2024, 02:20
Добавлено в форуме Php

Anonymous » 17 ноя 2024, 02:20 » в форуме Php

Я использую Google Cloud Vision API (OCR) для обнаружения текста в файлах PDF с помощью библиотеки PHP API. Оптическое распознавание текста выполнено идеально, и я сохранил полный набор выходных файлов JSON (например, output-1-to-2.json) с полными...

0 Ответы

21 Просмотры

Последнее сообщение Anonymous
17 ноя 2024, 02:20

Вернуться в «Python»