Сегментация текста, сегментация строк, от строки к словам, от слов к символам с помощью Python и OpenCV

Сегментация текста, сегментация строк, от строки к словам, от слов к символам с помощью Python и OpenCV ⇐ Python

1 сообщение • Страница 1 из 1

Anonymous

Сегментация текста, сегментация строк, от строки к словам, от слов к символам с помощью Python и OpenCV

Цитата

Сообщение Anonymous » 13 май 2024, 10:36

Для ввода текстового изображения мне нужно разбить текст на сегменты с помощью библиотеки OPENCV.
Предположим, изображение имеет 4 строки текста, мне нужно написать функцию, которая разбивает, обрезает строки и создает По 4 новых изображения для каждой строки соответственно.
Затем функция, которая получает строку/предложение, состоящее из нескольких слов, и вырезает изображения слов отдельно.
Затем функция, получающая изображение слова и разлагающая его на буквы, для каждой буквы будет создано свое изображение.
Функция ниже, разрезающая на буквы только одно слово р>

Код: Выделить всё

# Cutting one word to letters
def image_to_text(image_file_path):
img = cv2.imread(image_file_path, cv2.IMREAD_COLOR)
extracted_text = ""

if img is not None:
gray = cv2.cvtColor(img, cv2.COLOR_BGR2GRAY)
_, thresh = cv2.threshold(gray, 0, 255, cv2.THRESH_BINARY_INV + cv2.THRESH_OTSU)
contours, _ = cv2.findContours(thresh, cv2.RETR_EXTERNAL, cv2.CHAIN_APPROX_SIMPLE)

for idx, contour in enumerate(contours):
x, y, w, h = cv2.boundingRect(contour)
letter_img = thresh[y:y + h, x:x + w]
kernel = np.array([[0, -1, 0], [-1, 5, -1], [0, -1, 0]], np.float32)
letter_img = cv2.filter2D(letter_img, -1, kernel)
letter_img = cv2.copyMakeBorder(letter_img, 4, 4, 4, 4, cv2.BORDER_CONSTANT, value=[0, 0, 0])
letter_img = cv2.resize(letter_img, (28, 28), interpolation=cv2.INTER_AREA)

# Display the image
plt.imshow(letter_img, cmap='gray')
plt.axis('off')
plt.show()
letter_img = letter_img.reshape(1, 28, 28, 1).astype('float32') / 255

prediction = loaded_model.predict(letter_img)
# Print the predicted class and its corresponding label
predicted_class = np.argmax(prediction)
predicted_label = class_labels[predicted_class]
print(f"Predicted class for the letter: {predicted_class} ({predicted_label})")
extracted_text += predicted_label
extracted_text = extracted_text[::-1]
print('Extracted text:', extracted_text)
return extracted_text

Код: Выделить всё

text = image_to_text(r"C:\Users\student\Desktop\FinalProject\Flask\image\test3IMG.jpg")

ввод:

вывод :
Я ограничен в количестве изображений, которые могу загрузить на форум, поэтому загружу только два примера букв B и E
< img alt="Буква B из слова "Потому что"" src="https://i.sstatic.net/65PGtVPB.png" />

Остальные буквы были извлечены таким же образом..

Вопрос в том, как могу ли я обработать такой ввод:

Я пытаюсь уже несколько дней и все расстраиваюсь.. буду рад помощи

Подробнее здесь: https://stackoverflow.com/questions/784 ... characters

1715585777

Anonymous

Для ввода текстового изображения мне нужно разбить текст на сегменты с помощью библиотеки OPENCV.
Предположим, изображение имеет 4 строки текста, мне нужно написать функцию, которая разбивает, обрезает строки и создает По 4 новых изображения для каждой строки соответственно.
Затем функция, которая получает строку/предложение, состоящее из нескольких слов, и вырезает изображения слов отдельно.
Затем функция, получающая изображение слова и разлагающая его на буквы, для каждой буквы будет создано свое изображение.
Функция ниже, разрезающая на буквы только одно слово р>
[code]# Cutting one word to letters
def image_to_text(image_file_path):
img = cv2.imread(image_file_path, cv2.IMREAD_COLOR)
extracted_text = ""

if img is not None:
gray = cv2.cvtColor(img, cv2.COLOR_BGR2GRAY)
_, thresh = cv2.threshold(gray, 0, 255, cv2.THRESH_BINARY_INV + cv2.THRESH_OTSU)
contours, _ = cv2.findContours(thresh, cv2.RETR_EXTERNAL, cv2.CHAIN_APPROX_SIMPLE)

for idx, contour in enumerate(contours):
x, y, w, h = cv2.boundingRect(contour)
letter_img = thresh[y:y + h, x:x + w]
kernel = np.array([[0, -1, 0], [-1, 5, -1], [0, -1, 0]], np.float32)
letter_img = cv2.filter2D(letter_img, -1, kernel)
letter_img = cv2.copyMakeBorder(letter_img, 4, 4, 4, 4, cv2.BORDER_CONSTANT, value=[0, 0, 0])
letter_img = cv2.resize(letter_img, (28, 28), interpolation=cv2.INTER_AREA)

# Display the image
plt.imshow(letter_img, cmap='gray')
plt.axis('off')
plt.show()
letter_img = letter_img.reshape(1, 28, 28, 1).astype('float32') / 255

prediction = loaded_model.predict(letter_img)
# Print the predicted class and its corresponding label
predicted_class = np.argmax(prediction)
predicted_label = class_labels[predicted_class]
print(f"Predicted class for the letter: {predicted_class} ({predicted_label})")
extracted_text += predicted_label
extracted_text = extracted_text[::-1]
print('Extracted text:', extracted_text)
return extracted_text

[/code]
[code]text = image_to_text(r"C:\Users\student\Desktop\FinalProject\Flask\image\test3IMG.jpg")
[/code]
ввод: 
[img]https://i.sstatic.net/Kny47DXG.jpg[/img]

вывод :
Я ограничен в количестве изображений, которые могу загрузить на форум, поэтому загружу только два примера букв B и E
< img alt="Буква B из слова "Потому что"" src="https://i.sstatic.net/65PGtVPB.png" />
[img]https://i.sstatic.net/ep1y2EvI.png[/img]

Остальные буквы были извлечены таким же образом..
[img]https://i.sstatic.net/Jflw6xs2.png[/img]

Вопрос в том, как могу ли я обработать такой ввод:
[img]https://i.sstatic.net/oTMhHdRA.png[/img]

Я пытаюсь уже несколько дней и все расстраиваюсь.. буду рад помощи 

Подробнее здесь: [url]https://stackoverflow.com/questions/78456602/text-segmenting-line-segmentation-from-line-to-words-from-words-to-characters[/url]

Ответить Пред. тема След. тема

1 сообщение • Страница 1 из 1

Быстрый ответ

Заголовок:

Имя пользователя:

Изменение регистра текста:

Смайлики

Ещё смайлики…

К этому ответу прикреплено по крайней мере одно вложение.

Если вы не хотите добавлять вложения, оставьте поля пустыми. Можно прикреплять файлы, перетаскивая их в окно сообщения.

Максимально разрешённый размер вложения: 15 МБ.

Имя файла:

Комментарий к файлу:

Имя файла	Комментарий к файлу	Размер	Статус

Похожие темы

Ответы

Просмотры

Последнее сообщение

Cv2.error: OpenCV(4.8.1) D:\a\opencv-python\opencv-python\opencv\modules\src\.cpp:660: ошибка: (-215: утверждение не вып

Последнее сообщение Anonymous « 06 янв 2025, 12:05
Добавлено в форуме Python

Anonymous » 06 янв 2025, 12:05 » в форуме Python

Мой код:
import cv2
import matplotlib.pyplot as plt
import cvlib as cv
from cvlib.object_detection import draw_bbox
import tensorflow as tf

im = cv2.imread('road.PNG')
bbox, label, conf = cv.detect_common_objects(im)
output_image = draw_bbox(im,...

0 Ответы

129 Просмотры

Последнее сообщение Anonymous
06 янв 2025, 12:05
Нахождение всех допустимых восьмибуквенных слов путем добавления одной дополнительной буквы к семибуквенным словам.

Последнее сообщение Anonymous « 25 окт 2024, 02:31
Добавлено в форуме Python

Anonymous » 25 окт 2024, 02:31 » в форуме Python

У меня есть несколько длинных списков, состоящих из тысяч слов, отсортированных по длине, по одному списку для каждой длины слова. Для каждого слова длины n в списке я хотел бы сгенерировать все допустимые слова из списка со словами длины n+1, то...

0 Ответы

9 Просмотры

Последнее сообщение Anonymous
25 окт 2024, 02:31
Нахождение всех слов длины n+1 путем добавления одной дополнительной буквы к словам длины n.

Последнее сообщение Anonymous « 25 окт 2024, 10:39
Добавлено в форуме Python

Anonymous » 25 окт 2024, 10:39 » в форуме Python

У меня есть несколько длинных списков, состоящих из тысяч слов, отсортированных по длине, по одному списку для каждой длины слова. Для каждого слова длины n в списке я хотел бы сгенерировать все слова из списка со словами длины n+1, то есть просто...

0 Ответы

18 Просмотры

Последнее сообщение Anonymous
25 окт 2024, 10:39
Нахождение всех слов длины n+1 путем добавления одной дополнительной буквы к словам длины n.

Последнее сообщение Anonymous « 25 окт 2024, 12:03
Добавлено в форуме Python

Anonymous » 25 окт 2024, 12:03 » в форуме Python

У меня есть несколько длинных списков, состоящих из тысяч слов, отсортированных по длине, по одному списку для каждой длины слова. Для каждого слова длины n в списке я хотел бы сгенерировать все слова из списка со словами длины n+1, то есть просто...

0 Ответы

21 Просмотры

Последнее сообщение Anonymous
25 окт 2024, 12:03
Нахождение всех слов длины n+1 путем добавления одной дополнительной буквы к словам длины n.

Последнее сообщение Anonymous « 25 окт 2024, 14:07
Добавлено в форуме Python

Anonymous » 25 окт 2024, 14:07 » в форуме Python

У меня есть несколько длинных списков, состоящих из тысяч слов, отсортированных по длине, по одному списку для каждой длины слова. Для каждого слова длины n в списке я хотел бы сгенерировать все слова из списка со словами длины n+1, то есть просто...

0 Ответы

15 Просмотры

Последнее сообщение Anonymous
25 окт 2024, 14:07

Вернуться в «Python»