Однако существует проблема с определением ориентации плана этажа.
Вот пример изображения плана этажа:
< img alt="введите здесь описание изображения" src="https://i.sstatic.net/v86YlyHo.jpg" />
В правом нижнем углу находится указатель направления, показывающий север (N) со стрелкой, указывающей вверх. Как люди, мы легко можем понять, что север направлен вверх, и можем соответствующим образом скорректировать нашу интерпретацию плана этажа. Однако при использовании модели ИИ для обработки изображения модель не может прочитать метку «N» или понять направление стрелки, что приводит к неправильному анализу ориентации.
Чтобы решить эту проблему, Я попытался использовать PaddleOCR для обнаружения текста на изображении и аннотирования его. Код, который я использовал, представлен ниже
из Paddleocr import PaddleOCR, draw_ocr
из изображения импорта PIL
Код: Выделить всё
# Initialize PaddleOCR
ocr = PaddleOCR(use_angle_cls=True, lang='en') # Download and load the model once
# Provide the image path
img_path = 'prop_1.png'
# Perform OCR
result = ocr.ocr(img_path, cls=True)
# Print the result
for idx in range(len(result)):
res = result[idx]
for line in res:
print(line)
Подробнее здесь: https://stackoverflow.com/questions/793 ... floor-plan