Как захватить и обработать мигание текста на экране в течение 0,2 секунды? - Цифровое Кемерово

Как захватить и обработать мигание текста на экране в течение 0,2 секунды? ⇐ Python

Ответить Пред. тема След. тема

1 сообщение • Страница 1 из 1

Anonymous

Как захватить и обработать мигание текста на экране в течение 0,2 секунды?

Цитата

Сообщение Anonymous » 07 дек 2024, 02:44

Я пытаюсь создать скрипт Python, который может обнаруживать текст, мигающий на экране в течение очень короткого периода времени (около 0,2 секунды). Я использую MSS для захвата экрана и pytesseract для распознавания текста. Ниже приведен код, с которым я работаю:

Код: Выделить всё

python
Copy code
import cv2
import pytesseract
import numpy as np
from mss import mss
import time
import threading

# Configure pytesseract path
pytesseract.pytesseract_cmd = "/opt/homebrew/bin/tesseract"

# Define the full-screen capture region
sct = mss()
monitor = sct.monitors[1]  # Full screen (adjust for multiple monitors)

# Initialize variables
last_detected_text = ""
detected_text_lock = threading.Lock()

# Function to capture the screen and process OCR
def capture_and_process_text():
global last_detected_text
while True:
start_time = time.time()
# Capture the screen
screenshot = np.array(sct.grab(monitor))
# Skip grayscale or thresholding for speed
text = pytesseract.image_to_string(screenshot, lang="eng").strip()
# Normalize the text to reduce noise
normalized_text = " ".join(text.split())

# Only display new and non-empty text
with detected_text_lock:
if normalized_text and normalized_text != last_detected_text:
print(f"Detected Text: {normalized_text}")
last_detected_text = normalized_text

# Dynamically adjust loop timing
end_time = time.time()
print(f"Frame processed in {end_time - start_time:.5f} seconds")

# Run the optimized text capture loop
print("Starting full-screen text capture...")
capture_thread = threading.Thread(target=capture_and_process_text)
capture_thread.start()

try:
while True:
time.sleep(1)  # Keep the main thread alive
except KeyboardInterrupt:
print("Text capture stopped.")

Это работает достаточно хорошо для захвата и обработки текста на экране, но я столкнулся с несколькими проблемами:
Скорость: иногда кажется, что сценарий недостаточно быстр, чтобы уловить очень короткие вспышки текста, хотя я стремлюсь к примерно 0,2 секунды.
Накладные расходы на обработку OCR: pytesseract может работать медленно при работе с полноэкранными изображениями, и мне интересно, если есть способ сделать это быстрее.
Захват всего текста: поскольку я не знаю, где на экране появится текст, мне приходится захватывать весь экран, что добавляет накладные расходы.
Я ищу советы о том, как оптимизировать этот код, чтобы сделать его быстрее и надежнее. В частности:
Есть ли способ ускорить захват экрана, сохраняя при этом обработку всего экрана?
Существуют ли более быстрые альтернативы pytesseract, которые хорошо работают для распознавания текста в реальном времени?Есть ли какие-нибудь общие советы по оптимизации рабочего процесса захвата и последующего распознавания текста для обработки таких коротких вспышек?
Я буду признателен за любые рекомендации или предложения о том, как решить эту проблему. Заранее спасибо!

Подробнее здесь: https://stackoverflow.com/questions/792 ... the-screen

Реклама

1733528641

Anonymous

Я пытаюсь создать скрипт Python, который может обнаруживать текст, мигающий на экране в течение очень короткого периода времени (около 0,2 секунды). Я использую MSS для захвата экрана и pytesseract для распознавания текста. Ниже приведен код, с которым я работаю:
[code]python
Copy code
import cv2
import pytesseract
import numpy as np
from mss import mss
import time
import threading

# Configure pytesseract path
pytesseract.pytesseract_cmd = "/opt/homebrew/bin/tesseract"

# Define the full-screen capture region
sct = mss()
monitor = sct.monitors[1]  # Full screen (adjust for multiple monitors)

# Initialize variables
last_detected_text = ""
detected_text_lock = threading.Lock()

# Function to capture the screen and process OCR
def capture_and_process_text():
global last_detected_text
while True:
start_time = time.time()
# Capture the screen
screenshot = np.array(sct.grab(monitor))
# Skip grayscale or thresholding for speed
text = pytesseract.image_to_string(screenshot, lang="eng").strip()
# Normalize the text to reduce noise
normalized_text = " ".join(text.split())

# Only display new and non-empty text
with detected_text_lock:
if normalized_text and normalized_text != last_detected_text:
print(f"Detected Text: {normalized_text}")
last_detected_text = normalized_text

# Dynamically adjust loop timing
end_time = time.time()
print(f"Frame processed in {end_time - start_time:.5f} seconds")

# Run the optimized text capture loop
print("Starting full-screen text capture...")
capture_thread = threading.Thread(target=capture_and_process_text)
capture_thread.start()

try:
while True:
time.sleep(1)  # Keep the main thread alive
except KeyboardInterrupt:
print("Text capture stopped.")
[/code]
Это работает достаточно хорошо для захвата и обработки текста на экране, но я столкнулся с несколькими проблемами:
Скорость: иногда кажется, что сценарий недостаточно быстр, чтобы уловить очень короткие вспышки текста, хотя я стремлюсь к примерно 0,2 секунды.
Накладные расходы на обработку OCR: pytesseract может работать медленно при работе с полноэкранными изображениями, и мне интересно, если есть способ сделать это быстрее.
Захват всего текста: поскольку я не знаю, где на экране появится текст, мне приходится захватывать весь экран, что добавляет накладные расходы.
Я ищу советы о том, как оптимизировать этот код, чтобы сделать его быстрее и надежнее. В частности:
Есть ли способ ускорить захват экрана, сохраняя при этом обработку всего экрана?
Существуют ли более быстрые альтернативы pytesseract, которые хорошо работают для распознавания текста в реальном времени?Есть ли какие-нибудь общие советы по оптимизации рабочего процесса захвата и последующего распознавания текста для обработки таких коротких вспышек?
Я буду признателен за любые рекомендации или предложения о том, как решить эту проблему. Заранее спасибо! 

Подробнее здесь: [url]https://stackoverflow.com/questions/79259674/how-can-i-capture-and-process-text-flashing-for-0-2-seconds-on-the-screen[/url]

Ответить Пред. тема След. тема

1 сообщение • Страница 1 из 1

Быстрый ответ

Заголовок:

Имя пользователя:

Изменение регистра текста:

Смайлики

Ещё смайлики…

К этому ответу прикреплено по крайней мере одно вложение.

Если вы не хотите добавлять вложения, оставьте поля пустыми. Можно прикреплять файлы, перетаскивая их в окно сообщения.

Максимально разрешённый размер вложения: 15 МБ.

Имя файла:

Комментарий к файлу:

Имя файла	Комментарий к файлу	Размер	Статус

Похожие темы

Ответы

Просмотры

Последнее сообщение

Постоянное мигание альтернативного текста в Firefox при загрузке изображений

Последнее сообщение Гость « 29 фев 2024, 03:57
Добавлено в форуме CSS

Гость » 29 фев 2024, 03:57 » в форуме CSS

При загрузке изображений на мой сайт Firefox на короткое время (примерно на полсекунды) отображает замещающий текст перед загрузкой изображения.

Есть и другие проблемы , но все предлагают добавить

img:-moz-loading { видимость: скрыта; } Я...

0 Ответы

26 Просмотры

Последнее сообщение Гость
29 фев 2024, 03:57
Постоянное мигание альтернативного текста в Firefox при загрузке изображений

Последнее сообщение Anonymous « 01 мар 2024, 11:53
Добавлено в форуме CSS

Anonymous » 01 мар 2024, 11:53 » в форуме CSS

При загрузке изображений на мой сайт Firefox на короткое время (примерно на полсекунды) отображает замещающий текст перед загрузкой изображения.

Есть и другие проблемы , но все предлагают добавить

img:-moz-loading { видимость: скрыта; } Я...

0 Ответы

20 Просмотры

Последнее сообщение Anonymous
01 мар 2024, 11:53
Мигание: тайм -аут Sonoff Zigbee Stick 3.0

Последнее сообщение Anonymous « 30 апр 2025, 14:18
Добавлено в форуме Python

Anonymous » 30 апр 2025, 14:18 » в форуме Python

Я попытался обновить свой USB Zigbee 3.0 USB Dongle Plus, EFR32MG21 + CH9102F Zigbee USB-стик ». Я всегда получаю это сообщение об ошибке (1):
sonoff
Opening port COM3, baud 500000
Reading data from...

0 Ответы

13 Просмотры

Последнее сообщение Anonymous
30 апр 2025, 14:18
Позволяет ли Java DateTimeFormatter щадящий анализ в течение долей секунды?

Последнее сообщение Anonymous « 18 окт 2024, 12:06
Добавлено в форуме JAVA

Anonymous » 18 окт 2024, 12:06 » в форуме JAVA

В настоящее время я работаю с Java DateTimeFormatter для анализа меток времени в формате ISO 8601, особенно тех, которые содержат доли секунды. Экспериментируя с различными форматами временных меток, я заметил неожиданное поведение относительно...

0 Ответы

27 Просмотры

Последнее сообщение Anonymous
18 окт 2024, 12:06
Позволяет ли Java DateTimeFormatter щадящий анализ в течение долей секунды?

Последнее сообщение Anonymous « 07 ноя 2024, 02:04
Добавлено в форуме JAVA

Anonymous » 07 ноя 2024, 02:04 » в форуме JAVA

В настоящее время я работаю с Java DateTimeFormatter для анализа меток времени в формате ISO 8601, особенно тех, которые содержат доли секунды. Экспериментируя с различными форматами временных меток, я заметил неожиданное поведение относительно...

0 Ответы

14 Просмотры

Последнее сообщение Anonymous
07 ноя 2024, 02:04

Вернуться в «Python»

Programmiererforum