Как извлечь текст с веб-страницы?Python

Программы на Python
Ответить
Anonymous
 Как извлечь текст с веб-страницы?

Сообщение Anonymous »

Эта идея проекта бродила у меня в голове несколько дней. Мои одноклассники нашли эту игру (она на румынском языке, но это не важно), в которой нужно сопоставить подсказанную гору с правильной точкой на карте. Я хочу немного автоматизировать этот процесс с помощью Python.
Я думал об использовании tesseract для идентификации текста, отображаемого на странице, но не смог найти никакой информации о распознавании текста tesseract. в реальном времени. Возможно, мне понадобится сделать снимок экрана, передать его в тессеракт, получить текст, переместить мышь в нужную точку, а затем удалить снимок экрана. Есть ли лучший способ сделать это? Может быть, я смогу прочитать html-код веб-страницы, когда она меняет гору, которую запрашивает?
Часть с перемещением мыши я уже разобрался. У меня есть координаты, сохраненные в dict, и на данный момент я сопоставил их с первыми тремя буквами гор. Очевидно, это недостаточно быстро.
Примечание: я работаю на машине с Windows и не буду использовать это для мошенничества, это просто интересный проект.
Мой код:
import mouse

coords = {
"olt": (811, 831),
"cea": (589, 806),
"jiu": (613, 790),
"rm": (819, 751),
"pit": (937, 826),
"meh": (474, 797),
"iov": (485, 778),
"cer": (459, 755),
"tar": (464, 687),
"god": (504, 718),
"ret": (540, 681),
"hat": (553, 640),
"pet": (627, 675),
"par": (658, 712),
"val": (585, 731),
"hun": (543, 531),
"sur": (602, 599),
"gal": (687, 582),
"can": (722, 591),
"lot": (772, 639),
"vid": (723, 658),
"cap": (750, 714),
"sib": (787, 555),
"lov": (817, 664),
"coz": (832, 693),
"fru": (871, 689),
"ghi": (897, 687),
"lac": (880, 663),
"fag": (865, 603),
"iez": (950, 660),
"pia": (996, 637),
"cul": (1020, 644),
"lea": (1001, 681),
"buc":(1045, 665),
"bra": (1071, 627)
}

while True:
query = input("relief: ")
mouse.move(coords[query][0], coords[query][1])
mouse.click()


Подробнее здесь: https://stackoverflow.com/questions/791 ... -a-webpage
Ответить

Быстрый ответ

Изменение регистра текста: 
Смайлики
:) :( :oops: :roll: :wink: :muza: :clever: :sorry: :angel: :read: *x)
Ещё смайлики…
   
К этому ответу прикреплено по крайней мере одно вложение.

Если вы не хотите добавлять вложения, оставьте поля пустыми.

Максимально разрешённый размер вложения: 15 МБ.

Вернуться в «Python»