Как решить CAPTCHA с помощью Python при автоматическом парсингеPython

Программы на Python
Ответить
Anonymous
 Как решить CAPTCHA с помощью Python при автоматическом парсинге

Сообщение Anonymous »

Я пишу парсер на Python и столкнулся с CAPTCHA в форме входа. Сайт иногда возвращает обычную reCAPTCHA v2, а иногда hCaptcha. Я пытался обойти это через Selenium, но CAPTCHA продолжает блокировать автоматизацию.
Моя цель — автоматически получить токен решения CAPTCHA и вставить его в форму, чтобы скрипт мог продолжать работать без вмешательства вручную.
Что я уже пробовал: headless Chrome, разные пользовательские агенты; ожидание появления iframe; пробовал распознавать изображение CAPTCHA через сторонние библиотеки, но reCAPTCHA/hCaptcha так не работает; нашел упоминания о внешних сервисах, но не понимаю, как именно интегрировать их с Python через API.
Что мне нужно:
Пошаговая рекомендация, как технически организовать разгадывание капчи в Python: какой API использовать; как создать задачу, получить токен; как передать его обратно в Selenium или запрос; существует ли универсальный метод для разных типов CAPTCHA.
Буду признателен за пример работающего кода или проверенную архитектуру.

Подробнее здесь: https://stackoverflow.com/questions/798 ... d-scraping
Ответить

Быстрый ответ

Изменение регистра текста: 
Смайлики
:) :( :oops: :roll: :wink: :muza: :clever: :sorry: :angel: :read: *x)
Ещё смайлики…
   
К этому ответу прикреплено по крайней мере одно вложение.

Если вы не хотите добавлять вложения, оставьте поля пустыми.

Максимально разрешённый размер вложения: 15 МБ.

Вернуться в «Python»