Как обойти капчу с помощью Python

Как обойти капчу с помощью Python ⇐ Python

1 сообщение • Страница 1 из 1

Anonymous

Цитата

Сообщение Anonymous » 18 сен 2024, 11:56

Я знаю, что есть много других вопросов по этой проблеме, но они кажутся... устаревшими (?) или, по крайней мере, они больше не работают. Я пробовал несколько методов, таких как ротаторы прокси, пользовательские списки прокси (которых в идеале мне хотелось бы избегать), использование сеансов Tor через Python, но ни один из этих методов не привел меня ни к чему другому, кроме этой ошибки:
--more--

As you were using this website, something about your browser or behaviour made us think you might be a bot.
Solve the captcha below to continue browsing the site.

--more--

По сути, я использую Python для очистки веб-сайта, который предлагает такие объекты, как комнаты, квартиры и т. д. Но я сделал много запросов (и это цель скрипта), и теперь я встретился с упомянутый ответ с помощью капчи.
Важная часть моего кода, которая выполняет запросы и инициализирует сеанс, следующая:
import requests
from bs4 import BeautifulSoup
import csv
from fake_useragent import UserAgent
import random

def init(url):
global session
global proxies
session = requests.Session()
proxies = [
'http://35.185.196.38:3128',
'https://35.185.196.38:3128',
'http://202.86.138.18:8080',
'https://202.86.138.18:8080',
'https://20.206.106.192:80',
'https://20.210.113.32:80',
'https://20.206.106.192:8123',
'https://89.43.31.134:3128',
'https://88.198.212.91:3128',
'http://213.217.30.69:3128',
'https://213.217.30.69:3128',
'https://204.109.59.194:3121',
'https://20.111.54.16:8123',
'https://195.154.184.80:8080',

]

proxy = random.choice(proxies)
print(f"Using proxy: {proxy}")

user_agent = UserAgent()
session.headers.update({'User-Agent': str(user_agent)})

response = session.get('https://[website_url]/')
assert response.status_code == 200

response = session.get('https://[website_url]/cgi-bin/fl/js/verify')
assert response.status_code == 200

try:
response = session.get(url, proxies={'http': proxy, 'https': proxy}, timeout=10)
return response
except requests.exceptions.RequestException as e:
print(f"Request error: {e}")
return None

def scrape_website(url):
response = session.get(url)
if response.status_code == 200:
print(response.text) # Here is where I print the response which contains the captcha response.
-- rest of the code --

Подробнее здесь: https://stackoverflow.com/questions/784 ... ing-python

1726649770

Anonymous

Я знаю, что есть много других вопросов по этой проблеме, но они кажутся... устаревшими (?) или, по крайней мере, они больше не работают. Я пробовал несколько методов, таких как ротаторы прокси, пользовательские списки прокси (которых в идеале мне хотелось бы избегать), использование сеансов Tor через Python, но ни один из этих методов не привел меня ни к чему другому, кроме этой ошибки:
--more--

As you were using this website, something about your browser or behaviour made us think you might be a bot.
Solve the captcha below to continue browsing the site.

--more--

По сути, я использую Python для очистки веб-сайта, который предлагает такие объекты, как комнаты, квартиры и т. д. Но я сделал много запросов (и это цель скрипта), и теперь я встретился с упомянутый ответ с помощью капчи.
Важная часть моего кода, которая выполняет запросы и инициализирует сеанс, следующая:
import requests
from bs4 import BeautifulSoup
import csv
from fake_useragent import UserAgent
import random

def init(url):
global session
global proxies
session = requests.Session()
proxies = [
'http://35.185.196.38:3128',
'https://35.185.196.38:3128',
'http://202.86.138.18:8080',
'https://202.86.138.18:8080',
'https://20.206.106.192:80',
'https://20.210.113.32:80',
'https://20.206.106.192:8123',
'https://89.43.31.134:3128',
'https://88.198.212.91:3128',
'http://213.217.30.69:3128',
'https://213.217.30.69:3128',
'https://204.109.59.194:3121',
'https://20.111.54.16:8123',
'https://195.154.184.80:8080',

]

proxy = random.choice(proxies)
print(f"Using proxy: {proxy}")

user_agent = UserAgent()
session.headers.update({'User-Agent': str(user_agent)})

response = session.get('https://[website_url]/')
assert response.status_code == 200

response = session.get('https://[website_url]/cgi-bin/fl/js/verify')
assert response.status_code == 200

try:
response = session.get(url, proxies={'http': proxy, 'https': proxy}, timeout=10)
return response
except requests.exceptions.RequestException as e:
print(f"Request error: {e}")
return None

def scrape_website(url):
response = session.get(url)
if response.status_code == 200:
print(response.text) # Here is where I print the response which contains the captcha response.
-- rest of the code --

 

Подробнее здесь: [url]https://stackoverflow.com/questions/78455185/how-to-bypass-captcha-using-python[/url]

Ответить Пред. тема След. тема

1 сообщение • Страница 1 из 1

Быстрый ответ

Заголовок:

Имя пользователя:

Изменение регистра текста:

Смайлики

Ещё смайлики…

К этому ответу прикреплено по крайней мере одно вложение.

Если вы не хотите добавлять вложения, оставьте поля пустыми. Можно прикреплять файлы, перетаскивая их в окно сообщения.

Максимально разрешённый размер вложения: 15 МБ.

Имя файла:

Комментарий к файлу:

Имя файла	Комментарий к файлу	Размер	Статус

Похожие темы

Ответы

Просмотры

Последнее сообщение

Как обойти капчу слайдера, чтобы решить головоломку с помощью селена? (Python)

Последнее сообщение Anonymous « 16 дек 2024, 11:01
Добавлено в форуме Python

Anonymous » 16 дек 2024, 11:01 » в форуме Python

На указанном веб-сайте после поиска токена появляется слайдер-капча.
Пример капчи:

Я хочу обойти капчу слайдера. Я взял ссылку на первое решение в разделе «Невозможно позволить моему сценарию сдвинуть кнопку вправо».
Мой подход заключался бы в...

0 Ответы

18 Просмотры

Последнее сообщение Anonymous
16 дек 2024, 11:01
Удалить фоновую капчу Python r/Python

Последнее сообщение Anonymous « 06 окт 2024, 23:33
Добавлено в форуме Python

Anonymous » 06 окт 2024, 23:33 » в форуме Python

У меня вопрос. Я работаю над проектом и хочу выделить только буквы из изображений с капчей. Я хочу удалить фон и оставить только буквы, но у меня 300 таких изображений. Как бы я это сделал? Все методы, которые я пробовал, работали не идеально....

0 Ответы

14 Просмотры

Последнее сообщение Anonymous
06 окт 2024, 23:33
Получите и решите капчу с помощью myjdapi

Последнее сообщение Anonymous « 26 окт 2024, 23:21
Добавлено в форуме Python

Anonymous » 26 окт 2024, 23:21 » в форуме Python

Я пытаюсь получить изображение капчи с my.jdownloader.org с помощью myjdapi, но не могу его получить.
Не удалось получить идентификатор изображения капчи: 1729973111207. Ответ сервера : Нет
Справочник по JD API
Пример кода, который я использую:
#...

0 Ответы

11 Просмотры

Последнее сообщение Anonymous
26 окт 2024, 23:21
Как я могу решить эту капчу в Python? [закрыто]

Последнее сообщение Anonymous « 03 мар 2024, 06:02
Добавлено в форуме Python

Anonymous » 03 мар 2024, 06:02 » в форуме Python

I need to bypass captcha while scaping websites in Python3. I tried a couple of python captcha solver libraries. But they didn't work well with captchas I met.

Has anyone ever solved this kind of captchas? Or anyone recommend python libraries to...

0 Ответы

19 Просмотры

Последнее сообщение Anonymous
03 мар 2024, 06:02
Нажмите кнопку, которая покажет, когда вы разгадали капчу. от Selenium + Python

Последнее сообщение Anonymous « 22 окт 2024, 06:04
Добавлено в форуме Python

Anonymous » 22 окт 2024, 06:04 » в форуме Python

Мне нужна помощь. Мне нужно нажать кнопку «Lưu và tiếp tục» (сохранить и продолжить), но она появляется только тогда, когда я решаю капчу.
изображение здесь
Это моя функция нажатия:
def auto_click(xpath, interval, duration):
start_time =...

0 Ответы

15 Просмотры

Последнее сообщение Anonymous
22 окт 2024, 06:04

Вернуться в «Python»