Проблема с тайм-аутом при очистке электронных писем с нескольких URL-адресов с помощью запросов Python

Проблема с тайм-аутом при очистке электронных писем с нескольких URL-адресов с помощью запросов Python ⇐ Python

1 сообщение • Страница 1 из 1

Anonymous

Проблема с тайм-аутом при очистке электронных писем с нескольких URL-адресов с помощью запросов Python

Цитата

Сообщение Anonymous » 24 дек 2024, 16:26

Я работаю над проектом очистки веб-страниц, используя библиотеку запросов Python. Цель состоит в том, чтобы очистить электронные письма от многочисленных URL-адресов. Чтобы справиться с задержками в сети, я установил параметр timeout как timeout=(10, 10).
Однако, когда я запускаю сценарий для нескольких URL-адресов, я сталкиваюсь с проблемой, при которой программа зависает на запросе и не учитывает настройки таймаута. Это приводит к тому, что скрипт зависает на неопределенный срок, особенно при очистке большого количества URL-адресов.
Вот фрагмент кода, который я использую:

Код: Выделить всё

import requests

urls = [
"http://example.com",
"http://anotherexample.com",
# ... more URLs
]
HEADERS={"user-agent":"Mozilla/5.0 (Windows NT 10.0; Win64; x64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/131.0.0.0 Safari/537.36"}
for url in urls:
try:
response = requests.get(url, headers=HEADERS, timeout=(10, 10))
if response.status_code == 200:
# Extract emails (simplified for demonstration)
print(f"Emails from {url}: ", response.text)
except requests.exceptions.Timeout:
print(f"Timeout occurred for {url}")
except requests.exceptions.RequestException as e:
print(f"Error occurred for {url}: {e}")

Несмотря на использование параметра тайм-аута, сценарий иногда зависает на неопределенный срок и не переходит к следующему URL-адресу.
Принятые меры< /strong>:

Пытался уменьшить значения тайм-аута до (5, 5), но столкнулся с той же проблемой.
Убедился, что URL-адреса действительны и доступен.

Мои вопросы:

Почему в этом случае тайм-аут может работать не так, как ожидалось?

Как обеспечить, чтобы скрипт не зависал бесконечно при парсинге большого количества URL-адресов?

Любая помощь или предложения по решению этой проблемы будут очень важны. оценено.
Окружающая среда:
Версия Python: 3.10.10
запрашивает версию: 2.32.3

Подробнее здесь: https://stackoverflow.com/questions/793 ... n-requests

1735046808

Anonymous

Я работаю над проектом очистки веб-страниц, используя библиотеку запросов Python. Цель состоит в том, чтобы очистить электронные письма от многочисленных URL-адресов. Чтобы справиться с задержками в сети, я установил параметр timeout как timeout=(10, 10).
Однако, когда я запускаю сценарий для нескольких URL-адресов, я сталкиваюсь с проблемой, при которой программа зависает на запросе и не учитывает настройки таймаута. Это приводит к тому, что скрипт зависает на неопределенный срок, особенно при очистке большого количества URL-адресов.
Вот фрагмент кода, который я использую:
[code]import requests

urls = [
"http://example.com",
"http://anotherexample.com",
# ... more URLs
]
HEADERS={"user-agent":"Mozilla/5.0 (Windows NT 10.0; Win64; x64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/131.0.0.0 Safari/537.36"}
for url in urls:
try:
response = requests.get(url, headers=HEADERS, timeout=(10, 10))
if response.status_code == 200:
# Extract emails (simplified for demonstration)
print(f"Emails from {url}: ", response.text)
except requests.exceptions.Timeout:
print(f"Timeout occurred for {url}")
except requests.exceptions.RequestException as e:
print(f"Error occurred for {url}: {e}")
[/code]
Несмотря на использование параметра тайм-аута, сценарий иногда зависает на неопределенный срок и не переходит к следующему URL-адресу.
[b]Принятые меры< /strong>:
[list]
[*]Пытался уменьшить значения тайм-аута до (5, 5), но столкнулся с той же проблемой.
Убедился, что URL-адреса действительны и доступен.
[/list]
Мои вопросы[/b]:
[list]
[*]Почему в этом случае тайм-аут может работать не так, как ожидалось?

Как обеспечить, чтобы скрипт не зависал бесконечно при парсинге большого количества URL-адресов?

[/list]
Любая помощь или предложения по решению этой проблемы будут очень важны. оценено.
[b]Окружающая среда[/b]:
Версия Python: 3.10.10
запрашивает версию: 2.32.3 

Подробнее здесь: [url]https://stackoverflow.com/questions/79305703/timeout-issue-when-scraping-emails-from-multiple-urls-using-python-requests[/url]

Ответить Пред. тема След. тема

1 сообщение • Страница 1 из 1

Быстрый ответ

Заголовок:

Имя пользователя:

Изменение регистра текста:

Смайлики

Ещё смайлики…

К этому ответу прикреплено по крайней мере одно вложение.

Если вы не хотите добавлять вложения, оставьте поля пустыми. Можно прикреплять файлы, перетаскивая их в окно сообщения.

Максимально разрешённый размер вложения: 15 МБ.

Имя файла:

Комментарий к файлу:

Имя файла	Комментарий к файлу	Размер	Статус

Похожие темы

Ответы

Просмотры

Последнее сообщение

Проблема с тайм-аутом при очистке электронных писем с нескольких URL-адресов с помощью запросов Python

Последнее сообщение Anonymous « 24 дек 2024, 18:11
Добавлено в форуме Python

Anonymous » 24 дек 2024, 18:11 » в форуме Python

Я работаю над проектом очистки веб-страниц, используя библиотеку запросов Python. Цель состоит в том, чтобы очистить электронные письма от многочисленных URL-адресов. Чтобы справиться с задержками в сети, я установил параметр timeout как...

0 Ответы

10 Просмотры

Последнее сообщение Anonymous
24 дек 2024, 18:11
Запретить отправку нескольких электронных писем с интервалом в 30 секунд, множественные запросы

Последнее сообщение Anonymous « 03 май 2024, 06:40
Добавлено в форуме JAVA

Anonymous » 03 май 2024, 06:40 » в форуме JAVA

Я написал API:
В приложении Spring с несколькими экземплярами приложения для каждого электронного письма разрешается отправлять почту только в течение 30 секунд. Отправка того же письма будет заблокирована в течение 30 секунд. Однако, если это...

0 Ответы

41 Просмотры

Последнее сообщение Anonymous
03 май 2024, 06:40
Как я могу использовать App.config для хранения URL-адресов и получения URL-адресов при тестировании тестов Selenium с п

Последнее сообщение Anonymous « 31 июл 2024, 12:29
Добавлено в форуме C#

Anonymous » 31 июл 2024, 12:29 » в форуме C#

Я создал файл App.config для хранения URL-адресов вместо того, чтобы жестко запрограммировать их во время моих модульных тестов, поэтому, если URL-адрес изменится, у меня есть только одно место, где мне нужно их изменить. Это мой App.config...

0 Ответы

32 Просмотры

Последнее сообщение Anonymous
31 июл 2024, 12:29
Как я могу использовать App.config для хранения URL-адресов и получения URL-адресов при тестировании тестов Selenium с п

Последнее сообщение Anonymous « 31 июл 2024, 20:10
Добавлено в форуме C#

Anonymous » 31 июл 2024, 20:10 » в форуме C#

Я создал файл App.config для хранения URL-адресов вместо того, чтобы жестко запрограммировать их во время моих модульных тестов, поэтому, если URL-адрес изменится, у меня есть только одно место, где мне нужно их изменить. Это мой App.config...

0 Ответы

34 Просмотры

Последнее сообщение Anonymous
31 июл 2024, 20:10
Отправка электронных писем с помощью хостинга GoDaddy с помощью PHPMailer?

Последнее сообщение Anonymous « 10 янв 2025, 06:08
Добавлено в форуме Php

Anonymous » 10 янв 2025, 06:08 » в форуме Php

В настоящее время я работаю над созданием и запуском веб-сайта для своей виртуальной компании. Я провел исследование и нигде не могу найти ответ на этот вопрос.
Когда пользователь регистрируется, я хочу, чтобы он получил электронное письмо с...

0 Ответы

16 Просмотры

Последнее сообщение Anonymous
10 янв 2025, 06:08

Вернуться в «Python»