Я в настоящее время строю приложение для соскобки, которое займет URL на любую страницу рецепта и возвращаю только основы: заголовок, ингредиенты, инструкции… < /p>
Это мой первый раз, когда он соскоб И я использую красивый суп, чтобы найти определенные элементы HTML. Я подумал о том, чтобы использовать что -то вроде селена, чтобы обойти это, но если я передаю это приложение нескольким клиентам с разными драйверами и браузерами, которые создают проблему. < /P>
есть другой вариант или альтернатива, так Что я могу получить данные из URL -адресов, не будучи ограниченным для драйверов и браузеров? А также обход обнаружения бота для определенных веб -сайтов?
Подробнее здесь: https://stackoverflow.com/questions/794 ... nal-across
Как я могу обойти обнаружение бота, обеспечивая, чтобы мой веб -скребок оставался функциональным на нескольких платформа ⇐ Python
-
- Похожие темы
- Ответы
- Просмотры
- Последнее сообщение