Мне нужна помощь в очистке данных с ресурса, который защищен от этогоPython

Программы на Python
Ответить Пред. темаСлед. тема
Anonymous
 Мне нужна помощь в очистке данных с ресурса, который защищен от этого

Сообщение Anonymous »

Мне нужно извлечь очень большой объем текста (html) из ресурса (mayocliniclabs.org, там есть /test_catalog, который включает в себя тысячи страниц о биомаркерах, которые мне нужны в текстовом формате). Я использую Python, но могу работать с любым языком, мне просто нужно решение, и каждый раз, когда я делаю это, используя некоторые библиотеки Python, я не могу очистить данные. Когда я делаю простой запрос, он возвращает 403, а когда я имитирую полную среду браузера, он работает очень медленно, данные не полны и даже не содержат текста на странице. Что бы вы порекомендовали?
Мой английский не идеален, как Python. спасибо.
я пробовал запросы, selenium, undetected_chromedriver, имитацию полной среды браузера,chatgpt

Подробнее здесь: https://stackoverflow.com/questions/791 ... m-doing-so
Реклама
Ответить Пред. темаСлед. тема

Быстрый ответ

Изменение регистра текста: 
Смайлики
:) :( :oops: :roll: :wink: :muza: :clever: :sorry: :angel: :read: *x)
Ещё смайлики…
   
К этому ответу прикреплено по крайней мере одно вложение.

Если вы не хотите добавлять вложения, оставьте поля пустыми.

Максимально разрешённый размер вложения: 15 МБ.

  • Похожие темы
    Ответы
    Просмотры
    Последнее сообщение
  • Мне нужна помощь в очистке данных с ресурса, который защищен от этого
    Anonymous » » в форуме Python
    0 Ответы
    11 Просмотры
    Последнее сообщение Anonymous
  • Android 14: (SeekBar) onDraw теперь защищен
    Anonymous » » в форуме Android
    0 Ответы
    19 Просмотры
    Последнее сообщение Anonymous
  • Почему пакет конвертеров Spring защищен?
    Anonymous » » в форуме JAVA
    0 Ответы
    15 Просмотры
    Последнее сообщение Anonymous
  • Проверьте, защищен ли лист Excel при использовании WorkbookReader в Exceljs.
    Anonymous » » в форуме Javascript
    0 Ответы
    12 Просмотры
    Последнее сообщение Anonymous
  • Я хочу, чтобы имя ресурса определялось пользователем в aws независимо от типа ресурса
    Anonymous » » в форуме Python
    0 Ответы
    30 Просмотры
    Последнее сообщение Anonymous

Вернуться в «Python»