Мне нужна помощь в очистке данных с ресурса, который защищен от этого

Мне нужна помощь в очистке данных с ресурса, который защищен от этого ⇐ Python

1 сообщение • Страница 1 из 1

Anonymous

Мне нужна помощь в очистке данных с ресурса, который защищен от этого

Цитата

Сообщение Anonymous » 31 окт 2024, 22:16

Мне нужно извлечь очень большой объем текста (html) из ресурса (mayocliniclabs.org, там есть /test_catalog, который включает в себя тысячи страниц о биомаркерах, которые мне нужны в текстовом формате). Я использую Python, но могу работать с любым языком, мне просто нужно решение, и каждый раз, когда я делаю это, используя некоторые библиотеки Python, я не могу очистить данные. Когда я делаю простой запрос, он возвращает 403, а когда я имитирую полную среду браузера, он работает очень медленно, данные не полны и даже не содержат текста на странице. Что бы вы порекомендовали?
Мой английский не идеален, как Python. спасибо.
я пробовал запросы, selenium, undetected_chromedriver, имитацию полной среды браузера,chatgpt

Подробнее здесь: https://stackoverflow.com/questions/791 ... m-doing-so

1730402213

Anonymous

Мне нужно извлечь очень большой объем текста (html) из ресурса (mayocliniclabs.org, там есть /test_catalog, который включает в себя тысячи страниц о биомаркерах, которые мне нужны в текстовом формате). Я использую Python, но могу работать с любым языком, мне просто нужно решение, и каждый раз, когда я делаю это, используя некоторые библиотеки Python, я не могу очистить данные. Когда я делаю простой запрос, он возвращает 403, а когда я имитирую полную среду браузера, он работает очень медленно, данные не полны и даже не содержат текста на странице. Что бы вы порекомендовали?
Мой английский не идеален, как Python. спасибо.
я пробовал запросы, selenium, undetected_chromedriver, имитацию полной среды браузера,chatgpt 

Подробнее здесь: [url]https://stackoverflow.com/questions/79146032/i-need-help-scraping-data-from-a-resource-that-is-protected-from-doing-so[/url]

Ответить Пред. тема След. тема

1 сообщение • Страница 1 из 1

Быстрый ответ

Заголовок:

Имя пользователя:

Изменение регистра текста:

Смайлики

Ещё смайлики…

К этому ответу прикреплено по крайней мере одно вложение.

Если вы не хотите добавлять вложения, оставьте поля пустыми. Можно прикреплять файлы, перетаскивая их в окно сообщения.

Максимально разрешённый размер вложения: 15 МБ.

Имя файла:

Комментарий к файлу:

Имя файла	Комментарий к файлу	Размер	Статус

Похожие темы

Ответы

Просмотры

Последнее сообщение

Мне нужна помощь в очистке данных с ресурса, который защищен от этого

Последнее сообщение Anonymous « 31 окт 2024, 22:21
Добавлено в форуме Python

Anonymous » 31 окт 2024, 22:21 » в форуме Python

Мне нужно извлечь очень большой объем текста (html) из ресурса (mayocliniclabs.org, там есть /test_catalog, который включает в себя тысячи страниц о биомаркерах, которые мне нужны в текстовом формате). Я использую Python, но могу работать с любым...

0 Ответы

8 Просмотры

Последнее сообщение Anonymous
31 окт 2024, 22:21
Android 14: (SeekBar) onDraw теперь защищен

Последнее сообщение Anonymous « 24 июл 2024, 13:35
Добавлено в форуме Android

Anonymous » 24 июл 2024, 13:35 » в форуме Android

В моем приложении для Android я переопределяю AppCompatSeekBar. onDraw , чтобы расширить панель поиска.
Насколько я знаю, так и должно быть сделано — см.: https:// Developer.android.com/develop/ui/views/layout/custom-views/custom-drawing
override...

0 Ответы

18 Просмотры

Последнее сообщение Anonymous
24 июл 2024, 13:35
Почему пакет конвертеров Spring защищен?

Последнее сообщение Anonymous « 25 июл 2024, 13:12
Добавлено в форуме JAVA

Anonymous » 25 июл 2024, 13:12 » в форуме JAVA

В Spring Batch параметры задания преобразуются из строк в объявленный тип с помощью JobParametersConverter. Реализация по умолчанию включает в себя (Spring Core) ConversionService, который фактически преобразует переданные аргументы....

0 Ответы

15 Просмотры

Последнее сообщение Anonymous
25 июл 2024, 13:12
Проверьте, защищен ли лист Excel при использовании WorkbookReader в Exceljs.

Последнее сообщение Anonymous « 15 янв 2025, 15:15
Добавлено в форуме Javascript

Anonymous » 15 янв 2025, 15:15 » в форуме Javascript

Я работаю над чтением файла Excel с помощью exceljs. У меня есть ограничение: я могу использовать только этот пакет и никаких других сторонних пакетов. Поскольку мне нужно работать с большим файлом Excel, мне также нужно использовать WorkbookReader....

0 Ответы

12 Просмотры

Последнее сообщение Anonymous
15 янв 2025, 15:15
Я хочу, чтобы имя ресурса определялось пользователем в aws независимо от типа ресурса

Последнее сообщение Anonymous « 24 окт 2024, 16:14
Добавлено в форуме Python

Anonymous » 24 окт 2024, 16:14 » в форуме Python

Итак, по сути, я хочу, чтобы имя определялось пользователем при создании ресурса в aws.
Но существуют разные методы и разные функции для разных ресурсов, т. е. для ec2 они разные, для efs разные и т. д.
У меня есть разные атрибуты, такие как...

0 Ответы

29 Просмотры

Последнее сообщение Anonymous
24 окт 2024, 16:14

Вернуться в «Python»