Возникла ошибка при использовании Pandas `read_html`: «ValueError: неверный литерал для int() с базой 10: '40%'»

Возникла ошибка при использовании Pandas `read_html`: «ValueError: неверный литерал для int() с базой 10: '40%'» ⇐ Python

1 сообщение • Страница 1 из 1

Anonymous

Возникла ошибка при использовании Pandas `read_html`: «ValueError: неверный литерал для int() с базой 10: '40%'»

Цитата

Сообщение Anonymous » 17 янв 2025, 04:55

Я успешно использовал pd.read_html для большинства сканируемых веб-страниц, но ниже выдает указанную ошибку:
'https://sec.gov/Archives/edgar/data/320 ... 462974.xml'
Когда я проверяю источник веб-страницы, Я вижу ошибочное назначение rowspan:

Код: Выделить всё




Rule 10b5-1(c) Transaction Indication

Веб-страница разрешается правильно, поэтому очевидно, что это не ошибка. Какое здесь решение?
Вот код, который я использую для анализа этого файла и выдается ошибка:

Код: Выделить всё

headers = {
"User-Agent": "Alias ([email protected])",
"Accept-Encoding": "gzip, deflate"
"Host": "www.sec.gov"
}

filing_url = 'https://data.sec.gov/Archives/edgar/data/320193/000032019323000048/xslF345X04/wf-form4_168064750462974.xml'
x = requests.get(filing_url, headers=headers)

if x.status_code != 200:
print(f'Error loading xml for file:\n{filing_url}\nReason: {x.reason}')
else:
print(filing_url,'\n')
columns = [
'title',
'trade_date',
'execution_date',
'trade_code',
'trade_code_v',
'shares_traded',
'acq_code',
'price',
'shares_remaining',
'own_type',
'relationship'
]

try:
tbls = pd.read_html(x.content)
except:
pass

Напротив, файл ниже читается без проблем:
'https://data.sec.gov/Archives/edgar/dat ... 345X03/wf- form4_167546711444862.xml'
**Домены data.sec.gov и sec.gov используются для API и веб-доступа соответственно отдельно

Подробнее здесь: https://stackoverflow.com/questions/793 ... iteral-for

1737078954

Anonymous

Я успешно использовал pd.read_html для большинства сканируемых веб-страниц, но ниже выдает указанную ошибку:
'https://sec.gov/Archives/edgar/data/320193/000032019323000048/xslF345X04/wf-form4_168064750462974.xml'
Когда я проверяю источник веб-страницы, Я вижу ошибочное назначение rowspan:
[code]



Rule 10b5-1(c) Transaction Indication

[/code]
Веб-страница разрешается правильно, поэтому очевидно, что это не ошибка. Какое здесь решение?
Вот код, который я использую для анализа этого файла и выдается ошибка:
[code]headers = {
"User-Agent": "Alias ([email protected])",
"Accept-Encoding": "gzip, deflate"
"Host": "www.sec.gov"
}

filing_url = 'https://data.sec.gov/Archives/edgar/data/320193/000032019323000048/xslF345X04/wf-form4_168064750462974.xml'
x = requests.get(filing_url, headers=headers)

if x.status_code != 200:
print(f'Error loading xml for file:\n{filing_url}\nReason: {x.reason}')
else:
print(filing_url,'\n')
columns = [
'title',
'trade_date',
'execution_date',
'trade_code',
'trade_code_v',
'shares_traded',
'acq_code',
'price',
'shares_remaining',
'own_type',
'relationship'
]

try:
tbls = pd.read_html(x.content)
except:
pass
[/code]
Напротив, файл ниже читается без проблем:
'https://data.sec.gov/Archives/edgar/data/320193/000032019323000016/xslF345X03/wf- form4_167546711444862.xml'
**Домены data.sec.gov и sec.gov используются для API и веб-доступа соответственно отдельно 

Подробнее здесь: [url]https://stackoverflow.com/questions/79363420/running-into-an-error-using-pandas-read-html-valueerror-invalid-literal-for[/url]

Ответить Пред. тема След. тема

1 сообщение • Страница 1 из 1

Быстрый ответ

Заголовок:

Имя пользователя:

Изменение регистра текста:

Смайлики

Ещё смайлики…

К этому ответу прикреплено по крайней мере одно вложение.

Если вы не хотите добавлять вложения, оставьте поля пустыми. Можно прикреплять файлы, перетаскивая их в окно сообщения.

Максимально разрешённый размер вложения: 15 МБ.

Имя файла:

Комментарий к файлу:

Имя файла	Комментарий к файлу	Размер	Статус

Похожие темы

Ответы

Просмотры

Последнее сообщение

Возникла ошибка при использовании Pandas `read_html`: «ValueError: неверный литерал для int() с базой 10: '40%'»

Последнее сообщение Anonymous « 17 янв 2025, 04:17
Добавлено в форуме Html

Anonymous » 17 янв 2025, 04:17 » в форуме Html

Я успешно использовал pd.read_html для большинства сканируемых веб-страниц, но ниже выдает указанную ошибку:
'
Когда я проверяю источник веб-страницы, Я вижу ошибочное назначение rowspan:

Rule 10b5-1(c) Transaction Indication

Веб-страница...

0 Ответы

16 Просмотры

Последнее сообщение Anonymous
17 янв 2025, 04:17
Как преобразовать список[int, int, int] в кортеж[int, int, int], а не в кортеж[int, ...]

Последнее сообщение Anonymous « 27 апр 2024, 23:47
Добавлено в форуме Python

Anonymous » 27 апр 2024, 23:47 » в форуме Python

Предположим, у меня есть две функции: func1 и func2. func1 возвращает список из 3 целых чисел, а func2 принимает кортеж из 3 целых чисел. Как мне преобразовать список в кортеж таким образом, чтобы можно было предотвратить ошибки с помощью средств...

0 Ответы

289 Просмотры

Последнее сообщение Anonymous
27 апр 2024, 23:47
Как исправить ValueError: недопустимый литерал для int() с базой 10: «<_io.TextIOWrapper name='3x+1.txt' mode='r'coding=

Последнее сообщение Гость « 24 сен 2023, 11:14
Добавлено в форуме Python

Гость » 24 сен 2023, 11:14 » в форуме Python

у меня есть ValueError: недопустимый литерал для int() с базой 10: «» на Vsc строка x = int(f.read())

Я пробовал разные методы чтения файла, я пытаюсь получить число из файла, чтобы его можно было использовать в математическом уравнении.

0 Ответы

25 Просмотры

Последнее сообщение Гость
24 сен 2023, 11:14
Очистка селена продолжает возвращать ValueError: недопустимый литерал для int() с базой 10: ''

Последнее сообщение Гость « 11 мар 2024, 21:49
Добавлено в форуме Python

Гость » 11 мар 2024, 21:49 » в форуме Python

При попытке парсинга веб-сайта они не могут найти текст в моей переменной индексирования страниц. Функция len() для нумерации страниц показывает правильное число, поэтому я знаю, что она нашла нужный мне элемент. Только не текст в нем. Если кто-то...

0 Ответы

24 Просмотры

Последнее сообщение Гость
11 мар 2024, 21:49
Каков прототип этой функции? BFont::DrawString(wchar_t*, int, int, int, int, int, int) [закрыто]

Последнее сообщение Anonymous « 04 июл 2024, 10:56
Добавлено в форуме C++

Anonymous » 04 июл 2024, 10:56 » в форуме C++

Кто-нибудь знает прототип BFont::DrawString(wchar_t*, int, int, int, int, int, int) в библиотеке BFont++? Кажется, она была популярна где-то в 2003 году, мне бы хотелось получить прототип этой функции для модификации старой программы. Буду очень...

0 Ответы

108 Просмотры

Последнее сообщение Anonymous
04 июл 2024, 10:56

Вернуться в «Python»