При анализе HTML с помощью Beautiful Soup иногда отсутствуют дочерние теги.CSS

Разбираемся в CSS
Ответить Пред. темаСлед. тема
Anonymous
 При анализе HTML с помощью Beautiful Soup иногда отсутствуют дочерние теги.

Сообщение Anonymous »

Используя Beautiful Soup, я работаю над довольно стандартной программой, которая анализирует HTML и извлекает данные на основе элементов CSS. Проблема, с которой я столкнулся, заключается в том, что когда я получаю тег CSS в необработанном виде, существуют теги, которые я не могу вызвать.
Я никогда раньше с этим не сталкивался.ИЗОБРАЖЕНИЕ
ПОСМОТРЕТЬ ИЗОБРАЖЕНИЕ: Элементы, которые я ищу, — это зеленые элементы ОБА в желтом и красном тегах, но я получаю только элементы красного цвета. коробка. Как будто желтого ящика не существует.
HTML здесь:

Код: Выделить всё

[-]REG_TAG_AUDIO_MESSAGE_GIA_CNFG

NameValueTypeType DescriptionTraceabilityConfig Note
queue_behavior0x00000021 (IOP_AUD_BIT_PRIORITY_FIFO, IOP_AUD_BIT_INTERRUPT_NONE)IOP_aud_queue_behavior_t32audio queue behavior
gma_info.gma_modelIOP_AUD_CFG_GMA_36IOP_audio_gma_model_t8GMA model used in airframe
gma_info.gma_quantityIOP_AUD_CFG_ONE_GMA_INSTALLIOP_audio_gma_quantity_t8number of GMAs used
gma_info.gma_audio_pathIOP_AUD_CFG_GMA_GIA6XW_DIGITALIOP_audio_gma_path_t8GMA-GIA audio path type
gma_info.gma_path_failIOP_AUD_CFG_GMA_FAIL_CLASSIC_DIG_FAULTIOP_audio_gma_path_fail_t8audio path failure behavior
[-]clip_volume[0]: IOP_AUD_DB_CLIP_DA40_ALERT

NameValueTypeType DescriptionTraceabilityConfig Note
database_clip_idIOP_AUD_DB_CLIP_DA40_ALERTIOP_audio_clip_t32database clip id
attenuation9uint8attenuation value
Когда я запускаю следующее:

Код: Выделить всё

fifth_level = child.div.table.find_all('tr', class_='odd')
for l in fifth_level:
print(l)
Напечатав l, я получаю следующее:

Код: Выделить всё

database_clip_idIOP_AUD_DB_CLIP_DA40_ALERTIOP_audio_clip_t32database clip id

attenuation9uint8attenuation value
Для меня очевидно, что существует два отдельных элемента, каждый из которых имеет свой собственный набор потомков. У меня возникла проблема: я хочу, чтобы текст из одного из элементов был вложен внутри. Но когда я призываю каждого использовать этот код:

Код: Выделить всё

fifth_level = child.div.table.find_all('tr', class_='odd')
for l in fifth_level:
# print(l)
ltitle = l.td.  text
value = l.td.next_sibling.text
print('TITLE:' + str(title) + '\t Name: ' + str(ltitle) + '\t VALUE: ' + str(value))
Я получаю такой результат:

Код: Выделить всё

TITLE:clip_volume[0]: IOP_AUD_DB_CLIP_DA40_ALERT     Name: attenuation   VALUE: 9
Когда я ожидаю этого результата:

Код: Выделить всё

TITLE:clip_volume[0]: IOP_AUD_DB_CLIP_DA40_ALERT     Name: database_clip_id  VALUE: IOP_AUD_DB_CLIP_DA40_ALERT

TITLE:clip_volume[0]: IOP_AUD_DB_CLIP_DA40_ALERT     Name: attenuation   VALUE: 9
Ссылаясь на прикрепленное изображение, почему l.td переходит на второй тег . Что еще более интересно, когда я вызываю .contents или .children l, первый и все его потомки нигде не находятся. найденный! Пожалуйста, помогите!

Подробнее здесь: https://stackoverflow.com/questions/786 ... -sometimes
Реклама
Ответить Пред. темаСлед. тема

Быстрый ответ

Изменение регистра текста: 
Смайлики
:) :( :oops: :roll: :wink: :muza: :clever: :sorry: :angel: :read: *x)
Ещё смайлики…
   
К этому ответу прикреплено по крайней мере одно вложение.

Если вы не хотите добавлять вложения, оставьте поля пустыми.

Максимально разрешённый размер вложения: 15 МБ.

  • Похожие темы
    Ответы
    Просмотры
    Последнее сообщение
  • При анализе HTML с помощью Beautiful Soup иногда отсутствуют дочерние теги.
    Anonymous » » в форуме CSS
    0 Ответы
    24 Просмотры
    Последнее сообщение Anonymous
  • Списки массивов html-элементов, упорядоченные по веб-сайтам в selenium/beautiful Soup
    Anonymous » » в форуме Python
    0 Ответы
    16 Просмотры
    Последнее сообщение Anonymous
  • Beautiful Soup – получить весь текст, но сохранить ссылку в формате HTML?
    Anonymous » » в форуме Python
    0 Ответы
    13 Просмотры
    Последнее сообщение Anonymous
  • Beautiful Soup – получить весь текст, но сохранить ссылку в формате HTML?
    Anonymous » » в форуме Python
    0 Ответы
    14 Просмотры
    Последнее сообщение Anonymous
  • Как извлечь только первые элементы из нескольких тегов диапазона с помощью Beautiful Soup?
    Anonymous » » в форуме Python
    0 Ответы
    42 Просмотры
    Последнее сообщение Anonymous

Вернуться в «CSS»