Как написать регулярное выражение для сопоставления вложенных тегов HTML в приложении Java? [дубликат]

Как написать регулярное выражение для сопоставления вложенных тегов HTML в приложении Java? [дубликат] ⇐ JAVA

1 сообщение • Страница 1 из 1

Anonymous

Как написать регулярное выражение для сопоставления вложенных тегов HTML в приложении Java? [дубликат]

Цитата

Сообщение Anonymous » 11 июл 2024, 17:55

Я работаю над Java-приложением, в котором мне нужно обрабатывать HTML-контент. Мне нужно регулярное выражение, которое может правильно сопоставлять вложенные теги HTML. Вот пример HTML-контента, с которым я работаю:

Код: Выделить всё

Some bold[/b] text and [i] italic [/i] text.
Another [url=#]link[/url] inside span

Я хочу сопоставить весь тег вместе с его вложенным содержимым, включая все дочерние теги. Я пробовал несколько шаблонов регулярных выражений, но ни один из них, похоже, не обрабатывает вложенные теги правильно. Вот что я пробовал:

Код: Выделить всё

String regex = "(.*?)";
Pattern p = Pattern.compile(regex, Pattern.DOTALL);
Matcher m = p.matcher(htmlContent);
while(m.find()){
System.out.println(matcher.group());
}

Этот шаблон соответствует только внешнему тегу и неправильно фиксирует вложенные вложенные теги. Как написать шаблон регулярного выражения, который корректирует и извлекает содержимое вложенных HTML-тегов?

Подробнее здесь: https://stackoverflow.com/questions/787 ... pplication

1720709707

Anonymous

Я работаю над Java-приложением, в котором мне нужно обрабатывать HTML-контент. Мне нужно регулярное выражение, которое может правильно сопоставлять вложенные теги HTML. Вот пример HTML-контента, с которым я работаю:[b][code]
Some bold[/b] text and [i] italic [/i] text.
Another [url=#]link[/url] inside span

[/code]
Я хочу сопоставить весь тег вместе с его вложенным содержимым, включая все дочерние теги. Я пробовал несколько шаблонов регулярных выражений, но ни один из них, похоже, не обрабатывает вложенные теги правильно. Вот что я пробовал:
[code]String regex = "(.*?)";
Pattern p = Pattern.compile(regex, Pattern.DOTALL);
Matcher m = p.matcher(htmlContent);
while(m.find()){
System.out.println(matcher.group());
}
[/code]
Этот шаблон соответствует только внешнему тегу и неправильно фиксирует вложенные вложенные теги. Как написать шаблон регулярного выражения, который корректирует и извлекает содержимое вложенных HTML-тегов? 

Подробнее здесь: [url]https://stackoverflow.com/questions/78736212/how-to-write-a-regex-to-match-nested-html-tags-in-a-java-application[/url]

Ответить Пред. тема След. тема

1 сообщение • Страница 1 из 1

Быстрый ответ

Заголовок:

Имя пользователя:

Изменение регистра текста:

Смайлики

Ещё смайлики…

К этому ответу прикреплено по крайней мере одно вложение.

Если вы не хотите добавлять вложения, оставьте поля пустыми. Можно прикреплять файлы, перетаскивая их в окно сообщения.

Максимально разрешённый размер вложения: 15 МБ.

Имя файла:

Комментарий к файлу:

Имя файла	Комментарий к файлу	Размер	Статус

Похожие темы

Ответы

Просмотры

Последнее сообщение

Регулярное выражение для сопоставления всех тегов и извлечения атрибута «src»

Последнее сообщение Anonymous « 30 ноя 2024, 11:05
Добавлено в форуме Php

Anonymous » 30 ноя 2024, 11:05 » в форуме Php

Я хочу с помощью регулярного выражения найти все теги img в html-документе и извлечь содержимое атрибута src.

Это это мое регулярное выражение (см. онлайн

aaa.jpg

выход:

Full match `
aaa.jpg
`
Group prepend ` `
Group 2.
Group srs...

0 Ответы

11 Просмотры

Последнее сообщение Anonymous
30 ноя 2024, 11:05
Symfony2 — Настройка облака тегов с использованием веса тегов для популярных тегов

Последнее сообщение Anonymous « 25 окт 2024, 08:03
Добавлено в форуме Php

Anonymous » 25 окт 2024, 08:03 » в форуме Php

Я пытаюсь настроить взвешенное облако тегов, которое работает, когда теги являются строковыми свойствами в сущности блога.

Теперь я настроил теги как отдельные сущности и связал их с блогом как двунаправленное отношение ManyToMany/ManyToMany....

0 Ответы

82 Просмотры

Последнее сообщение Anonymous
25 окт 2024, 08:03
Регулярное выражение для удаления HTML -тегов

Последнее сообщение Anonymous « 29 янв 2025, 02:15
Добавлено в форуме C#

Anonymous » 29 янв 2025, 02:15 » в форуме C#

Я использую следующую обычную экспрессию для удаления HTML -тегов из строки. Это работает, за исключением того, что я оставляю закрывающий тег. Если я попытаюсь удалить: blah это оставляет .

Я вообще не знаю синтаксиса регулярного выражения и...

0 Ответы

5 Просмотры

Последнее сообщение Anonymous
29 янв 2025, 02:15
Регулярное выражение Java для проверки пар узлов/тегов в строке

Последнее сообщение Гость « 11 мар 2024, 20:26
Добавлено в форуме JAVA

Гость » 11 мар 2024, 20:26 » в форуме JAVA

Я хочу иметь возможность проверять, имеет ли строка правильное «количество» пар узлов/тегов, аналогичное XML.
Узлы могут быть самозакрытыми, например или пару открытия-закрытия, например , и может иметь любую комбинацию промежуточных значений,...

0 Ответы

38 Просмотры

Последнее сообщение Гость
11 мар 2024, 20:26
Регулярное выражение зависает – средство сопоставления Java

Последнее сообщение Anonymous « 25 май 2024, 22:29
Добавлено в форуме JAVA

Anonymous » 25 май 2024, 22:29 » в форуме JAVA

Строка:

Аква, лауретсульфат натрия, лаурилсульфат натрия, диметикон, кокамид МЭА, карбонат цинка, дистеарат гликоля, хлорид натрия , пиритион цинка, ксилолсульфонат натрия, цетиловый спирт, отдушка, гуаровый гидроксипропилтримониум хлорид, сульфат...

0 Ответы

31 Просмотры

Последнее сообщение Anonymous
25 май 2024, 22:29

Вернуться в «JAVA»