Это теги и ; один из каждого является совпадающей парой. В строке не может быть ни одной, ни одной или нескольких пар и/или одной или нескольких несовпадающих пар, т. е. без соответствующего . (Хотя теоретически возможно иметь без , я не сталкивался ни с одним и меня это не беспокоит.)
Я пытаюсь найти экземпляры ' (правая одинарная кавычка) в несовпадающей паре, т. е. после , у которого нет соответствующего . Это может быть связано с тем, что EOL достигается до или потому, что другой появляется первым.
Пример данных:
Код: Выделить всё
Line one, matched one,
Line two, unmatched’ one. Line two, matched’ pair one.
Line three, ’fore no tag.
Line four, ’fore first tag. Line four, unmatched one’.
Line five free text before. Line five, matched one, line five, ’matched two. Line five’ free text after.
Line six matched one, line six free text! Line six matched two hittin’ and sittin’ and goin’ on forever.
Line seven unmatched’ one.
Line eight free text. Line eight’ unmatched one, unmatched’ two.
Это на Python, с регулярным выражением, которое должно быть частью поиск и замена, например
Код: Выделить всё
regex.sub(r"regex", r"", text_being_processed)
Не обращая на мгновение внимания на EOL, я попытался найти текст между двумя без вмешиваюсь , но я явно неправильно обрабатываю отрицательный просмотр:
Код: Выделить всё
(?
Подробнее здесь: [url]https://stackoverflow.com/questions/79340748/regex-for-a-particular-character-in-an-unpaired-tag[/url]
Мобильная версия