Я пытаюсь разработать шаблон регулярного выражения для использования в цикле for. У меня есть два списка: один — это очищенный набор ключевых слов из документа, другой — набор тегов, которым я хочу использовать очищенный текст для сопоставления. Вот пример того, как это будет выглядеть:
Код: Выделить всё
text_list = ['item1', '3000', '3100', 'item2', '4543', '4643']
tags_list = ['item1 3000 series', 'item 2 4000 series']
Из-за особенностей написания документов теги не всегда связаны между собой. «item1», «3000» и «3100» связаны друг с другом и на самом деле переводятся как «item1 3000» и «item1 3100», но автор написал это не так. Я хотел бы иметь возможность иметь такой элемент, как «3000» или «3100», и сопоставлять его с «item1 серии 3000».
Я предполагаю, что для этого мне понадобится регулярное выражение которое соответствует либо всему слову (от «3000» до «3000» в «серии элемента 3000»), либо первому символу слова (от «3100» до «3» в «3000» в «серии элемента 3000»).< /p>
Можно ли это использовать регулярное выражение? Я изо всех сил пытался разработать шаблон, который мог бы достичь этого.
Подробнее здесь:
https://stackoverflow.com/questions/790 ... whole-word