Функция регулярного выражения, которая идентифицирует либо первый символ, либо целое слово.

Функция регулярного выражения, которая идентифицирует либо первый символ, либо целое слово. ⇐ Python

1 сообщение • Страница 1 из 1

Anonymous

Функция регулярного выражения, которая идентифицирует либо первый символ, либо целое слово.

Цитата

Сообщение Anonymous » 27 сен 2024, 10:38

Я пытаюсь разработать шаблон регулярного выражения для использования в цикле for. У меня есть два списка: один — это очищенный набор ключевых слов из документа, другой — набор тегов, которым я хочу использовать очищенный текст для сопоставления. Вот пример того, как это будет выглядеть:

Код: Выделить всё

text_list = ['item1', '3000', '3100', 'item2', '4543', '4643']
tags_list = ['item1 3000 series', 'item 2 4000 series']

Из-за особенностей написания документов теги не всегда связаны между собой. «item1», «3000» и «3100» связаны друг с другом и на самом деле переводятся как «item1 3000» и «item1 3100», но автор написал это не так. Я хотел бы иметь возможность иметь такой элемент, как «3000» или «3100», и сопоставлять его с «item1 серии 3000».
Я предполагаю, что для этого мне понадобится регулярное выражение которое соответствует либо всему слову (от «3000» до «3000» в «серии элемента 3000»), либо первому символу слова (от «3100» до «3» в «3000» в «серии элемента 3000»).< /p>
Можно ли это использовать регулярное выражение? Я изо всех сил пытался разработать шаблон, который мог бы достичь этого.

Подробнее здесь: https://stackoverflow.com/questions/790 ... whole-word

1727422737

Anonymous

Я пытаюсь разработать шаблон регулярного выражения для использования в цикле for. У меня есть два списка: один — это очищенный набор ключевых слов из документа, другой — набор тегов, которым я хочу использовать очищенный текст для сопоставления. Вот пример того, как это будет выглядеть:
[code]text_list = ['item1', '3000', '3100', 'item2', '4543', '4643']
tags_list = ['item1 3000 series', 'item 2 4000 series']
[/code]
Из-за особенностей написания документов теги не всегда связаны между собой. «item1», «3000» и «3100» связаны друг с другом и на самом деле переводятся как «item1 3000» и «item1 3100», но автор написал это не так. Я хотел бы иметь возможность иметь такой элемент, как «3000» или «3100», и сопоставлять его с «item1 серии 3000».
Я предполагаю, что для этого мне понадобится регулярное выражение которое соответствует либо всему слову (от «3000» до «3000» в «серии элемента 3000»), либо первому символу слова (от «3100» до «3» в «3000» в «серии элемента 3000»).< /p>
Можно ли это использовать регулярное выражение? Я изо всех сил пытался разработать шаблон, который мог бы достичь этого. 

Подробнее здесь: [url]https://stackoverflow.com/questions/79003299/regex-function-that-identifies-either-first-char-or-whole-word[/url]

Ответить

1 сообщение • Страница 1 из 1