Я хочу найти все возможные комбинации списка слов в тексте (множественное число, единственное число, префикс и т. Д.). В настоящее время я определил следующую функцию, которая использует шаблон регуляции, чтобы найти слово в моем тексте. Но это не соответствует слову «нация» в последнем предложении в моем тексте («кто нация».) Если я не заменим период на космос («кто нация»). Точно так же это не соответствует словам «национальности» или «народов». Я хочу использовать шаблон, чтобы я мог расширить свой код, чтобы соответствовать любым словам в списке выбранных слов в тексте. Есть ли способ проверить, существуют ли эти соответствия в тексте с шаблоном регуляции? < /P>
text = '''
we are the natio
we love other nations.
other nationalities are good too, we are that. who is a nation.
'''
def WordsinSentence(word,sentence):
pattern = re.compile(' '+word+' |^'+word+' | '+word+' $')
# stem = tokenize_and_stem(sentence)
# stemmed_sent = ' '.join(stem)
if re.search(pattern,sentence.lower()):
return True
Подробнее здесь: https://stackoverflow.com/questions/683 ... th-pattern
Репорс Python: Найдите все возможные формы слова в тексте с помощью шаблона ⇐ Python
-
- Похожие темы
- Ответы
- Просмотры
- Последнее сообщение
-
-
Заменить слова в тексте с помощью словаря Python (заменить ключ его значением)
Anonymous » » в форуме Python - 0 Ответы
- 136 Просмотры
-
Последнее сообщение Anonymous
-