Ниже код токенизирует текст и идентифицирует грамматику каждого токенизированного слова. < /p>
import nltk
from nltk.tokenize import sent_tokenize, word_tokenize
from nltk.corpus import wordnet as wn
#nltk.download()
text = "Natural language processing is fascinating"
# tokenise the sentence
words = word_tokenize(text)
print(words)
# identify noun, verb, etc grammatically in the sentence
for w in words:
tmp = wn.synsets(w)[0].pos()
print (w, ":", tmp)
< /code>
Вывод IS; < /p>
['Natural', 'language', 'processing', 'is', 'fascinating']
Natural : n
language : n
processing : n
is : v
fascinating : v
< /code>
, где n существует существительное, а V - глагол < /p>
может какой -то эксперт по коду Python Пожалуйста, сообщите мне, как форматировать вывод, чтобы он был похож на ниже; < /p>
nouns = ["natural", "language", "processing"]
verbs = ["is", "fascinating"]
< /code>
Мне нужна помощь, чтобы изменить формат вывода результата. Я думаю, что для выполнения этого требования требуется какой -то соответствующий код Python.
Подробнее здесь: https://stackoverflow.com/questions/796 ... l-with-gra
Text Text Tokenize Code для вывода результатов от горизонтальной до вертикальной с распознаванием грамматики ⇐ Python
-
- Похожие темы
- Ответы
- Просмотры
- Последнее сообщение