Код: Выделить всё
Pierre/NNP
Vinken/NNP
,/,
61/CD
years/NNS
old/JJ
,/,
will/MD
join/VB
the/DT
board/NN
as/IN
a/DT
nonexecutive/JJ
director/NN
Nov./NNP
29/CD
./.
...
Код: Выделить всё
Mortimer 1 NNP 1
foul 1 JJ 1
reported 16 VBN 7 VBD 9
before 26 RB 6 IN 20
allow 4 VB 2 VBP 2
Получить общее количество слов не проблема:
Код: Выделить всё
with open(input_filename, "r") as f:
for line in f:
try:
word, pos = line.rsplit('/', 1)
wordcounts[word] = wordcounts.get(word, 0) + 1
except ValueError:
pass
Код: Выделить всё
ValueErrorИсключение Подробнее здесь: https://stackoverflow.com/questions/793 ... e-document
Мобильная версия