Нужно несколько счетов из одного документаPython

Программы на Python
Ответить
Anonymous
 Нужно несколько счетов из одного документа

Сообщение Anonymous »

У меня есть текстовый файл со словами и тегами частей речи:

Код: Выделить всё

Pierre/NNP
Vinken/NNP
,/,
61/CD
years/NNS
old/JJ
,/,
will/MD
join/VB
the/DT
board/NN
as/IN
a/DT
nonexecutive/JJ
director/NN
Nov./NNP
29/CD
./.
...
Моя задача — создать файл со следующим выводом:

Код: Выделить всё

Mortimer    1   NNP 1
foul    1   JJ  1
reported    16  VBN 7   VBD 9
before  26  RB  6   IN  20
allow   4   VB  2   VBP 2
В первом столбце указывается слово, во втором — сколько раз слово встречалось во всем документе, а затем как часто оно было помечено каким POS-тегом.
Получить общее количество слов не проблема:

Код: Выделить всё

with open(input_filename, "r") as f:
for line in f:
try:
word, pos = line.rsplit('/', 1)
wordcounts[word] = wordcounts.get(word, 0) + 1
except ValueError:
pass

Код: Выделить всё

ValueErrorИсключение 
необходимо, чтобы избежать пустых строк во входном документе. Однако у меня возникли проблемы с поиском подходящей структуры данных для хранения счетчиков POS-тегов, чтобы я мог записать ее в выходной файл. Как бы вы это сделали?

Подробнее здесь: https://stackoverflow.com/questions/793 ... e-document
Ответить

Быстрый ответ

Изменение регистра текста: 
Смайлики
:) :( :oops: :roll: :wink: :muza: :clever: :sorry: :angel: :read: *x)
Ещё смайлики…
   
К этому ответу прикреплено по крайней мере одно вложение.

Если вы не хотите добавлять вложения, оставьте поля пустыми.

Максимально разрешённый размер вложения: 15 МБ.

Вернуться в «Python»