Подсчет частоты слов в кадре данных pandasPython

Программы на Python
Ответить Пред. темаСлед. тема
Anonymous
 Подсчет частоты слов в кадре данных pandas

Сообщение Anonymous »

У меня есть таблица, как показано ниже:

Код: Выделить всё

      URN                   Firm_Name
0  104472               R.X. Yah & Co
1  104873        Big Building Society
2  109986          St James's Society
3  114058  The Kensington Society Ltd
4  113438      MMV Oil Associates Ltd
И я хочу посчитать частоту всех слов в столбце Firm_Name, чтобы получить результат, как показано ниже:

Изображение


Я пробовал следующий код:

Код: Выделить всё

import pandas as pd
import nltk
data = pd.read_csv("X:\Firm_Data.csv")
top_N = 20
word_dist = nltk.FreqDist(data['Firm_Name'])
print('All frequencies')
print('='*60)
rslt=pd.DataFrame(word_dist.most_common(top_N),columns=['Word','Frequency'])

print(rslt)
print ('='*60)
Однако следующий код не создает уникальное количество слов.

Подробнее здесь: https://stackoverflow.com/questions/467 ... data-frame
Реклама
Ответить Пред. темаСлед. тема

Быстрый ответ

Изменение регистра текста: 
Смайлики
:) :( :oops: :roll: :wink: :muza: :clever: :sorry: :angel: :read: *x)
Ещё смайлики…
   
К этому ответу прикреплено по крайней мере одно вложение.

Если вы не хотите добавлять вложения, оставьте поля пустыми.

Максимально разрешённый размер вложения: 15 МБ.

  • Похожие темы
    Ответы
    Просмотры
    Последнее сообщение

Вернуться в «Python»