Подсчет частоты слов в кадре данных pandas

Подсчет частоты слов в кадре данных pandas ⇐ Python

Ответить Пред. тема След. тема

1 сообщение • Страница 1 из 1

Anonymous

Подсчет частоты слов в кадре данных pandas

Цитата

Сообщение Anonymous » 03 ноя 2024, 23:12

У меня есть таблица, как показано ниже:

Код: Выделить всё

      URN                   Firm_Name
0  104472               R.X. Yah & Co
1  104873        Big Building Society
2  109986          St James's Society
3  114058  The Kensington Society Ltd
4  113438      MMV Oil Associates Ltd

И я хочу посчитать частоту всех слов в столбце Firm_Name, чтобы получить результат, как показано ниже:

Я пробовал следующий код:

Код: Выделить всё

import pandas as pd
import nltk
data = pd.read_csv("X:\Firm_Data.csv")
top_N = 20
word_dist = nltk.FreqDist(data['Firm_Name'])
print('All frequencies')
print('='*60)
rslt=pd.DataFrame(word_dist.most_common(top_N),columns=['Word','Frequency'])

print(rslt)
print ('='*60)

Однако следующий код не создает уникальное количество слов.

Подробнее здесь: https://stackoverflow.com/questions/467 ... data-frame

1730664723

Anonymous

У меня есть таблица, как показано ниже:

[code]      URN                   Firm_Name
0  104472               R.X. Yah & Co
1  104873        Big Building Society
2  109986          St James's Society
3  114058  The Kensington Society Ltd
4  113438      MMV Oil Associates Ltd
[/code]

И я хочу посчитать частоту всех слов в столбце Firm_Name, чтобы получить результат, как показано ниже:

[img]https://i.sstatic.net/TbW0I.png[/img]


Я пробовал следующий код:

[code]import pandas as pd
import nltk
data = pd.read_csv("X:\Firm_Data.csv")
top_N = 20
word_dist = nltk.FreqDist(data['Firm_Name'])
print('All frequencies')
print('='*60)
rslt=pd.DataFrame(word_dist.most_common(top_N),columns=['Word','Frequency'])

print(rslt)
print ('='*60)
[/code]

Однако следующий код не создает уникальное количество слов.  

Подробнее здесь: [url]https://stackoverflow.com/questions/46786211/counting-the-frequency-of-words-in-a-pandas-data-frame[/url]

Ответить Пред. тема След. тема

1 сообщение • Страница 1 из 1

Быстрый ответ

Заголовок:

Имя пользователя:

Изменение регистра текста:

Смайлики

Ещё смайлики…

К этому ответу прикреплено по крайней мере одно вложение.

Если вы не хотите добавлять вложения, оставьте поля пустыми. Можно прикреплять файлы, перетаскивая их в окно сообщения.

Максимально разрешённый размер вложения: 15 МБ.

Имя файла:

Комментарий к файлу:

Имя файла	Комментарий к файлу	Размер	Статус

Похожие темы

Ответы

Просмотры

Последнее сообщение

Подсчет частоты некоторых слов в некоторых других ключевых словах в тексте

Последнее сообщение Anonymous « 05 дек 2024, 06:05
Добавлено в форуме Python

Anonymous » 05 дек 2024, 06:05 » в форуме Python

У меня есть два набора списков слов: первый я назвал поисковыми словами, а второй я назвал ключевыми словами. Моя цель — рассчитать частоту поисковых слов в пределах 10 ключевых слов. Например, предположим, что слово - acquire - находится в списке...

0 Ответы

24 Просмотры

Последнее сообщение Anonymous
05 дек 2024, 06:05
Подсчет частоты некоторых слов в некоторых других ключевых словах в тексте

Последнее сообщение Anonymous « 08 дек 2024, 20:27
Добавлено в форуме Python

Anonymous » 08 дек 2024, 20:27 » в форуме Python

У меня есть два набора списков слов: первый я назвал поисковыми словами, а второй я назвал ключевыми словами. Моя цель — рассчитать частоту поисковых слов в пределах 10 ключевых слов. Например, предположим, что слово - acquire - находится в списке...

0 Ответы

18 Просмотры

Последнее сообщение Anonymous
08 дек 2024, 20:27
BLE: измерение частоты дыхания или частоты дыхания с помощью устройства Bluetooth с низким энергопотреблением.

Последнее сообщение Anonymous « 21 апр 2024, 14:14
Добавлено в форуме Python

Anonymous » 21 апр 2024, 14:14 » в форуме Python

Мне нужно устройство Bluetooth с низким энергопотреблением, которое измеряет частоту дыхания (частоту дыхания) в вдохах в минуту. Я не вижу какой-либо службы или характеристики в присвоенных Bluetooth SIG номерах и ресурсах.
В некоторых статьях...

0 Ответы

53 Просмотры

Последнее сообщение Anonymous
21 апр 2024, 14:14
BLE: измерение частоты дыхания или частоты дыхания с помощью устройства Bluetooth с низким энергопотреблением.

Последнее сообщение Anonymous « 21 апр 2024, 14:14
Добавлено в форуме IOS

Anonymous » 21 апр 2024, 14:14 » в форуме IOS

Мне нужно устройство Bluetooth с низким энергопотреблением, которое измеряет частоту дыхания (частоту дыхания) в вдохах в минуту. Я не вижу какой-либо службы или характеристики в присвоенных Bluetooth SIG номерах и ресурсах.
В некоторых статьях...

0 Ответы

59 Просмотры

Последнее сообщение Anonymous
21 апр 2024, 14:14
Функция для поиска всех имен, присутствующих и отсутствующих в кадре данных проверки, в другом кадре данных в Pandas.

Последнее сообщение Anonymous « 21 окт 2024, 23:17
Добавлено в форуме Python

Anonymous » 21 окт 2024, 23:17 » в форуме Python

У меня есть фрейм данных, который содержит следующую структуру:

А мне нужно проверить, присутствуют ли строки из столбца Имя из столбцов МНЕМОНИКА 1, 2, 3 и так далее, по контрольному списку, имеющему следующий формат:
p>

Что мне нужно...

0 Ответы

19 Просмотры

Последнее сообщение Anonymous
21 окт 2024, 23:17

Вернуться в «Python»