Сгруппируйте по столбцу и получите три наиболее частых значения из другого столбца в виде строки, разделенной запятыми

Сгруппируйте по столбцу и получите три наиболее частых значения из другого столбца в виде строки, разделенной запятыми ⇐ Python

Ответить Пред. тема След. тема

1 сообщение • Страница 1 из 1

Anonymous

Сгруппируйте по столбцу и получите три наиболее частых значения из другого столбца в виде строки, разделенной запятыми

Цитата

Сообщение Anonymous » 01 окт 2024, 10:50

Есть фрейм данных со столбцами район, тип преступления, дата, месяц

Код: Выделить всё

df = spark.createDataFrame(
[('D1', 'ROBBERY', '2024-02-01', 2),
('D1', 'ROBBERY', '2024-02-01', 2),
('D1', 'DRUGS', '2024-03-05', 3),
('D1', 'FRAUD', '2024-03-05', 3),
('D1', 'AUTO THEFT', '2024-01-09',1),
('D1', 'AUTO THEFT', '2024-01-03', 1),
('D2', 'MURDER', '2024-05-04', 5),
('D2', 'MURDER', '2024-06-01', 6),
('D2', 'RAPE', '2024-07-02', 7)],
['district', 'crime_type', 'date', 'month'])

Необходимо получить список топ-3 наиболее частых типов преступлений для каждого района (в виде строки через запятую) и медианное (не среднее!) значение количества преступлений по месяцам. столбец для этого округа.
Результатом должен стать новый фрейм данных с тремя столбцами: District, top_3_crime_types, median_crimes_monthly:

район
top_3_crime_types
median_crimes_monthly

D1
ограбление, угон авто, наркотики
2

< tr>
D2
УБИЙСТВО, ИЗНАСИЛОВАНИЕ
1

Подробнее здесь: https://stackoverflow.com/questions/790 ... n-as-comma

1727769051

Anonymous

Есть фрейм данных со столбцами район, тип преступления, дата, месяц
[code]df = spark.createDataFrame(
[('D1', 'ROBBERY', '2024-02-01', 2),
('D1', 'ROBBERY', '2024-02-01', 2),
('D1', 'DRUGS', '2024-03-05', 3),
('D1', 'FRAUD', '2024-03-05', 3),
('D1', 'AUTO THEFT', '2024-01-09',1),
('D1', 'AUTO THEFT', '2024-01-03', 1),
('D2', 'MURDER', '2024-05-04', 5),
('D2', 'MURDER', '2024-06-01', 6),
('D2', 'RAPE', '2024-07-02', 7)],
['district', 'crime_type', 'date', 'month'])
[/code]
Необходимо получить список топ-3 наиболее частых типов преступлений для каждого района (в виде строки через запятую) и медианное (не среднее!) значение количества преступлений по месяцам. столбец для этого округа.
Результатом должен стать новый фрейм данных с тремя столбцами: District, top_3_crime_types, median_crimes_monthly:



район
top_3_crime_types
median_crimes_monthly




D1
ограбление, угон авто, наркотики
2

< tr>
D2
УБИЙСТВО, ИЗНАСИЛОВАНИЕ
1


 

Подробнее здесь: [url]https://stackoverflow.com/questions/79025222/group-by-column-and-get-top-3-most-frequent-values-from-another-column-as-comma[/url]

Ответить Пред. тема След. тема

1 сообщение • Страница 1 из 1

Быстрый ответ

Заголовок:

Имя пользователя:

Изменение регистра текста:

Смайлики

Ещё смайлики…

К этому ответу прикреплено по крайней мере одно вложение.

Если вы не хотите добавлять вложения, оставьте поля пустыми. Можно прикреплять файлы, перетаскивая их в окно сообщения.

Максимально разрешённый размер вложения: 15 МБ.

Имя файла:

Комментарий к файлу:

Имя файла	Комментарий к файлу	Размер	Статус

Похожие темы

Ответы

Просмотры

Последнее сообщение

Сгруппируйте по столбцу и получите три наиболее частых значения из другого столбца в виде строки, разделенной запятыми

Последнее сообщение Anonymous « 26 сен 2024, 06:27
Добавлено в форуме Python

Anonymous » 26 сен 2024, 06:27 » в форуме Python

Есть фрейм данных со столбцами район, тип преступления, дата, месяц
df = spark.createDataFrame(
,
)

Необходимо получить список топ-3 наиболее частых типов преступлений для каждого района (в виде строки через запятую) и медианное (не среднее!)...

0 Ответы

22 Просмотры

Последнее сообщение Anonymous
26 сен 2024, 06:27
Возврат строки двумерного массива в виде строки, разделенной запятыми, по заданному номеру строки

Последнее сообщение Anonymous « 02 ноя 2024, 20:29
Добавлено в форуме JAVA

Anonymous » 02 ноя 2024, 20:29 » в форуме JAVA

Я попытался создать функцию, которая будет принимать номер строки двумерного массива как целое число и возвращать строку, содержащую список значений в этой строке, разделенных запятыми.

this.desks — это двумерный массив, содержащий строковые...

0 Ответы

31 Просмотры

Последнее сообщение Anonymous
02 ноя 2024, 20:29
Сгруппируйте строки 2d-массива по столбцу и создайте подмассив из другого столбца внутри каждой группы [дубликат]

Последнее сообщение Anonymous « 28 окт 2024, 21:54
Добавлено в форуме Php

Anonymous » 28 окт 2024, 21:54 » в форуме Php

Я использую функцию PHP glob для получения изображений в подкаталогах, и я не знаю, сколько файлов существует в каждом каталоге.

имя каталога id и я хочу классифицировать все изображения в каталогах в один массив

$arr = [];
$dir =...

0 Ответы

17 Просмотры

Последнее сообщение Anonymous
28 окт 2024, 21:54
Сгруппируйте данные строки из 2d-массива по одному столбцу и создайте подмассив из другого столбца [дубликат]

Последнее сообщение Anonymous « 01 ноя 2024, 10:44
Добавлено в форуме Php

Anonymous » 01 ноя 2024, 10:44 » в форуме Php

Как сгруппировать значения внутри массива и, например, я хочу получить это вот так

=>array(
=> 1
=> array(2500,200,5000,400)
)
=>array(
=> 2
=> array(4500,500,5000,400)
)

Подробнее здесь:

0 Ответы

14 Просмотры

Последнее сообщение Anonymous
01 ноя 2024, 10:44
Получите значения без суффикса в скобках из строки, разделенной запятыми.

Последнее сообщение Anonymous « 26 ноя 2024, 14:42
Добавлено в форуме Php

Anonymous » 26 ноя 2024, 14:42 » в форуме Php

Как бы мне разделить приведенное ниже, чтобы все «что-то» хранилось в массиве?
$string = something here (9), something here2 (20), something3 (30) ;

Желаемый результат:
$something_array = array(
=> something
=> something2
=> something3 )

По...

0 Ответы

7 Просмотры

Последнее сообщение Anonymous
26 ноя 2024, 14:42

Вернуться в «Python»