Сгруппируйте по столбцу и получите три наиболее частых значения из другого столбца в виде строки, разделенной запятымиPython

Программы на Python
Ответить Пред. темаСлед. тема
Anonymous
 Сгруппируйте по столбцу и получите три наиболее частых значения из другого столбца в виде строки, разделенной запятыми

Сообщение Anonymous »

Есть фрейм данных со столбцами район, тип преступления, дата, месяц

Код: Выделить всё

df = spark.createDataFrame(
[('D1', 'ROBBERY', '2024-02-01', 2),
('D1', 'ROBBERY', '2024-02-01', 2),
('D1', 'DRUGS', '2024-03-05', 3),
('D1', 'FRAUD', '2024-03-05', 3),
('D1', 'AUTO THEFT', '2024-01-09',1),
('D1', 'AUTO THEFT', '2024-01-03', 1),
('D2', 'MURDER', '2024-05-04', 5),
('D2', 'MURDER', '2024-06-01', 6),
('D2', 'RAPE', '2024-07-02', 7)],
['district', 'crime_type', 'date', 'month'])
Необходимо получить список топ-3 наиболее частых типов преступлений для каждого района (в виде строки через запятую) и медианное (не среднее!) значение количества преступлений по месяцам. столбец для этого округа.
Результатом должен стать новый фрейм данных с тремя столбцами: District, top_3_crime_types, median_crimes_monthly:



район
top_3_crime_types
median_crimes_monthly




D1
ограбление, угон авто, наркотики
2

< tr>
D2
УБИЙСТВО, ИЗНАСИЛОВАНИЕ
1




Подробнее здесь: https://stackoverflow.com/questions/790 ... n-as-comma
Реклама
Ответить Пред. темаСлед. тема

Быстрый ответ

Изменение регистра текста: 
Смайлики
:) :( :oops: :roll: :wink: :muza: :clever: :sorry: :angel: :read: *x)
Ещё смайлики…
   
К этому ответу прикреплено по крайней мере одно вложение.

Если вы не хотите добавлять вложения, оставьте поля пустыми.

Максимально разрешённый размер вложения: 15 МБ.

  • Похожие темы
    Ответы
    Просмотры
    Последнее сообщение

Вернуться в «Python»