Как найти среднее и медиану таблицы частот с помощью PythonPython

Программы на Python
Ответить Пред. темаСлед. тема
Гость
 Как найти среднее и медиану таблицы частот с помощью Python

Сообщение Гость »

Я новичок в анализе данных Python и работаю над данными переписи населения, вот пример данных

Код: Выделить всё

| geo_area   |Total | 2-5km|5-10km|
|------------|------| ----| -----|
| E02000001  | 5378 | 385 | 241|
| E02000002  | 3238 | 474 |394 |
| E02000003  | 5238 | 603 | 541|
| E02000004  | 3113 | 354 |277 |
| E02000005  | 4862 | 684 | 532|
| E02000006  | 4271 | 676 |408 |
Где в первом столбце указана географическая область, во втором — общее расстояние, пройденное до работы, а в остальных столбцах — расстояния от 2–5 км до 5–10 км. Остальные колонки (10-20 км, 20-30 км, 30-40 км, 40-60 км, свыше 60 км и, наконец, 0 км (работа из дома) я исключил, потому что они были слишком длинными. Также я показал только 6 строк, но данные содержат более 7000 строк.
Значения столбцов 2–5 км и 5–10 км — это частоты.
Я хотел бы определить среднее и медианное расстояние, пройденное для каждой географической области?
Я не слишком уверен, правильно ли это, но для медианы я написал следующее определение:

Код: Выделить всё

def median_calculator(df):
full_list_of_numbers = []
for col in df.columns:
full_list_of_numbers.append(((df[col].cumsum() - (df[col].sum(axis=0)/2).T) < 0).sum())
return full_list_of_numbers
Я затрудняюсь с расчетом среднего значения и даже не знаю, правильно ли применяется приведенная выше медиана. Кроме того, могу ли я использовать df.groupby('geographical_areas').agg({mean_distance: 'mean, 'median_distance:'median}) или это неверно?
Здесь это ссылка на данные, если кому-то интересно:
Это файл census2021-ts058-msoa в zip-файле (TS058 Расстояние, пройденное до работы в разделе «Работа и путешествия».
Я очень ценю помощь.

Подробнее здесь: https://stackoverflow.com/questions/782 ... ing-python
Реклама
Ответить Пред. темаСлед. тема

Быстрый ответ

Изменение регистра текста: 
Смайлики
:) :( :oops: :roll: :wink: :muza: :clever: :sorry: :angel: :read: *x)
Ещё смайлики…
   
К этому ответу прикреплено по крайней мере одно вложение.

Если вы не хотите добавлять вложения, оставьте поля пустыми.

Максимально разрешённый размер вложения: 15 МБ.

  • Похожие темы
    Ответы
    Просмотры
    Последнее сообщение
  • Создание таблицы распределения частот в Python
    Anonymous » » в форуме Python
    0 Ответы
    19 Просмотры
    Последнее сообщение Anonymous
  • Java: создание таблицы частот для целых чисел, случайно сгенерированных и помещенных в массив.
    Anonymous » » в форуме JAVA
    0 Ответы
    15 Просмотры
    Последнее сообщение Anonymous
  • Java: создание таблицы частот для целых чисел, случайно сгенерированных и помещенных в массив.
    Anonymous » » в форуме JAVA
    0 Ответы
    13 Просмотры
    Последнее сообщение Anonymous
  • Как мне найти медиану пяти переменных в Python?
    Anonymous » » в форуме Python
    0 Ответы
    6 Просмотры
    Последнее сообщение Anonymous
  • Самый эффективный способ найти медиану трех целых чисел
    Anonymous » » в форуме C#
    0 Ответы
    15 Просмотры
    Последнее сообщение Anonymous

Вернуться в «Python»