Код: Выделить всё
| geo_area |Total | 2-5km|5-10km|
|------------|------| ----| -----|
| E02000001 | 5378 | 385 | 241|
| E02000002 | 3238 | 474 |394 |
| E02000003 | 5238 | 603 | 541|
| E02000004 | 3113 | 354 |277 |
| E02000005 | 4862 | 684 | 532|
| E02000006 | 4271 | 676 |408 |
Значения столбцов 2–5 км и 5–10 км — это частоты.
Я хотел бы определить среднее и медианное расстояние, пройденное для каждой географической области?
Я не слишком уверен, правильно ли это, но для медианы я написал следующее определение:
Код: Выделить всё
def median_calculator(df):
full_list_of_numbers = []
for col in df.columns:
full_list_of_numbers.append(((df[col].cumsum() - (df[col].sum(axis=0)/2).T) < 0).sum())
return full_list_of_numbers
Здесь это ссылка на данные, если кому-то интересно:
Это файл census2021-ts058-msoa в zip-файле (TS058 Расстояние, пройденное до работы в разделе «Работа и путешествия».
Я очень ценю помощь.
Подробнее здесь: https://stackoverflow.com/questions/782 ... ing-python