У меня есть рамка данных, где я хочу вернуть число (доля) пациентов, у которых было последующее наблюдение после диагноза отделов заболеваний. < /p>
Пример; Пациент может иметь diag_yn в нескольких отделениях, но я хочу проверить, у пациента был следующий, как раньше, но для каждого отдела.
Таким образом, пациент 1 был записан дважды в примере, 1 для радиологии и снова для дыхания, поскольку он имел последующее приложение для обоих отделов.
Оригинальный DF
.dept | patient_id | app_date | diag_date | diag_yn |
|------------|------------|------------|------------|-----------|
Radiology | 1 | 2024-01-11 | NaT | NaN |
Radiology | 1 | 2024-03-14 | 2024-03-14 | 1 |
Radiology | 1 | 2024-04-09 | NaT | NaN |
Radiology | 1 | 2024-09-09 | NaT | NaN |
Respiratory | 1 | 2024-02-11 | NaT | NaN |
Respiratory | 1 | 2024-04-14 | 2024-04-14 | 1 |
Respiratory | 1 | 2024-06-09 | NaT | NaN |
Respiratory | 1 | 2024-09-09 | NaT | NaN |
Respiratory | 2 | 2024-01-11 | NaT | NaN |
Respiratory | 2 | 2024-03-14 | 2024-03-14 | 1 |
Respiratory | 2 | 2024-04-09 | NaT | NaN |
Respiratory | 2 | 2024-09-09 | NaT | NaN |
< /code>
желаемый вывод < /p>
dept | patient_with_fup | count |
Radiology |------------------|-------|
| 1 | 1 |
| 0 | 0 |
Respiratory |------------------|-------|
| 1 | 2 |
| 0 | 0 |
было предоставлено следующий код, но перед DEPT столбец был добавлен в DF.
(df.groupby('patient_id')
.apply(lambda g: g['app_date'].gt(next(iter(g['diag_date'].dropna()),
pd.NaT)).any(),
include_groups=False)
.astype(int).value_counts()
.reindex([0, 1], fill_value=0).rename_axis('fup_yn')
.reset_index()
)
Подробнее здесь: https://stackoverflow.com/questions/791 ... s-to-check
Несколько групп и агрегации после получения последующих значений дат для проверки условия ⇐ Python
-
- Похожие темы
- Ответы
- Просмотры
- Последнее сообщение