У меня следующая ситуация: каждому пациенту сопоставлена матрица признаков NxD, где N может варьироваться в зависимости от пациента. Каждый пациент также связан с одним событием времени и выживания. Я хочу использовать модель XGBoost для прогнозирования коэффициента риска, поэтому я использую цель «выживание: рулевое управление». Я вижу здесь этот урок, где похоже, что они подают цензуру (независимо от того, произошло ли событие или нет для данного пациента) в виде «sample_weight». С другой стороны, я вижу здесь, что здесь говорится: «Регрессия Кокса для данных о времени выживания, подвергнутых цензуре справа (отрицательные значения считаются цензурированными справа)».
Основываясь на этом, у меня есть несколько дополнительных вопросов:
Какой из этих методов правильный? Для пациентов, у которых не было события, должен ли я сделать их время выживания отрицательным или мне следует установить вес равным 0?
Если я установлю вес равным 0, я просто полностью игнорирую этих пациентов, т.е. они вообще не участвуют в обучении?
Как мне относиться к тому факту, что каждый пациент связан с переменным количеством векторов признаков, а не только с 1, что означает, что пациент с большим количеством векторов может доминировать в обучении установить? Нужно ли мне корректировать вес, чтобы учесть это?
Заранее спасибо, дайте мне знать, если я смогу что-то уточнить!
У меня следующая ситуация: каждому пациенту сопоставлена матрица признаков NxD, где N может варьироваться в зависимости от пациента. Каждый пациент также связан с одним событием времени и выживания. Я хочу использовать модель XGBoost для прогнозирования коэффициента риска, поэтому я использую цель «выживание: рулевое управление». Я вижу здесь этот урок, где похоже, что они подают цензуру (независимо от того, произошло ли событие или нет для данного пациента) в виде «sample_weight». С другой стороны, я вижу здесь, что здесь говорится: «Регрессия Кокса для данных о времени выживания, подвергнутых цензуре справа (отрицательные значения считаются цензурированными справа)». Основываясь на этом, у меня есть несколько дополнительных вопросов: [list] [*]Какой из этих методов правильный? Для пациентов, у которых не было события, должен ли я сделать их время выживания отрицательным или мне следует установить вес равным 0? [*]Если я установлю вес равным 0, я просто полностью игнорирую этих пациентов, т.е. они вообще не участвуют в обучении? [*]Как мне относиться к тому факту, что каждый пациент связан с переменным количеством векторов признаков, а не только с 1, что означает, что пациент с большим количеством векторов может доминировать в обучении установить? Нужно ли мне корректировать вес, чтобы учесть это? [/list] Заранее спасибо, дайте мне знать, если я смогу что-то уточнить!