Как правильно использовать XGBoost для прогнозирования отношения рисков?Python

Программы на Python
Ответить
Anonymous
 Как правильно использовать XGBoost для прогнозирования отношения рисков?

Сообщение Anonymous »

У меня следующая ситуация: каждому пациенту сопоставлена ​​матрица признаков NxD, где N может варьироваться в зависимости от пациента. Каждый пациент также связан с одним событием времени и выживания. Я хочу использовать модель XGBoost для прогнозирования коэффициента риска, поэтому я использую цель «выживание: рулевое управление». Я вижу здесь этот урок, где похоже, что они подают цензуру (независимо от того, произошло ли событие или нет для данного пациента) в виде «sample_weight». С другой стороны, я вижу здесь, что здесь говорится: «Регрессия Кокса для данных о времени выживания, подвергнутых цензуре справа (отрицательные значения считаются цензурированными справа)».
Основываясь на этом, у меня есть несколько дополнительных вопросов:
  • Какой из этих методов правильный? Для пациентов, у которых не было события, должен ли я сделать их время выживания отрицательным или мне следует установить вес равным 0?
  • Если я установлю вес равным 0, я просто полностью игнорирую этих пациентов, т.е. они вообще не участвуют в обучении?
  • Как мне относиться к тому факту, что каждый пациент связан с переменным количеством векторов признаков, а не только с 1, что означает, что пациент с большим количеством векторов может доминировать в обучении установить? Нужно ли мне корректировать вес, чтобы учесть это?
Заранее спасибо, дайте мне знать, если я смогу что-то уточнить!

Подробнее здесь: https://stackoverflow.com/questions/798 ... prediction
Ответить

Быстрый ответ

Изменение регистра текста: 
Смайлики
:) :( :oops: :roll: :wink: :muza: :clever: :sorry: :angel: :read: *x)
Ещё смайлики…
   
К этому ответу прикреплено по крайней мере одно вложение.

Если вы не хотите добавлять вложения, оставьте поля пустыми.

Максимально разрешённый размер вложения: 15 МБ.

Вернуться в «Python»