У меня есть два классификатора для набора мультимедийных данных. Один для визуального материала и один для текстового материала. Я хочу объединить предсказания этих классификаторов, чтобы сделать окончательный прогноз. Я читал о сборах, усилении и складывании ансамблей, и все они кажутся полезными, и я хотел бы их попробовать. Однако мне кажется, что я нашел только теоретические примеры для моей конкретной проблемы, ничего конкретного, чтобы понять, как ее реализовать на самом деле (на Python с scikit-learn). Оба моих классификатора используют 10 KFold CV с классификацией SVM. Оба выводят список из n_samples = 1000 с прогнозами (1 или 0). Кроме того, я заставил их обоих составить список вероятностей, на которых основаны прогнозы, выглядящий следующим образом:
Код: Выделить всё
[[ 0.96761819 0.03238181]
[ 0.96761819 0.03238181]
....
[ 0.96761819 0.03238181]
[ 0.96761819 0.03238181]]
Как бы мне объединить их в ансамбль? Что мне следует использовать в качестве входных данных? Я попытался объединить прогнозы меток по горизонтали и ввести их как функции, но безуспешно (то же самое и с вероятностями).
Подробнее здесь:
https://stackoverflow.com/questions/309 ... lassifiers