В настоящее время я использую машину опорных векторов с scikit-learn, чтобы предсказать, какой товар купит пользователь, учитывая демографические данные. Набор данных также включает в себя количество пользователей определенной возрастной группы, купивших каждый товар. Выглядело это примерно так:
Код: Выделить всё
items a b c
age
15-20 10 3 10
20-25 1 5 6
25-30 2 5 6
Я не уверен, как включить это в обучающие данные, поскольку единственный способ, который я могу придумать, — это включить набор значений вероятности того, что пользователь купит товар, но это очень громоздко. Другая идея, которая у меня возникла, заключалась в том, чтобы использовать метод ансамблевого обучения и объединить SVM, возможно, с наивным байесовским классификатором.
Подробнее здесь:
https://stackoverflow.com/questions/343 ... in-sklearn