Я пытаюсь создать функцию, которая перебирает полный список фильмов и прогнозирует их значение рейтинга по идентификатору пользователя, который определяется при вызове функции.
Это для Python3 с библиотекой сюрприз и алгоритмом SVD. Набор данных взят из MovieLens с открытым исходным кодом: ссылка на набор данных
Код: Выделить всё
from surprise import Dataset
from surprise import Reader
from surprise import SVD
import pandas as pd
reader = Reader(line_format='user item rating timestamp', sep='\t')
data = Dataset.load_from_file('./dataset/ml-100k/u.data', reader=reader)
movies = pd.read_csv('./dataset/ml-100k/u.item',sep='|', encoding='latin-1', usecols=[0,1], names=['iid', 'name'])
algorithm = SVD()
trainset = data.build_full_trainset()
algorithm.fit(trainset)
def prediction(uid):
ratings=[]
for iid in movies['iid']:
pred = algorithm.predict(uid, iid)
ratings.append(pred[3])
return ratings
prediction(321)
Код: Выделить всё
[3.52986,
3.69845,
2.98954,
3.00545,
3.84254,
...]
Код: Выделить всё
[3.52986,
3.52986,
3.52986,
3.52986,
3.52986,
3.52986,
3.52986,
3.52986,
...]
РЕДАКТИРОВАТЬ: как было предложено, я добавил print(iid) внутри цикла, и он выполняет итерацию правильно, печатая все iids. Но внутри строки pred = алгоритм.predict(uid, iid) это не работает
Подробнее здесь: https://stackoverflow.com/questions/578 ... -in-python
Мобильная версия