Алгоритм ALS Spark MLlib — Как мне получить свои собственные «Личные рекомендации» (рейтинги фильмов, которые я не оцени

Алгоритм ALS Spark MLlib — Как мне получить свои собственные «Личные рекомендации» (рейтинги фильмов, которые я не оцени ⇐ Python

1 сообщение • Страница 1 из 1

Anonymous

Алгоритм ALS Spark MLlib — Как мне получить свои собственные «Личные рекомендации» (рейтинги фильмов, которые я не оцени

Цитата

Сообщение Anonymous » 25 окт 2024, 09:25

Я использую PySpark в Azure Databricks. Я использовал алгоритм ALS библиотеки Sparks MLlib для прогнозирования рейтингов фильмов, который успешно работает. Однако я пытаюсь добавить фрейм данных, состоящий из моих оценок для 10 случайно выбранных фильмов. Когда я это делаю, я получаю рейтинги прогнозов только для фильмов, которые я уже оценил.

Я хочу иметь возможность использовать эту модель для получения рекомендаций на основе их рейтинга.

У меня есть Spark Код, выполняющий следующие задачи:

Импортирует данные (RatingsSmall, MoviesSmall, RatingsLarge, Movies Large)
Объединить маленькие рейтинги с маленькими фильмами, объединить большие рейтинги с большими фильмами
Добавить вместе к двум новым наборам данных< /p>
Удалить ненужные столбцы «Отметка времени» и «Жанр»

Теперь у меня есть чистая таблица с MovieID, названием (названием фильма), UserID и рейтингом. Я покажу код с этого момента. Если вам нужен код до этого, я тоже могу его отправить.

Разделение данных на обучающий и тестовый наборы (0.80) , 0,20)
Алгоритм ALS
Отображение прогнозов.

Надеюсь, приведенное выше поможет вам разобраться в прикрепленном мною коде.
Я получаю прогнозы только для уже отправленных рейтингов.< /p>

Я попытался объединить свои рейтинги с обучающим набором. Отсюда я хотел бы получить рекомендации или прогнозы для других фильмов в наборе данных.

Моя попытка:
импортировал DF с моим собственным рейтингом.
Добавил это (UnionAll) в обучающий набор.
Получил прогнозы (но только для фильмов, которые я уже оценил)

код:

Код: Выделить всё

#Split dataset

training, test = All_Movies.randomSplit([0.8, 0.2])
from pyspark.ml.recommendation import ALS

from pyspark.ml.evaluation import RegressionEvaluator

#Set up model

ALS = ALS(maxIter=10, regParam=0.01, userCol = "userId",itemCol="movieId", ratingCol="rating",  coldStartStrategy="drop")

#Fit model to Training set and attach personal recomendations

model = ALS.fit(training.unionAll(PersonalDF)) #PersonalDF is my rankings

#Get Predictions for Test Set
predictions = model.transform(test).dropna()

#All good up until here.

#Trying to get prediction rankings for my movies
mySampledMovies = model.transform(PersonalDF)
mySampledMovies.registerTempTable("mySampledMovies")

display(sqlContext.sql("select userId, movieId, rating,title, prediction from mySampledMovies"))

Я ожидаю DataFrame, в котором указаны мой идентификатор пользователя, MovieID, рейтинг и прогноз. Для фильмов, которые я не видел, рейтинг должен быть N/A или Null, а прогнозы имеют значение.

Большое спасибо

Подробнее здесь: https://stackoverflow.com/questions/545 ... tions-rank

1729837547

Anonymous

Я использую PySpark в Azure Databricks. Я использовал алгоритм ALS библиотеки Sparks MLlib для прогнозирования рейтингов фильмов, который успешно работает. Однако я пытаюсь добавить фрейм данных, состоящий из моих оценок для 10 случайно выбранных фильмов. Когда я это делаю, я получаю рейтинги прогнозов только для фильмов, которые я уже оценил. 

Я хочу иметь возможность использовать эту модель для получения рекомендаций на основе их рейтинга.

У меня есть Spark Код, выполняющий следующие задачи:

[list]
[*]Импортирует данные (RatingsSmall, MoviesSmall, RatingsLarge, Movies Large)
Объединить маленькие рейтинги с маленькими фильмами, объединить большие рейтинги с большими фильмами
[*]Добавить вместе к двум новым наборам данных< /p>
[*]Удалить ненужные столбцы «Отметка времени» и «Жанр»
[/list]

Теперь у меня есть чистая таблица с MovieID, названием (названием фильма), UserID и рейтингом. Я покажу код с этого момента. Если вам нужен код до этого, я тоже могу его отправить.

[list]
[*]Разделение данных на обучающий и тестовый наборы (0.80) , 0,20)
[*]Алгоритм ALS
Отображение прогнозов.
[/list]

Надеюсь, приведенное выше поможет вам разобраться в прикрепленном мною коде.
Я получаю прогнозы только для уже отправленных рейтингов.< /p>

Я попытался объединить свои рейтинги с обучающим набором.  Отсюда я хотел бы получить рекомендации или прогнозы для других фильмов в наборе данных.

Моя попытка:
импортировал DF с моим собственным рейтингом.
Добавил это (UnionAll) в обучающий набор.
Получил прогнозы (но только для фильмов, которые я уже оценил)

код:
[code]#Split dataset

training, test = All_Movies.randomSplit([0.8, 0.2])
from pyspark.ml.recommendation import ALS

from pyspark.ml.evaluation import RegressionEvaluator

#Set up model

ALS = ALS(maxIter=10, regParam=0.01, userCol = "userId",itemCol="movieId", ratingCol="rating",  coldStartStrategy="drop")

#Fit model to Training set and attach personal recomendations

model = ALS.fit(training.unionAll(PersonalDF)) #PersonalDF is my rankings

#Get Predictions for Test Set
predictions = model.transform(test).dropna()

#All good up until here.

#Trying to get prediction rankings for my movies
mySampledMovies = model.transform(PersonalDF)
mySampledMovies.registerTempTable("mySampledMovies")

display(sqlContext.sql("select userId, movieId, rating,title, prediction from mySampledMovies"))
[/code]

Я ожидаю DataFrame, в котором указаны мой идентификатор пользователя, MovieID, рейтинг и прогноз. Для фильмов, которые я не видел, рейтинг должен быть N/A или Null, а прогнозы имеют значение.

Большое спасибо 

Подробнее здесь: [url]https://stackoverflow.com/questions/54592009/als-algorithm-spark-mllib-how-do-i-get-my-own-personal-recomendations-rank[/url]

Ответить Пред. тема След. тема

1 сообщение • Страница 1 из 1

Быстрый ответ

Заголовок:

Имя пользователя:

Изменение регистра текста:

Смайлики

Ещё смайлики…

К этому ответу прикреплено по крайней мере одно вложение.

Если вы не хотите добавлять вложения, оставьте поля пустыми. Можно прикреплять файлы, перетаскивая их в окно сообщения.

Максимально разрешённый размер вложения: 15 МБ.

Имя файла:

Комментарий к файлу:

Имя файла	Комментарий к файлу	Размер	Статус

Похожие темы

Ответы

Просмотры

Последнее сообщение

PHP Domdocument/xpath Не извлечение данных фильмов со страницы фильмов Paytm

Последнее сообщение Anonymous « 15 апр 2025, 10:01
Добавлено в форуме Php

Anonymous » 15 апр 2025, 10:01 » в форуме Php

Я пытаюсь очистить детали фильма (имя, жанр и т. Д.) Из фильмов Paytm Coimbatore с использованием PHP Domdocument и XPath. В то время как мой код успешно получает HTML, он не может извлечь текстовый контент из карт фильмов.
{ @context : Bad Ugly ,...

0 Ответы

9 Просмотры

Последнее сообщение Anonymous
15 апр 2025, 10:01
PHP Domdocument/xpath Не извлечение данных фильмов со страницы фильмов Paytm

Последнее сообщение Anonymous « 15 апр 2025, 10:31
Добавлено в форуме Php

Anonymous » 15 апр 2025, 10:31 » в форуме Php

Я пытаюсь очистить детали фильма (имя, жанр и т. Д.) Из фильмов Paytm Coimbatore с использованием PHP Domdocument и XPath. В то время как мой код успешно получает HTML, он не может извлечь текстовый контент из карт фильмов.
{ @context : Bad Ugly ,...

0 Ответы

6 Просмотры

Последнее сообщение Anonymous
15 апр 2025, 10:31
Как создать функцию бронирования фильмов для добавления фильмов в раздел, а затем удалить из раздела (не разрешен JavaSc

Последнее сообщение Anonymous « 24 май 2025, 13:51
Добавлено в форуме Python

Anonymous » 24 май 2025, 13:51 » в форуме Python

Для моего задания мне нужно создать функцию, в которой люди могут добавлять разные фильмы в раздел бронирования (браузер не нужно хранить информацию в системе, просто визуально). Для этого нам разрешено использовать только Brython, HTML, CSS и VUE...

0 Ответы

7 Просмотры

Последнее сообщение Anonymous
24 май 2025, 13:51
Как создать функцию бронирования фильмов для добавления фильмов в раздел, а затем удалить из раздела (не разрешен JavaSc

Последнее сообщение Anonymous « 24 май 2025, 13:51
Добавлено в форуме Html

Anonymous » 24 май 2025, 13:51 » в форуме Html

Для моего задания мне нужно создать функцию, в которой люди могут добавлять разные фильмы в раздел бронирования (браузер не нужно хранить информацию в системе, просто визуально). Для этого нам разрешено использовать только Brython, HTML, CSS и VUE...

0 Ответы

13 Просмотры

Последнее сообщение Anonymous
24 май 2025, 13:51
Сохранение модели Mllib Spark с использованием каталога данных KEDro

Последнее сообщение Anonymous « 30 июн 2025, 21:50
Добавлено в форуме Python

Anonymous » 30 июн 2025, 21:50 » в форуме Python

Рассмотрим модель, которая обучена этому экзамену в документации Кедро
from typing import Any, Dict

from kedro.pipeline import node, pipeline
from pyspark.ml.classification import RandomForestClassifier
from pyspark.sql import DataFrame

def...

0 Ответы

2 Просмотры

Последнее сообщение Anonymous
30 июн 2025, 21:50

Вернуться в «Python»