Данные: мой общий доступ к Baidu
Таблица значений RMSE для разных комбинаций iterations и K:
iterations, K | Значение RMSE |
---|---|
3, 20 | 0,6498 |
4, 30 | 0,6295 |
5, 50 | 0,5757 |
6, 70 | 0,5883 |
8, 100 | 0,6032 |
Основная идея алгоритма заключается в следующем:
Когда пользователь u оценивает фильм p, это вызывает обновление результатов рекомендаций для пользователя u. Поскольку пользователь u оценил фильм p, то для него изменятся степени рекомендации наиболее похожих фильмов. Поэтому выбираются K фильмов, наиболее похожих на p, в качестве кандидатов. Каждый кандидат получает вес в соответствии с «приоритетом рекомендаций», который служит мерой того, насколько этот фильм подходит для рекомендации пользователю u. Эти фильмы вычисляют свой приоритет рекомендаций на основе последних оценок пользователя u, а затем объединяются и заменяются на предыдущие результаты рекомендаций.
Примечание: поскольку невозможно напрямую вычислить сходство между фильмами в данных Netflix Prize, здесь используется алгоритм ALS для вычисления косинусного сходства между предметами в матрице товаров. Подробности см. в документации Doc.
Конкретная реализация алгоритма описана в документе в каталоге Doc.
Выбрана длительность пакета batchDuration = 2 секунды.
Количество оценок | Время отклика системы рекомендаций |
---|---|
1000 | Менее 2 секунд |
5000 | Менее 3 секунд |
10 000 | Менее 4 секунд |
30 000 | Около 5 секунд |
50 000 | Примерно 6 секунд |
Результаты тестов сведены в следующую таблицу:
a. Скорость 500 оценок в секунду:
Ось X не имеет математического значения, а служит идентификатором каждой оценки. Ось Y показывает время отклика для соответствующей оценки в секундах. При скорости 500 оценок в секунду производительность системы рекомендаций хорошая, и даже самые медленные рекомендации выполняются менее чем за 6 секунд.
b. Скорость 1000 оценок в секунду:
Смысл осей X и Y такой же, как и в предыдущем случае. При скорости 1000 оценок в секунду производительность системы рекомендаций остаётся хорошей, и даже самые медленные рекомендации завершаются менее чем за 6 секунд. Это аналогично ситуации со скоростью 500 оценок в секунду.
c. Скорость 1500 оценок в секунду:
d. Скорость 2000 оценок в секунду:
e. Скорость 2500 оценок в секунду:
f. Скорость 3000 оценок в секунду:
При скорости 2500 оценок в секунду и выше производительность системы начинает снижаться из-за накопления данных. Когда поступают новые данные, старые данные ещё обрабатываются, что приводит к накоплению новых данных и увеличению времени отклика. Можно видеть, что в течение одной минуты время отклика постепенно увеличивается до 20 секунд. Можно ожидать, что при скорости 2500 оценок/с и более время отклика будет увеличиваться по мере увеличения продолжительности сохранения этой скорости.
Вы можете оставить комментарий после Вход в систему
Неприемлемый контент может быть отображен здесь и не будет показан на странице. Вы можете проверить и изменить его с помощью соответствующей функции редактирования.
Если вы подтверждаете, что содержание не содержит непристойной лексики/перенаправления на рекламу/насилия/вульгарной порнографии/нарушений/пиратства/ложного/незначительного или незаконного контента, связанного с национальными законами и предписаниями, вы можете нажать «Отправить» для подачи апелляции, и мы обработаем ее как можно скорее.
Комментарии ( 0 )