AIFFEL Life

[Day18] 넷플릭스 추천 알고리즘을 만들어 볼까?

nevermet 2020. 9. 29. 17:59

오늘은 넷플릭스 영화 추천시스템과 같은 컨텐츠 추천 알고리즘에 대해 배워보았습니다. 결과적으로는 팝송을 추천해 보는 것이었죠... 컨텐츠 추천 알고리즘을 엿볼 수 있는 몇가지 자료들을 공유합니다.

 

1. 콘텐츠 추천 알고리즘의 진화 www.kocca.kr/insight/vol05/vol05_04.pdf

2. Music Recommendation Datasets for Research ocelma.net/MusicRecommendationDataset/lastfm-360K.html

 

:: Music Recommendation Datasets ::

 

ocelma.net

리눅스에서 tar.gz로 된 파일 압축 푸는 방법 잘 안외어지고 헛갈리지 않으시나요?

3. sarghis.com/blog/468/

 

리눅스 tar.gz와 압축/해제 명령어

리눅스(Linux)에서의 파일 압축 개념은 윈도우즈(Windows)에서의 파일 압축 개념에 비해 세분화 되어있다. 윈도우즈에서는 보통 압축을 한다하면, zip 등의 방식으로 선택된 파일이나 폴더들을 묶으�

sarghis.com

4. 명시적 vs. 암묵적 피드백 데이타셋 orill.tistory.com/entry/Explicit-vs-Implicit-Feedback-Datasets?category=1066301

 

Explicit vs Implicit Feedback Datasets

1. Explicit Datasets 영화 추천시스템을 만드는 상황을 생각해보겠습니다. 어떤 데이터를 사용할 수 있을까요? 가장 먼저 떠오르는 데이터는 사용자의 평점 기록 데이터입니다. 이미지 분류에 MNIST가

orill.tistory.com

추천시스템에서는 어떤 사용자가 좋아한다는 것만을 가지고 그것과 비슷한 컨텐츠만 추천해주는 데는 한계가 있고, 그 사용자가 좋아할 것을 추천해 주지 못하는 경우가 생기겠죠? 그래서 이 사용자와 비슷한 사람이 좋아하는 것을 이 사용자에게도 추천해 줄 때 이 사용자가 좋아한다고 할 확률이 높습니다.

5. Collaborative Filtering for Implicit Feedback Datasets yifanhu.net/PUB/cf.pdf

6. Recommender System — Matrix Factorization towardsdatascience.com/recommendation-system-matrix-factorization-d61978660b4b

 

Recommendation System — Matrix Factorization

Walk Through Recommender System of Matrix Factorization

towardsdatascience.com

7. scipy.sparce.csr matrix 이해하기 stackoverflow.com/questions/53254104/cant-understand-scipy-sparse-csr-matrix-example/62118005#62118005

 

can't understand scipy.sparse.csr_matrix example

I can't wrap my head around csr_matrix examples in scipy documentation: https://docs.scipy.org/doc/scipy/reference/generated/scipy.sparse.csr_matrix.html Can someone explain how this example work?...

stackoverflow.com

8. Fast Python Collaborative Filtering for Implicit Datasets. github.com/benfred/implicit

 

benfred/implicit

Fast Python Collaborative Filtering for Implicit Feedback Datasets - benfred/implicit

github.com

9. 문제점 지적: filter_already_liked_items Working for ALS? github.com/benfred/implicit/issues/365

 

filter_already_liked_items Working for ALS? · Issue #365 · benfred/implicit

I am not finding that there is any impact to the recommendations if I set filter_already_liked_items True or False. It is version '0.4.2' Its hard to create a reproducible example of this t...

github.com

10. 해결: Fix rank items in ItemItemRecommender #389 github.com/benfred/implicit/pull/389

 

Fix rank items in ItemItemRecommender by jmc-bbk · Pull Request #389 · benfred/implicit

The line liked_vector = user_items[user_id] loses information about the indices. recommendations.indices returns a vector where all elements are zero [0, 0,...,0]. This impacts the line best = sort...

github.com