12. Deep Learning Model with Recommend System

2023. 11. 30. 14:44NAVER AI Tech/Recommen System

딥러닝을 사용하는 이유

1. nonlinear transformation은 user-item interaction pattern을 효과적으로 모델링하여 선호도를 예측할 수 있음.

2. raw data를 feature representation을 학습하여 표현하기 때문에 사람이 직접 표현을 신경쓰지 않아도 됨.

3. sequence model : next-item prediction, session-based recommendation에 사용됨.

4. Flexibility : 이미 프레임워크가 다양하게 개발되어 있어서 메타데이터가 다양한 추천시스템에서 쉽게 응용하여 사용할 수 있다.

 

 

추천시스템에서 첫 딥러닝 모델을 사용했다는 관점에서 History를 한번 알아보자.

1. Neural Collaborative Filtering - MF의 한계를 지적하며 추천시스템에 MLP 첫 도입

    - user와 item의 복잡한 관계를 선형적으로 나타내기에는 한계가 있다.

선형적으로 관계를 표현했을 때 맞이하는 한계점.

 

user 또는 item을 latent vector로 표현한 뒤 이 둘을 concat하여 layer1을 생성.

 

 

2. Deep Neural Networks for YouTube Recommendations

    - YouTube 추천 문제 : scale(너무 많은 유저와 아이템), Freshness(새로 업데이트 된 컨텐츠), Noise(높은 Sparsity)

cadidate 조차 수백개, 수천개이기 때문에 두 module로 나누어 아키텍처를 설계하였다.

 

    1. Candidate Generation module : 결국 마지막에 softmax를 통해 다중 분류를 수행하는 모듈

        - watch vector and search vector : 과거 시청 이력과 검색 이력이 핵심.

        - demographic and geographic feature : 성별 등 인구통계학 정보와 지리적 정보를 embedding하여 feature로 사용

        - example age feature : item 생성 나이를 embedding하여 feature로 사용(freshness 제고)

        - ANN 알고리즘(tree 생성)을 통해 실시간성 확보

 

    2. Ranking module : Candidate Generation module에서 생성한 top N개의 후보군의 순서를 지정하는 모듈

        - Logistic Regression을 사용한 기본적인 방법. 랭킹 score를 구함.

        - 이때 클릭 여부가 아닌 시청 시간을 weight로 하여 반영. 예측 또한 CTR이 아닌 Expected Watch Time을 예측

        - user action features 사용. 특정 채널에서 얼마나 많은 영상을 봤는지, 특정 토픽을 본지 얼마나 지났는지 등등

        - DL 구조 보다는 도메인의 전문가 역량이 중요한 부분.

'NAVER AI Tech > Recommen System' 카테고리의 다른 글

14. Graph Neural Network with Recommend System  (0) 2023.12.04
13. Auto Encoder with Recommend System.  (0) 2023.11.30
11. Approximate Nearest Neighbor(ANN)  (0) 2023.11.30
10. Item2Vec  (0) 2023.11.30
9. Embedding  (1) 2023.11.30