NAVER AI Tech(87)
-
Sequential Recommendation
Sequential Recommendation: 구매 이력 순서에 따른 추천 시스템 Markov Chain 기반 연구 - Markov Chain이란? chain rule에서 다음 사건은 그 직전의 사건에 대해서만 영향을 받고 그 이전과는 독립이라는 가정. Factorized Personalized Markov Chains(FPMC, Rendle et al., 2010) - 해당 유저가 직전에 구매한, 혹은 검색한 아이템만을 고려하면 된다는 아이디어. Personalized Ranking Metric Embedding(PRME, Feng et al., 2015) - 직전에 검색한 아이템과의 compatibility를 inner product(FPMC 방식)이 아닌 Euclidean distance를 사용함..
2024.02.23 -
Using temporal dynamics for Recommend System
Temporal dynamics 예시 - 특정 상품에 대한 평가가 시간에 따라 달라짐 - 계절이나 요일,주,월 단위의 주기성이 평가에 영향을 미침 - 사용자의 취향 또한 시간에 따라 바뀔 수 있음 - User Interface의 변화에 따라 평가가 달라지기도 함 AutoRegression이란? - 스스로 회귀. 즉 자기 자신의 과거 데이터 기반으로 미래를 예측하는 자동회귀를 의미한다. - 이때 MSE를 평가지표로 사용하지만 최근 K개의 데이터에 대해서만 MSE를 구한다면 이동 평균(Moving Average)라고 한다. Moving Average 또한 단순 평균으로 구하는 방법(MSE)와 Weighted MSE를 구하는 방법 등 여러가지가 존재할 수 있다. 시간이 지남에 따라 사용자의 취향이나 의견이 변..
2024.02.23 -
Using High-dimensional Side-information for Recommend System(text, image, audio data)
Using text data Collaborative Deep Learning(CDL, Wang et al. 2015) - textual content를 활용한 Top-K Ranking 추천 모델 - Matrix Factorization + Stacked Denoising Autoencdoer(SDAE)를 사용. **SDAE란 autoencoder를 여러 층 stack 형태로 쌓고, input에 noise를 추가하여 denoise model 모델을 만듦을 목표로 함. Using Visual data Visual BPR(VBPR, He and McAuley, 2016) - item의 visual content를 활용한 모델 - pretrained CNN 모델을 활용하여 item의 visual feature..
2024.02.22 -
Using side-information for Recommend System
Collaborative Filtering : user-item interaction data만을 활용하여 추천을 수행. 한계점 두가지 - Cold-start problem : interaction data가 충분하지 않은 경우 - Temporal evolution : 시간의 흐름에 따른 사용자 선호도 및 아이템 특성의 변화를 반영하지 못함 **Cold-start problem 이란 interaction 정보가 매우 적거나 존재하지 않는 아이템이나 사용자에게 올바른 추천을 제공하기 어려운 상황을 의미 - Content-based methods(사용자 혹은 아이템의 side-information)을 활용하여 cold-start problem 완화 가능. - 예를 들면 해당 유저와 비슷한 군집의 유저가 좋아..
2024.02.22 -
Deep Learning for CF
딥러닝 장점 1. Nonlinear Transformation : activate function(ReLU, Sigmoid, Tanh) 2. Representation Learning : No feature Engineering and Heterogeneous contents(multi-modality) 3. Sequence Modeling 4. Flexibility 딥러닝 단점 1. Interpretability 2. Data Requirement(need too large data amout) 3. Extensive Hyperparameter Tuning AutoEncoder CF - user-item matrix제작(rating 표시 등, Top-K의 경우 interaction을 발생할 확률을 입력..
2024.01.31 -
Collaborative Filtering
CF(Collaborative Filtering) : matrix completion task. - 단, sparse matrix를 다루기 위한 추가적인 방법이 필요하긴 함. Memory-based CF : 사용자 또는 아이템간 유사도를 바탕으로 rating prediction 또는 top-K ranking에 활용. - 유사도 지표로는 Jaccard, Cosine, Pearson 등이 있다. - item to item CF / user to user CF 등 상품끼리 혹은 유저끼리 유사도를 비교. **아마존에서 발표한 Two Decades of Recommender Systems at Amazon.com, Simth and Linden,2017 논문을 살펴보자. 현재까지도 Memory-based CF 모..
2024.01.31