5. TF-IDF를 활용한 컨텐츠 기반 추천

2023. 11. 29. 12:31NAVER AI Tech/Recommen System

컨텐츠 기반 추천 : 유저가 선호하는 아이템을 기반으로 해당 아이템과 유사한 아이템을 추천

- 추천 아이템에 대한 설명(explanation)이 가능하다.

- 그러나 아이템 heterogeneous 특성 탓에 아이템끼리 나타내는 feature 또한 다를 수 있다.

 

 

item profile

- 추천 대상이 되는 아이템을 feature로 구성시켜야 한다.(=vectorization)

- TF-IDF for text feature(Term Frequency - Inverse Document Frequency)

   

TF-IDF 공식

 

TF-IDF는 특정 아이템을 어떤 document에서 볼 것인가가 정해진다면 vectorization이 가능한 방법

 

user profile

- 유저가 정해졌으니, 과거 선호했던 item들을 TF-IDF를 통해 벡터로 표현

- 과거 n개의 item들의 벡터를 평균낼 수도, weight를 준 평균을 구해서 user를 나타낼 수도 있다.

 

이제 user vector가 구해졌으니, 두 벡터 사이의 유사도를 cosine 유사도를 이용해서 구할 수 있다.

 

1. 유저 vector와 아이템 벡터 i에 대해서 유사도를 내림차순으로 정렬하여 top K개를 추천 가능.

2. user profile을 구축하지 않고 과거 선호했던 아이템(각각)과 현재 추천하려는 아이템의 유사도를 구한 후, 이를 가중치로 활용하여 평점과 곱한 가중평균을 구한다 = 새로운 아이템에 대해 평점을 예측하는 문제.