10. Item2Vec

2023. 11. 30. 12:34NAVER AI Tech/Recommen System

Skip-Gram with Negative Sampling(SGNS)에 영감을 받은 방법론.

유저가 소비한 아이템 리스트는 문장

소비한 아이템은 단어로 가정하여 Word2Vec 사용

- 식별자 feature를 사용하지 않기 때문에 유저 식별 없이 세션 단위로도 데이터 생성 가능

- SVD기반 MF를 사용한 Item-Based Collaborative Filtering 보다 Word2Vec를 사용하는 것이 더 높은 성능을 보임.

 

아이템 리스트에는 순서가 상관없으므로 집합으로 간주(=시간적, 공간적 특성 고려하지 않음)

 

**t-SNE는 고차원 데이터를 2차원으로 축소시켜 시각화를 진행할 때 사용하는 기법

 

ex) spotify에서 플레이리스트는 문장, 각각 노래들은 아이템이라고 볼 수 있다.