NAVER AI Tech(87)
-
추천시스템 SOTA 모델, 주요 학회, 라이브러리 및 데이터셋
Top-K Ranking 평가 지표 - Recall@K - Precision@K - MRR - NDCG@K 주요 AI 학회, Data Mining 학회 및 추천 시스템 관련 주요 컨퍼런스 - AI/ML(ICML, NeurlIPS, ICLR, AAAI, IJCAI) - Data Mining(ICDM, KDD) - CV(CVPR, ICCV, ECCV) - NLP(ACL, EMNLP, NAACL)
2024.01.31 -
'개인화'된 추천시스템
추천시스템에서 Deep Learning 발전이 타 분야에 비해 더딘 이유 1. NLP와 CV에 비해 각 회사마다 데이터를 다르게 정의할 수 있다.(스릴 영화에 대한 기준이 모호함) 2. 풀고자 하는 목적에 따라 다른 평가방식을 사용하며 데이터 공개 또한 의무가 아니다. 3. 시간에 따라 user 특성, item 특성이 바뀌기도 한다.(10년전 고양이 사진과 현재 고양이 사진에 비해 시간의 영향을 많이 받음)
2024.01.30 -
6. Matrix Factorization(SVD) for Recommend System.
user-item matrix - train data : 구매한 항목은 1, 구매하지 않은 항목은 0으로 표기 → U, sigma, V를 얻을 수 있음 - test data : 새로운 user(or 새로운 item)에 대하여 궁금한 항목을 0.5로 표기 후 train에서 얻은 sigma, V를 사용하여 U를 구함. why U? 따라서 U(=test data으로부터 유사 역행렬을 도출), sigma(=from train), V(=from train)을 활용하여 test data를 예측.
2024.01.05 -
5. Graph Neural Network for Recommend System
Graph Neural Network(GNN) 은 크게 Spectral / Spatial 분야로 나눌 수 있다. - Graph Convolution Network(GCN)이 이 둘을 이어주는 아주 중요한 역할을 한 모델임. - GCN 등장 이후 Spatial filtering 위주의 연구가 주를 이루게 됨. Graph를 표현하기 위한 데이터는 Node feature matrix, Adjacency matrix, Degree matrix, Laplacian matrix가 있다. - input으로는 Node feature matrix, Laplacian matrix(D - A) - task에 따라 Graph-level, Edge-level, Node-level 작업 수행. GCN - Adj에 이웃노드와의 연..
2024.01.05 -
4. Transformer Fine Tuning
Hyperopt, Ray 등 라이브러리를 활용해서 hyperparameter tuning을 진행해보자. Transformer의 hyperparameter 1. layer 수 2. head 수 3. embedding dim 4. sequence length Training 시 hyperparameter 1. learning rate 2. batch size 3. epochs
2024.01.04 -
3. (Kaggle) Riiid Competition Winner's Solution
EDA - 연속형 변수 : 결측치 개수 파악, 최대/최소 값 파악, 중앙값, 평균 파악, 첨도,왜도 확인, target에 따른 feature 분포 확인 - 범주형 변수 : 결측치 개수 파악, Unique 값 개수 파악, value 별 개수 count, 최빈도 값 파악, value 별 target 분포 확인 - 시간 데이터가 주어짐 : feature를 풍부하게 생성해낼 수 있다. - 해당 대회는 특정 학생이 TOEIC 시험문제를 맞출지를 예측하는 대회로 문제를 푸는데 소요시간이 길다면 틀릴 확률이 높은 인사이트를 활용하여 해당 문제의 평균 시간, 틀린 학생들의 평균 시간 등을 feature로 추가할 수 있다. - 문항별, 시험지별, 태그별 평균 정답률을 feature로 추가할 수도 있고 등장 빈도를 fea..
2024.01.04