NAVER AI Tech(87)
-
3. 인기도 기반 추천
인기있다의 정의는 ? - 조회수, 평균 평점, 리뷰 개수, 좋아요/싫어요 수 를 척도로 평가. 메타데이터(추천 아이템의 종류)에 따라 달리지는 인기도 score! - 뉴스의 경우 조회수가 가장 높고 최신인 아이템을 추천. 최근 핫한 이슈가 중요하기 때문 - 맛집의 경우 평균 평점이 가장 높은 아이템을 추천. 퀄리티가 중요하기 때문
2023.11.29 -
2. 추천시스템 평가 지표
추천시스템 평가 지표 - 비즈니스 관점 : 매출이 증가하였는가? 혹은 CTR(노출 대비 클릭)이 상승했는가? - 품질 관점 : 연관성, 다양성, 새로움, 참신함 등에 대해 평가를 진행. Precision / Recall - Precision : 추천한 아이템 중에 실제 유저가 관심있는 아이템 비율 - Recall : 유저가 관심있는 아이템 중에 우리가 추천한 아이템 비율 ex) 유저가 관심있는 아이템 3개, 추천시스템이 추천한 아이템 5개 중 2개가 유저가 관심있는 아이템에 포함될 경우 Precision : 2/5, Recall : 2/3 MAP@K - 모든 유저에 대해서 Precision@1부터 Precision@K 까지 평균. NDCG - cumulative gain : 상위 K개 아이템에 대하여 관..
2023.11.29 -
1. 추천시스템 개요
추천시스템이란? - 특정 유저에게 적합한 아이템을 추천한다 or 특정 아이템에게 적합한 유저를 추천한다. - 이때 유저-아이템 간 상호 작용을 평가할 score가 정의되어야 한다. - 따라서 top K(랭킹)을 예측하거나, 정확한 선호도를 예측하는 문제로 나눌 수 있다. 추천시스템에서 사용하는 데이터 1. 유저 데이터(식별자, 데모그래픽 정보, 행동 정보) - 식별자 - 데모그래픽 정보(성별, 연령, 거주지역, 관심사) - 유저 행동 정보(페이지 방문 기록, 아이템 평가, 피드백 등) 2. 아이템 데이터 - 아이템의 종류에 따라 달라질 수 있음(메타 데이터 속성에 따라 달라진다고 함) - 식별자 - 아이템 고유 정보(영화일 경우 출연 배우, 감독, 줄거리 등등, 음악일 경우 아티스트, 작곡가, 장르 등등..
2023.11.29 -
2. Matplotlib
시각화는 plt 라이브러리 내의 figure라는 도화지에 그리게 된다. 여러 그림을 그릴 수 있는데 ax 라는 subplot을 생성하여 지정하게 된다. import matplotlib.pyplot as plt fig = plt.figure() ax1 = fig.add_subplot(1, 2, 1) # 전체 도화지가 1행 2열, 그 중 1번째에 그림을 그려라. ax2 = fig.add_subplot(1, 2, 2) plt.show 데이터 추가하기 fig = plt.figure() x1 = [1, 2, 3] x2 = [3, 2, 1] ax1 = fig.add_subplot(2,1,1) ax2 = fig.add_subplot(2,1,2) ax1.plot(x1) ax2.plot(x2) plt.show() 같은 ..
2023.11.23 -
1. Data Visualization 이란?
데이터 시각화 : 데이터를 그래픽 요소로 매핑하여 시각적으로 표현하는 것 - 데이터 - 그래픽 요소 - 매핑 - 시각적으로 표현 데이터 종류 - 수치형 데이터 : 연속형, 이산형 - 범주형 데이터 : 명목형, 순서형
2023.11.23 -
7. Generative Model.
What Generative Model do? - we want to learn a probability distribution p(x) 28 x 28 image 생성 시 - 각 pixel이 서로 연관이 있기 때문에 경우의 수는 2**28, 이때 필요한 파라미터는 2**28 -1 개 - p(x)를 알기 위해서는 2**28-1개만 알면 나머지 하나는 총 확률 합=1 에 의해 자동적으로 알게 되므로. Independence - 각 pixel이 독립이라고 가정한다면? 경우의수는 2**28, 하지만 필요한 파라미터는 n개. - 서로 독립시행이기 때문에 파라미터 개수를 엄청나게 줄일 수 있다. - 하지만 그만큼 표현력이 줄어드는 것도 사실. 그리고 28x28 image에서 각 pixel은 연관성이 있는것도 사실...
2023.11.22