NAVER AI Tech/Deep Knowledge Tracing
1. Deep Knowledge Tracing
코딩소비
2024. 1. 3. 11:01
Deep Knowledge Tracing : 딥러닝을 이용한 지식 상태 추적
- 추적 : Sequence Data 처리(RNN, LSTM, Transformer 등 시계열 모델을 사용)
i-Scream Dataset 예시
- userid, 문제id, answerCode(corret or not), Timestamp, KnowledgeTag
**EDA 첫 스텝 : 기술통계량(평균,중앙값, 분산, 표준편차, 최대/최소 값)부터 살펴보기 및 시각화
- 문제를 많이 푼 학생일 수록 정답률이 높나?
- 더 많이 노출된 태그일수록 정답률이 높나?
- 목적에 유의미한 feature를 찾기 위해 다양한 시각에서 확인
Sequence Data를 만들기 위해 사용자 별로 데이터를 생성해서 모델의 input으로 제공해야함.
- embedding 기법을 참고하여서 어떻게 input 을 생성하는지 고찰해보자.