4. 연관 규칙 분석

2023. 11. 29. 12:14NAVER AI Tech/Recommen System

연관 규칙 분석 : 하나의 연속된 거래들 사이의 규칙을 발견하기 위한 분석

- 흔히 장바구니 분석이라고도 함.

 

- 규칙 : 한 사건이 일어난 후에 다른 사건이 일어난 경우

- 연관 규칙 : 규칙의 빈도수가 threshold를 넘었을 때 '함께' 발생한다는 또 다른 사건의 규칙을 의미

    - antecedent, consequent로 이루어지며, 두 집합은 서로소(disjoint)이다.

 

- supprot : itemset이 전체 transaction data에서 등장하는 비율

 

연관 규칙 척도 

 

1. support

 

2. confidence(조건부 확률)

 

 

3. lift

 

사용 방법

- item이 많아질 수록 itemset을 구성할 수 있는 경우의 수는 기하급수적으로 많아진다.

- 따라서 유의미한 rule을 판별해내는 것이 중요하다.

 

1. minimum support, minimum confidence 설정 = rule fitering

2. lift값을 내림차순으로 정렬하여 가장 의미 있는 rule부터 판단

    - 이때 lift값이 크다는 것은 rule을 구성하는 antecedent와 consequent가 연관성이 높고 유의미하다는 뜻이다.

 

모든 룰을 brute-force로 탐색? 비효율적이다.

- Apriori 알고리즘(한번 쯤 구글링으로 공부해볼 것), DHP 알고리즘, FP-Growth 알고리즘 등이 존재.