학교수업/데이터 사이언스

[5-1] MaxMiner, Closet, CHARM

해영이의 성장일기 2026. 3. 31. 14:03

close pattern 랑 헷갈리면 안된다

 

max-pattern = 더 큰 frequent 패턴이 없는 패턴

조건:

  • frequent (min_sup 이상)
  • 자기보다 큰 frequent 집합이 없음
  • 모든 frequent 패턴 안 구하고 max만 구함 그래서 개수 확 줄어듦! 아래 예시보면 알 수 있

즉: {A,B,C}가 frequent인데 {A,B,C,D}는 not frequent → {A,B,C}는 max

 

 

BUT HOW?

size k candidate including B but not A

 

For each section, we can pick the super pattern.

 

그리고 다른 개념을 소개 하겠다

closed pattern = support 같은 super-pattern 없음 더 큰 frequent 있데 support 같으면 안됨

 

 

  • conditional pattern base 활용
  • support 동일한 경우 제거
  • closed = 정보 손실 없이 압축
  • max보다 더 정보 유지됨

 

 

  • support 계산 쉬움
  • scan 거의 안 함
  • support = 교집합 크기
  • intersection = 새로운 후보 생성

 

간단하게 intersection 만 하면 되는 것이다.
lower frequency 는 빼고요! 근데 예시가 좀 틀려 있음

 

 

Association Rules

❑ Mining multilevel association

❑ Miming multidimensional association

❑ Mining quantitative association

❑ Mining interesting correlation patterns

같은 min_sup 쓰면: 하위 아이템 다 사라지는 문제가 있어서 상위는 높게 하위는 낮게 level마다 다른 support 쓰자.

 

이렇게 함으로써 우리는 같은 확률로 include 되게 할 수 있게 된다.

 

 

근데 또 문제가 비슷한 rule 너무 많아.

제거 조건:

  • support 비슷
  • confidence 비슷하면 

 

이거는 보면 이해한다
no order discretization (구간 나누기)

 

 

인접 구간 → 합치기 (clustering) similar rules become one universal rule
support & confidence만 보면 오해 가능

 

 

 

 

'학교수업 > 데이터 사이언스' 카테고리의 다른 글

[6-1] Classification part 2  (0) 2026.04.06
[5-2] Decision Tree + Random Forest  (0) 2026.04.01
[4-1] FP-Growth  (0) 2026.03.23
[3-2] Improving Apriori  (0) 2026.03.16
[2-2] Apriori Algorithm  (0) 2026.03.09