2017-01-30 3 views
-1

내 데이터에서 자주 패턴을 찾고 싶습니다. 그러나 데이터 세트는 매우 큽니다. 먼저 트랜잭션 데이터베이스 형식으로 변환해야합니다. 문제는 데이터베이스 (500000 개 레코드 중)에는 402 개의 고유 한 반복 항목이 있다는 것입니다. 어디서나 최대 8 자 (A, B, C, D, E, F, G, H)의 데이터 세트로 fp-growth 예제를 볼 수 있지만 402 개의 고유 항목을 표시해야합니다. 이 알고리즘에 알파벳 조합을 사용할 수 있습니까? 아니면 다른 접근법이 있습니까? 너희들 고마워.FP 성장 허용 입력 데이터 형식이란 무엇입니까?

답변

1

당신의 구현에 달려있다.

하지만 '우유'와 같은 편지 항목 하나를 허용하는 것이 표준입니다.

관련 문제