회사의 액세스 권한에 대해 일부 데이터 마이닝을 시도하고 있습니다. 나는 그들이 가지고있는 접근에 따라 서로 다른 그룹을 함께 클러스터링하려고 시도하고있다. 그런 다음 그룹 피어 중 누구도 액세스 할 수 없기 때문에 다른 사람의 액세스가 용의성이 있는지 판단한다. 나는 이것으로 나를 도울 수있는 알고리즘을 찾고있다. 거의 반전 추천 시스템입니다 (예 : Netflix, Amazon). 다음은 간단한 예제 :사용자 액세스 권한의 이상 감지
내가 (자율 학습) 사람 1-3 명 4-6 유사 기능이며, 때문에, 같은 그룹에 가능성이 있음을 분류하지 않고 인식 할 수 있도록하려면Person 1 has access to files A, B, E
Person 2 has access to files A, B
Person 3 has access to files A, B
Person 4 has access to files C, D, E
Person 5 has access to files C, D
Person 6 has access to files C, D, E
자신의 비슷한 파일 액세스 (클러스터링). 클러스터를 확인한 후에 파일 E가있는 사람 1 인 비정상적인 액세스를 플래그로 지정합니다.
AI4R 루비 라이브러리를 조사하려고했지만 막 다른 방향으로 왔습니다. 선택할 수있는 알고리즘이 너무 많습니다. 나는 그저 올바른 길을 가리킬 필요가 있습니다. 감사.
간단한 group_by는 어떨까요? 당신에게 개요를 줄 수 있습니다. – three