0

나는이 질문을 위해서 간단하게하려고 하겠지만 가능한 한 간단하게 나의 이슈를 설명하려고 노력할 것이다.많은 변수들 사이의 관계를 찾는 것

저는 1000 개가 넘는 변수로 작업하고있는 상당히 큰 프로젝트가 있습니다. 사용자가 작성하려는 페이지를 선택한 순서대로 선택합니다. 각 페이지에는 약 200 개의 변수가 있습니다.

평균 사용자는 약 10 페이지를 채 웁니다.

여기 제가 해결하려고하는 까다로운 부분이 있습니다. 각 페이지의 다른 변수와 관련된 많은 변수가 있습니다 (더 많은 것은 사용자가 사용할 수있는 다른 페이지에서도 더 중요합니다). 사용자가 확실히 사용할 특정 페이지가 하나도 없으며, 사용자의 선호도에 따라 다릅니다.

그래서 관계는 그래서 때로는 관계가 단지 그들이 동일 여부를 기반으로

page1_address == page2_address == page3_address == page4_address == etc. 

page1_total = page1_var1 + page1_var2; 
page3_total = page1_total + page2_var1; 

if (page6_var1 > 0) && (page6_var2 < 10) 
then page3_super = "something important" 

같은 모양. 그러나 때로는 좀 더 복잡한 변수 간의 관계를 찾고 싶습니다. 모든 변수가있는 경우에만이 기능이 작동합니다.

내 질문에 변수 사이에 관계형 규칙을 만드는 방법에 대해 알아야 할 특별한 방법이 있습니까?

사용자가 페이지 4를 먼저 기입 한 다음 주소로 과 같은 관계형 변수로 page1을 자동 채우기해야하는 경우와 같은 검사를 수행하는 적절한 방법은 무엇입니까? 더 복잡한 검사를해야하지만 처음에는 모든 변수가 존재하지는 않지만 지금은 존재합니까?

나는 어리석은 증거 방법을 찾고 있지 않다. 나는이 사실을 알고있다. 나는 앞으로 나아갈 방향을 찾고 있습니다. 모든 지침을 부탁드립니다.

답변

1

데이터를 N-ary trees (N-ary trees)으로 표시 할 수 있습니다. 아니면 너 Decision trees, 그들은 당신을 위해 더 적합 할 수도 있습니다 : Decision trees. Decision trees과 그 (것)들에서 자료 작은 조각을 위해 많은 중대한 책 및 온라인 과정 및 자습서가있다. 적어도 통계에 대한 기본 경험이 있어야합니다. (아래 설명에서)

편집 :

아주 좋은 책이 Lior Rokach에 의해 Data Mining with Decision Trees: Theory and Applications입니다. 그런 다음 Data Mining: Practical Machine Learning Tools and Techniques, Third Edition을 사용해보세요. 데이터의 복잡한 분석을 원한다면 기계 학습, 통계 등을 연구해야합니다. 그러나 익숙하지 않은 경우 어딘가에서 시작해야합니다 : Data structuresStatistics.

+0

감사합니다 @KamilMaraz이 – bryan

+0

에 대해 살펴 보겠습니다. '데이터 마이닝'또는 이러한 유형의 '데이터 구조'에 대한 경험이 있습니까? – Kamil

+0

데이터를 매우 단순하게 채웠습니다 (텍스트 줄). 그러나 나는이 대답에 열거 된 어떤 것에도 경험이 없다. @KamilMaraz – bryan

관련 문제