문제의 일반적인 아이디어는 데이터가은
"Entity" "parent entity" "value"
A001 B001 .10
A001 B002 .15
A001 B003 .2
A001 B004 .3
A002 B002 .34
A002 B003 .13
..
..
..
A002 B111 .56
실체 수있는 값의 그래프가 테이블에 세 개의 열 아래에 배치된다 관여 상위 엔티티에서 엔티티로 향하는 에지의 가중치로 표시됩니다. 특정 엔티티의 상위 엔티티의 몇 가지 하위 집합이 .5 (말)보다 큰지 계산해야합니다. 더 많은 것을 계산하려면 (나중에 부분은 계산하기가 쉽지 않음)
요점은 데이터가 너무 큽니다 (Excel 파일은 데이터가 손실 됨 :()입니다.) 어떤 언어 나 도구를 사용할 수 있습니까? 어떤 사람들은 저에게 SAS 나 STATA를 제안했습니다. . 사전
얼마나 많은 데이터 포인트에 대해 이야기하고 있습니까, 오래된 Excel은 64000 행을 포기합니다. –
데이터가 엑셀 한도보다 훨씬 큽니다. 현재 그것의 STATA 파일. –
저는 기술 논문의 조직을 위해 일하고 있으며 소스웨어의 라이센스는 문제가되지 않습니다. –