2012-05-29 1 views
0

복잡한 네트워크와 소셜 네트워크 분석의 아이디어와 기술을 익히기 시작했습니다. 나는 항상 위로 올라가고 데이터 준비 단계에 갇혀있는 것 같습니다. 나는 종종 Google Refine에서 데이터 집합을 가지고 있는데, 이는 기본적으로 어떻게 든 관련이있는 일련의 행입니다. 그래서 조직 것이라고 볼 수복잡한 네트워크/SNA로 시작합니다. 데이터 셋을 예상 포맷으로 바꿈

My Google Refine Data

을 (조직이 이벤트에 하나 이상의 대리자를 보냈을 수도로 일부 중복으로) 현재 예를 들어 나는 그들이 참석 한 단체 및 이벤트의 목록을 내 그래프의 노드가되고 두 ​​이벤트가 같은 이벤트에 참여했다면 관계가 존재하지만 NWB, Gephi, R 또는 Tulip과 같은 도구로 이해할 수있는 형식으로이 데이터 집합을 변환하는 방법을 알지 못합니다.

데이터 세트가있는 상황에서 종종 열 사이의 관계를 볼 수 있지만 관계를 탐색 할 수있는 도구로 가져올 준비가 된 데이터 준비를 위해 다음 단계를 수행해야한다는 것을 알지 못했습니다. 지원되는 파일 형식에 대한 문서를 훑어 보았습니다. 내 생각에 구체화의 RDF 스켈레톤 도구로 뭔가를 수행하고 링크 된 데이터 스타일 접근 방식을 사용하는 것이 해결책 일 수 있지만 운이 없습니다.

데이터 준비에 대한 모든 정보를 제공해 주시면 감사하겠습니다.

답변

0

앞으로 누군가가이 문제에 봉착하게됩니다. 저는 CSV를 R로 가져 와서 하나의 모드 행렬을 만든 다음이를 바탕으로 그래프를 작성했습니다. 도움이된다면

organisations_events<-read.csv("/Users/David/Desktop/PhD/R_github/ROI/data/Ins_Event.csv" , header=T, sep=",") 

df<-read.csv("/Users/David/Desktop/PhD/R_github/ROI/data/Ins_Event.csv" , header=T,  sep=",") 

M = as.matrix(table(df)) 

Mrow = M %*% t(M) 

#Mcol = t(M) %*% M 

write.csv(Mrow, "test.csv") 

은 .. 여기에 대한 답을이 블로그 http://www.davidsherlock.info/network-analysis

관련 문제