4
내가큰 데이터
df <- data.frame(group= c("a","a","b","b","b","c"),
person = c("Tom","Jerry","Tom","Anna","Sam","Nic"), stringsAsFactors = FALSE)
df
group person
1 a Tom
2 a Jerry
3 b Tom
4 b Anna
5 b Sam
6 c Nic
같은 큰 dataframe이 결과적으로 좀하고 싶습니다 설정에 공통 셋째 찾기
df.output
pers1 pers2 person_in_common
1 Anna Jerry Tom
2 Jerry Sam Tom
3 Sam Tom Anna
4 Anna Tom Sam
6 Anna Sam Tom
결과 dataframe은 기본적으로 사람의 모든 쌍있는 테이블을 제공합니다 누가 공통점이있는 사람인지. SQL에서 할 수있는 방법을 찾았지만 오랜 시간이 걸리므로 효율적인 방법이 있는지 궁금합니다.
그것은 설정 정상적인 크기의 데이터에 대해 잘 작동하지만'mydf' 인접 행렬을 설정하려고 할 때 내 실제 데이터와 메모리 문제로 실행이 ('g' 거의이다 1gb 크기). – user6617454
나는 그것을 시도했지만 매트릭스가 너무 큽니다. 스파 스 매트릭스로 주변을 조롱하고 있었지만 알아 내지 못했습니다. 좀 더 시도해보고 일반적인 문제를 해결할 때 대답을 받아 들일 것입니다. – user6617454
두 번째 버전 @ d.b에서 충돌이 발생하지 않지만 계속 실행 중입니다. 나는 그것이 어떻게되는지 알려줄 것이다 – user6617454