2013-10-29 3 views
0

여기에 약간의 피클이 있습니다. 중복되는 셀을 반복하여 채우는 작업을 자동화해야하며 순서가 맞지 않습니다. 그게 분명하지 않다는 것이 확실합니다.데이터 집합 간의 값 연결

생물학 연구에서는 x 개의 개인이 있습니다. 개인의 섹스와 무게 등의 정보는 연구 과정 전반에 걸쳐 일관성 유지 : 여러 번 과목 개별 테스트에서 찍은 특정 측정이

| Ind | S | W | 
| 1 | M | 4 | 
| 2 | M | 6 | 
| 3 | F | 2 | 
| 4 | M | 8 | 
| 5 | F | 4 | 
| 6 | F | 3 | 
... 

했다. 지금은 두 장의 스프레드 시트가 있습니다. 여러 값 (샘플 아래 A와 B) 각 당이있다 위에 나열된 것과 같은 일관된 값을 가지고 하나 하나 : 나는 이러한 데이터에 대한 통계를 실행하기 전에,

| Ind | A | B | 
| 1 | .1 | 4 | 
| 1 | .2 | 6 | 
| 1 | .1 | 2 | 
| 1 | .3 | 8 | 
| 2 | .1 | 4 | 
| 2 | .1 | 3 | 
| 2 | .3 | 4 | 
| 3 | .2 | 6 | 
| 3 | .2 | 2 | 
| 3 | .1 | 8 | 
| 3 | .1 | 4 | 
| 3 | .1 | 3 | 

기본적으로, 내가 원하는 여러 샘플 워크 시트의 일관된 값을 채우십시오. 데이터 세트가 이보다 훨씬 길기 때문에 수동으로 작업하는 것을 피하고 싶습니다. 최종 결과는 다음과 같을 것입니다 :

| Ind | A | B | S | W | 
| 1 | .1 | 4 | M | 4 | 
| 1 | .2 | 6 | M | 4 | 
| 1 | .1 | 2 | M | 4 | 
| 1 | .3 | 8 | M | 4 | 
| 2 | .1 | 4 | M | 6 | 
| 2 | .1 | 3 | M | 6 | 
| 2 | .3 | 4 | M | 6 | 
| 3 | .2 | 6 | F | 2 | 
| 3 | .2 | 2 | F | 2 | 
| 3 | .1 | 8 | F | 2 | 
| 3 | .1 | 4 | F | 2 | 
| 3 | .1 | 3 | F | 2 | 

여러분도 알다시피, 개개인은 반드시 같은 수의 샘플을 가질 필요는 없습니다. 네, 비 일관된 현장 작업! regex 또는 R을 사용하여이를 수행하는 허용 가능한 방법은 매우 유용합니다!

답변

0

원하는 것은 merge입니다. 그이 후 R 두 data.frame 객체로 읽을 경우 당신은 :

merge(dataframe1, dataframe2) 

당신이해야 할 Ind 열이 모두 같은 이름이 있는지 확인합니다.

+0

data.table, match 및 % in %는 두 데이터 집합을 더 빠르게 조인 할 수 있습니다 (일치 및 % in %는 약간 다릅니다). – user1436187

관련 문제