테이블이 포함 된 두 개의 파일을 병합 할 수있는 스크립트를 찾고 있습니다. 열은 박테리아의 이름을 포함하는 반면 열은 개별 샘플의 세균 수입니다. 일부 박테리아는 하나의 파일에만 있지만 다른 하나의 파일에는 나타나지 않기 때문에 나는 그들을 정렬하고 병합 할 수 없습니다. 이 경우 행을 0으로 채우고 싶습니다. 여기 bash를 사용하여 누락 된 값이있는 두 데이터 테이블 병합
은 예입니다파일 1
Header S1 S2 S3 S4
Acetobacterium submarinus 1350 1000 1541 1541
Abiotrophia defectiva 100 110 112 166
Acetobacterium tundrae 2 1 0 0
파일 2
Header S5 S6 S7 S8
Acholeplasma cavigenitalium 100 90 88 120
Acetobacterium woodii 2 3 4 0
Acetobacterium submarinus 500 600 400 480
그리고 결과 파일은
Header S1 S2 S3 S4 S5 S6 S7 S8
Abiotrophia defectiva 100 110 112 166 0 0 0 0
Acetobacterium submarinus 1350 1000 1541 1541 500 600 400 480
Acetobacterium tundrae 2 1 0 0 0 0 0 0
Acetobacterium woodii 0 0 0 0 2 3 4 0
Acholeplasma cavigenitalium 0 0 0 0 100 90 88 120
어떤 아이디어 (알파벳 순으로 정렬)한다 ?
저는 붙여 넣기 기능이 첫 번째 열에 의해 파일을 병합 할 수 있지만 누락 된 종을 처리하는 방법을 잘 모르겠습니다.
업데이트 다음은 두 가지 샘플 데이터 집합입니다. 열 번호는 원래 데이터 집합과 동일하며 행 수를 줄였습니다. 당신은 -a 1 2
, -e '0'
및 -o '0,1.2,1.3,1.4,1.5,2.2,2.3,2.4,2.5'
옵션 join
를 사용해야합니다
https://www.dropbox.com/s/h46nwjwwfdyzwqr/Class_Level_Aggregate_Counts-1.csv?dl=0 https://www.dropbox.com/s/x8wtdxl45bej729/Class_Level_Aggregate_Counts-2.csv?dl=0
설명은 확장 토론이 아닙니다. 이 대화는 [채팅으로 이동되었습니다] (http://chat.stackoverflow.com/rooms/67279/discussion-on-answer-by-striving-coder-merging-two-data-tables-with-missing-valu) . – Taryn
@bluefeet : 시도했지만 OP에서 채팅 할 수있는 담당자가 충분하지 않았습니다. –