제가 공통적으로 생각해야 할 것이 있습니다 만, 아직 어떤 좋은 해결책도 찾지 못했습니다.유닉스에서 문자열과 숫자를 함께 정렬합니다.
각 줄마다 염색체 번호, 염색체의 시작 위치 및 아래의 관련 값이있는 파일이 있습니다.
1 1.07299851019 1 1.07299851019 HQ chrY 2845223 + 0.251366120219 46
1 1.06860686763 1 1.06860686763 HQ chr10 88595309 + 0.256830601093 47
1 1.04688316093 3 3.14064948278 HQ chr6 49126474 + 0.295081967213 54
1 1.1563829915 1 1.1563829915 HQ chrX 16428176 + 0.185792349727 34
이 파일은 염색체 (6 열)와 시작 위치 (7 열) 모두에서 unix sort 명령을 사용하여 정렬하려고합니다. 주변 검색 후 난다면 저를 가지고있는이 함께했다 :
nohup sort -t $'\t' -k 6.4,6.5n -k 7,7n
내가 해결할 수없는 나머지 문제는 숫자로 번호 염색체 정렬하는 동안 확실히 염색체 X 염색체 Y가 함께 분류되어 있다는 것입니다 다음과 같이 시작 위치에 :
1 0.978579587641 9 8.80721628876 HQ chrX 2861057 - 0.431693989071 79
1 0.979500536702 1 0.979500536702 HQ chrY 2861314 - 0.420765027322 77
1 0.969979601694 9 8.72981641525 HQ chrX 2861649 - 0.469945355191 86
chrX와 chrY를 숫자로 대체하거나이를 해결하기위한 프로그램을 작성하지만, 특히 파일 크기가 대개 크고 반복적으로 수행하기 때문에 간단한 명령을 사용하는 것이 좋습니다.
염색체 22에 위해 1 줄과 경우도 좋을 것이다 다음 X 다음 Y. 내 명령은 염색체 X와 Y는 22
가 대단히 ruakh 감사의 SED 명령을 정확히 내가 원하는 걸 해! – user838744
@ user838744 : 환영합니다! – ruakh