CSV 파일에서 중복 값 열 A를 정렬하려고하지만 Python에서 예상 결과를 얻지 못했습니다.중복 값 열을 CSV 파일에서 정렬
입력 파일 (.csv)로
열 이름 : 나는 PDB ID와 리간드 ID와 함께 우니 뽀 르트도 Acc 열의 중복 값과 싱글을 정렬 할
Uniprot Acc, PDB ID, Ligand ID, Structure Title, Uniprot Recommended Name, Gene Name, Macromolecular Name
.
Input file:
Uni port Acc PDB ID Ligand ID
* P0AET8 1AHI NAI
* P04036 1ARZ NAI
* Q59771 1C1D NAI
* P0C0F4 1DLJ NAI
* Q9QYY9 1E3E NAI
* Q9QYY9 1E3I NAI
* Q14376 1EK6 NAI
* Q16836 1F17 NAI
* P0AET8 1FMC NAI
* Q46220 1GIQ NAI
* P97852 1GZ6 NAI
* P07195 1I0Z NAI
* P00338 1I10 NAI
* P11986 1JKI NAI
* P10760 1KY5 NAI
* Q2RSB2 1L7E NAI
* Q27743 1LDG NAI
* O32080 1LSU NAI
* P00334 1MG5 NAI
* P26392 1N2S NAI
* P9WGT1 1NFQ NAI
* P0ABH7 1NXG NAI
* P05091 1NZW NAI
* P05091 1NZZ NAI
* P27443 1O0S NAI
* P0A6D5 1O9B NAI
* P20974 1OG4 NAI
* P11986 1P1J NAI
Expected Result:
Uni port Acc PDB ID Ligand ID
* P0AET8 1AHI NAI
* P0AET8 1FMC NAI
* P04036 1ARZ NAI
* Q59771 1C1D NAI
* P0C0F4 1DLJ NAI
* Q9QYY9 1E3E NAI
* Q9QYY9 1E3I NAI
.
.
.
I want to sort how many uniport acc id same with pdb id along with single id, No need to remove any id.
코드 :
import csv
import re
import sys
import os
f1 = csv.reader(open('one.csv', 'rb'))
writer = csv.writer(open("Output_file_1.csv", "wb"))
def has_duplicates(f1):
for i in range(0, len(f1)):
for x in range(i + 1, len(f1)):
if f1[i] == f1[x]:
var = f1[i]
writer.writerow(var)
정확하게 정렬하고/무엇인가를 정렬하려고합니까?! 지금까지 볼 수 있듯이 출력 파일에 중복 된 행만 작성합니다. 그러나 행이'k '번 반복되면, 출력 파일에서'k * (k-1)/2' 번 찾을 것입니다. 이거 목적이 있니? – Antoine
** 중복 된 행을 ** 다른 파일로 분리하려고 시도하고 있다는 것을 의미합니까? –
다른 세부 정보와 함께 열 A에 중복 값을 정렬하려고합니다. – krish