각 형성에서 지층과 화석 종의 출현에 대한 .csv 파일이 있습니다. 각 화석은 그 행에 포메이션 이름이 포함 된 .csv 파일에 자체 행이 있습니다..csv 열의 섹션에서 고유 한 요소 계산 (파이썬)
아래에서 작성한 코드는 형성 횟수를 잘 보여줍니다.
import csv
from collections import Counter
out=open("BivalviaGRDWIS.csv", "rb")
data=csv.reader(out)
data.next()
data=[row for row in data]
out.close()
formations = []
for row in data:
if row[13]=='':
continue
else:
formations.append(row[13])
print Counter(formations)
그러나 화석 이름이 중복되어 카운트를 망칠 수 있습니다. 나는 각 지층에서 유일한 화석의 수를 원한다. 모든 요소가 아닌 .csv 파일에서 한 열의 섹션에있는 고유 한 요소를 계산하려면 무엇을 추가해야합니까?
위치를 포함하는 열은 무엇입니까? –
위치에 따라, 나는 형성을 의미합니다. 형성은 열 14 번째 열에서 개최됩니다. – EJMC
코드에서 많은 중복 작업을하고 있습니다. 왜'csv.reader()'객체를 통해 ** 직접 ** 루프하지 않습니까? 대신, 행 목록을 먼저 작성합니다 (순환 방식으로). –