2012-09-18 5 views
0

인덱스 열이없는 CSV를 읽으려면 팬더 함수 read_csv을 사용하고 있습니다. 인덱스로 사용할 열 번호, 열 이름 또는 열 번호/이름의 목록 :팬더 read_csv 인덱스 예외

read_csv("file.csv", header=1) 

나는 documentation

index_col에 따라 각 행에 대한 인덱스를 생성 할 것이라고 팬더를 기다리고 있었다 결과 행의 DataFrame (행 레이블). 기본적으로 헤더가있는 것보다 하나 더 많은 데이터 열이있는 경우가 아니라면 첫 번째 열을 인덱스로 사용하지 않는 한 열을 사용하지 않고 행의 번호를 매 깁니다.

그러나

, 그것은 던졌습니다 파일을로드하는 동안,

Exception: Reindexing only valid with uniquely valued Index objects 

그리고 나는이 경우가 왜 알아낼 수 없습니다. 이 예외의 원인은 무엇입니까?

나는 또한 skiprowsnrows을 전달하려고 시도했으며 동일한 예외가 발생합니다.

+0

데이터의 예를 들려 줄 수 있습니까? – BrenBarn

+0

여기 저기에 있습니다. 문자열, ints, 수레, 날짜. 그러나 특정 데이터 유형에 대해이 중 하나를 구문 분석하려고하지는 않습니다. – milkypostman

+0

구체적인 예를 들어야합니다. 실제로 오류를 유발하는 샘플 데이터 파일을 제공하십시오. 문제는 파일이 어떻게 포맷되고 어떤 데이터가 포함되어 있는지에 대한 세부 사항과 관련이 있습니다. – BrenBarn

답변

1

인수가 True/False 형식 인수가 아니기 때문에 발생합니다. 오히려 헤더의 행 번호를 지정합니다. 1으로 지정되었으므로 머리글에 두 번째 행을 사용하고 있으며이 행에 실제 데이터가 포함되어 있다는 점을 감안할 때 그 값은 반드시 고유하지 않습니다.

문제는

read_csv("file.csv") 

또는

read_csv("file.csv", header=0) 

수정에 명령을 변경. 그것은 "이런"순간이지만 R에 익숙해지면 header=1이 헤더를 읽는 것으로 잘못 지정했다고 생각했습니다. 응. 나중에 참조

,

Reindexing only valid with uniquely valued Index objects 

헤더 값은 고유없는 예외에 관한 것이다.

+0

어떤 판다의 버전을 사용하고 있습니까? 'read_csv'는 비 고유 헤더를 사용하는 몇 가지 장난감 예제에서 잘 작동하는 것처럼 보였습니다. 비공개로 유지하려는 데이터를 공개하지 않고 문제를 재현하는 특정 데이터 세트를 생각해 낼 수 있는지 여부는 알 수 없습니다. –

+0

버전은 '0.8.1'입니다. – milkypostman