2013-07-16 1 views
0

나는 이런 식으로 날짜를 포함하는 두 개의 인접한 열이 CSV 파일을 읽고있다 :이 사용 read_csv을 읽은 다음,이Pandas read_csv는 자동으로 날짜와 문자열을 변환하고 어설프니까?

로 변환 가져옵니다 to_csv 방법을 사용하여 다시 CSV에 기록

29/11/2004 00:00,29/11/2005 00:00,2,NULL,NULL,NULL,NULL,NULL,NULL,NULL,NULL,NULL 

29/11/2004 00:00,00:00.0,2.0,,,,,,,, 

두 가지 질문이 있습니다. 첫 번째 날짜는 괜찮습니까?하지만 두 번째 형식은 정확히 같은 형식을 가진 것으로 보이는 이유는 무엇입니까? 그리고 왜 NULL은 빈 문자열로 변환 되나요? 누락 된 날짜

df = pandas.read_csv(filepath, sep = ",") 
df.to_csv("C:\\tmp\\test.csv") 
+0

당신은 당신의 팬더 버전을 게시 할 수 있습니다. .12 릴리스 후보자 아래서, 나는 옳은 것을 얻는다. 두 개의 date cols가 모두 파싱됩니다 (parse_dates = [0, 1]'을 쓰거나 읽은 후 수행 할 수 있습니다). 그리고 NULL은'NaN'으로 변환됩니다. – TomAugspurger

+0

.11을 사용하고 있습니다 (불행히도 업그레이드 할 수 없습니다). NaN으로 변환하기 위해 변환 할 값을 어떻게 결정합니까? 더 걱정스러운 것은 누락 된 날짜입니다 ... – Anne

+0

csv에 헤더 행이 있습니까? – waitingkuo

답변

1

확실하지 이유 : 여기

내가 사용하고있는 코드입니다. 다른 행의 영향을 받았다고 생각합니다. 널 (NULL) 문자열 문제에 대한

, keep_default_na는 당신이를 방지하는 데 도움이 될 수 있습니다 :

df = pd.read_csv('test.csv', sep=',', keep_default_na=False) 
관련 문제