2016-09-05 3 views
3

내 엑셀 시트를 인식하지 못하는파이썬 팬더 read_excel가 null 세포를

A B 
1 first second 
2 
3 
4 x y 
5 z j 

파이썬 코드 :

df = pd.read_excel (filename, parse_cols=1) 

반환 정확한 출력 :

first second 
0 NaN NaN 
1 NaN NaN 
2 x  y 
3 z  j 

내가에만 작동합니다 두 번째 열이있는 경우

df = pd.read_excel (filename, parse_cols=[1]) 

반환 :

second 
0 y 
1 j 

내가 특정 컬럼에서만 작동하는 경우에도 나는 (내 DF에서 NaN이) 빈 엑셀 행에 대한 정보를 가지고 것입니다. 출력 느슨한 NaN의 정보는, skiprows의 paramater을 위해, 예를 들어,하지 괜찮아요 경우 는 등

덕분에 나를 위해

+1

'skip_blank_lines = False' 매개 변수를 사용해 보시겠습니까? – jezrael

+0

그것은 작동합니다. 왜 내가이 매개 변수를 볼 수 없는지 http://pandas.pydata.org/pandas-docs/stable/generated/pandas.read_excel.html –

답변

4

매개 변수 skip_blank_lines=False 작동합니다

:

df = pd.read_excel ('test.xlsx', 
        parse_cols=1, 
        skip_blank_lines=False) 
print (df) 

     A  B 
0 first second 
1 NaN  NaN 
2 NaN  NaN 
3  x  y 
4  z  j 

또는 첫 번째 행을 생략해야하는 경우

df = pd.read_excel ('test.xlsx', 
        parse_cols=1, 
        skiprows=1, 
        skip_blank_lines=False) 
print (df) 

    first second 
0 NaN NaN 
1 NaN NaN 
2  x  y 
3  z  j 
+0

예. 하지만 왜 공식 문서에서이 매개 변수가 보이지 않습니까? http://pandas.pydata.org/pandas-docs/stable/generated/pandas.read_excel.html –

+0

[docs]의 일반 구문 분석 구성 (http://pandas.pydata.org/pandas-docs/stable)을 참조하십시오. /io.html#io-read-csv-table) 또는이 매개 변수는 ['read_csv'] (http://pandas.pydata.org/pandas-docs/stable/generated/pandas.read_csv.html)에 있습니다. – jezrael

+0

공식 문서 - ['read_excel'] (http://pandas.pydata.org/pandas-docs/stable/generated/pandas.read_excel.html)'** kwds' 뒤에 있습니다 ( – jezrael