2016-09-06 6 views
1

아래 코드를 사용 중입니다. 내 모든 CSV 파일에는 균일 한 구조가 있습니다. 데이터 프레임이 형성되면 내 CSV에 날짜에 대한 두 개의 열이 포함됩니다.CSV 병합 팬더 데이터 프레임 사용

결과 데이터 프레임에서 몇 개의 행에 대해 날짜 값이 첫 번째 날짜 열에 있고 나머지 데이터의 경우 두 번째 날짜 열로 이동합니다.

원본 CSV 파일의 한 열에 왜 두 개의 열 (날짜 열)이 생성되는지 알기 바랍니다.

all_data = pd.DataFrame() 
for f in glob.glob("/Users/tcssig/Desktop/Files/*.csv"): 
    df = pd.read_csv(f) 
    all_data = all_data.append(df,ignore_index=True) 

In [76]: all_data.columns 
Out[76]: Index(['0', '0.1', 'Channel_ID', 'Date', 'Date ', 'Duration (HH:MM)','Episode #', 'Image', 'Language', 'Master House ID', 'Parental Rating','Program Category', 'Program Title', 'StartTime_ET', 'StartTime_ET2','Synopsis'], 
dtype='object') 
+0

아마도 일부 CSV 파일에는'Date' 열에 공백이있을 것입니다. –

+0

감사합니다. – Sarang

답변

5

두 번째 컬럼에 공백이 있기 때문에 :

'Date', 'Date ' 
      ^

그래서 당신은 내가 선행을 제거하기 위해 str.strip을 사용하여 여기

all_data = pd.DataFrame() 
for f in glob.glob("/Users/tcssig/Desktop/Files/*.csv"): 
    df = pd.read_csv(f) 
    df.columns = df.columns.str.strip() 
    all_data = all_data.append(df,ignore_index=True) 

를 추가하기 전에 열을 정상화해야하고 후행 공백

+0

감사합니다. CSV 파일 중 일부에서 문제가 해결되어 작동했습니다. – Sarang

+0

내 대답이 문제를 해결했다면 받아 들일 수 있습니다. 내 대답의 왼쪽 상단에 빈 눈금이 표시됩니다. 감사합니다. – EdChum

+0

다시 한번 감사드립니다 :) – Sarang