나는 unbalanced csv 파일에서 pandas 데이터 프레임을 만들려고합니다가장 빠른 방법으로 Pandas 데이터 프레임에 불균형 행을 어떻게 추가 할 수 있습니까?
그러나 내가 무차별 방식으로 만들면 속도가 너무 느립니다. 여기
, 나는 Dataframe
의 스키마를 만들 수 있습니다 열 목록과 파일의 행 무리가있다.
어떻게 빨리 처리 할 수 있습니까?
(나는 다른 방법으로 빈 목록을 작성해야합니까?)
import pandas as pd
import numpy as np
for key in column_name:
newdf = pd.DataFrame(columns = column_name[key])
with open(str(key) +'.csv') as f:
reader1 = csv.reader(f)
index = 0
print key, sum(1 for row in csv.reader(open(str(key) +'.csv')))
for row in reader1:
if index % 10000 == 0:
print index
new_row = [np.nan]*len(column_name[key])
for i in range(len(row)):
new_row[i] = row[i]
newdf.loc[index] = new_row
index = index+1
newdf.to_csv(key+"_with_column_name"+".csv")