1
팬더를 사용하여 약 3GB, 200Kb 및 200kb 인 3 개의 파일을 병합하려고하고 컴퓨터에 32G 메모리가 있지만 여전히 MemoryError로 끝납니다. 이 문제를 피할 수있는 방법이 있습니까?팬더에서 메모리 사용을 최적화하는 방법
다음product = pd.read_csv("../data/process_product.csv", header=0)
product["bandID"] = pd.factorize(product.Band)[0]
product = product.drop('Band', 1)
product = product.drop('Info', 1)
town_state = pd.read_csv("../data/town_state.csv", header=0)
dumies = pd.get_dummies(town_state.State)
town_state = pd.concat([town_state, dumies], axis=1)
town_state["townID"] = pd.factorize(town_state.Town)[0]
town_state = town_state.drop('State', 1)
town_state = town_state.drop('Town', 1)
train = pd.read_csv("../data/train.csv", header=0)
result = pd.merge(train, town_state, on="Agencia_ID", how='left')
result = pd.merge(result, product, on="Producto_ID", how='left')
result.to_csv("../data/train_data.csv")
당신이 당신의 파일을 gzip을 여기 어딘가에 업로드 및 링크를 게시 할 수 : 그것은
product
DF을의 경우, 나는 이런 식으로 할 것인가? 물론 데이터가 합리적이지 않은 경우 (고객 정보, 전자 메일 등을 포함하지 않음). 16GB RAM이있는 노트북에서 최적화 할 수 있습니다. – MaxU