Pandas 라이브러리를 사용하는 것이 좋습니다. 또한 작은 CSD 파일로 큰 CSV 파일을 읽을 수 있습니다. 여기에 문서에서 examle는 다음과 같습니다
데이터 : 청크 크기를 지정
year indiv zit xit
0 1977 A 1.2 0.60
1 1977 B 1.5 0.50
2 1977 C 1.7 0.80
3 1978 A 0.2 0.06
4 1978 B 0.7 0.20
5 1978 C 0.8 0.30
6 1978 D 0.9 0.50
가 (당신이 반복 가능한 수) :
reader = read_table(’tmp.sv’, sep=’|’, chunksize=4)
for chunk in reader:
.....: print chunk
출력 :
year indiv zit xit
0 1977 A 1.2 0.60
1 1977 B 1.5 0.50
2 1977 C 1.7 0.80
3 1978 A 0.2 0.06
year indiv zit xit
0 1978 B 0.7 0.2
1 1978 C 0.8 0.3
2 1978 D 0.9 0.5
NB! 어쨌든 주식 데이터를 추가로 조작해야 할 경우 팬더가 가장 좋은 방법입니다.
무엇이 문제입니까? –
파이썬의'csv' 모듈은 생성자를 사용하여 데이터를 반복합니다. 엄청난 양의 데이터 세트를 수십 개의 배열에 저장하려고하는데 실패하면 RAM이 충분하지 않을 수 있습니다. –
코드를 작성하십시오 –