2014-06-16 7 views
6

pandas.read_csv에 대한 함수 서명이, 다른 사람의 사이에서, 제공에 다음과 같은 옵션이 무엇을 : 나도 low_memory 또는 memory_map 플래그에 대한 모든 문서를 찾을 수 없습니다low_memory 할 및 memory_map 플래그 pd.read_csv

read_csv(filepath_or_buffer, low_memory=True, memory_map=False, iterator=False, chunksize=None, ...) 

합니다. 나는 이러한 기능이 아직 구현되었는지 여부와 만약 그렇다면 어떻게 작동하는지 혼란 스럽다.

구체적

,
  1. memory_map

    : 그것은 np.memmap 사용합니까 구현 등등 않는 경우가 memmap 나 행 등의 개별 항목을 저장하는 경우.
  2. low_memory : 메모리에 저장하려면 cache과 같은 것을 지정합니까?
  3. 우리는 변환 할 수 memmapped DataFrame

P.S.에 DataFrame 기존 : 관련 모듈

pandas==0.14.0 
scipy==0.14.0 
numpy==1.8.1 
+0

''low_memory''는 문서화되어야합니다 (실제로는별로 도움이되지 않는 오래된 옵션이지만). ''memory_map''은 구현되지 않았기 때문에 문서화되지 않았습니다. 귀하의 질문에 대한 답변은 모두 아니오입니다. – Jeff

+4

https://github.com/pydata/pandas/issues/5888 – Jeff

+0

참고로 이러한 문서는 공개 doc-strings에도 없으므로 찾고있는 위치가 확실하지 않습니다. – Jeff

답변

1

나는이 질문에 대한 의견을 정리해도 하나의 포괄적 인 대답에 내 자신의 연구를 추가하려고 시도합니다 버전.

  1. low_memory 옵션을 사용한다는 점에서 실제로 더 이상 (source를) 아무것도하지 않는 한, depricated의 종류이다.

  2. memory_map 내가 뭔가를 보인다 source code에서 말할 수로 dataframe 당신이받을 방법은 중요하지 어떤 데이터의 입력 스트림을 구문 분석하는 방법에 대한 옵션이 될하기까지 NumPy와 메모리 맵을 사용하지 않는 것 공장.

  3. 포인트 2의 가정은 이것이 구문 분석에만 해당되는 것이므로이 질문은 적합하지 않습니다.