2016-08-12 6 views
1

팬더 테이블을 파일에 저장하고 싶으므로 나중에 해당 파일에서 읽을 수 있습니다. 내 요구 사항 :DataFrame을 완전히 저장하고 복원하는 포맷?

  • 파일 형식 (주요 언어로 윈도우/리눅스에 좋은 라이브러리 지원) 친절하게 휴대해야

  • 내가

  • 저장된 것과 완전히 동일해야 읽기 DataFrame 내가 index_col=0 인수를 제공하지만 데이터 유형이 손실됩니다 (물론, 자동 형식 유추가 과라을하지 않는 경우 작동 할 수 this post, read_csvto_csv에 따르면

ntee 내게 같은 종류의 even for simple types, 내가 결코 유추되지 않습니다 list 같은 파이썬 개체를 사용하는 경우 언급하지 않기 위하여).

많은 엣지 케이스에 대해 걱정할 필요없이 확실하게 작동하는 간단한 솔루션이 있습니까?

제가 생각할 수있는 유일한 해결책은 to_csv/read_csv을 사용하고 있지만 다른 유형의 정보는 다른 곳에 저장하십시오. 여전히 숨겨진 문제 (예 : 열 이름 중복 등)가있을 수 있습니다.

+0

@tzaman 나는 그것이 관련된 추측하지만 문제는 속도에 중점을두고, 나는 휴대 성을 찾고 있기 때문에 상단/허용 대답은 내 경우에는 완전히 부적절하다. (피클 파일은 파이썬 외부에서 읽을 수 없으며 쉽게 읽을 수 없습니다). – max

+1

그 대답은 또한'hdf5'라고 언급합니다. 그게 만족스럽지 않니? – piRSquared

+0

@ pixRSquared 방금 확인했는데 제대로 작동합니다. (허용되지 않는 동일한 이름의 열은 제외 하고도 괜찮습니다.) HDF5 읽기/쓰기가 역변환 가능하다는 보장은 없지만 그냥 그런 것 같아요. – max

답변

-1

pd.DataFrame.to_pickle/pd.read_pickle 보유 열 데이터 형식. 의 그것을 확인해 보자

df_in.to_pickle('input_5') 
df_out = pd.read_pickle('/input_5') 
관련 문제