몇 가지 큰 데이터 세트 (내 RAM보다 훨씬 큰 데이터)에 대한 분석을 실행하고 있습니다. 내 작업을 돕기 위해 numpy.memmap
을 사용하여 데이터 세트를로드합니다 (단층 데이터 세트에서 생성 된 개별 .npy 파일에 저장 한 후).numpy.memap, Pandas dataframe 및 seaborn boxplot 문제
데이터 세트에서 여러 값을 추출한 후 팬더 데이터 프레임에서이 값을 수집합니다. 값을 보면 (예 : df.head()
을 통해) 값이 잘 표시됩니다.
지금 seaborn.boxplot(data=df, x='Treatment', y='Tumor_Vol', hue='Experiment_Day')
같은으로 값을 시각화하고 싶습니다,하지만 난
ValueError: List of boxplot statistics and `positions` values must have same the length
이 동일한 명령 이후, 메모리 매핑 값으로 인해 나에게 보인다 오류를 얻을 데이터 프레임을 CSV 파일에 저장하고 디스크에서 다시로드 할 때 작동합니다 (현재의 해결 방법).
그래서 --- 더 나은 단어가 부족하여 --- 값을 해제하고 값을 데이터 프레임에 '실제'값으로 저장할 수있는 방법이 있습니까?
관심있는 데이터의 하위 집합에서 'copy'를 호출하여 숫양으로 끌어 올 수 있습니다. 예 : – Elliot
'plot_copy = df.ix [:, '[Tumor_vol', 'Experiment_Day', 'Treatment']]와 같이 도움이되지 않는 것 같습니다. copy()'data_subset = memmap_data [i : j] .copy() 'plot_copy [ 'Tumor_vol']에서 나는 여전히''을 얻었습니다. –
Habi
최소한의 완전하고 검증 가능한 예제 (http://stackoverflow.com/help/mcve)를 포함 시키면 함께 해킹 할 수 있습니다. 그렇지 않으면 노력하고있는 것과 함께 작동하지 않는 것을 함께 모으기가 어렵습니다. – Elliot