Python을 사용하여 R을 사용하여 생성 된 대용량 CSV 파일 (200MB)을 압축 해제합니다 (저는 Python을 사용합니다).Numpy 저장 파일이 원본보다 큼
파일 정리 (정규화, 크기 조정, 정크 열 제거 등)를 한 다음 데이터 분리 문자가있는 numpy의 savetxt를 ','로 사용하여 CSV 속성을 다시 저장합니다.
새로운 파일은 원본 파일 (거의 400MB)의 거의 두 배입니다. 원래 데이터와 새 데이터는 수레 배열입니다.
도움이된다면 새로운 파일에 원래 값이없는 지수 값이 필요한 매우 작은 값이있는 것처럼 보입니다.
왜 이런 일이 발생하는지 알고 싶습니다.