분류 모델을 작성하기 위해 큰 csv 파일 (약 18G)을 rapidminer에로드하려고합니다. "가져 오기 구성 마법사"는 데이터를로드하는 데 어려움이 있습니다. 따라서 "매개 변수 목록 편집 : 데이터 세트 메타 데이터 정보"를 사용하여 특성 및 레이블 정보를 설정합니다. 그러나 UI 인터페이스를 사용하면 해당 정보를 열 단위로 만 설정할 수 있습니다. 내 CSV 파일에는 약 80000 개의 열이 있습니다. 이런 종류의 시나리오를 어떻게 처리해야합니까? 감사.큰 csv 파일을 rapidminer에로드 할 때의 문제
1
A
답변
0
아직 직접 사용해 보지 않았지만 CSV를 MySQL 데이터베이스에로드 할 수 있어야합니다. 그런 다음 스트림 데이터베이스 연산자를 사용하여 크기 제한을 피할 수 있습니다. 다음은 RapidMiner의 설명입니다.
데이터를 메인 메모리에로드하는 것과는 달리, Stream Database 연산자는 데이터를 데이터베이스에 보관하고 데이터 읽기를 일괄 적으로 수행합니다. 이를 통해 RapidMiner는 크기 제한없이 임의의 크기의 데이터 세트에 액세스 할 수 있습니다.
관련 문제
- 1. 큰 csv 파일을 테이블에로드 할 때의 문제
- 2. 큰 CSV 파일을로드 할 때의 성능 문제 (Objective-C)
- 3. WebClient/FTP를 통해 큰 파일을 다운로드 할 때의 문제
- 4. 큰 csv 파일을 R
- 5. weka로 데이터를로드 할 때의 문제
- 6. 큰 csv 파일을 데이터베이스에 삽입
- 7. mex 파일을 컴파일 할 때의 문제
- 8. xml 파일을 구문 분석 할 때의 문제
- 9. 기존 pdf 파일을 업데이트 할 때의 문제
- 10. VB.NET - 텍스트 파일을 쓰려고 할 때의 문제
- 11. Slim Framework에서 파일을 다운로드 할 때의 문제
- 12. iText에서 PDF 파일을 만들려고 할 때의 문제
- 13. 큰 csv 파일을 사용하는 방법
- 14. Ajax 양식 내부에서 파일을 다운로드 할 때의 문제
- 15. Ruby의 TCP 서버를 통해 더 큰 파일을 전송할 때의 문제
- 16. 파이썬에서 csv 파일을 읽을 때의 정수
- 17. QLPreviewController로 대용량 파일을 미리 보려고 할 때의 문제
- 18. AJAX로 이미지를로드 할 때의 문제
- 19. 자바에서 파일을 읽을 때의 문제
- 20. .nc 파일을 읽을 때의 문제
- 21. 큰 이미지에 작은 이미지를 표시 할 때의 문제
- 22. 자바에서 가장 큰 제수를 생성 할 때의 문제
- 23. 데이터를 다시로드 할 때의 문제
- 24. 큰 파일을 구문 분석 할 때의 메모리 오류 - Python
- 25. WCF를 사용하여 큰 파일을 업로드 할 때의 문제가
- 26. GridView를 필터링하려고 할 때의 문제
- 27. i18next.js를 require.js로로드 할 때의 문제
- 28. gcc에서 링크 할 때의 문제
- 29. Clojure에서 컴파일 할 때의 문제
- 30. 동일한 테이블을 업데이트 할 때의 문제
심각한 RAM 용량을 갖춘 64 비트 컴퓨터가 있습니까? 그렇지 않으면 18G 데이터 세트를 처리 할 수 없습니다. –
저는 서버에서 Rapidminer를 실행 중이며 Java-Xmx 40G를 사용하여 40G로 지정합니다. – user785099