코드를 실행할 때마다 사전에 구문 분석 할 필요가있는 약 10million 행의 100MB 파일이 있습니다. 이 프로세스는 매우 느리고 속도를 높이는 방법을 찾고 있습니다. 한 가지 생각은 파일을 한 번 구문 분석 한 다음 pickle을 사용하여 디스크에 저장하는 것입니다. 이것이 속도 향상을 가져올 지 확신하지 못합니다.파일 또는 unpickle을 다시 처리하기
의견을 보내 주시면 감사하겠습니다.
EDIT : 몇 가지 테스트를 마친 후 사전을 만들 때 속도 저하가 발생한다고 걱정됩니다. Pickling은 훨씬 빨라 보이지만, 더 잘할 수는 있습니다. 더 그랜드
시도하는 데 몇 분 정도 걸립니다. 시도해 봤어? –
당신이하고있는 파싱 작업의 양과 pickler가 수행 한 작업의 양에 따라 다릅니다. I/O 바인딩 일 수 있습니다. 알아낼 수있는 유일한 방법, 그리고 나는 Stackoverflowers가 당신을 위해 그것을 할거라고 생각하지 않아요 :) – JoeFish
각 라인은 사전에 어떻게 끝나나요? –