자연어 처리 연구에 사용하는 문자열이 많습니다. 파이썬으로 저장하는 좋은 방법이 필요합니다.파이썬에서 큰 목록 (~ 10GB)을 저장하고 액세스하는 방법은 무엇입니까?
피클을 사용할 수는 있지만 전체 목록을 메모리에로드하는 것은 불가능할 것입니다 (저는 믿습니다). 크기는 약 10GB이며, 많은 메인 메모리가 없습니다. 현재 shelve 라이브러리에 저장된 목록이 있습니다 ... 선반은 "0", "1", ..., "n"등의 문자열로 색인이 생성됩니다.
하나의 파일에 이러한 개체를 저장하는 더 좋은 방법이 있습니까? 여전히 임의의 (ish) 액세스 권한이 있습니까?
최상의 옵션은 여러 목록으로 분할하는 것일 수 있습니다.
감사합니다.
실제로 데이터베이스가 이러한 종류의 작업에 더 적합하다고 생각합니다. 나는 그 총을 줄 것입니다 : D –
그냥 SQLite3 이상으로 이식. 처리 속도가 훨씬 빠르며 선반이 차지하는 디스크 공간의 약 1/3이 필요합니다! –
하! 작은 _and_. 나는 SQLite3을 좋아한다. : D – sarnold