2010-03-07 7 views
-4

큰 데이터를 메모리에로드해야하며 구조가 목록입니다. 다른 접근법을 얻으려면 어떻게해야합니까? 고맙습니다파이썬을 사용하여 거대한 데이터를 메모리에로드

+0

답변에서 보았 듯이 추측하고 있습니다. 실제 문제를 조금 더 명확히 할 수 있다면 그것은 도움이 될 것입니다. –

+0

로드하는 데이터의 예가 있습니까? 어떤 종류의 정보가 포함되어 있습니까? 이 질문에 대한 대답은 조금 더 쉽게 질문에 답할 수 있습니다. – iblamefish

+2

이것은 같은 주제 인 에 몇 분 안에 물어 본 두 번째 질문입니다 : http://stackoverflow.com/questions/2396238/memory- 오류로 인해 거대한 입력 파일 크기. 해당 질문에 대한 답변이 적절하지 않은 경우 원래 질문에서 그렇게 대답해야합니다. 같은 질문에 대한 희미한 버전도 묻지 말아야합니다. –

답변

0

데이터가 너무 커서 컴퓨터의 메모리에 맞지 않으면 조각으로 읽어야합니다. 너무 크지 않은 경우에도이 작업을 수행하려고 할 수는 있지만 메모리 전체로 읽을 필요가있을 수 있습니다. 질문을 편집하여 요구 사항에 대해 더 자세히 설명하고 데이터의 특성이 무엇인지 알면이 질문보다 훨씬 더 유용한 대답을 얻을 수 있습니다.

2

공정 라인으로 데이터 라인, 예를 들어

for line in open("file"): 
    print "do processing of line:",line 

아니면 정말 메모리에 하나 개의 전체 덩어리를로드하려는 경우, 당신은 메모리 매핑을 시도 할 수 있습니다.

import mmap,os,re 
bigfile = open("file2") 
length = os.stat(bigfile.fileno()).st_size 
try: 
    mapping = mmap.mmap(bigfile.fileno(), length, mmap.MAP_PRIVATE, mmap.PROT_READ) 
except AttributeError: 
    mapping = mmap.mmap(bigfile.fileno(), 0, None, mmap.ACCESS_READ) 
data = mapping.read(length) 
# example, finding a pattern 
pat =re.compile("pattern",re.M|re.DOTALL) 
print pat.findall(data) 
+1

+1 메모리 매핑 –

0

이 데이터에 대한 구조는 고객 레코드의 큰 목록처럼, 거기에, 또는 이미지, 오디오 또는 비디오 데이터와 같은 하나의 큰 덩어리인가? 전자의 경우 데이터를 데이터베이스로 재구성 할 수 있습니다. sqlite는 Python 2.5와 같이 Python에 포함되어 있으며 많은 데이터 정렬 및 선별 작업에 충분합니다.

"큰"크기는 얼마입니까? 파이썬이 얼마나 많은 양의 데이터를 동시에 메모리에 저장할 수 있는지 놀랄 것입니다. 큰 데이터 목록에 대해 더 자세히 알려주세요.

관련 문제