지금까지 미국에서 발생한 토네이도에있는 거대한 데이터를 분석해야하는 프로젝트를 진행하고 있습니다. 파이썬이 데이터 분석에 유용하기 때문에 나는 그것을 선택했다. 하지만 몇 가지 질문이 있습니다. 명확한 설명이 필요합니다. 1. 데이터 분석을 위해 팬더를 사용하고 있습니다. 내가 지금까지 한 것은 모든 .csv 파일을 포함하는 하나의 큰 데이터 프레임 (1GB .csv 파일)을 만들었습니다. 2000 년에 발생한 총 사망자 수를 계산하고 싶다고 가정 해 봅시다. 쿼리가 결과를 가져 오지만 시간이 오래 걸립니다. 모든 데이터를 데이터 프레임에 저장하고 데이터를 가져 오는 것이 좋습니까? 아니면 다른 빠른 접근 방식이 있습니다. 2. 또 다른 접근법은 전체 파일의 json 문자열을 만들고 json 문자열을 쿼리합니다. 나는이 접근법에서 아무 것도하지 않았다. 좋은 분이십니까?데이터를 가져 와서 파이썬으로 분석하기위한 접근법
감사합니다. https://dato.com/products/create/docs/generated/graphlab.SFrame.html
sframe 라이브러리는 빠르게로드하고 쉽게 색인입니다 바이너리 형식으로 저장할 수 있습니다 :