2016-10-21 4 views
1

소셜 미디어 정서 분석에 대한 연구를하고 있습니다. 나는 pkl 파일에 저장된 2 개월 동안 켄터키 더비에 관한 트윗을 모두 받았다.피클 파일에서 팬더 데이터 프레임으로 데이터를 가져 오는 방법

내 질문은 :이 피클 덤프 파일을 데이터 프레임에로드하려면 어떻게해야합니까? 여기

내 코드입니다 :

import sklearn as sk 
import pandas as pd 
import got3 

def daterange(start_date, end_date): 
for n in range(int ((end_date - start_date).days)): 
    yield start_date + timedelta(n) 

start_date = date(2016, 3, 31) 
end_date = date(2016, 6, 1) 

dates = [] 

for single_date in daterange(start_date, end_date): 
    dates.append(single_date.strftime("%Y-%m-%d")) 

for i in range(len(dates)-1): 
    this_date = dates[i] 
    tomorrow_date = dates[i+1] 
    print("Getting tweets for " + tomorrow_date) 
    tweetCriteria = got3.manager.TweetCriteria() 
    tweetCriteria.setQuerySearch("Kentucky Derby") 
    tweetCriteria.setQuerySearch("KYDerby") 
    tweetCriteria.setSince(this_date) 
    tweetCriteria.setUntil(tomorrow_date) 
    Kentucky_Derby_tweets = got3.manager.TweetManager.getTweets(tweetCriteria) 
    pkl.dump(Kentucky_Derby_tweets, open(tomorrow_date + ".pkl", "wb")) 
+0

목록에 각 항목을로드하고 마스터 목록에 각 목록을 추가 한 다음 목록을 사용하여 'DataFrame'에 넣을 수 있습니다 –

답변

1

사용할 수 pd.read_pickle (파일 이름); 그것을 목록에 추가하십시오; then pd.concat (thelist)

관련 문제