2017-02-12 1 views
0

저는 팬더를 사용하고 csv 파일에서 데이터 프레임을 만들고 to.dict 함수를 사용하여 사전에 두 개의 값을 만들었습니다.pandas python : csv는 데이터 프레임 to.dict가됩니다. 열을 액세스하고 그 데이터로 뭔가를 수행하는 방법

이제 사전에 넣은 값에 액세스하고 싶습니다. 정확히 어떻게합니까?

with open("tweet_raw.csv") as csvfile: 
    colnames = ['created_at', 'id', 'idstr', 'text1'] 
    rdr = pd.read_csv(csvfile, header=None, 
         names=colnames, 
         usecols=["created_at", "id", "idstr", 'text1']).set_index('created_at')['text1'].to_dict() 

    values = rdr.values() 
    #dict(zip(list(rdr.created_at), list(rdr.text1))) 
    #pprint(rdr) 

def sentenceTokeniser(): 
    zen = values(list(values)['text1']) 
    zen.words 

모든 종류의 오류가 dict 객체에서 호출 할 수 없습니다. 그것을 액세스하는 올바른 방법은 무엇입니까?

감사

+0

df를 dict로 변환해야합니까? df.loc을 사용하면 csv의 열과 행을 분할하고 잘라내는 데 적합한 방법처럼 보입니다. – gregory

답변

0

당신이 열을 액세스하려면, 당신은 열을 액세스하는 시리즈 개체를 가져 LOC를 사용할 수 있습니다. 인덱스는 set_index의 열입니다.

rdr = pd.read_csv(csvfile, header=None, 
        names=colnames, 
        usecols=["created_at", "id", "idstr", 'text1']).set_index('created_at') 
values = rdr.loc[:, 'text1'] 
print type(values) 
관련 문제