2017-04-04 1 views
0

Google 저장 용량을 Google datalab으로 읽은 다음 데이터가있는 변수가 있지만이를 pandas Dataframe으로 변환해야합니다.Google 저장 용량이 pandas 데이터 프레임

나는 읽고있다 :

1/1/2016 08:35:56,1,4756798,"7501073831988",1.00,15.00,0.16,"S0394",4388,2,10.43\r\n1,1/1/2016 08:35:56,1,4756798,"850697002395",1.00,13.50,0.00,"S0394",4388,2,10.36\r\n1,1/1/2016 08:35:56,1,4756798,"850697002425",1.00,10.00,0.00,"S0394",4388,2,7.29\r\n1,1/1/2016 08:38:55,2,1013642,"8469760102003",1.00,200.00,0.16,"C0278",2595,1,161.20\r\n 

어떤 도움을하시기 바랍니다 :

%%gcs read --object $objeto1 --variable prueba 

변수 prueba처럼 보이는?

+0

이 :. DF = bq.Query ('타블라 SELECT * FROM') to_dataframe (), 내 개체를 pandas Dataframe으로 변환하는 것만으로도 충분하지만 스토리지의 변수에서 이와 비슷한 작업을 수행 할 수 있습니다. AttributeError : 'str'개체에 'to_dataframe'특성이 없습니다. –

+0

변수를 다음과 같이 StringIO로 래핑하십시오. https : //stackoverflow.com/questions/37990467/how-can-i-load-my-csv-from-google-datalab-to-a-pandas-data-frame – Tautvydas

답변

0

나는 당신이 당신의 datalabs 기계로 GCS에서 파일을 읽을 제안 : 내가 예를 들어 BigQuery의에서 쿼리를 읽어

def (gcs_path, csv_file_name): 
    get_ipython().system(u'gsutil cp ' + path + csv_file_name+' .') 
    df = pd.read_csv(csv_file_name) 
    return df 
관련 문제