2016-06-29 2 views
0

웹 사이트에서 모든 날씨 데이터를 가져 오려고하는데, 어떤 이유로 든 모든 데이터를 가져 오지 못했습니다. 반환 된 데이터의 중간에는 누락 된 행이 네 개 있습니다. 나는 30-33 행을 놓치고있다.Python-Pandas url 요청이 모든 데이터를 반환하지 않습니다.

import pandas as pd 
url2 = 'http://www.intellicast.com/Local/Observation.aspx?unit=F&location=USMS0371' 

data2 = pd.read_html(url2) 
+0

전혀 놓치지 않았습니다. 데이터 프레임을 호출 할 때 데이터 프레임이 인쇄되는 방식입니다. 'pd와 같은 import pandas로 디스플레이 설정을 변경할 수 있습니다; pd.set_option ('max_rows', 1000); 데이터 2 '. 인쇄 된 모든 행이 표시되어야합니다. – Abdou

+0

또한'pd.read_html()'호출은 두 개의 데이터 프레임을 반환하고 두 번째 데이터 프레임을 선택하려고합니다 :'data2 = pd.read_html (url2, header = 0) [1]'. – Abdou

+0

감사합니다. 나는 둘 다 해냈다! –

답변

0

행이 누락되지 않았습니다. 그들은 전시 설정 때문에 판다에 의해 숨어있다. 당신과 함께 디스플레이 설정을 변경할 수 있습니다

import pandas as pd 
pd.set_option('max_rows',100) #To display 100 rows 

또한, 호출의 출력은 2 dataframes를 반환하고 당신은 두 번째를 원한다. 올바른 데이터 프레임을 얻으려면 다음을 수행하십시오.

data2 = pd.read_html(url2,header=0)[1] 

그냥 호출하여 표시 할 수 있습니다.

data2 

희망이 있습니다.

관련 문제