저는 Python에 익숙하지 않습니다. 여기에 내 질문이있다. BeautifulSoup를 사용하여 HTML 태그 외부에서 데이터를 추출하는 방법
나는 다음과 같은 웹 페이지 나 웹 페이지에서 데이터를 수집하기 위해 BeautifulSoup로를 사용하는 방법에 대한 자습서를 지켜 봤는데 NDBC - Station 46011.에서 데이터를 추출하기 위해 노력하고있어 및 내가 지금까지 코드를 다음 있습니다 :import requests
from bs4 import BeautifulSoup
url = 'http://www.ndbc.noaa.gov/data/latest_obs/46011.rss'
r = requests.get(url)
soup = BeautifulSoup(r.content)
data_types = soup.find_all('strong')
for item in data_types:
print(item.text)
이것은 다른 데이터 유형 (풍향, 속도, 돌풍 등)을 제공합니다. 그러나이 웹 페이지에서 숫자 데이터를 추출하는 데 문제가 있습니다. 웹 페이지 소스를 보면 수치 데이터가 'strong'태그 다음이고 'br'태그 앞에 있다는 것을 알 수 있습니다. 명시 적으로 두 태그 사이에이 데이터를 추출하는 데 문제가 있습니다.
미리 감사드립니다.
당신이뿐만 아니라 추가 단계가 필요하면 알려주세요 :-) 도움이
당신은, 예를 들어 봤어 http://stackoverflow.com/q/8220732/3001761? – jonrsharpe