저는 웹 사이트를 구문 분석하고 거기에있는 모든 href를 가져 오는 구문을 작성하고 있습니다. 그러나 bs4를 가져 오려고하면 "ImportError : 'HTMLParseError'이름을 가져올 수 없습니다. 파이썬 3.5.2를 사용하고 있습니다.Beautifulsoup을 가져올 때 오류가 발생했습니다.
나는 이전 참조를 취하여 그 원인이 될 수 있음을 알고 있습니다. bs4의 이전 버전이므로 버전 4.5.1로 업그레이드되었습니다. 그러나 오류가 여전히 존재합니다. 구문에 이상이 있습니까 (이전 참조에서 또한 아래에 첨부 된) 또는 다른 도구를 찾아야합니다. 작업을 수행하는?
이누구? 한 가지 더, 나는 또한 LXML를 설치하려고 어떤 생각 (이 vcvarsall.bat을 찾을 수 없습니다했다)하지만 너무. 그래서, 많은되지 도구 내가 사용할 수 있습니다 실패 할 수 .
from bs4 import BeautifulSoup
import urllib.request
def open_html():
resp = urllib.request.urlopen("http://www.gpsbasecamp.com/national-parks")
soup = BeautifulSoup(resp, from_encoding=resp.info().get_param('charset'))
for link in soup.find_all('a', href=True):
print(link['href'])
if __name__ == '__main__':
open_html()
BeautifulSoup을 4.5.1 버전으로 업그레이드하기 위해 수행 한 단계는 무엇입니까? 아마도 이전 버전이 아직 존재합니까? –
'pip list'를 실행하십시오. Beautifulsoup4가 나열되어 있습니다 –