2016-08-22 11 views
0

저는 웹 사이트를 구문 분석하고 거기에있는 모든 href를 가져 오는 구문을 작성하고 있습니다. 그러나 bs4를 가져 오려고하면 "ImportError : 'HTMLParseError'이름을 가져올 수 없습니다. 파이썬 3.5.2를 사용하고 있습니다.Beautifulsoup을 가져올 때 오류가 발생했습니다.

나는 이전 참조를 취하여 그 원인이 될 수 있음을 알고 있습니다. bs4의 이전 버전이므로 버전 4.5.1로 업그레이드되었습니다. 그러나 오류가 여전히 존재합니다. 구문에 이상이 있습니까 (이전 참조에서 또한 아래에 첨부 된) 또는 다른 도구를 찾아야합니다. 작업을 수행하는?

누구? 한 가지 더, 나는 또한 LXML를 설치하려고 어떤 생각 (이 vcvarsall.bat을 찾을 수 없습니다했다)하지만 너무. 그래서, 많은되지 도구 내가 사용할 수 있습니다 실패 할 수 .

from bs4 import BeautifulSoup 
import urllib.request 

def open_html(): 

    resp = urllib.request.urlopen("http://www.gpsbasecamp.com/national-parks") 
    soup = BeautifulSoup(resp, from_encoding=resp.info().get_param('charset')) 

    for link in soup.find_all('a', href=True): 
     print(link['href']) 

if __name__ == '__main__': 
    open_html() 
+1

BeautifulSoup을 4.5.1 버전으로 업그레이드하기 위해 수행 한 단계는 무엇입니까? 아마도 이전 버전이 아직 존재합니까? –

+0

'pip list'를 실행하십시오. Beautifulsoup4가 나열되어 있습니다 –

답변

0

: 나는 주제를 참조

pip install [name_of_file]

하지만 그 사람을 위해이 문제를 제거하는 간단한 방법 : 다음 열고 cmd를, CD는이 파일을 저장 한 위치 DICT 및 명령을 사용하는 대안으로, BS 4.4.1과 lxml 3.6 (https://docs.continuum.io/anaconda/pkg-docs)을 이미 포함하고있는 Anaconda python을 설치하십시오. 또한 일반적으로 Anaconda는 패키지 관리를 산들 바람처럼 쉽게합니다.

+0

의견 주셔서 감사합니다. 아나콘다는 휴대 할 수 있습니까? 관리자 권한이없는 컴퓨터에서 Python을 코딩 할 수 있으므로 설치할 수 없습니다. 지금 WinPython을 사용하고 있는데, 실행을 위해 컴퓨터에 등록하지 않아도됩니다. –

+0

사실,이 오류는 Visual Studio의 결함으로 인해 발생합니까? –

+0

Linux 및 Mac 컴퓨터에서 관리자 권한이없는 계정에 여러 번 설치했습니다. 그것은 상자 밖에서 아무 문제없이 실행됩니다. 그래서 나는 VS가 전제 조건은 아니라고 생각하지만, 오랫동안 Windows에서 아무것도 시도하지 않았습니다. – dgg32

관련 문제