2013-08-03 3 views
0

html.parser 설명서를 읽었으나 anchorlist 속성이 HTMLParser 클래스는 아닙니다. Python 2.x에는 그 속성이 있습니다.은 HTMLParser 속성과 혼동 됨

나는 그것을 찾았지만 대답을 찾을 수 없습니다. Python 3.x에서는 HTMLParser 클래스에 있습니까?

+0

이 속성을 어디에서 보았습니까? 당신은 그것에 대한 참조가 있습니까? –

+0

@BurhanKhalid : http://docs.python.org/2/library/htmllib.html#htmllib.HTMLParser.anchor_bgn –

답변

1

anchorlist 속성은 htmllib.HTMLParser class의 일부입니다. 모듈은 파이썬 2.6에서 사용되지 파이썬 3

파이썬 3의 html.parser 모듈에 존재 하지가되었습니다, 다른 한편으로는, 그것은 하지anchorlist 속성이 있는가 파이썬 2에 HTMLParser을 불렀다.

당신은 어떤 a 태그, 시작 태그 이벤트를 수신하여 속성을 에뮬레이션 할 수

가 동일한 목록 구축 목록에 (있는 경우) href 속성을 추가 또는

from html.parser import HTMLParser 


class MyHTMLParser(HTMLParser): 
    def __init__(self, *args, **kw): 
     super().__init__(*args, **kw) 
     self.archorlist = [] 

    def handle_starttag(self, tag, attrs): 
     if tag == 'a' and 'href' in attrs: 
      self.anchorlist.append(attrs['href']) 

를 우호적 API를 사용 대신 BeautifulSoup처럼 링크 앵커를 수집하십시오.

+0

고맙습니다. 내가 할 수있는 것처럼 보입니다. – tixiangshu

+0

BeautifulSoup을 시도 할 것입니다. 질문을 수정 해 주셔서 감사합니다. – tixiangshu