파이썬에서 특정 주석을 찾을 수 없습니다 (예 : <!-- why -->
). 내 주된 이유는 2 개의 특정 코멘트 안에있는 모든 링크를 찾는 것입니다. 파서와 같은 것.Python을 사용하여 HTML 코드의 특정 주석 찾기
import urllib
over=urlopen("www.gamespot.com").read()
soup = BeautifulSoup(over)
print soup.find("<!--why-->")
을하지만 그것은 작동하지 않습니다 나는 Beautifulsoup
와 함께이 시도. 이 아닌 regex
을 사용해야 할 수도 있습니다.
도와주세요.
예 : 우리는이
<!--why-->
www.godaddy.com
<p> nice one</p>
www.wwf.com
<!-- why not-->
편집과 같은 HTML 코드가 : 2 주석 사이에 다른 물건, 태그처럼있을 수 있습니다.
그리고 모든 링크를 저장해야합니다.
>>> from bs4 import BeautifulSoup, Comment
>>>
>>> s = """
... <p>header</p>
... <!-- why -->
... www.test1.com
... www.test2.org
... <!-- why not -->
... <p>tail</p>
... """
>>>
>>> soup = BeautifulSoup(s)
>>> comments = soup.findAll(text = lambda text: isinstance(text, Comment))
>>>
>>> comments
[u' why ', u' why not ']
을 그리고 당신이 그들을있어 일단, 당신은 주위를 이동하는 보통의 트릭을 사용할 수 있습니다 : 당신이 모든 의견을 원하는 경우에
모든 사람에게 도움이 될 실질적인 예를 들어주세요. –