2014-07-27 2 views
1

URL을 열고 HTML 코드에서 윤곽선을 작성하는 함수를 작성하려고합니다. 윤곽선에 임의의 ... 태그가 포함되어야합니다. 특정 웹 페이지의 윤곽선. 각 제목 수준에는 번호가 매겨진 x 레벨의 제목이있는 번호가 올바르게 지정되어야합니다. 시작하는 방법?웹 페이지, 파이썬에서 윤곽선을 작성하십시오.

+2

html과 해당 출력의 예를 줄 수있는 것이 더 분명합니다. – user2963623

+0

http://stackoverflow.com/questions/11709079/parsing-html-python –

+0

@ user2963623 기본적으로이 http에서 개요를 만듭니다. : //homepage.cs.uiowa.edu/~lillis/016/2014Summer/assignments/HW12/jazz.html – jhg6699

답변

0

headings 외에도 연결된 html에는 많은 태그가 있습니다. 어쨌든 이것은 당신을 시작하게하는 것입니다 :

beautifulsoup4이 필요하고 this을 요청하십시오. 파이썬은 이러한 opration을 위해 인 빌트 패키지를 제공하지만 위의 2 가지 패키지는 작업을 매우 쉽게 만듭니다.

import requests 
from bs4 import BeautifulSoup 

html = requests.get("http://homepage.cs.uiowa.edu/~lillis/016/2014Summer/assignments/HW12/jazz.html").text 
#If you want to parse another url, change the link within get() 
soup = BeautifulSoup(html, "lxml") 
print soup.body 

이것은 htmlbody 태그 내의 모든 tags, texts 등의 내용을 인쇄합니다. 다른 출력물이나 더 구체적인 것을 원하면 아래에 주석을 달아주십시오. 코드를 변경하겠습니다.

+0

태그를 사용하여 개요를 구성하는 또 다른 방법은 무엇입니까? – jhg6699

+0

그래서 제목 태그 만 원하십니까? – user2963623

+0

예. 그리고 당신이 표제의 줄을 읽을 때, 그들은 찌르거나 나열하고 있습니까? – jhg6699

관련 문제