나는 TV 캐치 업 웹 사이트에서 HTML을 가져 오는 프로그램을 만들고 나서 split 함수를 사용하여 모든 HTML 데이터를 채널 이름과 현재 사용중인 프로그램으로 나눕니다 테이블 : BBC 1 - '프로그램 이름'. 나는 누군가가 중대하게 평가할 것을 도울 수있는 경우에 나의 첫번째 균열 기능 후에 나가하는 무슨을에 다만 도움을 필요로한다.파이썬 웹 페이지 데이터 가져 오기
import urllib2
import string
proxy = urllib2.ProxyHandler({"http" : "http://c99.cache.e2bn.org:8084"})
opener = urllib2.build_opener(proxy)
urllib2.install_opener(opener)
tvCatchup = urllib2.urlopen('http://www.TVcatchup.com')
html = tvCatchup.read()
firstSplit = html.split('<a class="enabled" href="/watch.html?c=')[1:]
for i in firstSplit:
print i
secondSplit = html.split ('1" title="BBC One"></a></li><li class="v-type" style="color:#6d6d6d;">')[1:]
for i in secondSplit:
print i
이것은 학교 수업이기 때문에 웹 페이지를 조작 할 때 사용법을 가르쳐 준 것이 그것이 학교에서 사용한 유일한 이유입니다. 또한 프록시 처리기를 분명히하기 위해 프로그램이 실제로 프록시를 통해 학교에있을 때 인터넷에 액세스 할 수 있습니다. – user1655562
저는 현재 전체 코드를 작성하고 있습니다. 제발 잠시만 기다려주십시오 :) – Goranek
감사합니다. 내가 혼란스러워하는 일은 내가 HTML 목록을 작성하고 목록을 반복 작성하고 HTML의 나머지 부분을 제거하는 방법이다. 내가 무엇을 해야할지 전혀 모른다. – user1655562