2010-01-27 6 views
0

웹 페이지를 구문 분석하여 비디오 다운로드 URL을 얻을 수 있습니다. 나는 파이썬과 방화범이 끌리지 만 URL 링크를 얻을 수 없다.파이썬으로 페이지 구문 분석하기

예 :

나는 동영상 링크를 얻을 수있는 URL이 : hxxp : //www.rtve.es/mediateca/videos/20100125/saber-comer---salsa-verde-judiones -25-01-10/676590.shtml "

비디오는 hxxp된다 //www.rtve.es/resources/TE_SSAC011/flv/8/2/1264426362028.flv 당신이 날 도와 줘요 수 ? 많은 영어에 감사드립니다.

+0

btw, 동영상 클립을 다운로드 할 수 있습니까? – YOU

+1

해당 비디오 링크는 javascript에 의해 생성됩니다. – ghostdog74

답변

5
+0

+1 BeautifulSoup – miku

+0

감사합니다. 문제는 내가 비디오 링크를 얻을 수 없다는 것입니다. 그러나 웹 페이지에서 재생 버튼을 누르면 firefox 확장자 인 "Download Helper"가있는 비디오 파일을 다운로드 할 수 있지만이 작업은 자동으로 수행하고 싶습니다. 어떤 도움을 주시겠습니까? – mmm286

+0

그런 다음 문제를 잘못 전달했습니다. SWF 파일을 디 컴파일해야하는 경우 다른 곳을 봐야합니다. –

0
import re 
from urllib2 import urlopen 
text = urlopen('http://www.rtve.es/mediateca/videos/20100125/saber-comer---salsa-verde-judiones-25-01-10/676590.shtm').read() 
reg = re.compile(r'http://www\.rtv.*flv') 
reg.findall(text) 

정상적으로 사용할 수 있습니다. 하지만 내부에 링크가 없습니다.

+0

BeatifulSoup 또는 mechanise를 사용할 수도 있습니다. – bluszcz

+0

감사합니다. 문제는 내가 비디오 링크를 얻을 수 없다는 것입니다. 그러나 웹 페이지에서 재생 버튼을 누르면 firefox 확장자 인 "Download Helper"가있는 비디오 파일을 다운로드 할 수 있지만이 작업은 자동으로 수행하고 싶습니다. 어떤 도움을 주시겠습니까? – mmm286

0

@OP,이 비디오는 자바 스크립트에 의해 생성됩니다. 이 주제는 here을 참조하십시오. 참조 용으로 search google.

+0

많은 고마워, 나는 대안을 찾으려고 노력하지만 아무 것도 찾지 못한다. 나는 비디오 dowloads에 수동으로해야한다 :-( 많은 감사합니다! – mmm286

관련 문제