2017-11-04 1 views
0

비디오 제목, 비디오 ID, 비디오 게시 시간, Youtube의 비디오에서 비디오 뷰어를 포함한 정보를 얻고 싶습니다. 하지만 올바른 xpath를 찾는 방법을 모르겠습니다. 다음 코드는 다음과 같습니다 : How to extract the title of a youtube video using python파이썬을위한 정확한 youtube xpath를 찾는 법

'Chrome'과 'firefox'의 'firefox'검사를 사용하려고했지만이 모든 것이 코드에서 작동하지 않았습니다 (발견 된 xpath는 다음과 같습니다 : // * [@ id = "컨테이너"]/h1). 결과는 모두 빈 목록입니다.

import lxml 
from lxml import etree 

youtube = 
etree.HTML(urllib.request.urlopen("https://www.youtube.com/watch? 
v=Tqyu6E_k_cg").read()) 

video_title = youtube.xpath("//span[@id='eow-title']/@title") 

print (''.join(video_title)) 

그래서 내가 어떻게 그 WOR 수있는 시간적으로, 동영상 ID, 시청자에 대한 올바른 XPath를 찾아야한다?

답변

1
video title : //*[@class='watch-title'] 
view count : //*[(@class='watch-view-count')] 
upload date: //*[(@class='watch-time-text')] 

URL에서 비디오 ID를 가져올 수 있습니다.

+0

정말 고마워요. 왜냐하면 나는 html이나 xml에 대해 아무것도 배우지 않았기 때문에 이런 것들을 찾기가 정말로 어렵습니다. 고맙습니다. –

+0

@ HongliBu No issue 내가 당신을 위해 일했으면 좋겠다. –

0
import requests 
page = requests.get("https://www.youtube.com/watch?v=Tqyu6E_k_cg") 
youtube = html.fromstring(page.text) 


video_title = youtube.xpath("//*[@class='watch-title']/text()") 
video_count = youtube.xpath("//*[(@class='watch-view-count')]/text()") 
video_date = youtube.xpath("//*[(@class='watch-time-text')]/text()") 

수정 후이 코드가 작동합니다!

+0

제안 사항이 있으시면 주저없이 게시하십시오. –

관련 문제