다음은 현재 코드입니다. 내가 뭘 잘못하고 있는지 모르겠다. 어쩌면 나는 html에서 충분히 깊이 파고 있지 않고 Beautifulsoup에게 적절한 태그를 제공하지 않을 것인가? 지금은 코드가 공백으로 표시됩니다.Beautifulsoup4 및 Python 3을 사용하여 웹 스크랩하는 방법
from bs4 import BeautifulSoup
from urllib.request import urlopen
html = urlopen("https://www.youtube.com/watch?v=5_zrHZdhaBU")
soup = BeautifulSoup(html,'html.parser')
nameList = soup.findAll("div", {"id": "cp-2"})
for name in nameList:
print(name.get_text())
다음은 내가 검사 한 코드입니다.
<div id="cp-2" class="caption-line" data-time="7.54"><div class="caption-line-time">0:07</div><div class="caption-line-text">but it was untucked.</div></div>
*** 편집
코드가 옆에있는 공유 버튼을 "더"를 클릭하여 확인할 수 있습니다 파이썬 나에게 다시 돌아 얻으려고 "하지만 untucked했다". 그런 다음 성적표를 클릭하면 거기에 모든 텍스트가 표시됩니다.
합니다. 이 선은 무엇입니까? –
아약스를 통해 동적으로로드되지 않았습니까? 오픈 페이지 소스, 정적 소스에는 이러한 요소가 없을 수 있습니다. –
@Yevhen Kuzmovych youtube 페이지로 이동하면 공유 옆에 "more"버튼이 있습니다. 그것을 클릭 한 다음 성적표를 클릭하십시오. 줄 0:07입니다. –