2017-03-22 4 views
0

사이트에서 href를 얻기 위해 bs4를 사용하고 있습니다.beautifulsoup4 : href를 얻고 "#"을 반환하십시오.

<a class="aaa" target="12345" href="someURL" 
data-track="HOT:SR:HotelModule" tabindex="0"> 
     <span class="visuallyhidden"> 
     some text here 
     </span> 
</a> 

HTML은 위와 같습니다. 이 코드를 사용하여 URL의 대부분을 얻을 수 있습니다 :

for URL in res.select('.someClass') 
URL.select('a')[0]['href'] 

하지만 반환 값의 일부

내가 웹 사이트의 소스 코드를 확인하신 후 # 이고 나는 href가 정말 여기 찾아 그것은 # 아니다.

무엇이 잘못되었지만 URL이 아닌가?

여기 제가 시도한 the website입니다. + VIP 태그가있는 호텔에서 문제가 발생했습니다.

답변

0

어쩌면 그들은 <a href="#" onclick="myJsFunc();">Link</a>을 사용하고있을 것입니다. href가 없습니까? different = 파서를 사용하면 다른 결과가 나올 때 차이점이 있습니다. 그들 모두를 사용하여 시도하고 결과 xml, html5lib 확인, html.parser" Difference between parsers one <code>href</code> = #

+0

오! 나는 href = "#"이 내 목표 href와 동일한 클래스에 있다는 것을 알았고, 그것은 나의 표적 앞에있다. 그래서 나는 표적 대신 #을 얻었다. 고맙습니다. –

+0

하하, 문제 없습니다. 자바 스크립트는 까다로울 수 있으며 Selenium과 상호 작용하는 것을 볼 수 있기 때문에 Selenium은 매우 유용한 모듈입니다. –