2017-01-16 1 views
0

는이 같은 페이지에서 이메일을 얻을 필요가 HTML 다운로드 페이지에 "..."으로 나타납니다 이 코드는 내가 원하는 이메일을 찾지 못합니다. 프로필 사진 아래에서 볼 수있는 두 개의 이메일을 찾지 만 내 관심사가 아닌 페이지 하단에있는 이메일을 찾습니다.파이썬 3 이메일

전체 HTML 페이지를 다운로드하고 메일이 있어야하는 곳에 메일이 있어야하는 위치의 "..."및 그 아래의 줄에있는 경고 :

내 자바 스크립트가 브라우저에서 활성화 된 경우
<td class="fieldCell" id="cbfv_84"><span class="cbMailRepl" id="cbMa92357">...</span><noscript> 
This e-mail address is protected by spam bot, you must activate JavaScript in you browser in order to visualize it 
</noscript> 
</td> 
</tr> 
<tr class="sectiontableentry2 cbft_emailaddress" id="cbfr_97"> 
<td class="titleCell"><label for="cbfv_97" id="cblabcbfv_97">e-mail:</label></td> 
<td class="fieldCell" id="cbfv_97"><span class="cbMailRepl" id="cbMa92358">...</span><noscript> 
This e-mail address is protected by spam bot, you must activate JavaScript in you browser in order to visualize it 

그래서 내가 확인하고이 스크린 샷에서 볼 수 있듯이 이미이었다 http://prntscr.com/dwgl7w

그래서 내가 메일을받지 않고 페이지를 다운로드 할 수 있습니다 "밖으로립니다"어떻게 스팸 방지 봇 시스템에 의해 HTML 코드에서? 이것도 가능합니까?

+1

브라우저가이 프로토콜과 아무 관련이 없습니다. 이 페이지는 파이썬 스크립트가 처음부터 액세스 할 수 있도록 제작 된 것이 아니기 때문에이 텍스트는 오해의 소지가 있습니다. 사용중인 스크립트가 사이트에 액세스하여 읽고 사용하는 것처럼 행동합니다. 이 순간, 당신의 스크립트는 특정 작업을 수행하라는 간단한 자바 스크립트 스크립트를 실행하라는 간단한 captcha가 필요합니다. 스크립트가 js 스크립트를 실행할 수 없으므로 올바르게 감지되고 처리됩니다. –

답변

0

이메일 주소는 자바 스크립트에 의해 생성된다 : enter image description here

requests 또는 urllib는 JS 코드 hanlde 없다. 셀레늄을 사용하십시오.

+0

그 페이지의 맨 아래에 메일을 받고 있지만, 나는 원래의 게시물에 슬픈 것처럼 그것을 위의 하나를 원한다 : http://prntscr.com/dwrjs7 – Steve

+0

@ 스티브 내 대답을 업데이 트했습니다. –