내가 발견했습니다 <span>...</span>
섹션. 웹 드라이브를 사용하면 해당 섹션이 포함됩니다. 그러나 웹 드라이버가 오래 걸리는 것 같아서 코드가 좀 더 엉망이됩니다. webdriver를 사용하지 않고 HTML 문서 전체를 검색하는 방법이 있습니까?urlopen (URL)와 전체 HTML 검색
0
A
답변
1
이 도움이 될 것입니다 있는지, 유명한 요청 라이브러리를 사용할 수 있습니다 훨씬 간단하고 <span>
태그의 내용을 구문 분석 솔루션을 쉽게 읽을 수 :
1
당신은 아래의 코드가 여기에
import requests
from bs4 import BeautifulSoup
page = requests.get('https://www.google.com/')
soup = BeautifulSoup(page.text, 'lxml')
span = soup.find_all('span')
print(span)
+0
아직 받고 있습니다. .... 다른 방법을 시험해보십시오. 나는 코드를 여기에 게시했다 : https://github.com/mws75/UserName_by_Tag/blob/master/HashTag_SE_Test.py – Mwspencer
관련 문제
- 1. Urllib2 urlopen html 불완전
- 2. Angularjs 전체 HTML 검색
- 3. html 콘텐츠의 전체 텍스트 검색
- 4. HTML 엔티티에 대한 MySQL 전체 텍스트 검색
- 5. 전체 CSS가 포함 된 크리스탈 보고서의 전체 HTML 코드 검색
- 6. Google 검색 결과 페이지에서 전체 HTML 콘텐츠를 얻는 방법
- 7. Python urlopen 오류
- 8. 파이썬 urlopen 출력 잘못된
- 9. urlopen 디버그 python3에서
- 10. urllib2.Request 전체 HTML 라인
- 11. SQL 전체 텍스트 검색
- 12. urlopen for for beautifulsoup
- 13. 전체 테이블 검색 전체 쿼리
- 14. 전체 앱에서 전체 "검색 기능"
- 15. HTTP403 오류 urllib2.urlopen (URL)
- 16. URLError : urlopen 오류가 만료되었습니다.
- 17. Python 3 urlopen 사용
- 18. urlopen 오류 동안
- 19. Python 3 Urlopen 문제
- 20. urlopen()와 [urllib2가]
- 21. urlopen windows ftp 오류
- 22. urllib2.urlopen()이 페이지를 실제로 가져 옵니까?
- 23. urllib2.urlopen() 다른 결과를 반환합니다.
- 24. 전체 테이블을 반환하는 mysql 검색
- 25. HTML/XML 데이터에 대한 SQL 전체 텍스트 검색
- 26. Sql Server 2008에서 html 태그를 무시하는 방법 전체 텍스트 검색
- 27. 전체 HTML 본문 내용을 일부 URL에서 검색 한 데이터로 바꿉니다.
- 28. 데이터베이스가없는 PHP 전체 텍스트 검색
- 29. mysql 전체 텍스트 검색
- 30. 전체 텍스트 검색
이것은 여전히 나에게 단지 ...을 준다. 속성을 추가하면 findAll 목록은 []입니다. wedDriver가 html의 모든 내용을 수집 할 수있는 유일한 방법 인 것 같습니다. 다른 메소드의 예를보고 싶다면 https://github.com/mws75/UserName_by_Tag/blob/master/HashTag_SE_Test.py – Mwspencer
Hello BananjanB, 사과드립니다. 지금까지 이것을 시험 할 시간이 있지만, 당신의 방법은 훌륭하게 작동합니다. 빠르고, 필요한 정보를 얻습니다. 나는 페이지의 더 많은 것을로드하는 방법을 알아 내지 못했기 때문에 이것이 나의 다음 단계이다. 그러나 내가 알아낼 수 있다면, 내 웹 스크래퍼는 셀레늄을 사용하는 것보다 훨씬 빠를 것입니다. 당신의 도움을 주셔서 감사합니다. – Mwspencer