Chrome DevTools를 사용하면 페이지의 DOM 트리를 볼 수 있습니다. 거기에 액세스하고 파이썬을 사용하여 해당 트리를 꺼내 방법이 있습니까?Python으로 Chrome DOM 트리에 액세스
답변
내가 selenium.webdriver
를 사용하고 발견하는 가장 좋은 방법 :
import selenium.webdriver as webdriver
import lxml.html as lh
import lxml.html.clean as clean
browser = webdriver.Chrome() # Get local session of Chrome
browser.get("http://www.webpage.com") # Load page
content=browser.page_source
cleaner=clean.Cleaner()
content=cleaner.clean_html(content)
doc=lh.fromstring(content)
문서가 lxml.html.HtmlElement
좋아요! http://stackoverflow.com/questions/43183736/beautifulsoup-does-not-returns-all-data/43191283#43191283에서 사용됨 –
BeautifulSoup 라이브러리를 사용해 보셨나요? 이 자습서의이 섹션은 귀하의 질문에 대한 답변을 줄 수 있습니다. http://www.crummy.com/software/BeautifulSoup/bs3/documentation.html#The 구문 분석 트리
그런 다음 요청 라이브러리도 가져와야합니다.
from BeautifulSoup import BeautifulSoup
import requests
url = 'http://www.crummy.com/software/BeautifulSoup/bs3/documentation.html'
page = requests.get(url)
soup = BeautifulSoup(page.content)
print soup
@ michellesun - 답변 해 주셔서 감사합니다.하지만 불행히도 이것은 자바 스크립트가 제공하는 동적 콘텐츠가없는 HTML 만 가져옵니다. – root
@root : 동적으로 생성 된 콘텐츠가 중요한 경우 해당 요구 사항을 질문에 추가해야합니다. 생성시기와 방법을 설명하십시오. 사용자 상호 작용을 요구하면 표시 범위가 확장됩니다. – Shog9
@ Shog9 - Chrome dom 트리에 액세스하는 것에 대한 질문이있었습니다. 그 이유를 충분히 설명 할 필요가 없다고 생각했습니다. 학사와 html 페이지에 액세스하는 것은 내가 요청한 것과 다소 다르다. 게다가, 동적 인 내용은 논평에서 언급되었다. – root
- 1. DOM 트리에 대한 출력 없음
- 2. KML 트리에 액세스
- 3. 페이지에서 NPAPI에 액세스 DOM
- 4. 자바 스크립트로 DOM 트리에 HTML 문자열을로드하십시오.
- 5. Chrome 디버거에서 DOM 요소를 개체로보기
- 6. Chrome DevTools : 원격 DOM 수정
- 7. Python으로 Facebook API 데이터에 액세스
- 8. Chrome 확장 프로그램의 Chrome 설정에 액세스
- 9. DOM 액세스 소자 JS
- 10. chrome javascript dom iframe backgroundimage 제거
- 11. 모든 브라우저에서 작동하는 Chrome JS/Dom?
- 12. QUOTA_EXCEEDED_ERR : DOM Exception 22 in chrome
- 13. 속성이 Chrome/Firefox의 기본 DOM 속성인지 확인
- 14. C++에서 mySQL B- 트리에 액세스
- 15. DOM 트리에 요소를 추가하자마자 즉시 읽을 수 있습니까?
- 16. HTML 구문 분석에서 <script> 태그가 DOM 트리에 삽입됩니까?
- 17. dom 트리에 추가하려면 append()가 body 태그에 있어야합니까?
- 18. 인터넷에 Python으로 액세스 할 수 없는지 확인하십시오.
- 19. JDBC를 통한 Chrome 기록 액세스
- 20. Java에서 HTML DOM 요소에 액세스
- 21. C#에서 DOM 요소에 액세스
- 22. ember.js보기에서 DOM 요소의 속성에 액세스
- 23. Python으로 쿠키로드하기
- 24. 뒤로 버튼, Chrome 및 DOM 업데이트에 심각한 문제가 있음
- 25. SECURITY_ERR : Chrome 확장 프로그램에서 getImageData를 사용하는 경우 DOM 예외 18
- 26. Chrome 개발자 도구/firebug에서 DOM 요소 강조 표시 유지
- 27. Chrome 확장 프로그램 외부에서 생성 된 DOM 변경 감지
- 28. Chrome DOM 중단 점 이벤트를 콘솔에서 수동으로 연결할 수 있습니까?
- 29. Sitecore의 특정 역할에 하위 트리에 대한 읽기 액세스 제한
- 30. 어떻게 v8 구문 분석 트리에 액세스 할 수 있습니까?
왜 파이썬을 사용해야와 DOM을 얻는다? javascript 및 jquery와 같은 클라이언트 측 도구를 사용하여 dom에 액세스 할 수 있습니다. – voscausa
@ voscausa - 저는 파이썬으로 동적 인 내용을 분석하고 분석하려고합니다. – root