일부 자바 스크립트 태그가 포함 된 HTML 파일이 있습니다. IE와 같은 일부 브라우저에서이 파일을 실행하면 일부 내용이 소스에서 캐시되고 브라우저 (예 : 일부 도시의 날씨)에 표시됩니다. 이 html
파일을 실행하고 이전에 웹 브라우저에 표시된 웹 페이지의 내용을 가져 오는 방법은 무엇입니까? 내 응용 프로그램에 내용을 표시하고 싶지 않습니다. 나는 반환 된 데이터를 파싱하고 (예를 들어 각 도시의 날씨를 추출하는) 몇 가지 특별한 내용을 추출하려고합니다. 누군가 나를 안내 할 수 있습니까?java : html 내용 얻기
-1
A
답변
1
당신이하려는 것은 html 스크래핑이라고합니다.
최선의 선택은 conemon 및 복잡한 작업이므로 라이브러리 형태로 도움말을 얻는 것입니다.
이 질문을 참조하십시오 : Options for HTML scraping?
0
셀레늄은 좋은 내기이다. 다른 브라우저에서 HtmlUnit, Firefox, Chrome을 지원합니다.
관련 문제
- 1. Java + Mozilla XPCOM에서 HTTP 스트림의 내용 얻기
- 2. QueryPath를 사용하여 임의의 HTML 요소 내용 얻기
- 3. Java/DOM : 노드의 XML 내용 얻기
- 4. MultipartFile의 내용 얻기
- 5. ContextMenuListener의 뷰에있는 내용 얻기
- 6. txt 파일의 내용 얻기
- 7. Spreadsheet_Excel_Writer 파일 내용 얻기
- 8. plist 내용 얻기
- 9. AppleScript의 Safari 윈도우 내용 얻기
- 10. Itext에서 PDF 파일 내용 얻기
- 11. JFrame : 실제 내용 크기 얻기
- 12. Express가있는 Node.js의 URL 내용 얻기
- 13. 원격 txt 파일의 내용 얻기
- 14. JavaScript로 작성한 링크의 내용 얻기
- 15. PHP에서 이미지 객체의 내용 얻기
- 16. GDB 내부 : 가변 내용 얻기
- 17. C# 내의 ContentPlaceHolder 내용 얻기
- 18. IntelliJ의 최신 디렉토리 내용 얻기
- 19. 404 오류 페이지 응답 루비의 내용 얻기
- 20. php : 피드 버너 피드의 내용 얻기
- 21. html - 내용 늘이기
- 22. 변환 HTML div의 내용
- 23. html 페이지 내용 확인하기
- 24. HTML - 데이터 내용 필드
- 25. Google지도의 오른쪽에있는 HTML 내용
- 26. 버튼 인쇄 HTML 내용 -
- 27. HTML 내용 폭
- 28. Java 클래스의 내용 나열
- 29. Pycurl로 HTML 얻기
- 30. 기본 SharePoint HTML 얻기
이 질문은 너무 불특정이며,이 seeems으로, 자바와는 아무 상관이있다. 나는'java' 태그를 자른다. – HerrSerker
자바 응용 프로그램을 서버에서 사용하고 싶다. 입력을 받고 사이트에서 가져온 데이터를 반환합니다. 웹 서버에서받은 HTML 파일이나 내용을 파싱하고 선호하는 태그를 추출하려면 자바 라이브러리가 필요합니다. 그래서 제 질문은 자바에 관한 것입니다! – sajad