블로그 게시물 (sample 1, sample 2)이 있습니다. HTML을 파싱하고 저자, 제목, 날짜, 문서 내용, 의견 (별도)을 검색하는 가장 좋은 방법은 무엇입니까? 전체 내용은 건너 뜁니다. 귀하의 블로그 사이트를 가정블로그 기사의 기사 내용/설명을 검색하고 추출하는 가장 좋은 방법은 무엇입니까
이
0
A
답변
0
RSS 피드를 가지고, 당신은 XML 여기
http://download.oracle.com/javase/1.4.2/docs/api/javax/xml/parsers/SAXParser.html
을 통해 채찍 자바의 SAX 파서를 사용하는 것은 SAX 파서
를 사용하여 RSS를 파싱 사람의 예
0
당신이 찾고있는 모든 것을 얻을 수는 없을지 모르지만, 나는 Boilerpipe을 살펴볼 가치가 있다고 생각합니다.
관련 문제
- 1. 블로그 기사 주소를 URL 재 작성하는 가장 좋은 방법은 무엇입니까?
- 2. 기사의 짧은 버전을 얻는 가장 좋은 방법은 무엇입니까?
- 3. 블로그 기사의 Wordpress 현지화 - 가능?
- 4. 웹 사이트를 검색하고 PHP에서 데이터를 검색하는 가장 좋은 방법은 무엇입니까?
- 5. WCF를 통해 인증하는 가장 좋은 방법은 무엇입니까?
- 6. 블로그 게시물에 여러 개의 태그를 추가하는 가장 좋은 방법은 무엇입니까?
- 7. 블로그 간의 링크 연결을 매핑하는 가장 좋은 방법은 무엇입니까?
- 8. 블로그 또는 댓글 스팸을 제거하는 가장 좋은 방법은 무엇입니까
- 9. 콘텐츠 (블로그, 기사) 개정 : Serverside 또는 JS?
- 10. Objective-C : NSString에서 하위 문자열을 추출하는 가장 좋은 방법은 무엇입니까?
- 11. 필요한 경우 데이터베이스에서 데이터를 추출하는 가장 좋은 방법은 무엇입니까?
- 12. 자바를 사용하여 zip 파일을 추출하는 가장 좋은 방법은 무엇입니까
- 13. HTML 파일 그룹에서 테이블 내용을 추출하는 가장 좋은 방법은 무엇입니까?
- 14. URL을 파싱하여 도메인을 추출하는 가장 좋은 방법은 무엇입니까?
- 15. 다른 DBMS에서 XML 데이터를 추출하는 가장 좋은 방법은 무엇입니까?
- 16. regexp를 사용하여 url의 호스트 부분을 추출하는 가장 좋은 방법은 무엇입니까?
- 17. HTML 페이지에서 요소를 추출하는 가장 좋은 방법은 무엇입니까?
- 18. 내 블로그 기사의 소스 코드 강조
- 19. 기사의 기사 및 태그가있는 데이터베이스를 표준화하는 올바른 전략은 무엇입니까?
- 20. 메일에서 시간대를 추출하는 가장 좋은 방법은 Java의 날짜 헤더입니까?
- 21. RSS의 기사 리드
- 22. Python 문자열에서 datetime을 추출하는 가장 좋은 방법
- 23. Microsoft Word에서 데이터를 추출하는 가장 좋은 방법
- 24. API 요청을 처리하는 가장 좋은 방법은 무엇입니까?
- 25. ASP.NET에서 URL을 생성하는 가장 좋은 방법은 무엇입니까?
- 26. 블로그 게시물/뉴스 기사의 기본 이미지를 검색하려면 어떻게해야합니까?
- 27. CustomViewData에 가장 좋은 방법은 무엇입니까?
- 28. PHP에서 가장 좋은 방법은 무엇입니까?
- 29. MBean의 가장 좋은 방법은 무엇입니까?
- 30. MATLAB에서 가장 좋은 방법은 무엇입니까?
3 자 : RSS;) – timbooo