웹 페이지에서 주요 뉴스 콘텐츠를 추출해야합니다. 인터넷에서 검색 한 결과 무료로 사용할 수있는 보일러 파이프라는 API를 발견했습니다. http://boilerpipe-web.appspot.com/하지만 Boilerpipe를 사용하는 자바의 구현을 찾지 못했습니다. 누구든지 사용할 수 있습니다 Java에서 Boilerpipe를 사용하여 뉴스 컨텐츠를 추출하거나 Java에서 구현에 대한 링크를 제공하여 Boilerpipe를 사용하여 뉴스 웹 페이지에서 컨텐츠를 추출 할 수있는 방법을 알려주십시오.보일러 파이프를 사용하여 웹 페이지에서 뉴스 콘텐츠를 추출하는 방법은 무엇입니까?
0
A
답변
1
내 대답이 너무 늦었습니다. 하지만 꽤 간단합니다.
URL url = new URL("http://www.nydailynews.com/sports/baseball");
ArticleExtractor ae = new ArticleExtractor();
String content = ae.getText(url); // this contains the final text
1
관련 문제
- 1. 웹 페이지에서 텍스트 콘텐츠를 추출하는 방법은 무엇입니까?
- 2. 보일러 파이프를 사용하여 비 영어 기사 추출
- 3. 웹 페이지에서 의미 있고 유용한 콘텐츠를 추출하는 방법은 무엇입니까?
- 4. 웹 페이지에서 동적 아약스 콘텐츠를 추출하는 방법
- 5. 뉴스 웹 페이지에서 주요 내용을 추출하는 데 어려움이 있습니다.
- 6. 웹 페이지에서 특정 텍스트를 추출하는 방법은 무엇입니까?
- 7. 웹 페이지에서 콘텐츠를 가져 오는 방법은 무엇입니까?
- 8. 보일러 파이프를 로컬 HTML 파일과 함께 사용하는 방법은 무엇입니까?
- 9. 다른 웹 사이트에서 자동으로 콘텐츠를 추출하는 방법은 무엇입니까?
- 10. 웹 페이지에서 탐색 메뉴를 추출하는 기술은 무엇입니까?
- 11. 블로그 기사에서 콘텐츠를 올바르게 추출하는 방법은 무엇입니까?
- 12. gwt를 사용하여 주어진 URL 문서에서 콘텐츠를 추출하는 방법은 무엇입니까?
- 13. Maven 종속성에서 자동으로 콘텐츠를 추출하는 방법은 무엇입니까?
- 14. 폴더를 만들고 * .zip 콘텐츠를 추출하는 방법은 무엇입니까?
- 15. HTML 페이지에서 텍스트 블록을 추출하는 Java 라이브러리
- 16. XMLHTTPRequest를 통해로드 된 웹 페이지에서 URL을 추출하는 최적의 방법은 무엇입니까?
- 17. 웹 페이지에서 문장을 추출하는 방법
- 18. HTML 페이지에서 텍스트 블록을 추출하는 방법은 무엇입니까?
- 19. UIWebView - Facebook 같은 웹 페이지에서 HTML 코드를 추출하는 방법은 무엇입니까?
- 20. 디스플레이 크기를 유지하면서 웹 페이지에서 이미지를 추출하는 방법은 무엇입니까?
- 21. 외부 웹 페이지에서 특정 텍스트를 추출하는 방법은 무엇입니까?
- 22. 웹 페이지에서 특정 콘텐츠를 읽으십니까?
- 23. 파이썬으로 몇 초마다 웹 페이지에서 콘텐츠를 다운로드하는 방법은 무엇입니까?
- 24. 웹 페이지에서 동적으로 생성 된 콘텐츠를 다운로드하는 방법은 무엇입니까?
- 25. C#에서 htmlagilitypack을 사용하여 웹 페이지에서 링크 및 게시물을 추출하는 방법은 무엇입니까?
- 26. Java의 HTML 페이지에서 JavaScript 링크를 추출하는 방법은 무엇입니까?
- 27. 보일러 플레이트 코드를 속성으로 대체하는 방법은 무엇입니까?
- 28. jQuery를 사용하여 웹 페이지를 읽고 특정 링크를 추출하는 방법은 무엇입니까?
- 29. 웹 페이지에서 텍스트를 음성으로 변환하는 방법은 무엇입니까?
- 30. 파이썬을 사용하여 웹 페이지에서 동적 시간 카운터를 추출하는 방법
Jsoup와 같은 도서관을 사용하고 있습니까? http://jsoup.org/ 긁어 모으는 특정 웹 사이트가 있습니까? –