웹 페이지에서 문장을 추출하고 싶습니다. 이러한 기능이 Jsoup와 같은 인기있는 HTML 구문 분석 라이브러리에서 지원되는지 궁금합니다.웹 페이지에서 문장을 추출하는 방법
감사합니다,
편집 : 포스트가 명확하지 않았다 경우
죄송합니다. 자연어 문장이 필요하므로 반드시 점으로 구분하지 않아도됩니다.
모두에게 감사드립니다. 방금이 라이브러리 http://alias-i.com/lingpipe/demos/tutorial/sentences/read-me.html을 찾았는데 정확히 내가 원하는 것처럼 보입니다.
더욱 정확하게 말하십시오. HTML 컨텐츠의 예를 제시하고 추출 할 내용을 알려주십시오. – sp00m
"자연어 처리"에 대해 이야기 하시겠습니까? 아니면 점으로 구분 된 단어 목록을 문장으로 사용합니까? – PeterMmm
[diffbot.com] (http://www.diffbot.com)에서 살펴보고, 그들은 클라우드에서 이것을 수행합니다. – yegor256