2012-09-21 6 views
0

웹 페이지에서 문장을 추출하고 싶습니다. 이러한 기능이 Jsoup와 같은 인기있는 HTML 구문 분석 라이브러리에서 지원되는지 궁금합니다.웹 페이지에서 문장을 추출하는 방법

감사합니다,

편집 : 포스트가 명확하지 않았다 경우

죄송합니다. 자연어 문장이 필요하므로 반드시 점으로 구분하지 않아도됩니다.

모두에게 감사드립니다. 방금이 라이브러리 http://alias-i.com/lingpipe/demos/tutorial/sentences/read-me.html을 찾았는데 정확히 내가 원하는 것처럼 보입니다.

+0

더욱 정확하게 말하십시오. HTML 컨텐츠의 예를 제시하고 추출 할 내용을 알려주십시오. – sp00m

+0

"자연어 처리"에 대해 이야기 하시겠습니까? 아니면 점으로 구분 된 단어 목록을 문장으로 사용합니까? – PeterMmm

+0

[diffbot.com] (http://www.diffbot.com)에서 살펴보고, 그들은 클라우드에서 이것을 수행합니다. – yegor256

답변

0

JSoup 당신은 그

var t = $('p').text();
var sentences = t.split('.');
에 대한 jQuery를 사용할 수 있습니다

-1

... 네,이 기능을 제공합니까 ... 짧은에,data를 조작 및 를 추출 API 매우 편리합니다 않습니다

+0

간단 할 수도 있습니다. 귀하의 필요에 따라 달라질 수 있습니다. – Max

관련 문제