HTML 섬이 포함될 수있는 텍스트가 있습니다.Java에서 HTML 조각 추출
예 :
qwwdeadaskdfdaskjfhbsdfkf<a href="/cookbook/modifying-data/set-attributes">Set attribute values</a>gfkjgfkjrgjgjgjgjgroggjrog <b>jsoup</b>sdflkjsdfsfklsfklfjsfkljsfljsf<a href="/apidocs/org/jsoup/Jsoup.html#parse(java.lang.String)" title="Parse HTML into a Document.">Jsoup.parse(String html)</a>skgjdfgkjdfgkldfjgdfkgljdfg
가 어떻게 그 HTML 조각을 추출 할 수 있습니다?
HTML 텍스트와 HTML이 아닌 텍스트 간의 경계를 정의하는 것은 무엇입니까? –
@IraBaxter : 나는 그가 HTML 태그를 의미한다고 생각한다. –
당신이하는 일은 무엇이든 [정규식을 고려하지 마십시오] (http://stackoverflow.com/questions/1732348/regex-match-open-tags-except-xhtml-self-contained-tags). –