2013-04-24 3 views
0

Java 응용 프로그램에서 편집해야 할 String이 있습니다. 문제는 이러한 문자열에 HTML 태그/요소가 포함될 수 있다는 점입니다. 요소는 요소를 검색 할 ID가 없습니다.Java에서 html이 아닌 문자열 일부 가져 오기

시나리오 (추가 -) :

String a = "<span> <table> </table> </span> <div></div> <div> text 2</div>"; 
should become: <span> <table> </table> </span> <div></div> <div> -text 2</div> 

String b = "text"; 
should become: -text 

String c = "<p> t </p>"; 
should become: <p> -t </p> 

내 질문은 : 나는

답변

3

당신은을 사용할 수 있습니다 (ID 또는 클래스를 추가 할 수 없습니다) HTML 태그를 포함 할 수있는 문자열의 텍스트를 검색 할 수있는 방법 XML 파싱 라이브러리.

String newText = null; 
for (Node node : document.nodes()) { 
    if (node.text() != null) newText = "-" + node.text(); 
} 

이것은 의사입니다.

newText은 이제 노드 텍스트가 무엇이든간에 -text이됩니다.

편집 : 귀하의 질문은 측면에서 약간 모호 "텍스트 는 HTML 요소를 포함 할 수 있습니다." 이 html 태그를 포함하지 않는 경우이 태그를 포함, 왜 당신은 그냥 할 수없는하지 않는 경우
, 당신은 ... .. 질문을 가져다 XML 파서를 사용할 수 없습니다

String newString = "-" + a; 
+0

답장을 보내 주셔서 감사합니다. 그 이유는 문자열에 html이 포함되는지 미리 알지 못하기 때문입니다. – Attiej