2013-07-08 3 views
2

처음부터 텍스트를 분할하고 일부 태그 (div 및 p)를 모두 나누고 싶지 않습니다.자바에서 정규식을 사용하여 문자열 분할

Input: 
String html = "text<div>some text</div><tag>text</tag><span>asd</span><p>text</p>text"; 

Output: 
text 
<div>some text</div> 
<tag>text</tag><span>asd</span> 
<p>text</p> 
text 

어떤 정규식을 사용해야합니까?

+7

HTML 파서라고하는 정규식입니다. – m0skit0

+1

http://stackoverflow.com/questions/1732348/regex-match-open-tags-except-xhtml-self-contained-tags/1732454#1732454 –

+0

JSoup와 같은 HTML 구문 분석을 사용해보세요 – selig

답변

1

당신이 정규식

(?<=</(div|p)>)|(?=<(div|p)>) 

와에게 그것을 분할 그러나 수있는 다른 사람은 사용에게 HTML 파서 ..


을 권장하지만 왜 정규식 이상 사용 파서 ..

고려로 . 당신이 태그를 중첩 한 경우는

  • 작동하지 않습니다 ... 당신이있는 경우 태그
  • 을 속성이있는 경우
  • (불가능이 problem..It의 다음를 해결할 수 NO REGEX하지) 태그 내에서 공간의 임의의 수

비록 그 분명이 분할을하고 싶은 이유

+0

대단히 고마워요! – Nyger

관련 문제