2014-03-28 2 views
0

일부 HTML 콘텐츠가 포함 된 문자열이 있습니다. 모든 HTML 태그와 그 안에있는 내용을 Java의 Regex를 사용하여 바꾸려고합니다.Regex는 Java에서 모두 바꿉니다.

예를 들어 <a>, <a href=""/>, </a> 등을 제거해야합니다.

나는
str=str.replaceAll("<\\w*>",""); 

을 시도하지만 문자열에서 첫 번째 발생을 대체합니다.

어떻게이 종류의 모든 항목을 문자열로 바꿀 수 있습니까? 감사

+0

[자바에서 HTML 태그를 스트립]의 중복 가능성 (http://stackoverflow.com/questions/832620/stripping-html-tags-in-java) –

답변

5

당신이 시도 할 수

str = str.replaceAll("<[^>]*>", ""); 

+0

그것은 일했다. 그러나 어떻게? –

+4

@ TanujWadhwa 왼쪽 꺾쇠 괄호와 일치시킵니다. 그런 다음 오른쪽 꺽쇠 괄호가 아닌 0 개 이상의 일치 항목을 찾습니다. 즉, 첫 번째 오른쪽 꺾쇠 괄호까지는 일치하지만 "<"일치 이후부터 일치하지 않습니다. 그런 다음 오른쪽 꺾쇠 괄호와 일치시킵니다. ..... 첫 번째 경기는 ""이며, 모든 경기가 대체 될 때까지 다시하십시오. – xagyg

+0

예를 들어 태그를 건너 뛸 수 있습니다.
을 입력하고 나머지는 바꿉니다. –

관련 문제