2013-10-23 3 views
0

html 형식의 텍스트가 포함 된 문자열에서 위치가 HTML 태그에 있는지 알아 보는 가장 쉬운 방법은 무엇입니까?위치/문자가 HTML 태그 안에 있는지 확인하십시오.

예 :

이 내 텍스트 수 :

나는 HTML 태그 여부를 현재 나는 경우 위치 지정된 x
This is a text <a href="http://foo.com"> and this </a> is also <b>part</b> of the <b /> text. 

, 어떻게 테스트 할 수 있습니까? 나는 내가 이러한 상황 중 하나입니다 경우 테스트해야합니다 가정 (* 내 위치이다) :

- < * > ... </> 
- <...> * </> 
- < * /> 

그러나이 문제를 해결할 수있는 효율적인 방법은 무엇인가?

+0

3 가지 상황은 상호 배타적이지 않습니다. 즉 : '<...>< * > ...'는 1과 2를 만족할 것입니다. – Cruncher

+0

사실,이 경우에는 꽤 기본적인 HTML로 작업하고 있습니다. 중첩 된 태그는 존재하지 않습니다. – Saragis

+0

그래,하지만 알다시피 가능한 가장 작은 유효한 HTML 파일에는 중첩 된 태그가있다. :). 그러나 이것은 단지 html 조각을 가지고 있을지도 모르는 문자열일까요? – Cruncher

답변

2

당신은이 링크에 대한 몇 가지 답변이 있습니다

Java HTML Parsing

는 기본적으로 HTML 구문 분석을 수행하는 몇 가지 라이브러리를 사용합니다. 몇 달 전에 개인적으로 JSoup을 사용했는데 완벽하게 작동했습니다.

다음 번 검색;)

+0

(대용량) HTML 문서의 DOM 표현을 작성하는 것이 필요하지 않은 경우, [SAX 파서] (http://docs.oracle.com/javase/1.4.2/docs/api/org/xml/sax/package-summary.html)는 꽤 잘할 것입니다. 'ContentHandler'는 모든 요소에 대해 통지를받습니다. 거기에 대상 문자열이 있는지 확인할 수 있습니다. – 9000

관련 문제