2010-12-10 3 views
0

정규식 패턴을 사용하고 있으며 문자열의 시작 부분이 HTML 단순 텍스트이고 해당 문자열을 반환하는지 확인해야합니다. 그래서 예를 들면 :Java의 정규식 패턴

Hello World!<TAG> &nsbp; 

가 반환해야합니다 :

Hello World!

+0

HTML을 구문 분석하는 경우 HTML 구문 분석기를 사용해야합니다. –

+0

http://stackoverflow.com/questions/701166/can-you-provide-some-examples-of-why-it-is-hard-to-parse-xml-and-html-with-a-rege –

+0

" split "은 첫 번째 인수로 정규식을 취합니다. – thejh

답변

3

텍스트 또는 전체 파일의 큰 섹션을 구문 분석하는 경우 문자열을 새로운 참조로 강제 설정해야합니다. 그렇지 않으면 하위 문자열로 인해 메모리 누수가 발생할 수 있습니다.

new String("Hello World!<TAG> &nsbp;".split("<")[0]) 
+0

THanks for the response 그러나 String.split 용 API를 확인하면 Regex 표현식 –

+0

을 사용해야합니다. 기술적으로는 정규식입니다. :) –

0
"Hello World!<TAG> &nsbp;".split("<")[0] 

Hello World!를 반환해야합니다.