내 질문은 다음과 같습니다.정규 표현 그룹화
다른 태그로 묶인 매우 긴 문자열이 있습니다. 중국어, 영어 단어 및 숫자를 포함한 그 값.
패턴을 지정하여 구분하고 싶습니다. 다음은 예입니다 은 (xxxx는, 숫자 또는 표기법, 중국어 영어지만 "<"를 포함하지 않거나 어디 패턴 XXXXXX를 찾으려면 ">"이 두 기호가 태그 식별을위한로)
을 그러나, 나는이 패턴에 이상한 것을 발견했다. 패턴이 처음 두 태그()하지만
String a = "<f\"number\">4 <f\"number\"><f$n0>14 <h85><f$n0>4 <f$n0>2 <f$n0>2 7 -<f\"Times-Roman\">7<f\"number\">";
Pattern p = Pattern.compile("<f\"number\">[\\P{sc=Han}*\\p{sc=Han}*[a-z]*[A-Z]*[0-9]*^<>]*<f\"number\">");
Matcher m = p.matcher(a);
while(m.find()){
System.out.println(m.group());
}
이 출력은
, 당신이 고려해야 XML 파서를 사용하여. 정규 표현식은 이것을 다루는 것만 큼 뜨겁지가 않다. –
죄송합니다. 일부 정보를 놓치지 마십시오. – DickDickSean
예상 결과는이어야합니다. –
DickDickSean