2014-06-12 2 views
-2

에 다음과 같은 패턴을 추출 않습니다. 또한 [Anarchism,Political culture ....,Far-left politics]어떻게 내가 다음과 같은 형식의 문자열을 자바

, 나는이 정규식 패턴 매칭 물건에 대해 배울 수있는 좋은 자습서 .. 감사

+1

는 순수 정규식에 대해 배우고 싶다면 내가 지금까지 본 적이 가장 http://docs.oracle.com/javase/tutorial입니다/essential/regex /는 Java에서 regex를 사용하는 법을 알려줍니다. 이 문제를 해결하려면 Pattern과 Matcher 클래스를 사용하는 방법, 정규 표현식에서 특수한 문자와 이스케이프 방법 (이 경우'['와']')을 알아야합니다. – Pshemo

답변

1

단어 "를 선택하지 않으 카테고리 "자체에서 정규식은 다음과 같습니다.

(?<=Category:).*?(?=]) 

당신을 위해 조금 내려 놔.

괄호 안의 첫 번째 비트는 실제로는 선택하지 않고 Category을 찾습니다.

다음 .+?은 (줄 바꿈 제외) 1 - 무한 문자를 보이지만, 바로 다음 부분이 일치으로 중지 :

마지막 괄호는 ]을 찾아 그것을 알 수 있지만, 실제로 선택하지 않고 .

결과는 파란색으로 강조 표시된 비트가됩니다. http://www.regular-expressions.info/

enter image description here

2

당신은 카테고리를 얻기 위해 다음과 같은 정규 표현식을 사용할 수 있습니다 : 다음

\[\[Category:(.+)\]\] 

을 수행 할 수 있습니다 그룹에 액세스하여 카테고리 값을 얻으십시오. 당신이 자바 문자열을 사용하는 경우

는 백 슬래시에 백 슬래시를 추가해야합니다 :

\\[\\[Category:(.+)\\]\\] 

당신은이 작업을 볼 수 있습니다 당신을 가정

enter image description here

관련 문제