2017-04-06 14 views
0

사전 목록을 사용하여 일부 데이터에 주석을 달기 위해 StanfordNLP regexner를 사용하고 싶습니다. 불행히도 나는 같이 패턴에서 괄호를 일치시킬 수 없습니다 이니 경기가 있어야 할 곳에StanfordNLP regexNER의 괄호와 일치하는 방법은 무엇입니까?

"Iq (mA) max" 

중 하나 "Iq" or "Iq (mA) max" 내가 다른 정규식을 시도

, 같은

Iq(\s\(\smA\s\)\smax)? 
Iq(\\s\\(\\smA\\s\\)\\smax)? 
그러나 아무것도 일하지 . 항상 일치합니다. "Iq"
아무도 도와 줄 수 있습니까? 정규식을 사용하는 것이 가능합니까?

답변

0
규칙이 방식으로 포맷해야합니다

: IQ는 선택 사양 일을 한 후 모든 것을 원하는 경우

Iq -LRB- mA -RRB- max ENTITY MISC 1 

, 내가 할 수있는 가장 쉬운 일이 방금 Iq

각각 별도의 규칙을 작성할 생각을 RegexNER 규칙의 시작 부분에 공백으로 구분 된 목록의 요소는 TOKEN과 일치하는 정규 표현식입니다. 따라서 물음표를 추가하면 패턴의 일부 토큰을 선택적으로 만들 수 있지만 확실하지는 않습니다. 그들 모두를 선택 사항으로 그룹으로 만들지 말지.

+0

안녕하세요, 감사합니다. 규칙에서 "1"의 효과는 무엇입니까? 모든 패턴을 선택적으로 만들 수있는 솔루션을 찾을 수 없기 때문에 각 패턴에 물음표를 추가하여 선택적으로 만들 것입니다. – maflj

관련 문제