5
나는 다음과 같은 정규식을 사용하여 히브리어 텍스트의 한 부분을 (원점 뉴스 사이트에 대한 의견입니다) 잡으려고 노력하고있어이 :Java에서 정규 표현식으로 히브리어를 캡처하는 방법은 무엇입니까?
[\u0590-\u05FF \\p{Graph} \\s]+
그것은 대부분의 의견을 작동하지만 몇 가지 코멘트를 놓칠 수 있습니다.
이 디버깅을 시도했는데 패턴과 일치하지 않는 히브리어가있는 것 같습니다.
나는
아이디어 ...이 편지를 추출하여 인쇄가 정수 값이 올바른 것 같다있어 여전히 정규식은 그것을 잡을하지 않는 경우?
'Pattern.compile' 메소드에서'Pattern.UNICODE_CASE'를 사용합니까? –
아니, 그럴까? – lribinik
시도해 보라 :'Pattern p = Pattern.compile ("YOUR_REGEX", Pattern.UNICODE_CASE); ' –