2014-11-12 3 views
2

정규식이 PDF 비교 도구 (ExamDiff Pro)를 사용하고 있으며 잠재적 인 날짜와 일치하는 단어를 제외하는 방법을 알아 내려고하고 있습니다. 비교할 문서의 특정 날짜 형식은 다음과 같습니다. "2014 년 1 월 20 일"날짜 (월 dd, yyyy)

다른 사람이이 정규 표현식을 알아낼 수 있습니까?

나는 비슷한 질문에 대한 결과를 발견했습니다,하지만 그들은 내가 그것을 알아낼 수 없을 정도로만을위한 달랐다 :/

감사합니다!

답변

1

나는 ExamDiff를 사용한 적이 없지만 그 중 regex help page을 보면 도움이 될 것 같습니다.

다음 정규식은 사용자가 지정한 형식으로 날짜를 가져와야한다고 생각합니다.

\w+\s\d{2},\s\d{4} 

는 설명 :

\w+ -- Find one or more word characters 
\s  -- a white space character 
\d{2} -- 2 digits 
,  -- a literal comma 
\s  -- another space 
\d{4} -- 4 digits 
+0

이렇게했습니다. 고맙습니다. –

3

나는 당신의 도구가 어떻게 작동하는지 모르겠지만, 여기에 제공된 샘플을 정확히 당신이 원하는 것을 찾을 수 있어야 하나 :

\w{3,9}?\s\d{1,2}?\s,\s\d{4}? 


1 부 : \w{3,9}? - 3 ~ 9 자 사이의 문자 시퀀스를 최대한 짧게 찾습니다 (짧은 = 5 월 (3), 9 = 9)
2 부 : \s - 이것은 단지 원한다면 "공백"또는 공백이라고 부릅니다.
파트 3 : \d{1,2}? - 숫자 시퀀스 (0-9)가 가능한 한 번 몇 번 (1-31 범위를 의미 함)
4 번 : \s,\s - -이 쉼표 다음에 공백을 발견하고 또 다른 공백
제 5 부 : \d{4}? -이 가능한 (넘어 년 1000-2014 등) 등의 몇 배 4 자리 숫자의 순서

가되어 발견 당신이 찾고 있던 것에 충분 했나요?

+1

5 월은 어떨까요? – PeterK

+0

얼마나 당황 스럽습니까? (나는 커피가 부족하다는 것을 비난 할 것이다. 가치가있는 것을 위해 ... P edK. –

+2

위험한 일 - 카페인이 적 으면서 정규식 :) – PeterK