국회 기록에 사용 된 구체적인 명명 규칙을 식별하는 정규 표현식을 제시하려고합니다.국회 기록에서 이름 일치
국회 기록의 연설은 항상 연사의 이름 앞에옵니다. 예를 들어, 다음은 발췌 부분입니다.
Mr. DORNAN of California. 스피커, 내 친구에게 양보 하겠지만 문제가 있습니다. 정보위원회가 소집되고있다.
나는 15 분 동안 그 때문에 신사에게 인내심을 요청할 수 있습니까? ?
Mr. RITTER. 신사가 내게 줄 수있는 경우에만 6 분.
Mr. DORNAN of California. 신사가 4시에 할 수 있니?
Mr. Speaker, 나는 펜실베니아에서 신사에게 양보합니다. 드 라 크루즈].
Mr. de la CRUZ. ㅋㅋㅋ
워싱턴의 McCORMICK.
국회 기록에서 사용되는 명명 규칙은 제목 (Mr., Mrs., Ms)과 성 (모두 대문자)으로 시작해야합니다. 어떤 경우에는 성 (state)이 뒤를 잇습니다 (캘리포니아의 DORNAN 씨와 같이).
즉, 정규 표현식은 다음과 같은 기준으로 문자열을 일치해야합니다 : 문자열의 시작에서 중 (씨, 여사, 또는 양)에 대한
- 봐.
- (드물게) 'de la CRUZ'예와 같이 일부 소문자가 올 수 있습니다. 이름에 대한
- 전체 (또는 대부분의 모든, 맥코믹의 예에서와 같이)이 이름이 기간에
- 끝 '[상태 이름]의'다음됩니다 (경우에 따라)
- 모자에.
첫 번째는 쉽게 달성된다^(씨 | 여사. | MS)
그러나 나머지는 나를 붙어 있습니다.
파서와 문법이 더 좋은 아이디어입니다. – duffymo
개별 요소를 추출해야합니까?그렇지 않다면, 표제를 따르는 기간까지 일치시켜야합니다. 맞습니까? –
예상되는 결과를 추가 할 수 있습니까? – agstudy