로이터에서 특정 회사에 대한 정보를 파이썬을 사용하여 추출하고 있습니다.문자열에서 비즈니스 제목과 기간 추출
: 나는 지금 this page
에서 임원/임원 이름, 전기, 보상을 얻을 수 있었다, 나는 이런 식으로 뭔가를 보이는 전기 섹션에서 이전 위치 타이틀과 기업을 추출 할 Donald T. Grimes는 2008 년 5 월부터 Wolverine World Wide, Inc.의 CFO 겸 재무 담당 수석 부사장으로 재직 중입니다. 2007 년부터 2008 년까지 Keystone Automotive Operations, Inc.의 수석 부사장 겸 CFO였습니다. , 자동차 액세서리 및 장비의 유통 업체. Keystone에 입사하기 전에 Mr. Grimes는 고급 와인 및 증류주 제조업체 및 마케팅 담당자 인 Brown-Forman Corporation에서 일련의 수석 기업 및 부서별 재무 담당 직무를 수행했습니다. 브라운 - 포먼 (Brown-Forman)에서 근무하는 동안 그라 임즈 (Grimes)는 2006 년부터 2007 년까지 음료 금융 담당 이사였습니다. 2003 년부터 2006 년까지의 기획 및 분석 담당 부사장 1999 년에 브라운 - 포먼 영 미국의 수석 부사장, 최고 재무 책임자 (CFO) 2003
전에서 몇 년에 얻을 간단한 정규식을 사용할 수 있습니다,하지만 난에 정규식 작성하는 방법에 딱하다 제목과 회사 명을 얻으십시오. 나는 문자열 형식이 일관성이 없다는 것을 알고 있으므로 적어도 70 %의 경우에 대해 작동하는 대답을 취할 것입니다. 내가 정말 불쾌한 않는 한 당신이 사용할 수있는 하나의 정규식이있을 거라고 생각하지 않습니다
2007-2008, executive vice president and chief financial officer, Keystone Automotive operations
bdk, 사려 깊고 자세한 답장을 보내 주셔서 대단히 감사합니다. 나는 같은 라인을 따라 생각하고 있었다. 형용사를 추출하기 위해 패턴 라이브러리를 사용했습니다. 나는이 목적을 위해서도 갈 것입니다. [http://www.clips.ua.ac.be/pages/pattern] – karlos