많은 가능성이있다 접근법의 만약 가능성이 많다면, 이것을 기계 학습 문제로 취급하고 접근법 1을 사용할 수 있습니다. 그렇지 않으면 1, 가능성이 제한적일 경우 (예 : 약 5), 두 번째 접근법을 사용할 수 있습니다.
접근 1 :
은 기계 학습 문제를 생각해 보자. 경험 년이 포함되어 있는지에 따라 텍스트의 각 문장을 0 또는 1로 분류하십시오. 이는 일부 데이터를 수동으로 교육하여 수행 할 수 있습니다. 각 교육 예제에 대해 레이블을 지정합니다.
작업 경력 : 3 년
이년 (라벨 0) 동안 열심히
공부 (라벨 1) (라벨 0) 경험
2 년 (라벨 예를 들어 1)
경력 : 2,010에서 2,014 사이 (라벨 1) 많은 예제가 있으면
, 당신은 skicit-learn
사용하거나 유사한 PA 모형을 훈련시키는 ckage.
접근법 2 : 년간
1 검색합니다. 정확한 단어 (year
또는 years
)이거나 4 자리 숫자 (예 : 2014) 일 수 있습니다.
2- 1
이 통과하면 가까운 거리에서 경험 (또는 비슷한 단어)을 검색하십시오.
1
과 2
이 모두 통과하면 오랜 경험을 할 수 있습니다. 그런 다음 원하는 것에 따라 더 추출 할 수 있습니다.
많은 가능성을 의미하는 마침내 예상되는 패턴 뒤에 논리를 찾아야합니다. 예를 들어 주위의 문자열을 사용하거나 원하는 패턴의 모양이 제한적이라면 정규식과 같은 여러 가지 방법으로 구조를 사용할 수 있습니다. – Kasramvd
@ Kasramvd 3 가지 방법은 경험을 나열하는 대체 방법이지만 "많은"방법이있을 수는 없지만 대부분 실제로 처음에는 두 가지 패턴이 전혀 없습니다. –
단 하나의 방법은 정규 표현식을 사용하는 것입니다. 또는 우리는 다른 논리를 사용할 수 있습니다. –