2008-10-01 4 views
1

단수 복수형 키워드 검색에 대한 간단한 해결책을 발견했습니다. 형태소 분석에 대해 들었지만 모든 기능을 사용하고 싶지는 않습니다. 단 복수형/단수 변환 만 사용하십시오. 언어는 네덜란드어입니다. 전에 http://www.snowball.tartarus.org을 보았습니다. 누구든지 단수형 복수 관련 검색에 대한 간단한 솔루션을 알고 있습니까? 미리 감사드립니다. 단수/복수 검색 및 형태소 분석

답변

2

사전을 사용하십시오. 불특정하지 않으려는 불용어 목록과 언어 규칙을 사용하십시오. 당신이 네덜란드를 모르는 경우 다음 나는 당신을 도울 수 있지만,이 스페인어로 할 것입니다 방법, 예를 들어, 당신을 보여 그 다음하지 않는 당신이 일을 끝낼 경우,

  • 복수형 s와 함께 종료
    • 는 S로 끝나는 경우
      • 검사가 동사하거나, 다음 그것은 동사가 아니라면
      • (동사는 불용어 목록에 추가 할 수있다)을 끝낼 한 경우의로 끝나는 결합 인 경우에, s를 제거합니다.
      • d가 사전에 존재하면 이전 문자를 제거하지 않으면
      • 을 수행하고 사전에서 확인하십시오.
      • 그것은 거기 아직도 당신이 (내가 지금 어떤 생각 할 수없는 예외 코드를 수동으로 확인해야합니다 예외,하지만 그들은 항상 존재 :

경우 물론 이것은 네덜란드어로 직접 번역되지 않습니다.

일반적으로 스 트리머는 이미 완료되어 있으며 필요한 대부분을 제공합니다. 왜 원하지 않으십니까?

1

스템 머 (stemmers)로 인해 많은 사용자 성가심이 발생했기 때문에 하나만 사용하면 단수/복수를 제외한 모든 기능을 사용할 수 없게됩니다. 따라서 요구 사항은 복수/단수 변환 만 사용하는 것입니다.

1

답변은 정확하지만 네덜란드어에는 많은 수의 불규칙 동사가 있음을 언급 할 가치가 있습니다. 이로 인해 단일 룰 세트보다 테이블 룩업 문제가 더 많이 발생합니다.

당신은 여기에서 네덜란드어를 찾을 수 있습니다 : http://corpus1.mpi.nl/ds/imdi_browser/

관련 문제