독일어 단어에 대한 형태소 분석을 수행 할 수있는 라이브러리를 찾고 있습니다. 즉, 단어를 루트 형태로 변환하고 분석 된 단어에 대한 메타 정보를 제공합니다. 예를 들어독일어의 형태 학적 분석을위한 무료 라이브러리가 있습니까?
:
gegessen -> essen
wurde [...] gefasst -> fassen
Häuser -> Haus
Hunde -> Hund
내 위시리스트 :
그것은 명사와 동사 모두 일해야- .
- 독일어의 복잡성 때문에이 작업이 매우 힘들다는 것을 알고 있습니다. 따라서 근사값만을 제공하거나 약 80 % 정확할 수도있는 라이브러리도 찾고 있습니다.
- 사전과 함께 작동하지 않는 라이브러리가 더 좋겠지 만, 상황에 따라 타협 할 수는 있습니다.
- 또한 C/C++/Delphi Windows 라이브러리를 선호합니다. .NET, Java, ... 등을 더 쉽게 통합 할 수 있기 때문입니다.
- 무료 라이브러리 여야합니다. (L) GPL, MPL, ...
편집 : 나는 때문에 불규칙 단어, 전혀 사전없이 형태 학적 분석을 수행 할 수있는 방법이 없다는 것을 알고 있어요. 내가 말할 때 , 나는 내가 각각의 모든 단어를지도하는 전체 날려 사전을 의미 사전없이 도서관을 선호 :
arbeite -> arbeiten
arbeitest -> arbeiten
arbeitet -> arbeiten
arbeitete -> arbeiten
arbeitetest -> arbeiten
arbeiteten -> arbeiten
arbeitetet -> arbeiten
gearbeitet -> arbeiten
arbeite -> arbeiten
...
그 사전은 거대한 크기와 알 수없는 단어를 처리 할 수없는 등 여러 가지 단점을 가지고있다.
esse -> essen
isst -> essen
eßt -> essen
aß -> essen
aßt -> essen
aßen -> essen
...
이 (내 마음이 지금 당장 돌고있다 :))
당신은 부분적으로 맞다, 나는 내 질문에 업데이트되었습니다. –