2013-04-17 1 views
0

자연어를위한 특별한 형태 어휘를 만들어야합니다. 각 단어는 일련의 특성을 포함해야합니다. PostgreSQL 9. *은 이러한 상황에서 도움이됩니까? 제 말은 : 처음부터 테이블을 만들어야합니까? 아니면 미리 정의 된 방법이 있습니까?morph 사전은 어떻게 postgresql을 사용하여 만들 수 있습니까?

+0

단어 형태소 분석을 위해 내장 된 tsearch2 사전 외에는 들어 본 적이 없습니다. 이 질문에 약간의 세부 사항을 덧붙이면 도움이 될 것입니다. –

답변

0

PostgreSQL의 일반적인 솔루션이 설계 한 것 이상을 찾고 있습니다. 가장 좋은 방법은 사용자 정의 테이블을 작성하는 것입니다.

이제는 언어적인 주제에 대해 관심있는 독자 일뿐입니다. 그러나 형태학적인 분석을 위해서는 근본적으로 다른 형태 학적 시스템을 가진 여러 언어로 문제가 발생할 것으로 생각됩니다. 예를 들어, Austronesian, Indo-European, Athabascan의 형태학 개념 (모두 내가 충분히 위험하다고 알고있는 것)은 저를 하나의 관계형 모델에 매우 도움이되는 것으로 치지 않습니다. 예를 들어, 우리는 IE에서 동사 시제에 대한 뚜렷한 모폴로지를 가질 수 있지만 다른 두 개는 사용할 수 없습니다. Austronesian 언어의 Reduplication은 (특히 접두사/접미사/접미어 조합을 처리 할 때) 약간의 커브 공을 추가하며 Athabascan은 품사에 대한 다른 두 언어의 기대에 맞지 않는 슬롯을 가지고 있습니다.

그래서 많은 범용 모프 데이터베이스 스키마를 찾을 가능성이 거의 없습니다. 상황은 언어 별 및 목적 별 일 수 있습니다. 예를 들어, 중세와 현대 영어 사이의 형태 학적 변화를 찾기위한 데이터베이스를 구축하는 것은 트윗의 현재 형태를 분석하기 위해 설계된 것보다 상당히 다를 것입니다.

관련 문제