저는 NLP (Natural Language processing)에 새로 들어설 수 있습니다. 프로젝트를 시작하기 위해 필자는 두 가지 유사한 문장을 인식 할 수있는 시스템을 개발 중입니다. Lexical, Syntax, Semantic의 세 가지 수준에서 다양한 측정을 적용 할 것입니다. 어휘 수준에서 코사인 유사성, 일치 계수, jaccard 계수 ... 등과 같은 여러 유사성 측정 값이 있습니다. 셰필드 대학 (University of Sheffield)에서 개발 한 simMetrics 패키지는 다양한 유사성 측정을위한 훌륭한 패키지입니다. 여기에는 유사성 측정이 많이 포함되어 있습니다. 그러나 levenshtein 거리 및 jaro-winkler 거리 측정의 경우 코드는 * 문자 만 가능합니다. 코드는 * 입니다. 문장 수준에서 코드를 작성하십시오 (즉, 한 단어를 문자 현명한 대신 단위로 고려하십시오). 또한 맨해튼 거리에 대한 코드는 SimMetrics에 없습니다 ... 나는 전문가에게 요구 된 코드를 개발하기위한 제안을 주거나 (또는) 위에서 언급 한 조치에 대한 문장 수준의 코드를 제공하도록 요청합니다.문장 수준의 유사성을 이용한 의역 인식
많은 도움을 주신 귀하의 시간과 노력에 감사드립니다.
이것은 별다른 문제가 아닙니다. 나는이 분야에서 많은 전문 기술이나 선행 기술을 찾을 수 있을지 의심 스럽다. – Cerin
NLP에 완전히 익숙하다면 정말 작고 제한적인 프로젝트를 시도해야한다고 생각합니다. –
'JNLP'는 'NLP'와 아무 관련이 없습니다. 태그 제거 중. –