2013-05-01 3 views
0

나는 대학 웹 페이지를 방문한다고 가정 해 봅시다. 거기에 많은 선생님 프로필이 있습니다. 이 페이지는 구문 론적으로 관련이 없지만 의미 론적으로 관련이 있습니다. 이러한 유형의 관계를 어떻게 측정 할 수 있습니까? 관계를 찾기 위해 어떤 매개 변수에 집중해야합니까?두 웹 페이지 간의 의미 론적 관계를 측정하는 방법

답변

0

This 게시물은 구문 간의 의미 상 유사성을 계산하는 방법에 대한 답변입니다. 귀하의 경우에는 다른 페이지를 문서로 표현하고 동일한 접근 방식을 따라하면됩니다.

귀하의 경우에는 연구원의 경우 페이지 또는 출판물 사이의 링크와 같은 더 많은 정보를 이용할 수 있습니다.

확실히 페이지 각 교사 및 링크 된 페이지는, 의미 론적으로이 교수의 특성을 텍스트를 포함 : 나는 링크가 조금 ... 여기 간단하지만 아주 좋은 알고리즘

0

도움이되기를 바랍니다. 교수 페이지의 텍스트와 링크 된 페이지의 텍스트를 연결하여 구성된 단어 집합을 만들었다 고 가정합니다. 링크를 따라 계속해서 임의의 깊이까지 이어지는 텍스트를 계속 연결할 수 있습니다.

이제 벡터 공간 모델을 사용하여 추출한 정보를 바탕으로 교수를 클러스터링 할 수 있습니다. 각 교수는 추출 된 페이지에 포함 된 단어 및 관련 용어 - 빈틈을 구성 요소로하는 벡터로 표현됩니다. 코사인 유사도가 나머지 작업을 수행합니다.