2010-02-17 3 views
3

나는 집단 지성 분야에서 텍스트 마이닝 및 기타 관련 사항을 배우려고 노력해 왔습니다. 나는 문서를 스캔하여 관련 게시물/기사를 페이지에 표시하는 앱을 만드는 데 관심이 있습니다.관련 콘텐츠 또는 기사를 표시하는 기술

필수 정보를 검색하는 데 도움이되는 알고리즘은 무엇입니까?

감사

/간단한 방법은 페이지가 아닌 일반적인 단어와 자신의 인스턴스를 계산하는 것입니다

답변

2

. 단어가 많을수록 게시물의 내용을 설명하는 것이 좋습니다. 그런 다음 다른 기사/게시물을 조회하는 데 사용할 수 있습니다.

1

Resource Description Framework (RDF)을 사용할 수 있습니다. RDF 기반은 구조화 된 지식과 그것들 사이의 연결을 포함합니다. 따라서 텍스트의 모든 단어에 대한 RDF 레코드를 가져 와서 그래프로 연결할 수 있습니다. 최대 엣지 수와 루트 노드가있는 노드 (그래프가 트리와 같은 경우)는 문서의 테마를 참조합니다.

+0

관련 콘텐츠를 추출 할 때 언급 한 내용이 있습니까? – Volatil3

관련 문제