2010-03-02 4 views
3

사용자가 현재 읽고있는 관련 (유사한) 기사를 찾을 수있는 코드는 어떻게 작성합니까?"관련 기사를 구현하는 방법"

예를 들어, 나는 기사가 있다고 가정 : (. 내가 지금이 타이틀을 함께했다)

Python programming tips 
Python programming for newbies 
Programming in Python, ActionScript and Flash 
Programming in the Jungle 
Tarzan saves newbie Judy from using Fortran programming language 

어떻게 데이터베이스를 쿼리하고는 관련된 모든 것을 찾을 수 있을까?

의견을 보내 주시면 감사하겠습니다.

감사합니다. Boda Cydo.

답변

1

어떤 데이터베이스를 사용하고 있습니까? "전체 텍스트 검색"이 도움이 될 수 있으며, MySQL에 내장되어 있습니다. Google에 대해.

+0

저는 MySQL을 사용하고 있습니다. google, 고마워! – bodacydo

1

나는 당신이 cosine similarity보고 tf-idf을 제안

코사인 유사성은 두 문서 (뿐만 아니라) 사이의 유사성을 측정하는 데 사용하는 간단한 방법이며 사용하여 입력으로 가중 단어의 벡터를받을 수 없어 tf-idf.
기본적으로 tf-idf 가중치는 단어가 현재 문서에서 자주 나오는 경우 (용어 빈도 - tf)는 높지만 다른 경우에는 드문 경우 (역 문서 빈도 - IDF) 더 높습니다.

2

This book에는 이에 대한 몇 가지 정보가 포함되어 있습니다. 더 구체적으로이 문제는 Collaborative Filtering과 같습니다.

문제에는 여러 가지 방법이 있습니다. 하나는 태그를 붙이고 태그를 달고있는 독자와 기고가에게 의존하고 다른 태그는 키워드와 일치시킬 수 있습니다.

또 다른 접근법은 검색과 분석, 즉 Google 접근 방식을 결합하는 것일 수 있습니다. 검색 쿼리에 대한 결과를 표시하고 사용자가 클릭하면 일부는 클릭 한 사람이 관련 검색어를 클릭하고 그 사이에 관계를 설정할 수 있습니다.

0

사례가 실제로 콘텐츠 중심 웹 사이트 인 경우 편집자에게 모든 기사에 태그를 추가하도록 요청하는 것이 가장 좋습니다. 웹상에서 행해지는 방식입니다 (예 : Wordpress)

또한 언어 처리를 할 수있는 방법이 있지만 파이썬을 사용하므로 파이썬 전문가 인 사람들에게 맡깁니다.

0

하나의 제안은 모든 기사에 태그를 추가하는 것입니다. 관련 기사는 유사한 태그가있는 기사입니다.

+0

이 접근법을 고맙게 생각합니다! – bodacydo

관련 문제