2013-04-24 1 views
4

내가 만들고있는 웹 사이트의 고객을 위해 헬프 데스크를 만들 필요가 있으며 StackOverflow가 유사한 질문을하는 방식을 좋아합니다. 누구든지 사이트에서 어떤 알고리즘을 사용하는지 알고 있습니까? 어디서 찾을 수 있습니까?StackOverflow는 비슷한 질문을 찾기 위해 어떤 알고리즘을 사용합니까?

+1

관련 질문 http : // stackoverflow.com/questions/891772/stackoverflow-related-questions-algorithm – Tyler

답변

5

에 대한 세부 사항을 얻었다.

질문은 클러스터의 일부가되며 동일한 클러스터의 다른 질문 (아마도 similarity measure 순)이 비슷한 질문으로 표시됩니다. (제목보다 적은 무게) 텍스트에

  • 단어를 제목에

    • 태그
    • 단어
    • :

      는 클러스터링에 사용할 수 features, 그 중 일부는 될 수있는 다양한 있습니다 다른 질문/웹 페이지로 연결됩니다.

    등등.

    이러한 종류의 문제에서 사용되는 text summarization, sentiment analysis 등과 같은 기술을 사용하여 다른 공식화 된 기능이있을 수 있습니다. 어떤 기능이 문제에 달려 있는지에 따라 어떤 기능이 좋을까요?

    • 유튜브
    • 위키 백과
    • IMDB

    하고 목록이 무한대로 계속 : 당신이 행동에 이러한 알고리즘을 참조

    다른 영역이다.

    그럼 문제에 대해 어떻게 할 수 있습니까?

    답변이 하나도 없습니다. 그것은 모두 데이터 및 대상 쿼리에 따라 다릅니다. 그러나 여전히, 당신은 할 수있다

    • 를 배우라.
    • clustering에 대해 알아보십시오.

    (이들에 대한 많은 온라인 코스가 있습니다.)

    또는

    • 이 물건을 알고있는 사람을 고용.
  • 1

    대부분 likley는 태그에 가중치를 적용하고 match() 또는 제목에 일치하는 전체 텍스트 가중치 검색을 사용합니다.

    그것의 아마 문제와 같은 유형을 다루는 clustering라는 Machine Learning의 전체 지점 (unsupervised learning의 일종)이 어딘가에 메타, 자주 묻는 질문

    관련 문제