나는 "Brittney Spears"문제에 초점을 맞춘 this question을 보았습니다. 그러나 나는 약간 다른 질문을 가지고있다. 알고리즘으로 어떤 단어 나 문구를 순위 결정해야하는지 결정하는 방법은 무엇입니까? 예를 들어, "마이클 잭슨이 죽었다"라는 트윗을 보내면 "마이클 잭슨"을 뽑아 내고 "죽지"않았다는 것을 어떻게 알 수 있습니까?트위터의 트렌드 주제가 트윗에서 추출 할 단어를 어떻게 결정합니까?
아니면 알렉스 볼드윈과 스티븐 볼드윈이 그날 뉴스에 올랐다는 이유로 많은 트윗에서 언급되었습니다. "볼드윈 (Baldwin)"을 꺼내는 대신에 두 이름을 다르게 취급하는 것을 어떻게 알 수 있습니까?
순식간에이 문제가 NP 완료된 것으로 나타났습니다 (트윗의 모든 잠재적 구문을 다른 모든 트윗의 모든 잠재적 구문과 비교해야합니다).