사용자 하이라이트를 기반으로 텍스트에서 가장 중요한 요소를 얻는 집계 알고리즘을 수행하려고합니다.알고리즘 : 관련 정보를 결정하기 위해 하위 문자열 집계
당신이 "관련 하이라이트", 1 < = K < = N. (k는 n 개의 문자열입니다)
로 텍스트에서 K 연속 단어를 선택하는 기능이 n 개의 단어를 갖는 텍스트가 상상k 개의 하이라이트 중 10 ~ 10000 개를 선택한다고 가정하면 가장 중요한 정보를 결정할 수있는 알고리즘이 있습니까?
하이라이트 중 상당 부분이 겹칠 수 있으므로이를 고려해야한다고 생각하십시오. 또한 크롬 확장을위한 것이므로 자바 스크립트에서 솔루션을 찾고있는 것이 바람직합니다.
이것은 클래스 용이 아니며, 군중 기반 요약에 관한 개인 프로젝트 용입니다.
중요한 것을 어떻게 결정 하시겠습니까? 누가 중요합니까? –
중요한 것은 사용자 선택에 의해 가장 많이 선택되는 문장입니다. @Dave Newton – jab11
텍스트를 "강조 표시"하는 데 사용되는 방법은 무엇입니까? 각각의 하이라이트에 대해 – guest271314