콘텐츠 검색 알고리즘

Clearly에 의해 수행 된 웹 페이지의 "콘텐츠 감지"를 재현하려고합니다. 메뉴, 텍스트 광고, 텍스트 버튼 텍스트 반대로콘텐츠 검색 알고리즘

은 내가 자동으로 텍스트 내용를 구별하려면, 웹 페이지를 감안할 등

HTML 페이지에서 텍스트 내용을 감지 적합 어떤 알고리즘

[StackOverflow의 경우 내용은 실제 질문이됩니다. 나머지는 단지 "내용을 둘러싼"것입니다.]

2012-01-29 Randomblue

가능한 중복 [어떤 알고리즘의 URL에서 텍스트를 추출 가독성 사용합니까?] (http://stackoverflow.com/questions/3652657/what-algorithm-does-readability-use-for-extracting -text-from-urls) – Regexident

당신은 가독성 알고리즘을보고 싶을 것입니다. 의

What algorithm does Readability use for extracting text from URLs?

출처

2012-01-29 16:16:06 Regexident

고마워, 그게 내가 필요한거야! – Randomblue

굉장한, 그걸로 행운을 빌어 요! – Regexident

콘텐츠 검색 알고리즘

답변

관련 문제