2012-01-29 4 views
0

Clearly에 의해 수행 된 웹 페이지의 "콘텐츠 감지"를 재현하려고합니다. 메뉴, 텍스트 광고, 텍스트 버튼 텍스트 반대로콘텐츠 검색 알고리즘

은 내가 자동으로 텍스트 내용를 구별하려면, 웹 페이지를 감안할 등

HTML 페이지에서 텍스트 내용을 감지 적합 어떤 알고리즘

?

[StackOverflow의 경우 내용은 실제 질문이됩니다. 나머지는 단지 "내용을 둘러싼"것입니다.]

+0

가능한 중복 [어떤 알고리즘의 URL에서 텍스트를 추출 가독성 사용합니까?] (http://stackoverflow.com/questions/3652657/what-algorithm-does-readability-use-for-extracting -text-from-urls) – Regexident

답변