원시 URL이 n 개라고 가정하면 뉴스, 블로그, 사진 및 동영상으로 분류 할 수 있습니다.콘텐츠 분류 URL에서
예를 들어 링크가 사용자를 사진으로 연결하는 경우 원시 링크가 이미지의 파일 확장자를 포함하고있어 원본 URL을 사진으로 분류 할 수 있을까요?
동영상, 블로그 및 뉴스의 경우 원시 URL을 분류 할 도메인 집합 (예 : http://www.youtube.com)이 충분하지 않은 것으로 보입니다.
웹 콘텐츠를 검사하여 분류 할 수 있습니까? 아니면 이것을위한 오픈 소스 도구가 있습니까?
URL 분류를 위해 무엇을했는지 궁금하십니까? –