2009-10-07 3 views
1

사이트에 파일 업로드와 관련된 아이디어가 있습니다. 그러나 내가 원했던 것, 가능하다면 궁금한 점은 사용자가 "찾아보기"를 클릭하고 파일을 선택하면 사이트가 파일을 업로드하기 전에 사이트의 데이터베이스에서 유사한 파일을 자동으로 검색 할 수 있는지 여부입니다. 대지. 이 사이트에서 질문을 할 때 자동 "관련 질문"과 비슷한 종류입니다.파일 업로드 형식으로 파일을로드 할 때 데이터베이스에서 관련 파일을 검색 할 수 있습니까?

+0

매우 모호합니다. 관련된 문서? 텍스트, 바이너리? 그들은 이미지입니까? 어떤 기준으로 "비슷한"을 정의합니까? –

+0

파일 유형이 제공되지 않았기 때문에 일반 업로드 사이트라고 가정합니다. 라 Rapidshare. –

+0

모든 종류의 파일이 있으므로 "일반 업로드 사이트"로 분류 될 수 있습니다. – Wazle

답변

0

파일 이름을 기반으로 검색을 수행 할 수 있도록 파일을 업로드하지 않고 파일 이름을 가져올 수 있습니다. 콘텐츠는 업로드 후에 만 ​​사용할 수 있습니다.

+0

사이트가 업로드 우선 가능하면 메타 정보 종류의 태그/설명/작성 –

1

물론 가능합니다. 그러나 비슷한 것을 찾는 알고리즘뿐만 아니라 자신 만의 정의를 찾아야합니다.

파일 형식의 차이는

다른 파일 형식은 다르게 비교되어야한다. 예를 들어 텍스트 파일은 유사한 파일을 찾기 위해 diff에 적합하지만 비슷한 이미지 나 비디오를 비교하는 것은 상당히 어렵습니다. 비교

난이도 또한, 많은 수의 파일에 대해 비교하는 것은 일반적으로 쌍대 일 이후 할 수있는 매우 비싼 것입니다. 일부 인덱싱 방법을 사용하면 검색의 효율성을 높일 수 있지만이 작업을 신속하게 수행 할 수있는 쉬운 방법은 없습니다.

군중 소스 대안

또 다른 대안이 사이트의 사용자가 유사성을 지적 단순히 유사 선정 된 가장 인기있는 파일의 목록을 표시하는 방법이하는 것입니다. 물론 이것은 새로운 파일을 업로드 할 때 도움이되지 않지만 사용자가 비슷한 것을 발견하는 데 도움이됩니다.

콘텐츠의 유사성을 비교하기 위해 사이트가 많이있는 곳은 사용자가 항목에 태그를다는 것입니다. 한 항목이 동일한 태그를 다른 태그와 많이 공유하면 유사 할 가능성이 큽니다. 이것은 아마도 가장 쉬운 방법 일 것입니다.

또한 모든 콘텐츠 형식을 다른 콘텐츠 형식과 비교할 수 있다는 이점이 있습니다. 따라서 비디오와 동일한 태그를 가진 텍스트 파일을 비슷한 것으로 표시 할 수 있습니다.

+0

" 군중 소스 대안 "- 귀하의 제안에 감사드립니다. – Wazle

+0

+1, 군중 소스 태그 지정은 아마 일반화 된 시나리오로 이동하는 방법 일 것입니다. –

관련 문제