2009-12-27 3 views
0

내 사진 공유 웹 사이트 용 검색 엔진을 만들고 싶습니다. 검색 엔진은 "태그"단어를 기반으로 결과를 반환하면됩니다. 사진은 인기도, 새것 또는이 둘의 조합으로 분류됩니다.내 사이트에 대한 검색 엔진을 만들 때 Yahoo BOSS를 사용해야합니까?

나는 야후 보스 API를 사용하여 내 검색 엔진을 설정하는 대신 (lucene, solr 등) 궁금했다.

설명서를 보았지만 BOSS API를 사용하여 이미 야후 색인에있는 항목을 검색하는 대신 전체 색인 색인을 가져올 수 있는지 여부를 파악할 수 없었습니다. 사용자가 사이트의 사진에 태그를 지정하면 검색 색인의 항목을 "태그"로 업데이트 할 수 있습니다.

다른 개발자는 Yahoo BOSS에서 이와 같은 작업을 해 본 경험이 있습니까?

답변

1

내가 아는 한 BOSS는 크롤링 할 때 야후 거미가 귀하의 사이트에서 선택하는 모든 것을 검색하도록합니다. 모든 콘텐츠를 탐색 할 수있는 경우 (예 : 검색 가능) 사용자의 목적에 충분할 수 있습니다. 아주 작은 작업만으로 큰 이점이 있습니다.

콘텐츠 또는 색인을 BOSS/yahoo로 업로드하거나 가져올 수 없으므로 콘텐츠를 크롤링으로 찾을 수없는 경우 BOSS가 해결책이 아닐 수도 있습니다.

BOSS가 잘라내지 않으면 자체 검색 플랫폼을 구현해야합니다. 기본적으로 두 가지 선택 항목이 있습니다.

1) Lucene과 같은 색인을 사용하십시오. 그러나 많은 콘텐츠가 없으면 옵션 2)가 충분할 수도 있습니다.

2) 데이터베이스의 해당 열을 색인화하십시오. MySQL을 사용하는 경우 Full text search

옵션 2는 옵션 1보다 훨씬 적은 작업입니다. 둘 다 BOSS보다 특정/원하는 필드로 검색을 제한 할 수 있다는 이점이 있습니다. 자신의 검색을 구현하면 검색 결과가 항상 최신 상태가됩니다.

도움이 되길 바랍니다.

+0

검색 할 항목이 300,000 개 있습니다. 필자는 쉼표로 구분 된 태그가있는 "태그"필드의 전체 텍스트 검색이 상당히 느릴 것이라고 생각합니다. 옳은? – makeee

+1

하나의 태그 필드/열만 검색하는 경우 300k가 많이 있다고 생각하지 않습니다. 기본적으로 컬럼을 인덱싱함으로써 MySQL은 Lucene이하는 일을 내부적으로 수행합니다. 그래도 테스트하는 것이 매우 쉽습니다. 따라서 큰 총을 부수기 전에 그렇게하는 것이 좋습니다. –

관련 문제