2010-08-12 3 views
1

검색 엔진을 개발할 생각이지만 효율적으로 사용할 수있는 백엔드에 대해 전혀 알지 못합니다. 나에게 수천 개의 레코드를 저장하고 시간에 효율적으로 쿼리 할 수있는 데이터베이스를 제안하십시오. 나는 나의 자신의 관심사를위한 검색 엔진을 이렇게 개발하고있다, 저에게 유사한 질문에서 일반적으로 찾아낸 어떤 비평가 생각도주지 말라.검색 엔진 용 데이터베이스

감사합니다.

+0

모두 당신이 찾고있는 것에 달려 있습니다. 분명히 Bono가 사용하는 접근 방식은 너무 느립니다 ... http : //bit.ly/54Dlbs – RedFilter

+0

Lucene 또는 비슷한 것을 만드는 대신에 검색 엔진을 사용하지 않는 이유는 무엇입니까? – Paco

답변

2

Cloudant (Apache의 CouchDB의 클러스터 된/확장 가능 배포)을 살펴보십시오. CouchDB는 NoSQL 이니셔티브 (데이터베이스 서버에 의해 추상화 된 저장소가 아니라 파일 시스템을 사용함)의 일부이며, 특히 Cloudant를 사용하여 확장 성을 말합니다. 직접 시도하지는 않았지만 말입니다.

분명히 DODB (Apache가 말한 것처럼 문서 지향 데이터베이스)를 사용하면 파일 시스템을 사용하여 일반적으로 메모리 용량과 테이블 색인 생성만으로 저장 용량을 포함시켜야 할 필요성을 느낄 수 있습니다 메모리를 적게 사용하십시오 (의 정보가 메모리에 저장됨에 따라 메모리에 저장 됨). 이것은 일반적인 일반화이지만 아이디어를 얻습니다.

1

수천 개의 레코드로 표준 rdbms이면 충분합니다. 100 만 개가 넘는 사람들을 위해, 당신은 대안을 들여다 볼 수 있습니다.

하지만 당신이 관심을 가지고 그렇게하고 있기 때문에, 차이점을 이해할 수 있도록 각각 하나씩하십시오.

1

MySQL을전체 텍스트 인덱스는 수천 개의 레코드 내에서 검색 할 수있는 좋은 솔루션입니다. 스케일 업하고 1 백만 행에 가까워지면 전체 텍스트이 느려지고 스핑크스과 같은 다른 접근 방식을 사용해야합니다.