2010-07-07 1 views
3

투표 당 색인을 생성하는 것을 상상할 수 없습니다. 그것은 서버를 부적절하게 변형시킵니다.Reddit이 어떻게 게시물을 다시 색인 처리하여 정확한 순서로 유지한다고 생각하십니까?

나는 내 프로젝트에서 비슷한 것을 시도하고 있기 때문에 이것에 대해 언급했다. 투표를 한 후에 오브젝트를 인덱싱하는 가장 좋은 방법을 알 수 없다.

Sunspot-Solr을 사용하고 있습니다.

답변

3

저는 늦었지만 오늘은 귀하의 질문에 새로운 빛을 불어 넣기 위해 검색을 수정했습니다. 대답은 Solr과 같은 검색 엔진이 reddit 투표와 같은 자주 업데이트를 처리 할 수 ​​없다는 것입니다. 그들은 지금 IndexTank을 사용하고 있으며, 확실히 작동합니다! (예, 저는 개발자 인 IndexTank입니다)

+0

나는 그것에 대해서도 읽었다. – Trip

+0

jhandl, 세 개의 대답, 모두 세 개의 indextank에 연결됩니다. 사람들이 이것을 알아 차리지 않을 것이라고 생각하십니까? : s – dmp

+0

맞습니다. 면책 조항을 추가해야합니다. 끝난. – jhandl

1

투표 수를 통해 검색 결과에 영향을주고 싶지만 오프라인/지연 방식으로 수행해야한다고 생각합니다. 제 생각에 투표 결과가 투표 결과에 미치는 영향이 적을수록 Solr이 더 잘 작동 할 것이므로 Reddit은 잘못된 사용 사례입니다. 6 또는 12 또는 24 시간마다 투표를 업데이트하고 투표 된 문서의 하위 집합에 대해서만이를 수행하십시오. 어떤 시점에서 Solr 문서의 일부만 업데이트하면 도움이 될 것입니다!

1

실제로 투표 당 한 번 색인이 생성됩니다.

우리는 IndexTank를 사용하여 upvotes/downvotes/user karma를 변경할 때마다 새로운 검색을 설계했습니다.

인덱스 탱크의 장점은 텍스트 데이터를 다시 색인하지 않아도 채점 시스템에 영향을주는 문서 변수 (숫자)를 업데이트 할 수 있다는 것입니다. 이렇게하면 엄청난 수의 (문서 변수) 업데이트가 있더라도 색인이 빠르게 유지됩니다.

관련 문제