2014-04-24 2 views
0

우편 주소 검색을위한 4.4 solr 코어가 있습니다.이 주소는 this solr name search approach을 읽은 후에 구성했습니다.solar EdgeNGram 쿼리 시간이 느림

이제 쿼리 시간을 제외하고는 모든 것이 정상입니다. 나는 ~ 80M의 색인 된 주소를 가지고 있으며, 800K 장소 집합을 검색하고있다. PortugueseStemFactory에서이 문제에 대한 다른 접근법을 사용할 때, 800K 검색은 약 5 시간 만에 완료됩니다.

이 EdgeNGramFactory 접근 방식은 현재 24 시간 이상 걸리고 전체 파일의 10 %를 방금 통과했습니다. 그것은 더 정확하지만 batchjob에 너무 오래 걸립니다.

이 특별한 경우에 대한 쿼리 시간을 개선하는 방법에 대한 조언이 필요하거나 Solr에 대한 전반적인 조정 및 병목 현상 조사 및 문제 해결 팁이 필요합니다.

또한이 문제와 관련이 있다면 내 쿼리에서 strdist 및 sqedist에 의한 정렬을 사용하고 있습니다.

자세한 내용이 필요하면 의견을 남겨주세요.

답변

0

일반적으로 solr 쿼리 검색 성능은 Search optimization을 사용하여 최적화 할 수 있습니다.

인덱스의 크기가 주어지면 성능을 향상 시키려면 shard보다 좋습니다. 또한 검색 동작 속도를 높이기 위해 상자에 물리적 RAM이 충분하다는 것을 보았습니다.

또한, 당신의 solr 쿼리에서 debugQuery = true를 사용하면, 어떤 부분/구성 요소가 시간이 걸리는지 알 수 있습니다.

strdist는 비트 강렬한 활동이지만 실제로는 검색 결과의 응답 크기에 따라 달라집니다. 그러나 이것이 반드시 문제의 원인이라고 생각하지는 않습니다.

관련 문제