ok, 저는 SOLR과 Lucene을 완전히 처음 접했지만 Tomcat 6.x에서 Solr을 즉시 사용할 수있게되었습니다. 그리고 기본 Wiki 항목 중 일부를 방금 들었습니다.웹 프로젝트에서 SOLR을 사용하는 가장 좋은 방법은 무엇입니까?
몇 가지 질문이 있으며 몇 가지 제안 사항이 필요합니다.
Solr은 파일 (XML, CSV)의 데이터를 색인화 할 수 있으며 색인을 생성 할 수도 있습니다. 또한 URI/도메인을 가리킬 수 있고 Google에서하는 것처럼 웹 사이트의 색인을 생성 할 수 있습니까?
"페이지 이름", "페이지 콘텐츠"등 "제품", "SKU"등 "페이지"데이터가있는 웹 사이트가있는 경우, Schema.xml 파일? 그렇다면 Solr의 두 가지 인스턴스를 의미합니까? 당신은 당신이 가장 좋은 방법은?
다음의 3 가지 옵션 중 하나를 말하는 것입니다 무슨 큰 관계형 및 표준화 된 데이터베이스와의 프로젝트를 가지고있는 경우
마지막으로, 미들웨어 서비스가 실행 되세요 DB를 채굴하고 수동으로 관련 XML 파일을 생성하여 SOLR로 전송합니다.
SOLR은 DB에 직접 색인을 지정합니다. 이 경우 모든 테이블 관계를 추상화 할 뷰로 SOLR을 지정하는 것이 가장 좋을까요?
다른 옵션은 무엇입니까?
컨텍스트 : 우리는 SQLServer에, 윈도우 2003 환경에서 2005/2008
환호를 .NET 3.5을 실행하는!
+1 감사합니다. Mauricio, 정말 유용합니다. 나는 당신이 한 지점, 아마도 두 곳에서 조금 확장 할 수 있는지 궁금합니다. 오래된 데이터와 신선한 데이터의 관점에서 내가 사용하는 데이터 소스는 상관 없습니까? 얼마나 자주 내가 커밋을하는 지 ... 모든 커밋 (추가/업데이트/삭제)을 수동으로 올바르게 수행해야한다고 가정 할 때? SolrNet에 관해서는 SOLR과의 직접적인 통신에 대해 걱정할 필요가 없습니까? 다시 한 번 감사드립니다 데이터 신선도에 관한 – andy
: 데이터의 * 사용자 * (소비자)에 따라 다릅니다. 소비자가 오프라인/배경 인덱스 방법을 배제하는 최신 데이터를 항상 볼 필요가 있다면 트리거 나 ORM 차단과 같은 좀 더 사후 대응책을 찾아야합니다. 물론 웹 페이지를 인덱싱 할 때 "트리거"가 없으면 크롤러 만 사용할 수 있습니다. 예, SolrNet이 .Net을 처리합니다. <-> Solr 통신. –
@mauricio : 감사합니다. 우리는 사이트를 구축하기 위해 사용자 정의 CMS를 사용합니다. 따라서, 페이지/제품이 CMS에서 편집 될 때마다 XML을 통해 Solr에 업데이트/삭제 만 커밋한다고 생각합니까? 또한 우리는 NHybernate를 사용하지 않기 때문에 SolrNet에는 아무런 이점이 없을 것입니다. 다시 한 번 고마워, 이건 정말 도움이 – andy