2009-07-07 2 views
0

어쩌면 내가 문제를 잘못 설명하고 답을 질문과 섞을 수도 있지만, 제발 나에게 제발. 나는 검색 엔진 (lucene/solr, FAST ESP 등)을 사용하는 MVC 프레임 워크 (PHP 또는 ASP.NET MVC, whtever)를 기반으로하는 사이트에 대해 (공동으로, 당신과 함께) 생각하고 싶습니다.)를 모델의 백엔드로 사용합니다. 즉, 프로젝트 자체에는 데이터베이스가 없습니다. 반 구조화 된 문서 인 거대한 색인 색인.검색 엔진이 모델 인 MVC 구현

나는이 사이트가 주로 읽기 전용이며, 문제가 발생할 가능성이 있음을 알고 있습니다. 이것이 당신이 생각한 행동이 나쁜 생각이라고 생각하게 만드는 것은 무엇입니까? 또한 검색 엔진을 둘러싸고있는 강력한 인프라가 있다고 가정하십시오. 따라서 퍼펙트 주석을 환영하지만 중요한 문제는 아니라고 생각합니다.

감사합니다.

답변

0

일반적으로 콘텐츠를 검색하는 데 Lucene과 같은 도구를 사용하고 검색하는 데 데이터베이스를 사용합니다. 그렇다고해서 작동하지 않는다는 의미는 아닙니다. 그것은 왜 당신이 데이터베이스를 사용하고 싶지 않은지에 대한 질문입니다. 예, 작동 할 수 있으며 아마도 작동 할 것입니다 (사이트의 기능 요구 사항에 따라 다름).하지만 여전히 Lucene과 같은 도구를 만들지는 않습니다. right 도구 자체로 작업하십시오.

즉, 사이트의 종류에 따라 달라질 수 있습니다. 검색 가능한 데이터 만 포함하고있는 사이트인가요? 아니면 그 이상의 것입니까? 대답이 첫 번째라면 좋은 것입니다! 후자의 경우 생각할 수있는 몇 가지 문제가 있습니다.

  • 데이터를 업데이트하는 것이 번거로울 수 있습니다. Lucene은 색인을 다시 작성해야하기 때문에 "즉시 업데이트"는 일반적으로 시간이 많이 소요됩니다. 데이터에 대한 업데이트가 많지 않으면 문제가 없습니다. 인덱스가 하루에 두 번 또는 야간에 다시 생성 될 수 있습니다.
  • 색인 생성에 실제로 적합하지 않은 색인의 데이터를 채우려 고 시도하는 것은 대개 좋은 생각이 아닙니다. 사이트에서 사용자가 사이트에 등록 할 수있게하면 해당 사용자 데이터는 실제로 데이터베이스에 있어야합니다. lucene 인덱스에 저장하는 것은 불가능하지 않으며 작업에 적합한 도구가 아닙니다. 인덱스는 인덱스 된 문서의 묶음으로 사용하지만 데이터베이스로도 사용하지 마십시오.
+0

감사합니다. Razzie - 사이트는 드물게 변경되는 카탈로그 에서처럼 실제로 데이터 검색에 관한 것입니다. 그러나 각 데이터 항목의 구조는 다를 수 있습니다. 단지 몇 개의 템플릿 만있는 것이 아니라 임의의 "지능적으로 마크 업된"XHTML 또는 XML의 파편과 비슷합니다. 사실 CouchDB와 같은 것을보고있었습니다. 감사 –