2011-05-04 4 views
1

신참자 경고!asp.net에서 사이트를위한 검색 엔진을 만드십시오. C#

ASP .net | C# | VS2008 | MS SQL Server 2008 R2 Express

파일 이름, 파일 경로 및 파일 범주가있는 데이터베이스가 있습니다. 나는 또한 웹 사이트에 정적 페이지가 많이 있습니다. 맞춤 검색 엔진을 개발하고 싶습니다. (다른 타사 도구를 사용할 수 없기 때문에 기본적으로 그들은 나를 다시 만들길 바랍니다.)

사용자가 무언가를 검색 할 때 파일 이름과 정적 페이지의 내용을 검색해야합니다. 파일 이름은 데이터베이스에서 직접 검색 할 수 있습니다 (그랬습니까?). 정적 페이지는 머리글 등을 포함한 SEO 친화적입니다.

웹 사이트에서 정적 페이지의 색인을 생성하려면 어떻게해야합니까? 앞으로 일부 페이지가 추가 된 후 검색 색인을 만드는 방법은 무엇입니까? ASP.net C#에서 사용할 수있는 PHP의 컬 (curl)과 같은 함수가 있습니까?

전체 텍스트 검색에 대해서도 들었습니다. 전체 텍스트 데이터베이스를 쿼리하는 방법에 대한 링크?

P.S : 초보자 :)

답변

1

가까운 장래에 페이지가 변경되지 않는다고 확신하는 경우 대부분의 목적에 부합하는 SQL 전체 텍스트 인덱싱을 찾아보십시오. 그러나 앞으로 확장 할 필요가 있다면 Apache Solr (Lucene을 사용하여 빌드 됨)을보아야합니다. .NET 또는 원하는 플랫폼에 통합하기위한 RESTful 인터페이스를 제공합니다. 그것은 모든 케이크는 호환성 자바에 대한 걱정없이 패 시팅 등을 요구 .NET 버전 등을 할 수 있습니다

쉽게 1

+0

감사를 사용하여 .NET 응용 프로그램에 SOLR를 통합 할 수 있습니다! 정적 웹 페이지에 SQL 전체 텍스트 인덱싱을 사용하려면 어떻게해야합니까? 페이지에 내용이 하드 코드되어 있습니다. – Ranjanmano

+0

또한 HTML 페이지를 읽는 방법? 모든 파일 핸들러를 사용할 수 있습니까? – Ranjanmano

+1

SQL Server의 가져 오기/내보내기 유틸리티를 사용하여 콘텐츠를 가져올 수 있는지 확실하지 않습니다. 그렇지 않다면, 기존의 많은 HTML 파서를 사용하여 매우 쉽게 작성할 수 있습니다. http://www.codeplex.com/htmlagilitypack을 권하고 싶습니다. – Mikos

0

pHP에는 cURL을 사용할 필요가 없습니다. IO 함수를 사용하여 디렉토리 (웹)에있는 파일 목록을 조작하고 내용을 가져 와서 나중에 검색 할 수 있도록 데이터베이스에 저장하십시오. 텍스트에서 정규 표현식으로 페이지 제목, 메타 태그도 검색 할 수 있습니다.

로직이 적합한 경우 코드가 필요한지 알려주세요.

관련 문제