2011-01-25 11 views
0

나는 어려운 문제가 내 앞에 놓여 있으며 스스로 공격 계획을 세우기 전에 커뮤니티의 지침을 찾는 것이 가장 좋다고 생각했습니다.많은 수의 XML 파일 인덱싱

SQL Server 2008 데이터베이스에서 검색 할 수 있어야하는 수천 개의 XML 파일이 있습니다. XML 파일은 현재 디스크에 있으며 모든 저장소에 포함되어 있지 않습니다. 내가 "검색"을 의미하는 것은 내가 (여기 사이비 코드) 같은 것을 할 수 있어야한다는 것입니다

SELECT * 
FROM tbl_xmldata 
WHERE CONTAINS('xmldata', 'some search word') 

tbl_xmldata XML 파일이 저장되는 테이블이 될 것이며, XMLDATA는 열 것 실제 XML 데이터

마지막 요구 사항 (실제로 이것은 힘든 것입니다)은 히트가 발견되면 (그리고 '히트'에 의해 XML 파일에 검색된 용어가 포함되어 있음을 알 수 있습니다) 액세스 권한이 필요합니다 검색 용어가있는 단어를 둘러싼 문구로 예를 들어, 나는 거기에 다음 한 XML 파일이 있다면 :

< 우리는 모든 사람이 만든 것을 자명 한 진실로을 개최>루트 동일 </루트>

및 나는 "self-evident"라는 단어를 검색했고, 검색 용어가 발견되기 전후로 약 20 문자를 되돌릴 수 있어야합니다. SQL Server의 전체 텍스트 인덱싱은 용어/단어/구가 특정 문서에있는 경우에만 알려줄 수 있기 때문에 제한적입니다 (해당 문서가 SQL Server 2008 파일 스트림), 단어/문구가있는 문맥을 말할 수는 없습니다.

도움이 될 것입니다. 감사!

+0

xml 파일은 모두 동일한 스키마를 가지고 있습니까? –

답변

관련 문제