2012-06-08 2 views
0

특정 마크 업 표준에 저장되어있는 파일을 선택하면 전체 텍스트 볼륨을 구성합니다. 이 텍스트는 다양한 언어로 제공되며 각 파일은 해당 언어로 복제됩니다.대용량의 텍스트 저장, 검색 및 표시

웹 앱을 통해 잠재적으로 많은 사용자에게 정보를 저장, 검색 및 표시하려면 가장 적절한 방법을 구현해야합니다. 현재 나는 다음의 라인을 따라 생각하고 있습니다.

파일을 XML로 변환 한 다음 (마크 업 언어를 쉽게 만들 수 있도록 디자인되었습니다) 사용자가 해당 섹션을보고 싶을 때 관련 파일을로드하십시오. 결과를 표시하기 위해 Rails와 Ember.js를 사용하고 있으므로 데이터가 JSON 형식이어야합니다.

내 질문은 :

내가 JSON에 XML을 변환해야하고 파일이 저장 또는이 XML에게이 요청 될 때마다 변환하는 더 나은 것입니까? 데이터를 파일에 저장해야합니까, 아니면 데이터베이스로 이동해야합니까? 텍스트의 각 섹션에 각주 및 기타 참조가있을 수 있으므로 데이터베이스 경로를 따라 가면 각 섹션을 각 언어의 테이블 필드로 저장하는 것이 더 낫겠습니까? 또는 각 언어마다 자체 테이블이 있어야합니까? 나는 그 것을 더 해체해야하고, 단락, 각주, 참조 등에 대한 필드가있는 언어 내의 각 섹션에 대한 테이블을 가지고 있어야합니까?

구현할 가장 좋은 방법은 실제 구현 방법이 아니라 실제 구현 방법에 대한 답변입니다. 감사.

+0

나는 큰 소리로 생각하고있다. 그러나 결국 파일 내용을 검색 할 수 있기를 원하기 때문에 데이터베이스가 가장 좋은 방법 일 것이라고 생각한다. 또는 파일의 여러 키워드에 대한 전체 텍스트 검색을 쉽게 할 수 있을까? ? –

답변

0

나는 XML 문서를 저장하기 위해 eXist을 사용했으며, 나에게 잘 맞았다. XPATH 및 XQUERY를 통해 XML 문서를 저장하고 쿼리 할 수있는 XML 데이터베이스입니다. 텍스트 기반 검색을위한 Lucene 통합도 있습니다. XML 저장에 대해 생각하고 있다면 XML을 조사하는 것이 좋습니다.