2009-04-08 2 views
0

맨 페이지 모음에 대한 다양한 속성 (예 : 제목, 태그, 설명)을 정렬, 탐색 및 표시 할 수있는 웹 응용 프로그램을 디자인하고 싶습니다.텍스트 맨 페이지를 찾아 볼 수있는 웹 인터페이스는 어떻게 디자인합니까?

특히, 이들은 SVN 저장소에있는 여러 사람이 관리하는 데이터 세트 모음이 들어있는 R 패키지 내에 R documentation files입니다. 이 파일의 형식은 .Rd입니다. LaTeX와 비슷하지만 형식은 다릅니다.

R에는이 man 페이지를 html 또는 pdf로 변환하는 기능이 있지만 사용자가 특정 키워드를 클릭하고 목록을 가져올 수있는 웹 인터페이스를 가질 수 있기를 바랍니다 (간략한 발췌 내용) \ keyword {} 태그 내에 해당 키워드가있는 맨 페이지의 경우.

또한 생성 된 html은 다소 못 생겨서 내 자신의 CSS를 제공 할 수 있기를 바랍니다.

명백한 옵션 중 하나는 MySQL과 같은 데이터베이스에 원하는 모든 메타 데이터를로드하고 내 사이트를 디자인하여 쿼리를 실행하고 적절한 데이터를 가져 오는 것입니다.

나는 미래의 유지 보수를위한 유지 보수를 최소화하기 위해 피하고 싶습니다. 파일 수가 적고 (< 500) 데이터 양이 적습니다 (파일 당 2 백 라인 정도).

필자가 기대하는 것은 각 파일의 원하는 메타 데이터를 요약 JSON 파일로 가져 와서이 summary.json 파일을 PHP에로드하고 디코드 한 다음 배열을 반복하여 속성이있는 항목을 찾는 스크립트를 작성하는 것입니다 현재 검색어 (예 : 모든 문서가 keyword1 AND keyword2)와 일치합니다. 나는 다음과 같은 ...

$contents=file_get_contents("summary.json"); 
$c=json_decode($contents,true); 
foreach ($c as $ind=>$val) { .... etc 

와 그 방향으로 시작했다

또 다른 아이디어는 XML 이러한 .Rd 파일을 변환 할 스크립트를 작성하는 것이 었습니다. 이 경우 간단한 XML 파일 컬렉션을 정렬하고 검색 할 수있는 가벼운 프레임 워크가 있습니까? XQuery를이 과잉 인 경우

는 잘 모르겠어요 아니면 내가 ... 그것으로

을 발굴 할 시간이 있다면 나는 모든 AJAX의 유혹에 너무 많은 옵션-증후군을 앓고있는 것 같아요. 어떤 도움이라도 대단히 감사합니다.

저는 간단한 간단한 해결책을 찾고 있습니다. 어떻게 당신 중 일부가이 문제에 접근 할 수 있습니까?

답변

1

내 접근 방식은 파일에서 귀하의 설명 (나는 그들이 정상적인 단어/텍스트에서 그들을 구별하는 특별한 표기법이 있다고 가정) 구문 분석하고 검색 색인으로 어딘가에이 데이터를 저장합니다. mySQL 일 필요는 없지만 sqlite는 반드시 프로젝트에 충분할 것입니다. 검색은 매우 간단합니다.

파싱 파일은 Subversion 저장소의 커밋 후크 (post-commit-hook)로 자동화 할 수 있습니다.

0

각 요약 필드에 대해 열로 테이블 요약을 작성하지 않는 이유는 무엇입니까? 그러면 전체 텍스트 색인으로 색인을 생성하여 각 필드에 다른 가중치를 할당 할 수 있습니다.

MySQL이 필요하지 않은 경우 Google의 전체 텍스트 색인 생성 (FTS3)이 내장 된 SQLite를 사용할 수 있습니다.

관련 문제