2009-10-20 7 views
0

참조되지 않는 개체를 먼저 찾아서 데이터베이스를 정리하려고합니다. 모든 데이터베이스 개체를 목록으로 추출하고 모든 ddl 코드를 파일로 추출했으며 프로젝트의 모든 Java 소스 코드도 가지고 있습니다.Perl에서 여러 파일들을 어떻게 인덱스 할 수 있습니까?

기본적으로 (필자가 가장 익숙한 스크립팅 언어 인 Perl에서 선호하는) 추출 된 데이터베이스 ddl 및 Java 파일의 내용을 어떻게 든 색인화하여 (검색 속도를 높이기 위해) 데이터베이스 개체 목록을 단계별로 실행 한 다음 인덱스를 사용하여 모든 파일을 검색하여 해당 개체가 어디에서나 참조되고 보고서를 만들 수 있는지 확인하십시오.

당신이 원하는 방향으로 모든 파일을 색인 할 수있는 방법으로 (필자가 Perl에서 검색 할 수있는 방식으로) 찾을 수 있다면 큰 감사 할 것입니다. 여기에서 핵심은 수동으로 (Google 데스크톱 검색과 같은 것을 사용하는 것이 아니라) 프로그램 적으로이 작업을 수행 할 수 있다는 것입니다.

+4

개체가 참조되지 않았다고 어떻게 결정합니까? 입력 데이터는 어떻게 생겼습니까? 귀하의 질문에 구체적인 정보가 너무 적습니다. 바로 지금, * 파일의 색인을 생성하고 검색하십시오 * 귀하의 질문에 대한 완벽한 대답입니다. –

+0

원본 파일 (특정 개체의 데이터베이스 원본 파일 제외)의 어느 곳에서나 이름이 표시된 텍스트가없는 경우 개체는 참조되지 않습니다. – Roqetman

+0

이것은 코드가 있기 때문에 HTML 문서와 키워드보다 훨씬 어렵 기 때문에 복잡한 작업입니다. 더 이상 적용되지 않는 설명에 뭔가가 남겨지면 위양성을 얻을 수 있습니다. 또한 객체 이름을 사용하는 규율에 따라 적용되지 않는 데이터 문자열을 일치시킬 수 있습니다. 저는 여러분이 사례를 제한하고 시작하는 것에 대해 생각할 필요가 있다고 생각합니다. – Axeman

답변

2

작업을 단계별로 분해하고 처음부터 시작하십시오. 첫째, 레코드는 어떻게 보이며, 어떤 정보가 다른 레코드와 연결됩니까? 해당 레코드를 구문 분석하고 고유 식별자 및 참조하는 항목의 목록을 저장합니다.

일단 그 목록을 가지고 있으면 그것을 뒤집습니다. 각 참조에 대해 참조 된 개체의 목록을 만듭니다. 그들의 식별자로 계산하십시오. 당신은 카운트가 0 인 것을 얻을 수 있어야합니다.

매우 일반적인 답변이지만 매우 일반적인 질문을 던졌습니다. 문제가있는 경우 해당 단계 중 하나에 해당하는 단계로 나누고 샘플 데이터와 지금까지 시도한 코드를 제공하여보다 구체적인 질문을하십시오.

행운을 빌어 요,

0

당신은 당신이 원하는 일을하기 위해 사용할 수있는 흥미로운 모듈은 당신에게 당신이 찾고 있다고 색인의 종류를 제공, KinoSearch입니다. 그런 다음 객체 식별자를 통해 참조가 있는지 확인할 수 있습니다.

관련 문제