2012-05-25 2 views
0

이탈리아어 사전 (정의가 강조된 단어)을 포함하는 ~ 600MB .DAT 파일이 있습니다.문자열을 추출하기 위해 이진 사전 파일을 리버스 엔지니어링하십시오.

이 파일 (단어 및 정의를 읽을 수있는 한 문자열 및 더티 헤더/바이너리 데이터가 포함 된 원시 덤프)에서 모든 문자열을 추출하고 싶습니다.

제 질문은 : 자동화 된 방식으로이 작업을 수행 할 수있는 소프트웨어가 있습니까?

나는 그것을 말할 것이다 : 은 '나는이 파일은 문자열 "TREE", "개", "CAT", "충돌"... 이제 어떤 방법과 어떤 폭력, 통계 분석 또는를 사용하여 포함되어 있음을 알고 시도하고 이러한 문자열은 '언급 내가 좋아하는 것

2 일을 인코딩하는 방법을 찾을 :

  • 나는 소프트웨어 개발자 모르지만, 리버스 엔지니어링에 전혀 경험이나 지식이없는, 진수 편집 등 ...
  • 리버스 엔지니어링 자습서를 읽고 몇 시간을 보내고 싶지는 않습니다. 시행 착오를하는 것은 많은 소파를 사용합니다. 필요한 것을 간단하게 추출하지 못하면이 작업을 포기할 것입니다.

이 작업을 간단하게 수행 할 수 없다는 사실을 알고 있습니다 (텍스트가 암호화되어있는 경우). 나는 최선의 도구를 사용해 보려고합니다.

답변

0

자동 도구가 존재하지 않는 것 같습니다. 입력 도구의 경우 매우 작은 입력 파일 집합에서만 작동합니다.

마침내 내 문제에 대한 해결책을 찾았습니다.

나는 사전 검색과 단어 정의 표시를 허용하는 EXE 프로그램이 있습니다.

AutoHotkey를 사용하여 400k 단어 입력 목록에서 모든 단어의 정의를 검색하고 클립 보드에 복사 한 다음 다른 출력 텍스트 파일에 붙여 넣는 비교적 간단한 스크립트를 작성했습니다.

스크립트를 안정화하기 위해 키 입력, 창 전환 등 사이에 Sleep 문을 삽입해야했습니다. 전체 사전을 "파싱"하는 예상 시간 : 20 일 :

관련 문제