문제는 실행 파일을 검사하고 분석을 위해 문자열을 찾아야하며 sysinternals의 strings.exe을 사용해야합니다. 그러나 의미있는 문자열과 사소한 문자열을 구별하는 방법,이 문제를 해결할 수있는 알고리즘이나 생각이 있습니까 (통계? 확률?).문자열을 판단하는 알고리즘이 있습니까?
예를 들어: strings.exe에서 추출 문자열 (모든 문자열의 일부) 경험적 판단에서
S`A
waA
RmA
>rA
5xA
GetModuleHandleA
LocalFree
LoadLibraryA
LocalAlloc
GetCommandLineW
지난 5 문자열을 의미하고, 처음 5 사람은 없습니다. 이 문제를 해결하려면 블랙리스트 또는 화이트리스트와 같은 사전을 사용하지 마십시오.
또는 적어도이 예를 들어 문자 – Andrey
의 나쁜 N-gramms와 함께 몇 가지 사전을 사용합니다 'strings -n4'는 또한 차별화 역할을합니다. 좀 더 복잡하면 digram 또는 trigram 테이블을 채우고 영어 digram 또는 trigram 테이블과 더 일치하는 단어를 선택할 수 있습니다. – sarnold