가능한 트위터 핸들을 생성하고 가용성을 확인하는 스크립트를 작성했습니다. 허용되는 심볼 조합을 반복하면됩니다 : a-z, 0-9, _
. 현재 1926220 개의 조합, 즉 1 ~ 5 개의 기호가 포함 된 모든 조합을 확인했습니다. 여기에 간단한 결과는 다음과 같습니다 1 0
무료 계정, 2, 3 개 기호, 442711
는이 목록을 분석하고 사람을 찾을 것 algorythm을 작성할 수 있습니다 만약 내가 궁금하네요임의의 텍스트로 언어 패턴 찾기
5.를 들어, 4 750
무료 그 중에서도 읽을 수있는 단어는입니다. 다음은 예입니다
elnsv
elnt8
eloq4
elosu
elq0_
elq15
elq46
elosu
가이 다른 이들과 다른 단어와는 Elosu라고 스페인 심지어 마을이 있다고 밝혀졌습니다. 인간은 어떻게이 단어들을 구별 할 수 있습니까? 저는 여러 언어로 된 강의 표제를 만들고 단어를 비교해 볼 수 있다고 생각합니다. 수식이나 다른 아이디어로 나를 도울 수 있습니까?
업데이트 : 구현을 시도하려는 사용자는 5-symbol handles으로 연결됩니다.
같은 종류의 http://en.wikipedia.org/wiki/Latent_semantic_indexing 같은가요? – jmpyle771