2012-05-25 3 views
0

사용 가능한 모든 언어에 대한 단어 목록을 포함하는 파일이 필요합니다. 나는 그것을 검색하고 ftp.gnu.org 호스트가 aspell 디렉토리를 많이 포함하고 있지만, 나는 단어 데이터를 가진 어떤 원시 파일도 찾지 못했다는 것을 알게되었다. n-gram을 생성하고 특정 텍스트에서 언어를 인식하는 데이 코드가 필요합니다.리눅스 사전

답변

1

는/usr/share/DICT/영국 - 영어 파일은 패키지 wbritish에 포함되며, 다른 사전을 다운로드 할 수 있습니다 또한 Kevin's Word List Page에서 중에는 Ispell 영어 단어 목록을 설정한다.