2010-02-24 6 views
6

에서 촬영 N-그램의 데이터베이스를 찾고 : 단어 물리적 객체를 나타냅니다I 효과적으로이 문제와 같은 문제를 해결하기 위해 노력하고 위키 피 디아

Finding related words (specifically physical objects) to a specific word

뺀 요구 사항. 대답과 편집 된 질문은 위키 피 디아 텍스트를 코퍼스 (corpus)로 사용하여 n-gram의 빈도 목록을 작성하는 것이 좋은 출발임을 나타냅니다. 매머드 위키 피 디아 덤프를 다운로드하기 전에 누군가가 이미 그러한 목록이 있는지 알고 있습니까? 이전 질문의 원래 포스터이 보는 경우에, 당신이 문제를 해결했다 방법 결과까지 (우수 :-)에게

답변

1

Google as a publicly available 테라 바이트 N-가람 데이터베이스를 것로 알고 싶어요

PS 5).
6 개의 DVD로 주문하거나 호스트하는 토렌트를 찾을 수 있습니다.

+0

예, 데이터 집합을 고려했습니다. 위키피디아 덤프보다 훨씬 더 무서운 것입니다. – mojones

+3

상업적 용도로는 사용할 수 없습니다. – Joel

+0

누구든지 급류를 발견 했습니까? – placeybordeaux

관련 문제