내 응용 프로그램에서 들어오는 문서의 특성을 "잘"또는 "잘못"으로 기술하고 싶습니다. 이것이 쉬운 일은 아니라는 것을 알지만, 거친 아이디어조차도 유용 할 것입니다. 이 작업을 수행하는 방법은 두 클래스가있는 순진한 베이 즈 분류자를 통해 이루어 지지만 제안은 받아 들일 수 있습니다. 그래서 두 가지 질문 :NLP와 Ruby는 글자의 품질을 특징으로합니다.
이 방법은 최적이 을 수행하는 방법 (계정 단순성을 고려하여) 충분히 큰 훈련 DB를 가정입니까?
루비 에이 도서관입니다 (또는 통합 가능한 JRuby에서 또는 무엇이든) 나는이 작은 소란으로 일어날 수 있도록 내 레일 응용 프로그램에 연결 할 수 있습니다?
고마워요!
Ken- 이것을 수행하기 위해 특정 라이브러리를 사용하고 있습니까? 아니면 그냥 손으로 코딩? 시작하기에 좋은 장소 인 것 같습니다. –
그냥 손으로 코딩. 내가 아는 도서관이 없어 ... – seriousken