에코 상태 네트워크의 계층 적 조합을 사용하여 R^n의 고정 된 크기의 벡터로 심볼의 보안을 벡터화하는 아이디어를 테스트하고 있습니다. 목표는 이러한 시퀀스를 벡터로 분류하는 것입니다 (고정 된 크기의 실제 벡터에 사용할 수있는 많은 기계 학습 알고리즘이 있음).기계 학습 알고리즘을 사용하는 단어 벡터화
특히이 알고리즘을 영어 단어로 테스트하여 명사 또는 형용사로 분류하려고합니다. 내 데이터 세트는 다음과 같습니다. http://www.ashley-bovan.co.uk/words/partsofspeech.html
SVM을 사용하여 분류하면 9 %의 오류가 발생합니다. 누군가 관련 논문이나 결과를 비교할 수있게 해주시겠습니까?
감사합니다.
좋은 예입니다. 그러나 90 %는 보편적 인 상수로 보입니다. 잘못 분류 된 단어를 게시 할 수 있습니까? n은 무엇입니까? 어떻게 n 벡터를 정규화합니까? – denis