2014-11-11 2 views
0

교육 데이터 세트 및 테스트 데이터 세트가 있습니다. 어떻게 실험하고 결과를 얻을 수 있습니까? WEKA를 동일한 용도로 사용할 수 있습니까?WEKA를 사용한 단어 감별 설명

주제는 접근에게 파일 형식을 다음과 두 세트 내에서

문서 유형 학습 감독을 서포트 벡터 머신을 사용하여 워드 감지 동음이다 1. 2 XML 파일 2. README 파일 3. SENSEMAP 형식을 4. TRAIN 형식 5. KEY 형식 6. 단어 형식

답변

2

SVM과 같은 기계 학습 방법은 단어 감별에 널리 사용되지 않습니다.
당신은 Wikify을 알고 계십니까, 위키 피 디아로의 매핑은 매우 정밀한 단어 감별을위한 것으로 간주 될 수 있습니다.
질문에 답변하려면 다음과 같이하십시오. 어떤 기계 학습 기술은 당신에게 원하는 결과를 줄 수 있습니다. 하나는 추출 할 기능에 대해 더 걱정해야하며 단어 기능이 당신이 선택한 수준의 명확성을 해결할 수있을만큼 특이하다는 것을 확인해야합니다. 예를 들어, Wish you a very Happy Christamas의 경우 Happy Christmas을 책이나 축제로 명확하게 말하자.

+0

내가 언급 한 여러 논문에서 SVM이 단어 감별을위한 가장 좋은 방법 중 하나라는 것이 밝혀졌습니다. – Krithi07

+0

WEKA 또는 R 중 하나를 사용하여 트레이닝을 설정 한 경우 테스트 세트를 평가할 수 있는지 알고 싶습니까? – Krithi07

+0

테스트 세트를 평가한다는 것은 무엇을 의미합니까? 어쨌든 전에 WEKA를 사용한 적이없는 테스트 세트 (링크?)는 무엇입니까? –

관련 문제