2010-07-14 2 views
2

태그 속도, 나는 스탠포드 타거에 대한 모델을 훈련하기 위해 자체적으로 분류 된 코퍼스를 제공했습니다. 그러나 나는 tagger에 대한 내 모델의 태깅 속도가 기본 wsjleft3 태그 모델보다 훨씬 느리다는 것을 깨달았다. 이것은 무엇에 기여할 수 있습니까? 내 모델의 속도를 어떻게 향상시킬 수 있습니까? (Penn treebank 태그 세트에 추가로 3 개 또는 4 개의 커스텀 태그를 추가했습니다)스탠포드 타게터 - 스탠딩 태그 타에 관한

답변

4

더 많은 기능을 추가하면 (arch에서는) 일반적으로 약간 느려지는 반면 (피쳐 추출은 주요 런타임 비용 중 하나이기 때문에), 속도의 두 개의 큰 결정 요인은 다음과 같습니다 컨텍스트 기능에 사용되는 태그의

  • 번호 : left3words가 이전 및 초 이전 태그 (2) 사용 등 매우 빠르고, 양방향 각 4 (두를 사용 측면)와 매우 느린 입니다. 1 또는 0 컨텍스트 태그 만 사용하는 태그 작성기는 훨씬 더 빠릅니다. .
  • 태그 집합의 크기, 특히 알 수없는 단어에 적용 할 수있는 공개 클래스 태그 집합의 크기. (그러나 3 또는 4를 추가해도 거의 차이가 없어야합니다. 수백 개의 태그가있는 태그가있는 경우 문제가됩니다.)
관련 문제