2016-09-06 2 views
3

최근 언어 API를 사용하여 업무용 프로젝트에 대한 감성 예측을 수집했습니다. 약 1,300 개의 레이블이없는 문서가 있었고 사전에 각 단어의 극성 추정치가있는 단어 사전을 기반으로 NLTK의 도구를 사용했습니다. 나는 API를 사용하여 예측을 검토 한 후 API가 NLTK보다 훨씬 나은 결과를 산출했습니다.새로운 Google 자연 언어 API

나는 엔지니어가 예측 엔진의 세부 사항을 공개하고 싶지는 않을 것이라는 것을 이해하지만, 높은 수준에서 어떻게 작동하는지 궁금하다. 누군가가 나를 가르치거나 올바른 방향으로 나를 가리킬 수 있다면, 나는 그것을 감사 할 것입니다. 예를 들어, "은 수십억 개의 관측에 대해 훈련 된 신경망을 사용합니다."은 합리적인 답입니다.

이번에도 저는 이것을 업무 프로젝트에 사용하고 있는데 왜 NLTK에서 API로 전환했는지에 대한 간단한 설명을하고 싶습니다. (개선 된 결과는 스스로 말해야하지만 분명히 알 수 있습니다. "잘하시오, 어떻게 작동합니까?").

답변

3

언어 API는 Penn Treebank와 같은 공개 데이터와 Google의 언어 학자가 주석 처리 한 독점 데이터를 조합하여 훈련 된 최첨단 기계 학습 시스템의 파이프 라인입니다.

NLTK와 같은 성능 향상은 학습을위한 더 많은 데이터와 더 나은 데이터의 결합뿐만 아니라 신경 네트워크를 포함하되 이에 국한되지 않는 최첨단 기계 학습 알고리즘의 조합에서 비롯됩니다. 알고리즘의 몇 가지 논의

관련 링크 :