2016-08-24 1 views
2

목표는 금융 도메인 언어 쌍인 CHT - EN 및 CHS - EN에 대한 사용자 정의 번역 엔진을 만드는 것입니다. 각자의 사전과 정렬 된 세그먼트가 사용자 지정 엔진으로 가져 와서 엔진을 훈련 할 준비가되었습니다.IBM Watson Machine Translation API로 사용자 정의 도메인을 작성할 수 있습니까?

설명서 (https://www.ibm.com/watson/developercloud/doc/language-translation/)를 올바르게 이해하면 기존 도메인 및 언어 쌍 위에 만 작성할 수 있습니다. 그래서 중국어 - 영어에 대해서만 특허 도메인을 선택하고 내 사전과 코퍼스를 가져온 다음 다시 훈련 할 수있었습니다. 이것이 확실하다면 중국의 전통 중국어 나 중국어 간체를 말하는지 확실하지 않습니다. 나는 전통적인 중국어 서비스를 먼저 필요로하고, 나중에 중국어 간체를 사용한다.

금융 뉴스 도메인 위에 구축하는 것이 대안이지만 중국어 - 영어에는 뉴스를 사용할 수 없습니다.

나는 최선의 방법을 찾아 내려고 모든 지침을 이해하는 방법을 알아 내려고하고 있습니다.

감사합니다.

+0

서비스가 기존 도메인/언어 쌍의 사용자 지정 만 지원한다는 점에서 사용자의 문서 읽기가 정확하다고 생각합니다. 나는 전통적인 중국어 vs 중국어 질문을 조사하고있다. –

+0

업데이트 :이 서비스는 "unihan"을 사용하여 중국어 (번체)와 중국어 (간체)를 모두 지원합니다. 출력을 위해 어떻게 작동하는지는 모르지만 적어도 두 변형을 모두 소스 언어로 입력 할 수 있습니다. –

답변

0

모델을 만들려면 높은 빈도 또는 높은 신뢰성의 구문 번역 또는 병렬 처리 (TMX 파일)가 포함 된 용어집을 사용할 수 있습니다.

@ Nathan에 따르면 zh-en-patentbase_model_id으로 사용하면 unihan을 사용하여 중국어 (번체 및 간체)를 모두 지원할 수 있습니다. zh-en-patent오늘을 사용하여 중국어를 영어로 번역 할 수있는 유일한 모델입니다.

다음은 IBM Watson Language Translator service을 사용하여 맞춤 번역 모델을 만드는 방법에 대한 가이드입니다.

관련 문제