라사의 엔티티 동의어는 다소 혼동을 줄 수 있습니다. 그들이 제공하는 실제 기능은 매우 간단합니다. 모델에 의해 파싱 된 각 엔티티에 대해 해당 엔티티의 값은 엔티티 동의어 목록과 비교하여 검사됩니다. 값이 엔티티 동의어와 일치하면 동의어 값으로 대체됩니다.
간단한 예를 들어 보겠습니다. 여기 내 엔티티 동의어 정의입니다 :
내 훈련 데이터는이 예를 제공하는 경우 {
"value": "New York City",
"synonyms": ["NYC", "nyc", "the big apple"]
}
: 내 모델이의 실체를 감지 할 수있을 것입니다 수있을 것입니다 매우 가능성이
{
"text": "in the center of NYC",
"intent": "search",
"entities": [
{
"start": 17,
"end": 20,
"value": "New York City",
"entity": "city"
}
]
}
을 문장은 In the center of the big apple.
과 같습니다. 그리고 the big apple
이 모델에 의해 엔티티로 구문 분석되지 않으면 뉴욕시를 읽는 엔티티 동의어로 바꿀 수 없습니다.
이런 이유로 실제 common_examples
에 엔테이션 라벨이있는 교육 데이터를 추가해야합니다. 엔티티의 모든 변형이 올바르게 분류되면 해당 값을 엔티티 동의어에 추가하면 대체됩니다.
[
{
"text": "in the center of NYC",
"intent": "search",
"entities": [
{
"start": 17,
"end": 20,
"value": "New York City",
"entity": "city"
}
]
},
{
"text": "in the centre of New York City",
"intent": "search",
"entities": [
{
"start": 17,
"end": 30,
"value": "New York City",
"entity": "city"
}
]
}
]
나는이 효과에 메모를 추가 할 라사의 문서 페이지에 pull request를 열었습니다.
다음, 나는 라사에 루이스 모델 스키마를 변환하는 샘플 C# 콘솔 응용 프로그램을 작성한 다음 스크린 샷과 같이
답장을 보내 주셔서 감사합니다. 그래서 LUIS의 목록 엔티티 같은 것이 있습니다. 약 900 개의 값을 동의어로 추가 할 수 있습니까? –
우리는 값을 교환하고, 시작/끝 위치를 계산하고, 그것을 'common_examples' 배열에 푸시하는 간단한 스크립트를 사용합니다 (우리는 노드에 있지만, 파이썬 등일 수 있습니다). 'common_examples'에서 인 텐트에 레이블을 지정할 필요가 없다는 점은 주목할 가치가 있습니다. 'text'와'entities'만으로 된 객체를 가지고 있다면 그것은 의도 클래스에 영향을 미치지 않고 엔티티 분류에 영향을줍니다. –
감사합니다, 친구 ... –