shingles
TokenFilter (documentation)를 살펴보십시오. ngram
과 매우 유사하지만 문자 대신 토큰을 사용합니다.
기본 설정을 사용하면 두 단어의 긴 토큰이 생성됩니다. 당신은 _analyze API를 사용하여 동작을 확인할 수 있습니다 : 다음
{
"tokens": [
{
"token": "The",
"start_offset": 0,
"end_offset": 3,
"type": "word",
"position": 1
},
{
"token": "The mouse",
"start_offset": 0,
"end_offset": 9,
"type": "shingle",
"position": 1
},
{
"token": "mouse",
"start_offset": 4,
"end_offset": 9,
"type": "word",
"position": 2
},
{
"token": "mouse is",
"start_offset": 4,
"end_offset": 12,
"type": "shingle",
"position": 2
},
{
"token": "is",
"start_offset": 10,
"end_offset": 12,
"type": "word",
"position": 3
},
{
"token": "is very",
"start_offset": 10,
"end_offset": 17,
"type": "shingle",
"position": 3
},
{
"token": "very",
"start_offset": 13,
"end_offset": 17,
"type": "word",
"position": 4
},
{
"token": "very little",
"start_offset": 13,
"end_offset": 24,
"type": "shingle",
"position": 4
},
{
"token": "little",
"start_offset": 18,
"end_offset": 24,
"type": "word",
"position": 5
}
]
}
는,이 필드에 조회하여, 당신은 당신이 개 예를 문서의 차이를 볼 수 있습니다 : 출력됩니다
POST _analyze?tokenizer=whitespace&filters=shingle&text=The mouse is very little
.
근접 검색에 대한 자세한 설명은 최종 가이드의 this section에서 찾을 수 있습니다.
. 나는 그것을 살펴볼 것이다. 답장을 보내 주셔서 감사합니다. – user3116355