2013-03-14 3 views
0

Elasticsearch에서 토큰 라이저 및 분석기의 가능성을 이해하는 데 어려움이 있습니다.elasticsearch에서 인덱싱 된 데이터의 속성 추출

제품의 인덱싱 된 데이터 집합이 있다고 가정합니다. 각 제품에는 설명 텍스트가있는 필드가 있습니다. 설명에서 색상의 이름이 지정됩니다.

내장 된 분석기 나 맞춤식 토크 나이저/분석기 중 하나를 사용하여 색상 정보 (예 : 키워드 집합 [빨강, 초록, 파랑, 노랑색 등])를 추출하고 새로운 색상 정보를 제품에 대한 별도의 필드로 사용합니까?

은 일반적인 속성 (예. 색상, 재질 등)

답변

0

당신이 엔티티 인식 기능과 더 많은 관계를 가지고있다 설명하는 과정에 들어오는 데이터를 확장하기 위해 좋은 기능 일 것이다. 텍스트를 제공하는 다른 라이브러리가 있습니다 : OpenNLP, UIMA 이상.

elasticsearch OpenNLP plugin을보고 싶을 수도 있습니다. 엔터티를 감지하고 들어오는 문서에 해당 필드를 추가합니다.

+0

대단히 감사합니다! – Jabb

관련 문제