2012-04-18 2 views
0

1500 개의 카테고리 (여러 개의 다른 단어가 포함 된 여러 개의 단어가 있음)가있는 상당히 큰 카테고리 테이블이 있으며 제목을 기준으로 해당 카테고리의 새로운 제품을 검색하는 가장 좋은 방법을 찾고 있습니다. .카테고리 일치 - 정규식 대 전체 텍스트 검색

정규 표현식을 사용하여 주요 단어에 대한 제품 설명을 반복적으로 살펴 봤지만 한 번에 1000 개가 넘는 제품을 추가 할 때 매우 효율적이지는 않았습니다. 전체 텍스트도보고있었습니다. 검색 (FREETEXT 포함)하지만 FreeText 검색은 제품 설명에있는 모든 단어와 일치하는 결과를 많이 가져 오는 것으로 보입니다.

누구나 제품의 설명에 따라 어떤 카테고리를 자동화하고 어떤 조언이나 조언을 제공 할 수 있습니까?

답변

1

그래서 내가 이해할 수있는 질문은이 설명이 적용될 수있는 범주를 설명해주었습니다.

이런 종류의 작업을 수행하는 일반적인 방법은 Naive Bayesian Classification 프로세스를 구축하고,이를 통해 설명을 모두 넣어하는 것입니다.

이와 같은 분류는 일반적으로 2 단계로 수행됩니다.

1 단계 : 분류자를 "훈련"하기 위해 알려진 설명/카테고리 쌍이 사용됩니다.

2 단계 : 분류가 훈련 후에는 다음을 알 수없는 데이터를 제공 할 수 있으며, 그 다음 설명은 해당 카테고리와 일치 할 확률을 반환합니다.

이 방법의 분류는 내가 나이브 베이지안 분류의 읽기 업을해야합니다, 오류가 일반적으로

+0

감사에 크리프을, 일반적으로 매우 정확하지만 우리는 통계를 다루고있는 주어진 – user1186144