내가자바 빠른 문자열 일치 (카테고리에 텍스트를 연결하는)
- TITLE 같은 것입니다 게시물 있다고 가정하자 : "WEB : SEO 2011 년"
- 설명 : "에 대해 얘기하는 회의 웹 드 - IT는 "> (고양이)": 2011의 웹 사이트에 SEO "
- 또한
, 난 관련 키워드 카테고리의 목록을 가지고" 기호 ","검색 엔진 최적화 "," "웹 개발", "개발 내가 필요
(키워드)
내가 여러 범주를 (IT, 예술, MEDICALS, 문학, 기계 등) 자바를 사용하여 미래의 검색을 개선하기 위해 해당 카테고리 및 키워드 (일종의 태깅)로 내 게시물을 자동으로 업그레이드하십시오.
위 예제는 main_category 필드가 "IT"로 채워지고 subfield_category가 "seo"또는 "web"로 채워지도록 "seo"와 "web"과 일치해야합니다. 나쁘지 않다.)
내 문제는 내가 말할 수있는 유일한 해결책은 bruteforcing (모든 단어 테스트, 하나는 카테고리와 키워드 목록이 일치 함)에 대한 waaaaay이다. 내 공연 속도가 느려집니다 ...
더 좋은 방법으로 검색을 수행 할 수있는 방법이 있습니까? 또한 내 카테고리 -> 키워드 구조를 수정할 수 있습니다 더 나은 일을 (나는 아직도 어떻게 ...)
미리 감사드립니다!
EDIT : 정확도는별로 중요하지 않습니다. 내가 문자열의 원시 일치를 기반으로 정직의 정직한 금액을 가질 수 있기 때문에 나는 태깅에 100 %의 정확성이 필요하지 않습니다.
또한, 나는에 대해 thinkinking 된 논리는 다음과 같습니다, 게시물 제목/설명, 키워드 매칭 검색, 카테고리,이 범주에 더 많은 키워드 검색과 태그를 보면 3 ~ 5 일치하는 키워드
학습용 샘플이 있습니까? [즉 어떻게 태그를 지정해야 하는지를 아는 문서 세트]? – amit
또한 태그 지정의 정확도를 알고 계십니까? 또는 tag-word가 항상 주제/설명에 있다고 가정 할 수 있습니까? – amit
이것은 가장 큰 문제입니다. ope :(샘플 컨텍스트가없는 원본 문서 만 있습니다. (정확도가 중요하지 않으므로 각 게시물에 2-3 초 수준의 키워드를 연결하기로 결정했습니다. –