2016-07-01 3 views
0

어떤 Microsoft인지 서비스 (또는 Azure Machine Learning 서비스)가 가장 적합하며 기사가있는 유사한 기사를 찾는 문제를 해결하는 데 사용할 수있는 작업이 가장 적습니다. 기사는 텍스트 문자열입니다. 그리고 기사에 대한 사용자 상호 작용 데이터가 없다고 가정합니다.Microsoft인지 서비스를 사용하여 유사한 항목 찾기

Microsoft인지 서비스에서이 문제를 즉시 해결할 수있는 것이 있습니까? 상호 작용/사용자 데이터가 없으므로 Recommendations API를 사용할 수없는 것 같습니다.

안토니

답변

0

예. 텍스트 분석 API를 사용할 수 있습니다.

예제는 여기에서 볼 수 있습니다. https://www.microsoft.com/cognitive-services/en-us/text-analytics-api

+0

안녕하세요, Narasimha, 답장을 보내 주셔서 감사합니다. 귀하의 링크에서 나는 감정 분석, 핵심 어구 추출, 주제 발견 및 언어 탐지 API만을 찾을 수 있습니다. 비슷한 항목 (기사)을 즉시 찾을 수있는 항목을 찾을 수 없습니다. (내가 질문 한 이유는 문제를 해결하기 위해 스파크를 사용하는 파이프 라인을 학습하는 기계를 만드는 것이 가능하지만, 즉각적인 솔루션을 찾거나 최소한의 맞춤 코딩을 요구하고 있기 때문입니다) –

0

@Narasimha가 제안한대로 텍스트 분석 API [1]를 사용하는 것이 좋습니다. 문자열을 주제 검색 API에 입력 한 다음 유사성을 위해 각 문자열을 다른 문자열과 비교할 수있는 메트릭 (예 : 유사성 = 개수 (일치하는 주제) - 개수 (일치하지 않는 항목))을 제시하십시오. 이것은 단지 하나의 API 호출과 작은 JSON 구문 분석을 요구할 것입니다.

[1] https://www.microsoft.com/cognitive-services/en-us/text-analytics-api

0

나는 텍스트 웹 로그 분석 API 적어도 아직,이 시나리오의 좋은 사용 될 수 있다는 것을 확실하지 않다.

정말 유사성의 두 가지 유형이 있습니다 :

1. 표면 유사성 (어휘) - 단어의 존재에 의하여 유사성/우리가 표면 유사성을 찾는 경우 알파벳

, 퍼지 매칭/조회를 시도 (SQL Server Integration Services - 이에 대한 구성 요소를 제공합니다.) 또는 근사 유사성 함수 (Jaro-Winkler distance, Levenshtein distance) 등이 있습니다. 이렇게하면 사용자 지정 컴퓨터 학습 모델을 만들 필요가 없기 때문에 더 쉽습니다.

2. 시맨틱 유사성 - 우리가 의미 론적 유사성을 찾고 있다면 단어

의 의미로 유사성, 당신은 의미 클러스터링, 단어의 삽입 등, DSSM (깊은 의미 론적 유사성 모델) 에 갈 필요가 주석 처리 된 코퍼스를 기반으로 자신의 기계 학습 모델을 교육해야하기 때문에이 작업이 더 어려워집니다.

Luis Cabrera | 텍스트 분석 프로그램 관리자 | Cloud AI Platform, Microsoft

관련 문제