용어 추출 알고리즘/서비스를 찾고 있습니다. 이것은 편집자를위한 제안 일 뿐이므로 추출 된 용어는 불완전 할 수 있습니다. 따라서 텍스트를 사용 가능한 용어 목록과 비교하고이 목록 외부의 용어를 제안하지 않습니다.사용 가능한 용어 목록으로 용어 추출
작업이 간단 해 보입니다. 각 용어에 대해 텍스트의 모양 수를 세고, 상위 용어를 필터링하십시오. 하지만 여기에 나는 수십만 개의 용어가 나열된이 있습니다.이 작업은 불가능한 것처럼 보입니다. 당신이하는 서비스 나 알고리즘을 아십니까?
또 다른 세부 사항은 용어 추출 서비스에 만족하지만 (이 목록은 내 목록을 기반으로 용어를 필터링 함) 영어 이외의 언어이며 대부분의 단어는 복합어이므로 어떤 것도 모릅니다. 유용한 서비스.
감사합니다.
편집 : 예
혼 하이 31/1/2011, 에릭슨 초 biết DJA 트린 디엔 맹 HSPA (고속 패킷 접속) 목 VOI TOC DJO 용 다운로드 렌 đến 168 메가 비트/지아이, 24 Mbit/giây. 에릭슨에게 싱텔과의 대화를 나누기 위해 싱어 송 라이터를 연결해 줬다.
DJE đạt TOC DJO 168 메가 비트/지아이 에릭슨 DJA SU 배설물 MOT 있도록 목 thuật VÔ 투엔 바오 곰 뭉친 anten 응에 MIMO (다중 입력 다중 출력) VA 뒤 GUI 대신 ...로서 nhiều kênh cùng MOT LUC. MIMO는 송신기와 송신기 사이의 통신을 지원합니다.
테오 에릭슨, cũng SE 공동 MOT buổi 트린 디엔 NHU의 vay được 티엔 스님 타이 트리 엔 램 모바일 월드 콩그레스 (Mobile World Congress) SAP 토이 O 바르셀로나 (TAY 금지 냐)
그리고 제안 목록이있을 수 있습니다 : 에릭슨, 트린 (다른 사람들의 것 사이)
예를 들어 주시겠습니까? –
그래서 본질적으로 텍스트에서 가장 빈번한 단어를 가져오고 싶습니다. 그 맞습니까? –
대부분의 단어는 복합어라고하셨습니다. 먼저 용어로 무엇을 의미하는지 정확하게 정의하십시오. – ThomasMcLeod