이진화는 분류 자 알고리즘에 대한 좋은 예를 만들기 위해 엔티티의 다채로운 기능을 숫자 벡터, 가장 자주 바이너리 벡터로 변환하는 행위입니다. "고양이가 개를 먹었다"라는 문장을 2 진수로 만들려면 모든 단어에 ID (예 : cat-1, ate-2, -3, dog-4)를 할당 한 다음 그것으로 벡터를 부여하는 단어로 바꾸십시오. < 3,1,2,3,4>.
나는 문제 해결을 위해 최선의 접근법에 대한 전문가의 조언을 원한다. 몇 가지 기계 학습, 신경 네트워크 및 그런 것들을 조사했습니다. 나는 weka, 일종의 baesian solution을 조사했습니다. R .. 몇 가지 다른 것들. 그래도 어떻게 진행해야할지 모르겠다. 여기 내 문제가있다. 나는 많은 이벤트 컬렉션을 가지고있다. 결국 약 100,000
나는 각각 약 150 개의 별개의 속성을 가진 ~ 10K 개의 개체 집합을 가지며, 그 중 약 1/4이 다른 속성 또는 여러 속성과 관련되어 있습니다. 저는이 객체들을 '템플릿'객체로 정의하고있는이 객체들을 정렬하고자하는 약 120 가지 범주의 집합을 가지고 있습니다. 인스턴스가 템플릿과 정확히 일치하면 그 개체는 분명히 해당 범주에 포함되지만 개체의 약
나는 완전히 무료 인 무료 택 소노 미를 찾고 있습니다. 내 연구에서 듀이는 법적인 문제가있다. 의회 도서관 분류는 미국을 제외하고 저작권이 있습니다. DMOZ는 사용자로부터 업데이트해야합니다. 내가 틀렸다면 나를 바로 잡아주세요. 그래서 상용 사용을위한 무료 분류가 있습니까? 내가 찾고있는 것은 Google Directory 나 Yahoo Director