knn

    0

    1답변

    알고리즘에 scikit 배우기 옵션의 기본 범위가 일부 매개 변수가있을 수 있습니다, sklearn.neighbors.KNeighborsClassifier(n_neighbors=5, weights='uniform', algorithm='auto', leaf_size=30, p=2, metric='minkowski', metric_params=None, n_

    0

    1답변

    클러스터 된 문서 집합이 있습니다. 이제 각 문서에는 레이블이 있습니다. 나는 이것에 기초한 분류자를 만들고, 훈련하고, 테스트하여 잘 작동하도록하고, 새로운 문서/텍스트를 주면 적절한 클러스터로 떨어지고 싶었다. 그래서 countVectorizer를 사용하여 문서를 기능으로 변환했습니다. 이 countVectorizer는 내가 제공 한 문서 세트 (100

    0

    1답변

    k- 근근 이웃 알고리즘에서 다른 거리 계산 방법과 다른 투표 시스템을 비교하려고합니다. 현재 내 문제는 내가 무엇을 하든지 상관없이 scikit-learn의 precision_recall_fscore_support 메소드는 precision, recall 및 fscore에 대해 정확히 동일한 결과를 산출한다는 것입니다. 왜 그런가요? 나는 다른 데이터 세

    0

    1답변

    샘플 행렬, 학습 행렬 및 그룹 행렬이 있습니다. 나는 쓸데없는 knnclassify() 함수를 사용했다. 나는 그것을 fitcknn() 기능으로 바꾸고 싶다. 나는 matlab에 새로운 사람이다. fitcknn() 메서드는 어떻게 작동하며 코드를 작성하기 위해 필요한 변경 사항은 무엇입니까? 스크린 샷 첨부. enter image description h

    2

    1답변

    라이브러리를 디버깅하는 중이고 가장 가까운 이웃을 계산하는 작업이 진행 중입니다. 나는 이해하기가 어려워하는 모범으로 질문을 골머 랐다. 먼저 장난감 예제로 설명하고, 그 결과로 질문을 이끌어 낼 출력을 보여줍니다. 작업은 데모는 여기에 2 차원 데이터 포인트의 10 수를 갖는 csv 파일을 읽습니다. 작업은 첫 번째 datapoint에서 모든 데이터 포인

    2

    1답변

    내 Matlab 프로그램을 GPU를 사용하여 속도를 높이려고하지만 "knnsearch"함수가 GPU를 지원하지 않기 때문에 자신 만의 무차별 함수를 작성하기로했습니다 (물론 CUDA 커널을 작성하거나 기존 라이브러리를 사용하는 것과 같은 다른 옵션이 있지만 시간이 오래 걸릴 것입니다. 또한 Windows 10에서 mex 파일을 사용하기 위해 matlab을

    1

    1답변

    KNeighborsRegressor를 사용하고 있습니다. 맞춤 거리 함수와 함께 사용하고 싶습니다. knn_regression = KNeighborsRegressor(n_neighbors=15, metric=customDistance) 두 가지 기능을 실행하지만 결과는 좀 이상해됩니다 : 나는 또한 같은 KNeighborsRegressor 생성자에서 직

    2

    2답변

    kNN의 도움을 받아 추천 엔진을 개발 중입니다. 데이터는 드물지만 약 1500 개의 샘플과 약 200 개의 기능이 있습니다. 나는 1 또는 0의 값을 갖는 서수 목표를가집니다. 그것에 대한 특징 선택을하는 기술은 무엇입니까? 필자는 기능 선택을 위해 무작위 포리스트를 선택한 경우 선택한 기능이 kNN이 중요한 기능을 담당한다고 가정하는 경우와 다를 수 있

    3

    3답변

    KNN 분류 알고리즘에서 모델을 훈련했고 97 %의 정확도를 얻었습니다. 그러나 나중에 데이터를 정규화하지 않고 데이터를 정규화하고 모델을 재교육했음을 알게되었습니다. 이제는 87 %의 정확도 만 얻었습니다. 그 이유는 무엇일까요? 정규화되지 않은 데이터를 사용하거나 표준화 된 버전으로 전환해야합니다.

    1

    1답변

    저는 두 개의 드문 드문 한 행렬 A와 B를가집니다. A는 120000 * 5000이고 B는 30000 * 5000입니다. B의 각 행과 A의 모든 행 사이의 유클리드 거리를 찾아서 B의 선택된 행과 가장 가까운 거리에있는 A의 5 행을 찾아야합니다. 매우 큰 데이터이므로 CSR을 사용하고 있습니다. 메모리 오류. 그것은 A의 각 행에 대해 (x_b - x