knn

0열

1답변

Sklearn GridSearchCV는 견적 매개 변수의 가능한 모든 기본 옵션을 선택합니까?

알고리즘에 scikit 배우기 옵션의 기본 범위가 일부 매개 변수가있을 수 있습니다, sklearn.neighbors.KNeighborsClassifier(n_neighbors=5, weights='uniform', algorithm='auto', leaf_size=30, p=2, metric='minkowski', metric_params=None, n_

0열

1답변

분류 자 알고리즘을 사용하여 단일 텍스트를 분류하는 방법

클러스터 된 문서 집합이 있습니다. 이제 각 문서에는 레이블이 있습니다. 나는 이것에 기초한 분류자를 만들고, 훈련하고, 테스트하여 잘 작동하도록하고, 새로운 문서/텍스트를 주면 적절한 클러스터로 떨어지고 싶었다. 그래서 countVectorizer를 사용하여 문서를 기능으로 변환했습니다. 이 countVectorizer는 내가 제공 한 문서 세트 (100

0열

1답변

정밀도, 회상, F1 점수가 sklearn과 같습니다.

k- 근근 이웃 알고리즘에서 다른 거리 계산 방법과 다른 투표 시스템을 비교하려고합니다. 현재 내 문제는 내가 무엇을 하든지 상관없이 scikit-learn의 precision_recall_fscore_support 메소드는 precision, recall 및 fscore에 대해 정확히 동일한 결과를 산출한다는 것입니다. 왜 그런가요? 나는 다른 데이터 세

0열

1답변

matlab의 오래된 knnclassify() 함수를 새로운 fitcknn() 함수로 대체하는 방법은 무엇입니까?

샘플 행렬, 학습 행렬 및 그룹 행렬이 있습니다. 나는 쓸데없는 knnclassify() 함수를 사용했다. 나는 그것을 fitcknn() 기능으로 바꾸고 싶다. 나는 matlab에 새로운 사람이다. fitcknn() 메서드는 어떻게 작동하며 코드를 작성하기 위해 필요한 변경 사항은 무엇입니까? 스크린 샷 첨부. enter image description h

2열

1답변

R과 Java + WEKA 사이의 가장 가까운 이웃을 계산할 때의 불일치

라이브러리를 디버깅하는 중이고 가장 가까운 이웃을 계산하는 작업이 진행 중입니다. 나는 이해하기가 어려워하는 모범으로 질문을 골머 랐다. 먼저 장난감 예제로 설명하고, 그 결과로 질문을 이끌어 낼 출력을 보여줍니다. 작업은 데모는 여기에 2 차원 데이터 포인트의 10 수를 갖는 csv 파일을 읽습니다. 작업은 첫 번째 datapoint에서 모든 데이터 포인

2열

1답변

K가 매우 작은 벡터에서 K가 가장 작은 요소 찾기

내 Matlab 프로그램을 GPU를 사용하여 속도를 높이려고하지만 "knnsearch"함수가 GPU를 지원하지 않기 때문에 자신 만의 무차별 함수를 작성하기로했습니다 (물론 CUDA 커널을 작성하거나 기존 라이브러리를 사용하는 것과 같은 다른 옵션이 있지만 시간이 오래 걸릴 것입니다. 또한 Windows 10에서 mex 파일을 사용하기 위해 matlab을

1열

1답변

Sklearn KNeighborsRegressor 맞춤 거리 메트릭

KNeighborsRegressor를 사용하고 있습니다. 맞춤 거리 함수와 함께 사용하고 싶습니다. knn_regression = KNeighborsRegressor(n_neighbors=15, metric=customDistance) 두 가지 기능을 실행하지만 결과는 좀 이상해됩니다 : 나는 또한 같은 KNeighborsRegressor 생성자에서 직

2열

2답변

kNN의 기능 선택 및 중요한 기능

kNN의 도움을 받아 추천 엔진을 개발 중입니다. 데이터는 드물지만 약 1500 개의 샘플과 약 200 개의 기능이 있습니다. 나는 1 또는 0의 값을 갖는 서수 목표를가집니다. 그것에 대한 특징 선택을하는 기술은 무엇입니까? 필자는 기능 선택을 위해 무작위 포리스트를 선택한 경우 선택한 기능이 kNN이 중요한 기능을 담당한다고 가정하는 경우와 다를 수 있

3열

3답변

KNN의 정규화 정확도 차이

KNN 분류 알고리즘에서 모델을 훈련했고 97 %의 정확도를 얻었습니다. 그러나 나중에 데이터를 정규화하지 않고 데이터를 정규화하고 모델을 재교육했음을 알게되었습니다. 이제는 87 %의 정확도 만 얻었습니다. 그 이유는 무엇일까요? 정규화되지 않은 데이터를 사용하거나 표준화 된 버전으로 전환해야합니다.

1열

1답변

두 개의 커다란 CSR 행렬의 행 사이의 유클리드 거리를 찾으십시오.

저는 두 개의 드문 드문 한 행렬 A와 B를가집니다. A는 120000 * 5000이고 B는 30000 * 5000입니다. B의 각 행과 A의 모든 행 사이의 유클리드 거리를 찾아서 B의 선택된 행과 가장 가까운 거리에있는 A의 5 행을 찾아야합니다. 매우 큰 데이터이므로 CSR을 사용하고 있습니다. 메모리 오류. 그것은 A의 각 행에 대해 (x_b - x