scikit-learn

6열

2답변

scikit-learn에서 SVM과 함께 정수가 아닌 문자열 레이블을 사용하려면 어떻게해야합니까? Python

Scikit-learn은 기계 학습을위한 사용자 친화적 인 Python 모듈을 제공합니다. 내 라벨 및 입력 데이터가 단어 및 주석 인 자연 언어 처리 (NLP) 용 SVM 태그 지정자를 학습하려고합니다. 예 : 입력 튜플 [[1,2], [2,0]]으로 이중/정수 데이터를 사용하는 대신 내 튜플이 다음과 같이 표시 될 것입니다 [['word','NOUN']

6열

1답변

sklearn.mixture.DPGMM : 예기치 않은 결과

DPGMM에서 얻은 결과는 내가 기대 한 바가 아닙니다. 예 : >>> import sklearn.mixture >>> sklearn.__version__ '0.12-git' >>> data = [[1.1],[0.9],[1.0],[1.2],[1.0], [6.0],[6.1],[6.1]] >>> m = sklearn.mixture.DPGMM(n_comp

1열

1답변

scikit 기능 중요도 선택 경험

Scikit-learn은 극단적 인 무작위 나무를 사용하여 기능 (분류)을 순위 지정하는 메커니즘이 있습니다. forest = ExtraTreesClassifier(n_estimators=250, compute_importances=True, random_state=0) 이 방법이 "단 변량"또는 "다 변수"기능

2열

2답변

교차 유효성 검사를 위해 사용자 정의 파이프 라인 사용하기 scikit-learn

나는 분류 자의 매개 변수를 결정하기 위해 GridSearchCV를 사용하고자하며, 파이프 라인을 사용하는 것이 좋은 옵션처럼 보입니다. 응용 프로그램은 Bag-of-Word 기능을 사용하는 이미지 분류를위한 것이지만 문제는 교육 또는 테스트 예제의 사용 여부에 따라 다른 논리 파이프 라인이 있다는 것입니다. 각 훈련 세트의 경우 KMeans를 실행하여 테

4열

2답변

Amazon EC2 클러스터에서 python scikit-learn 라이브러리로 gridsearch 수행

이 질문이 파이썬 Scikit-learn 라이브러리와 관련이있는 경우 죄송합니다. scikit-learn의 GradientBoostingRegressor에 대한 최적의 매개 변수를 찾기 위해 그리드 검색을 수행하려고합니다. 문제는 어디서부터 시작해야할지 모르겠다. 과거에는 R 및 RStudio 설정을 사용했지만 데이터 마이닝 및 Scikit 용 Python

0열

1답변

scikit으로 학습 확률 분포가 무작위 포리스트를 학습합니까?

나는 state-> action 쌍 (s, a)의 데이터 세트를 가지고있다. 여기서 각 s는 가능한 선택 사항에 대한 확률 분포를 정의하고, 각 a는 확률 분포로부터 샘플링된다. 나는이 데이터 세트에 대한 분류자를 훈련시키고 싶다. 최대 가능성을 예측하는 것을 배우기보다는, 분포 a가 샘플링 된 것으로 예측한다. 예를 들어 반복 가위 - 가위를 연주하는 경

3열

3답변

scikit-learn OpenMP libsvm

일부 데이터를 분류하기 위해 scikit-learn SVC를 사용하고 있습니다. 교육 성과를 높이고 싶습니다. CLF = svm.SVC (cache_size = 4000, 확률 = TRUE 장황 = TRUE) libsvm 및 libsvm와 인터페이스 sckikit가 배우기 때문에 내가 바라고 OpenMP를 사용한다 : 내보내기 OMP_NUM_THREADS

15열

2답변

정수가 아닌 클래스 레이블 Scikit-Learn

scikit-learn에 대한 빠른 SVM 질문입니다. 당신이 SVM을 훈련 할 때, from sklearn import svm s = svm.SVC() s.fit(training_data, labels) 같은 숫자가 아닌 유형의 목록이 될 labels위한 어떤 방법이 있나요입니까? 예를 들어, 'cat'이나 'dog'를 1과 2로 인코딩하는 일종의

10열

1답변

predict_proba 또는 estimator "confidence"로 decision_function

저는 scikit-learn에서 견적을 훈련시키는 모델로 LogisticRegression을 사용하고 있습니다. 내가 사용하는 기능은 (주로) 범주 형입니다. 라벨도 마찬가지입니다. 따라서 DictVectorizer 및 LabelEncoder를 사용하여 값을 올바르게 인코딩합니다. 교육 과정은 매우 간단하지만 테스트 부분에 문제가 있습니다. 간단한 작업은

8열

1답변

scikit-learn SVM의 데이터 크기 조정

libsvm은 Scikit-Learn (SVC 분류자를위한 libSVM을 기반으로해야 함)을 사용하여 데이터 크기를 조정하는 도구를 제공하지만 데이터를 확장 할 방법이 없습니다. 기본적으로 나는 4 개의 피쳐를 사용하고 싶습니다. 그 중 3 개의 피치는 0에서 1까지이고 마지막 피쳐는 매우 큰 가변 숫자입니다. (데이터를 자동으로 조정하는 easy.py 스