scikit-learn

    6

    2답변

    Scikit-learn은 기계 학습을위한 사용자 친화적 인 Python 모듈을 제공합니다. 내 라벨 및 입력 데이터가 단어 및 주석 인 자연 언어 처리 (NLP) 용 SVM 태그 지정자를 학습하려고합니다. 예 : 입력 튜플 [[1,2], [2,0]]으로 이중/정수 데이터를 사용하는 대신 내 튜플이 다음과 같이 표시 될 것입니다 [['word','NOUN']

    6

    1답변

    DPGMM에서 얻은 결과는 내가 기대 한 바가 아닙니다. 예 : >>> import sklearn.mixture >>> sklearn.__version__ '0.12-git' >>> data = [[1.1],[0.9],[1.0],[1.2],[1.0], [6.0],[6.1],[6.1]] >>> m = sklearn.mixture.DPGMM(n_comp

    1

    1답변

    Scikit-learn은 극단적 인 무작위 나무를 사용하여 기능 (분류)을 순위 지정하는 메커니즘이 있습니다. forest = ExtraTreesClassifier(n_estimators=250, compute_importances=True, random_state=0) 이 방법이 "단 변량"또는 "다 변수"기능

    2

    2답변

    나는 분류 자의 매개 변수를 결정하기 위해 GridSearchCV를 사용하고자하며, 파이프 라인을 사용하는 것이 좋은 옵션처럼 보입니다. 응용 프로그램은 Bag-of-Word 기능을 사용하는 이미지 분류를위한 것이지만 문제는 교육 또는 테스트 예제의 사용 여부에 따라 다른 논리 파이프 라인이 있다는 것입니다. 각 훈련 세트의 경우 KMeans를 실행하여 테

    4

    2답변

    이 질문이 파이썬 Scikit-learn 라이브러리와 관련이있는 경우 죄송합니다. scikit-learn의 GradientBoostingRegressor에 대한 최적의 매개 변수를 찾기 위해 그리드 검색을 수행하려고합니다. 문제는 어디서부터 시작해야할지 모르겠다. 과거에는 R 및 RStudio 설정을 사용했지만 데이터 마이닝 및 Scikit 용 Python

    0

    1답변

    나는 state-> action 쌍 (s, a)의 데이터 세트를 가지고있다. 여기서 각 s는 가능한 선택 사항에 대한 확률 분포를 정의하고, 각 a는 확률 분포로부터 샘플링된다. 나는이 데이터 세트에 대한 분류자를 훈련시키고 싶다. 최대 가능성을 예측하는 것을 배우기보다는, 분포 a가 샘플링 된 것으로 예측한다. 예를 들어 반복 가위 - 가위를 연주하는 경

    3

    3답변

    일부 데이터를 분류하기 위해 scikit-learn SVC를 사용하고 있습니다. 교육 성과를 높이고 싶습니다. CLF = svm.SVC (cache_size = 4000, 확률 = TRUE 장황 = TRUE) libsvm 및 libsvm와 인터페이스 sckikit가 배우기 때문에 내가 바라고 OpenMP를 사용한다 : 내보내기 OMP_NUM_THREADS

    15

    2답변

    scikit-learn에 대한 빠른 SVM 질문입니다. 당신이 SVM을 훈련 할 때, from sklearn import svm s = svm.SVC() s.fit(training_data, labels) 같은 숫자가 아닌 유형의 목록이 될 labels위한 어떤 방법이 있나요입니까? 예를 들어, 'cat'이나 'dog'를 1과 2로 인코딩하는 일종의

    10

    1답변

    저는 scikit-learn에서 견적을 훈련시키는 모델로 LogisticRegression을 사용하고 있습니다. 내가 사용하는 기능은 (주로) 범주 형입니다. 라벨도 마찬가지입니다. 따라서 DictVectorizer 및 LabelEncoder를 사용하여 값을 올바르게 인코딩합니다. 교육 과정은 매우 간단하지만 테스트 부분에 문제가 있습니다. 간단한 작업은

    8

    1답변

    libsvm은 Scikit-Learn (SVC 분류자를위한 libSVM을 기반으로해야 함)을 사용하여 데이터 크기를 조정하는 도구를 제공하지만 데이터를 확장 할 방법이 없습니다. 기본적으로 나는 4 개의 피쳐를 사용하고 싶습니다. 그 중 3 개의 피치는 0에서 1까지이고 마지막 피쳐는 매우 큰 가변 숫자입니다. (데이터를 자동으로 조정하는 easy.py 스