정규화 된 일반 선형 모델 구현을 찾았습니다. 나는 glmnet이 커스텀 링크 기능을 허용하지 않는다는 것을 발견했다. 그러나 h2o는 링크 함수 유형을 매개 변수로 사용합니다. h2o에서 가족 밑의 맞춤 링크 기능을 정의하고 사용할 수 있습니까 (최적화 문제입니까?)? 당신이 내장 된 링크 기능 중 하나를 사용해야하고, API를 통해 자신을 전달할 수 없
2 카테고리 분류를 처리하기 위해 VL-Feat 및 LIBLINEAR를 사용합니다. 트레이닝 세트의 # (-)/# (+)는 35.01이고 각 특징 벡터의 차원은 3.6e5입니다. 약 15000 가지 예가 있습니다. 양의 예제의 가중치를 35.01로 설정하고 음수의 예제를 1로 기본값으로 설정했습니다. 하지만 내가 얻는 것은 테스트 데이터 세트의 성능이 극도
데이터 소거의 고전적인 방법은 매트릭스를 만들고, SVD를 수행하고, 작은 특이 값을 0으로 설정 한 다음, 분해 된 매트릭스 부분을 곱하여 새로운 매트릭스를 만드는 것입니다. 이것은 입력 데이터를 "컨디셔닝"또는 "정규화"하는 한 방법입니다. 원래의 행렬 공간에 벡터가 있으면, 어떻게 그 벡터를 새로운 조건 공간에 투영합니까?
정규화 된 이진 분류에 scikit-learn의 LogisticRegression 객체를 사용하고 있습니다. intercept_scaling에 대한 설명서를 읽었지만이 값을 지능적으로 선택하는 방법을 이해할 수 없습니다. 데이터 세트는 다음과 같다 : 10 ~ 20 개 기능을 300-500 사실 대부분의 관측은 출력 클래스입니다 반드시 똑같이 가능성이없는