데이터 세트는 매우 간단합니다. 데이터 세트는 매우 간단합니다. 각 행은 [0, 1] 범위의 실수 값으로 구성되어 단일 레이블에 매핑됩니다. 총 24 개의 레이블이 있으며, 내 작업의 핵심은 기본적으로 레이블에 매핑되는 범위를 찾기 위해 분류자를 훈련시키는 것입니다.수치 변환을위한 ML
내가 생각할 수있는 두 가지 접근 방식이 있습니다. 첫 번째는 입력 평면을 24 개의 영역으로 분리 할 수있는 능력 때문에 SVC입니다. 이것이 내가 원하는 것입니다. 그러나 코딩을 시도했을 때, 나는 끔찍한 결과를 낳았습니다. 분류기는 아무 것도 배우지 않았고 입력 값에 관계없이 같은 라벨을 뱉어 냈습니다.
내가 고려중인 두 번째 접근법은 신경망이지만 기능과 학습 데이터가 부족하다는 점을 감안할 때이 접근 방법의 실현 가능성에 대해서는 의심 스럽습니다.
요청한 경우, 내가 개발 한 SVC 코드를 scikit-learn과 공유 할 수 있습니다. 여기
내가 터미널에 덤프 한 내 데이터를 살펴입니다 :Label: Min, Mean, Max
{0: [0.96, 0.98, 1.0],
1: [0.15, 0.36, 0.92],
2: [0.14, 0.56, 0.98],
3: [0.37, 0.7, 1.0],
4: [0.23, 0.23, 0.23],
6: [0.41, 0.63, 0.97],
7: [0.13, 0.38, 0.61],
8: [0.11, 0.68, 1.0],
9: [0.09, 0.51, 1.0],
10: [0.19, 0.61, 0.97],
11: [0.26, 0.41, 0.57],
12: [0.29, 0.72, 0.95],
13: [0.63, 0.9, 0.99],
14: [0.06, 0.55, 1.0],
15: [0.1, 0.64, 1.0],
16: [0.26, 0.58, 0.95],
17: [0.29, 0.88, 1.0],
21: [0.58, 0.79, 1.0],
22: [0.24, 0.59, 0.94],
23: [0.12, 0.62, 0.95]}
당신이 볼 수 있듯이이 데이터는 도처에있다,하지만 난 그게 가능하다하는지 여부를 확인하려면 각 라벨이 가장 잘 나타내는 범위를 찾습니다.
나는 옳은 길을 가고 있는지 누군가가 말해 줄 수 있으면 고맙겠습니다. 감사!
음 ... 그 데이터에 대한 귀하의 가정은 무엇입니까? 일부 모델 아이디어? – sascha
글쎄, 가장 큰 가정은 라벨이 나타내는 범위가 서로 중첩되지 않는다는 것입니다. 그래서 효과적으로, 내 레이블은 [0, 1]을 24 개의 고유 한 별개의 공간으로 분할합니다. 모델 아이디어는 2 가지 중 하나를 선택했는데 작동하지 않는 것으로 나타났습니다. :] –
데이터를 표시하지 않으시겠습니까? – sascha