0

내 질문의 세 가지 부분이 있습니다 : (1) 피드 포워드 신경망이 혼합 된 입력 기능을 처리 할 수 ​​있습니까 : 일부는 범주 형 (이산 값 : 예 : 낮음, 보통, 높음) 일부는 실제 가치가 있습니까? 입력 특징 변수의 총 수는 약 80 - 90이며, (감독 된) 분류 문제를 풀고 싶습니다. (2) 파트 (1)에 대한 답이 '예'라면, 나는 (Low = 001, Med = 010, High = 100 등)를 사용하여 다른 문맥에서 이산 값 입력 특징 변수를 나타낼 수 있습니다. 전체 입력 특징 벡터의 스케일링/정규화에 대해 우려하고 있습니다. (필자가 권장하는 것) - 전체 또는 혼합 된 특징 벡터를 스케일/정규화하는 방법 또는 필요하지 않은 방법? (3) 누군가 랜덤 포레스트 (RF)를 사용하도록 제안했습니다. RF에 익숙하지 않습니다. 주어진 상황에서 RF 대 NN의 장단점은 무엇입니까?Neural Nets 혼합 실수 형 및 범주 형 입력 기능

답변

0

2 번 질문에 대한 답변을 드릴 수 있습니다. RF에 대해서는 준비가되어 있지 않으므로 좀 더 숙련 된 사람들에게 그 대답을 남길 것입니다.

포인트 2까지는 각각의 범주 입력을 k- 벡터 (k = 클래스 수)로 변환하면 [0, 1] 범위로 확장 된 k 개의 새 입력을 도입하는 것입니다. ] 때문에 실제 값 입력 기능 자체가 그 범위에서 조절되면 꽤 괜찮습니다.

0 < 될해야하면 (그 출력 -1 내지 1의 범위)를 TANH 활성화 기능을 사용하는 경우에는 범주 입력을 변환하도록

참고 때문에 (k는 = 3 말), 따라서 기능 1, -1, -1>

1 < -1, 1, -1>

이 내가 명확히 해요 < -1, -1, 1>

희망이되어야가되어야 그.