2017-10-28 3 views
0

나는 이미지로 구성된 훈련 세트를 가지고 있는데, 마녀에게서 고정 된 수의 문자와 숫자로 구성된 라벨을 예측해야합니다. 이러한 라벨을 텐톨 플로우에 공급하는 가장 좋은 방법은 무엇입니까? 나는 숫자의 목록을 만들려고 생각했다. 라벨에있는 모든 문자/숫자에 대해 하나씩. 나는 알라 가능한 값 목록을 만들어 : tensorflow에서 라벨을 공급하는 가장 좋은 방법

__dict = ['a', 'b', 'c', 'd', 'e', 'f', 'g', 'h', 'i', 'j', 'k', 'l', 'm', 'n', 'o', 'p', 'q', 'r', 's', 't', 'u', 
      'v', 'w', 'x', 'y', 'z', '0', '1', '2', '3', '4', '5', '6', '7', '8', '9'] 

다음 내가 번호 목록에 라벨을 인코딩하는 __dict 변수에 문자의 인덱스를 사용합니다. 예 :

label = abc 
label_encoded = [0, 1, 2] 

올바른 방법일까요? 문자가있는 경우 (베이스 (36)의 위치 인코딩을 사용하는

답변

1

가장 좋은 방법은 등 레이블, 즉 AAA = 0, AAB = 1, 각각

그것은 편리 고유 한 정수를 사용하는 것입니다 소문자 영문 + 숫자).

내가 만들 필요가 이런 식으로 (즉, 출력하여 분류 문제에 대한 클래스)

+0

당신이 직면하고있는 문제를 알고 있지만, 라벨의 거대한 숫자로이 이어질 수 있다는 사실에주의를 지불하지 않습니다 가능한 모든 레이블. 그것은 매우 비쌀 수 있습니다. 처음에 생각했던 것과 비슷한 방법이 있습니까? 고맙습니다. – Yes92

+0

그것은 문제에 달려 있습니다 : 레이블 "aaa"와 "bcd"가 아무 것도 공유하지 않는다면, 그들은 분류 문제의 다른 클래스로 취급되어야합니다. 그렇습니다. 가능한 모든 레이블을 만들어야합니다. 모든 것은 대부분 당신이 성취하고자하는 것에 달려 있습니다. –