2013-07-08 4 views
0

현재 UCI 저장소의 숫자 데이터 세트를 사용하여 간단한 기계 학습 기술을 실행합니다. 문제는 16 * 16 픽셀 그림이므로 데이터 집합이 256 차원으로 제한된다는 것입니다. 나는 64 * 64 픽셀 인 숫자 입력을 가지고 있는지, 16 * 16으로 줄이거 나 사용할 수있는 기술이 있는지 궁금합니다.숫자/문자 인식 차원 제한을위한 데이터 세트

답변

0

내가 알고있는 모든 자릿수 인식 알고리즘은 이미지의 특정 해상도와 상관없이 작동하지만 실제로 걱정되는 경우 데이터를 [0.0, 1.0) 범위로 표준화하는 것이 좋습니다.

사각형이 아닌 이미지에서도 작동합니다. 예를 들어, 16x16 이미지에서 16은 사용자의 선호도에 따라 1.0 또는 15/16으로 매핑됩니다. 이것은 자의적으로 임의의 크기의 이미지로 확장됩니다. 몇 가지 예제 코드를 원한다면, 내가 선택한 언어로 일부를 제공 할 수 있습니다.

+0

내 데이터는 0과 1의 256 자리 숫자 범위입니다. 나는 여기에 맞는 정규화를 실제로 이해하지 못합니다. O_o –

+0

일반적으로 배열은 실제 값이있는 인덱스를 사용하지 않습니다. 따라서, 동일한 크기의 이미지를 생성하기 위해 어떤 종류의 보간이 필요할 수 있습니다. – alfa

+0

@TrtTrt 글쎄, 두 개의 배열을 비교할 수있게 만들려고한다면 완전히 다른 것들을 다룰 필요가 없다고 말하고 있습니다. Tbh 두 가지 크기의 이미지 파일을 처리 할 때 어떤 문제가 있을지 정확히 알 수는 없습니다. 저는 일반적으로 제가 다루는 모든 이미지를 표준화 한 다음, 필요하다면 셀 사이에 선형 보간법을 적용합니다. 그러나 여러분의 문제가 정확히 무엇인지 설명 할 수 있다면 아마도 더 많은 도움이 될 것입니다. –

관련 문제