대부분의 인공 지능 기법은 이미지와 같은 원시 데이터에서 작동하지 않습니다. 그들은 일반적으로 특징 벡터에서 작동합니다. 원본 데이터를 바람직하게 압축하고 스마트하게 표시합니다. 일반적으로, 특징 벡터는 고정 된 수의 수치 또는 공칭 값 (특징)을 포함한다. 예를 들어, 얼굴 인식에서 일반적인 특징 벡터는 Eigenface이라고하는 고유 벡터 집합입니다. 나는 지문 인식에 익숙하지 않지만, 거기에 사용 된 특징 벡터는 핑거 프린트의 이미지에서 관찰 된 패턴을 어떻게 든 설명하는 숫자 세트라고 상상한다.
일반적으로 얼굴 또는 지문 이미지 세트에서 일부 기계 학습 방법을 학습 할 때 이러한 이미지에 해당하는 특징 벡터를 계산하여 데이터베이스에 저장합니다. 원본 이미지는 더 이상 사용되지 않습니다. 모든 후속 처리는 해당 특징 벡터에서 수행됩니다.
보이지 않는 새로운 인스턴스를 이전에 학습 한 인스턴스의 데이터베이스와 비교하기 위해 새 인스턴스의 특징 벡터가 계산되어 저장된 특징 벡터의 데이터베이스와 비교됩니다. 이것은 여러 가지 방법으로 이루어질 수 있습니다. 홍채 인식에 일반적으로 사용되는 예가 Hamming distance입니다.