2009-12-15 2 views
5

이미지 인식 시스템을 사용하면 도움이되는 앱을 개발하고 있습니다. iPhone 및 Android 앱에서 이런 종류의 것을 보았습니다. 책을 찍으면 그 책을 찾을 수있는 Amazon으로 이동합니다. 나는 일반적인 이미지 인식을 찾고있는 것이 아니라, 약 10k 이미지의 라이브러리에서 하나의 이미지를 선택하는 능력이 더 큽니다.Android/iPhone 용 이미지 인식

이런 종류의 서비스에는 어떤 서비스가 제공됩니까?

+0

이미지 인식은 컴퓨터 비전의 거대한 하위 필드입니다. 정확한 알고리즘 권장 사항을 만들기 전에 인식해야 할 문제의 유형에 대해 더 많이 알고 있으면 도움이됩니다 (많은 성숙하고 효과적인 컴퓨터 비전 기술 다소 특정 영역에서 문제를 해결할 수 있습니다.) – JasonWyatt

+0

내가 실제로 찾고있는 것은 Magic the Gathering과 같은 인기있는 트레이딩 카드 게임에서 나온 카드의 이미지를 가져 와서 카드의 데이터 또는 데이터베이스의 가격을 끌어 올리는 기능입니다. 나는 사용자가 휴대폰 카메라를 사용하여 카드의 이미지를 찍은 다음 해당 카드의 데이터를 데이터베이스에서 가져올 수있는 기능을 원합니다. 그래서 모든 이미지가 2D가 될 것입니다. 그리고 데이터 세트는 약 10k 옵션 정도로 매우 작을 것입니다. –

답변

1

Google Goggles 아마존과 비슷한 것을 기억합니다. 텍스트를 식별 할 수 있고 Google 이미지에서 유사한 이미지 검색으로 텍스트를 사용하려는 경우 OCR을 사용합니다. 나는 이미지가 유사한 경우 이미지가 비슷하다는 특징을 가진 이미지에 대해 일종의 해시를 생성한다고 생각합니다.

가장 좋은 추측은 문자 인식으로 시작하여 카드 제목에 대한 텍스트 검색을 시도하는 것입니다. 이는 사용자가 특정 위치에서도 매우 선명한 이미지를 만들어야 함을 의미합니다. 그러나 첫 번째 응용 프로그램의 경우 이미 훌륭합니다. 누군가 마술을하면서 나는 카드 거래 및 카탈로그 작성 도구를 구입할 것입니다.

+0

그건 좋은 생각이야 ... 나는 OCR 인식 부분을 생각하지 않았다. 그것은 분명히 물건을 단순화하고 사용자가 그림에 전체 카드를 가질 필요가 없게 할 것입니다. –

1

실제로 실제 Amazon 직원이이 사실을 확인할 방법이 없다는 것을 알기에는 부족하지만 실제로 언급 한 Amazon Remembers 기능은 군중 소싱의 작업이라는 것을 확신합니다. 데이터를 통해 마치 컴퓨터가하는 것처럼 보이게합니다. 실제로 그들 자신이 Mechanical Turk 시스템을 사용하고 있다고 생각합니다.

편집 : 또한 흥미가있는 this SO question이 발견되었습니다. 특히 카드 놀이에 사용되지만 일부 답변 (예 : 기계 학습 예제)은 마술 카드로하고 싶은 일에보다 도움이되도록 수정할 수 있습니다.

+0

전체 프로세스가 10 초 미만 걸린다는 것을 고려하면 ... 나는 이것이 그럴 것 같지 않습니다. 이미지가 Amazon으로 전송되고 새 페이지가 다시 전송 될 때까지는 처리 시간이 약 1 ~ 2 초 정도 걸리므로 단 한 번의 빠른 Turk가되어야합니다. –

+0

당신이 그것에 명확한 제목 (거의 시간에 인간에 의해 evewn 확인할 수 있습니다)와 무언가의 사진을 찍으면, 예, 그것은 단지 10 초 걸립니다. 임의의 항목을 찍으려고 시도하면 시간이 오래 걸립니다. 또한 Google Amazon Remembers와 Mechanical Turk는 사람들이 시스템을 테스트 한 결과를 발견하고 Mechanical Turk 시스템을 사용하고있는 것으로 확인했습니다. 아마존은 그들이 아마존 기억을 어떻게하는지 말한 적이 없기 때문에 추측입니다. 나의 유일한 요점은 아마존이 기억하는 것의 적어도 일부가 가짜이기 때문에 가장 좋은 예가 아닐 수도 있다는 것입니다. –