2010-11-27 2 views

답변

8

현재 Google에서 관리하고있는 오픈 소스 OCR 엔진 인 Tesseract OCR 툴킷이 있습니다. "Olipion"은 iPhone에 들어가기 위해 cross compilation tutorial을 만들었습니다. 나는 이것이 시작하기 좋은 곳이라고 말한다.

그러나 가능한 경우에도 전화에서 OCR을하고 싶지 않은 이유가 있습니다. 이 중 일부는 다음과 같습니다 :

  • 새로운 iPhone 4의 프로세서조차도 그렇게 빠르지 않으며 응용 프로그램이 실제로 처리를 수행하는 백그라운드에서 실행할 수 없으므로 사용자 환경이 최적이 아닐 수도 있습니다.
  • 모바일 장치에서 OCR을 실행하면 배터리 수명이 단축 될 수 있습니다.
  • OCR 엔진을 업데이트 할 때마다 앱을 설치 한 사람이 모두 업그레이드해야합니다.

언제 어디서나 서버의 OCR을 실행하는 항상 연결된 모바일 장치의 경우 더 좋을 것입니다. OCR 소프트웨어를 쉽게 업그레이드 할 수 있으며 모바일 장치가 처리 할 수있는 훨씬 더 강력한 알고리즘을 실행할 수 있습니다.

모바일 카메라를 사용하여 찍은 사진으로 좋은 결과를 얻을 수 있을지 확신하지 않습니다. OCR 시스템의 정확성은 불투명하고 시끄럽고 왜곡 된 이미지를 사용하여 캡처 될 가능성이 높습니다. 전화 카메라.

프리미엄 서비스를 구입하면 OCR 기능을 제공하는 Evernote 제품이 있습니다.

OCR 기계의 대안으로 항상 Mechanical Turk이 있으며, OCR을 수행하기 위해 소량의 돈을 지불 할 수 있습니다. 이미지 소스가 주어지면 필사본에서 더 잘할 것입니다.

+1

http://weocr.ocrgrid.org/ 프로젝트에서 네트워크 OCR을위한 인프라를 제공한다고 주장합니다. – tlindner

+0

여기 iOS에서 작동하는 tesseract OCR github 프로젝트입니다. https://github.com/nolanbrown/Tesseract-iPhone-Demo –

+0

와우, 데모를 시도했는데 ...이 Tesseract 알고리즘은 정말 엿 같은 일을합니다. 그것은 대부분 엉망이되는 사이에 때로는 실제 단어로 횡설수설을 읽습니다. 너무 좋지 않아요 : ( –