2011-02-03 3 views
9

iPhone의 카메라 이미지에서 숫자를 실시간으로 인식해야합니다. 이미지에 5 자리 이상 표시되지 않습니다.iPhone에서 번호 인식이 실시간으로 가능합니까?

iPhone의 계산 사양이 주어진다면 해결하는 것이 현실적인 문제입니까? Tesseract OCR 라이브러리 사용 경험이있는 사람이 있습니까? 그리고이 라이브러리를 사용하여 해결할 수 있다고 생각하십니까?

+0

가능한 중복 : http://stackoverflow.com/questions/3140455/training-tesseract-to-use-with-iphone –

+0

@Daniel : 그 질문은 어떻게 물으면서 Tesseract를 사용하여 스틸 이미지에서 숫자를 읽는 것은 라이브 비디오 스트림에서 이러한 종류의 처리를 수행 할 가능성을 조사하고 있습니다. 새로운 질문을 정당화하기에는 여기에 차이가 있다고 나는 믿는다. –

답변

1

계산적으로 가능해야합니다. 실시간으로 바코드를 얻을 수있는 앱과 실시간 번역을 수행하는 앱이 있습니다. (단어 렌즈). 그러나 나는 그들이 어떤 라이브러리를 사용하는지 잘 모르겠습니다.

11

"실시간"의 정의에 따라 다르지만 예, 글꼴, 조명 조건 등이있을 수있는 경우 iPhone 4에서 0-9까지의 숫자 만 상대적으로 빠르게 인식 할 수 있어야합니다. 그들이 등장 할 것입니다.

iPhone 카메라를 사용하여 how Sudoku Grab does its recognition of puzzles에 대한 기사를 읽는 것이 좋습니다. 그들의 경우 훈련 된 신경 회로망을 사용하여 현대 iOS 하드웨어에서 상당히 단순하고 빠르지 만 숫자를 식별했습니다.

거기에있는 현재 인식 라이브러리는 OpenCV와 마찬가지로 iPhone의 CPU를 사용하여 처리합니다. 나는 그들이 영상 소스와 함께 사용하면서 얼굴 인식과 같은 더 복잡한 작업을 할 수 있고 최소한의 마비를 보여줄 수 있다고 들었다.

더 나은 성능을 위해 최신 iOS 장치의 프로그래밍 가능한 GPU에는 많은 잠재력이 있다고 생각합니다. my benchmarks에서 간단한 이미지 처리를 위해 iPhone 4의 GPU를 사용할 때 14 배속에서 28 배속까지의 속도 향상을 보았습니다. 지금 당장이 부분을보고있는 사람은 거의 없지만, Sudoku Grab의 신경망과 같은 것은 GPU에서 이익을 얻을 수있는 충분한 프로세스 여야합니다.

+0

유용한 작품 http://www.benjaminloulier.com – iCoder86

0

예. Bender 당신을 도울 수 있습니다. iOS에서 신경망을 만들고 실행할 수 있습니다. 후드 아래에 금속을 사용하기 때문에 빠르고 부드럽게 작동합니다. 또한 TensorFlow 모델을 직접 실행하는 것도 지원합니다.

그래서 당신은 벤더에 당신이

책임의 한계와 법적 고지 도움이 필요하면 숫자 인식 Handwritten Digit Recognition using Convolutional Neural Networks in Python with Keras 위해 훈련 TensorFlow의 기존 모델을 실행할 수 있습니다 :이 프로젝트에서 일했다.

0

무료 SDK가 있습니다 : http://rtrsdk.com/ iOS와 Andorid를 모두 지원하며 실시간으로 작동하여 모든 텍스트를 캡처 할 수 있으며 숫자는 문제가되지 않습니다.

면책 조항 : 나는 ABBYY 작동

관련 문제