2014-02-09 3 views
4

상점 티켓 (자바) 용 OCR을 코딩하려고하는데 이미지 사전 거리가 좋지만 왜곡 된 텍스트 나 나쁜 스캔에는 적합하지 않습니다. 나는 이것을 위해 뉴런 네트워크가 완벽하다고 들었다.OCR 및 신경 네트워크?

질문 : 상점 티켓 문자 검색을 위해 어떤 유형의 연결 네트워크를 권장합니까?

Thks

답변

3

신경 네트워크는 마술 당신을 위해 문제가 해결되지 않습니다. 그들은 현재의 접근 방식과 비슷한 문제를 갖게 될 것입니다. 대부분의 경우 스큐를 감지하고이를 분류 자에게 보내기 전에 수정해야합니다.

나쁜 스캔과 비슷합니다. 그것은 정확히 나쁜 스캔이 무엇인지에 달려 있습니다. 예를 들어, 일부 신경망은 흐림을 보정하는 데 놀랍도록 효율적입니다 (초점이 맞지 않은 이미지, 움직이는 흐림 등 ...).

OCR 및 신경 네트워크에 대한 몇 가지 자료를 살펴보십시오. 고전적인 주제이므로 많은 것들이 있습니다. 예를 들어 The Anatomy of Bangla OCR System for Printed Texts Using Back Propagation Neural Network도 신경망을 실행하기 전에 왜곡 된 이미지의 문제를 해결하려고합니다.

나는 재발 성 신경 네트워크가 OCR을 위해 사용될 수 있다는 것을 안다. 아주 단순한 문자 일지라도 간단한 문자를 쉽게 인식 할 수 있습니다. 그 (것)들을 개량하는 최근 종이가있다 : High-Performance OCR forPrinted English and Fraktur using LSTM Networks. 심지어 텍스트 줄 정규화가 포함되어있어 사용자의 경우에 매우 유용합니다.

답변이 너무 OCR에 대한 일반 피드 포워드 역 전파 신경망을 훈련에 대해 여기에 있다는 것을

주의 사항 : training feedforward neural network for OCR

1

"길쌈 신경망" "깊은 학습은"최상의 결과의 일부를 제공하기 위해 표시되었습니다로 OCR (구체적으로 MNIST 데이터베이스에 있음).

좋은 출발점은 this tutorial입니다.