0

나는 패턴 인식에 대한 간단한 프로젝트를 이미 마쳤다.
Backpropagation과 다층 신경망을 사용하여 10 개의 알파벳 문자를 인식했습니다.
꽤 어려웠고 지역 최저점과 싸우는 데 많은 어려움을 겪었습니다.
하지만 여전히이 프로그램이 효과가있었습니다. 물론 나쁜 코드 일 수도 있습니다.

좋은 신경 네트워크 토폴로지 및 이미지 인식을위한 교육 방법

지금 당장 결과를 개선하고 26자를 모두 사용하고 싶습니다. 게다가 훈련 데이터는 더 복잡 할 수 있습니다 (적어도 더 큰 이미지). 그래서 나는 잘못된 접근법을 사용할지도 모른다고 조금 걱정합니다.

도움이 될 것이라고 생각하십니까? 아마도 유전자 알고리즘과 신경 회로망을 어떤 종류로 조합해야합니까?
더 복잡한 네트워크 토폴로지를 사용 하시겠습니까? (와드 네트워크 및 교육 알고리즘을 염두에두고 있습니다.)

나는 OCR 라이브러리를 사용하지 않는다는 사실을 말씀 드리고 싶습니다. 교육 프로젝트 일뿐입니다.

누군가 내게 조언을 줄 수 있다면 좋을 것입니다. 고맙습니다.

답변

1

시도 resilient propagation 훈련.

바닐라 Rprop 교육을 통해 큰 성공을 거두었습니다. ANN 토폴로지의 경우 정상적인 피드 포워드가 이미지 처리에 사용됩니다. 모든 글자가 같은 글꼴이고 작은 크기 (4x4 어쩌면) 인 경우 Self-organizing map으로 실험 해 볼 수 있습니다. 출력은 글자를 나타낼 수 있습니다.

+0

대단하다! 그런 건 들어 본 적이 없어요. 그것은 오래된 ANN 매뉴얼에 갇혀있는 것 같습니다. 토폴로지에 관해서는, 다른 레이어를 훈련시키기 위해 병렬 프로그래밍을 사용하고 싶었습니다. 그것에 대해 아는 것이 있습니까? 고맙습니다. – user1131662

+0

한 번만 병렬 전파를 시도했지만 스레딩 오버 헤드가 너무 많아서 결과 프로그램이 10-15 배 느려졌습니다. 그러나 또 다른 접근 방식은 모든 입력 - 출력 세트에 대한 가중치의 변화를 계산 한 다음 끝에 추가합니다. 이것은 많은 메모리를 필요로합니다. 역 전파는 스레딩에 적합하지 않습니다. –