2012-02-13 5 views
6

저는 OCR 인식과 Python의 새로운 기능을 제공합니다.Python에서 이미지 인식

내가 얻으려고하는 것은 .tif의 특정 수치를 '인식'하기 위해 Python 스크립트에서 Tesseract를 실행하는 것입니다.

나는 Tesseract에 대한 훈련을 할 수 있다고 생각했지만 Google과 여기에 비슷한 주제를 찾지 못했습니다.

기본적으로 나는 '화살표', '꽃'및 다른 아이콘과 같은 여러 이미지가 포함 된 .tif 파일을 가지고 있으며 스크립트에서 해당 아이콘의 이름을 출력으로 출력하려고합니다. 화살표가 있으면 '화살표'를 인쇄하십시오.

실현 가능합니까?

+0

http://code.google.com/p/pytesser/를 보셨습니까? –

+0

이미지 안의 아이콘이나 텍스트 만 인식합니까? 당신이 아는 한 그것을 훈련시키는 방법이 있습니까? – KingBOB

+0

그림 뒤에 배경이 있습니까? 방향, 크기 또는 색이 바뀌나요? 우리가 더 많은 정보를 얻으면 우리가 도울 수 있습니다. – P2bM

답변

1

이것은 완전한 대답은 아니지만 tif에 이미지가 여러 개인 경우 미리 크기를 알고 있으면 분류하기 전에 이미지 샘플을 표준화 할 수 있습니다. tif에서 가능한 모든 사각형으로 이미지를 자릅니다.

그래서 분류자를 만들 때 (여기서는이 방법을 언급하지 않습니다) 최종 결과는 모든 작은 사각형을 분류하는 합성을 취합니다.

tif가 주어지면 '화살표'또는 '꽃'이미지는 16x16 픽셀이며, 예를 들어 Python PIL을 사용하여 샘플을 만들 수 있습니다.

from PIL import Image 

image_samples = [] 

im = Image.open("input.tif") 
sample_dimensions = (16,16) 

for box in get_all_corner_combinations(im, sample_dimensions): 

    image_samples.append(im.crop(box)) 


classifier = YourClassifier() 

classifications = [] 

for sample in image_samples: 
    classifications.append (classifier (sample)) 

label = fuse_classifications (classifications) 

다시 말하지만, 사실은 YourClassifier를 작성하는 학습 단계에 대해 이야기하지 않았다. 그러나 이것이 문제의 일부를 배치하는 데 도움이되기를 바랍니다.

이미지를 분류하고 이미지를 분류하기 전에 이미지에서 노이즈를 정리하는 작업에 대한 연구가 많이 있습니다.

기존 Python 기계 학습 라이브러리의 멋진 모음을 탐색 해보십시오.

http://scipy-lectures.github.com/advanced/scikit-learn/index.html

뿐만 아니라 이미지와 관련된 많은 기술이 있습니다.