opencv 및 C++와 함께 Tesseract 라이브러리를 사용하여 숫자와 문자를 모두 포함하는 이미지를 OCR하려고합니다. 정팔 포체 라이브러리를 호출하기 전에, 내가 OpenCV의이 OCR이 이미지에 대한 결과 인 opencv BGR2GRAY와 베개 변환 함수의 차이점
가 100 % 정확하다
cvtColor(roiImg,roiImg,CV_BGR2GRAY);
와 규모를 이미지를 회색하는 데 사용됩니다.
다음 이미지는 python이있는 pillow 라이브러리로 테스트되었습니다. 원본 이미지는 다음 방법을 사용하여 회색 스케일링되었습니다.
gray = image.convert('L')
이
후자 한 그레이 스케일 이미지가 100 % 정확한 결과를 준이다.
인터넷을 통해 검색 한 후에는 opencv BGR2Gray와 pillow img.convert 메소드 모두 동일한 루마 변환 알고리즘을 사용한다고 언급했습니다.
두 가지 OCR 결과가 서로 다른 이유는 무엇입니까? 사전
OpenCV의 기본적으로 BGR 사용되지만으로 변환되고 RGB에서 회색 ('CV_RGB2GRAY'). 'CV_BGR2GRAY'가 아니겠습니까? –
@Hi 저는 Frogatto입니다. 맞습니다. 코드를 편집했습니다. 왜 이런 일이 일어나는 지 아십니까? –
@Hi 후에도 여전히 동일한 문제가 발생합니다. Frogatto 제안입니까? – NAmorim