55,000 개의 이미지 파일 (JPG 및 TIFF 형식)이 책의 사진입니다. 텍스트 --- (수평 라인) --- 수 텍스트 : 각 페이지의 구조는 이쪽 --- (가로선) --- 다른 번호 텍스트 제로 4 수평 라인에서 특정 페이지에있을 수 있습니다. 숫자가 수평선 바로 아래에 있는지 알아야합니다. 그러나 숫자는 정확히 하나를 시작으로 하나씩 나오므로 숫자
프로그래밍 방식으로 수행하는 방법을 찾고 있다는 것을 제외하면 제 질문은 this one 842986/how-to-read-text-written-on-a-image과 비슷합니다. 본질적으로 비트 맵 개체 나 이미지 개체를 가져 와서 그 이미지의 텍스트를 다시 제공 할 수있는 좋은 .NET 단순 라이브러리에 대해 알고 계십니까? 환호
WPF InkCanvas 컨트롤을 사용하여 Tablet PC 응용 프로그램의 서명을 캡처하고 있습니다. 내 요구 사항 중 하나는 응용 프로그램이 실제로 "서명"되었는지 여부를 확인하는 것입니다. 지금은 InkCanvas의 Strokes 컬렉션을 검사하여이 작업을 수행하고 있습니다. 0 번 치면 사용자가 "서명하지 않았습니다"라는 것을 알게됩니다. 그러나 사
나는 그것이 무엇을 말하고 싶지 않고 보안 문자와 같은 왜곡을 다루지 않을 것입니다. 단지 묶음에 텍스트가 들어 있는지 알고 싶습니다. 이것은 유휴 리눅스 서버에서 실행될 것이며, 크론 작업은 하루에 여러 번 이미지를 대량으로 처리합니다. 내가 처리하고자하는 일 중 하나는 텍스트가있는 이미지를 버리는 것입니다. 몇 가지 오 탐지는 신경 쓰지 않지만 가능하면
계약 작업을 위해, 나는 독일 연방 의회 (Federal Parliament of Germany)에서 많은 오래된 스캔 된 그래픽 전용 총회 토론 프로토콜 PDF를 디지털화해야합니다. 문제는 이러한 파일의 대부분은 2 열 형식을 가지고있다 : Sample Protocol http://sert.homedns.org/img/btp12001.png 내 다음 질문
나는 스크린 샷을 캡쳐하고 OCR (Optical Character Recognition)을 클릭하여 특정 버튼을 찾기 위해 PC를 자동화하는 소프트웨어를 만들려고합니다. 예). 마우스와 키보드 컨트롤 부분이 있지만 지금은 스크린 샷을 처리하기 위해 OCR이 필요했습니다. 내가 발견 한 것은 Tesseract OCR이 화면상의 텍스트와 잘 작동하지 않는 것