내 첫 번째 단계는 노이즈를 없애기 위해 5x5 박스 필터와 임계 값을 80 %로 설정 한 다음 반전시키는 것입니다 (아마도 형태학을 사용하려고 계획했기 때문에 가능했지만 결국 그렇지 않았습니다).
convert news.jpg -depth 16 -statistic mean 5x5 -threshold 80% -negate z.png
나는 다음 을 통해을 "구성 요소 분석을 연결"것을 실행하고 (2000 픽셀에서) 너무 작은 면적을 가진 모든 모양을 삭제 :
convert news.jpg -depth 16 -statistic mean 5x5 -threshold 80% -negate \
-define connected-components:verbose=true \
-define connected-components:area-threshold=2000 \
-connected-components 4 -auto-level output.png
출력
Objects (id: bounding-box centroid area mean-color):
110: 1254x723+59+174 686.3,536.0 901824 srgb(0,0,0)
2328: 935x723+59+910 526.0,1271.0 676005 srgb(0,0,0)
0: 1370x1692+0+0 685.2,712.7 399651 srgb(0,0,0)
2329: 303x722+1007+911 1158.0,1271.5 218766 srgb(0,0,0)
25: 1262x40+54+121 685.2,140.5 49820 srgb(255,255,255)
109: 1265x735+54+168 708.3,535.0 20601 srgb(255,255,255)
1: 1274x64+48+48 675.9,54.5 16825 srgb(255,255,255)
2326: 945x733+54+905 526.0,1271.0 16660 srgb(255,255,255)
2327: 312x732+1003+906 1169.9,1271.5 9606 srgb(255,255,255) <--- THIS ONE
421: 403x15+328+342 528.6,350.1 4816 srgb(255,255,255)
7: 141x23+614+74 685.5,85.2 2831 srgb(255,255,255)
필드는 첫 번째 줄에 레이블이 지정되어 있지만 흥미로운 요소는 두 번째 (블록 형상) 및 네 번째 필드 (블롭 영역)입니다. 보시다시피 11 개의 줄이있어서 이미지에 11 개의 얼룩이 있습니다. 두 번째 필드 인 AxB+C+D
은 A
픽셀의 너비가 B
픽셀이고 이미지의 왼쪽 가장자리에서 왼쪽 위 모서리가 C
픽셀이고 맨 위에서 아래쪽 이미지가 D
인 픽셀을 의미합니다.
convert news.jpg -fill "rgba(255,0,0,0.5)" -draw "rectangle 1003,906 1315,1638" oneArticle.png
는 새 속으로 그 기사를 자르려면 : 2327: 312x732+1003+906
를 시작하고 하나 그 이상 사각형을 그립니다 내가 화살표로 표시 한 하나의
살펴 보자, 이미지 :
convert news.jpg -crop 312x732+1003+906 article.jpg
우리가 다른 모든 상자에 그리면, 우리가 얻을 :
당신이뿐만 아니라 진짜 입력 이미지가 있습니까? 당신이 보여주는 것은 그 개념을 설명하는 데 유용합니다. 하지만 실제로는 실제 입력과 함께 작업해야합니다. –
구문 분석 할 문서가 다양한 소스에서 제공되었지만 실제 입력 이미지가 추가되었습니다. 형식의 전체 형식은 항상 비슷할 것으로 예상되지만 줄 크기, 언어, 텍스트 형식 등은 변경되기 쉽습니다. – migsvult
스캐너 나 카메라로 촬영 한 이미지가 아닌 컴퓨터에서 생성 된 이미지 인 것처럼 보입니다. (모든 라인이 완벽하게 수평/수직 인 방식으로 판단하면 모든 입력이 비슷할 것입니까? 그렇다면 분명히 작업이 쉬워집니다. –