나는 PDF를 가져 와서 텍스트를 추출하려고한다. 그런 다음 ColdFusion의 사용 가능한 Verity 검색을 사용하여 내용을 검색 할 수있게하려고합니다.Java 또는 .NET 라이브러리를 사용하여 ColdFusion의 PDF에 광학 문자 인식 수행?
이미이 작업을 수행하고있는 라이브러리가 있습니까? 나는 그들이 CF에서 호출 될 수 있기 때문에 Java 또는 .NET (Java 선호) 라이브러리를 범위에 포함합니다.
어떤 통찰력이나 경험이라도 대단히 감사 할 것입니다 ... 감사합니다!
편집 : PDF 파일의 색인 생성은 텍스트가 PDF에 포함되어있는 경우 작동합니다. 처리해야하는 PDF에는 텍스트가 이미지로 스캔됩니다.
내 서버가있어 잠재적 인 것처럼 보입니다. 나는이 년 전에 건너 왔고 이름을 기억할 수 없었다. .. 고마워! 그래도 TIFFS 만 처리하는 것처럼 보이므로 PDF의 각 페이지를 변환해야합니다. –