모든 종류의 파일 텍스트를 추출하는 데 Apache Tika를 사용합니다. 이제는 올바른 MIME 유형의 파일을 탐지하는 데이 파일을 사용하려고합니다.Tika : Js, Css의 MIME 유형 감지
이하지만 ...위한 ...- PDF - 파일 (
application/pdf
) - HTML - 파일 (
text/html
)
예를 들어 작동
하지 않는 :
- CSS 파일 (
text/css
대신text/plain
) - 자바 스크립트 파일 (대신
text/javascript
의text/plain
) - ...
(이 마임 타입 결과는 티카 - 응용 프로그램에서도 내 응용 프로그램에서 와서).
일반 응용 프로그램의 경우 text/css
과 같은 정확한 MIME 유형이 필요합니다 (text/plain
). 티카와 함께 할 수 있습니까?
파일 이름을 Tika에 제공하고 있습니까? – Gagravarr
예, 내 응용 프로그램과 tika-app는 파일 이름을 설정하기 위해'Metadata.RESOURCE_NAME_KEY'를 사용합니다. – Sonson123