java에서 HTML 파일을 구문 분석/변환하기 위해 HtmlCleaner 라이브러리를 사용하고 있습니다.HTMLCLEANER가 스페인어 문자를 처리합니다.
그것은 그와 같은 스페인어 문자를 처리 할 수없는 것 같다 'ÁáÉéÍíÑñÓóÚúÜü'
나는이 또는 다른 솔루션을 처리하기위한 HtmlCleaner에서 설정할 수있는 모든 속성이 있습니까? 여기에 내가 그것을 호출하는 데 사용하고 코드는 다음과 같습니다
CleanerProperties props = new CleanerProperties();
props.setRecognizeUnicodeChars(true);
java.io.File file = new java.io.File("C:\\example.html");
TagNode tagNode = new HtmlCleaner(props).clean(file);
UTF-8을 사용하도록 인코딩을 설정하는 방법이 있습니까? – Makoto
파일에 쓸 때 UTF-8을 사용하고 있습니다. 'new PrettyHtmlSerializer (props) .writeToFile (tagNode, filePath, "utf-8");' – choop
HTML 파일이 실제로 UTF-8로 인코딩 되었습니까? –