다음 문자열이 데이터베이스에 저장되어 있습니다 (Unicode 형식).수치 엔티티를 읽을 수있는 형식으로 변환
كنت قد دخلت بالفعل في مكان آخر من
이제 해당 문자열을 읽을 수있는 형식으로 변환하고 싶습니다. Java에서는 어떻게 할 수 있습니까?
이것은 유니 코드 형식이 아니며 XML/HTML 문자 참조입니다. . 리터럴 문자가 필요한 데이터베이스에서이 값을 갖는 것은 큰 데이터 품질의 냄새입니다. Andrzej의 설명에 따라 이스케이프 처리를 해제하여 읽을 수 있지만 장기적으로이 데이터를 처음부터 수정해야합니다. 제출 된 양식 데이터의 HTML 문자 참조는 양식 페이지를 UTF-8로 제공하지 않은 경우가 많습니다. – bobince
해당 문자열을 해당 언어로만 원합니다 (예 : 그 문자열이 urdu에 있다면 그것은 단지 unicode 문자가 아닌 urdu 만 표시해야합니다. –
? 우르두어는 유니 코드 문자입니다. '& #'...';'는 HTML 문자 참조 이스케이프입니다. 그것은 유니 코드와 아무런 관련이 없습니다. – bobince