ElasticSearch는 UTF8로만 데이터를 받아들이는 검색 서버입니다. 인터넷에서 가져온 텍스트의 UTF8 변환
내가 잠재적으로 가벼운보고 부하 라인중소기업 미만 £ 440,000의 연간 매출 가진 사람을 포함 텍스트 다음 ElasticSearch 줄을 시도 할 때, 이하 £ 220,000 및보다 적은 수의 순자산 직원 수 10 명 "내 자바 응용 프로그램을 통해
- 기본적으로 내 자바 응용 프로그램이 웹 페이지에서이 정보를 받아, elasticSearch로 제공이 £을 이해하지 못할 불만 ES하고 코드를 아래를 통해 여과 한 후 실패 -..
byte bytes[] = s.getBytes("ISO-8859-1");
s = new String(bytes, "UTF-8");
여기 £
은 �
로 변환하지만 떠들썩한 파티를 사용하여 내 홈 디렉토리에 파일을 복사 할 때 다음 그것을 잘 간다된다. 모든 포인터가 도움이 될 것입니다.
http://xkcd.com/138/ –
@VineethMohan을 왜'getBytes를 사용하는 ("ISO-8859-1")'? UTF-8에서 일해야한다고 생각 했나요? – buruzaemon
기본 인코딩을 식별해야합니다.텍스트의 인코딩을 ISO-8859-1로 가정합니다. –