2
mapred.textoutputformat.separator
값을 \001
으로 설정했습니다. 그러나 MR 작업을 실행할 때 예외가 throw됩니다.글자 참조 "& # 1"은 (는) 잘못된 XML 문자입니다
문자 참조 "& # 1"은 잘못된 XML 문자입니다.
도와주세요.
mapred.textoutputformat.separator
값을 \001
으로 설정했습니다. 그러나 MR 작업을 실행할 때 예외가 throw됩니다.글자 참조 "& # 1"은 (는) 잘못된 XML 문자입니다
문자 참조 "& # 1"은 잘못된 XML 문자입니다.
도와주세요.
나는 해결책을 얻었다. 이유는 "\ 001"문자 시퀀스 또는 다른 유니 코드 문자를 사용할 때 객체 직렬화 중에 잘못된 형식으로 변환되기 때문입니다.
그래서 해결책은, Base64로를 사용하여 문자를 인코딩 TextOutputFormat 클래스의 getRecordWriter 방법을 무시하고 다음 거기를 디코딩하는 것이 었습니다. (Base64.decodeBase64)이 작동.