2011-09-07 3 views
1

텍스트 조각이 quoted-printable encoded인지 테스트하는 강력한 방법을 Java에서 찾고 있습니다. 가장 간단한 방법은 문자열에 다음 정규 표현식과 일치하는 문자 시퀀스가 ​​있는지 테스트하는 것입니다. (=[A–F0-9][A–F0-9])|(=[\r][\n]) (인코딩 된 문자 + = 및 개행을위한 소프트 브레이크).텍스트 조각이 Quoted-printable로 인코딩되었는지 테스트하는 방법

+0

주어진 임의의 문자열 조각을 감안할 때이를 감지하는 강력한 방법은 없습니다. 왜 필요합니까? 본문은 어디에서 왔습니까? –

+0

텍스트 조각의 예는 http://en.wikipedia.org/wiki/Quoted-printable#Example에서 확인할 수 있습니다. 전자 메일 데이터베이스 - http://www.isi.edu/~adibi/Enron/Enron.htm. 전자 메일 중 일부는 인용 및 인쇄가 가능하며 일부는 인코딩되지 않습니다. – Skarab

+0

이메일 헤더는 인코딩을 나타냅니다. – tripleee

답변

3

나는 테스트를 무효로 할 것이다. = 뒤에 뉴 라인 또는 2 자리의 16 진수가 오는 텍스트는 QP가 아닙니다. 하지만 이것은 여전히 ​​약한 발견 적 기술입니다. 누군가는 =3D을 인코딩되지 않은 텍스트로 넣을 수 있습니다 (그리고 방금했습니다). 결론 : 인코딩을 모르는 경우 인코딩을 알 수 없습니다.

+0

나는 천천히 같은 결론을 내리고있다. 고마워. – Skarab

관련 문제