파이썬에서 JSON 피드를 구문 분석 중이며이 문자가 포함되어있어 유효성을 검사하지 않습니다.파이썬에서 외부 기호로 작업하기
이러한 기호를 처리 할 수있는 방법이 있습니까? 그들은 개종 할 수 있습니까 아니면 그들을 깔끔하게 제거 할 수 있습니까?
이 기호가 무엇인지 또는 무엇이 원인인지 알지 못합니다. 그렇지 않으면 직접 연구 할 것입니다.
편집 : Stackover 흐름 그래서 여기에 문자를 제거한다 : [?] http://files.getdropbox.com/u/194177/symbol.jpg
이 있다는 아마 당신이 가지고있는 텍스트 인코딩 일종의 의미 "클래식 80"
코드 스 니펫과 Python 버전이 여기에 모두 관련되어 있습니다. JSON 피드의 인코딩을 아는 경우 보너스 포인트입니다. – Triptych
JSON은 유니 코드 인코딩, UTF-8, UTF-16 (BE 또는 LE) 또는 UTF-32 (BE 또는 LE) 중 하나에 있어야합니다. . 제작자가 대신 ISO-8859-1 또는 windows-1252로 보낼 수도 있습니다. 파일을 '잘못된'인코딩으로 읽고 구문 분석하기 전에 수정할 수 있습니다. –
lavinio