인코딩 된 문자열에 사용 된 인코딩 유형을 찾을 수 있는지 궁금합니다. 적어도 특정 엔티티 또는 단어가 python3.x의 문자열 또는 바이트인지 확인하십시오. 미리 감사드립니다. 인코딩 유형 찾기
0
A
답변
3
확인하려면 간단하다 :
isinstance(x, str)
다니엘은 그의 대답 사용했다 당신이 그 다음 당신이 할 수있는, 바이트 것으로 확인되면
isinstance(x, bytes)
대
chardet은 인코딩이 무엇인지 짐작하게합니다. 짧은 텍스트에서는 매우 신뢰할 수 없지만 긴 텍스트에서는 정상적으로 작동합니다.
8
chardet
라이브러리를 권하고 싶습니다. 그것은 some work from Mozilla을 기반으로하며 필요를 충족하는 것 같습니다.
>>> import urllib
>>> rawdata = urllib.urlopen('http://yahoo.co.jp/').read()
>>> import chardet
>>> chardet.detect(rawdata)
{'encoding': 'EUC-JP', 'confidence': 0.99}
그리고 거기뿐만 아니라 해당 페이지에 적용됩니다 더 복잡한 사용 사례가 있지만, 핵심은 단순히 문자열에 전달할 수 있으며,이는 잠재적 인 인코딩의 집합을 반환 그 추측에 그들의 신뢰와 함께. 이 문자열의 또는 바이트 경우
관련 문제
- 1. 인코딩 유형
- 2. 파일 유형 찾기
- 3. Ruby 1.9.2 Find.find 인코딩 찾기
- 4. C# 파일의 인코딩 유형 변경?
- 5. IPv4 패킷의 데이터 유형 찾기
- 6. nullable 유형 목록에서 색인 찾기?
- 7. icu :: BreakIterator에서 중단 유형 찾기
- 8. jQuery 양식 요소 유형 찾기
- 9. Windows에서 wofstream을 사용하는 UTF-16 인코딩 유형
- 10. wsHttp Y 인딩의 기본 인코딩 유형
- 11. C++ : 파일, 인코딩 및 데이터 유형
- 12. Google App Engine : CSV 용 인코딩 유형?
- 13. 인코딩 유형 DecoderFallback 속성을 설정할 수 없습니다
- 14. .Net CF 1.0에서 OS 유형 찾기
- 15. .NET 리플렉션 : 사용 된 유형 찾기
- 16. Outlook MeetingItem의 기본 개체 유형 찾기
- 17. 문서 라이브러리의 문서 템플릿 유형 찾기
- 18. 유형
- 19. Bouncy castle AES 암호화의 인코딩 유형 및 주요 문제점
- 20. 이전 프로그램 고정 : 데이터베이스 텍스트 인코딩 및 잘못된 필드 유형
- 21. SMS에서 전송할 바이트 배열을 변환 할 수있는 인코딩 유형
- 22. URL 인코딩, 양식 인코딩 및 mailto : 인코딩
- 23. 수퍼 클래스로 선언 된 인스턴스의 서브 클래스 유형 찾기
- 24. JVisualVM 프로파일 분석 - 많은 수의 원시 유형 소스 찾기?
- 25. Sybase PowerDesigner 데이터 항목의 데이터 유형 변경 (찾기/바꾸기/변환)
- 26. Qt로 MIME 유형 및 관련 응용 프로그램 찾기
- 27. SQL에서 SQL 인코딩 인코딩 스튜디오
- 28. URI 인코딩 및 HTML 인코딩
- 29. .net의 텍스트 인코딩
- 30. mysql 문자 인코딩 문제
이 테스트가 작동하는데,하지만 난 다음이 작동하지 않습니다 그것을 보여줍니다 생각하는 방법을 확실하지 : >>> 유형 (x)의 >>> isinstance (X, 바이트) 진정한 >> > isinstance (x, str) True –
kasterma
@kasterma : 파이썬 2에서는 str과 bytes가 같은 타입이기 때문이다. 파이썬 3에서는 그렇지 않습니다. –