유니 코드 문자가있는 웹 사이트를 긁어 내려고하고 있습니다. 나는 매우 태초 -*- coding: utf-8 -*-
에 명시된 플러스 나는 re.UNICODE
플래그정규식, 유니 코드 패턴 찾기
pattern = re.compile('(?:{}|{})'.format(regex, regex1), re.UNICODE)
을 사용하지만 내가 출력 난 아직도 내가 그 문제를 해결하려면 어떻게 �
같은 그 이상한 문자를받을를 인쇄 할 때? 감사!
글꼴이 각각의 유니 코드 문자를 지원하지 않기 때문에 문자가 나타날 수 있습니다. – nwellnhof
그것은 백퍼센트 않습니다. – nutship
먼저 웹 사이트에서 UTF-8 텍스트를 디코드해야합니다. 예를 들어 [이 질문] (http://stackoverflow.com/questions/10293234/why-wont-python-display-this-text-correctly-utf-8-decoding-issue)을 참조하십시오. – nwellnhof