2014-01-06 2 views
0

주어진 문자열이 카타카나 범위 내에 있는지 테스트하려고합니다.파이썬에서 유니 코드 범위 다루기

나는 해결책을 시도했다 : Python and Unicode Blocks for regex. 하지만 여전히 내 출력은 "없음"입니다. 내가 여기서 무엇을 놓치고 있니?

#!/usr/bin/env python 
# -*- coding: utf-8 -*- 
import re 
print re.search(u'[\u30A0-\u30FF]', u'カタカ') 
+0

Windows에서 python 2.7을 사용하면 – shamim

+0

'u'[\ u30A0- \ u30FF] ''를 사용하는 동안 'u'[\ u30a0- \ u30ff] ''를 사용한다는 것을 알 수 있습니다. 그 차이가있을 수 있을까요? – SethMMorton

+1

저에게 맞습니다. 실제로 파일을 UTF-8로 저장 했습니까? – geoffspear

답변

1

문제는 귀하가 Windows를 사용하고 있다는 것입니다. 소스 파일이 UTF-8이지만 Windows는 UTF-8을 사용하지 않도록 지정합니다. Windows 자체의 언어 버전 및 설정에 따라 다양한 코드 페이지가 사용됩니다.

많은 편집자가 Windows 코드 페이지를 무시하고 파일을 UTF-8로 저장할 수있는 방법이 있습니다. 메모장 예를 들어 다른 이름으로 저장 대화 상자에 Encoding 목록이 있습니다.

관련 문제