2013-05-06 1 views
0

외국 문자 (ģ,,,,, ā, ē, ū, ¶, ¶, ķ, ž 및 대문자)를 사용하여 성가신 문제를 해결합니다. . 모두 길이가 len이고 1과 같지 않습니다. 예를 들어 len('ī')은 2입니다 (텍스트 처리시 \xc4\xab으로 표시됨). 모든 문자에 대해 1을 돌려주는 함수를 원합니다. 어떤 도움이 필요합니까?문자열로 처리되지 않은 문자를 계산합니다.

+1

유니 코드 문자에 대한 'len'의 반환 값은 시스템에 따라 다릅니다. – Jared

+0

@Jared 글쎄, Mac OS 10.7.5를 사용하고 있습니다. 구현은 Sage입니다. –

+2

[Pragmatic Unicode - 또는 - 어떻게 고통을 멈 춥니 까?] (http://nedbatchelder.com/text/unipain.html)) –

답변

0

설명 페이지는 Rob K에 표시됩니다. 내 문제에 대한 간결한 해결책 :

def varlen(string): 
    return len(string.decode('utf-8')) 
관련 문제