2011-08-04 7 views

답변

7

한자가 무엇인지에 대한 특정 개념에 따라 다릅니다. 아마도 /\p{Script=Hani}/을 찾고있을 것입니다. 그러나 우리가 그물을 넓히고 싶다면, 다음 정규 표현식 패턴은 중국어로 쓰여진 것들과 일치 할 것입니다. 필요한 경우 제한하십시오.


use 5.014; 
/
    (?: \p{Block=CJK_Compatibility} 
    | \p{Block=CJK_Compatibility_Forms} 
    | \p{Block=CJK_Compatibility_Ideographs} 
    | \p{Block=CJK_Compatibility_Ideographs_Supplement} 
    | \p{Block=CJK_Radicals_Supplement} 
    | \p{Block=CJK_Strokes} 
    | \p{Block=CJK_Symbols_And_Punctuation} 
    | \p{Block=CJK_Unified_Ideographs} 
    | \p{Block=CJK_Unified_Ideographs_Extension_A} 
    | \p{Block=CJK_Unified_Ideographs_Extension_B} 
    | \p{Block=CJK_Unified_Ideographs_Extension_C} 
    ) 
/x; 

, . 한 문자와 일치합니다. split DWYM의 빈 패턴 :

use utf8; 
split //, '冰淇淋' 
# returns ('冰', '淇', '淋') 
+0

어떻게하면 冰에 대한 淇.. , 그러나 나는 단지 전체 단어에서 모든 점이 아닌 마지막 점을 분리하고 싶습니까? – deepWebMie

+0

이 기술에 대한 PerlDoc 페이지 : http://perldoc.perl.org/perluniprops.html#Properties-accessible-through-%5Cp%7B%7D-and-%5CP%7B%7D – jhclark

관련 문제