2014-12-30 5 views
1

라틴 문자 및 일부 특수 문자와 일치하는 Java의 정규 표현식이 필요합니다.라틴 문자 자바의 정규 표현식

문자를 나열하고 싶지 않습니다.

예 :

는 다음과 같은 대문자와 소문자와 일치해야합니다 : 나는 몇 가지 패턴과 그룹을 시도 £

하지만 시간 후에 나는 밖으로 해요 : äöüçłąćżźńóę

이 일치하지해야 아이디어의

어떤 도움을 주시면 감사하겠습니다.

[\p{L}]+ 

답변

8

\p{IsLatin} 문자 클래스는이 작업을 수행합니다

0

는 다음과 같은 패턴 (\p{L} 일치하는 유니 코드 문자)를 사용합니다.

즉, System.out.println(someString.matches("\\p{IsLatin}+"));

는 그것은 Pattern class documentation에 이름입니다.

ABCDEFGHIJKLMNOPQRSTU VWXYZ ABCDEFGHIJKLMNOPQRSTU VWXYZ ª º A A A A A A Æ Ç È É Ê Ë I I I :

순회 빠른 루프 가능한 모든 문자는 일치 문자 세트는 것을 보여준다 Ï Ð Ò Ò Ø Ø Ø Ø Ú Ü Ý Â Â Â Â Â Ã ¢ Ã ¢ Ã ¢ Ã ¢ Ã ¢ Ã ¢ Ã ¢ Ã ¢ â, ¬ Â A A A C C C C C C C č D D DJ đ E E E E E ė E E E E G ĝ G G G G G G H H H H I I I I I I I I I I IJ ij J ĵ Ķ Ĺ Ļ Ŀ Ń ʼn ʼn Ŋ Ő Ő Ő Ŕ ŕ Ŗ ŗ ŗ Ţ Ŧ Ŧ Ů Ų Ŵ Ŵ ŵ ƀ Ƃ Ƃ Ƈ Ƈ Ƅ Ƈ Ƈ Ƈ Ɖ Ɗ ƌ ƍ Ǝ Ə Ɛ Ƒ Ɠ Ɠ Ɣ ƕ Ɨ Ɨ Ƙ ƙ ƚ ƛ Ɯ Ɲ ƞ Ɵ Ơ Ƣ ƣ Ƥ ƥ Ʀ Ƨ ƨ ƪ ƫ Ƭ ƭ Ʈ Ʈ Ʊ Ʊ Ʊ Ƴ ƴ ƴ ƶ Ʒ Ʒ ƹ ƺ ƻ Ƽ ƽ ƽ ƾ ƿ ǁ ǁ! DŽ Dž dž lj lj lj nj nj nj ǎ ǎ Ǐ Ǐ Ǒ Ǒ ǔ ǔ ǖ ǖ ǘ ǘ ǚ ǚ Ǜ ǜ ǝ Ǟ ǟ ǡ ǡ Ǣ ǣ ǥ ǥ ǧ ǧ ǩ ǩ Ǫ ǫ ǭ ǭ ǯ ǯ ǰ DZ Dz dz ǵ ǵ Ƕ Ƿ ǹ ǹ ǻ ǻ ǽ ǽ ǿ ǿ ȁ ȁ ȃ ȃ ȅ ȅ ȇ ȇ ȉ ȉ ȋ ȋ ȍ ȍ ȏ ȏ ȑ ȑ ȓ ȓ ȕ ȕ ȗ ȗ S S T ţ Ȝ ȝ Ȟ ȟ Ƞ ȡ Ȣ ȣ Ȥ ȥ ȧ ȧ ȩ ȩ ȫ ȫ ȭ ȭ Ȯ ȯ Ȱ ȱ ȳ ȳ ȴ ȵ ȶ ȷ ȸ ȹ Ⱥ ȼ ȼ Ƚ Ⱦ ȿ ɀ ɂ ɂ Ƀ Ʉ ʌ Ɇ ɇ ɉ ɉ ɋ ɋ Ɍ ɍ ɏ ɏ ɐ ɑ ɒ ɓ ɔ ɕ ɖ ɗ ɘ ə ɚ ɛ ɜ ɝ ɞ ɟ ɠ ɡ ɢ ɣ ɤ ɥ ɦ ɧ ɨ ɩ ɪ ɫ ɬ ɭ ɮ ɯ ɰ ɱ ɲ ɳ ɴ ɵ ɶ ɷ ɸ ɹ ɺ ɻ ɼ ɽ ɾ ɿ ʀ ʁ ʂ ʃ ʄ ʅ ʆ ʇ ʈ ʉ ʊ ʋ ʌ ʍ ʎ ʏ ʐ ʑ ʒ ʓ ʔ ʕ ʖ ʗ ʙ ʚ ʛ ʜ ʝ ʞ ʟ ʠ ʡ ʢ ʣ ʤ ʥ ʦ ʧ ʨ ʩ ʪ ʫ ʬ ʭ ʭ ʰ ʱ ʲ ʳ ʴ ʵ ʶ ʷ ʸ ˠ ˡ ˢ ˣ ˤ ᴀ ᴁ ᴂ ᴃ ᴄ ᴅ ᴆ ᴇ ᴈ ᴉ ᴊ ᴋ ᴌ ᴍ ᴎ ᴏ ᴐ ᴑ ᴒ ᴓ ᴔ ᴕ ᴖ ᴗ ᴘ ᴙ ᴚ ᴛ ᴜ ᴝ ᴞ ᴟ ᴠ ᴡ ᴢ ᴣ ᴤ ᴥ ᴬ ᴭ ᴮ ᴯ ᴰ ᴱ ᴲ ᴳ ᴴ ᴵ ᴶ ᴷ ᴸ ᴹ ᴺ ᴻ ᴼ ᴽ ᴾ ᴿ ᵀ ᵁ ᵂ ᵃ ᵄ ᵅ ᵆ ᵇ ᵈ ᵉ ᵊ ᵋ ᵌ ᵍ ᵎ ᵏ ᵐ ᵑ ᵒ ᵓ ᵔ ᵕ ᵖ ᵗ ᵘ ᵙ ᵚ ᵛ ᵜ ᵢ ᵣ ᵤ ᵥ ᵫ ᵬ ᵭ ᵮ ᵯ ᵰ ᵱ ᵲ ᵳ ᵴ ᵵ ᵶ ᵷ ᵹ ᵺ ᵻ ᵼ ᵽ ᵾ ᵿ ᶀ ᶁ ᶂ ᶃ ᶄ ᶅ ᶆ ᶇ ᶈ ᶉ ᶊ ᶋ ᶌ ᶍ ᶎ ᶏ ᶐ ᶑ ᶒ ᶓ ᶔ ᶕ ᶖ ᶗ ᶘ ᶙ ᶚ ᶛ ᶜ ᶝ ᶞ ᶟ ᶠ ᶡ ᶢ ᶣ ᶤ ᶥ ᶦ ᶧ ᶨ ᶩ ᶪ ᶫ ᶬ ᶭ ᶮ ᶯ ᶰ ᶱ ᶲ ᶳ ᶴ ᶵ ᶶ ᶷ ᶸ ᶹ ᶺ ᶻ ᶼ ᶽ ᶾ A A B B B B B B C C D D D D D D D D D D E E E E E E E E E E F F G G H H H H H H H H H H I I I I K K K K L K L L L L Ḻ L L L Ḿ ḿ M, M, M, N N N N N N N N O O O O O O O O P P P P로 R R R R F S S S S S S S S S T T T T T T T T U U U U U U U U U U V V V V W W W W W W W W W W X X X X, Y, Y, Z, Z, Z, Z, Z, Z H T W Y A ~ F ẜ ẝ ẞ ẟ A A A A A A A A A A A A A A A A A A A A A A A A E E E E E E E E E E E E E E E E I I I I O O O O O O O O O O O O O O O O O O O O O O O O U U U U U U U U U U U U U U Y Y Y Y Y Y Y Y ỻ ỻ Ỽ ỽ Ỿ ỿ ⁱ ⁿ ₐ ₑ ₒ ₓ ₔ ₕ ₖ ₗ ₘ ₙ ₚ ₛ ₜ K Å ⅎ ⅎ ⅰ ⅱ ⅲ ⅳ ⅴ ⅵ ⅶ ⅷ ⅸ ⅹ ⅺ ⅻ ⅼ ⅽ ⅾ ⅿ ⅰ ⅱ ⅲ ⅳ ⅴ ⅵ ⅶ ⅷ ⅸ ⅹ ⅺ ⅻ ⅼ ⅽ ⅾ ⅿ ↀ ↁ ↂ ↄ ↄ ↅ ↆ ↇↈ Ⱡ ⱡ Ɫ Ᵽ Ɽ ⱥ ⱦ Ⱨ ⱨ Ⱪ ⱪ Ⱬ ⱬ ɑ Ɱ Ɐ Ɒ ⱱ Ⱳ ⱳ ⱴ Ⱶ ⱶ ⱷ ⱸ ⱹ ⱺ ⱻ ⱼ ⱽ Ȿ Ɀ Ꜣ ꜣ Ꜥ ꜥ Ꜧ ꜧ Ꜩ ꜩ Ꜫ ꜫ Ꜭ ꜭ Ꜯ ꜯ ꜰ ꜱ Ꜳ ꜳ ꜵ ꜵ ꜷ ꜷ ꜹ ꜹ ꜻ ꜻ ꜽ ꜽ ꜿ ꜿ ꝁ ꝁ ꝃ ꝃ ꝅ ꝅ ꝇ ꝇ ꝉ ꝉ ꝋ ꝋ Ꝍ ꝍ ꝏ ꝏ ꝑ ꝑ Ꝓ ꝓ ꝕ ꝕ ꝗ ꝗ Ꝙ ꝙ ꝛ ꝛ ꝝ ꝝ ꝟ ꝟ Ꝡ ꝡ Ꝣ ꝣ Ꝥ ꝥ ꝧ ꝧ ꝩ ꝩ ꝫ ꝫ ꝭ ꝭ ꝯ ꝯ ꝰ ꝱ ꝲ ꝳ ꝴ ꝵ ꝶ ꝷ ꝸ ꝺ ꝺ ꝼ ꝼ Ᵹ ꝿ ꝿ ꞁ ꞁ ꞃ ꞃ ꞅ ꞅ ꞇ ꞇ ꞌ ꞌ Ɥ ꞎ ꞑ ꞑ ꞓ ꞓ ꞡ ꞡ Ꞣ ꞣ Ꞥ ꞥ Ꞧ ꞧ Ꞩ ꞩ Ɦ ꟸ ꟹ ꟺ ꟻ ꟼ ꟽ ꟾ ꟾ f g h i j k l m n o p q r s t u v x y y

너무 많으면 named Unicode blocks과 교차 할 수 있습니다. 예를 들어

,이 문자 클래스 :

[\p{IsLatin}&&[\p{InBasic_Latin}\p{InLatin_1_Supplement}\p{InLatin_Extended_A}\p{InLatin_Extended_B}]] 

가 일치 :

ABCDEFGHIJKLMNOPQRSTU VWXYZ ABCDEFGHIJKLMNOPQRSTU VWXYZ ª º A A A A A A Æ Ç È É Ê Ë I I I I Ð ñ O O의 O O O O U U U U Ý þ ß A A A A A A æ ç è é ê ë I I I I ð ñ O O O O O O U U U U ý þ ÿ A A A A A ĉ ĉ ĉ Ċ Ē Ĕ ĕ Ė ĝ ĝ ĝ ģ ģ ģ ģ ģ Ĩ Ĭ Ĭ Ĭ I I I I IJ ij J J K K ĸ -11- L L L L L L L L N N N N N N ʼn N N O O O O O O Œ œ로 R R S S여 S S S S 여 S S T ţ T는 승 T T T U U U U U U U U U U U U (W) (W) 예 예 예, ► ►을 Z Z ž ž S ƀ Ɓ 경우 ● ● 촬영 ƅ ƅ ɔ ■ 카메라 ■ 카메라 Ɖ Ɗ Ƌ ƌ 경우 → Ǝ ə ɛ ƒ ƒ Ɠ Ɣ ƕ Ɨ Ɨ Ƙ ƙ ƚ Ɯ Ɲ ƞ Ɵ Ơ Ƣ ƣ Ƥ ƥ Ʀ Ƨ ƪ ƪ ƫ Ƭ ƭ Ʈ Ʊ Ʊ Ʋ Ƴ ƴ ƶ Ʒ Ƹ ƹ ƺ ƻ ƻ ƽ ƾ ƾ ƿ ǁ ǁ ǂ! dž dž dž lj lj lj NJ Nj nj ǎ ǎ Ǐ Ǐ Ǒ Ǒ ǔ ǔ Ǖ ǖ Ǘ ǘ Ǚ ǚ Ǜ ǜ ǝ Ǟ ǟ ǡ ǡ ǣ ǣ Ǥ ǥ ǧ ǧ Ǩ ǩ ǫ ǫ Ǭ ǭ Ǯ ǯ ǰ dz dz dz ǵ ǵ Ƕ Ƿ ǹ ǹ ǻ ǻ ǽ ǽ ǿ ǿ Ȁ ȁ ȃ ȃ ȅ ȅ Ȇ ȇ ȉ ȉ Ȋ ȋ ȍ ȍ ȏ ȏ ȑ ȑ Ȓ ȓ Ȕ ȕ Ȗ ȗ S S T ţ ȝ ȝ ȟ ȟ Ƞ ȡ ȣ ȣ ȥ ȥ ȧ ȧ Ȩ ȩ Ȫ ȫ Ȭ ȭ Ȯ ȯ Ȳ Ȳ ȳ ȴ ȵ ȷ ȸ ȹ Ⱥ Ȼ ȼ Ƚ ȿ ɀ Ɂ Ƀ Ʉ Ʌ Ɇ ɇ Ɉ ɉ ɋ Ɍ ɍ Ɏ ɏ

+0

이것은 그리스어, 키릴 자모 및 다른 알파벳과도 일치합니다. – Boann

+0

@Boann 네, 모든 유니 코드와 일치한다고 말합니다! – Kasramvd