문자 클래스의 모든 양식을 명시 적으로 나열하지 않고 일부 유니 코드 인코딩을 사용하여 인코딩 된 텍스트의 특정 문자의 모든 악센트 부호가있는 형식과 일치하는 정규 표현식을 작성하고 싶습니다.특정 문자의 악센트 부호가있는 모든 양식을 일치시키는 방법은 무엇입니까?
내가a
의 악센트 버전과 일치하려는 경우는 ISO-8859-1에 살고에만
a
년대를 가져오고 다른 악센트가있을 수 있습니다 그래서, 예를 들어,
[aàáâãäå]
이 불충분
그것은 거기에서 일어나지 않습니다. 받아 들여질 수있는 것은 \p{Base_Character: a}
과 같은 것이고, 유니 코드에 정의 된 것과 같은 것입니다. 이 일을하는 무언가가 존재합니까?
편집 : 문자열을 ASCIIfy 할 수 없습니다 --- 문자열이 데이터베이스에 있습니다. 직접 액세스 할 수 없습니다. 사실 여기에는 코드 수준의 액세스 권한이 없습니다. 내가 줄 수있는 유일한 입력은 정규식입니다.