2011-02-23 4 views
7

완전한 유니 코드를 지원하는 훌륭한 오픈 소스 C/C++ 정규 표현식 라이브러리를 찾고 있습니다.필요 : 유니 코드를하는 오픈 소스 C/C++ 정규 표현식 라이브러리

라이브러리를 ASCII, UTF-8 또는 UTF-16로 가져올 수있는 환경에서 사용하고 있습니다. UTF-16을 얻으면 필요한 인용 문자 (FF FE) 또는 (FE FF)가 있거나 없을 수 있습니다.

둘러 보았는데 PCRE 이외의 옵션이없는 것 같습니다.

두 번째 문제점은 현재 커다란 정규 표현식을 작성하기 위해 flex를 사용하고 있다는 것입니다. 이상적으로는 유니 코드를 처리하는 플렉스와 같은 어휘 표현 생성기를 사용합니다.

제안 사항?

+1

유니 코드 속성 지원 [Qt/C++ 정규 표현식 라이브러리] 가능한 중복 (http://stackoverflow.com/questions/2820367/qt-c-regular-expression-library-with-unicode-property-support) –

+0

사실, 그렇습니다. – vy32

답변

0

나는 Boost SpiritBoost Regex 모두 적어도 어느 정도 유니 코드를 지원한다고 생각합니다.