내 검색 응용 프로그램에서 posix c regex 라이브러리 (regcomp/regexec)를 사용하고 있습니다. 내 응용 프로그램은 멀티 바이트 문자를 사용하는 언어를 포함하여 다른 언어를 지원합니다. 단어 경계 메타 문자 (\ b)를 사용할 때 문제가 발생했습니다. 단일 바이트 문자열을 , 그것은 예를 들어, 잘 작동 : 정규식 및 쿼리 문자열이 멀티 바이트를하는 경우다중 바이트 문자열에 대한 정규식 단어 경계
그러나
"\ bpaper \ B"일치 "종이", 그것은하지 않는 것 제대로 작동하는, 예를 들면 :
"\ B 紙張 \ b"를 일치하지 않습니다 "紙張"
내가 실종 무엇인가? 어떤 도움을 주시면 감사하겠습니다.
요청 정보 :
- 프로그래밍 언어 : C
- 정규식 라이브러리 : GNU C (regex.h)
감사합니다.
RegExp에 어떤 프로그래밍 언어/라이브러리를 사용하고 계신지 말씀해주십시오. –
@Ferdinand : 요청 된 정보가 추가되었습니다. –