어제 비슷한 질문을했지만 다른 방식으로 리 페이즈해야한다는 것을 알고 있습니다.Windows에서 C++의 유니 코드에서 대/소문자를 구분하지 않는 검색
짧게 : Windows의 C++에서 문자열이 유니 코드 형식 (와이드 char, wchar_t) 일 때 대/소문자를 구분하지 않고 문자열을 검색하려면 어떻게해야합니까? 문자열의 언어 나는 건초 더미에 바늘이 있는지 여부를 알고 싶습니다. 바늘의 위치는 나와 관련이 없습니다.
배경 : 이메일 본문이 많은 저장소가 있습니다. 메시지는 다른 언어 (일본어, 독일어, 러시아어, 핀란드어로되어 있습니다)에 있습니다. 모든 데이터는 유니 코드 형식이며, C++ 응용 프로그램에서 와이드 문자열 (wchar_t)에로드합니다 (시체는 MIME 디코딩되어 있으므로 디버거에서는 실제 일본어, 독일어 문자를 볼 수 있음). 전자 메일 메시지에는 세부 정보가 포함되어 있지 않으므로 메시지의 언어를 모릅니다. 또한 단일 전자 메일 본문에는 여러 언어의 문자가 포함될 수 있습니다.
나는 wcsstr과 같은 것을 찾고 있지만, insensitve 방식으로 검색을 수행 할 수있는 능력이 있습니다. 나는 텍스트의 언어를 모른 채 대문자에서 소문자로 100 % 적절한 변환을 할 수 없다는 것을 알고있다. 나는 가능한 99 %의 경우에 작동하는 솔루션을 원합니다.
Visual Studio 2008과 C++, STL 및 Boost를 함께 사용하고 있습니다.
Iiİı 문제가 증명할 때 이상을 무시하고 싶습니다. 당신은 실제로 정확하지 않은 일치를 원한다. 예를 들어 é = e를 원한다. 그리고 æ = ae, 그래서 당신은 문자 단위로 이것을 할 수 없습니다. – MSalters