"C"에서 "go"언어에 대한 렉서를 코딩하려고합니다.하지만 UTF-8을 문자 세트로 사용하고 C는 Ascii를 사용했습니다. 그렇다면 유니 코드 문자를 ascii로 표현할 수 있습니까?ASCII로 UTF-8을 표현합니다.
0
A
답변
0
C는 multibyte strings을 지원하지만 작동하려면 로케일을 사용해야합니다.
ASCII는 실제로 UTF-8의 하위 집합이므로 표준 C 단일 바이트 문자열 기능을 어느 정도 사용할 수 있습니다. 길이를 요구하거나 리턴하는 함수는 문자 수가 아닌 바이트 수임을 기억하십시오.
더 복잡한 것이면 외부 라이브러리가 필요합니다.
+0
당신은 그것을 언급했지만, 나는 이것을 강조하고 싶다 : C 멀티 바이트 문자열 처리는 로케일에 민감하다! – DarkDust
관련 문제
- 1. SSRS에서시/분 형식을 표현합니다.
- 2. 암에 많은 수를 표현합니다.
- 3. mysql에서 utf8을 구성하십시오.
- 4. Utf8을 유니 코드로 변환
- 5. mySQL에 UTF8을 설정하십시오.
- 6. 기본적으로 utf8을 처리하는 스트림
- 7. UTF8을 ANSI로 변환 하시겠습니까?
- 8. UTF8을 Windows-1252로 변환
- 9. glib에 utf8을 인쇄하십시오
- 10. 플래시에 utf8을 표시 하시겠습니까?
- 11. Phalcon UTF8을 준수합니까?
- 12. PowerShell 스크립트가 UTF8을 얻으려고합니까?
- 13. 라우팅은 템플릿 엔진없이 ng2로 표현합니다
- 14. django에서 많은 모델을 json으로 표현합니다.
- 15. 배열을 Jama를 사용하여 배열로 표현합니다.
- 16. Show는 C처럼 데이터를 엑셀로 표현합니다.
- 17. jwplayer 비디오를 상자보다 작게 표현합니다.
- 18. ASCII로 음역 변환하는 중
- 19. ASCII로 CRLF로 CSV 파일
- 20. 스캔 코드를 ASCII로 변환
- 21. ASCII 유니 코드에서 ASCII로
- 22. EBCDIC 코드를 ASCII로 변환
- 23. 이진 파일을 ASCII로 해석하기
- 24. Char를 ASCII로 변환
- 25. Ascii로 변환이 실패합니다 &
- 26. stringbinary를 ascii로 변환
- 27. 문자열을 ascii로 인코딩
- 28. 음수를 ASCII로 변환
- 29. LISP에서 CHAR를 ASCII로 변환하십시오.
- 30. 어셈블리에서 숫자를 ASCII로 변환
음, [UTF-7] (http://en.wikipedia.org/wiki/UTF-7)이라는 인코딩이 있지만 C가 다른 비 ASCII 인코딩을 처리 할 수없는 이유는 무엇입니까? –
[Project ICU] (http://site.icu-project.org/)는 C와 C++ 및 Java에 대한 유니 코드 처리의 이식 가능한 구현을 제공합니다. – DevSolar
@TimPietzcker : Erm, 그는 명백한 이득이 없으면 UTF-8에서 UTF-7로 변환해야합니다. 이 세월 동안 나는 전자 메일 외의 UTF-7 사용을 전혀 보지 못했습니다. – DarkDust