X # 문자 = Y # 바이트를 알아내는 좋은 추정치/전환/공식은 무엇입니까?바이트 문자들
바이트 문자들
답변
전적으로 인코딩 및 잠재적으로 데이터에 따라 다릅니다.
UTF-16의 경우 모든 문자가 Basic Multilingual Plane에 있음을 알고 있으면 대답은 바이트 = 2 * 문자가됩니다.
UTF-8의 경우 모든 것이 ASCII 범위에 있으면 바이트 = 문자입니다. 그러나 극동 문자가 많으면 바이트 = 3 * 문자만큼 많을 수 있습니다. 다국어 화면).
다른 인코딩에는 분명히 다른 시나리오가 있습니다. 자신의 상황 (및 플랫폼)에 대해 더 자세히 설명해 주시겠습니까? 실제 문자를 기반으로 정확한 계산 값을 원하십니까? 인코딩 할 텍스트에 대해 아십니까?
UTF-8은 단일 문자에 대해 최대 4 바이트를 사용할 수 있습니다. –
@Christoffer : BMP 내조차도? http://www.cl.cam.ac.uk/~mgk25/unicode.html#utf-8에 따르지 않음 –
ANSI의 경우 1 바이트는 char이지만 유니 코드의 경우 char 당 2 바이트라고 생각합니다. 아마도 다중 바이트 패턴이있을지라도.
- 1. 네트워크 전송을위한 NSString의 추가 문자들
- 2. 내 UTF8 문자열의 장고 문자들
- 3. 자바 : 바이트 []에서 바이트 []
- 4. C# 캐스트 바이트 [*, *, *]를 바이트 []
- 5. PHP 수정 이미지 바이트 바이트
- 6. int 바이트 스트림을 float 바이트 스트림으로 변환합니다.
- 7. 2 바이트 문자 또는 1 바이트 문자
- 8. 바이트 x에서 바이트 y까지의 Java readFile
- 9. 어셈블리 코드 저장 바이트 /로드 바이트
- 10. 파일은 0 바이트 (0 바이트)로 저장됩니다.
- 11. VB.NET의 바이트 배열에서 4 바이트 가져 오기
- 12. 바이트 배열에서 첫 번째 16 바이트 제거
- 13. 바이트 배열 & 바이트 버퍼를 사용할 때?
- 14. SQL varbinary에서 바이트 서비스를 제공하는 바이트
- 15. C#에서 구조체의 바이트 직렬화에 대한 바이트
- 16. Java : 바이트 배열을 바이트 배열로 변환
- 17. 바이트 직렬화
- 18. 바이트 스트림
- 19. 바이트 검색 [
- 20. 읽기 바이트 ++
- 21. 개체를 바이트 []
- 22. 교체 바이트
- 23. MD5는 4 바이트 및 8 바이트 키를 16 바이트 값으로 해시합니다. 충돌의 기회는 무엇입니까?
- 24. 8 바이트 일반 텍스트의 DES 암호화 결과는 16 바이트 배열입니다.
- 25. 폴더를 바이트 []로 변환하고 다시 바이트 []를 폴더로
- 26. 바이트 안드로이드에서 이미지의 바이트 표현에 대한 픽셀 당 가치
- 27. "1 바이트 UTF-8 시퀀스의 잘못된 바이트 1"오류
- 28. tiff 바이트 배열을 C 바이트로 itextsharp를 사용하여 바이트 배열로 변환
- 29. 바이트 []를 바이트 버퍼 원시 메모리로 변환하는 방법은 무엇입니까?
- 30. 인스트루먼트 ObjectAlloc : 라이브 바이트 및 전체 바이트 설명
전적으로 사용하는 문자 인코딩 체계에 따라 다릅니다. 어느 쪽을 사용하고 있습니까? –
MySQL ...? > _o –
MySQL의 기본 인코딩은 Latin-1이므로 변경하지 않으면 문자 당 1 바이트이지만 매우 제한된 문자 집합 만 저장할 수 있습니다. UTF-8 사용을 고려하십시오. – bobince