AWS s3 버킷에서 UTF-8 형식의 파일 이름으로 작업 할 때, 파일에 링크 된 일부 인용 된 파일 이름 s3 버킷에서) 내 파이썬 애플 리케이션 (나는 boto 라이브러리를 사용하여)의 코드에 의해 인용 된 동일한 파일 이름 다를 수 있습니다. 내가 알기로 그들은 다른 normalization forms of unicode으로 인해 다르며 unicodedata.normalize을 사용하면 문제가 사라집니다. 내가 AWS (NFC
, NFKC
, NFD
또는 NFKD
)에 의해 사용되는 정규화 형태에 대한 정보를 찾을 수없는, 그래서 나는 정보, 감사 것을 제공 trasted 소스의 suggestance 감사 높은 것입니다 그러나AWS S3 용 유니 코드 정규화 형식이란 무엇입니까?
.
S3가 개체 키를 전혀 정규화하지 않는 것처럼 보입니다. 당신은 예제 코드 포인트 시퀀스와 그것이 변환하는 시퀀스를 제공 할 수 있습니까? –