2009-04-17 2 views
56

가능한 경우 사용자로부터받은 이메일을 받아 들여야하며, 그러한 주소로 메일을 보낼 때 예상되는 문제는 무엇입니까?이메일 주소에 국제 문자 (영어 이외의 문자)가 포함될 수 있습니까?

+4

그것은이 질문에 다시 질문했다 슬픈이다 [약 8 개월 후 (http://stackoverflow.com/ 질문/2049502/what-characters-are-allowed-in-email-address), 그리고 새로운 질문은 더 많은 표를 얻었지만, 거기에있는 모든 정보는 여기 정보보다 오래되었다. 나는 여기에 모든 답을 줄 수 있기를 바란다. –

답변

37

공식적으로, RFC 6532 - .

간단한 설명을 보려면 wikipedia을 확인하십시오.

+0

[RFC 5335 : 국제화 된 전자 메일 헤더] (http://tools.ietf.org) 외에 [RFC 6531 : 국제화 된 전자 메일 용 SMTP 확장명] (http://tools.ietf.org/html/rfc6531)을 확인하십시오./html/rfc5335) 또한 [국제 문자 (예 : 움라우트 문자)가 이메일 주소의 로컬 부분에서 유효합니까?] (http://stackoverflow.com/questions/15121359/are-international-characters-eg-umlaut-characters) -valid-in-the-local-part-of) –

+1

[RFC 6532] (https://tools.ietf.org/html/rfc6532) 및 자세한 내용 [여기] (http://stackoverflow.com)을 확인하십시오./a/31066998/2350426). –

+1

확실히이 스레드에서 @ BinaryZebra의 덧글을 참조하십시오. RFC-5335는 이제 폐기되었습니다. 그것의 후계자 인 RFC-6532가 현재의 표준입니다 (더 이상 실험적이지는 않습니다). – Nate

1

아직 없습니다. (가 내려 갔다으로) 여기, H-Online article: IEFT planning internationalised email addresses H-온라인에서 RfC: SMTP Extension for Internationalized Email Addresses

견적입니다 : IEEE는이 작업을 수행 할 계획에 대한

인터넷 엔지니어링 태스크 포스 (IETF)가 발표했습니다 세 가지 중요한 문서를 ASCII 문자 집합 외부의 기호를 포함하는 전자 메일 주소 머리글 의 표준화 즉, 곧 중국어 문자, 프랑스어 악센트 및 독일어 움라우트를 사용할 수 있습니다. 메시지의 본문뿐만 아니라 이메일 주소에도 포함됩니다. 따라서 귀하의 이름이 Zoë이고 façades를 만드는 회사에서 근무하는 경우 새 이메일 주소에 관심이있을 수 있습니다. 그러나 공급자의 대표자는 이미 신음하고있다. 유니 코드 표준 UTF-8이 인 경우 이 "업그레이드 매니아"가되어야한다고 말하면서 현재 일반 전자 메일 언어로 사용되는 정보 교환 (ASCII)에 대한 미국 표준 코드 을 대체합니다.

RFC 5335는 거의 모든 전자 메일 헤더에서 UTF-8을 사용하도록 지정합니다. 변경 사항은 SMTP 클라이언트, SMTP 서버, 메일 사용자 대리인 (MUA), 메일 링리스트 소프트웨어, 다른 미디어 게이트웨이, 및 이메일 처리 또는 전달되는 모든 곳에서 변경해야합니다. RFC 5336 은 SMTP 전자 메일 전송 프로토콜을 확장합니다. 프로토콜의 레벨에서 확장은 UTF8SMTP로 표시됩니다.

새로운 헤더 필드

는 업그레이드되지 않은 시스템에 의해 수신자에 도달하기 전에 을 던져 경우 에 "낙하산"의 종류가 UTF-8 이메일 연착륙을 보장으로 추가됩니다. "OldAddress"는 순전히 ASCII 주소입니다. 그러나 OldAddress는 을 두 번째 전송 시도의 채널로 사용하지 않고 을 보내 집으로 보내야합니다.

마지막으로 RFC5337은 비 ASCII 전자 메일의 배달 상태와 관련된 올바른 메시지가 전송되도록합니다. 도달 할 수없는 수신자 의 정확한 주소는 추가 전송 이 거부 된 경우에도 반송되어야합니다. 그룹의 전자 메일 주소 국제화 (EAI) 그룹도 다양한 헤더 필드와 봉투 에 대한 여러 가지 "다운 그레이드 메커니즘"을 수행하고 있습니다. 가능하면 원래의 머리글 정보를 "포장"하여 보존해야합니다.

".de"도메인의 등록 기관인 DeNIC는 그럼에도 불구하고 을 보급하고 있습니다. "우리가 할 수있는 일은 많지 않습니다."은 DeNIC 대변인 Klaus Herzig에 대해 설명했습니다.DeNIC은 국제 도메인 표준 인 RFC3490 또는 IDNA2003에 대해 IETF가 작업 중임을 알리기 위해 에 더 많은 관심을 기울이고 있습니다. Herzig은 " 하위 호환성이 없으므로 그다지 행복하지 않습니다. 업데이트가 나올 때, DeNIC은 심볼 "ß"뒤에 무게를 던질 것이라고 말했습니다 - 또한은 estzett로 알려져 있습니다 - 지금까지 간과 해 왔습니다. 또한 독일 등록 기관은 이전 버전과의 호환성이 부족한 것으로 알려지기 전에 잠깐 기다려야한다고 말합니다 ( ). 일단 새로운 표준이 으로 안정적으로 실행되고 등록 기관 및 제공 업체가이를 채택하면 ß 이 추가됩니다.

이와 대조적으로 전문가들은 중국에있는 중국 등록 업체와 대만 대만이 국제화 된 전자 메일에 대한 변경을 신속하게 구현할 것으로 믿고 있습니다. CNIC 및 TWNIC의 대표는 표준 작성자입니다. 중국인 사용자는 현재 중국어로 의 왼쪽에 ASCII로 이메일을 작성해야하며, 이미 중국어로 된 도메인의 경우 @와 그 오른쪽에 한자로 전자 메일을 작성해야합니다. 나는 최상위 도메인의 숫자 이후 네 가정 것이다

+1

"The H"가 종료됨에 따라이 링크는 죽었습니까? –

5

(모니카 Ermert는) 이미 도메인에 대한 비 ASCII에게 문자를 허용하고 도메인 이메일 주소의 일부이기 때문에, 그것은 완벽하게 가능 입니다. 이러한 도메인에 대한 예는 www.öko.de 될

1

짧은 대답 : 예

사용자 이름에서뿐만 아니라 도메인 이름뿐만 아니라

이 허용됩니다.

+0

전자 메일 주소의 로컬 부분에 움라우트를 이미 허용하는 메일 교환기/도메인을 알고 있습니까? – nanosoft

8

문제는 일부 메일 클라이언트 (서버 도구 및/또는 데스크톱 도구)가이를 지원하지 않으며 예를 들어 움라우트가있는 주소로 메일을 보내려고 할 때 '잘못된 전자 메일'예외가 발생한다는 것입니다.

완벽하게 지원하려면 이메일 주소 부분을 "punycode"로 변환해야합니다. 이를 통해 사용자는 일반적인 방법으로 주소를 입력 할 수 있지만 지원되는 수준의 방법으로 저장합니다.

예 : müller.com»xn--mller-kva.com

같은 일에 두 점을.

0

대답은 예이지만 특수하게 인코딩해야합니다.

Look at this. 이메일 헤더하고 RFC 2047

+0

전자 메일 주소의 로컬 부분에 움라우트를 허용하는 메일 교환기/도메인을 알고 있습니까? – nanosoft

13

업데이트 2015 참조하는 부분을 읽어 사용 RFC 6532 실험 5335가 사용되고 있지

: 6532
나중에 설정 한에 "분류 : 표준 트랙" ,
만들기 표준.

Section 3.2 (RFC 5322에 구문 확장)
포함 (적절한) UTF-8로 대부분의 텍스트 필드를 업데이트했습니다.

The following rules extend the ABNF syntax defined in [RFC5322] and 
[RFC5234] in order to allow UTF-8 content. 

VCHAR =/ UTF8-non-ascii 
ctext =/ UTF8-non-ascii 
atext =/ UTF8-non-ascii 
qtext =/ UTF8-non-ascii 
text =/ UTF8-non-ascii 
      ; note that this upgrades the body to UTF-8 
dtext =/ UTF8-non-ascii 

The preceding changes mean that the following constructs now 
allow UTF-8: 
    1. Unstructured text, used in header fields like 
     "Subject:" or "Content-description:". 
    2. Any construct that uses atoms, including but not limited 
     to the local parts of addresses and Message-IDs. This 
     includes addresses in the "for" clauses of "Received:" 
     header fields. 
    3. Quoted strings. 
    4. Domains. 

Note that header field names are not on this list; these are still 
restricted to ASCII. 


는 도메인의 명시 적 포함을 유의하시기 바랍니다.
그리고 헤더 의 명시적인 제외는입니다. 또한

주에 대한 NFKC :

The UTF-8 NFKC normalization form SHOULD NOT be used because 
it may lose information that is needed to correctly spell 
some names in some unusual circumstances. 

그리고 Section 3 시작 :

Also note that messages in this format require the use of the 
SMTPUTF8 extension [RFC6531] to be transferred via SMTP. 
관련 문제