2012-07-19 2 views
8

일부 언어는 힌디어, 러시아어 또는 일본어와 같이 라틴 문자로 허용 된 음역을 사용합니다. 예를 들어, Devinagari 스크립트에 쓰여진 'The man is eating'이라는 힌디는 'आदमी खा रहा है.'입니다. 말문을 열면 'Aadmi kha raha hai'가됩니다. (또는이 비슷한 접근법은 사람들이 힌디어 키보드에 액세스 할 수없는 경우 특히 온라인에서 자주 사용됩니다.)lon 속성을 소리 나는 발음과 함께 사용하는 올바른 방법은 무엇입니까?

이 경우 Google은 라틴어 스크립트를 사용하지만 힌디어를 계속 쓰고 있습니다. lang 속성을 사용하여 하나의 변화를 표시하는 것이 허용 :

<span lang="hi">आदमी खा रहा है।</span>또는<span lang="hi">Aadmi kha raha hai.</span>

내 질문이 정상적으로 라틴 알파벳 자체에 기록 된 언어에 대해,하지만이 아닌 스피커의 음성 가이드가있을 수 있습니다/학습자 - IPA 또는 특별 발음 - 가장 좋은 실습이 있습니까? 세속적 인 의미를 부여하는 측면에서 ce?

예를 들어, "사람이 먹고있다"고 말하면 아일랜드 사람에게 "나는 두려워 할 것"이라고 말할 것입니다. 내가 아닌 스피커의 발음 가이드를 제공한다면 내가 "지금까지 예를 들어 IH-그는에 TAW"을 말할 수도,

<span lang="ga">Tá an fear ag ithe.</span>

: I는 다음과 같이 이것을 표시 할 수 있습니다. 문장은 의미가 없으며 (예 : 'lorem ipsum'텍스트) 영어 나 아일랜드어 문장도 없습니다.

이 경우 HTML에서 언어 관련 특성의 올바른 사용은 무엇입니까? 아니면 현재이 사양에서 다루지 않은이 유스 케이스입니까?

+0

아일랜드를보기 에 SO :) –

+1

@ Darragh 생각 집 근처에 예제를 사용하지 마십시오 :) – anotherdave

답변

5

짤막한 버전 : 라틴 알파벳으로 구체적으로 말하고 싶다면 입력 한 예에 대해 "hi-Latn"또는 "ga-Latn"으로 이동하십시오.

긴 버전 :

The W3C spec for the lang attribute 특별히이 언급하지 않습니다 - 그것은 (예 : 사용되는 문자의 고품질 버전을 렌더링하기 위해 그것을 사용하는 등) 맞춤법에 따라이 중 일부 사용을 제안하지만, 일부 (검색 엔진과 같은).

RFC1766은 언어 태그의 형식을 지정하며 태그의 특수화를 사용하여 "az-arabic 및 az-cyrillic 같은 스크립트 변형"을 나타낼 수 있음을 나타냅니다. 스크립트 하위 태그 in this article on the W3C site에 대한 자세한 내용과 약간의 추가 내용은 the later RFC5646입니다. 그 중 하나는 ISO standard list of script names을 가리키고, 그 목록에서 다른 스크립트의 로마식 형식이기 때문에 원하는 스크립트를 "Latn"이라고합니다.

(이것은 당신이 음역을 어떻게했는지 병음 대 웨이드 - 자일스를 사용하여 라틴어 스크립트에서 하나 이상의 표준 예를 들어 중국어를 할 수 있습니다 언어,하지만, 지정 같은 것들을 포함되지 않습니다.) 흥미 롭

+0

감사합니다. 흥미로운 점은'-Latn' 접미어입니다. 내가 힌디어 대 힌디를 만들려고했던 차이점은 아일랜드 인이 기본적으로 라틴어라는 것입니다. 그래서 힌디어를 음역 할 때, 그것은 새로운 스크립트에서 음성 학적으로 철자가 붙여지고 여전히 '힌디어'로 간주됩니다. 아일랜드어 (또는 프랑스어/독일어/기타)와 같이 이미 라틴어로 된 언어의 소리 나는 철자는 어느 언어로 간주 될 수없는 것을 렌더링합니다. 링크를 가져 주셔서 감사합니다, 나는에 대한 새로운 숙제를 읽어 보았습니다. – anotherdave

+1

보너스 : 당신이 아이리쉬 텍스트를 위해 준 표준 철자법이 얼마나 표준인지 모르겠지만 http : //www.iana. org/assignments/language-subtag-registry에는 IPA (ga-fonipa) 또는 X-SAMPA (ga-fonxsamp)에있는 경우 사용할 수있는 변형 태그가 있습니다. – bouteillebleu

+0

완전히 100 % 표준이 아닙니다. 와우, IPA 표준을 사용하는 것과 마찬가지로 재미 있습니다. 완벽 할 것입니다. 또한 그 페이지에서 비표준 변종에도 사용할 수있는'Zyyy'와'Zzzz' 변종 (각각 '미정의 스크립트'와 '코딩되지 않은 스크립트')이 있음을 알 수 있습니다. – anotherdave

0

<ruby>으로 표시하는 것이 좋습니다. 예를 들어

:

<ruby lang="hi">आदमी<rt>Aadmi</rt> खा<rt>kha</rt> रहा<rt>raha</rt> है।<rt>hai</rt></ruby> 
+2

틀림없이 나는 전문가는 아니지만 이것은 대답처럼 보입니다. downvoter 제발 의견을 수 있습니까? (어쩌면 그것은 형식에 관한 것일뿐입니다 - 그 대답은 단순한 링크가 아닌 좀 더 자세한 내용을 제공 할 수 있다는 것에 동의합니다) –

+0

대답은 언어 마크 업과 관련된 질문과는 아무런 관련이 없습니다. –

+1

@Jukka ''* *에 대한 언어 마크 업/발음 가이드가 아닙니까? –

3

가장 실용적인 목적을 위해, 그것은 중요하지 않습니다, 일반적으로 lang 속성을 무시 브라우저, 검색 엔진 및 기타 관련 프로그램 때문이다. 속성은 글꼴 선택에 영향을 줄 수 있지만 페이지 자체가 글꼴을 제안하지 않는 경우 (드문 경우)에만 가능합니다. 일부 음성 브라우저는 lang에 대한 몇 가지 값을 인식하고 그에 따라 기능을 조정합니다. 또한 MS Word에서 HTML 문서를 열면 lang 마크 업을 인식하고 언어 별 맞춤법 도구를 적용합니다. 그러나이 모든 것은 다소 제한적이며 거의 중요하지 않습니다. 또한 이러한 경우 가장 간단한 유형의 언어 코드 만 인식됩니다.

원칙적으로 라틴어와 Devanagari와 같은 필기 시스템 ("스크립트")과 사용 된 음역 시스템 또는 필사체 시스템을 나타낼 수 있습니다. 이것은 BCP 47에 설명되어 있습니다. 그러나 그것의 대부분은 구현 자의 지침이며, 지금 여기서 사용할 수있는 것이 아닙니다.

예를 들어 내용이 힌디어로 표시되었지만 라틴 문자로 표시되어 있다고 표시하려면 <span lang="hi-Latn">Aadmi kha raha hai.</span>을 작성할 수 있습니다. 그리고 원칙적으로 경쟁 로마 제 시스템 중 어느 것이 사용되었는지를 나타내는 방법이 있습니다. 웹 관련 소프트웨어가 전혀 인식되지 않는다고 생각합니다 lang="hi-Latn"; lang="hi"을 인식하더라도 프로그램이 인식하지 못할 수도 있습니다.

lang에 대한 자세한 값을 사용할 수는 있지만 많이 사용하지는 않습니다.다른 언어 (예 : 한 문장 이상)의 모든 대문자 조각에 대해 lang="hi"과 같은 단순한 마크 업을 사용하는 것은 좋은 습관입니다. 그것에 너무 많은 시간을 보내기 전에 당신이 기대할 수있는 실질적인 이익을 고려하십시오. 예를 들어 hyphenate.js과 같은 클라이언트 측 하이픈을 사용하면 lang 마크 업이 필수적입니다. 그런 다음 일반 사양이 아닌 해당 소프트웨어의 기대치를 확인해야합니다.

경고 단어 : 라트비아어로 된 러시아어로 lang="ru"을 사용하면 이상한 결과가 나타납니다. 그 이유는 브라우저가 "러시아어 용 글꼴"이라는 아이디어로 전환하여 글꼴이 혼합되기 때문입니다. 그러나 간단한 해결 방법은 모든 텍스트에 일관된 글꼴 설정을 지정하고 브라우저 기본값을 무시하는 것입니다.

"Taw on far 예 : ih-he"와 같은 문자열은 의미있는 의미로 일부 언어로 분류 될 수 없습니다. 언어 마크 업을 사용하는 경우 lang="" (값으로 빈 문자열 포함)을 사용하십시오. 언어가 명시되어 있지 않음을 명시 적으로 나타내는 방법이기 때문에!

+0

감사합니다. 빈 lang 속성을 제공 할 수 있는지 몰랐습니다! 검색 엔진이 lang 속성을 무시한다는 사실과 관련하여 링크가 있습니까? 나는 항상 Google 등이 고급 설정 (프랑스어 등의 결과 표시)을 사용했다고 생각했습니다. – anotherdave

+0

검색 엔진에서 'lang' 속성을 사용한다고 말하는 것이 일반적이지만 그 증거는 없습니다. 테스트 결과 아무런 효과가 없음을 시사합니다. 검색 엔진과 관련된 사람들의 비공식적 인 진술에 따르면'lang' 속성은 너무 신뢰할 수없고 종종 잘못되었습니다. 왜냐하면 어떤 저작 시스템은 저자에게 묻지 않고'lang = "en"'을 방출하기 때문입니다. 검색 엔진은 콘텐츠에서 언어를 추측 할 수 있습니다. –

+0

lang 특성은 내게 필요한 옵션에 중요하며 WCAG 2.0 요구 사항입니다. 화면 판독기는 lang 속성의 값을 사용하여 재생 중에 사용할 올바른 음성 및 소리 나는 엔진을 결정합니다. – charlieb

관련 문제