2014-12-12 1 views
0

주어진 웹 사이트가 프로그래밍 방식으로 다른 언어로 번역되었는지 확인하려고합니다.웹 사이트가 다른 언어로 번역 된 경우 어떻게 감지합니까?

나는 es.domain.com, domain.es, domain.com/es 및 domain.com.es와 같은 다양한 조합을 사용하여 get 요청을 시도했습니다. 나는 거짓 포지티브를 없애기 위해 200을 반환하는 사이트에 대한 또 다른 요청을하고 있습니다 (웹 사이트는 영어 페이지 등을 렌더링합니다). 이러한 요청에 대해 저는 허위 ​​URL (xyz123.domain.com, domain.xyz123, domain.com/xzy123)을 사용하고 상태 코드가 200이 아니며 본문이 비어 있지 않은지 확인합니다. 나는 여전히 오탐 (false positive)을 얻고 있습니다. 예를 들어, www.domain.com은 한 회사가 소유하고 www.domain.es는 다른 회사가 소유하고 있습니다. 따라서 www.domain.es에 대한 성공적인 응답을 얻는 동안 실제로 웹 사이트가 아닙니다.

누구든지 이것을 확인하는 방법에 대한 아이디어가 있습니까?

감사합니다.

+0

정말 이에 대한 표준은 없습니다. 웹 사이트에 콘텐츠 나 메타 데이터의 번역 된 버전에 대한 링크가 포함되어 있지 않은 한 기본적으로 추측됩니다. 추측은 가양 성 (false positive)과 위음성 (false negative)을 초래할 것입니다. – David

+0

http://stackoverflow.com/questions/5948465/meta-tags-for-different-languages? –

답변

0

하위 도메인을 쿼리하는 것은 웹 사이트 번역 여부를 확인하는 데 유효한 방법이 아닙니다.

웹 사이트가 번역되었다는 것을 나타내는 표준이 없으므로 모든 프로그래밍 기능이 정확하지 않을 수 있습니다.

표준이 구현 될 때까지 최선의 선택은 수행하는 것과 같은 무차별 방식이며 실제 사이트를 직접 확인하는 것입니다.

+0

고마워요, 그게 제가 생각한 것입니다. 우리는 다른 언어 버전 (Espanol, Francais 등)에 대한 링크를 홈페이지에서 검색하여 약간의 성공을 발견했습니다. –

+0

그래, 그게 최선의 방법이 될거야. lang 태그 등을 스캔하십시오. ... 언젠가 이것을 표준화에 넣을 것입니다. –

관련 문제