주어진 웹 사이트가 프로그래밍 방식으로 다른 언어로 번역되었는지 확인하려고합니다.웹 사이트가 다른 언어로 번역 된 경우 어떻게 감지합니까?
나는 es.domain.com, domain.es, domain.com/es 및 domain.com.es와 같은 다양한 조합을 사용하여 get 요청을 시도했습니다. 나는 거짓 포지티브를 없애기 위해 200을 반환하는 사이트에 대한 또 다른 요청을하고 있습니다 (웹 사이트는 영어 페이지 등을 렌더링합니다). 이러한 요청에 대해 저는 허위 URL (xyz123.domain.com, domain.xyz123, domain.com/xzy123)을 사용하고 상태 코드가 200이 아니며 본문이 비어 있지 않은지 확인합니다. 나는 여전히 오탐 (false positive)을 얻고 있습니다. 예를 들어, www.domain.com은 한 회사가 소유하고 www.domain.es는 다른 회사가 소유하고 있습니다. 따라서 www.domain.es에 대한 성공적인 응답을 얻는 동안 실제로 웹 사이트가 아닙니다.
누구든지 이것을 확인하는 방법에 대한 아이디어가 있습니까?
감사합니다.
정말 이에 대한 표준은 없습니다. 웹 사이트에 콘텐츠 나 메타 데이터의 번역 된 버전에 대한 링크가 포함되어 있지 않은 한 기본적으로 추측됩니다. 추측은 가양 성 (false positive)과 위음성 (false negative)을 초래할 것입니다. – David
http://stackoverflow.com/questions/5948465/meta-tags-for-different-languages? –