2011-09-26 12 views
0

나는 구글이 구글의 즉석 미리보기에 등장하는 모든 웹 사이트를 어떻게 캡쳐하고 있는지 궁금해했다. (www.thumbalizr.com, websnapr.com, snapcasa.com, thumbshots.com과 같은) 섬네일 서비스를 사용하지 않고 자신의 소프트웨어를 사용하고 있다고 확신합니다. 그러나 : Google이 많은 웹 사이트를 캡처한다는 점을 감안할 때 매우 정교한 시스템이 있어야합니다. PLUS : 엄청난 양의 데이터를 생성합니다 (jpgs?). 누군가 Google이이를 어떻게 수행하는지에 대해 더 많은 통찰력을 가지고 있습니까?Google은 어떻게 인스턴트 미리보기 이미지를 만드나요?

답변

0

그것은 말할 어렵지만, 여기를 논의 구글 프로젝트 매니저에서 몇 가지 정보입니다 :

는 "우리의 인덱스와 검색 결과 :

http://googleblog.blogspot.com/2010/11/beyond-instant-results-instant-previews.html

그것은 부분적으로 말한다 전체 웹에서 각 웹 페이지의 관련 부분을 식별하고 함께 꿰매고 에있는 검색 결과에 맞게 사용자 정의 된 검색 결과를 제공하십시오. "

미리보기 페이지의 소스를 살펴보면 JPEG Base64 이미지 문자열을 스크린 샷으로 제공하기 위해 자신의 색인 (캐시 된 페이지를 제공하는 데 사용되는 동일한 webcache.googleusercontent.com)을 사용하고 있음을 알 수 있습니다. .

+0

나는 당신을 올바르게 이해하고 있는지 확인하기 위해 실제로 웹 사이트의 HTML 코드 (플러스 이미지)를 가져 와서 최종 사용자에게 JPEG로 푸시한다고 생각하십니까? – memyself

1

예, 그렇습니다. 그들의 웹마 스터 페이지는 크롬이 사용하는 것과 동일한 엔진으로 페이지를 렌더링한다는 것을 암시하며, 미리보기는 결과를 기반으로합니다.

관련 문제