2012-04-19 4 views
0

일부 사이트의 제품 이미지를 스크랩해야합니다. 자바 스크립트를 사용하여 스크랩했습니다. 지금까지 나는 성공적으로 내가 또한 문서에서 가격을 긁어 할 자바 스크립트를 사용하여 가격을 긁음

var images = document.images; 

for (var i = 0; i < images.length; i++) { 
    img = images[i]; 

아래처럼 이미지를 근근이 살아가고있다. 나는 이것이 가능하다는 것을 알고 있으며 일부 사이트는 이미 이것을하고 있지만 확실하지는 않습니다. 문서 텍스트를 통해 "가격"문자열을 일치시키는 것과 같은 일이 가능할 수는 있지만 확실하지는 않으며 더 좋은 방법이 있습니다. 포인터가 있습니까?

+0

"스크랩"보다는 "스크랩"을 의미한다고 가정합니다. –

+0

스크랩으로 무엇을 의미합니까? : S – mattytommo

+1

@mattytommo 그는 PHP에서 우리가 file_get_contents()를 사용하고, 반환 된 obj/string ..을 횡단하여 웹 페이지를 가져 오는 중임을 의미합니다. –

답변

1

문제의 페이지에 대해 얼마나 알고 있는지에 따라 다릅니다. 시각 장애인이라면 항상 document.body.innerHTML.match(/£\d+\.\d+/g) (또는 통화에 따라 유사) 무언가를 사용할 수 있습니다. 어느 쪽이든, 당신은 페이지의 패턴을 찾아서 일치시키고 거기에서 가격을 얻고 싶을 것입니다.

보너스 포인트 : Google Base 피드 (비보호)가 있는지 확인하십시오. 얼마나 많은 사람들이 놀랍습니까? 이것은 (보통) 당신이 필요로 할 수있는 모든 것을 가진 XML 피드가 될 것입니다.

+1

나는 당신이 말하는이 'google 기본 피드'를 조사해야 할 것입니다. – rlemon

+0

@leonard, 당신의 대답은 흥미로운 것 같습니다. 여기에 정의한 정규 표현식의 의미를 설명해 주시겠습니까? 미안 정규 표현식의 초보자입니다. 나는 구글 피드를 더 보게 될 것이다. 정확하게 그것이 무엇인지 모릅니다. – asm234

+0

regex (정규 표현식)에 대한 훌륭한 소개 : www.regular-expressions.info/ Google Base는 Google 쇼핑/제품의 또 다른 이름입니다. Google Base는 판매자가 제공하는 제품을 Google에 알려주고 Google이 해당 제품을 통해 쇼핑 웹 사이트. 피드 (일반적으로 CSV)를 통해이 정보를 제공합니다. 때로는 알아낼 수도 있고 추측 할 수도/이러한 피드에 대한 액세스를 요청할 수도 있습니다. 이렇게하면 삶이 훨씬 쉬워집니다. – LeonardChallis

관련 문제