2013-08-01 2 views
0

먼저 이것이 일반적으로 어떻게 이루어질 수 있는지 알고 싶습니다. 그리고 나서 누군가가 Capybara를 사용하여이를 수행하는 방법을 알고 있습니다.유용하지 않은 (임의의) 이미지 추출 src = 웹 페이지에서

예 : 이는 src은 이미지 자체가 아닌 임의의 이미지를 반환하는 스크립트를 가리 킵니다. 페이지가로드되고 스크립트가 실행되고 이미지가 표시됩니다. src 값을 쉽게 얻을 수 있지만 이미지를 다운로드하는 링크에 액세스하면 스크립트가 다시 실행되어 전혀 다른 그림을 반환합니다. 이미 페이지에있는 것이 필요합니다.

+0

이 문제를 해결하기 위해 작성한 코드를 보여줘야합니다. http://meta.stackexchange.com/questions/156810/stack-overflow-question-checklist –

+0

입력 HTML의 예는 무엇입니까?를 참조하십시오. 결과로 얻을 것으로 예상되는 것은 무엇입니까? –

+0

수정 내용을 확인하십시오. 현재 명확한 코드가 표시됩니다. –

답변

0

JS 또는 Capybara를 사용하면 프로세스가 매우 유사하다고 생각합니다. 나는 두 단계로 나누었습니다.

  1. <img> 태그를 찾을 수있는 선택기를 작성하십시오. 반환 된 노드에서

    myImg = document.getElementByTagName("img") 
    
  2. 전화 .src : JS처럼 보일 수 있습니다 그

    result = myImg.src 
    

나는 카피 바라가 XPath와 CSS 선택기로 제한 믿습니다. 그러므로 긁어 모으려는 페이지에 따라 HTML 태그 또는 CSS 속성에서 어떤 종류의 패턴을 식별하여 <img> 태그를 찾아야합니다.

+0

선택기를 쓰는 것은 문제가되지 않습니다. 그러나 .src는 단지 내 예제에서와 같이'src'의 값을 반환하지 않을까요? –

+0

나는 그 질문을 이해할 수 없다. –

관련 문제