2012-01-05 6 views
1

계약자가 일련의 상점에 대한 설문 조사 데이터를 제공했습니다. 데이터에는 상점 번호, 미리보기 이미지 및 큰 이미지가 포함됩니다. 데이터는 계약자의 보안 웹 사이트를 통해 액세스 할 수 있습니다. 데이터에 대한 보고서를 작성하기 위해 각 이미지를 수동으로 다운로드하는 대신 사이트에서 상점 번호와 이미지를 긁어 내려고했습니다. 나는 보안 사이트와 cfhttp를 사용하지 않은,하지만 지금까지와 약간의 성공이 있었다CFhttp to Scrape Image

:

<cfhttp 
    method="post" 
    url="http://www.website.com/impart/client_login.php" 
    throwonerror="Yes" 
    redirect = "yes" 
    resolveUrl = "yes"> 

    <cfhttpparam name="user" value="myUsername" type="formfield"> 
    <cfhttpparam name="pass" value="myPassword" type="formfield"> 
    <cfhttpparam name="submit" value="Login" type="formfield"> 

나는 이미지가 포함 된 페이지로 인증을 통과하기에서 진행 어떻게 다운로드?

+0

완전한 대답을 제공하려면 먼저 타사 사이트의 인증에 대해 자세히 알아야합니다 (여기에서 릴레이하십시오). 손으로 사이트에 성공적으로 로그인하면 하나 이상의 쿠키 생성을 모니터링 할 수 있습니다. 그렇다면 보안 페이지에 대한 cfhttp 호출을 위해 쿠키의 이름과 값을 사용하십시오. 당신은 분명히 먼저 알아야 할 것입니다. 그렇지 않으면 대답은 순수한 추론을 기반으로합니다. –

답변

0

cfhttp 범위의 덤프는 어떻게 생깁니 까? 특히, 상태 코드는 무엇입니까?

상태 코드가 200이면 각 이미지를 가져올 때 세션을 유지해야합니다. 다음을 참조하십시오 :

http://www.bennadel.com/projects/cfhttp-session.htm

http://www.bennadel.com/blog/725-Maintaining-Sessions-Across-Multiple-ColdFusion-CFHttp-Requests.htm

는 cfhttp 태그를 통해 이미지를 저장하기 위해이 질문을 참조하십시오

Convert an image from CFHTTP filecontent to binary data with Coldfusion

+0

+1 나는 그저 똑같은 것이 좋습니다. – Micah

+0

Ben의 게시물을 간과했다고 생각할 수 없습니다. 방향에 진심으로 감사드립니다. 그것은 나에게 가장 진보를 아직 제공했습니다. – aparker81

+0

링크를 없애면 여기에 답변이 없습니다. Ben은 좋은 사람이고 훌륭한 정보를 제공하지만 퍼머 링크를 변경하거나 블로그를 종료하지 못하게하려면 어떻게해야합니까? 이 정보는 원래의 Asker를위한 것이 아니라 동일한 문제가있는 향후 독자를위한 것임을 기억하십시오. – ale

1

내가와 cfhttp이를위한 최선의 선택을하지 않을 수 있다고 생각합니다. 나는 바스 (BASH)를 잘한다. 따라서 말장난으로 스크립트를 작성하는 경향이 있지만이 페이지의 일부 제품은 더 쉬울 것이다. http://www.timedicer.co.uk/web-scraping?