일부 라이브러리 또는 방법을 사용하여 웹 페이지를 수동으로 탐색 할 때 실시간으로 웹 페이지를 스크래핑하는 방법이 있습니까? 내가 알고있는 대부분의 스크래퍼는 브라우저를 에뮬레이트하는 브라우저 객체를 생성합니다. 물론 브라우저를 열면 브라우저가 생성하는 것보다 다를 것입니다.수동으로 탐색 할 때 웹 페이지 스크랩
해결 방법이 없다면 HTML5 게임의 요소를 긁어내어 지능형 에이전트를 만들려고합니다. 나는 더 자세히 설명하지는 않겠지 만, 다른 사람들이 미래에 똑같은 일을 시도한다면 (또는 실제 사용자와의 실시간 스크랩), 이것에 대한 해결책이 그들에게도 유용 할 수 있다고 생각합니다.
미리 감사드립니다.
고마워요. 저는 컴퓨터 비전 유형의 물건을보고 있었지만 그렇게하지 않아도되고 싶지 않았습니다. 내 경우에는 - 특히 긁어 내야하는 정보 하나, 브라우저 플러그인으로 할 수는 있지만 제안 된대로 양말을 들여다 보았고 다른 사람들이없는 경우 좋은 대안으로 보입니다. 선택권. – Joker
셀렌과 다른 브라우저 테스트 프레임 워크는 SOCKS 옵션보다 더 쉽습니다. 난 당신이 셀렌과 다른 많은 언어를 사용하여 다른 사람을 운전할 수있을 것 - 꽤 파이썬, 펄, C#, 루비에 대한 후크를 가지고 확신 ... 내 생각 엔 당신이 특정 개체의 존재 또는 부재를 찾고 있습니다 DOM을 들여다 보면 HTML과 JavaScript 및 기타 트래픽을 구문 분석하고 진행 상황을 추론하는 것보다 쉬울 수도 있습니다. 반면 게임에 잘 정의 된 읽기 쉽지 않은 암호화되지 않은 프로토콜이 있으면 프록시가 좋습니다. – leander