2013-07-14 8 views
1

당신은 내 질문을 소유하고 있지 않습니다. 너는 그렇게 생각한다.Perl - 기계식

우리는 이제 동의해야합니다. 아무 것도 고약하지 않습니다.

감사합니다.

+1

코드가 사용되지 않는다고 말하는 doc blurp에 대한 링크를 제공하는 데주의해야합니까? – innaM

답변

3

설명서가 잘못되었습니다. LWP, URI, WWW :: Mechanize, HTML :: TokeParser 중 어느 것도 사용되지 않습니다. Mechanize는 크롤링에 일반적으로 잘 작동합니다. 나는 HTML : TokeParser를 선언적 방식으로 HTML 파싱을 처리하는 것으로 대체 할 것이다. - Web::Query이 훌륭하다. HTML::TreeBuilder::XPath이 좋다.

그러나 귀하의 코드 예와 관련하여 : Google의 사용 약관은 스크래핑을 금지합니다. 대신 their API을 사용하십시오!

+0

저에게 그 자리를 보여주세요, 나는 그것을 직접 읽고 싶다. – daxim

+0

Selenium 사용은 다음과 같은 경우에 좋습니다. 1. Perl 외부에서 액세스 할 수있는 표준 인터페이스 (예 : WebDriver)가 필요합니다. 2. LWP가 아닌 백엔드를 원한다. chromedriver, phantomjs 또는 Java HtmlUnit. – daxim