나는 대학 미니 프로젝트의 초기 단계에 있으며 붙어 있습니다.Perl을 사용하여 HTML에서 데이터 추출

누구나 코드와 함께 "Perl을 사용하여 HTML 페이지에서 데이터 추출하기"의 기본 개념과 고급 개념을 알려주십시오.

yjrm이 아니라면 개념과 관련된 리소스를 살펴보고 나 혼자서 배울 수있는 경로를 보여주십시오.


use strict; 
use warnings; 
use autodie; 
use LWP::Simple; #For getting a websites HTML also see LWP::UserAgent 
use HTML::Tree; #Use a parser to parse HTML, read the docs on CPAN 

#Use LWP get a page's contents 
#We'll use the url to this question http://stackoverflow.com/questions/24858906/data-extraction-from-html-using-perl 
my $url = "http://stackoverflow.com/questions/24858906/data-extraction-from-html-using-perl"; 

#All the html will be in content 
my $content = get($url); 

my $p = HTML::Tree->new(); 

#parse the string in $content. You can also parse_from_file or parse_from_url 
#Though for learning sake you should get used to LWP 

#Check HTML::Element documentation for the data manipulation part 
my $post = $p->find_by_attribute('class', 'post-text'); 

#Should print your question out. 
print $post->as_text(); 

