2010-04-19 4 views
0

나는 파서를 처음 사용한다. 웹 사이트에서 특정 데이터를 가져 오는 것을 좋아합니다. 나는 그것을 위해 파서를 사용할 필요가있다. 파서를 시작하는 방법? 무엇을 다운로드해야합니까? Java의 파서를 사용하여 웹 사이트에서 데이터를 가져 오는 코드는 무엇입니까?자바 코드로 파서를 시작하기

답변

0

내 조언은 HTMLCleaner와 같은 오픈 소스 HTML 파서 사용하는 것입니다 - http://htmlcleaner.sourceforge.net/

이 추출하는 데 사용 후 웹 페이지 DOM의 표현을 만들 HTMLCleaner (또는 유사)를 사용하고, 수를 어떤 정보 당신은 웹 페이지에서 원합니다.

URL url = new URL("website you want to load"); 
HTMLCleaner h = new HTMLCleaner(); 
TagNode HtmlNode = h.clean(url.openStream()); 
//perform queries on the DOM to extract information 
:

과정은 다음과 같이 보입니다

관련 문제