2011-05-06 6 views
0

나는 자바로 시도한 적이없는 새로운 프로젝트를 시작하고 있으며 직접 연구 해왔다. 저의 연구는 제가 시작한 곳보다 훨씬 더 많은 것을 얻지 못했습니다.자바 - 웹 페이지에서 텍스트 가져 오기

  • 웹 사이트를 검색 해당 데이터가 (기본적으로 사용자의 입력이 다음 해당 결과를 반환하는 쿼리 의 기반 의 검색 엔진을 검색 할) 수 :

    는 기본적으로 내 프로젝트는이 작업을 수행합니다 결과 다음 중 하나에

  • 사용자가 클릭하는 프로그램 특정
    값을 표시한다 (값은 0이 될 것이다 결과의 웹 페이지)

지금까지 내가 종류의이 작업을 수행하는 방법에 대해 알고있는 모든 웹 스크래핑입니다. 나는 어떤 예도 찾을 수 없었기 때문에 나는 이것에 대해 어둠 속에 아직도 머물러있다.

정말 가능한가요? Android SDK와 함께 Java를 사용하게 될 것입니다. 나는 종류의 아이디어를 가지고 있지만, 내 자바 지식 등, 고급의

감사합니다, 물론 브랜든

답변

1

Nutch는 훌륭한 도구이지만 작은 프로젝트의 경우 과소 평가 될 수 있습니다. http://java.net/projects/crawler/sources/svn/content/trunk/src/examples/com/torunski/crawler/examples/ExampleDownloadWithHTMLParser.java?rev=429

당신은 아마 당신의 프로젝트에이 드롭 할 수 있으며 10 분에서 긁어 수 : 당신이 이해하기 정말 신속하고 더러운 쉽게 뭔가를 찾고 있다면 당신은

여기 사용의 예를 볼 crawler 조사한다

+0

감사합니다. 그들 모두를 들여다 볼 것입니다. – Brandon

0

것이 가능를 웹 페이지와 아무 포함되어 있지 않습니다. 아마도이 라이브러리는 Apache Nutch 일 것입니다. Lucene과 같은 강력한 라이브러리 스택을 기반으로하며 매우 성숙합니다. 자습서를보고 빠른 정보를 얻기 위해 필요한 모든 정보를 찾을 수 있습니다.

관련 문제