2012-06-16 3 views
0

임 난 점 열을 읽고에 의해 그것을 나눌 예를 들어 축구 리그 테이블 데이터읽기 다른 웹 페이지에서 데이터를 분석하고 내

http://www.skysports.com/football/league/0,19540,11660,00.html

를 얻는 간단한 웹 페이지를 만들려고 노력에 삽입 내 웹 페이지에 인쇄 할 게임 열당 평균 점수를 얻으려는 게임의 수.

온라인으로 어떻게 할 수 있습니까?

Im C/Matlab과 같은 오프라인 프로그램에서이 작업을 수행하는 데 꽤 경험이 있지만 온라인으로 어디서부터 시작해야할지 몰라요.

감사합니다.

+0

Perl은 html 또는 xml을 웹 스크랩하고 파싱하는 데 유용한 도구입니다. 나는 많은 웹 사이트에서 수행하고자하는 일을 정확하게 수행했으며 LWP를 사용하여 펄을 사용하여 모든 작업을 완료했다. :: 간단한 패키지와 기본 정규식 패턴 매칭 – mathematician1975

+0

다른 언어를 추천한다면 파이썬과 루비는 각각이 훌륭한 패키지를 많이 갖고있다. 목적 : – Amro

+0

죄송합니다, 자바 태그를 참조하십시오. 그는 일반적인 웹 스크랩 옵션을 찾고 있다고 생각했습니다. – mathematician1975

답변

0

브라우저 측에서 클라이언트 측에 제안하지 않겠습니다. 이 단계에 따라 (예를 들면, 자바를 사용하여) 서버 측에 스크랩하기 쉬울 것입니다 :

  1. 잡아 웹 페이지의 내용 (스카이 스포츠) 원하는 컨텐츠 부분을 찾을 수 정규식
  2. 를 사용하여 기존의 HTML 마크 업.
  3. regex를 사용하여 레코드 (tr) 및 필드 (td)를 가져 오는 스트립/분할 HTML 마크 업입니다.
  4. 값을 전송하고 수학을 수행합니다.
  5. 결과를 사용하여 html 또는 json 등의 버전을 생성하십시오.
  6. 생성 된 컨텐츠를 클라이언트에 제공하십시오. 일반적으로 폐기에

는 쉽지만 언제든지 (경고 없음)에서 변경 될 수 있습니다 소스 HTML 마크 업으로 내일을 보장 할 수 없습니다.

원하는 경우 C#으로 기본 샘플을 제공 할 수 있습니다. (미안하지만 1997 년 이래로 "자바"가 없습니다.)

0

는이 같은 jQuery.get 사용

$.get('http://www.skysports.com/football/league/0,19540,11660,00.html', function(data) { 
//do the parsing here 
}); 
0

이 정보에서 점점 할 수있는 여러 가지 프로그래밍 언어가 있습니다, PHP 추출 또는 file_get_contents 및 정규식 구문 분석을 사용하여 고전적인 방법이 될 것입니다 네가 원하는 비트. 귀하의 웹 호스트가 원격 URL 검색을 허용하지 않는 경우 Yahoo Pipes으로도 가능합니다.

자바 여단이 나에게 연락을 좀 더 잘 해주지 않으면 PHP에서 대략적인 코드를 작성해 보겠습니다.

관련 문제