2012-09-18 4 views
-1

다른 웹 페이지에서 가져온 일부 텍스트를 복사하는 웹 페이지를 만들려고하지만이 방법을 잘 모르겠습니다.웹 페이지에서 텍스트 정보 추출

예를 들면 다음과 같습니다. http 사이트 A에는 사용자가 페이지를로드하는 순간의 특정 위치에서의 풍속이 표시됩니다. 페이지의 어디에 있는지 정확히 알 수 있습니다. 항상 페이지의 세 번째 숫자이거나, 앞에 wind speed: 또는 그 밖의 다른 문자가 붙는 것입니다. 정규 표현식을 사용하거나 페이지에서 원하는 것을 나에게 줄 것이며, 웹 페이지 소유자의 정보 사용 권한 또는 기타 사항을 알고 있습니다. 이 번호를 페이지에서 가져 와서 내 웹 페이지에 넣을 수 있기를 원합니다.

HTML 만 사용하여이 작업을 수행 할 수있는 방법이 있습니까? 또는 javascript와 같은 정보를 얻기 위해 다른 것을 사용해야합니까?

+0

'화면 스크래핑'에 대한 인터넷 검색을 시도해보십시오. –

답변

0

일반적으로 다른 사이트에 정보를 제공하는 페이지는 웹 서비스를 사용하여 정보를 제공합니다.

이렇게하면 이와 같은 페이지에 정보를 얻기 위해 방문 할 수있는 선택한 URL에 대한 메소드가 생깁니다.

구현 방법에 따라 HTML 페이지에서 웹 서비스의 응답을 직접로드 할 수 있습니다. 그러나 AJAX를 사용하여 웹 서비스를 호출하고 응답을 조작하는 것이 좋습니다.

물론 사용할 수있는 웹 서비스가없고 일반 HTML 텍스트에서 정보를 제거하는 경우 작업을 수행하는 데 반드시 javascript가 필요합니다. HTML만으로는 그렇게 할 수 없습니다.

0

Bardo가 말한 것처럼 2 가지 선택이 있습니다. 첫 번째는 웹 서비스이고 두 번째는 JavaScript로 페이지를 파싱하는 것입니다. 간단히 말해서 추출하려는 정보의 위치를 ​​찾으려고하면 페이지의 특정 패턴을 검색하고 정보를 추출 할 수 있습니다.