2013-03-31 1 views
0

제목이 다소 모호해 보일 수도 있습니다.웹 사이트에서 정보를 얻으십시오. 소유하고 있지 않습니다.

내가 소유하지 않거나 제어 할 수없는 웹 사이트에서 정보를 가져오고 싶습니다 (예 : 이 데이터를 JSON 또는 유사하게 파싱하고 싶습니다.

구문 분석을 이해하는 데 문제가 있습니다. 웹 사이트 관리자가 해당 데이터를 가져올 수 있도록 JSON 형식으로 데이터를 제공해야합니까?

또는 URL과 해당 정보의 html 요소를 제공하여 원하는 데이터를 얻을 수 있습니까?

+1

데이터 형식에 따라 parers를 선택하십시오. 정보가 JSON으로 제공되면 JSON 구문 분석기를 사용합니다. HTML로 제공되면 HTML 구문 분석기를 사용합니다. XML 인 경우 XML 파서 등을 사용합니다. –

답변

1

웹 브라우저처럼 사이트에서 공개적으로 사용할 수있는 데이터를 얻을 수 있습니다. 하지만 원하는 그대로의 형식이 아닙니다. HTML 코드를 다운로드하거나 다운로드 한 형식의 정보를 구문 분석하고 추출해야합니다.

정확히 어떻게 할 것인가는 사용하는 언어에서부터 시작되는 여러 가지 요인에 달려 있습니다.

+0

자, 먼저 HTML 파서를 사용하여 데이터를 구문 분석해야합니다 (사이트에서 JSON으로 제공하지 않는다고 가정). 그런 다음 서비스로 가져와야합니다. 나는 데이터로 IOS 애플리케이션을하고있다. 업데이트 : 사이트에서 RSS 피드를 제공합니다. 사용할 수 있습니까? – marsrover

+0

그게 달려 있습니다. 그것은 HTML일지도 모르지만 그 중 하나 또는 두 개의 정보 만 필요하기 때문에 전체 문서를 구문 분석 할 필요가 없습니다 (매우 해안에 CPU가있을 수 있음). 정규식은 대부분의 경우 알려진 HTML 템플릿을 기반으로 필요한 모든 정보를 쉽게 추출하는 데 도움을줍니다. – Havenard

관련 문제