2010-07-13 2 views
0

공개적으로 액세스 할 수있는 레크레이션 정보 데이터베이스에서 정보를 가져 오려고합니다. 구문 분석하려고하는 피드는 http://www.recdata.gov/feeds/RecElements/getAllRecElementsForOrgID_-1.xml (대용량 파일)정부 웹 서비스 사용

피드는 데이터베이스의 참조 테이블과 비슷한 정보에 대한 많은 참조가있는 것처럼 보이는 복잡한 xml 문서 인 것 같습니다. 이것을 처리하는 방법에 대한 몇 가지 팁이 무엇입니까? 그것을 소비하는 더 좋은 방법이 있습니까? 피드에서 가능한 한 많은 정보를 얻을 필요가 있으며 모든 아크 요소가 실제로 나를 트립시킵니다.

+0

아마도 대용량 파일에 대한 링크와 달리 문서에 대한 링크를 게시 할 수 있습니다. –

답변

1

웹 사이트를 조금 샅샅이 뒤다 보니 그 숫자가 Web Service Manual입니다. 이는 각자의 서비스에 대해 WSDL을 노출했다는 것을 보여주었습니다. 데이터를 가져 오는 서비스의 WSDL은 https://www.recdata.gov/RIDBWebService/RIDBService.jws?WSDL입니다. XMLSPY이 WSDL을 말한다

주에 오류가 :이 서비스를 다루는

File https://www.recdata.gov/RIDBWebService/RIDBService.jws?WSDL is not valid. 
    attribute 'part' in extensibility element '<mime:mimeXml>' refers to part 'Body' which could not be found in message 'getRecGovFacilitiesHttpGetOut' 
     Error location: definitions/binding/operation/output/mime:mimeXml/@part 

그래서 한 가지 방법은 당신의 마음에 드는 언어로 프록시 클래스를 생성하기 위해 WSDL을 사용하는 것입니다. 예를 들어, .NET을 사용하는 경우 "서비스 참조 추가"명령을 사용하여 WSDL을 가리 킵니다.

+0

필자는 PHP를 더 잘 알고 있기 때문에 아마 PHP를 사용할 것입니다. 시설 ID와 관련된 요소를 얻는 가장 좋은 방법은 무엇입니까? 그것이 내가 곤경에 처하게되는 곳이다. – Seth

+0

@Seth : PHP 5.2가 WSDL을 처리 할 수 ​​있다고 생각했습니다. –