2013-06-24 4 views
0

http://www.112.ru/services/wanted/people/index.shtml?roztype=1 야후 파이프Xfetch 모듈을 사용하여 모든 제목을 가져 오려고합니다.XPath 쿼리는 야후 파이프에서 결과를 반환하지 않습니다.

내 검색어 //span[@class='uchbold']의 모든 책을 선택하고 Firepath을 성공적으로 완료했습니다. 그러나 에서 야후 파이프Hpple 결과가 없습니다.

+0

www.112.ru에서 링크를 클릭 할 준비가되어있는 사람들이있을 수 있습니다. 나를 포함한 다른 사람들은 덜 신뢰하기 때문에 질문에 대답하지 않습니다. 충분한 XML 추출물을 질문에 복사하는 것이 훨씬 낫습니다. –

+0

@MichaelKay Jens가 알아 냈 듯이 데이터의 비동기로드 부분으로 인해 문제가 발생했습니다. html 소스 만 여기에 입력하면 질문에 대답 할 수 없습니다. – Shmidt

답변

1

이러한 클래스 속성은 Yahoo Pipes 및 Hpple을 사용하여 실행되지 않는 JavaScript에 의해 삽입됩니다.

또한 내용이 ajax에 의해로드되므로 ajax 호출을 추적하고이 인터페이스에 대해 개발해야합니다.

방화범을 사용하여 나는

http://www.112.ru/publish/00/01/0508.01/2012/08//contents.xml 

404 오류를 반환했습니다 다른 "contents.xml"많은 파일을로드를 추적 할 수 있습니다.

<view file="0901156380089d71_0508.01_00_01.full.shtml" format="full" indexed="true"/> 

과 같은 요소 형식의 콘텐츠가 포함되어 있으며 실제 데이터가 포함 된 일부 HTML 스 니펫에 다시 연결되는 것으로 보입니다.

+0

자세한 내용은 자습서/설명서를 참조 할 수 있습니까? – Shmidt

+1

파일을로드하는 JavaScript를 읽고 분석해야합니다. 데이터로드 방법과 JavaScript없이 수행하는 방법에 대한 아이디어를 얻을 수 있습니다. 로드 할 URL을 결정하는 방법을 알았 으면로드 한 URL을 모두 가져 와서 결합해야합니다. 야후 파이프에 대해 자세히 알지 못해서 더 이상 당신을 도울 수 없어서 죄송합니다. 또는 Node.JS 또는 일부 다른 도구를 사용하여 프록시를 구축하고 Yahoo Pipe로 구문 분석하기 전에 JavaScript를 평가하는 데이 프록시를 사용하면 더 어렵습니다 (서버가 필요함). –

관련 문제