2014-02-08 5 views
2

저는 XML 경로 언어를 처음 사용합니다. 내가 원하는 것은 콘텐츠를 긁어 내기위한 스크립트에서 XPath를 사용하는 도구를 사용하는 것입니다. 예를 들어올바른 XPath를 얻는 방법?

는 : http://econpy.pythonanywhere.com/ex/001.html

나는 모든 구매자의 이름을 싶어.

나는 Firebug와 Chrome DevTools를 시도했지만 둘 다 내 용도로 작동하지 않는 경로를 생성하는 것으로 보입니다.

즉, 나는 /html/body/div[2]/div 인 반면, //div[@title="buyer-name"]/text()이어야합니다.

(나는 http://docs.python-guide.org/en/latest/scenarios/scrape/을 사용했습니다).

모든 의견을 보내 주시면 감사하겠습니다.

답변

3

FirePath이라는 확장명의 Firebug 확장 프로그램이있어 XPath와 관련된 Firebug의 기능을 향상시킵니다. 최근에 Firebug에 구현 된 새로운 기능이 있었는데 copy the minimal XPath까지 허용됩니다.

둘 다 ID가있는 요소를 기반으로 경로를 만들지 만, 사용자가 원하는 부분을 허용하기 위해 enhancement request for Firebug을 만들었습니다. 그리고 나는 이것을 목표로 한 기존의 feature request for FirePath에 대해서도 논평했다.

+0

당신은 상대 xpath 강화 Sebastian을 구현했습니다. 여전히 공개적으로 문제가 있다는 것을 알 수 있습니다. 아직 Firefox에 설치하는 방법이 있습니까? 감사합니다. –

+0

실제로 ID가있는 요소의 경우 Firebug에서 기능을 구현 한 사람은 Jakob이었습니다. 열린 문제는 * ID가없는 요소를 기반으로하는 상대적 XPath와 관련됩니다. 문제는 아직 열려 있으므로 Firebug에서는 아직 사용할 수 없습니다. 이 기능을 사용하려면 [Firebug.next] (https://github.com/firebug/firebug.next)에 대한 패치를 작성하십시오. –

관련 문제