2011-11-07 2 views
0

시간 내 주셔서 감사합니다.XPath로 정보를 입력하십시오.

일부 웹에서 정보를 선택하고 그와 같은 표현에 문제가 있습니다.

  <a class="xxxxx"> 
      <br> 
      Hi 
      <br> 
      <span class="hpn">City</span> 
      : Barcelona 
      <br> 
      <span class="hpn">color</span> 
      : Blue 
      <br> 
      <span class="hpn">Price</span> 
      : 50 
      <br> 

나는 결과 바르셀로나, 블루와 도시 색상 및 가격 정보를 선택하려면, 50

임 답변을 기다리고!

+1

지금까지 시도한 것을 보여 주길 기다리고 있습니다. –

+0

Xpath를 사용하는 이유가 무엇인가요? 왜 regex를 사용하여 정보를 추출하지 않는가? 위 예제는 실제로 XML이 아닌 HTML입니다. – tazyDevel

답변

2

Xpath에 대한 지식을 포함하여 다른 정보가 없으면 나는 Xpath tutorial으로 연결됩니다.

0

위의 텍스트는 XML이 아니기 때문에 (XML로 태그 지정 했음에도 불구하고) 사용자가 그대로 작동하도록 생각하지 않습니다. 위의 추출은 <a> 태그에 닫기 태그를 추가하지 않는 한 올바른 형식의 XML로 해석 될 수 없습니다 (복사를 잊어 버린 경우). <br> 태그를 모두 얻으려면 <br/> 태그가 필요합니다. 파싱 ​​된 어떤 언어로 이것을 (지정되지 않은) 시도하려고하는지 모르기 때문에 파서가 잘 작동하지만 XPath 쿼리의 결과에 대한 두려움이 여전히 남아 있습니다. 그러나

//a[@class='xxxxx']/span[text()='City']/following-sibling::text()[1] 

반환이 같은 쿼리를 작동합니다 가정 '바르셀로나'

또는

//a[@class='xxxxx']/span/following-sibling::text()[1] 

가 반환됩니다 (''일부는 제거 할 하위 문자열 수 있습니다) 각 스팬 클래스의 첫 번째 형제

관련 문제