2014-12-18 2 views
1

저는 HTML 민첩성 팩을 사용하여 C#으로 웹 스크래핑 프로그램을 작성하고 있습니다. 나는 이전에 자바로 작성했지만 C#으로 옮길 것이다. jSoup를 사용하여 HTML을 파싱하기 전에 Yahoo Finance에서 xpath를 통해 요소를 가져 오는 데 문제가 없었지만 HTML Agility Pack을 사용하면 xpath를 사용하여이 사이트에서 요소를 얻을 수없고 합법적 인 것 같습니다. 노드. 여기에 예를HTML 민첩성 팩에서 xPath를 찾을 수 없습니다.

http://finance.yahoo.com/q?s=AMZN 것은 사이트

나는 이것이 Excel 추가 것을 추가해야 스프레드 시트

ws.get_Range("A2").Value2 = doc.DocumentNode.SelectSingleNode("//*[@id='table1']/tbody/tr[1]/td").InnerText; 

에 추가하려면이 코드를 사용을합니다. 스프레드 시트에 HTML을 쓰면 HTML에서 "table1"을 찾을 수 없지만 HTML을 텍스트 파일로 인쇄 할 때 찾을 수 있습니다. 이 노드를 찾는 데 필요한 통찰력이 있습니까?

답변

2

찾았습니다. HtmlAgilityPack은 xpath의 "/ tbody"부분을 사용하는 것을 좋아하지 않습니다. 테이블 요소를 검색하는 경우이를 사용하십시오.

관련 문제