다음 HTML에서는 table
요소를 구문 분석 할 수 있지만 th
요소는 건너 뛸 수 없습니다.HTML 민첩성 팩을 사용하여 구문 분석 테이블
나는 단지 td
요소를 얻을 싶어하지만 내가 사용하려고하면
foreach (HtmlNode cell in row.SelectNodes("td"))
을 ... 나는 예외를 얻을.
<table class="tab03">
<tbody>
<tr>
<th class="right" rowspan="2">first</th>
</tr>
<tr>
<th class="right">lp</th>
<th class="right">name</th>
</tr>
<tr>
<td class="right">1</td>
<td class="left">house</td>
</tr>
<tr>
<th class="right" rowspan="2">Second</th>
</tr>
<tr>
<td class="right">2</td>
<td class="left">door</td>
</tr>
</tbody>
</table>
내 코드 :
var document = doc.DocumentNode.SelectNodes("//table");
string store = "";
if (document != null)
{
foreach (HtmlNode table in document)
{
if (table != null)
{
foreach (HtmlNode row in table.SelectNodes("tr"))
{
store = "";
foreach (HtmlNode cell in row.SelectNodes("th|td"))
{
store = store + cell.InnerText+"|";
}
sw.Write(store);
sw.WriteLine();
}
}
}
}
sw.Flush();
sw.Close();
예외는 무엇입니까? –