2011-11-26 4 views
0

태그가없는 텍스트를 추출하고 싶습니다.태그 안에 포함되지 않은 텍스트 가져 오기

<a href="asdsd.com">hello</a> 

I want this text 

<strong>not this</strong> 

가 어떻게 텍스트를받을 수 있나요 :

html로 이런 식으로 뭔가를 보이는?

문자열로 읽은 다음 <a><strong> 태그의 부품을 검색 할 수 있지만 쓰는 방법을 모르겠다 고 생각합니다.

p.s. 나는 철저히 검사했으며 아무런 <div>, <b>, <p> 또는 다른 태그가 없습니다. 그것은 그 것처럼 매달린다.

답변

0

형제가 포함 된 텍스트 노드를 필터링 할 수 있습니다. 이전 또는 다음 노드가있는 경우 원하는 노드임을 알 수 있습니다.

Dim query = doc.DocumentNode       _ 
    .DescendantNodes         _ 
    .OfType(Of HtmlTextNode)       _ 
    .Where(Function(t) t.PreviousSibling IsNot Nothing _ 
       OrElse t.NextSibling IsNot Nothing) 
관련 문제