2009-09-30 6 views
0

HTML 문자열을 별도의 div 태그로 분할

어떻게 든 모든 div 태그 및 해당 콘텐츠 끌어 오기 및 배열 나누기 함수 및 정규식을 보았다 각 1 넣을 수 싶어요 html & 전체 문자열이 있습니다. 아직 명확하고 쉬운 해결책이 제시되지 않았습니다.

중첩 된 div 태그를 통합하기 위해이 부분을 약간 수정했지만 형식으로 반환해야하는 태그는 다음과 같습니다. -

<div class="normal"><div><p>Random Div</p></div>Lion</div> 
+0

그래, 내가 제시 한 것은 '달성하기 위해 노력하고있는 것'의 약간의 '무언가 다운'버전이지만, 다음 의견은 매우 도움이되었습니다. 실제 응용 프로그램에서 div에 적용된 클래스가 있으므로 정규식을 약간 수정했습니다. 그래서 Dim reg = New Regex ("

(.*?)
") – Miker169

답변

4

내가 정규식을 사용하여 vb.net이 테스트.

그게 필요한가요?

Dim reg = New Regex("<div>(.*?)</div>") 

     Dim matches = reg.Matches(strHml) 

     For Each mat As Match In matches 
      Dim s As String 
      s = mat.Value 
     Next mat 
+0

으로 변경했습니다. 다음과 같은 경우 작동합니다. 중첩 된 div가없고 div (s)가 여러 줄에 걸쳐 있지 않습니다. –

+1

예, 내가 원하는 것은 OP가 지정해야하는 것은 중첩 된 div의 경우에 원하는 것이며 탭과 끝 줄을 제거하여 여러 줄을 제거 할 수 있습니다. 그 외에는 html 파서를 사용해 보겠습니다. http://www.codeguru.com/vb/vb_internet/html/article.php/c4815 http://www.netomatix.com/products/Documentmanagement/HtmlParserNet.aspx –

+0

예, html-parser ++ –

관련 문제