2011-04-25 2 views
1

HTML 코드에 여러 개의 p 태그가 있습니다.C#의 정규식 그룹화

<p class=MsoNormal><b style='mso-bidi-font-weight:normal'><span 
style='font-size:7.0pt'>PA<span style='mso-spacerun:yes'> </span>ARALIĞI</span></b><span 
style='font-size:7.0pt'> [İng. <b style='mso-bidi-font-weight:normal'>PA 
interval</b>]. (<i style='mso-bidi-font-style:normal'>Kardiyoloji</i>). 
Atriyum’un P dalgasının başlangıcını ayıran mesafe. İntraatriyal ya da 
sino-nodal iletim süresinin (35-45 milisaniye) ölçümünü verir. Uzaması ileti 
bozukluğunun göstergesidir. <o:p></o:p></span></p> 

<p class=MsoNormal><b style='mso-bidi-font-weight:normal'><span 
style='font-size:7.0pt'>PA<span style='mso-spacerun:yes'> </span>ARALIĞI</span></b>  <span 
style='font-size:7.0pt'> [İng. <b style='mso-bidi-font-weight:normal'>PA 
interval</b>]. (<i style='mso-bidi-font-style:normal'>Kardiyoloji</i>). 
Atriyum’un P dalgasının başlangıcını ayıran mesafe. İntraatriyal ya da 
sino-nodal iletim süresinin (35-45 milisaniye) ölçümünü verir. Uzaması ileti 
bozukluğunun göstergesidir. <o:p></o:p></span></p> 

다른 색인으로 어떻게 가져올 수 있습니까? 각 p를 목록의 구성원으로 받아야합니다. 내 코드는 다음과 같습니다

Regex Rx = new Regex(@"<p(.*)>(.*)<\/p>",RegexOptions.Multiline); 
    MatchCollection mc = Rx.Matches(yazi); 

감사

답변

2

정규 표현식으로 HTML을 구문 분석 할 수있는 정말 좋은 생각입니다. HTML 구문이 너무 복잡합니다.

대신 HTML 구문 분석기를 사용하십시오. Looking for C# HTML parser