나는 다음과 같은 텍스트에서 태그를 제거하려고 시도하고있다 : 그것은 두 줄에 얼마나RegexOptions.Multiline을 사용하는 경우에도 내 정규식이 여러 줄에 걸쳐있는 HTML 태그와 일치하지 않는 이유는 무엇입니까?
<P style=""MARGIN: 0in 0in 0pt"" class=MsoNormal><SPAN
style=""COLOR: #1f497d""><FONT size=3 face=Calibri> </FONT></SPAN></P>
공지 사항. 그래서 내가 사용하려고하면 :
Regex _html = new Regex("<.*?>", RegexOptions.Multiline);
tempHtml = _html.Replace(tempHtml, string.Empty);
는 그것은 <p>
, <font>
, </font>
, </span>
및 </p>
태그와 일치하지만 <span>
태그를 일치하지 않는 것 같습니다.
내가 뭘 잘못하고 있니?
이 구문 분석을하려면 Regex 대신 HtmlAgilityPack을 사용해야합니다. 훨씬 더 생산적입니다. –
나는 아마해야한다. 동료로부터이 코드를 물려 받았고 그는 MS 워드로 인해 기존의 html 스트립 핑 코드를 사용할 수없고 실제 HTML을 출력하지 못하는 것 같았습니다. 나는 그것이 얼마나 진실한지를 모른다. – KallDrexx
이 정규식도 작동합니다 : <(.|\s)*?> – Alex