가능한 중복 :
Using C# regular expressions to remove HTML tags정규 표현식 - 태그
내가 태그를 제거하고 XML 파일의 다른 모든 정보를 보관해야합니다. 나는 정규 표현식을 사용할 때 어떻게 든 상실감에 처한다. 필자는 파일을 한 줄씩 읽은 다음 모든 태그를 찾아 "빈 문자열"로 바꾸려고했습니다. 그러나, 예상대로 작동되지 않습니다.
line = Regex.Replace(line, "<.*>", "");
내가 설명을 얻을시겠습니까이 예상 작동하지 않습니다 같은 이유 (난 그냥 또한, 수> < 안에있는 문자의 모든 가능한 조합을 찾을해야한다고 생각 정규 표현식에 대한 좋은 소개를 권유합니다. 정규 표현식에서 많은 것을 읽었습니다. 그러나 어떻게 든 불완전하고 혼란 스럽습니다.
xml 파서를 사용하지 않는 이유는 무엇입니까? – I4V
그리고 정확히 무엇을 남기고 싶습니까? '<' and '>'을 제외하고 모두? 속성 뒤에 남겨두기? CDATA와 XText 뒤에 남겨 두시겠습니까? – user7116
XML 파일에서'<>'를 제거 하시겠습니까? 뭔가 당신이 최적의 접근법에 있지 않다는 것을 말해줍니다. –