코드베이스를 가져 왔으며 Microsoft Word에서 작성한 HTML 파일을 읽어야합니다. 모든 종류의 인라인 서식이 있습니다.프로그래밍 방식으로 모든 HTML 및 인라인 서식을 제거합니다.
어쨌든 잘못된 인라인 서식을 모두 구문 분석하고이 스트림에서 텍스트를 가져 오는 것입니다. 기본적으로 청정기를 프로그램 적으로 사용하여 합리적인 CSS를 적용 할 수 있습니다.
코드베이스를 가져 왔으며 Microsoft Word에서 작성한 HTML 파일을 읽어야합니다. 모든 종류의 인라인 서식이 있습니다.프로그래밍 방식으로 모든 HTML 및 인라인 서식을 제거합니다.
어쨌든 잘못된 인라인 서식을 모두 구문 분석하고이 스트림에서 텍스트를 가져 오는 것입니다. 기본적으로 청정기를 프로그램 적으로 사용하여 합리적인 CSS를 적용 할 수 있습니다.
결국 나는 발견하고 대체 한 작은 클래스를 작성했습니다. 예쁘지는 않지만 효과가있었습니다.
HTML Tidy을 사용해야합니다. 이는 HTML 정리에있어 유일합니다. article on DevX that describes how to do it from .NET이 있습니다.