2011-09-09 8 views
2

우리는 현재 ASP에서 ASP.NET으로 인트라넷 응용 프로그램을 이식하고 있습니다. ASP 버전은 새로운 버전의 과정에서 피하려고하는 많은 프레임을 사용합니다.웹 페이지에 HTML 또는 Word 형식의 텍스트 포함

응용 프로그램에는 문서 모듈이 있으며 일부 문서의 내용이 Word 형식의 텍스트로 채워져 있음을 발견했습니다. 이것은 응용 프로그램의 레이아웃을 방해합니다. ASP 버전은 프레임을 사용하므로 레이아웃의 나머지 부분을 간섭하지 않으므로이 문제가 발생하지 않습니다.

HTML/Word 형식의 텍스트는 Word2000 속성을 가진 Tidy.NET-library으로 정리됩니다. 불행히도 이것은 모든 Word 형식 텍스트를 지우지 않는 것 같습니다. 웹 페이지에 Word 형식 텍스트를 삽입/표시하는 데 사용할 수있는 옵션은 무엇입니까? 아니면 프레임이 유일한 방법입니까?

답변

0

iframe을 사용해 보거나 RegEx를 사용하여 Tidy.NET 라이브러리에서 제거되지 않는 마크 업을 제거 할 수 있습니다. 다음은 .NET의 RegEx 사용법에 대한 자습서입니다. RegEx tutorial

+0

정규 표현식을 고려했지만 차 한잔하지 않았습니다. 나는 Coding Horror (http://www.codinghorror.com/blog/2006/01/cleaning-words-nasty-html.html)에 대한 기사를 읽고 사용했지만 불행히도 HTML은 Word가 아닌 일반 Word에 저장합니다. 어쩌면 정규 표현식을 배울 시간입니다 ... – thomasvdb

관련 문제