2010-03-28 3 views

답변

0

전체 HTML을 가져온 것으로 가정합니다. 가장 좋은 방법은 정규식을 사용하여 HTML 스타일의 텍스트를 제거하는 것입니다.

+0

HTML 및 일부 클라이언트 측 스크립트가 페이지에 기록됩니다. – Dmi

+0

와우, 이것을 받아 들인 대답으로 보는 것이 놀랍습니다. 기록을 위해 나는 클라이언트 측 스크립트를 처리하기 위해/ /'을 대체하고'/ <[^>] *> /'를 대체하여 다른 html 태그를 제거하려고한다. 스크립트 패턴은 완벽하지는 않지만 대부분의 경우 작동합니다 (기본적으로 스크립트 자체에'<'char가 포함되어 있지 않은 경우). –

0

innerText 속성을 사용하면 모든 태그가 제거됩니다.

관련 문제