VB5에서 MSHTML Parser를 사용하여 모든 HTML 태그를 제거하는 방법은 무엇입니까?VB6에서 MSHTML Parser를 사용하여 모든 HTML 태그를 제거하는 방법은 무엇입니까?
3
A
답변
1
이것은 CodeGuru의 코드 오버에서 수정되었습니다. 많은 많은 원저자에게 감사 : http://www.codeguru.com/vb/vb_internet/html/article.php/c4815
웹에서 HTML을 다운로드해야하는 경우 원래 소스를 확인하십시오. 예 :
Set objDocument = objMSHTML.createDocumentFromUrl("http://google.com", vbNullString)
웹에서 HTML 스텁을 다운로드 할 필요가 없습니다. 이미 메모리에 스텁이 있습니다. 그래서 원래의 소스는 제게 잘 적용되지 않았습니다. 내 주요 목표는 정규화 된 DOM Parser를 사용하여 사용자 생성 콘텐츠에서 HTML을 제거하는 것입니다. 일부는 "HTML을 제거하기 위해 RegEx를 사용하지 않는 이유는 무엇입니까?" 좋은 결과 내길 바랄 게!
가에 대한 참조 추가 : 마이크로 소프트 HTML 개체 라이브러리이 인터넷 익스플로러 (IE)를 실행하는 동일한 HTML 파서입니다 - 야유가 시작하자. txtSource.Text 모든 HTML을 박탈 내 사용자의 컨텐츠입니다
Dim objDocument As MSHTML.HTMLDocument
Set objDocument = New MSHTML.HTMLDocument
'NOTE: txtSource is an instance of a simple TextBox object
objDocument.body.innerHTML = "<p>Hello World!</p> <p>Hello Jason!</p> <br/>Hello Bob!"
txtSource.Text = objDocument.body.innerText
결과 텍스트 에 : 음, 야유 멀리 ...
저는 여기에 사용되는 코드입니다. 깨끗하고 유지 보수가 용이합니다. Cthulhu Way가 필요하지 않습니다.
0
Public Function ParseHtml(ByVal str As String) As String
Dim Ret As String, TagOpenend As Boolean, TagClosed As Boolean
Dim n As Long, sChar As String
For n = 1 To Len(str)
sChar = Mid(str, n, 1)
Select Case sChar
Case "<"
TagOpenend = True
Case ">"
TagClosed = True
TagOpenend = False
Case Else
If TagOpenend = False Then
Ret = Ret & sChar
End If
End Select
Next
ParseHtml = Ret
End Function
이것은 내 기능을위한 간단한 기능입니다. ? 사용 디버그 창
ParseHtml ("< DIV> 테스트 </DIV>")
테스트 나는이 외부 라이브러리
에게
0
한 가지 방법을 사용하지 않고 도움이되기를 바랍니다
:
Function strip(html As String) As String
With CreateObject("htmlfile")
.Open
.write html
.Close
strip = .body.outerText
End With
End Function
?strip("<strong>hello <i>wor<u>ld</u>!</strong><foo> 1234")
hello world! 1234
관련 문제
- 1. PHPQuery로 HTML 태그를 제거하는 방법은 무엇입니까?
- 2. 일부 HTML 태그를 제거하는 방법은 무엇입니까?
- 3. preg_replace를 사용하여 모든 HTML을 제거하는 방법은 무엇입니까?
- 4. Perl에서 ID를 사용하여 html 태그를 제거하는 방법은 무엇입니까?
- 5. 모든 태그를 제거하는 방법?
- 6. Nokogiri 명령으로 HTML 태그를 제거하는 이유는 무엇입니까?
- 7. VB6에서 밑줄이있는 쿠키를 제거하는 방법은 무엇입니까?
- 8. 안전한 목록에없는 HTML 태그를 제거하는 방법
- 9. Python 문자열에서 특정 HTML 태그를 제거하는 가장 빠른 방법은 무엇입니까?
- 10. iPhone의 문자열에서 태그를 제거하는 방법은 무엇입니까?
- 11. Django 템플릿 (필터)에서 html 태그를 영구 제거하는 방법은 무엇입니까?
- 12. html 태그를 응축하는 방법은 무엇입니까?
- 13. Xcode보기에서 디버거 경고 태그를 제거하는 방법은 무엇입니까?
- 14. PHP/Perl을 사용하여 제출 된 HTML 양식의 텍스트에서 사용자 정의 태그를 제거하는 방법은 무엇입니까?
- 15. 문자열의 모든 img 태그를 찾는 방법은 무엇입니까?
- 16. URL에서 HTML 태그를 가져 오는 방법은 무엇입니까?
- 17. jQuery를 사용하여 불필요한 HTML 요소를 제거하는 방법은 무엇입니까?
- 18. antlr 2.7을 사용하여 간단한 Lexer/Parser를 작성하는 방법은 무엇입니까?
- 19. sed로 모든 다른 줄을 제거하는 방법은 무엇입니까?
- 20. spark viewengine을 사용하여 맞춤 html 태그를 만드는 방법은 무엇입니까?
- 21. HTML 파일에서 일부 태그를 검색하는 방법은 무엇입니까?
- 22. DisplayTag에 HTML 태그를 추가하는 방법은 무엇입니까?
- 23. Drupal 6에서 HTML 태그를 수정하는 방법은 무엇입니까?
- 24. HTML 정수기에서 태그를 허용하는 방법은 무엇입니까?
- 25. Joomla 1.5에서 HTML 태그를 수정하는 방법은 무엇입니까?
- 26. 페이지의 모든 양식 요소에서 하나의 공통 속성을 제거하는 방법은 무엇입니까?
- 27. HTML :: Parser를 사용하여 태그 사이에서 텍스트를 추출하려면 어떻게해야합니까?
- 28. as3을 사용하여 XML 태그를 제거하는 방법
- 29. html 페이지에서 이러한 문자를 제거하는 방법은 무엇입니까?
- 30. tinyMCE를 사용하여 HTML 태그를 제거했습니다.
태그를 제거한 후 남겨 둘 점은 무엇입니까? 모든 태그 내의 모든 텍스트? 개행 문자는 어떨까요? – Bob77
저는 개 글자에 대해 확실히 우려하고 있습니다. MSHTML은
과을 개행 (\ n)으로 대체합니까? 아니면 여기에 우리 자신의 장치에 맡기고 있습니까? –
약간의 테스트가 끝나면 ... 출력물에 개보수가있는 것처럼 보이므로 조금 덜 걱정합니다. 누군가가 위대하다는 것을 확인할 수 있다면. –