2016-08-07 4 views
0

HTML에서 모든 태그를 제거하고 url을 텍스트로 표시하는 regex가 필요합니다.node.js 태그를 제거하는 regEx

예를 들어,이 텍스트 :

abc <a href="http://a.com" target="_blank">bbb</a> ccccccc 

이 될 것입니다 :

abc bbb http://a.com ccccccc 
+0

왜 DOM이 당신에게 훨씬 더 많은 신뢰성을 제공 할 때 정규식을 (불완전하게, 가장자리 케이스와 함께) "* 필요 *"합니까? 그리고 왜'href' (''http://a.com '')가'bbb'와'cccccc' 사이에 오나요? –

+0

dom이 없으므로 node.js에서 작업합니다. 나는 html에서 no-html 영역까지 모든 날짜를 보여주기 위해 신경을 써야한다. –

답변

0
text = html.replace(/href="([^"]*)"[^>]*>([^<]*)</g, '>$2 $1<').replace(/<[^>]*>/g, ''); 

첫 번째 replace은 링크 텍스트 뒤에 url을 추가합니다. 두 번째 replace은 모든 html 태그를 제거합니다.

1

은 당신이 getElementsByTagName을 사용할 수 이상이이 정규식으로 가지고있다 "href가"에 대한 "A"와 getAttribute?

+0

RegEx가 있는데 node.js에 쓰기 때문에 dom이 없습니다. –

+0

아마도이 게시물 [링크] (http://stackoverflow.com/questions/34268804/access-to-dom-using-node-js) 도움이됩니다. – csabinho

+0

https://www.npmjs.com/package/jQuery도 사용할 수 있지만 regEx 또는 문자열 조작을 선호합니다. –

관련 문제