일부 자습서의 내용을 변환하고 html
태그를 추출합니다. 이 정규식을 만들었습니다 : /<html\>(?!html)([\s\S]*)<\/html\>/
첫 번째 HTML 그룹의 내용 만 캡처하려고했지만, 내 (어쩌면 나쁜 위치) 부정적인 선견자 임에도 불구하고 마지막 HTML까지 모든 것을 캡처합니다.첫 번째 정의 문자열이 아닌 모든 내용을 캡처하는 정규식
내가 여기서 무엇을 놓쳤는가?
<html\>([\s\S]*?)<\/html\>
최초의 HTML 태그까지 모든 것을 차지한다 (live example)
This is text
<html>
<div>
some content
</div>
</html>
This is more text
<html>
<div>
some content
</div>
</html>
욕심을 없애시겠습니까? –