Regex를 잘 모르며 일부 추출 된 페이지 텍스트에서 모든 스크립트 태그를 가져 오려고합니다. 나는 다음 패턴을 시도했다 :Regex를 사용하여 일부 텍스트에서 스크립트 태그를 추출하는 방법은 무엇입니까?
<script.*?>.*?</script>
그러나 이것은 어떤 코드도 포함하고있는 스크립트 태그를 반환하지 않는 것처럼 보인다. 나는. 그것에서 다음
<script type="text/javascript" src="Scripts/Scipt1.js"></script>
<script type="text/javascript" src="Scripts/Scipt2.js"></script>
<script type="text/javascript">
function SomeMethod()
{
}
</script>
거 야 만 다음과 같은 결과를 얻을 :
<script type="text/javascript" src="Scripts/Scipt1.js"></script>
<script type="text/javascript" src="Scripts/Scipt2.js"></script>
이 어떻게 3을 반환 할 수 있습니까? (NB. 결과에 외부 스크립트 태그를 유지하고 싶습니다.)
를 사용하여 XML 파서입니다. Regex로 XML을 파싱 할 때마다 신이 새끼 고양이를 죽입니다. – scy
제발 [하지] (http://stackoverflow.com/questions/1732348/regex-match-open-tags-except-xhtml-self-contained-tags/1732454#1732454). XML 구문 분석기를 사용하십시오. – Stephen
Regex를 사용하여이 작업을 수행 할 수는 없습니다. HTML은 정규 언어가 아니므로 정규 표현식으로 파싱 할 수 없습니다. HTML 파서가 필요합니다. –