2013-06-20 1 views
0

지금은 href = "와 # fragment- [0에서 9 사이의 숫자]"사이에 무엇이든 반환하는 (?<=href=")(.*?)(?=#fragment-[0-9]">)을 사용하고 있습니다. 기본적으로 원하는 내용이지만 href = "http : /와 같은 것들을 제외하고 싶습니다. /blahblah.com#fragment-1 "또는 href ="https : blahblah.com # fragment-1 "그래서 http 또는 https로 시작하는 문자열을 제외하도록 (.*?)을 어떻게 변경할 수 있습니까?정규식은 두 문자열에서 문자열을 찾지 만 http로 시작하는 문자열은 제외합니다.

감사합니다. 또한

답변

1
(?<=href=")(?!https?:)(.*?)(?=#fragment-[0-9]">) 

, don't use regex to parse HTML.

+0

HTML을 구문 분석하지 않음, 깨진 링크를 고치기 위해 HTML 문서를 통해 검색 함, 감사합니다. – Paidenwaffle

관련 문제