htmlentities로 인코딩 된 HTML 코드가있는 문자열이 있습니다.HTML 문자열의 모든 경로를 찾는 정규 표현식
HREF = "XXX"SRC = "XXX": 내가 원하는 무엇
사이, 문서의 모든 경로를 찾을 수 있습니다.
나는 모든 링크는 HTTP, HTTPS, FTP 및 파일에 의해 시작 찾기 정규식 표현을해야합니까, 나 그것을 반복하지 않도록 :
"/\b(?:(?:https?|ftp|file):\/\/|www\.|ftp\.)[-A-Z0-9+&@#\/%=~_|$?!:,.]*[A-Z0-9+&@#\/%=~_|$]/i"
어떤 생각?
왜'href = "'와 다음'''사이에 모든 것을 찾으려고하지 않습니까? * 많이 * 더 쉽고 * 적은 * 오류가 발생하기 쉬울 것입니다. – zerkms
'href = "([^"] *) "'?가 URL에 허용됩니까? 나는 공간이 실제로는 ... –
@P O'Conbhui :'''문자뿐만 아니라 공백이 허용되지 않는다고 생각합니다. – zerkms