2013-03-18 4 views
-2

HTML에서 정규식을 사용하지 않아야한다는 것을 알고 있습니다. 내가 HTML 파일에서 이미지 소스를 풀고 싶습니다, 아래 예 :Regex - HTML에서 img src 추출

그것은 다음과 같습니다과 같이 "헤더 CID를"각각의 경우에

<img src = cid:header width="700" height="93" alt="Logo" /> 
<img src= cid:header width="700" height="93" alt="Logo" /> 
<img src =cid:header width="700" height="93" alt="Logo" /> 
<img src=cid:header width="700" height="93" alt="Logo" /> 

을 I'ld 얻을 좋아 결과.

내 정규식 지식은 기본적으로 0이므로, 나는 너희들을 생각해 보았다. "src"다음에 "="문자 다음에 공백을 허용하는 패턴이 필요합니다.

SRC [mightBeSpace] = [mightBeSpace] CID : [mustNotBeSpace]

감사합니다!

답변

2
^<img src\s?=\s?([^\s]+).*/>$ 
+1

제공하신 내용 만 포함 된 txt 한 줄과 일치하도록 제공했습니다. @Kolink가 지적한 것처럼 RegEx는 HTML – rbedger

+0

src \ s? = \ s? ([^ \ s] +)와 일치하는 것을 알 수 있습니다. 이것은 내가 필요한 유일한 당사자입니다. 감사합니다! –

+0

질문에 충분히 대답했다고 생각되면 대답으로 표시하십시오. – rbedger

2

정규식에서 "공간이 될 수있는 것은"\s*이며, "공백 없어야합니다"당신이 정규식을 구축 할 수 있어야한다이 정보를 사용하여 \S+

로 변환합니다. 당신이 할 수 없다면, 당신이 시도한 것을 보여주십시오.

+0

src \ s? = \ s? ([^ \ s] +) 해결되었습니다. 도움을 주셔서 감사합니다. –