PHP 간단한 HTML DOM 파서를 사용하고 있으며이 div 콘텐츠를 얻을 때까지 everithing이 잘 실행됩니다. 나는 src attr을 얻고, img 태그를 찾고, 모든 태그를 찾을 수있는 모든 방법을 시도했지만, img 태그를 얻을 수는 있지만 width, height 및 alt attr (단지 일부 텍스트 "가 나타나고 다른 문자열은 표시되지 않음).이 img 태그에서 src attr을 얻는 방법
<img width="656" height="370"
alt="some text " .="" othertetx="" anothertext="" anothertext="" anothertext="" anothertext'="" title="same text in the alt attr " src="http://siteurl/getattach/somedir/somefile.aspx">
나는이 문제가 alt = 텍스트가있는 모든 텍스트에서 파서를 혼란스럽게한다고 생각합니다. 이 태그는 브라우저에서 잘 표시되어 있으므로,이
이편집 "표준"이어야합니다
대답은 문제가 해결되지 않는 지적, 나는이 SRC를 얻는 방법을 알고, 문제는이 태그입니다. 시간을내어 질문을 충분히 읽은 후에 중복으로 표시하십시오. 해결 된 답변에서 제공된 코드는 내가 보여준 샘플에서는 작동하지 않습니다.
이
$img_src = $element->src;
if(!strstr($img_src, 'http://')) {
$img_src = $v . $img_src;
}
는
<img>
요소가 유효한 HTML되지 않습니다
<img width="656" height="370"
alt="some text " .="" othertetx="" anothertext="" anothertext="" anothertext="" anothertext'="" title="same text in the alt attr " src="http://siteurl/getattach/somedir/somefile.aspx">
parse dom ??? http://stackoverflow.com/questions/1732348/regex-match-open-tags-except-xhtml-self-contained-tags – Gadonski
요소를 위반하는 것은 아포스트로피입니다. 나는 그것을 어떻게 해결해야할지 모르겠다. –
아마도 부모의 innerHTML을 가져 와서 'src'를 검색하거나 아포스트로피를 제거하고이를 새로운 (숨겨진) 요소로 추가하고 'src'를 읽습니다. (나는 파서가 이것을 할 수 있다고 가정하고있다.) –