건초 더미에 맞는 이유 : 내가 사용이 패턴은 첫 번째와 마지막
<h2 >a · · ·
</h2>
<div class="indent">
aaaa
</div>
<h2 >b · · ·
</h2>
<div class="indent">
bbbb
</div>
패턴 :
#<h2[^>]*>(a|b)(?!</h2>)[\s\S]*</h2><div class="indent">((?!</div>)[\s\S]+)</div>#
이 패턴은 첫 번째 H2 내용 (예 : a · · ·
를) 마지막의 내용과 일치 div (예 : bbbb
)
하지만 h2와 div의 모든 콘텐츠와 일치하여 일대일지도를 만들 수 있습니다 (예 : a · · ·
=>). 210, b · · ·
=>bbbb
) 어떻게해야합니까?
c.c 정규식은 HTML을 구문 분석하는 데 사용해서는 안됩니다. – Daedalus
나는 그것을 분석하려고하지 않고있다. 나는 거미를 만들고있다. 내가 만드는 데 사용해야 할 것은 무엇인가? – LotusH
모든 ''다음에 개행 문자가 있기 때문에 일치하지 않아야합니다. 아니면 '건초 더미'를 변경 했습니까? – Wrikken