태그 내용을 제거해야하는 HTML 코드가 있습니다. 그들은 약 30 개입니다. 그것은문자열 첫 번째 일치 발생
<A class=tooltiplink href="javascript:void;" style="color:#000000"><img src="images/footnote.jpg" border="0"><SPAN style="margin:0 0 0 0px;"> unwanted info 4:6 </SPAN></A>
<b>Hello </b>
<A class=tooltiplink href="javascript:void;" style="color:#000000"><img src="images/footnote.jpg" border="0"><SPAN style="margin:0 0 0 0px;"> unwanted info 4:6 </SPAN>
</A><b>World</b>
<A class=tooltiplink href="javascript:void;" style="color:#000000"><img src="images/footnote.jpg" border="0"><SPAN style="margin:0 0 0 0px;"> unwanted info 4:6 </SPAN></A>
원하는 출력과 같은 HTML 코드 내 여러 곳에서 발견된다 : 안녕하세요
을 내가 $_=~s/A(.+)?\/A//gs;
로 태그 콘텐츠를 제거 할 때. 또한 마지막 태그 안의 유용한 정보를 사용합니다. g를 제거해도 동일한 효과가 있습니다. 처음과 마지막으로 서로 일치하지 않고 태그 내용 만 제거하고 유용한 정보를 제거하는 방법.
당신이 몇 가지 예를 입력하고 필요한 출력을 가지고 있습니까 :로
당신이 트리 구조로 HTML을로드하면의 XPath는 간단 수 있습니다 필요? – chooban
샘플 코드를 게시했습니다. 나는 오직 안녕과 세상이 필요합니다. – xtreak
몇 가지 정보는 일반적인 철저한 답변을 제공하는 데 필요합니다. 1)이 샘플은 귀하의 샘플과 같은 몇 가지 사례가있는 더 큰 html 코드의 부분적인 부분이라고 가정합니다. 2) 어떻게 구분 기호로 취할을 블록의 첫 번째 . 3) unwanted info is the one between first peer 에 해당하는 것으로 정의 할 수 있습니까? 4) 블록이 항상 여러 줄에 있거나 1 줄에있을 수 있다고 가정 할 수 있습니까? (이 경우 수정 필요) – NeronLeVelu