그래서 결국 sed와 반대되는 목적으로 내 상사에게 perl 사용을 승인하게되었습니다.Perl 욕심이없는 정규식
다음은 기본적인 사고 방식입니다.
는이 같은 라인이 : 그것은 정말 지저분입니다
<div class="SectionText">Sometext</div><div class="SectionText">Some more text</div>
을,하지만 난 그것을 기록하지 않았다. 어느 쪽이든,이 같은 페이지 생긴 수있다 그리고 그들은이 형식으로 변경해야합니다
<p>Sometext</p><p>Some more text</p>
은 분명히이 아닌 욕심 필요가있다.
perl -nle "s/(.*)<div class=\"SectionText\">(.*?)<\/div>(.*)/\1<p>\2<\/p>\3/ig; print $1" "somefile.html" > otherfile.html
그러나,이 아무것도 안하고 SectionText 모든 태그가 남아 : 지금 여기에 내가이 돕기 위해 마련 한 라인입니다.
당신은 욕심이 없으면서도 정규 표현식의 처음과 중간과 끝에'. * '을 넣어야한다고 말합니다. 또한 실제 HTML 구문 분석기를 사용하지 않으시겠습니까? –