계층 적 데이터와 일치하는 단일 정규 표현식을 만들 수 있습니까? 예를 들어계층 적 정규 표현식
:
<h1>Action</h1>
<h2>Title1</h2><div>data1</div>
<h2>Title2</h2><div>data2</div>
<h1>Adventure</h1>
<h2>Title3</h2><div>data3</div>
내가 일치와 끝까지 싶습니다.
"Action", "Title1", "data1"
"Action", "Title2", "data2"
"Adventure", "Title3", "data3"
내가보기로이 여기 놀이에 계층 구조가 있다는 것을 알고 나는 H1을 캡처하는 패턴을 코드 경우에만 해당 계층의 첫 번째 항목과 일치 필요합니다. H1 코드를 작성하지 않으면 캡처 할 수 없습니다. 내가 이것을 해결하기 위해 고용 한 특별한 트릭이 있는지 궁금해하고 있었다.
이것은 .NET 프로젝트입니다.
어떤 언어로 제공됩니까? 정규 표현식은 언어가 아닙니다. 그것에는 많은 다른 방언이 있습니다. 어떤 방언은 여러분이 원하는 것을 지원하고, 어떤 방언은 원하지 않는 방언을 지원합니다. 대부분은 그렇지 않습니다. –
정규식을 사용하는 것은 좋지 않지만 HTML 구문 분석기를 사용하는 것이 좋습니다. 플랫폼에 따라 좋은 것을 제안 할 수 있습니다. 질문을 수정하고 다시 태그하십시오. –
경험상 정규 표현식은 야생에서 HTML을 처리하는 데 매우 효과적 일 수 있습니다. D는 우아하지 않지만 시간이 지나면 효과적입니다. –