테이블 셀에서 식별 가능한 텍스트로 중첩 테이블을 일치시키는 정규식은 무엇입니까? 나는 시도했으나 예제에서 두 테이블의 시작과 끝을 잡아 내고 싶은 특정 테이블을 추출하는 정규 표현식을 찾지 못했습니다. 여기에 뭔가를 시작하는 것입니다 : "<table>.*?</table>
는" 어떤 정규식이 중첩 테이블을 테이블 셀의 식별 가능한 텍스트와 비교합니까?
<table>
<tr>
<td>
<table>
<tr><td>Code1</td></tr>
<tr><td>some data</td></tr>
<tr><td>etc ...</td></tr>
</table>
</td>
</tr>
<tr>
<td>
<table>
<tr><td>Code2</td></tr>
<tr><td>some data</td></tr>
<tr><td>etc ...</td></tr>
</table>
</td>
</tr>
</table>
내가 "CODE2"를 포함하는 테이블을 추출 할 말. 어떤 정규 표현식이 구체적으로 일치 할 것인가?
HTML 파서/DOM을 대신 사용해보십시오. HTML을 정규식으로 파싱하는 것은 일반적으로 모범 사례로 간주되지 않습니다. PHP, .NET 등에 사용할 수있는 파서가 있습니다 (어떤 언어를 사용하고 있는지 확실하지 않습니다). – TrueWill
[XML과 HTML을 정규식으로 구문 분석하기 어려운 이유에 대한 몇 가지 예를 제공 할 수 있습니까?] (http://stackoverflow.com/questions/701166/can-you-provide-some-examples-of- XHTML 독립 태그를 제외하고 [RegEx 일치하는 공개 태그] 중복 가능 –
중복 가능성이있는 이유는 무엇입니까? (http://stackoverflow.com/questions/1732348/regex-match-open-tags-except-xhtml-self-contained-tags) –