저는 정규식에 관해서는 초보자입니다. 어디서부터 시작해야할지 모르겠습니다. 나는 약간의 HTML 코드는 웹 페이지에서 긁어 변수에 저장해야하고, 이런 식으로 뭔가 같습니다정규 표현식을 사용하여이 데이터를 긁거나 분석 할 수 있습니까?
<thead><tr>
<th></th>
<th>GENERAL INFORMATION</th>
<th></th>
<th>DETAILED DATA</th>
</tr></thead>
<tbody><tr>
<th>ID</th>
<td>123456789ABCD</td>
<th>Field1</th>
<td>6 = (Some-Specification (3 or more details))</td>
</tr></tbody>
<tbody><tr>
<th>AGL</th>
<td>1 - United States ; TH - Some Data</td>
<th>Field2</th>
<td>7 = (Option/Other Option)</td>
</tr></tbody>
<tbody><tr>
<th>MANUFACTURER</th>
<td>2010 SPECIFICATION (ADSD: HMKC)</td>
<th>Field3</th>
<td>8 = (My Type)</td>
</tr></tbody>
<tbody><tr>
<th>MODEL</th>
<td>6X4 MY-MODEL/SOME_SPECS LONG SPECIFICATION, BLAH</td>
<th>Field4</th>
<td>9 = (STUFF/OTHER STUFF)</td>
</tr></tbody>
<tbody>
을 그리고 같은 더있다 ... 나는이의 데이터를 분석하고 싶습니다 셀을 변수로 변환합니다. (예 : ID 변수로 "123456789ABCD"구문 분석) ColdFusion에서 일하고 있는데 REFindNoCase
, REReplaceNoCase
, SpanExcluding
과 같은 메소드를 사용하려고 생각했습니다. 어떻게 생각하나요? 또는 ColdFusion에 익숙하지 않은 경우이 데이터를 구문 분석하는 데 필요한 정규 표현식만으로도 매우 유용합니다.
html/xml 콘텐츠를 구문 분석하기 위해 정규식을 사용하지 마십시오. xerces와 같은 dom/xml 파서를 사용하십시오 – stillstanding
이 다소 인기있는 답변을 참조하십시오. http://stackoverflow.com/questions/1732348/regex-match-open-tags-except-xhtml-self-contained-tags/1732454#1732454 –