2010-07-30 4 views
1

Regex를 사용하여 테이블의 내용을 추출하려고합니다.Regex를 사용하여 HTML 테이블 구문 분석하기

테이블에서 대부분의 태그를 제거했습니다. <br> , <a href >, <img > & <b> 어떻게 제거 할 수 있습니까 ??

<b> 태그에 나는 그것이 어떤 라인에 근무하고 일부는 이

<b class="saadirheader">Email:</b> 

사람이 태그

<br> , <a href >, <img > and <b> 
을 제거 도와 줄 수

로 넣어 출력을 제공하는이 정규식

\s*<b[^>]*>\s* 
(?<value>.*?) 
\s* </b>\s* 

시도

전체 태그 -

감사 하라구요
<img src="Newrecord_files/spacer.gif" alt="" border="0" height="1" width="5"> 

<a href="mailto:[email protected]"> 

,

나빈 HS

+0

['strip_tags'] (http://php.net/strip_tags)를 이미 알고 있습니까? – Gumbo

+3

또한 필수 링크 : http://stackoverflow.com/questions/1732348/regex-match-open-tags-except-xhtml-self-contained-tags/1732454#1732454 – Amadan

+0

다음의 차이점에 대해 알아볼 수도 있습니다. 욕심 많고 욕심없는 표현. 나는. in vs * – relet

답변

1

사용하여 다음과 같은 정규식 :

(?:<br|<a href|<img|<b)(?:.(?!>))*.> 

이 정규식은 위에서 언급 한 모든 태그를 일치 할 것이다 당신이 잊어 이상의 태그가있는 경우 그냥 "|" 추가하려는 태그로 서명하고 첫 번째 괄호에 삽입하십시오.

관련 문제