2013-05-29 2 views
2

정규 표현식에와, 난 내용 캐릭터정규식 XML 태그 사이에 무엇인가

내가 사용하는 정규식에 <w:t ...></w:t> 사이에 모든 것을 반환하고자하면 다음과 같다 내용은 처음에 절단, 그래서 text</w:t>

내가 일치하는 정규식 싶은와 내용은 시작할 수 :

  • : $ 1 텍스트 '여전히

와 내가 지금이 개 정규 표현식에를 (다른 하나는 #^()([^<]+)#입니다)이 <w:t>

로 둘러싸인 텍스트와 일치 계속,하지만 난 것 :' '이

  • $ 2' juste 한 정규식에 넣어 좋아 :

    예 내용 :

    {#fuites}</w:t></w:r><w:r w:rsidR="00E4576A"><w:rPr><w:bCs/></w:rPr><w:t>{</w:t></w:r><w:r w:rsidR="0066055D"><w:rPr><w:bCs/> 
    </w:rPr><w:t>type</w:t></w:r><w:r w:rsidR="00E4576A"> 
    <w:rPr><w:bCs/></w:rPr><w:t>}</w:t></w:r> 
    <w:r w:rsidR="00900433"><w:rPr><w:bCs/> 
    </w:rPr><w:t xml:space="preserve"> 
    </w:t></w:r><w:r w:rsidR="00900433"> 
    <w:rPr><w:noProof/><w:lang w:eastAsia="fr-FR"/> 
    </w:rPr><w:drawing><wp:inline distT="0" distB="0" distL="0" distR="0" wp14:anchorId="1745F132" wp14:editId="7142C18F"> 
    <wp:extent cx="225632" cy="179073"/><wp:effectExtent l="0" t="0" r="3175" b="0"/> 
    <wp:docPr id="7" name="Image 7"/><wp:cNvGraphicFramePr><a:graphicFrameLocks xmlns:a="http://schemas.openxmlformats.org/drawingml/2006/main" noChangeAspect="1"/></wp:cNvGraphicFramePr><a:graphic xmlns:a="http://schemas.openxmlformats.org/drawingml/2006/main"><a:graphicData uri="http://schemas.openxmlformats.org/drawingml/2006/picture"><pic:pic xmlns:pic="http://schemas.openxmlformats.org/drawingml/2006/picture"><pic:nvPicPr><pic:cNvPr id="0" name=""/><pic:cNvPicPr/></pic:nvPicPr><pic:blipFill><a:blip r:embed="rId11"/><a:stretch><a:fillRect/></a:stretch></pic:blipFill><pic:spPr><a:xfrm><a:off x="0" y="0"/><a:ext cx="228029" cy="180975"/></a:xfrm><a:prstGeom prst="rect"><a:avLst/></a:prstGeom></pic:spPr></pic:pic></a:graphicData></a:graphic></wp:inline></w:drawing></w:r><w:r><w:rPr><w:b/><w:bCs/></w:rPr><w:t xml:space="preserve"> {Type}</w:t></w:r><w:r><w:rPr><w:b/><w:bCs/></w:rPr><w:tab/><w:t>{</w:t></w:r><w:r><w:rPr><w:bCs/></w:rPr><w:t>Description}</w:t></w:r></w:p><w:p w:rsidR="00FF7A5E" w:rsidRPr="00FF7A5E" w:rsidRDefault="00FF7A5E" w:rsidP="00CA7135"><w:pPr><w:rPr><w:bCs/></w:rPr></w:pPr><w:r><w:rPr><w:bCs/></w:rPr><w:t>{/fuites} 
    
  • +8

    는 정말이 링크를 사용할 수있는 기회를 갖는처럼 : http://stackoverflow.com/a/1732454/57191 – cwallenpoole

    +1

    @cwallenpoole을 - 단지 시간 문제였다. – sircodesalot

    +3

    사람들은 점에서 HTML 태그 – Quentin

    답변

    2

    을 당신은 세코 필요 정규식은 XML/HTML을 구문 분석 할 수있는 강력한 도구가 아니기 때문에 정규식을 사용할 수 있습니다 (사실 더 필요합니다). 원하는 것을 성공적으로 수행 할 수있는 하나 이상의 정규 표현식을 만들 수있는 방법이 없습니다. 이 작업을 수행하는 대신 PHP's XML Parser 또는 다른 XML 인식 라이브러리를 제안합니다.

    +1

    문제는 유효 XML, 그렇지이다? HTML 구문 분석기와 같이 매우 관대 한 XML 구문 분석기가 있어야하며이를 해결할 수 있어야합니다. 해제 구문 분석 할 수 있고 변환하거나 유효하게하는 방식으로 그것을 포장 할 수 없기 때문에 당신이 가지고있는 "XML은"너무 유효하지 않은 경우, 그것은 단지 *의 모습 데이터의 전혀 실제로 XML이 아니다 * XML과 같은 경우에는 막혀있을 수 있습니다. 어떻게 구조화되지 않은 데이터를 정확하게 파싱 할 수 있습니까? – edi9999

    +0

    당신이 작업하고있는 XML의 예를 제공 할 수있는 XML 문서의 한 부분이기 때문에) – dimo414

    +0

    예, 그들은 질문의 끝에 몇 가지 예를 내용입니다 – edi9999