vim을 사용하여 외부의을 모두 제거하려고 시도했습니다. <text>
블록입니다. 이것은 개행과 다른 (관련없는) 태그들에 걸쳐 있어야합니다.태그 외부 텍스트 삭제
정규식을 사용하여 텍스트를 개행 문자로 대체하려고 시도했지만 몇 가지 이유 중 하나가 실패했습니다. 그 중 하나는 내 시도가 여러 줄에 걸쳐 있지 않았기 때문에 내 성냥을 비 욕심 많게해야합니다. (어떻게 든 {-}
를 사용하여 수행됩니다 그?)
가 I의 모습 삭제하고자하는 내용과 일치해야합니다 정규식 : <//text>.*<text.*>
하지만이 경기가 아닌 욕심 할 경우, 나는 다른 문제가있을 수 있습니다. (나는 또한 내가이 일을 처음에 정리 한 부분 태그 섹션을해야합니다 알고 있습니다.)
내가 복용해야 또 다른 방법이 있는가, 또는 누군가는 사이하지 모든 컨텐츠 을 제거하기 위해 저를 인도 할 수 vim을 사용하여 태그?
편집 : 샘플 텍스트를 포함
<contributor>
<username>MalafayaBot</username>
<id>628</id>
</contributor>
<minor />
<comment>Robô: A modificar Categoria:Vocábulo de étimo latino (Português) para Categoria:Entrada de étimo latino (Português)</comment>
<text xml:space="preserve">={{-pt-}}=
==Substantivo==
{{flex.pt|ms=excerto|mp=excertos}}
{{paroxítona|ex|cer|to}} {{m}}
# [[extrato]] de um [[texto]], [[fragmento]]
#: ''A seguir, um '''excerto''' do texto original.''
===Tradução===
{{tradini}}
* {{trad|es|extracto}}
* {{trad|fr|extrait}}
{{tradmeio}}
* {{trad|en|excerpt}}
{{tradfim}}
=={{etimologia|pt}}==
:Do latim ''[[excerptu]]'' (colhido de).
=={{pronúncia|pt}}==
===Brasil===
* [[SAMPA]]: /e."sEx.tu/
* [[AFI]]: /esˈertu/
[[zh:excerto]]</text>
<sha1>8i1zywj37s74ah4wnai11ohorfjn8j5</sha1>
<model>wikitext</model>
는 예를 들어 – Kent
을 제공하십시오 당신이 당신의 파일에 하나의''블록을 수행 그것으로, 추출은만큼 쉽다? –
Kent
정규식은 정말이 도구가 아닙니다. 이것은 html을 구문 분석하기에 좋지 않은 이유에 대한 흥미로운 읽을 거리가 될 것입니다. http://stackoverflow.com/questions/1732348/regex-match-open-tags-except-xhtml-self-contained-tags – FDinoff