2014-10-04 1 views
0

입력 ++ 태그를 추출, 즉 "/"계산하려면 : <s>asmE/, asyE/, asmA/t, asyA/s, asya/, asmi/n, asyA/m, AByA/m, eBi/s, ABi/s, eBya/s, ABya/s, ezA/m, AsA/m, ezu/, Asu/</s>http://regex101.com/r/yM2fA1/1어떻게 메모장에서 (같은</s>)

/에서 내가 http://www.sanskrit-lexicon.uni-koeln.de/scans/PWGScan/2013/downloads/pwgxml.zip에서 작업 XML 문서에 악센트를 표시하는 데 사용됩니다. 그러나 내가 / 만 세게된다면, 나는 </s></hom></h> 등등을 계산할 것이다. XML 태그를 제외하는 방법은 무엇입니까?

답변

0

에 대해 어떻게 :

찾기 무엇 : (?<!<)/(?! ?>)

설명 : 여기

(?<!<) : lookbehind, there're no < before the slash 
/  : slash character to be searched 
(?! ?>) : lookahead, there're no > (eventualy preceded by a space) after the slash 

lookaround에 대한 문서입니다.

+0

순수한 마법은 몇 초 만에 매력적으로 작동합니다. Lookaheadbehind 수업은 아직 내게 배울 수 있습니다. 튼튼하고 먼지도 없습니다. – gasyoun

+0

@ gasyoun : 기꺼이 도와 줬어. – Toto

0
유일한 목적을 카운트

:

Ctrl 키 + F 또는 검색 드롭 다운 메뉴에서을 찾아 물건을 검색 할로 / 입력을 클릭합니다. 이제 을 클릭하십시오. 현재 문서에서 모두를 찾으십시오. 문서에있는 /의 번호를 알려 주어야합니다. 번호를 적어 두십시오.

이제이 과정을 반복하되 </을 검색하십시오. 카운트의 차이는 원하는 검색의 실제 카운트입니다.

+0

나쁜 아이디어. 내 56Mb 문서에서 '/'를 계산하면 4M RAM, 몇 백만 건의 경우 약 20 분이 소요됩니다. 정기적으로 업데이트되는 네 개의 문서가 있습니다. 따라서 EmEditor 나 Notepad ++ 또는 PHP에서 일부 RegEx 마법을 사용하여 한 번에 가져오고 싶습니다. 내 계산기없이. – gasyoun

+0

메모장 + +로 여러 문서를 검색 할 수 있습니다. 느린 검색은 불행합니다. 텍스트 복사 붙여 넣기를 시도하고 MS 워드 또는 Google 크롬이나 파이어 폭스 등의 다른 도구로 검색하십시오. 미안하지만 더 도움이되지 못합니다. – Remian8985