2010-07-07 3 views
1

에 나는이 샘플 문자열이 있습니다신참 정규식

≪! [If Gte Mso 9]>≪Xml> ≪Br /> ≪O:Office Document Settings> ≪Br /> ≪O:Allow Png/> ≪Br /> ≪/O:Off... 

을 그리고 나는 ">"에서 "≪"에서 시작 및 종료 구체적으로 무엇을 대상으로, 그리고 어떤 공간 "으로 대체 것 ".

Rubular를 사용했지만이 설정 방법을 배우는 데 어려움을 겪고 있습니다.

어떤 idaes?

답변

2
result = subject.gsub(/≪[^>]*>/, '') 

트릭을 수행해야합니다.

[^>]* 의미 : >을 제외한 모든 문자를 일치시킵니다.

0

그냥 도움이되는 힌트, 나는 정규식 디버깅을 쓰기에 도움이 Rubular를 사용합니다.

0

정규 표현식으로 XML을 구문 분석하려고하는 것처럼 보입니다.이 문서에서 필요한 데이터를 추출하는 것은 매우 어렵고 약한 방법입니다.

XPath 또는 DOM을 사용하여 구문 분석을하고 필요한 정보를 선택하는 것이 좋습니다.