2012-01-03 3 views
0

일부 괄호 안에있는 괄호와 내용을 일부 텍스트에서 제거해야합니다.괄호 안의 내용과 괄호 자체를 단락에서 제거하십시오.

정규식으로 이것을하고 싶습니다. 그러나, 나는 파이썬에서 처음으로 re에 대해 모른다.

텍스트 대체 투자 솔루션의 선두 주자 인 Direxion은 Angelo Pirri를 북서부 지역의 새 수석 지역 책임자로 지명했습니다. (Logo : http://photos.prnewswire.com/prnh/20100701/NY29766LOGO) Mr. Pirri는 전신주, 지역 중개인 판매상, 등록 된 투자 고문 (RIA) 및 기타 회사의 모든 채널을 통해 Direxion의 Buy-and-hold 대체 투자 전략 상품을 판매하고 모든 금융 전문가에게 배포하는 일을 담당합니다. 영토. 씨 Pirri는

내가하지 않은 ...

는 괄호 안의 물건을 없애 .... 북부 캘리포니아, 오레곤, 워싱턴, 하와이, 와이오밍, 아이다 호, 알래스카, 몬타나에 자문 서비스를 제공합니다 아직 아무 것도 시도하지 않았습니다 ... 나는 다른 사람이 무엇을해야하는지 말해 주길 바란다. 나는 어떤 일도하고 싶지 않다.

+1

후 컨텐츠 샘플 ... –

+0

yeargh ... 그것은이 텍스트 (텍스트) 텍스트 같이 보일 것 버디 – user557862

+1

http://docs.python.org/ library/re.html – RanRag

답변

0
text = "Some sample (with parenthesis) text" 
regEx = re.compile(r'([^\(]*)\([^\)]*\) *(.*)') 
m = regEx.match(text) 
while m: 
    text = m.group(1) + m.group(2) 
    m = regEx.match(text) 
print text 

그것은 당신의 텍스트와 일치하는 올바른 정규식 서식 단지 문제 ... 문자열에서 괄호의 위 반복적으로 제거 세트, 한 번에 설정,하지만 당신은 괄호를 중첩 한 경우 실패합니다. 그것은 완전히 다른 문제입니다.

+0

감사합니다. 나는 중첩 된 괄호가 없다고 가정 할 것입니다. 다루기 힘든 합병증이 될 수 있기 때문에, 실제로 발생하지는 않을 것입니다. – user557862

+0

실제로 이것은 제가 스크립트에 넣고있는 것입니다. 감사! – user557862

+0

다른 해결책은 더 좋습니다. :) 또는 적어도 청소기. – CNeo

6

가정없이 중첩 된 괄호 :

import re 

string = 'text (text) text (text) text' 

regex = re.compile('\(.+?\)') 
output = regex.sub('', string) 

print(output) 
# >>> text text text 
+0

감사합니다.이 솔루션이 다른 솔루션보다 나은지 여부를 알려주시겠습니까? 그들이 동등하지 않은 경우 더 나은 무엇이든 사용하고 싶습니다 – user557862

+0

이것은 나를 위해 일하고 있습니다. 내 스크립트에서 사용하려고합니다. WOOHOO stackoverflow AWESOME입니다. – user557862

관련 문제