2010-08-17 5 views
0

정말 간단한 상황 :reg exewby - 문자를 일치 시키지만 출력에는 포함시키지 않으려면 어떻게 지정합니까?

예 : 이 캐릭터 :

my dog said "woof" today

내가하지만, 따옴표없이, 따옴표로 문자열을 좀하고 싶습니다

...

--- 자세한 내용 ---

불행하게도 정규식입니다 타사 소프트웨어를 통해 기본 엔진을 모릅니다.

href="http://pagingdrgupta.blogs.cnn.com/2010/08/17/dengue-fever-increases-in-florida/?hpt=T2">Dengue outbreak 

현재 정규식 :

(https?://)?([-\w]+(\.\w[-\w]*)+|([a-z0-9]([-a-z0-9]*[a-z0-9])?\.))+(com|edu|biz|gov|in(t|fo)|mil|net|org|[a-z][a-z]\.[a-z][a-z])\S*)

이 반환

http:.../?hpt=T2">Dengue

시작하고 정규식 법과의 끝을 " 추가 여기

문자열입니다 ks이지만, "을 포함합니다.

아마도 다른 방법이 있을까요?

+0

귀하의 질문에 따옴표없이 따옴표로 묶은 문자열을 일치시키고 싶지만 정규식은 URL과 일치하도록 의도 된 것입니다. 따옴표에 묶인 URL이나 일치하는 URL을 찾으려고합니까? –

답변

0

이것은 사용중인 정규 표현식의 "맛"에 달려 있습니다. 정규식 엔진이 lookarounds (긍정적 인 lookbehind, positive lookahead, negative lookbehind 및 negative lookahead)을 지원하는 경우이 작업을 수행 할 수 있습니다.

구문도 맛이 다양하기 때문에 질문 및/또는 태그를 편집하여 작업중인 언어를 표시하면보다 구체적인 답변을 얻을 수 있습니다.

+0

Unforunately 정규 표현식은 타사 소프트웨어를 통해 이루어 지므로 기본 엔진을 모릅니다. | 다음은 문자열입니다 : HREF = "http://pagingdrgupta.blogs.cnn.com/2010/08/17/dengue-fever-increases-in-florida/?hpt=T2"> 뎅기열 발생 | 현재 정규식 : ? (- [az] [az] \. [a-z0-9])?]) + (com | edu | biz | gov | [az]) \ S *) | 이 반환 HTTP : .../HPT = T2 "> 뎅기열 | 추가"를 시작하고 정규식 작품의 끝,하지만 "를 포함하는 | 아마 거기에 다른 방법을 – Kieryn

+2

@Kieryn가 그를 추가하려면?.? 질문 : –

+0

정규 표현식 소프트웨어가 캡처 그룹을 지원하지 않습니까? 문자열에 href가 하나만 있으면 href = "([^"] +)와 같은 식으로 "작동합니다 (URL을 캡처해야 함). – cam

관련 문제