2010-07-17 5 views
0

웹 페이지에서 URL을 추출하고 싶습니다. URL 자체는 하이퍼 링크가 아니며 단지 텍스트 일뿐입니다. 예를 들어 http://www.example.com, http://example.com, www.example.com 등등입니다. 정규식에서는 매우 새로 워서 온라인으로 20 개의 표현을 온라인으로 붙여 넣을 수 있습니다. 내가 제대로하고 있는지 알지 못합니다. 어떤 도움이라도 대단히 감사 할 것입니다.URL을 추출하는 표현식을 만들려고합니다.

+0

정규식 버디 (http://www.regexbuddy.com/) 및 정규식 쪽지 (http://www.addedbytes.com/cheat-sheets/regular-expressions-cheat-sheet/) 당신의 친구입니다 ... –

+2

URL을 추출하기 위해 어떤 언어를 사용하고 있습니까? 그리고 그것에 대해 어떻게 생각하십니까? 어떤 정규식을 사용하고 어떻게 실행하는지 보여주는 예가 도움이 될 것입니다. – Chris

+0

iam이 아주 새로운하지만 그 소프트웨어가 실행되고 그게 내가 그랬어 .net 소프트웨어가 귀하의 선택을 구체화하기 위해 정규 표현식을 사용하는 것보다 전체 콘텐츠를 추출하는 것 같아요 ... 나는 웹 사이트 URL을 때로는 추출하려는 그것들 중 10 개는 때로는 아무도 때때로 100이 아닙니다. 하나는 문제가되지 않습니다. 하나의 정규식을 사용하는 것은 i가 온라인입니다. iam이 그들을 올바르게 구현하는지 ... i ahev는 성공적으로 정규 표현식을 얻었습니다. 전자 메일 및 전화 번호를 얻으려고 노력하지만 URL을 얻으려면 얻을 수 있습니다. 단 하나의 URL을 선택하지 마십시오 .. – kyle

답변

0

아마도 .을 (를) 이스케이프하지 않을 것입니다. 각각 \.을 사용해야합니다.

strfriend.com을 살펴보십시오. 그것은 URL 예제를 가지고 있으며 그것을 그래픽으로 표현합니다.

이 제안의 예는 다음과 같습니다

^((ht|f)tp(s?)://|~/|/)?(\w+:\[email protected])?([a-zA-Z]{1}([\w-]+.)+(\w{2,5}))(:\d{1,5})?((/?\w+/)+|/?)(\w+.\w{3,4})?((\?\w+=\w+)?(&\w+=\w+)*)?

+0

(http | ftp | https) : \/\/[\ w \ -_] + (\ (\ w \ - \ @?^= % &/~ \ + #]) ? 이 코드가 작동했습니다. – kyle

+0

죄송합니다. 코드가 작동 했습니까? 또한, 왜 당신은 '&'을 찾고 있습니까? XML 문서에서 URL을 검색하고 있습니까? – Eric

0

나는 HTML 페이지 내 링크를 찾을 정규식 사용에 대한 게시물을 작성한 사람 (의도는 다음과 같은 문서에 외부 링크 또는 링크를 열 자바 스크립트를 사용하는 것이 었습니다 팝업 창에서 PDF 등).

마지막 정규식이었다 ^ ([./] +?) (: 자산 | HTTPS : // ((: WWW) integralist)??!?.?)?

전체를 게시물은 여기에 있습니다 : http://www.integralist.co.uk/javascript/regular-expression-to-open-external-links-in-popup-window/

해결책은 완벽하지는 않지만 올바른 방향으로 안내 할 수 있습니다.

마크

관련 문제