2013-08-23 3 views
0

문자열 내부 URL을 추출해야합니다.문자열 내 URL을 추출해야합니다.

내 경우에는 HTML 텍스트가 db에 있는데 텍스트를 가져 와서 텍스트의 모든 URL을 찾고 다른 테이블에 삽입해야 할 때 URL을 SQL 또는 C#으로 찾는 방법을 제공 할 수 있습니다.

+0

정규식을 사용해 보셨습니까? –

+0

http://stackoverflow.com/questions/4750015/regular-expression-to-find-urls-within-a-string –

답변

1

이 텍스트는 정규 표현식을 사용하는 것입니다 할 수있는 가능한 방법의

Regex regx = new Regex("http://([\\w+?\\.\\w+])+([a-zA-Z0-9\\~\\!\\@\\#\\$\\%\\^\\&\\*\\(\\)_\\-\\=\\+\\\\\\/\\?\\.\\:\\;\\'\\,]*)?", RegexOptions.IgnoreCase); 

MatchCollection mactches = regx.Matches(txt); 
+1

'https''ftp'? – I4V

0

하나의 URL을 찾을 수 reqular 표현이다. 첫 번째 옵션은 DB에서 HTML을 추출한 다음 정규 표현식을 사용하여 직접 링크를 찾는 것입니다. 두 번째 옵션은 링크 태그를 먼저 찾은 다음 정규 표현식을 사용하여 URL을 추출하는 것입니다. 여기

당신이 정기적으로 C#에서 표현식 사용하는 방법에 대한 정보를 찾을 수 있습니다 (이 URL이 얼마나 복잡한에 따라 다름) 너무 쉽게하지 않을 수 있습니다 올바른 정규 표현식을 쓰고, 다른 한편으로 http://msdn.microsoft.com/en-us/library/system.text.regularexpressions.regex.aspx

을, 하지만 당신은이 질문에 대해 살펴해야 : 또한 regular expression for url

을, 여기 당신이 일반적으로 정규 표현식에 대한 많은 정보를 찾을 수 있습니다 (때를 당신에게 많은 도움이 될 수있는, RegexBuddy 같은 일부 응용 프로그램이 있다는 것을 염두에 두어야 귀하의 정규 표현식을 테스트합니다.) : http://www.regular-expressions.info/

관련 문제