2010-04-29 4 views
1

태그의 href 속성에만 국한되지 않는 일반 텍스트를 URL로 파싱하려면 어떻게해야합니까?일반 텍스트의 URL을 구문 분석하십시오.

Python의 모든 코드 예제가 제공됩니다.

+0

근처 복제를 참조하십시오처럼

그래서 파이썬 코드 예제를 볼 수 있었다 : http://stackoverflow.com/questions/520031/whats-the-cleanest-way-to-extract-urls-from- 문자열 사용 파이썬 – mjv

답변

1

Jan Goyvaerts' blog를 참조하십시오.

result = re.findall(r"\b(?:(?:https?|ftp|file)://|www\.|ftp\.)[-A-Z0-9+&@#/%=~_|$?!:,.]*[A-Z0-9+&@#/%=~_|$]", subject) 
관련 문제