2016-07-20 4 views
-1

Regex를 처음 사용했습니다. 디렉토리 경로에서 2 가지를 추출해야합니다. ../path_to_html/myhtmlpage.html?additional_args_or_url경로에서 html을 추출하는 정규식

어떻게 html의 이름을 얻을 수 있습니까? eg.myhtml 페이지

어떻게 전체 URL을 가져올 수 있습니까? eg.myhtmlpage.html? video_url = www.google.com/video

대단히 감사합니다! 여기

+0

이 로컬 컴퓨터에있는 파일은? 또는 구문 분석 할 URL이 있습니까? –

+0

.html의 첫 번째 검색 만 검색 할 수는 없습니까? 이 방법을 사용하면 url이 .html 앞에있는 마지막 "\"사이에 있고 문자열 끝에 이동합니다 – limbo

+0

정규 표현식을 처음 사용하는 사람이라면 할 수있는 최선의 방법은 문서와 함께 앉아서 알아내는 것입니다 . 당신이 이해하지 못하는 정규식을 누군가에게 주면 장기간 잘 지낼 수 없습니다. –

답변

0

당신은 갈 :

import re 
url = "/path_to_html/myhtmlpage.html?video_url=www.google.com/video" 
# Name 
print re.findall(r'/(\w+)\.html', url)[0] 
# Entire url 
print re.findall(r'/(\w+\.html.*)', url)[0] 

이 인쇄 :

myhtmlpage 
myhtmlpage.html?video_url=www.google.com/video 
+1

완벽하게 작동합니다! 고맙습니다! –

+0

기꺼이 도와 드리겠습니다! – Ohumeronen

+0

수락 할 수 있습니까? – Ohumeronen

관련 문제