파이썬에서 경로를 "./"또는 "../"부분을 제거하거나 기본 포트를 추가하거나 특수 문자를 이스케이프 처리하는 등 라이브러리 함수를 검색하고 있습니다. 결과는 동일한 웹 페이지를 가리키는 두 URL에 대해 고유 한 문자열이어야합니다. 예를 들어 http://google.com
과 http://google.com:80/a/../
은 같은 결과를 반환합니다.URL을 정규화/정규화 하시겠습니까?
파이썬 3을 선호하고 이미 urllib
모듈을 살펴 보았습니다. URL 분할 기능을 제공하지만 표준화는 없습니다. 자바는 비슷한 것을하는 URI.normalize()
함수를 가지고있다. (기본 포트 80은 주어진 포트와 같지 않다.)하지만 파이썬 같은 것이 있는가? 이것에 대해
'에 http : // google.com /는'HTTP'보다 동일하지 않습니다 : // 구글 .com : 80/a/... /'. 즉,'/ a'가 존재하지 않으면, 두 번째 경로는 실패합니다. "canonicalizing"함으로써, 당신은 특별한 경우를 잃고 유효하지 않은 URI로 시작했을 때 ... –