에서 MP3 파일의 URL의 href 속성에 대한 정규식이 필요합니다, 나는 파이썬 re 모듈을 사용하여이 정규식 함께했다 :내가 cgoldberg에 의해 이전 스택 오버플로 질문 공헌을 바탕으로 파이썬
import re
urls = re.finditer('http://(.*?).mp3', htmlcode)
변수의 URL은 반복 가능 객체와 내가 하나 이상있는 경우 개별적으로 MP3 파일의 URL에 액세스 루프를 사용할 수 있습니다
for url in urls:
mp3fileurl = url.group(0)
이 기술은, 그러나, 때때로 작동합니다. 나는 정규 표현식이 완벽하게 구현 된 파서 모듈만큼 신뢰할 수 없다는 것을 알고있다. 그러나 때로는 동일한 페이지에서 신뢰할 수 없습니다.
일부 URL 항목에 대해 http 이전의 모든 것을 수신하는 경우가 있습니다.
정규식에 비교적 익숙합니다. 그래서, 그것에 대해 갈 수있는보다 믿을만한 방법이 있는지 궁금합니다.
미리 감사드립니다. stackoverflow를 처음 접 하시면서 몇 가지 답변을 제공해 주실 것을 기대합니다.
-1 : "신뢰할 수없는"의 어떤 정의를. "때로는 효과가있다"는 표현이 모호합니다. 이것이 작동하지 않는 구체적인 예가 있습니까? 오류에서 일부 오류 역 추적? 일부 샘플 데이터가 구체적으로 중단됩니다. 이것이 작동하지 않는 곳에서 가능한 가장 작은 예제를 제공해주십시오. –