정말 바보 같아서 미안하지만 파이썬에서 도움이 필요합니다.정규식을 사용하여 Python 2.7에서 html을 구문 분석 - 실제로 이해하지 못함
['<a href="needs to be cut out">Foo to BAR</a>', '<a href="this also needs to be cut out">BAR to Foo</a>']
그래서 나는이 튜플을 가지고 있고, 나는 그 href 속성 내부의 어떤 내부 <a>
태그 무엇을 잘라 필요 - 기본적으로 내가 좋아 보이는 튜플 싶어 : 내부
[["needs to be cut out", "Foo to BAR"], ["this also needs to be cut out", "BAR to Foo"]]
을 예를 들어 특수 기호 많이 있습니다 href 속성,
<a href="?a=p.stops&direction_id=23600&interval=1&t=wml&l=en">
내가 정말하려고 필요가없는 경우, HTML 파서를 사용하여 너무 많은 문제가 있다고 생각대로 객체 트리를 구문 분석하지만 웹 페이지에서 몇 개의 URL과 단어 만 필요합니다. 하지만 정규 표현식을 만드는 법을 정말로 이해할 수는 없습니다. 내가 만든 Regexes 완전히 틀린 것 같습니다. 그래서 누군가가 저를 도울 수 있는지 묻고 있습니다.