파이썬에서 XML 파싱

나는 파이썬에서 xml을 처리하는 것을 간헐적으로하고 있지만 xml과 함께 약간의 장애물이있다. 나는 xml.dom.minidom을 사용하고 있으며, 그저 조금만 걱정할 뿐이라는 걱정을하지 않는다. 내가 얻는 곳은 이상한 문법으로 엉망진창이다.파이썬에서 XML 파싱

<enclosure name="link1" url="http://google.co.uk/vid.mp4" type="video/mp4" />

는 내가 코드를 넣고 함께 할 수 strugling하고하는 것은 내가 봤 아무것도 발견되지 않은 url 속성에서 문자열을 추출 할 수있는 방법을 얻을 수 있습니다. 나는 XML에서 더 많은 경험을 가진 사람이 이것을 수행하는 방법에 대한 아이디어가 있다고 생각했다. 벨로 난 당신이 BeautifulSoup 사용할 수있는이 섹션

files = urllib2.urlopen(x) 
data = files.read() 
files.close() 

dom = parseString(data) 

xmlTag = dom.getElementsByTagName('enclosure')[0].toxml() 
print xmlTag

출처

2014-07-20 bobthemac

- XML을 파싱 할 예정입니까? –

yea 나는 그것이 XML이 비디오를 포함하고있는 RSS 피드라는 것을 확신합니다. 나는 HTML과 XML의 차이점을 안다. 예를 들어 이름 링크를 실제로 인클로저라고 부릅니다. 다른 모든 요소는 XML과 동일합니다 – bobthemac

'> – bobthemac

에 대해 지금까지 가지고있는 코드 :

from BeautifulSoup import BeautifulSoup 

xml = '<enclosure name="link1" url="http://google.co.uk/vid.mp4" type="video/mp4" />' 
parsed_xml= BeautifulSoup(xml) 
print parsed_xml.enclosure['url']

출력을 파싱하려는 더 HTML처럼 보이는

http://google.co.uk/vid.mp4

출처

2014-07-20 22:21:44 alfasin

고마워요. 그런 식으로 아름다운 수프를 사용하십시오. – bobthemac

파이썬에서 XML 파싱

답변

관련 문제