2014-07-20 2 views
2

나는 파이썬에서 xml을 처리하는 것을 간헐적으로하고 있지만 xml과 함께 약간의 장애물이있다. 나는 xml.dom.minidom을 사용하고 있으며, 그저 조금만 걱정할 뿐이라는 걱정을하지 않는다. 내가 얻는 곳은 이상한 문법으로 엉망진창이다.파이썬에서 XML 파싱

<enclosure name="link1" url="http://google.co.uk/vid.mp4" type="video/mp4" /> 

는 내가 코드를 넣고 함께 할 수 strugling하고하는 것은 내가 봤 아무것도 발견되지 않은 url 속성에서 문자열을 추출 할 수있는 방법을 얻을 수 있습니다. 나는 XML에서 더 많은 경험을 가진 사람이 이것을 수행하는 방법에 대한 아이디어가 있다고 생각했다. 벨로 난 당신이 BeautifulSoup 사용할 수있는이 섹션

files = urllib2.urlopen(x) 
data = files.read() 
files.close() 

dom = parseString(data) 

xmlTag = dom.getElementsByTagName('enclosure')[0].toxml() 
print xmlTag 
+1

- XML을 파싱 할 예정입니까? –

+0

yea 나는 그것이 XML이 비디오를 포함하고있는 RSS 피드라는 것을 확신합니다. 나는 HTML과 XML의 차이점을 안다. 예를 들어 이름 링크를 실제로 인클로저라고 부릅니다. 다른 모든 요소는 XML과 동일합니다 – bobthemac

+0

'> – bobthemac

답변

2

에 대해 지금까지 가지고있는 코드 :

from BeautifulSoup import BeautifulSoup 

xml = '<enclosure name="link1" url="http://google.co.uk/vid.mp4" type="video/mp4" />' 
parsed_xml= BeautifulSoup(xml) 
print parsed_xml.enclosure['url'] 

출력을 파싱하려는 더 HTML처럼 보이는

http://google.co.uk/vid.mp4 
+1

고마워요. 그런 식으로 아름다운 수프를 사용하십시오. – bobthemac