나는 BeautifulSoup을 사용하여 여러 XML 문서 피드를 파싱 중이며 비표준 CDATA
태그를 사용자 정의 XML 태그로 대체하기 위해 사전 처리 작업을 수행하려고합니다. 설명하기 :CDATA NavigableString을 BeautifulSoup의 태그로 바꾸기
다음 XML 소스 ...
<title>The end of the world as we know it</title>
<category><![CDATA[Planking Dancing]]></category>
<pubDate><![CDATA[Sun, 16 Sep 2012 12:00:00 EDT]]></pubDate>
<dc:creator><![CDATA[Bart Simpson]]></dc:creator>
...로 변신 것 :이 질문은 SO 이전에 요청 된 생각하지 않는다
<title>The end of the world as we know it</title>
<category><myTag>Planking Dancing<myTag></category>
<pubDate><myTag>Sun, 16 Sep 2012 12:00:00 EDT<myTag></pubDate>
<dc:creator><myTag>Bart Simpson<myTag></dc:creator>
(I 몇 가지 다른 SO 쿼리를 시도). 나는 또한 .findAll('cdata', text=True)
을 사용하여 몇 가지 다른 접근법을 시도하고 각각의 결과에 BeautifulSoup replaceWith()
메서드를 적용하여 NavigableString
을 적용했습니다. 내가 시도한 시도는 대체가 없거나 재귀 루프처럼 보입니다.
이전 시도를 게시하게되어 기쁩니다. 그러나 여기에서의 문제는 매우 간단합니다. 누군가가 BeautifulSoup 3을 사용하여 위의 검색 및 교체를 수행하는 방법에 대한 명확한 예를 게시 할 수 있기를 바랍니다.