유효하지 않은 XML이 포함 된 RSS 및 Atom 피드를 구문 분석 할 수 있기를 원합니다. 내가 직면 한 오류를 수정하고 싶습니다. 은 >
과 같은 간단한 것들을 포함합니다. ;
은 입니다. 누락 된 마감 태그 및 누락 태그는 누락되었습니다. 잘못된 주문에 나타납니다.Perl로 깨진 RSS 피드 구문 분석
이론상으로 이 잘못된 형식의 XML 문서를 전혀 구문 분석하지 못하도록하는 지에 대한 질문을 무시하고 싶습니다. 하나는 내가하고 싶은 일에 오히려 가까워 보이는 "전문 용어" 은 "태그 수프"입니다. 위에서 설명한 과 같은 간단한 오류를 허용하거나 수정할 수있는 이와 같은 파서를 만들기 위해 기존 CPAN 모듈을 사용해야합니까?