2012-05-10 6 views
1

나는 기계어를 사용하여 an .aspx web page을 긁어 내려고합니다. 하지만 나는 DTD를 수동으로 제거하더라도 재미있는 ParseError: unexpected '[' char in declaration 오류가 계속 발생합니다.기계어로 ASPX 스크래핑 : 양식을 가져올 수 없습니까?

여기에 전체에 내 코드입니다 : 그것은 마지막 줄에 ParseError: unexpected '[' char in declaration 실패

url = 'http://corporate.marksandspencer.com/aboutus/where/international_stores' 
browser = mechanize.Browser() 
browser.open(url) 
browser.select_form(nr=0) 

. 누구든지 잘못 될 수있는 것을 제안 할 수 있습니까?

+0

흠, 당신은이 포스트 즉,의 코드, 대'url'을 정리할 수있는'INTERNATIONAL_URL' ... –

+0

고정 - 미안. – Richard

+0

왜 lxml 구문 분석을 사용하지 않습니까? – Efazati

답변

6

나는 비슷한 종류의 문제도 가지고 있었다. 나는 다음 줄을 처음에 추가했고 나에게 도움이되었다.

self.browser = mechanize.Browser(factory=mechanize.RobustFactory()) 
관련 문제