2010-08-06 2 views
0

다음은 링크 객체 목록을 생성하는 Python의 코드입니다. 중복 양식을 제거하고 싶습니다.Python에서 mechnize를 사용하여 genrated 링크에서 중복을 제거하는 방법?

cb = list() 
for link in br.links(url_regex="inquiry-results.jsp"): 
     cb.append(link) 
print set(cb) 

그러나 오류 unhashable instance을 반환합니다.

Link(
    base_url='http://casesearch.courts.state.md.us/inquiry/inquirySearch.jis', 
    url='/inquiry/inquiry-results.jsp?action=..........', 
    text='12', 
    tag='a', 
    attrs=[('href', '/inquiry/inquiry-results.jsp?action=.......'), 
    ('title', 'Go to page 12')] 
    ), 

[단지 편의를 위해 추가 된 줄 바꿈과 점]

어떻게 중복을 제거 할 수 있습니다 - link이 같은 것입니다?

답변

3

당신은 키로 URL을 사용하여 사전을 구축하고, 그 값을 얻을 수 있습니다 :

cb = {} 
for link in br.links(url_regex="inquiry-results.jsp"): 
    cb[link.url] = link 
print cb.values() 
관련 문제