나는 아름 다운 스프와 일부 html 폼을 구문 분석 오전. 기본적으로 약 60 개의 입력 필드가 대부분 라디오 버튼과 체크 박스입니다. 지금까지 다음 코드와 함께 작동 :연관 목록 파이썬
from BeautifulSoup import BeautifulSoup
x = open('myfile.html','r').read()
out = open('outfile.csv','w')
soup = BeautifulSoup(x)
values = soup.findAll('input',checked="checked")
# echoes some output like ('name',1) and ('value',4)
for cell in values:
# the following line is my problem!
statement = cell.attrs[0][1] + ';' + cell.attrs[1][1] + ';\r'
out.write(statement)
out.close()
x.close()
을 코드에서 속성을 선택 내 문제 경악을 나타내는 것처럼, HTML 템플릿은 입력 필드에 속하는 인수의 순서를 혼합, 추한 때문이다. 나는 name = "somenumber"value = "someothernumber"에 관심이 있습니다. 불행히도 내 attrs [1] 접근 방식은 작동하지 않는다. 왜냐하면 이름과 값이 내 html에서 같은 순서로 발생하지 않기 때문이다.
결과 BeautifulSoup 목록에 연관성있게 액세스 할 수있는 방법이 있습니까?
미리 제안 사항이 있으면 알려주세요.
, 하나의 루프가 충분했다. 내 대답을 Peter's 대답을 참조하십시오. –