다음 구조의 지정된 HTML 테이블을 파이썬으로 정렬해야 할 필요성이 있습니다.Python에서 HTML 태그 (셀의 앵커 태그와 데이터 포함) 정렬
<table>
<tr>
<td><a href="#">ABCD</a></td>
<td>A23BND</td>
<td><a title="ABCD">345345</td>
</tr>
<tr>
<td><a href="#">EFG</a></td>
<td>Add4D</td>
<td><a title="EFG">3432</td>
</tr>
<tr>
<td><a href="#">HG</a></td>
<td>GJJ778</td>
<td><a title="HG">2341333</td>
</tr>
</table>
나는 이런 식으로 뭔가를하고 있어요 :
container = tree.findall("tr")
strOut = ""
data = []
for elem in container:
key = elem.findtext(colName)
data.append((key, elem))
data.sort()
문제는 그것이 <td>
내부의 텍스트로 정렬하는 것입니다. 나는 href가 아닌 anchor value로 정렬 할 수 있기를 원한다.
이를 달성하려면 어떻게해야합니까? 고마워.
@Eli을에는 문제가되지 않으나, 그래서 파이썬의 종류는 '키를 획득하기 전에에서 이전 "장식, 정렬, undecorate"관용구를 사용하여 영업 코드는 ='인수. 이 문제는 OP와 관련이 없습니다. OP의 특정 상황에서 키를 추출하는 올바른 방법에 관한 것입니다. –
@Alex : 네 말이 맞아. 나에게 그것은 OP가 관심있는 핵심이 무엇인지도 분명하지 않았기 때문에 코드를 작성하는 더 관용적 인 방법을 알려달라고 합의했다. –