Python 스크립트를 사용하여 HTML 테이블에서 데이터를 추출하여 변수로 저장하고 싶습니다 (변수가있는 경우 동일한 스크립트에서 나중에 사용할 수 있음). 또한 스크립트가 테이블의 첫 번째 행 (구성 요소, 상태, 시간/오류)을 무시하도록합니다. 나는 외부 라이브러리를 사용하지 않는 것을 선호한다. 를 heresPython을 사용하여 HTML 테이블에서 데이터 추출
SAVE_DOCUMENT_STATUS = "OK"
SAVE_DOCUMENT_TIME = "0.408"
GET_DOCUMENT_STATUS = "OK"
GET_DOCUMENT_TIME = "0.361"
...
그리고 스크립트에 입력 :
새로운 파일로 출력과 같이해야
<table border=1>
<tr>
<td><b>Component</b></td>
<td><b>Status</b></td>
<td><b>Time/Error</b></td>
</tr>
<tr><td>SAVE_DOCUMENT</td><td>OK</td><td>0.408 s</td></tr>
<tr><td>GET_DOCUMENT</td><td>OK</td><td>0.361 s</td></tr>
<tr><td>DVK_SEND</td><td>OK</td><td>0.002 s</td></tr>
<tr><td>DVK_RECEIVE</td><td>OK</td><td>0.002 s</td></tr>
<tr><td>GET_USER_INFO</td><td>OK</td><td>0.135 s</td></tr>
<tr><td>NOTIFICATIONS</td><td>OK</td><td>0.002 s</td></tr>
<tr><td>ERROR_LOG</td><td>OK</td><td>0.001 s</td></tr>
<tr><td>SUMMARY_STATUS</td><td>OK</td><td>0.913 s</td></tr>
</table>
내가 bash는 그것을 시도를하지만 필요하기 때문에 * _TIME 변수를 최대 시간과 비교하면 부동 소수이기 때문에 실패합니다.
"한 가지 더, 나는 외부 라이브러리를 사용하지 않는다"산출한다. 에픽 실패. 정말 아름다운 스프를 사용해야합니다. 이런 종류의 일에 가장 좋습니다. –
다른 방법이 없다면 Beautiful Soup을 사용할 것입니다. – Marko
"from HTML"은 Beautiful Soup와 동의어입니다. – SingleNegationElimination