2017-03-12 6 views
-1

나는 html을 정규식으로 분할하여 얻은 데이터 목록을 가지고 있습니다.IndexError :리스트 인덱스가 범위를 벗어났습니다.

data_list = re.findall(r'<tr.*?>(.*?)<\/tr>', html) 

DATA_LIST에서 나는 루프는 내가 예를

open = re.findall(r'kurs".*?>(.*?)<\/td', x)[0].strip('</span>') 

에 대한 변수 개방을 정의하려는 그것은 나에게 오류 줄 때 :

Traceback (most recent call last):

File "", line 2, in open = re.findall(r'kurs".?>(.?)</td', x)[0].strip('')

IndexError: list index out of range

미리

답변

0

이 감사를 오류는 해당 색인이있는 요소가 목록에 없음을 의미합니다. 따라서 목록에 re.findall이 반환 한 첫 번째 요소가 없으므로 아무 것도 발견되지 않았습니다.

그런데, HTML 구문 분석에 정규식을 사용하지 않는 것이 좋습니다. BeautifulSoup 및 lxml과 같은 HTML 지향 프레임 워크를 사용하는 것이 좋습니다.

관련 문제