구문 분석을 위해 BeautifulSoup
라이브러리를 사용하는 코드가 있지만 매우 느립니다. 코드는 스레드를 사용할 수 없도록 작성됩니다. 아무도 도와 줄 수 있습니까?BeautifulSoup (Python) 코드 최적화
구문 분석 및 DB에 저장하기 위해 BeautifulSoup
을 사용하고 있습니다. save
문을 주석 처리하면 여전히 오랜 시간이 걸리므로 데이터베이스에는 아무런 문제가 없습니다.
def parse(self,text):
soup = BeautifulSoup(text)
arr = soup.findAll('tbody')
for i in range(0,len(arr)-1):
data=Data()
soup2 = BeautifulSoup(str(arr[i]))
arr2 = soup2.findAll('td')
c=0
for j in arr2:
if str(j).find("<a href=") > 0:
data.sourceURL = self.getAttributeValue(str(j),'<a href="')
else:
if c == 2:
data.Hits=j.renderContents()
#and few others...
c = c+1
data.save()
의견이 있으십니까?
참고 : 나는 이미 here이 질문을하지만 불완전한 정보로 인해 닫혔습니다.