0
일부 데이터를 웹 사이트에 동적으로 다운로드하는 것처럼 보이는 웹 사이트를 긁어 내려고하고 있습니다. 나는 긁어 내고 싶다.Python Request Stream
<td class="border_TopRight border_Left">
Text - "TEST_NAME
<td class="border_TopRight">
Text - TEST_NAME_1
<td class="border_TopRight">
Text - TEST_NAME_2
<td class="apple dataCell border_TopRight font_green" id="Number of Apples" style="color: #333333; background-color: rgb(255, 255, 255);" rel="Apples ">
Text - '-'
다음 웹 사이트 등의 정보를로드합니다 :
웹 사이트로 시작, 내가 파이썬 요청을 사용하고로드 한 후 데이터를 얻을 스트리밍하려고
<td class="border_TopRight border_Left">
Text - "TEST_NAME
<td class="border_TopRight">
Text - TEST_NAME_1
<td class="border_TopRight">
Text - TEST_NAME_2
<td class="apple dataCell border_TopRight font_green" id="Number of Apples" style="color: #333333; background-color: rgb(255, 255, 255);" rel="Apples ">
Text - '999999.99'
을하지만, 나는 많은 성공을 거두지 못하고있다.
import requests
from bs4 import BeautifulSoup
tarball_url = xxxxx
r = requests.get(tarball_url, stream=True)
soup = BeautifulSoup(r)
td = soup.findAll('td')
for line in td:
print(str(line.get_text()))
이 반환 값 : 웹 사이트가 datacell를 업데이트 한 후 내가 데이터를 긁어 수있는 방법은
TEST_NAME
TEST_NAME_1
TEST_NAME_2
-
있습니까? 보통 몇 초 안에 꽤 빠릅니다.