2014-11-18 2 views
0

일부 데이터를 웹 사이트에 동적으로 다운로드하는 것처럼 보이는 웹 사이트를 긁어 내려고하고 있습니다. 나는 긁어 내고 싶다.Python Request Stream

<td class="border_TopRight border_Left"> 
    Text - "TEST_NAME 
<td class="border_TopRight"> 
    Text - TEST_NAME_1 
<td class="border_TopRight"> 
    Text - TEST_NAME_2 
<td class="apple dataCell border_TopRight font_green" id="Number of Apples" style="color: #333333; background-color: rgb(255, 255, 255);" rel="Apples "> 
    Text - '-' 

다음 웹 사이트 등의 정보를로드합니다 :

웹 사이트로 시작, 내가 파이썬 요청을 사용하고로드 한 후 데이터를 얻을 스트리밍하려고

<td class="border_TopRight border_Left"> 
     Text - "TEST_NAME 
    <td class="border_TopRight"> 
     Text - TEST_NAME_1 
    <td class="border_TopRight"> 
     Text - TEST_NAME_2 
    <td class="apple dataCell border_TopRight font_green" id="Number of Apples" style="color: #333333; background-color: rgb(255, 255, 255);" rel="Apples "> 
     Text - '999999.99' 

을하지만, 나는 많은 성공을 거두지 못하고있다.

import requests 
from bs4 import BeautifulSoup 

tarball_url = xxxxx 
r = requests.get(tarball_url, stream=True) 

soup = BeautifulSoup(r) 

td = soup.findAll('td') 

for line in td: 
    print(str(line.get_text())) 

이 반환 값 : 웹 사이트가 datacell를 업데이트 한 후 내가 데이터를 긁어 수있는 방법은

TEST_NAME 
TEST_NAME_1 
TEST_NAME_2 
- 

있습니까? 보통 몇 초 안에 꽤 빠릅니다.

답변

관련 문제