2014-09-14 4 views
0

BeautifulSoup을 사용하여 웹 사이트의 소스를 파싱 한 다음 청크를 가져옵니다. 목표는이 조각을 연결하여 전자 메일을 통해 자신에게 보낼 수있게하는 것입니다.html 소스를 파이썬으로 문자열로 바꾸기

내 문제는 태그 양식에 있기 때문에 항목을 연결할 수 없다는 것입니다. 문자열로 변환하려면 어떻게해야합니까?

예를 들어

, 어떻게 파이썬 문자열 객체로 아래 변환 할 수 있습니다, 또는 어떻게 트리플 따옴표 ("" ")을 arround를 포장 programaticall 수 있을까? 그것은 현재 나에게 구문 오류를 줄 것이다.

<td align="left" class="table-2">Date</td> 
<td align="left" class="table-2">Item</td> 

어떤 도움을 주셔서 감사합니다 당신이 BeautifulSoup로 태그 객체가있는 경우

답변

0

, 당신은 문자열로 변환 할 수 있습니다 str를 호출하여 :.

str(tag) 

In [120]: import bs4 as bs 

In [121]: soup = bs.BeautifulSoup('<td align="left" class="table-2">Date</td>') 

In [122]: tag = soup.find('td') 

In [123]: type(tag) 
Out[123]: bs4.element.Tag 

In [124]: str(tag) 
Out[124]: '<td align="left" class="table-2">Date</td>' 
관련 문제