2015-01-14 10 views
4

BeautifulSoup bs4를 사용할 때 HTML 태그 내부에서 텍스트를 가져 오는 방법은 무엇입니까? 내가이 줄을 실행하면 :BeautifulSoup bs4로 HTML 태그의 내부 텍스트 값을 얻는 방법은 무엇입니까?

<title>page name</title> 

을 지금은 태그없이 그것의 내부 텍스트, page name를 가져올 지 :

oname = soup.find("title") 

을 나는 title 태그를 다음과 같이 얻는다. 그렇게하는 방법?

+1

@TLama 타이 TLama을 수정 :) – kibaya

답변

8

.text를 사용하여 태그에서 텍스트를 가져옵니다.

oname = soup.find("title") 
oname.text 

하거나 soup.title.text

In [4]: from bs4 import BeautifulSoup  
In [5]: import requests 
In [6]: r = requests.get("http://stackoverflow.com/questions/27934387/how-to-retrieve-information-inside-a-tag-with-python/27934403#27934387")  
In [7]: BeautifulSoup(r.content).title.text 
Out[7]: u'html - How to Retrieve information inside a tag with python - Stack Overflow' 

는 파일을 열고 다른 문자열처럼 이름 간단한 사용으로 텍스트를 사용하려면 다음에 대한

with open(oname.text, 'w') as f 
+0

내가 열 tis 변수를 사용하는 방법에 대한 질문을 가지고있다. ('oname.text', 'w') f : – kibaya

+0

@kibayam 그냥 변수를 열어 –

+0

열어 라. ork :) ty ^^ – kibaya

관련 문제