2014-11-06 4 views
0

외부 웹 사이트의 페이지 소스 DOM을 가져올 수 있지만 \ r \ n 및 많은 공백이 있습니다.Python 변수에서 Strip r n

import urllib.request 

request = urllib.request.Request('http://example.com') 
response = urllib.request.urlopen(request) 
page = response.read() 
page = page.strip('\r\n') 
print (page) 

나는 행운을 빕니다. 어떻게 HTML로 만들 수 있습니까?

둘째, 반환되는 DOM을 javascript/jquery로 조작하는 논리는 무엇입니까? 생성 된 DOM에 "예 도메인"을 경고해야

alert(document.getElementsByTagName('h1')[0].innerHTML); 

: 내가 좋아하는 뭔가를 기대했다.

+0

"행운을 빌어 요"는 도움이되지 않습니다. 'print (page)'는 무엇을 출력합니까? – Andy

+0

@Andy'TypeError : str이 버퍼 API를 지원하지 않습니다. ' –

+0

당신이 알고 있는지 잘 모르겠지만'strip'은 문자열의 처음이나 끝에서만 문자를 제거합니다. 예를 들어''\ na \ nb \ n ".strip ("\ n ")'은'a \ nb '를 반환합니다. – Kevin

답변

2
'foo \r\n bar\r\n'.strip() 

'\r\n' 만 제거합니다. 텍스트 전체에 이러한 내용이 있다면 .replace()를 다음과 같이 연결해보십시오.

'foo \r\n bar\r\n'.replace('\r', '').replace('\n', '').replace(' ', '')