다음 코드가 있습니다.BeautifulSoup 출력 뒤에 공백이 있습니다. .strip()
html = urllib2.urlopen(
'https://ebet.tab.co.nz/results/CHCG-reslt05070400.html').read()
soup = BeautifulSoup(html)
data = soup.findAll('div', {'class' : 'header bold'})
match = re.search('R', data[0].text)
race_title = data[0].text[(match.start()):]
race_title = str(race_title.strip(' \t\n\r'))
print race_title
내가 콘솔에서 화면에 수 출력은 아래 내가 스트립 SPRINT와 C0하지만 사이에 공간의 모든 유형을 제거 것이라고 생각
Race 1 PEDIGREE ADVANCE SPRINT
C0
295 m
그래서 내가 원하는 분명히 내가 뭔가를 놓친 거지입니다 이 결과를 이해하는 데 도움이됩니다. bs4가 유니 코드 등으로 문자열을 출력했기 때문입니까?
모든 공백을 제거 하시겠습니까? – WeaselFox
"Race 1 PEDIGREE ADVANCE SPRINT C0 295 m" –
형식의 출력 문자열이 필요하므로 줄 바꿈을 제거 하시겠습니까? 'race_title.replace ("\ n", "")'을 사용하십시오. 이 모든 정보에 대한 문서를 읽으십시오. http://docs.python.org/library/stdtypes.html – WeaselFox