2012-06-14 1 views
-3

소스 코드제목 정규 표현식

HTML = "<title>RUU</title>" 
reExtraTitle = re.compile("<title[^>]*>([^<]*)</title>", re.IGNORECASE) 
mcTitle = reExtraTitle.match(HTML) 
if mcTitle: 
    print mcTitle.group() 
else: 
    print "no Title" 

정규 표현식에 유래 날

+3

무엇이 문제입니까? (정규 표현식을 사용하여 HTML을 파싱하는 것과는 별도로) –

답변

4

에 오신 것을 환영합니다 도움이됩니다. 사람들은 오늘 하향 회선에 강요 당한다. 미안하다. 네가 네이티브 영어 연사가 아닌 것 같아, 맞지?

귀하의 질문은 SSCCE 원칙을 충족합니다. 연구 결과가 약간 밝음을 보여 주지만 실제로 질문하지는 않았지만, 귀하가 겪은 것이 분명합니다. 귀하의 답변은 읽어야 할 re module doc에 있습니다.

가 먼저 import re해야하고, 다른 사람이 암시 한대로 다음

print mcTitle.group(1) 

print mcTitle.group() 

을 변경, 당신은 아마도 dedicated html parser 대신 using regexp의 사용을 고려해야합니다.