아래는 Google 검색 결과에서 관련 항목으로 python tuple
입니다. (여기에 새 라인을 추가하여 화면에 맞게 수정했지만 Firebug에서 공개 한 Google 소스에서 얻은 원시 문자열에 대해 정규식을 테스트했습니다. 귀하의 정규식은이 문자열에 대한 일치를 제공하지 않았습니다.
<li class="g w0">
<h3 class="r">
<a onmousedown="return rwt(this,'','','res','2','AFQjCNG5WXSP8xy6BkJFyA2Emg8JrFW2_g','&sig2=4MpG_Ib3MrwYmIG6DbZjSg','0CBUQFjAB')"
class="l" href="http://www.korokithakis.net/tutorials/python">Learn <em>Python</em> in 10 minutes | Stavros's Stuff</a>
</h3>
<span style="display: inline-block;">
<button class="w10">
</button>
<button class="w20">
</button>
</span>
<span class="m"> <span dir="ltr">- 2 visits</span> <span dir="ltr">- Jan 21</span></span>
<div class="s">
The data structures available in <em>python</em> are lists, <em>tuples</em>
and dictionaries. Sets are available in the sets library (but are built-in in <em>
Python</em> 2.5 and <b>...</b><br>
<cite>
www.korokithakis.net/tutorials/<b>
python</b>
-
</cite>
<span class="gl">
<a onmousedown="return rwt(this,'','','clnk','2','AFQjCNFVaSJCprC5enuMZ9Nt7OZ8VzDkMg','&sig2=4qxw5AldSTW70S01iulYeA')"
href="http://74.125.153.132/search?q=cache:oeYpHokMeBAJ:www.korokithakis.net/tutorials/python+python+tuple&cd=2&hl=en&ct=clnk&client=firefox-a">
Cached
</a>
- <button title="Comment" class="wci">
</button>
<button class="w4" title="Promote">
</button>
<button class="w5" title="Remove">
</button>
</span>
</div>
<div class="wce">
</div>
<!--n-->
<!--m-->
</li>
FWIW, 나는 많은 이유 중 하나가 모든이 결과에는 <Va>
없다는 것입니다 같아요. Firebug에서 전체 HTML 소스를 복사하여 정규 표현식과 일치 시키려고했는데 전혀 일치하지 않았습니다.
Google은 결과를 표시하는 방식을 수시로 바꿀 수 있습니다. 특정 시간에 로그인 상태, 웹 기록 등의 요인에 따라 달라질 수 있습니다. 사용했던 특정 정규식이 효과가있을 수 있습니다. 지금 당장은,하지만 장기적으로 유지하기가 어려울 것입니다. 사람들은 솔루션이 안정적이지 않다는 것을 알기 때문에 html 파서를 사용하는 대신 정규식을 제공하는 것이 좋습니다.
'code'와'pre' 태그에 넣는 대신 코드를 선택하고 Ctrl-k를 눌러서 포맷하거나 (각 공백을 4 줄 간격으로 수동으로 들여 쓰기) 코드를 선택하십시오. 그리고 btw, html을 정규식으로 구문 분석하지 말고 html 파서를 대신 사용하십시오. 이걸 본 적이 있습니까? http://stackoverflow.com/questions/1732348/regex-match-open-tags-except-xhtml-self-contained-tags/1732454#1732454 – Amarghosh
그건 PHP 코드, 델파이 코드가 필요합니다. 그리고 내가 만났던 모든 델파이 파서는 그렇게 좋지 않습니다. 나는 어떤 일을하고 다른 일을 할 수있는 사람을 얻을 수 있습니다. RegEx는 더 좋은 해결책 인 것처럼 보였습니다. –
Chuck Norris조차도 정규식으로 html을 파싱 할 수있는 사람은 아무도 없습니다. – Amarghosh