2009-10-14 5 views
1

내 뇌가 넘침. 어제 도움이 된 모든 분들께 진심으로 감사드립니다. (어제의 thread에 무엇이라도 추가하면 최신 질문으로 표시되지 않습니까?)정규식 - 제외 제외

어쩌면 누군가가 다시 도움을 얻을 수 있습니다. 그것은 나를 위해 매우 중요합니다. S

<ul> 
<li> 
07.05.2009: 
<a href="#1">Test 1</a> 
</li> 
<li> 
05.01.2009: 
<a href="#2">Test 2</a> 
</li> 
</ul> 

이번에는 두 번째 부분을 읽어야합니다. 가장 좋은 것은 하나의 정규식에서 두 가지를 따로 따로 얻을 수 있습니다.

그래서 :

  1. 2009년 7월 5일
  2. 테스트 1

나는이

<li>.*?</li>(.*)</a></li> 

으로 시도하지만 테스트 1 테스트 2 전에 모든 제외해야

+1

당신이 무엇을하려고 않았다 시도

<li>([^:<]*)[^<]*<a[^>]*>([^<]*) 
Rahul

+1

어제의 질문에 대한 상호 참조를 포함해야합니다. –

+1

lxml 또는 ElementTree와 같은 HTML 파서 라이브러리를 사용하지 않는 이유는 무엇입니까? – artagnon

답변

3

시도?
+0

와우 정말 좋은 thx! 당신은 그것을 마음으로, 또는 프레소로합니까? –

+0

나는 여러 가지 입력을 가진 Expresso 같은 도구로 마음에 쓴다. – Scoregraphic

+0

멋진 인상을 준다. –

2

나는 두 번째 요하네스 Rössel,하지만 난

<li>[\s]*([^:<]*)[^<]*<a[^>]*>([^<]*) 
+0

thx 너에게! –

1

과 날짜 부분의 앞의 줄 바꿈을 버려야 할이

<li>([^>]*)<a[^>]*>([^>]*)</a></li> 
+0

당신도 정말 당신에게! –