're'패키지를 사용하여 파이썬에서 다음 문제를 해결하기 위해 마술 구문을 파악하는 데 단지 한 시간을 보냈습니다. 나는 잠시 주위 해킹,하지만 도전을 제시하고 싶습니다 :캡쳐 괄호와 비 탐욕적인 일치 제한이있는 정규식
은 다음 문자열이 우리의 테스트를 나타냅니다
*Structure song <!-- See Project:Project_Songs -->
*Structure song |
*Structure song title |
목적은 '노래', '노래'를 추출하는 것입니다, 그리고 '노래 제목'을 하나의 정규식과 함께 사용하십시오.
내 시도 :
r'\*Structure ([^\|]*)(?:<)?'
나는 내가 지금까지 시도한 다양한 조합은하지 않습니다. 내 회피 방법은 앰퍼샌드 '&'을 캡처 괄호의 제외 집합에 추가합니다. 그러나 추출 된 문자열에 '&'을 포함 할 수 없다고 가정하고 싶지는 않습니다.
대신 경기 후행 경계를 어떻게 생각합니까? –
'제목'패턴과 생략하고 싶은 것의 현저한 차이점은 무엇입니까? –
복잡한 정규 표현식을 작성하는 것이 아니라 단순히 [unescape] (https://docs.python.org/3/library/html.html#html.unescape)하지 않습니까? – jonrsharpe