나무에 유용한 Newick 형식을 구문 분석해야합니다. 또 다른 예를 들어,텍스트의 여러 부분에서 다른 기호를 여러 번 일치시키는 정규식
(A,B,(C,D)E)F
나 : 그것은 노드 표시 괄호, 쉼표 및 문자 시리즈처럼 보이는
(,(((,(,)),),))
(,)
요소는 같은 부모 노드를 의미한다. 내 목적 (두 리프 사이의 경로 길이를 측정하기 위해)에 중첩 된 요소를 찾는 것이 필연적으로 필요합니다.
그럼, 내 질문은 다른 기호를 동일한 횟수만큼 일치시키는 방법입니까?
CCCAAABBACCCABCCAAABBBBBBACCCCCABBBABBCCAABB
정규식가 반환해야합니다 : ['AABB','AB','AAABBB','AB','AB','AABB']
반복 횟수가 다른 때마다
예를 들어, 내가 문자열 AB
패턴과 일치하고 싶다. 따라서 A{n}B{n}
가 작동하지 않습니다.
감사합니다.
Perl을 말할 수 있으면 다음과 같이 유용 할 수 있습니다. http://edwards.sdsu.edu/labsite/index.php/robs/375-parsing-newick-trees – Steve
이것은 정규식이 아니며 Python regexes는 ' 재귀를 지원하지 않으므로 정규 표현식만으로는이를 수행 할 수 없습니다. –
'** AABBB **'또는'** AAABB **'에서'AABB'를 찾으시겠습니까? –