나는 세 번 반복되는 문자열에서 하위 문자열을 찾고 gregexpr
을 사용하여 얻은 하위 문자열을 제거합니다. 그러나, 하위 문자열을 찾으려는 시도에서 미리보기를 제거해야합니다. 예를 들어 kajaaaaaaaaaaaa
문자열을 생각해보십시오. 여기서 aaaa
은 aaa
, aa
및 a
과 함께 출력됩니다. 마지막 세 개가 aaaa
에 포함되어 있기 때문에 어떻게 제거 할 수 있습니까? 나는 많이 시도했지만 그것을 할 수 없었습니다. 나는 적어도 세 번 연속적으로 반복되는 하위 문자열을 포착하려고합니다.look ahead ahead in regex
s <- 'kajaaaaaaaaaaaa'
m <- gregexpr(sprintf'(?=(.{2,})\\1{2,})',t) s, perl=TRUE)
unique(mapply(function(x, y) substr(s, x, x+y-1),
attr(m[[1]], 'capture.start'),
attr(m[[1]], 'capture.length')))
당신이 사용하고있는 정규 표현식을 게시 할 수 있을까요? – ekrah
당신의 필요를 이해하는 것은 너무 어렵습니다. 예상 한 ouptut은 무엇입니까? 더 많은 예제를 게시 할 수 있습니까? –
'look ahead ahead in regex' - 정규식을 파싱하고 있습니까? – sln