저는 Windows 7에서 python-3.x로 작업하고 있습니다. 수백만 개의 문자로 구성된 문자열이 있습니다. 예를 들어 :문자열의 특정 문자 범위 찾기
ATCGNNNATCGATNNNNNATCGANTCG
N
범위를 얻고 싶습니다. 여기에 [[4,7], [13,18], [23,24]]
. 큰 데이터이고이 방법이 너무 느리기 때문에 나는 단지 N
의 위치를 취한 다음 범위로 변환 할 수 없습니다. 정말 쉬운 문제인 것처럼 보이지만 사실 내 마음에는 좋은 길은 없습니다. 빠른 방법이 있나요?
'g.span()'을 사용하면 속도가 약간 빨라질 수 있습니다. – DSM
수백만 자의 경우 반복자를 한 번에 소비하지는 않겠지 만 위대한 접근 방식 +1 –
또한'g.span() '주위에 공백을 넣을 필요가 없음 –