2011-05-16 4 views
2

안녕하세요 자바 프로그램에서 정규 표현식을 사용하려고합니다. 정규 표현식에서 길이가 알려지지 않은 문자열을 식별하고 charachters는 'C', 'A', 'G'또는 'T'만 사용하고 싶습니다. 도움 주셔서 감사합니다.DNA 코드를 나타내는 문자열의 정규식

답변

5

쉽고, 단지 문자 클래스를 사용

[CAGT]+ 

또는

전체 문자열은 일치를위한 문자의 CAGT의 구성해야하는 경우 :

^[CAGT]+$ 
+0

전체 문자열 만 'C', 'A'로 구성 될 수있다 ' T '또는'G ' –

2

을 위에 추가 :

^[CAGTcagt]+$ 

소문자와 대문자의 구분을 방지합니다.

+0

/i 플래그가 처리하지 않습니까? –

2

나는 가장 많이 투표 한 답변에 동의하지 않습니다. [ACGT]+을 사용하면 큰 문자열로 인해 많은 메모리가 사용됩니다. 그래서 대신 부정 정규식을 사용하고, 문자열이 아닌 [ACGT]를 포함하지 않는 경우 대신 문자를 확인하십시오

str !~ [^ACGTacgt] 
관련 문제