-4
그래서 .txt 파일에 게놈 (A, C, G, T)이 반복되는 반복 시퀀스입니다. 예 : TCGTGTTGAGAGGTATGAGACCTCTGGCAAGTACTTTGCCTACAAGATGGAGGAGAA .... (반복되는 수백만 개의 문자가 별도의 파일에 저장되어 있습니다.) 이제 전체 게놈에 "ACGT"서열 모티프 번호를 찾는 코드를 작성하고 싶습니다. 누군가가이를 도와 드릴 수 있습니까?java에서 다른 파일에 저장된 데이터에서 시퀀스의 반복 횟수를 찾는 방법은 무엇입니까?
http://stackoverflow.com/questions/7378451/java-regex-match-count – RamPrakash
이것은 http://algs4.cs.princeton.edu/55compression/Genome.java.html에도 도움이 될 수 있습니다. – cheesey