나는 고통스럽고 간단한 문제에 대해 미리 스크립팅을하고 새해에 사과드립니다. 나는 꽤 철저히 검색 한 것으로 믿지만 분명히 다른 대답이나 요리 책이 나에게 충분히 이해되어서는 안된다. (예 : here - 아직도 그것을 얻을 수 없었다.) 나는 한 줄에 한 줄씩 문자의 문자열 (DNA라면 상관 없다)로 구성된 파일을 가지고있다. 각 문자열 위에 기본 문자열
많은 히스토그램을 사용합니다. 특히 이러한 히스토그램은 인간 게놈상의 세그먼트를 기준으로 한 기본 값입니다. x 축의 각 점은 DNA를 구성하는 네 개의 질소 염기 (A, C, T, G) 중 하나이며 y 축은 기지를 "호출"할 수 있었던 횟수를 나타냅니다 (또는 시퀀서 기계에 의해 인식되어, 게놈을 따라 서열을 결정할 수 있으며, 게놈을 따라 각 염기의 신
시퀀스 문자열 전체에 특정 문자열 ('GAATTC'라고 함)이 여러 번 반복되는 긴 시퀀스가 있습니다. 나는 현재 패턴 정규 표현식 .span()을 사용하여 'GAATTC'패턴이있는 곳의 색인을 제공합니다. 이제 그 색인을 사용하여 G와 A 사이의 패턴을 자르려고합니다 (즉 'G | AATTC'). 어떻게 일치 객체의 데이터를 사용하여 슬라이스 할 수
나는 작업중인 생물 정보학 프로젝트에 약간의 코딩 문제가 있습니다. 기본적으로, 내 임무는 데이터베이스에서 모티프 시퀀스를 추출하고 정보를 사용하여 시퀀스 정렬 파일에 주석을 달아주는 것이다. 정렬 파일은 일반 텍스트이므로 주석은 정교한 파일이 아닙니다. 추출 된 시퀀스를 정렬 파일 자체의 별표로 바꾸는 것만으로도 정교합니다. 나는 데이터베이스 파일을 스캔
현재 상업용 또는 비상업적 인 폭발 도구를 찾고 있습니다. 나는 현지 BLAST 검색에 NCBI 폭발을 여러 번 사용했지만 지금은 흥미로운 대안을 찾고 있습니다. 검색 중에 CUDA-Blast, GPU-Blast, WU-Blast, BlastStation2, mpiBlast 및 Turboblast와 같은 흥미로운 결과를 발견했습니다. 누구나 이러한 도구를
요소 0이 2D 배열이고 요소 1이 머리글 정보이고 요소 2가 rowname 인 목록 목록을 반환하는 함수를 정의하고 있습니다. 파일은 다음과 같은 경우 어떻게 파일에서이를 읽을 수 있습니다 유전자 S1 S2 S3 S4 S5 100 -0.243 -0.021 -0.205 -1.283 0.411 10000 - -0.79 0.063 -0.878 0.011 def
목록의 표준 편차를 계산하는 함수를 정의하고 있습니다. 때로는이 목록의 평균이 음수이므로 제 함수는 음수의 제곱근을 취할 수 없으므로 오류가 발생합니다. 이것은 단순 해 보입니다. 단지 생각할 수 없습니다. 음수의 제곱근을 취할 수 없기 때문에 음수가 있으면 -1을 곱하기 위해 함수에 대한 조건부를 작성하고 싶습니다. 이 문장을 작성하려면 어떻게해야합니까?