bioinformatics

    1

    1답변

    멀티 스레딩과 R에서 쉘 스크립트를 실행하지만, 내가 쉘 스크립트에서 여러 스레드를 설정 한 경우에도 하나의 스레드를 사용하는 것 같다. 이 경우 여러 스레드를 사용하려면 어떻게해야합니까? 코드는 내가 R 16 개 코어이 실행을 얻는 방법 system("blastp -query query.fasta -db db.fasta -num_threads 16 -ou

    2

    1답변

    대용량 50MB DNA 시퀀스와 약 15 문자 중 작은 것을 제공하는 Python 프로그램을 작성해야합니다.이 시퀀스는 15 자의 모든 시퀀스 목록을 반환합니다. 하나는 큰 것에서 그들이 어디에 있는지뿐만 아니라 주어진다. 내 현재의 접근 방식은 먼저 모든 서브 시퀀스 얻을 수 있습니다 : def find_similar_sequences(seq, data)

    0

    1답변

    쌍 샘플 (종양 및 정상)을 사용하여 gatk 재조정을 사용하고 싶습니다. 팬더를 사용하여 데이터를 구문 분석해야합니다. 그것이 내가 부른 것입니다. InputFunctionException in line 17 of /home/maurizio/Desktop/TEST_exome/rules/samfiles.rules: KeyError: '432/432_433

    0

    1답변

    나는 생물 정보학 파이프 라인을 만들기 위해 snakemake를 사용하고 싶다. 그리고 나는 그것을 봤고 문서와 다른 것들을 읽었지 만, 아직도 어떻게 작동하는지 알지 못한다. 다음은 원시 데이터 파일 중 일부입니다. RAWDATA/010_0_bua_1.fq.gz, RAWDATA/010_0_bua_2.fq.gz RAWDATA/11_15_ap_1.fq.gz,

    1

    1답변

    큰 서열 (F) 내에서 발생하는 작은 DNA 서열 (R)의 수를 찾고 조사하려고하는데, R은 몇 가지 문자를 가질 수 있습니다 변하기 쉬운. 내가 이것을 생각할 수있는 가장 쉬운 방법은 R에 대한 비율을 설정하고 F에서 80 %를 초과하는 모든 히트를 계산하는 것이지만, 이렇게하는 것처럼 보이는 명령 (예 : difflib의 SequenceMatcher 또

    1

    1답변

    유전자 뱅크 파일 .gbk에서 특정 유전자를 추출하고 싶습니다. 내 문제는 다음과 같습니다. 파일을 처리하기 위해 각 궤적의 헤더가 특정 형식이어야하며 내 파일에 없습니다. 내가 파일을 구문 분석하고 다음과 같은 헤더를 교체하려면 : LOCUS NODE_1_length_393688_cov_17.8554393688 bp DNA linear BCT22-MA

    2

    1답변

    biopython을 처음 사용했습니다. 이것이 기본적인 질문이라면 저를 용서하십시오. 시퀀스를 입력하고 정렬 한 다음 원래 시퀀스 (ungapped)와 정렬 된 시퀀스 (gapped)의 인덱스 위치를 참조 할 수 있어야합니다. 내 실제 예는 enolase (Uniprot P37869 및 P0A6P9)입니다. 기질 결합 라이신은 대장균에서 392 및 B. s

    0

    1답변

    큰 파일이기 때문에 vcf.gz 파일의 압축을 풀지 않고 내 노트북에는 공간이 없습니다. 나는 일을 시도 : gunzip -c file.vcf.gz > bgzip -c > file.vcf.bgz 을하지만 그것은 작동하지 않았다. 생각?

    0

    1답변

    데이터 시퀀스에 DNA 시퀀스가 ​​포함되어 있습니다.이를 데이터 표현식으로 변환하고 싶습니다. 이 문서에서와 마찬가지로 : 이 과정은 무엇인가 (변환), 나는 그것에 대해 검색 할? 어떻게 파이썬으로 적용 할 수 있습니까? 큰 배열로 데이터 집합 입력으로 할 수 있습니까?

    -1

    1답변

    두 파일을 입력 파일로 지정하려고합니다. 여기에 예제 : directory1 AB001.txt AB002.txt AB003.txt .... directory2 AB001.fasta AB002.fasta AB003.fasta .... 그래서, 나는 (일치하는 접두사로 항상) 해당 * .fasta 파일 5000 개 이상의 * .txt 인