2010-03-11 3 views
0

나의 논문 작업을 위해서, tRNA 데이터를 R로 가져 와서 정렬 시키길 바란다.tRNA 서열을 어떻게 얻고 (그리고 그것을 R로 가져올 것인가)

내 질문은 :

  1. 나는 데이터에 어떤 자원을 사용할 수 있습니까?
  2. 가져 오기/정렬에 어떤 명령이 도움이 될 수 있습니까? Genomic tRNA database at UCSC

지금까지, 나는 이러한 데이터를 보관 유지하는 두 가지 좋은 저장소를 발견 데이터를 R로 가져 오기

내 문제는 여전히 tRNA의 정렬을 처리하는 방법으로 남아 있습니다.

저는 현장에서 온 것이 아니기 때문에 (데이터를 다운로드해야하는 위치 나 사용할 명령과 같은) 매우 기본적인 대답을 놓칠 수도 있습니다. 조언을 원할 경우 가장 도움이 될 것입니다.

+0

입니다. R이 시퀀스 정렬을 관리하는 데 가장 좋은 도구라고 생각하지 않습니다. tRNA를 R로 가져와야하는 이유가 있습니까? – xiechao

+2

이것은 프로그래밍이 아니라 생물 정보학 관련 질문이기 때문에 여기에서 더 자세히 질문해야합니다. http://biostar.stackexchange.com – dalloliogm

+0

xiechao - 내 "원시 (통계) 언어이므로 R로 가져오고 싶습니다. " (말하자면).그리고 그들 중 일부에 대한 통계 분석을 수행하고 싶습니다. –

답변

1

나열된 두 데이터베이스는 시작하기 좋은 장소처럼 보입니다. 다른 하나는 tRNADB-CE입니다.

큐 레이트 된 데이터 세트를 얻으면 많은 골칫거리를 줄일 수 있습니다. 지금 현장에서 사용되는 "금 표준"tRNA 데이터베이스를 가리킬 수있는 tRNA 유전자에 대한 좋은 리뷰 논문을 찾았습니까?

tRNA 시퀀스 데이터베이스를 구축하는 또 다른 방법은 tRNA 기능과 관련된 Geno Ontology (GO) 용어로 태그 ​​된 시퀀스를 사용하는 것입니다. AmiGO을 사용하여 "trna"와 같은 GO 용어를 검색 한 다음 관심있는 특정 GO 용어로 태그 ​​된 모든 시퀀스를 검색 할 수 있습니다. 그러나 큐 레이 티드 데이터베이스로 시작하는 것이 좋습니다.

시퀀스 데이터가 FASTA 형식 (아마있을 것임) 인 경우 다중 시퀀스 정렬을위한 세 가지 공통 유틸리티는 clustalW, MUSCLET-Coffee입니다.

R에서 일하기 때문에 여기에 R package that will allow you to make calls to MUSCLE이 있습니다 (독립 실행 형 MUSCLE 유틸리티도 설치해야합니다). 정렬 프로그램의 출력을 파싱하는 것은 어렵지 않지만이 패키지는 약간의 노력을 덜어줍니다.

행운을 빈다.

+0

안녕 awesomo, 정말 고마워요. http://gtrnadb.ucsc.edu COVE를 사용하여 tRNA 서열을 도메인 특이 적 tRNA 공분산 모델과 정렬하여 구조 정렬을 수행합니까? MUSCLE도 똑같이 할 수 있습니까? Tal –

+1

나는 코브 논문을 살펴 보았고 "공분산 모델"은 기본적으로 RNA 2 차 구조를 고려한 추가 메타 데이터가 포함 된 숨겨진 마코프 모델입니다. RNA sequence 데이터로 할 수있는 한 가지는 흥미있는 서열의 Multiple Sequence Alignment (MSA)를 만드는 것입니다. HMMER (http://hmmer.janelia.org)와 같은 도구를 사용하여 사용자 지정 HMM을 작성하십시오. 마침내 HMM을 사용하여 유사한 서열을 찾아 게놈을 스캔하십시오. 함정을 이해하기 위해서는 먼저 코브 종이에 대한 이해를 얻는 것이 좋습니다. – awesomo

+0

Awesomo - 매우 유익한 답변, 감사합니다! 질문 : 사람들로부터 몇 개의 답을 얻은 후에, 나는 (당신이 쓴 것처럼) tRNA를 처음으로 이차 구조로 접는 것에 기초하고 있다는 것을 알게되었습니다. R에서 그렇게하는 방법이 있습니까? p.s :이 기사를 처음 접한 이래로, 나는 당신의 (그리고 다른 사람들) 인내심에 감사드립니다. –

2

TFAM 웹 서버를 사용하여 tRNA의 Lowe 모델 (gtRNAdb와 동일)에서 코브 기반 구조적 tRNA 정렬을 만들 수 있습니다. 현재 가장 신뢰할 수있는 서버는 http://tfam.lcb.uu.se

관련 문제