2012-07-12 5 views
2

biomaRt 패키지에 문제가 생겼습니다. affymetrix hgu133a 프로브 ID에 대한 entrez ID를 찾을 때였습니다. 예를 들어 biomaRt가 "206323_x_at"을 찾을 수 없습니다.
affy_hg_u133a 목록에있는 모든 프로브 ID를 나열하면 19872 프로브 ID 만 있었지만 HGU133a (또는 22313은 컨트롤 프로브)에 22245 프로브가 있습니다. 스크립트에 문제가 있습니까? 아니면이 데이터베이스가 불완전합니까?R : biomaRt 패키지에 프로브 ID가 누락 되었습니까?

감사합니다.

library(biomaRt) 
mart<-useMart("ensembl", dataset="hsapiens_gene_ensembl") 
affyids="206323_x_at" 
getBM(attributes=c('affy_hg_u133a', 'entrezgene'), filters = 'affy_hg_u133a', values = affyids, mart = mart) 
[1] affy_hg_u133a entrezgene 
<0 rows> (or 0-length row.names) 

hgu133a<-getBM(attributes='affy_hg_u133a', mart = mart) 
dim(hgu133a) 
[1] 19872  1 

답변

1

이 프로브 세트에서는 작동하지 않는 것 같습니다. 우리는 우리는

affyids = c("218471_s_at") 
getBM(attributes = c("affy_hg_u133a", "entrezgene"), filters = "affy_hg_u133a",values = affyids, mart = ensembl) 

myprobeset = "218471_s_at" 
genes <- mget(myprobeset,hgu133aENTREZID) 

그래서이 데이터의 두 개의 서로 다른 소스가 다른 대답을 줄 경우 것 같다 다른 탐침 기를 테스트 할 수 있습니다

library(hgu133a.db) 
myprobeset = "206323_x_at" 
genes <- mget(myprobeset,hgu133aENTREZID) 

에 대한 답을 얻을 수 있습니다. 이것은 때때로 발생합니다.

0

probemapper 패키지는이 특별한 필요에도 사용할 수 있습니다. R에서 사용할 수 있으며 온라인 인터페이스도 있습니다. 공급 업체 및 Bioconductor이 프로브는 Entrez의의 ID 4983에 맞추고 동의하지만 BLAST 가능성이 당신이 경우 무시 될 수있는 몇 가지 다른 잠재적 정렬을 (보여줍니다 qbrc.swmed.edu/probealignment/#probe=1005849

해석 : 여기

은 특정 유전자의 결과입니다 벤더의 주석을 신경 써라.)

+0

감사합니다. 패키지가 매우 유용하게 보입니다. 게시 된 기사 (귀하 외에)에서 누군가 사용 했습니까? – sztup

+0

웹 서비스에 대한 트래픽이 상당히 많았지 만 현재 사용하고있는 출판물에 대해서는 알지 못합니다. –

관련 문제