2016-06-13 5 views
3

유전자 구름을 시각화하기 위해 태그 클라우드를 만들고 싶습니다.태그 클라우드에서 대문자 유지

library(wordcloud) 

genes_snv <- read.csv("genes.txt", sep="", header=FALSE) 

wordcloud(genes_snv$V1, 
      min.freq=15, 
      scale=c(5,0.5), 
      max.words=100, 
      random.order=FALSE, 
      rot.per=0.3, 
      colors=brewer.pal(8, "Dark2")) 

이것은 내 코드이지만 모든 것을 소문자로 변환합니다 (유전자 이름에는 유용하지 않음). 어떻게 이것을 피할 수 있습니까?

Fcrl5 
Etv3 
Etv3 
Lrrc71 
Lrrc71 
(...) 
+0

만들기 genes_snv $ V1 벡터로 (유전자 <- genes_snv의 $의 V1) 그냥 시도, 난 그것이 작동한다고 생각하십시오 –

+0

불행히도 귀하의 답변 주셔서 감사합니다, 여전히 같은 (소문자) wordcloud. – maxie

답변

2

genes.txt 시작 freq 인수 내가 내부적으로 주파수를 계산하기 전에 기능 tolower를 호출 생각 wordcloud 전화 tm::TermDocumentMatrix를,이 없습니다.

볼, 예를 들어 우리가 우리 자신의 주파수를 제공 할 수 tm에 전화를 방지하려면 :

# dummy data 
set.seed(1) 
genes <- c("Fcrl5","Etv3","Etv3","Lrrc71","Lrrc71") 
genes <- unlist(sapply(genes, function(i)rep(i, sample(1:100,1)))) 

# get frequency 
plotDat <- as.data.frame(table(genes)) 

# plot 
wordcloud(word = plotDat$genes, freq = plotDat$Freq, 
      min.freq=15, 
      scale=c(5,0.5), 
      max.words=100, 
      random.order=FALSE, 
      rot.per=0.3, 
      colors=brewer.pal(8, "Dark2")) 

enter image description here

관련 문제