2014-04-17 5 views
0

) tm 패키지를 사용하면서 발생하는 오류에 대해 약간의 불확실 함이 있습니다.tm 및 wordcloud 패키지를 사용하여 워드 클 라우드를 만들 때 발생하는 오류 (R

나는 wordcloud 패키지의 wordcloud 함수는 인수로 영장을 소요 알고

문서에 명시된 바와 같이

: 는 (단어가이 기능을 제공)이 될 수 있습니다 문자 벡터, 또는 코퍼스 .

지금까지 그렇게 좋았습니다. 다음과 같이이 마음에와

, 나는 몇 가지 간단한 코드를 가지고 :
library(tm) 
library(wordcloud) 

corpus <-Corpus(DirSource("/.../MUSIC"), readerControl = list(language="lat")) readerControl = list(language="lat")) 

a <- tm_map(corpus, removeWords, c(stopwords("en")), mc.cores=1) 

내가 나에게, 구름 줄이 다음 라인을 원하는 :

wordcloud(a) 

을 대신 나는 다음과 같은 얻을 오류 :

Error in simple_triplet_matrix(i = i, j = j, v = as.numeric(v), 
nrow = length(allTerms), : 'i, j, v' different lengths 

왜 코퍼스가 잘못된 차원인지 잘 모르겠습니다. 나는 코퍼스가 받아 들일 수있는 의견이라는 인상을 받았다.

이 오류 중 하나의 특성에 대한 통찰력을 가진 사람이 누구입니까? 누가 전에이 문제를 보았고 다양한 해결 방법에 대한 아이디어가 있습니까?

미리 감사드립니다.

+0

하드 데이터없이 말할 수 있습니다. '? wordcloud'의 예가 여러분의 작업 흐름과 일치하고 일치하므로 데이터 문제를 알려줍니다. 코퍼스 (corus)를 보려면'inspect '를 사용하십시오. 아마도 누락 된 데이터, 빈 행. 평범하지 않은 것. –

+0

나는 똑같은 문제를 계속 가지고 있었고 결코 해결할 수 없었다. 우분투 상자에는 문제가 있었지만 데비안에는 없었고 궁극적으로 데비안 상자로 옮겨 갔지만 그 일이 계속 일어난 이유는 결코 해결되지 않았습니다. – Stedy

+0

필자도 wordcloud를 적재하지 않고도 tm corpus를 dendrogram으로 강제 변환하려고 할 때이 문제가 있음을 언급해야합니다. – Stedy

답변

0

코퍼스에서 DocumentTermMatrix을 만들어야합니다.

tdm <- TermDocumentMatrix(corpus) 
matrix <- as.matrix(tdm) # changed to term.matrix 
v <- sort(rowSums(matrix),decreasing=TRUE) 
d <- data.frame(word = names(v),freq=v) 
wordcloud(d$word) 

결과,이 시도 : this is the result

관련 문제