2017-02-12 5 views
0

저는 R.I.을 (를) 새롭게하려고 약 Corpus() 메서드에 대해 알고 있습니다.코퍼스 메서드가

이것은 내가 작성한 코드입니다.

library(tm) 
my_obj<-"learning about corpus method" 
corp<-Corpus(VectorSource(my_obj)) 
corp 

는이 코드의 출력이 Corpus 방법에 의해 제조되는 구조화 된 텍스트되어야 생각. 그러나 출력은 다음과 같습니다 -

<<VCorpus>> 
Metadata: corpus specific: 0, document level (indexed): 0 
Content: documents: 1 

사람이 R에 무엇 코퍼스 방법을 설명 할 수 있습니까?

+2

참조하십시오. http://stackoverflow.com/questions/30435054/how-to-show-corpus-text-in-r-tm-package –

+0

감사합니다. – a874

답변

0

코퍼스 메소드는 사용자가 텍스트 마이닝 기능을 많이 사용할 수있게 해주는 텍스트 모음 (NLP의 corpus라고 함)을 만듭니다. 예를 들어 tm-map 기능은 구두점, 단어, 공백, 숫자를 제거 할 수 있습니다. . 그리고 코퍼스에서 DocumentTermMatix 함수를 사용하여 코퍼스에서 각 문서의 용어 빈도를 계산할 수 있습니다.

관련 문제