2016-09-05 4 views
0

제가 코퍼스에있는 400 개 이상의 문서의 전체 또는 일부 텍스트 콘텐츠를 표시하려고합니다. 대신이 반환, 내가 기능 writeLines을 사용한 적이 있지만,이 문서에 포함 된 실제 텍스트를 반환하지 않습니다 이렇게하려면 : ("", "")writeLines가 텍스트를 반환하지 않습니다.

목록 (리스트 (콘텐츠 = C를 meta = list (작성자 = 문자 (0), atetimestamp = 목록 (초 = 33.0082728862762, 최소 = 22, 시간 = 12, 월 = 5, 월 = 8, 연도 = 116, 일 wday = 1, yday = 248, isdst = 0

library(tm) 
library(SnowballC) 

#Partition each cell in Excel into separate document 
textdata <- read.csv("C:/Users/biat/Documents/survey/openanswers.csv", header = FALSE) 
require(tm) 

doc <- Corpus(DataframeSource(textdata), readerControl = list(language="swedish")) 

writeLines(as.character(doc)) 

이 작업을 수행합니다), 설명 = 문자 (0), 제목은 ......

이것은 내가 코딩 한 방법이다 R 코드 또는 CSV 파일에 문제가 있습니까? DirSource과 함께 writeLines을 사용하면 텍스트가 반환됩니다. 누구든지 위에서 반환하는 정보를 숨기는 방법과 문서의 텍스트 만 가져 오는 방법을 알고 있습니까?

답변

0

다음을 시도하여 콘솔에 텍스트를 인쇄하십시오. 잘 이해하면 요청하는 내용입니까?

library(tm) 
data("crude") # example set from tm 
output <- sapply(crude, function(x) x$content) #get the content from your object 
cat(output) # have your text outputted 

추신 : 시도하고 귀하의 질문에

을위한 재현 예를 제공
관련 문제