2014-11-05 1 views
4

가 나는 경우를R-무효 1

sms_raw<-read.csv(............) 
sms_corpus<-Corpus(VectorSource(sms_raw$text)) 
sms_corpus<-Corpus(VectorSource(sms_raw$text)) 
tm_map(sms_corpus,content_transformer(tolower)) 
error:invalid multubytes string 1 
을 낮추기 위해 매핑 텍스트에 ploblem이 "TM"패키지 "

를 사용하여 텍스트 마이닝을 공부

이제 R 소프트웨어에 새로 온 멀티 바이트 문자열

은 내 csv 파일이 아닌 UTF-8 그래서 UTF-8로 복원하지만이 작동하지 않았다가 될 수 있다고 생각.

내 OS가

win8.1

누구든지이 문제에 대한 해결책을 알려주십시오.

+0

진행 상황이 어디에서 멈추는지를 보여주는 작은 재현 가능한 예를 제공해주십시오. –

답변

14

이름 텍스트입니다 내가 쉽게 내 파일의 열에서 인코딩 기능

해결 한 오류는 그래서

이 명령은 '텍스트'열 변환 입력 멀티 바이트 문자를

을 포함 (멀티 바이트)에서 utf8 양식