2014-02-25 2 views
2

수백만 개의 작은 문서로 구성된 tm 패키지를 사용하여 큰 R Corpus 개체가 있습니다.R 코러스를 디스크에 저장하는 방법

다른 프로그램 (예 : word2vec)에서 사용할 수 있도록 단일 텍스트 파일로 디스크에 저장하려면 어떻게해야합니까?

나는

writeCorpus(myCorpus) 

을 시도했지만 그건 내 Mac을 날려 백만 작은 텍스트 파일을 작성!

저는 R에 익숙하지 않아서 어떻게해야하는지에 대한 도움이 많이 들었습니다. 고맙습니다!

+2

당신이 R의 데이터를 계속 사용 계획 또는 당신이 그것을 사용하고자합니까 다른 프로그램들? –

+0

다른 프로그램 - word2vec의 텍스트 덤프로 필요합니다. – metalaureate

답변

2

시도 :

writeLines(as.character(mycorpus), con="mycorpus.txt") 

그러나 백만 문서 효율적입니다 모르겠어요

+0

완벽한, 감사합니다. 초당 55MB를 썼습니다. – metalaureate

관련 문제