removeWords()를 사용하여 패키지 tm을 사용한 텍스트 마이닝. 나는 수천 개의 합계 중 약 500 개의 관련 단어 목록을 가지고있다. removeWords()를 사용하여 논리를 뒤집어 목록에없는 단어를 코퍼스에서 제거 할 수 있습니까? 펄텍스트 마이닝 (tm 포함), 목록에없는 단어 제거
, 나는 이런 식으로 뭔가를 할 수 :
text <- tm_map(text, removeWords, wordList)
은 무엇과 같은 일을위한 올바른 구문 될 것이다 :
R에서
$diminishedText = (fullText =! s/$wordlist//g); #not tested
,이 단어 목록에서 단어를 제거 이?
text <- tm_map(text, removeWords, not in wordList)
최소의 작동 예제가 예상됩니다. 데이터 집합 (이 경우 코퍼스)과 R 벡터 형식으로 유지할 단어 목록입니다. ** tm ** 패키지에는 사용할 수있는 코퍼스 데이터가 내장되어 있습니다. 이 작업을 수행하지 않으면 닫힌 질문의 근거가됩니다. –
OP가 최소한의 작업 예제를 제공하지 않았으므로이 질문을 끝내기로했습니다. –