2017-05-04 1 views
0

R의 Twitter API를 사용하여 트윗을 추출 중입니다. write.csv2 명령을 사용하여 r의 결과를 csv에 저장했지만 트윗 텍스트의 문자가 원인 인 문자가 문제가됩니다. 하나의 트윗을위한 스프레드 시트의 여러 행문자열에서 줄 바꿈을 제거하려면 어떻게합니까?

str_replace_all을 사용해 보았지만 나에게 효과가없는 것 같아서 그 이유를 찾을 수 없습니다.

여기에 아래의 텍스트가 문제를 일으키는 트윗의 예입니다 내 코드

searchTags = c("Galwaybikeshare", "Corkbikeshare", "dublinbikes", "BelfastBikes", "SantanderCycles", "CitiBikeNYC", "obike", "Hubway", "bicing") 

additionalParams = c("-rt -http") 

searchString <- paste((paste(searchTags[1:9], collapse = " OR ")), additionalParams, collapse = "") 

tweets_list <- searchTwitter(searchString, n=20, lang = "en", resultType = 'recent') 

str_replace_all(tweets_list, "[\r\n]" , "") 

tweets.df <- twListToDF(tweets_list) 

todayDate <- Sys.Date() 

tweetArchive <- paste("BikeShareTweets ", todayDate, ".csv", sep ="") 

write.csv2(tweets.df, file = tweetArchive) 

입니다.

"TransitNinja205: 0.01% of the budget for 5-borough @CitiBikeNYC,\nand 0.2% for #FairFares. @NYCmayor @NYCmayorsOffice #progressive" 

왜 텍스트에서 \ str_replace_all을 제거하지 않습니까?

답변

1

stringr::str_replace_all 작품은 방금 결과를 무시하는 것입니다. 수정 방법 :

tweets_list = str_replace_all(tweets_list, "[\r\n]" , "") 
관련 문제