2012-11-22 2 views
1

누락 된 줄 바꿈을 한 열 R 데이터 프레임에 삽입해야합니다. 데이터 수집 단계에서 그 라인 차단기가 누락되었습니다.누락 된 줄 바꿈을 R 데이터 프레임에 삽입하는 방법

V1 
Apple 
OrangeBanana 
BananaBananaBanana 
Watermelon 
GrapeBanana 

"바나나"전 그렇게 모든 라인 차단기가

나는 "바나나"를 검색하고처럼 보이는, 그래서 그없는 라인 차단기를 추가 할

누락 : 같은

데이터 본다 :

V1 
Apple 
Orange 
Banana 
Banana 
Banana 
Banana 
Watermelon 
Grape 
Banana 

답변

3

다음은 좀 더 일반적인 해결책이지만 "바나나"로 명시 적으로 작업하는 것을 쉽게 목적으로 할 수 있습니다.

V1 <- c("Apple", "OrangeBanana", "BananaBananaBanana", "Watermelon", "GrapeBanana") 

첫째, 단어 경계가 아닌 모든 대문자를 발견하고 공간과 대문자로 대체하여 그들을 분할하자 그런

splits <- gsub("(?:\\B)([[:upper:]])"," \\1" , V1, perl=TRUE) 
[1] "Apple" "Orange Banana" "Banana Banana Banana" "Watermelon" "Grape Banana" 

공백 문자로 분할

unlist(strsplit(splits, " ")) 
[1] "Apple" "Orange" "Banana" "Banana" "Banana" "Banana" "Watermelon" "Grape" "Banana" 

또는 한 줄 : 및 목록에서 벡터로 변환

unlist(strsplit(gsub("(?:\\B)([[:upper:]])"," \\1" , V1, perl=TRUE), " ")) 

편집 :

gsub("(?:\\B)(Banana)"," \\1" , V1, perl=TRUE) 
+0

고마워 "바나나"로 명시 적으로 작동하는 정규식을 위해! 그건 잘된거야! – jinlong

관련 문제