나는 그들이 만드는 것이 각 편집에 대한 위키 백과의 사용자가 기여 삭제 단어의 인공 dataframe을 만들려고하고 있어요에 문자열 목록을 포함, 최종 결과는 다음과 같아야합니다R은 Dataframe
프레임을 만들기 위해 인공적인 데이터를 만들었지 만 "토큰 추가됨"및 "토큰 삭제됨"변수에 문제가 있습니다.
목록의 목록으로 만들면 요소가 항상 같은 길이가 아니더라도 데이터 프레임에 포함시킬 수 있다고 생각했습니다. 하지만 분명히 사실이 아닙니다. 대신 R은 각 개별 토큰에 대한 변수를 만듭니다. 그것은 수백만 개의 변수를 만들 것이기 때문에 실현 불가능합니다.
a <- c(1,2,3)
e <- list(b = as.list(c("a","b")),c = as.list(c(1L,3L,5L,4L)),d = as.list(c(TRUE,FALSE,TRUE)))
DF <- cbind(a,e)
U <- data.frame(a,e)
내가이처럼하고 싶은 : 여기에 예시하는 몇 가지 코드
전혀 dataframes와 R이 가능 (나는 이미 답을 dearching 시도하지만, 다른 질문에 대한 것이거나 나를 위해 너무 기술적 이었습니까?) 어떤 도움을 많이 주시면 감사하겠습니다!
나는 이것이 당신이 원하는 의미에서 가능하다고 생각하지 않습니다. 'Data.frame'은 같은 길이의 벡터리스트입니다. 당신이해야하거나하고 싶은 일은리스트의 벡터를 만드는 것입니다. 지금까지 내가 알 수있는 한 이것이 불가능합니다 (http://stackoverflow.com/questions/2624791/how-to-create-a-vector-of-lists-in-r 참조) –
다른 옵션은 각 요소는 문자가 되겠지만 목록을 붙여 넣은 버전은 –