내가 벡터화 작업을 사용하여 R에 데이터 테이블을 채우기 위해 노력하고 에서 벡터화 기능을 사용하여 데이터 테이블을 작성 : library(data.table)
x = 5
y = 3
Foo = data.table(Bar = 1:x)
Foo[,paste0("simulation",1:y) := Bar * rnorm(y,,Bar)]
내가 생각을 각 행
data.table :: fwrite를 사용하여 빠른 기록 저장소 &을 텍스트 로그 형태로 검색하려고합니다. 이는 R 엔드 포인트에 대한 배관공 API 호출을 사용하는 모바일 앱을 통해 업데이트됩니다. 모바일 앱은 초당 많은 API를 실행할 수 있으며 ~ 0.5 초의 간격 내에 두 개의 API로 수정되는 동일한 행의 기회가 있습니다. 나는 DB 호출을 피하
이전 행의 특정 값을 계산하기위한 변수를 만들려고합니다. 3 행의 count_a는 1 ~ 3 행의 "a"의 수를 세는 것이 필요합니다. 이처럼 내가 만들고 싶은 count_a, count_b,count_c,cound_d,count_e (var1의 고유 값 인 경우 c(a,b,c,d,e)) 데이터 : 여기 var1 count_a count_b count
많은 열이있는 매우 큰 데이터 집합이 있습니다. 이 데이터를 집계하고 각 열 집합에 다른 기능을 수행해야합니다. 필자는 많은 열을 가지고 있으므로 집계의 각 열과 함께 사용할 각 함수를 수동으로 지정하는 것이 번거로울 수 있습니다. data.table으로 집계하는 방법에 대한 많은 게시물을 읽었지만 아무도이 상황을 처리하지 못하는 것 같습니다. 예 는 mp
data.table R에 LEFT 조인을하려고합니다. 아마도 내 이해가 잘못되었지만 왼쪽 조인에서 일치하지 않는 행을 채우기로되어 있다고 생각했습니다. nulls 또는 무언가로, 그러나이 경우에, 나는 실제로 LEFT JOIN에서 행을 잃는다. 왜? > nrow(aaa)
[1] 30070
> ccc <- merge(aaa, bbb, all.X = TRU
값 목록이 값 범위 내에 있는지 확인한 다음 특정 값을 할당해야하는지 확인해야합니다. ifelse() 문을 중첩하지 않고이 작업을 수행 할 방법을 찾고 싶습니다. ifelse은 51 회 이상 중첩 할 수 없으며 끔찍해 보입니다.). 인위적인 사례이므로 일반화 할 수있는 방법이 있는지 궁금합니다 (예 : 루프? * 적용)? 나는 paste(eval())과 관
데이터 테이블의 월 이름 (1 월, 2 월 등) 벡터를 해당하는 숫자 (1, 2, ...)로 변환하고 싶습니다. 코드 which(month.abb == month)
는 예상대로 작동합니다. 즉, which(month.abb == "Feb")은 2를 반환합니다. 그러나 데이터 테이블에 사용 된 동일한 코드는 경고와 예상하지 못한 숫자가 포함 된 test
고정 된 선택 값과 열에 정의 된 값에 따라 data.table에 시퀀스 열을 추가하는 가장 좋은 방법은 무엇입니까? 다음 예제는 입력 및 원하는 출력을 ilustrates : library(data.table)
# Input
# Add a column sequence till 7 starting from the value of column V2.
데이터를 세 가지 다른 기간으로 분할해야하지만 각각의 데이터에 대해 (데이터가 누락 됨) 가장 적은 수의 방식으로 데이터를 분할해야합니다. I는 제 PE 정의하면이 경우 library(lattice)
xyplot(Data$Y ~ Data$X,,
panel = function(x, y) {
panel.xyplot(x, y)