나는 3 열 (병원 이름 - 문자, 주 문자, 사망률 숫자)이있는 CSV 파일에서 데이터를 읽고 있습니다 :내 R 프로그램에 버그를 찾을 수 없습니다
datafile <- read.csv("outcome-of-care-measures.csv",
na.strings = "Not Available",
colClasses = c("character","character","numeric"))
이제
내가 분할을 상태에 따라 데이터 :
## split data based on state name
data_split <- split(datafile,datafile$State)
내 문제는 각 상태에서 "최악"병원 (가장 높은 사망률을) 찾아 결과를 표시하는 것입니다. 이를 위해 먼저 데이터를 정렬했습니다. "(속도는 목록 임)
for (i in 1:length(data_split)){
## remove all rows with NA
rate[[i]] <- data_split[[i]][complete.cases(data_split[[i]][ ,3]), ]
##sort by mortality and remove
## conflict by hospital name
rate[[i]] <- rate[[i]][order(rate[[i]][, 3],rate[[i]][ ,1]), ]
}
프로그램이 작동하지만 많은 주에서 잘못된 병원 이름을 얻고 있습니다. 프로그램에서 오류를 찾을 수 없습니다.
안녕하세요. 일종의 재현 가능한 데이터 예제가 있으면 좋을 것입니다. [이 주제] (http://stackoverflow.com/questions/5963269/how-to-make-a-great-r-reproducible-example)를 확인하십시오. 그 외에 더 나은 제목의 질문을 통해 더 나은 답변을 얻고 주제를 검색하는 동안 더 쉽게 찾을 수 있습니다. –