저는 R을 사용하고 CSV 파일을 읽어 값이 0 인 파일의 열 그룹을 요약하고 알레르기 반응이 있는지 여부를 확인합니다. 이 파일에는 538 개의 변수가 포함되어 있습니다.이 변수는 정수이므로 모든 정수를 요인 변수로 변환하여 내 용도를 해결합니다. 그러나 모든 factor 열의 값을 요약하는 테이블 함수 만 사용할 수 있지만 열을 그룹화하고이를 그룹 요약별로 그룹의 테이블 함수에 적용해야합니다. 아무도이 점에서 나를 도울 수 없습니까? 다음과 같이테이블에 CSV 열의 범위를 추가하는 방법
내 코드는 다음 테이블에
egg1 <-read.csv("egg.csv",header = TRUE)
str(egg1)
egg1[sapply(egg1, is.integer)] <- lapply(egg1[sapply(egg1, is.integer)], as.factor)
lapply(egg1, function(egg1) {
if (is.factor(egg1)) return(table(egg1))
})
내가 그룹에 의해 CSV 파일 그룹의 변수의 범위를 전달 찾고 있어요 ....입니다. 더 나은 이해를 위해 색칠 한 3 개의 그룹이 들어있는 샘플 CSV를 살펴보십시오. Q1 : 3 가지 증상이 각각 나열되어있는 dose1, dose2 및 dose3에 대한 예/아니오 (1/0)의 분포를 계산하고 싶습니다. Q2 : 3 회 복용량의 증상을 비교하십시오.
테이블은 모든 열의 요약을 보여 주지만 그룹 별 요약이 필요합니다. @alistaire 말했듯이
그것은 선 아래로 버그를 소개 할 수있는 잠재력을 가지고 같은 요인으로 번호를 설정하는 일반적으로 권할 수있다 : 당신은 두 그룹에 대한 용량 및 symp 필드를 구분하는 컬럼 dose_symp을 분할 할 수 있습니다 인자가 정수로 저장된다는 사실 때문에 매우주의하지 않는 한).만약 당신이 각 컬럼의 테이블을 만들고자한다면,'lapply (egg1, table)'만 있으면된다. – alistaire
거의 각 컬럼을 그룹으로 묶어서 테이블을 만들 필요가있다. 분명히 나는 생년월일과 체중의 예를 들어 몇 개의 기둥을 건너 뛸 필요가있다. 특정 그룹이 csv 파일의 특정 섹션에 속하기 때문에 문제를 그룹화하는 것이 가장 좋습니다. – Usman
CSV에 대해 더 이상 말하지 않고 있습니다. 이제는 data.frame에 대해 이야기하고 있습니다. 정말로,이 시점에서 내가 할 수있는 것은 모두 당신이 필요로하는 것에 대해 추측하는 것입니다. 당신은 최소한 (분명히와 함께하지 않는 방법에 대한 [읽기이] (http://stackoverflow.com/questions/5963269/how-to-make-a-great-r-reproducible-example/5963610#5963610)해야합니다. 538 열,하지만 대표적인 하위 집합) 재현 가능 (데이터!) 예제 및 질문을 편집 할 수 있습니다. – alistaire