주어진 범주를 모든 가능한 그룹화 조합으로 구분하는 더미 변수를 생성하는 방법을 찾고 있습니다. 각 그룹화그룹화 된 더미 변수를 생성하는 방법은 무엇입니까?
Three groups: A/B/C
Two groups: A&B/C
Two groups: A&C/B
Two groups: A/B&C
One group: A&B&C
나서 더미 변수는 데이터 프레임의 서로 다른 열 출력과 같다 : 우리는 세 가지 카테고리 (예를 들어 A, B 및 C)가 예를 들어, 다섯 개 가지 그룹이있다. 그래서 내가 원하는 최종 출력은 다음 표와 같습니다
sample_num category grouping1 grouping2 grouping3 grouping4 grouping5
A; B; C A&B; C A&C; B A; B&C A&B&C
-----------+---------+------------+-----------+-----------+-----------+----------
1 A 1 1 1 1 1
2 A 1 1 1 1 1
3 A 1 1 1 1 1
4 A 1 1 1 1 1
5 B 2 1 2 2 1
6 B 2 1 2 2 1
7 B 2 1 2 2 1
8 C 3 2 1 2 1
9 C 3 2 1 2 1
10 C 3 2 1 2 1
11 C 3 2 1 2 1
12 C 3 2 1 2 1
최종 출력이 명확하지 않습니다 - 어떤 카테고리에 들어 있습니까? – thelatemail
질문이 닫힐 수있는 이유 중 하나이기 때문에 패키지 제안을 요청하는 부분을 모두 편집했습니다. 이 기능이 마음에 들지 않으면 변경 사항을 되돌릴 수 있습니다. –
감사합니다. 나는이 사이트가 처음인데 편집을 취소 한 것 같습니다. 그들을 돌려 보내려고하고있어. –