현재 재생할 가짜 데이터 집합을 작성 중입니다. 나는 환자의 정보를 가지고 하나 개의 데이터 세트라는 patient_data 있습니다데이터 프레임 python에 새로운 영구적 인 열 추가
patient_data = pd.DataFrame(np.random.randn(100,5),columns='id name dob sex state'.split())
이 이름, 생일 등의 변수 나에게 100 개 관찰의 샘플을 제공, 등
분명히, 이름과 같은 이들 중 일부 (성 및 국가)는 범주 형 변수이며 임의의 숫자가 첨부되어있는 것은 의미가 없습니다.
"성별"열에 대해서는 모든 임의 번호 <을 0으로 설정하고 "여성"을 읽는 기능을 만들었습니다. 나는 "성"이라는 새로운 변수를 생성하고이 변수 안에이를 저장하는 데 싶습니다. "성"나는 공식적으로 새 변수를 생성하는 데이터 프레임에이 기능을 적용 할 코드를 작성 후
def malefemale(x):
if x < 0:
print('male')
else:
print('female')
그리고
patient_data.assign(gender = patient_data['sex'].apply(malefemale))
그러나 "patient_data"를 목성 노트에 입력하면이 새로운 변수를 포함하도록 데이터 프레임이 업데이트되지 않습니다. 아무것도 한 것처럼 보이지 않았다.
제대로 작동하는 함수로이 새로운 성별 변수를 patient_data 데이터 프레임에 영구적으로 추가 할 수있는 사람이 누구인지 알고 있습니까?