1
데이터 프레임의 형태로 콘텐츠 스트림을 받고 있습니다. 각 배치는 열의 값이 다릅니다.값을 변경하여 데이터 프레임을 일관되게 핫 인코딩합니까?
day1_data = {'state': ['MS', 'OK', 'VA', 'NJ', 'NM'],
'city': ['C', 'B', 'G', 'Z', 'F'],
'age': [27, 19, 63, 40, 93]}
와 같은 다른 하나 :
day2_data = {'state': ['AL', 'WY', 'VA'],
'city': ['A', 'B', 'E'],
'age': [42, 52, 73]}
어떻게 열이 뜨거운 열 일관된 수를 반환하는 방식으로 인코딩 할 수 있습니다 예를 들어 하나 개의 배치처럼 보일 수 있습니다? 나는 배치의 각 팬더의 get_dummies()를 사용하는 경우
, 그것은 열을 다른 수의 반환
df1 = pd.get_dummies(pd.DataFrame(day1_data))
df2 = pd.get_dummies(pd.DataFrame(day2_data))
len(df1.columns) == len(df2.columns)
내가 각 열에 대한 모든 가능한 값을 얻을 수 있습니다, 문제는 그 정보와 짝수 일일 일괄 처리마다 하나의 핫 인코딩을 생성하는 가장 간단한 방법은 무엇입니까? 그래서 열의 수가 일관성이 있습니까?
두 데이터 소스 모두 '연령', '도시'및 '\t'상태 '같은 열을 갖습니다. 항상 그렇습니까? 그렇지 않은 경우 다른 열이 포함 된 좀 더 사실적인 예를 제공하십시오. –
흥미로운 질문입니다. 특정 열에 미리 포함될 수있는 모든 값을 알고 있습니까? – akilat90
그냥 연결 한 다음 인형 가져 오기를 호출하지 않는 이유는 무엇입니까? –