새 df 'new_df'를 만들고자하는 다음 데이터 프레임 'df'가 있습니다. 나는 새로운 df를 얻는 데 어려움을 겪고있다.Python Pandas : 두 개의 열을 기반으로 dataFrame에 새 행을 만듭니다.
Cust-id Sex Country Orders Products
0 'Cu1' 'F' 'FR' 'ord1 + ord2' 'A+G'
1 'Cu2' 'M' 'US' 'ord3' 'C'
2 'Cu3' 'M' 'UK' 'ord4 + ord5' 'H+Z'
3 'Cu4' 'F' 'RU' 'ord6' 'K'
4 'Cu5' 'M' 'US' 'ord7' 'T'
5 NaN 'M' 'UK' 'ord#' 'K'
6 'Cu6' 'F' 'US' 'ord8+ord9+ord10' 'R+D+S'
7 'Cu7' 'M' 'UK' 'ord11' 'A'
'new_df'에 해당 '제품'이 포함 된 '주문'에 대한 행을 포함하고 싶습니다. 다른 모든 열은 내용을 유지합니다. 또한 'Cust-id'열의 행이 NaN 인 경우 완료 행이 삭제되어야합니다 (즉, 새 df에는 없음). 그러면 다음과 같은 new_df가 제공됩니다.
Cust-id Sex Country Orders Products
0 'Cu1' 'F' 'FR' 'ord1' 'A'
1 'Cu1' 'F' 'FR' 'ord2' 'G'
2 'Cu2' 'M' 'US' 'ord3' 'C'
3 'Cu3' 'M' 'UK' 'ord4' 'H'
4 'Cu3' 'M' 'UK' 'ord5' 'Z'
5 'Cu4' 'F' 'RU' 'ord6' 'K'
6 'Cu5' 'M' 'US' 'ord7' 'T'
7 'Cu6' 'F' 'US' 'ord8' 'R'
8 'Cu6' 'F' 'US' 'ord9' 'D'
9 'Cu6' 'F' 'US' 'ord10' 'S'
10 'Cu7' 'M' 'UK' 'ord11' 'A'
도움이되었거나 도움이 되었습니까?
감사를보십시오. df1을 만들 때 ValueError가 발생합니다 ("중복 축에서 다시 색인 할 수 없음"). 이 문제를 어떻게 해결할 수 있습니까? –
그런 다음'df = pd.concat ([s1, s2], keys = ('Orders', 'Products'), axis = 1)'시도해보십시오. – jezrael
감사합니다.하지만 초기 코드가 제대로 작동하지 않는 것 같습니다. 데이터에 오류가있었습니다. –