특정 열 내의 목록을 기반으로 데이터 프레임에 새 열을 추가해야합니다. 새 열은 열의 모든 목록에서 파생 된 집합이어야합니다.열 값을 파싱하여 데이터 프레임에 대한 새 열을 만들고 다른 열의 값으로 새 열을 채 웁니다.
다음 첫 번째 목록에 해당하는 다른 열이 있지만 데이터가 약간 다릅니다. 값이 아닌 경우 나는 새 열을 채우기 위해이 값이 필요 목록 여기
"를 포함하지 않는 것은"예입니다
Disease Status
0 Asthma|ARD Ph II|Ph I
1 Arthritis|Inflammation|Asthma Ph III|Approved|No development reported
이것은이되어야 :
Disease Status Asthma ARD Arthritis Inflammation
0 Asthma|ARD Ph II|Ph I Ph II Ph I
1 Arthritis|Inflammation|Asthma Ph III|Approved|No development Ph III Approved
여기에 "포함하지 마십시오"의 목록은 단지 [ '발전 없음']이지만 여기에 포함시키려는 용어가 더 있습니다.
내가 사용하고있는 데이터 프레임에는 많은 컬럼이 있는데, 효율적인 방법으로이 작업을 수행 할 수있는 df, 열 이름 및 "안 함"목록을 전달할 수있는 기능을 개발하는 데 관심이 있습니다. (이상적으로 또는 거의 루프가없는).
현재 나는 Disease 열에서 집합을 만들고 pd.concat을 통해 데이터 프레임에 추가 한 다음 각 행을 반복하고 두 열의 값을 분할 한 다음 "Disease"목록을 반복합니다 질병 기둥에 올바른 지위를 두는 것.
이 문제는 내 데이터 프레임이 ~ 12k 행이므로 예외적으로 시간이 많이 걸리는 문제입니다.
은 어디이를 구현하기 위해 시도하고, 무엇을 정확하게 문제가있다 그것으로? – jonrsharpe
현재 접근법으로 업데이트되었습니다. 지금 당장 정확한 코드를 파내는 것처럼 보이지 않을 수 있습니다. 내일 시도 할 수 있습니다. 문제는 그것이 효율적이지 않다는 것입니다. – wingsoficarus116