목록에 추가 :팬더는 - dataframe에서 컬럼의 모든 요소를 분할하고 그래서 나는 다음과 같은 열이있는 dataframe이
Fruit
apple;banana
pear;apple;peach
blueberry;durian;apple;peach
banana;grape;orange
.
등등을. 다음 목록을 얻을 수있는 최종 목록을 만들고 싶습니다.
fruitList = ['apple','banana','pear','apple','peach','blueberry','durian','peach','banana','grape','orange']
어떻게하면됩니까? 한 행에 대해서만 작동
fruitList.extend(df['Fruit'].iloc[0].split(';'))
#fruitList = ['apple','banana']
그러나 물론
... 어떻게이 일반화 않은 : 나는 다음과 같은 단일 행에 대해이 작업을 수행하는 관리? 제 계획은 열매를 세고 열매 수를 상위 10 개까지 얻는 것입니다. 내 최종 목표는 상위 10 개 과일을 포함하는 행을 유지하는 것입니다.하지만 거기에 도달하려면 어떻게해야합니까?fruitList
처음에는 어떻게 될까요?
iloc [0]은 첫 번째 행을 나타냅니다. for 루프를 사용하면 이것을 일반화 할 수 있습니다. 더 많은 데이터를 추가 할 수 있습니까? – sera
@sera 전 단일 데이터 프레임 행 이상의 루프를 사용하여이 작업을 수행 할 수 있었지만 매우 큰 데이터 프레임을 사용하면 느려지지 않았습니까? 그 말이 맞는다면 판다 (pandas)에서 이렇게하는 내장 된 방법이 있는지 궁금 해서요. 그리고 네, 더 많은 데이터 예제를 추가 할 수 있습니다. – ocean800
@sera 파이썬에서는 가능한 한 루프를 사용하지 않습니다. 알웨이는 벡터화 된 방식으로 작업을 수행합니다. 당신 같은 문제를 찾고 Stackoverflow에 뛰어 들거나 질문을 게시하십시오. – srodriguex