값이 다른 클래스를 나타내는 데이터 프레임이 있습니다. 예를 들면 :팬더 데이터 프레임의 구성원 수가 적은 그룹의 값 변경
df=pd.DataFrame(
{'label':['a','a','b','a','b','b','a','c','c','d','e','c'],
'date':[1,2,3,4,3,7,12,18,11,2,5,3],'value':np.random.randn(12)})
나는 '제로'예로 레이블을 특정 임계 값보다 작 values_counts와 레이블을 선택한 다음 즉, 하나 개의 클래스에 넣어 싶습니다.
value_count=df.label.value_counts()
threshold = 3
for index in value_count[value_count.values<=threshold].index:
df.label[df.label==index]='zero'
이 작업을 수행 할 수있는 더 나은 방법이 있나요 :
이 내이 시도인가?
엄만, 벤치 마크를 업데이트했습니다. 그러나 나는 당신의 해결책을 좋아합니다. :-) – Zero
@JohnGalt, "timeit"을 잊지 마세요. : value_count = df.label.value_counts()';) – MaxU
네, 이제 이해가됩니다. 감사. – Zero