0
import pandas as pd
import dask.dataframe as dd
a = pd.DataFrame({'A':[100,102,101,99],'B':[1789,1890,1700,1980]})
b = pd.DataFrame({'A':[100,102,104,105],'B':[1230,1890,1700,1980]})
da = dd.from_pandas(a, npartitions=2)
db = dd.from_pandas(b, npartitions=2)
da = da.categorize()
내 질문 한 DASK DataFrame에서 기존 범주를 적용이다 나는에 da
의 범주를 적용 어떻게 db
같은 db
DataFrame는 범주이며, 또 다른 문제는 값 A:[100,102,nan,nan]
및 B:[nan,1890,1700,1980]
DASK DataFrame
을 가지고 위의 작동 후 범주 값을 코드로 대체하려면 어떻게합니까?
이것은 훈련 및 테스트를 위해 이미 분할 된 데이터에 중요합니다. 친절하게 도와주세요.