dataframe에서 여러 배열의 요소 현명한 표준 편차를 활용하는 방법, 처음 3 행은 다음과 같이 :파이썬 : 나는 각 셀에 오히려 큰 dataframe (DF)를 포함하는 배열과 NaN이이
df:
A B C
X [4, 8, 1, 1, 9] NaN [8, 2, 8, 4, 9]
Y [4, 3, 4, 1, 5] [1, 2, 6, 2, 7] [7, 1, 1, 7, 8]
Z NaN [9, 3, 8, 7, 7] [2, 6, 3, 1, 9]
나는 각각의 표준 편차를 얻는 방법을 궁금해 지금 어떤 생각을
element_wise_mean:
A [4.0, 5.5, 2.5, 1.0, 7.0]
B [5.0, 2.5, 7.0, 4.5, 7.0]
C [5.66666666667, 3.0, 4.0, 4.0, 8.66666666667]
:
나는 이미 내가 이것을 얻을 수 있도록 (thanks to piRSquared) 어떻게 각 열에 대한 행을 통해 현명한 요소을 의미하는 알아? 또한, 나는 groupby()가 무엇을하고 있는지 아직 이해하지 못한다. 누군가 그 함수를 더 자세히 설명 할 수 있을까?
np.random.seed([3,14159])
df = pd.DataFrame(
np.random.randint(10, size=(3, 3, 5)).tolist(),
list('XYZ'), list('ABC')
).applymap(np.array)
df.loc['X', 'B'] = np.nan
df.loc['Z', 'A'] = np.nan
element_wise_mean
df2 = df.stack().groupby(level=1)
element_wise_mean = df2.apply(np.mean, axis=0)
element_wise_sd
element_wise_sd = df2.apply(np.std, axis=0)
TypeError: setting an array element with a sequence.
012,351,641 DF
numpy array
에 변환과 람다를 사용하여 np.std 적용는
이 NumPy와 배열 값에 시도 -'df2.apply (람다 X : NP. std (x.values))'? – Zero
나는 당신의 종자 가치를보기 매우 행복 할 누군가를 안다. –
@ cᴏʟᴅsᴘᴇᴇᴅ는 그게 pirsquared입니까? – Dark