병합에 문제가 있으며 그게 무엇인지 이해할 수 없습니다. 내가 정수 값의 일련의 히스토그램을 추정하려면 다음을 수행했습니다팬더 : 병합이 어떻게 작동하는지 이해하는 데 어려움이 있습니다.
> print hist
count
series
0 2
1 4
2 13
3 15
4 12
5 16
6 18
7 7
8 8
9 3
10 1
11 1
> print freq
freq
series
0 0.02
1 0.04
2 0.13
3 0.15
4 0.12
5 0.16
6 0.18
7 0.07
8 0.08
9 0.03
10 0.01
11 0.01
을 그들은 모두 "series"
에 의해 색인이있어 : 나는 hist
및 freq
를 인쇄 할 경우
import pandas as pnd
import numpy as np
series = pnd.Series(np.random.poisson(5, size = 100))
tmp = {"series" : series, "count" : np.ones(len(series))}
hist = pnd.DataFrame(tmp).groupby("series").sum()
freq = (hist/hist.sum()).rename(columns = {"count" : "freq"})
이것은 내가 무엇을 얻을 내가 병합하려고하면 있지만 :
> df = pnd.merge(freq, hist, on = "series")
을 나는 KeyError: 'no item named series'
예외를 얻을. on = "series"
을 생략하면 IndexError: list index out of range
예외가 발생합니다.
내가 잘못하고있는 것을 얻지 못합니다. "시리즈"는 인덱스가 아닌 열이므로 다른 방식으로해야합니까? docs에서
merge docstring을 향상시킬 시간! –
@WesMcKinney : Nice :) – Avaris