필자는 MS Excel 피벗 테이블과 마찬가지로 피벗 테이블 모듈을 구현하고 있습니다. pandas 데이터 프레임 모듈을 사용하고 있습니다.데이터 프레임의 조회 값
내가 키에 의해 dataframe에서 값을 검색하는 방법을 궁금 어쨌든
....
경과 시간이 중요합니다.
아래 샘플 코드를 작성하십시오.
import pandas as pd
def getTestDataFrame():
data=[]
# generating 10000000 records
for i in range(10000):
for j in range(1000):
data.append((i ,j, i+j))
dataFrame=pd.DataFrame(data, columns=["key_1", "key_2", "myvalue"])
# setting index to key columns
dataFrame=dataFrame.set_index(['key_1','key_2'])
# data sample
print dataFrame.head()
return dataFrame
if __name__ == "__main__":
myDataframe=getTestDataFrame()
for i in range(10000):
for j in range(1000):
key1, key2= i, j
'''
how can i lookup "myvalue" column value
from "myDataframe" by key columns("key_1", "key_2")?
'''
# elapsed time is critical
# please complete my code
대신 팬더의 buitin'pivot_table' 메소드를 사용하지 않으시겠습니까? –
크기가 큰 데이터의 경우 pivot_table의 피벗 속도가 너무 느립니다. 그래서 groupby와 피봇 테이블 manualy를 구현하고 팬더 모듈을 녹입니다. –