나의 주요 목표는 거대한 행렬 행렬에서 중앙값 (열 기준)을 계산하는 것입니다. 예 :Python - 파일에서 열 반복자 가져 오기 (전체 파일을 읽지 않고)
a = numpy.array(([1,1,3,2,7],[4,5,8,2,3],[1,6,9,3,2]))
numpy.median(a, axis=0)
Out[38]: array([ 1., 5., 8., 2., 3.])
매트릭스 파이썬 메모리 (~ 5 테라 바이트)에 맞게 너무 커서, 그래서 csv 파일에 보관합니다. 그래서 각 열을 실행하고 중간 값을 계산하고 싶습니다.
전체 파일을 읽지 않고도 열 반복기를 사용할 수있는 방법이 있습니까?
매트릭스의 중앙값 계산에 대한 다른 아이디어도 좋습니다. 고맙습니다!
참고 : http://stackoverflow.com/questions/1053928/python-numpy-very-large-matrices –