2012-10-12 2 views
0

이전 게시물의 유용한 기고자가 추천 한대로 numpyscipy에 대한 설명을 살펴 보았습니다.numpy 또는 scipy로 시작 하시겠습니까?

저는 파이썬에서 초보자이기 때문에, 제발 저를 도와 주시겠습니까? 예를 들어, 폴더에 이라는 파일 (stats1.txt)이 있습니다. 이 .txt 파일에는 1000 개의 값이있는 열이 하나 있습니다. 지금 나는이 값 (평균값, 중앙값, 최대 값, 최소값, 표준값)에 대한 설명적인 통계를보고 싶습니다.

numpy 또는 scipy을 사용하여 동일한 파일 또는 새 텍스트 파일에서 결과를 실행하려면 어떻게해야합니까?

답변

1

파이썬이 어떻게 작동하는지 기본적인 이해가 필요합니다. 이것은 객체 지향 언어입니다. 당신은 기본적으로 입력 파일을 구문 분석 그래서 당신이 파일이 하나의 열이 말 때문에, , 당신은 당신이 경우에 당신이 볼 수있을 것과 유사한 테이블을 얻을 수

with open('stats1.txt') as f: 
    lines=[float(i) for i in f.xreadlines()] 

에 값을 변환해야 스프레드 시트로 열었을 때 모든 값이 숫자라고 가정합니다. 텍스트가 섞여 있으면 더 많은 정렬이 필요합니다. readlines``에 대한 필요가 없습니다

stdev=nlines.std() 
min_=nlines.min() 
max_=nlines.max() 
mean=nlines.mean() 
import collections 
mode=collections.Counter(nlines).most_common()[0] 
+0

그럼 당신은, 당신의 통계 값을 얻기 위해, 그 다음 NumPy와 배열

nlines=numpy.array(lines) 

로 그립니다. 'np.array ([float (ln) in ln for f])'같은 효과가 있습니다. –

+3

내장 명령을 덮어 쓰지 마십시오. 특히 나중에 사용하려고하면 특히 그렇습니다. numpy.loadtxt()를 사용할 수 있습니다. 컬렉션을 고려하십시오. 가장 일반적인 요소를 찾으려면 numpy.bincount (posints), scipy.stats.mode (일반 사례) 또는 numpy.histogram 기반 솔루션을 사용하지 마십시오. – jfs

+0

오른쪽, min_, max_, hadn ' 그 (것)들이 builtins 인 생각하지 않았다. 나는 대답을 업데이트 할 것이다. – Perkins

관련 문제