2012-11-26 3 views
8

데이터 세트의 통계를 계산해야하는 웹 앱을 만들고 있습니다. 백분위 수, 평균, 모드 및 기타 통계 함수를 배열에 대해 계산해야합니다.배열에 대한 통계를 계산하십시오.

일반적으로 파이썬에서는 stat 배열 함수의 거대한 라이브러리가있는 scipy, numpy 또는 nltk를 사용합니다. 이 작업을 위해 활용할 수있는 루비 보석 또는 라이브러리가 있습니까?

기존 라이브러리가없는 경우 Ruby/Rails에서 내 응용 프로그램을 유지하면서 Python에서 데이터를 쉽게 처리 할 수 ​​있습니까?

+0

아직 통계에는별로 도움이되지 않지만 실제로 [Sciruby] (http://sciruby.com)가있다. 그리고 그것은 지금 매우 활동적이지 않습니다. 루비는 여전히 계산 속도가 너무 느립니다. – halfelf

답변

7

실제로 전체 통계 라이브러리가 필요한 경우 statsample을 살펴보십시오. 그렇지 않으면 descriptive_statistics이 멋진 경량 대안이 될 수 있습니다.

+0

레일에서 descriptive_statistics를 사용하는 데 문제가 있습니다. AR을 엉망으로 만드는 Enumerable (레일 버전을 오버라이드)에 대한 합계를 정의하는 것처럼 보입니다. – slykat

+0

신경 쓰지 마라, 나는 그것이 'descriptive_statistics/safe'요구로 해결 될 수 있음을 알았다. – slykat

1

Rubystats 또는 Easystats을 사용할 수 있습니다. 거기에 더 많은 보석이 있다는 것을 나는 확신하지 못한다.

0

numbercrunching의 경우 Narray이 표준 권장 사항입니다. 통계적 방법은 합산, 누적 합산, 곱셈 (곱하기 요소), 누적 생산, 평균, 표준 편차, 제곱 평균 제곱근, 제곱근 편차, 최소값, 최대 값 및 중앙값입니다.

숫자를 전문적으로 사용하기 때문에 최대 50 배 빠르고 더 효율적으로 사용할 수있는 것은 claimed입니다.

0

ActiveRecord 모델에 대한 통계를 계산하는 경우 statistics 보석을 확인하고 싶을 것입니다.

나는 콘솔에서 사용하기 위해 GNU-R 통합과 SIRB을 제공하는 statisticus을 북마크했습니다.

레일즈 애플리케이션에서 파이썬을 실행할 수있는 방법은 많이 있지만, 루비 라이브러리에서 필요한 메소드를 찾는 것이 더 쉽습니다.

0

JRuby에서 통계를 처리하는 새로운 Gem - MDArray를 구현했습니다. JRuby가 기본적으로 Java이기 때문에 이것은 웹 앱에 실제로 유용 할 수 있습니다. MDArray는 NArray와 Numpy 철학을 따릅니다. 그리고이 시점에서 아마도 두 가지 모두보다 느릴 것입니다. 순수한 Ruby 대안보다 더 빠를 것입니다.

도움이 필요하시면 도와 드리겠습니다.

건배,

로드리고

0

당신은 지속적인 개발에 NumPy와 유사한 수치 라이브러리입니다 NMatrix를 사용할 수 있습니다. (면책 조항 : 나는 SciRuby/NMatrix 팀 출신이다.)

관련 문제