통계 분석을 위해 rpy (R, Python에서 실행되는 프로그램)에서 실행할 데이터 세트를 준비 중입니다.for 루프 (Python)에 새 배열 만들기
data = [[0, 1, 0, 0, 0, 0, 0, 1, 0, 0], [0, 0, 1, 0, 0, 1, 0, 0, 0, 0],
[0, 1, 1, 0, 0, 0, 0, 0, 0, 1], [1, 0, 0, 0, 1, 0, 0, 0, 0, 1],
[0, 0, 1, 1, , 0, 0, 0, 0, 0], [0, 0, 0, 0, 1, 1, 0, 0, 0, 0],
[1, 0, 0, 0, 0, 0, 0, 1, 0, 0], [0, 1, 0, 0, 0, 1, 0, 0, 0, 0],
[0, 0, 0, 0, 1, 0, 0, 0, 1, 0]]
이 데이터를 사용하려면 종속 변수 (y)를 독립 변수 (x)와 분리해야합니다. 1 년 동안 각 열에 대해 새 목록을 만들어야합니다.
y = data[:,9]
x1 = data[:,0]
x2 = data[:,1]
x3 = data[:,2]
x4 = data[:,3]
x5 = data[:,4]
x6 = data[:,5]
x7 = data[:,6]
x8 = data[:,7]
x9 = data[:,8]
x10 = data[:,9]
데이터에 67 개의 열이 있다고 가정합니다. 모든 열을 반복하고 모든 열을 입력하지 않고도 자동으로 각 열을 만드는 방법이 있습니까? 나는 모든 배열을 하드 코딩이의 라인을 따라 최대 67
뭔가를 싶지 않아,하지만 작동하지 않습니다
:i=0
for d in data:
"x%d"%i = data[:,i-1]
i+=1
이 코드의 나머지 부분입니다 절대적으로 필수적인 일이다 않는
x = []
for d in xrange(0,66):
x.append(data[:,d])
:
rpy.set_default_mode(rpy.NO_CONVERSION)
linear_model = rpy.r.lm(rpy.r("y ~ x1 + x2 + x3 + x4 + x5 + x6 + x7 + x8 + x9 + x10"), data = rpy.r.data_frame(x1=x1,x2=x2,x3=x3,x4=x4,x5=x5,x6=x6,x7=x7,x8=x8,x9=x9,x10=x10,y=y))
rpy.set_default_mode(rpy.BASIC_CONVERSION)
print linear_model.as_py()['coefficients']
summary = rpy.r.summary(linear_model)
예상되는 결과는 무엇입니까? 질문을하기가 어려웠습니다. – Sibi
x1 = data [:, 1], x2 = data [:, 2] .... x67 = data [:, 67]까지 하드 코딩하지 않아도됩니다. – ono
의존 변수'y'가'y = x10'으로 생성 될 때'x10'을 독립 변수로 포함 하시겠습니까? – lgautier