저는 동시 발생 행렬을 채울 수있는 빠르고 효율적인 방법을 찾고 있습니다. 여기서 I는 작업하고있는 데이터의 예이다 :공존 행렬 채우기
col1 col2
a e
a f
a e
b f
c g
a e
d f
a e
a g
b e
c e
및 I는 다음과 같은 형식의 매트릭스 원한다
... e... f... g
a
b
c
d
주파수에 관련된 대응하는 엔트리로한다.
예를 들어, 행렬의 요소 (3,1)은 (c, e)의 공존 빈도에 해당하며 값은 1이어야하고 (1,1)의 값은 값을 가져야합니다 (a, e)의 3 개의 엔트리에 대응하는도 3에 도시되어있다.
현재 두 개의 for 루프를 사용하여 항목을 개별적으로 계산하고 있고 행렬을 계산하는 데 오랜 시간이 걸립니다 (실제 데이터에는 약 백만 행이 있음).
스파 스 매트릭스, 당신에게 비 스파 스 –