2012-04-08 2 views
0

저는 용어 - 문서 행렬을 작성한 다음 SVD를 적용해야하는 벡터 공간 모델을 사용하여 검색 엔진 프로젝트를 수행하고 있습니다.LSI 구현을 위해 Java에서 용어 문서 행렬을 작성하십시오.

행과 문서라는 용어를 사용해야합니까?

이 같아야 그래서 자바로하고 있습니다 :

카운트 [keywordList.size()] [listOfFilesinCorpus.length];

또는 반대 방향이어야합니까?. 이 2 차원 배열을 아파치 공유 수학에 전달해야합니다.

RealMatrix A = Array2DRowRealMatrix (TDM);

여기서 TDM은 용어 문서 매트릭스입니다.

나는 차원으로 용어가 필요하고 벡터 공간의 문서를 비교할 것입니다. 도와주세요, 고마워요.

답변

2

정말 중요하지 않습니다. 항상 두 가지를 전환 할 수 있습니다.

일반적으로 행은 용어와 열이 문서입니다.

+0

거의 1 년 후 답변을 전한 하하 : D. 어쨌든 굉장히 받아 들일 테니 –

+0

고마워.) – bendaizer

관련 문제