1

곰을 이해하는 하나의 값 분해 (SVD) :잠재 의미 분석 (LSA) LSI의 내 겸손한 이해 (기계 공학 배경)을 통해 나와 함께

: LSI에서 SVD를 수행 한 후

, 당신은 3 행렬이 U, S 및 V 전치

U는 단어를 주제와 비교하며 S는 각 기능의 강도를 측정합니다. Vt는 주제를 문서와 비교합니다.

U dot S dot Vt 

은 SVD 이전의 원래 매트릭스를 반환합니다.

U dot S dot **Ut** 

이 용어의 비교를 제공하는 장기 매트릭스에 의해 용어를 반환 너무 많은 (없음)에 대한 심층적 인 대수를하지 않고는 것 같다. 즉 하나의 용어가 다른 용어와 얼마나 관련이 있는지, 컴포넌트가 아닌 단어를 비교하는 DSM (설계 구조 매트릭스). 나는 완전히 틀릴 수도 있지만 샘플 데이터 세트에서 시도해 보았습니다. 결과는 의미가있는 것처럼 보였습니다. 그것은 편견 일 수 있었지만 (나는 그것이 작동하기를 원했기 때문에 내가 원하는 것을 보았습니다). 문서가 보호되어 있으므로 결과를 게시 할 수 없습니다.

제 질문은 생각해 봅니다. 논리적으로? 수학적으로?

언제든지/응답 해 주셔서 감사합니다. 하나 개 용어는 서로 어떻게 관련 방금 계산할 수 있습니다 알고 싶다면

답변

0

(U는 S 도트)

용어에 의해 표현된다 행 벡터. 그런 다음 유클리드 거리와 같은 거리 함수를 적용하여 거리 행렬을 계산할 수 있습니다. 모든 벡터 사이의 거리를 계산하여 거리 행렬을 만들면 결과 행렬은 모든 거리가> 0 인 중공 대칭이어야합니다. 거리 A [i, j]가 작 으면 관련이 있고 그렇지 않은 경우에는 관련이 있습니다.

관련 문제