2014-04-05 2 views
0

나는이 개 내 오라클 데이터베이스의 테이블이 있습니다 문서 주파수쿼리 용어 주파수를 계산하려면 * 역 문서 빈도

  1. DF (term, doccount)
  2. TF (abstractid, term, freq)

한 (DF)를 가진 용어와 documentCount 및 TF라고하는 용어 빈도에 대한 또 다른 테이블은 documentID, terms, Frequency를 검색합니다. TF * IDF를 계산하고 싶습니다. 여기서 TF = 용어가 기사에 나타나는 횟수 (TF 표의 빈도 열) 및 IDF = log (132225) -log (docCount) +1

documentID, 조건 및 계산 된 TF * IDF를 가진 테이블 (TFIDF)에 내 결과

아이디어가 있습니까?

답변

0

TFDF 테이블에 가입 한 다음 대상 TFIDF 테이블에 삽입해야합니다. 사용해보기 :

insert into TFIDF (documentID, terms, tf_idf) 
select abstractID, df.term, (log(10, 132225)-log(10, doccount)+1)*(tf.freq) 
from tf, df 
where tf.term = df.term; 
+0

감사합니다. Aditya – Nour

관련 문제