및 문서 D2, 단어 (w2, w3 ..) 및 문서 Dn과 단어 (w1, w2, w3)가 포함 된 문서 D1 : w2, wn)Google 큰 표가있는 문서에서 단어의 동시 발생
큰 테이블에서 데이터를 구조화하여 과 같은 단어에 대해 가장 자주 발생하는 단어를 w1, 또는 w1 및 w2와 함께 가장 자주 발생하는 단어로 구성 할 수 있습니까?
는 내가 달성하기 위해 시도하고 세 번째 단어 WX 주어진 단어 W1 및 W2
내가 SQL에서 솔루션을 알고 함께 togehter 문서에서 가장 자주 ocures (제안)를 찾는 것입니다,하지만 구글 가능합니다 - 큰 테이블? 나는 나 자신에 의해 내 인덱스를 구축해야 할 것이다 알고
이 문제는 도움이 될 것입니다 AppEngine에 데이터 저장소에 내재 아무것도 없다 내가 지수 폭발을
감사 알미르
덕분에 나는 검색어에 나타나지 않지만 단어 W1과 W2에서 자주 발견되는 세 번째 단어를 찾고 있음을 잊어 버렸습니다. 내 질문을 조정했습니다. – zebra
'및 단어 = 'W3' '이 속임수를 쓰겠지 만 온라인으로해야합니까? 이런 종류의 오프라인 처리를 메모리에서하는 것이 더 좋은 생각이라고 생각합니다. – jbochi
하지만 'W3'이 쿼리 결과가 아닌 쿼리 결과로 필요하므로 다른 두 단어와 함께 발생하는 단어를 "제안"해야합니다 – zebra