나는 연습으로 tensorflow와 LDA를 구현하고 싶었와 LDA (잠재 디리클레 할당)를 구현하고, 나는 tensorflow 버전은 아래의 장점이있을 수 있습니다 생각 : 빠른장점 tensorflow
- 합니다. 내장 된 연산을 사용하여 샘플링 프로세스를 표현할 수 있다면.
- 쉽게 병렬화 할 수 있습니다. 많은 운영체제가 병렬화를위한 최적화로 구현 되었기 때문에이 lda는 gpus 나 분산 된 클러스터에서 쉽게 실행될 수 있어야합니다.
- 더 짧고 깨끗한 코드. 다른 많은 모델, 특히 NN과 마찬가지로 tensorflow가있는 모델을 작성하면 코드가 적습니다.
I (예를 들어, https://github.com/ariddell/lda/) LDA의 일부 파이썬 구현을 검사 한 후, 나는 tensorflow의 작전을 사용할 수있는 아무 생각이 없지만는 그래프의 종류를 내장해야하고 무엇을 최적화 내가 선택해야합니다. 깁스 샘플링 과정은 doc-topics, 주제어 행렬 및 주제 계산 테이블의 요소 별 업데이트와 비슷합니다. 그렇다면이 과정을 단순화하고 최적화하기 위해 tensorflow는 무엇을 할 수 있습니까?
그리고 생성 된 문서의 가능성을 최적화 대상으로 실제 입력 문서에 적용하고 그래디언트 부스트 옵티 마이저를 사용하여 우도를 최소화함으로써 알파, 베타 및 doc- 토픽 배포판을 얻을 수 있습니까? 왜냐하면 이것이 다루기 쉬운 것이면, 여기서 텐서 흐름을 확실히 사용할 수 있기 때문입니다.
LDA의 출력은 주제에 대한 단어 분포이며 Word2Vec의 출력은 구문의 벡터 표현입니다 (문장이 아님) –