2009-11-17 10 views
6

Java에서 LSI의 오픈 소스 구현이 있습니까? 내 프로젝트에 해당 라이브러리를 사용하고 싶습니다. 나는 jLSI를 보았지만 다른 종류의 LSI를 구현했다. 나는 표준 모델을 원한다.잠재 의미 론적 인덱싱?

+0

감사를 제공합니다. – Nettogrof

답변

5

LDA (Latent Dirichlet allocation)를 고려 했습니까? 나는 정말로 그 중 하나는 아니지만, 나는 최근에 LSI와 동일한 문제 (특허)를 겪었다. LDA는 관련 /보다 강력한 기술입니다. http://en.wikipedia.org/wiki/Latent_Dirichlet_allocation에는 오픈 소스 구현에 대한 링크가있는 것 같습니다.

+0

특별히 LSI를 묻는 것은 당신이 아니지만. 오, 그럴만 한 가치가 ... –

1

자바 LSI에 대한 Google 검색은 SemanticVectors를 권장하는 a similar question으로 연결됩니다. LSI와 유사한 'Lucene'위에 구축 된 패키지. 그것이 jLSI 구현보다 더 가까운 지 모르겠습니다.

그 스레드는 또한 LSI가 특허를 받았으며 많은 구현이 없다고 언급합니다. 따라서 표준 구현이 필요한 경우 java가 아닌 다른 언어를 사용해야 할 수도 있습니다.

0

나는 LSA/LSI가 1989 년에 특허를 얻었는데, 이는 특허 만료가되어야한다는 것을 의미한다. 다행히도 멋진 오픈 소스 애플리케이션을 곧 만나게 될 것입니다.

1

S-Space Package에는 오픈 소스 버전의 LSA가 있으며 LSI 문서 벡터에 대한 바인딩이 있습니다. (두 방법 모두 동일한 용어 - 문서 행렬에서 작동하며 출력을 제외하고는 동일합니다.) 이것은 thin-SVD를 사용하는 상당히 확장 가능한 접근 방식입니다. 나는 모든 Wikipedia에서 문제없이 LSI를 실행하는 데 사용했습니다 (5 회 미만의 빈번한 용어 제거 후).

Scott Ray가 언급했듯이 SemanticVectors 패키지에는 최근에 동일한 thin-SVD (SVDLIBJ)를 사용하여 전환 한 좋은 LSI 구현이 포함되어 있으므로 전에 사용하지 않은 것처럼 확인할 수 있습니다.

1

Google 검색은 jLSI에 대한 코멘트를 추가 내가 도움이 생각이 slides ...

관련 문제