내가 연구를하고있는 프로젝트의 일환으로 스파크에서 LSH의 해시 기능을 사용하는 방법을 찾고있다. 그렇게 할 방법이 있습니까?국부적으로 민감한 해싱을위한 스파크 구현
2
A
답변
2
이 구현보십시오 :
https://github.com/mrsqueeze/spark-hash
의 README에서 인용을, LSH 및 minhashing의 큰 설명이 "이 구현은 크게 대규모 데이터 세트의 광업의 제 3 장에 설명 된 알고리즘을 기반으로했다" .
1
최근 출시 된 Spark (2.1.0) 버전은 LSH에 대한 내장 지원을 제공하지만 분명히 in the Scala API (PySpark에서는 아직 지원되지 않음) 만 지원합니다.
관련 문제
- 1. 아파치 스파크 구현
- 2. 암호 해싱을위한 이중 소금?
- 3. N 서비스 버스 시간에 민감한 옥션 구현
- 4. 녹에있는 국부적으로 기능
- 5. 국부적으로 (메모리에서) Twisted
- 6. 국부적으로 WordPress 설치를 공유하는 방랑자
- 7. 국부적으로 패딩 사용 안 함
- 8. 폴리머를 국부적으로 가동시킬 수 있습니까?
- 9. 스파크 선택 - 폭발 관용구는 어떻게 구현 되었습니까?
- 10. 구현 드롭 다운 목록에서 MVC를-스파크
- 11. 선형/이차 해싱을위한 프로브 길이 검색
- 12. 민감한 기관
- 13. 스파크 1.6.2에서 스파크 2.0
- 14. 문화 민감한 GetHashCode
- 15. 국부 V와 국부적으로 부딪혀있는 세션의 행동
- 16. 아파치 vHosts를 가진 국부적으로 기계에 VirtualDocumentRoot에 연결하십시오
- 17. 스파크
- 18. 스파크
- 19. 응용 프로그램 민감한 데이터 저장
- 20. 민감한 엑셀 데이터 인코딩
- 21. 민감한 장고 모델명 경우가
- 22. 민감한 데이터 저장
- 23. 디렉토리. 시간에 민감한 존재인가?
- 24. 시간에 민감한 토큰 시스템입니까?
- 25. mcrypt로 민감한 데이터 암호화하기
- 26. 찾기 성능에 민감한 점
- 27. 너무 민감한 자이로 스코프
- 28. 대문자 민감한 php mac
- 29. 민감한 변수는 어디에 저장해야합니까?
- 30. 민감한 정보를 저장하기위한 규정?
시도해 보겠습니다. 감사. – user3636583
@ user3636583 FLANN, ANNOY, nearpy, SparseLSH, LSHForest (scikit-learn) 등과 비교하여 사용 사례에 대한 요금을 알려주십시오. 개인적으로 위의 Spark 구현이 매우 배가 고프다는 것을 알았습니다. – Nilesh