2013-07-18 2 views
1

내 프로그램에서 bloomfilter를 사용하고 싶을 때 거기에 약간의 위양성 비율이 있습니다. 나는 오판 될이 단어들에 대한 whiltelist를 만드는 법을 모릅니다.bloomfilter에서 허용 목록을 만드는 방법은 무엇입니까?

+2

블랙리스트를 의미하지 않습니까? 블룸 필터는 잘못된 * 긍정 *을 제공합니다. –

+0

정확히 무엇을하고 싶습니까? ** 모든 ** 가양 성을 제거하려면 ** 검은 색 ** - 목록을 만드시겠습니까? ... 블룸 필터 사용의 이점을 없애 주므로 무의미합니다. 그러면 해시 맵을 사용할 수 있습니다. – Dukeling

답변

2

블룸 필터에 발생할 수있는 가능한 쿼리의 공간을 제한 할 수 있으면 블룸 필터에 입력 한 내용이 채워진 후 이러한 목록을 만들 수 있습니다. 아이디어는 미리 가능한 모든 쿼리를 알고 그 집합의 크기가 비교적 작 으면 이러한 쿼리를 모두 작성하고 Bloom Filter와 함께 모든 잘못된 긍정 "예"답변을 저장하여 피하기 위해 알 수 있습니다 너를 도망 간다. 최근의 생물 정보학 논문은 정확하게 그 것을했습니다 : http://minia.genouest.org/files/minia.pdf.

물론 이것은 해시 된 개체의 일부 속성을 이용하는 방법에 따라 달라집니다. 연결된 경우 엔트리가 중복되는 DNA k-mer이기 때문에 확장자는 각 끝에 4 가지 값 중 하나만 가질 수 있습니다.

관련 문제