3. CS LÝ THU YT
3.5 Lý thuy tv bl c Bloom Filter
Nh m h n ch vi c m t b ng ch m c (Index table) chi m d ng quá nhi u không gian l u tr khi s l ng ch m c t ng nhanh, m t vector tên là Bloom Filter [17] đ c s d ng v i m c đích nhanh chóng ki m tra s t n t i c a d li u trong b ng. Cách
15 th c ho t đ ng c a Bloom Filter đ c th hi n nh trong hình 8. B Bloom Filter là m t m ng m bit có giá tr kh i t o là 0. D li u đ a vƠo s đ c tính b i k hƠm b m l n l t là . M i hàm s tr v m t k t qu khác nhau có giá tr t 0 đ n m-1. Nh ng k t qu này s tr t i v trí t ng ng trong m ng và thay đ i giá tr v trí đó t 0 sang 1. Khi m t d li u đ c ki m tra, n u m t trong các v trí t ng ng v i k t qu c a k hƠm b m lƠ 0 thì d li u này ch c ch n là m t d li u m i. Ng c l i, n u t t c đ u có giá tr là 1 thì d li u này có th đư t n t i tr c đó. Nh n m nh l i là “có th đư t n t i tr c đó” vì b n ch t Bloom Filter ch có th ki m tra li u đơy có ph i là d li u m i hay không ch không th đ m b o d li u này có b trùng v i m t d li u đư l u. Trong tr ng h p đó, c n ph i đ c t ng d li u trong b nh ra và so sánh v i d li u mu n ghi vào thì m i có th ch c ch n đ c.
16 Gi s có n ph n t đư đ c ki m tra b i m t b Bloom Filter dùng k hƠm b m vƠ có kích th c m ng là m bit. Xác su t đ m t bit trong m ng v n gi nguyên giá tr kh i t o là:
Nh v y, xác su t đ m t ph n t đ c k t lu n nh m r ng đư b l p là:
Qua đơy c ng th y đ c r ng có 3 tham s s tác đ ng t i hi u n ng c a m t b Bloom Filter. Nh ng tham s đó lƠ: s hƠm b m k ( nh h ng th i gian tính tốn), s ph n t trong m ng m (quy t đ nh kích c c a Bloom Filter) và t l d ng tính gi f (tác đ ng t i xác su t l i).