MACHINE LEARNING ASSIGNMENT SAMPLING MEHOD (PHƯƠNG PHÁP LẤY MẪU) Các phương pháp cơ bản Makov Chain Monte Carlo (MCMC) Ước lượng Monte Carlo Các phương pháp cơ bản Makov Chain Monte Carlo (MCMC) Ước lượng Monte Carlo
MACHINE LEARNING ASSIGNMENT SAMPLING MEHOD (PHƯƠNG PHÁP LẤY MẪU) Minh City, May 2016 tài: Sampling Methods M C TIÊU C A SAMPLING METHODS Vn c b n: Tìm giá tr kì v ng c a hàm f(z) tùy ý c a z v i hàm m t xác su t p(z): T t ng: N u có m t t p h p m u z (l) , l = L rút c l p t p(z), k v ng có th c tính x p x b ng công th c: Vn t ra: Làm th l y m u c l p t hàm m t su t p(z), không bi t c m u c l y t â u? N i dung Các ph ng pháp c b n Makov Chain Monte Carlo (MCMC) c l ng Monte Carlo xác I Các ph n g pháp c b n 1.1 Ph n g pháp bi n i (Tranformation methods): hay g i ph ng pháp bi n i ng c Ph ng pháp c áp d ng nh ng tr ng h p hàm phân b f(x) cpos d ng n gi n, ta có th th c hi n m t phép bi n i x(t) v m t phân b n g nh t, ta có công th c b o toàn xác su t: P(x)dx = P(t)dt v i P(x) = f(x) P(t) = (phân b n g nh t) ta thu c: 1.2 Ph n g pháp ch p nh n – lo i b ( Acceptance - Rejection methods): th ng c s d ng nh ng tr ng h p hàm f(x) có d ng ph c t p, không d dàng l y m u b ng ph ng pháp bi n i : - Tìm m t hàm phân b công c g(x) có th d dàng l y m u b ng ph ng pháp khác G i c ch n c a giá tr c c i t s f(x)/g(x) C >= max(f(x)/g(x)) Hàm f(x) s v i xác su t: c l y m u b ng cách l y m u hàm g(x) gi l i s i m l y m u P = f(x)/Cg(x) 1.3 L y m u theo tr n g s (Importance samplings): l y m u t m t phân b khác thay l y m u tr c ti p t phân b c n quan tâm Th ng c g i k thu t gi m ph ng sai l y m u Monte Carlo Kì v ng: Thay l y m u bi n x t phân b f(x) ta s l y m u t m t phân b g(x) gi n h n, ó kì v ng c tính theo công th c n II Makov Chain Monte Carlo (MCMC) MCMC: Chi n l c chung cho phép l y m u t m t l p l n hàm m t xác su t S d ng c ch c a Markov Chains M c tiêu: sinh m t t p m u t p(z) Gi 2.1 Ý ki n nh: a ra: phát sinh m u t m t Makov Chain có phân ph i b t bi n p(z) 2.2 Bi t m u hi n t i z(T), t o m t m u n g c z* t m t phân ph i xu t q(z|z(T)) mà bi t làm th l y m u t ó Ch p nh n m u theo m t tiêu chí thích h p N u m u n g c c c ch p nh n z (T+1) = z* n u không z(T+1) = z(T) Thu t toán Metropolis: Th ng c dáp d ng cho vi c l y m u t phân b nhi u chi u, t o t p h p tr ng thái d a m t m t xác su t ã cho tr c ó làm i u ph i t o m t trình Markov mà trình s ti n d n v m t phân b cân b ng M t chu i Markov m t chu i ng u nhiên giá tr x1, x2, , xN v i c i m xác su t c a giá tr sau (x’) ch ph thu c vào giá tr tr c (x) c c tr ng b i xác su t d ch chuy n P(x x’) Các m u III 3.1 xu t c l c l c ch p nh n v i xác su t: n g Monte Carlo n g m u: 3.1.1 Trung bình m u (sample mean): giá tr c l ng c a trung bình qu n th d a m t m u c l a ch n ng u nhiên qu n th Công th c: 3.1.2 V i xi giá tr m u N kích th c m u Ph ng sai m u (sample variance): Th ng c kí hi u S2 ho c S2N Công th c: 3.2 xác c a c l n g (Accurary): dùng nh giá g n hay l ch c a giá tr trung bình c l ng so v i giá tr th c c a i l ng v t lý, ô i c miêu t b ng sai s h th ng Trong monte carlo ta không th c tính xác m t cách tr c ti p c Các nhân t n h h ng • • • n xác: xác c a code (mô hình v t lý ) Mô hình toán (hình h c, ngu n ) L i ng i s d ng 3.3 Kho n g tin c y (Confidence Interval): m t kho ng gái tr mà có th ch a giá tr c a tham s c n c l ng (unknown parameter) r ng kho ng tin c y cho thông tin v bt nh c a phép tính c l ng tham s Các kho ng tin c y thông d ng c a phân b Gauss nh sau: Kho n g tin c y (Confidence Interval): :: Minh h a kho ng tin c y c a phân b Gauss ...M C TIÊU C A SAMPLING METHODS Vn c b n: Tìm giá tr kì v ng c a hàm f(z) tùy ý c a z v i hàm m t xác su t p(z):... Carlo (MCMC) c l ng Monte Carlo xác I Các ph n g pháp c b n 1.1 Ph n g pháp bi n i (Tranformation methods) : hay g i ph ng pháp bi n i ng c Ph ng pháp c áp d ng nh ng tr ng h p hàm phân b f(x) cpos... P(t) = (phân b n g nh t) ta thu c: 1.2 Ph n g pháp ch p nh n – lo i b ( Acceptance - Rejection methods) : th ng c s d ng nh ng tr ng h p hàm f(x) có d ng ph c t p, không d dàng l y m u b ng ph