Phân ph i nhố ị thức (Binomial Distribution) là m t d ng lan truy n xác su t r i r c. ộ ạ ề ấ ờ ạ Nó được sử dụng trong trường hợp thí nghiệm chỉ có hai khảnăng – thành công và thấ ạt b i. Phân ph i nhố ị thức là m t phân ph i xác su t r i r c, nó thộ ố ấ ờ ạ ể hiện xác suất của một t p gậ ồm hai k t qu khác nhau: thành công (p) và th t b i (q). ế ả ấ ạ
i. Đại lượng ngẫu nhiên r i rờ ạc 𝑋 = 0,1,2, … , 𝑛{ } g i là phân ph i nh ọ ố ịthức nếu tồn t i sạ ố𝑝 ∈ (0,1) sao cho:
𝑝𝑘= 𝑃 𝑋 = 𝑘 = 𝐶( ) 𝑛𝑘𝑝𝑘𝑞𝑛−𝑘, 𝑞 = 1 − 𝑞, 𝑘 = 0, 𝑛
Trong trường hợp này ta ký hiệu 𝑋~𝐵(𝑛, 𝑝)
Nếu bài toán thỏa mãn lược đồ Bernoulli, nghĩa l chỉ ra được:
Có n phép th ử độ ậc l p.
Trong mỗi phép th , xác su t xuử ấ ất hi n bi n c ệ ế ố A không đổi là (A) = . P p
X là s l n xu t hi n bi n cố ầ ấ ệ ế ố A trong n phép th ử đó thì X phân ph i theo quy ố
luật Nhị th c. ứ
ii. Tính ch t c a phân ph i nh ấ ủ ố ịthức
𝐸(𝑋) = 𝐸(∑𝑋𝑖 𝑛 𝑖=1 ) = ∑ 𝐸(𝑋𝑖) 𝑛 𝑖=1 = 𝑛𝑝
Phương sai của biến ng u nhiên X bẫ ằng tổng các phương sai thnh phần 𝐷(𝑋) = 𝐸(𝑋2) − (𝐸(𝑋))2= 𝑛𝑝(1 − 𝑝 = 𝑛𝑝𝑞)
+Ví d : ụ
Trong b nh vi n vào th ệ ệ ứ Năm tuần trước, có 10 đứa bé cho đời, trong đó có 6 đứa bé trai. Tìm xác suất để 6 đứa bé đầu chào i liên ti p là bé trai? đờ ế
Gọi A là biến cố6 đứa bé đầu l bé train ad 4 đứa còn lại là bé gái. Gọi X là s bé ố
t, v y X là bi n nhậ ế ịthức có tham s là 10 và ½. V y xác su t c n tìm là ố ậ ấ ầ
𝑃(𝐴𝑋 = 6) =𝑃(𝐴 𝑣à 𝑋 = 6)𝑃(𝑋 = 6) = 𝑃(𝑋 = 6) =𝑃(𝐴) (1/2)10
𝐶106 × (1/2)6× (1/2)4= 0.0048
E.Phân ph i hình h c ố ọ
Phân ph i hình h c (Geometric Distribution) là dố ọ ạng đặc bi t c a phân ph i nh ệ ủ ố ị
thức âm. Nó liên quan t i s ớ ố lượt th c n thi t cho m t l n thành công duy nh t. Vì ử ầ ế ộ ầ ấ
vậy phân ph i hình h c là mố ọ ột phân ph i nhố ịthức âm v i s l n thành công là 1. ớ ố ầ
i. Một bi n ng u nhiên r i r c X có phân ph i hình h c v i tham s p, ế ẫ ờ ạ ố ọ ớ ố trong đó 𝑝 ∈ (0,1) , có công thức xác su t thành công v i n l n th : ấ ớ ầ ử
𝑃(𝑋 = 𝑛 = 𝑝 × 𝑞) 𝑛−1
Với p là xác thành công cho m t l n th duy nh t ộ ầ ử ấ
q là xác su t th t b i cho mấ ấ ạ ột lần th duy nhử ất n là s l n th ố ầ ử
ii. Tính ch t c a phân ph i hình h c ấ ủ ố ọ
𝐸(𝑋) =𝑝1
𝐷(𝑋) =1−𝑝𝑝2
+Ví d : ụ
Trong b bài 52 lá, ta rút th 1 lá .Th ộ ử ử cho đến khi rút được lá Át thì d ng l i. Xác ừ ạ
suất để ít nh t l n ấ 10 ầ rút được lá Át?
Giải: G i X là s ọ ố lá bi rút được cho đến khi gặp lá Át. X là bi n ng u nhiên có ế ẫ
phân ph i hình h c v i tham s p=1/13 , v y ố ọ ớ ố ậ 𝑃(𝑋 = 𝑛) = (1213)𝑛−1(1/13) 𝑣ớ𝑖 𝑛 = 1,10 Vậy xác su t c n tìm là ấ ầ 𝑃(𝑋 ≥ 10) = ∑ (1213)𝑛−1(113) ∞ 𝑛=10 = 113 . (12/13)9 1 − /12 13 ≈ 0.49 F.Phân ph i Poisson ố
Trong phân ph i nhố ị thức, khi x y ra n! s l n th , dãy s nào quá lả ố ầ ử ố ớn để có th ể
phục v cho công tác này. Là xác su t c a bi n ng u nhiên r i rụ ấ ủ ế ẫ ờ ạc v nó thường
được s d ng r ng rãi trong các công viử ụ ộ ệc có thểđo đạc được. Sự phân bố này
được đưa ra bởi nhà toán học người Pháp, ti n sế ỹSimon Denis Poisson vo năm
1837 và phân bốny được đặt theo tên ông. Sau khi ông qua đời, nhà toán học
người Nga L.V.Bortkiewicz đã hon tất những công việc còn lại. Hiện nay, phân phối Poisson được phổbiến nh t, chấ ỉđứng sau phân ph i nhố ị thức và phân phối chuẩn trong ngành th ng kê. ố
Phép tuần hon Poisson đượ ậc t n dụng như một ph n cầ ủa các trường h p mà xác ợ
suất xu t hiấ ện của một s kiự ện là nhỏ, nghĩa l sự kiện ch x y ra mỉ ả ột lần sau m t ộ
khoảng th i gian dài. Ví d , xác suờ ụ ất x y ra lả ỗi trong quá trình thành lập tập đon
là nh , xác su t x y ra chỏ ấ ả ấn động trong một năm l nhỏ, vi c r i ro x y ra trên ệ ủ ả đường ph là nhố ỏ, v tương tựnhư vậy. Tất cảđều là những trường hợp mà xác suất xảy ra s ựkiện là nh . ỏ
i. Đại lượng ngẫu nhiên 𝑋 = 0,1,2, … , 𝑛{ } g i là có phân ph i Poisson nọ ố ếu tồn tại 𝑎 > 0, a là tham s c a phân ph i Poisson: ố ủ ố
𝑝𝑘= 𝑃 𝑋 = 𝑘( ) =𝑒−𝑎𝑘! , 𝑘 = 0,1,2, …× 𝑎𝑘 ii. Tính ch t c a phân ph i Poisson: ấ ủ ố
𝐸(𝑋) = 𝑎 𝐸(𝑋2) = 𝑎(𝑎 + 1) 𝐷(𝑋) = 𝑎
Trung bình trong m t cu n sách, c 3 trang là có 1 lộ ố ứ ỗi đánh máy. Nếu số lồi đánh
máy là bi n ngế ẫu nhiên Poisson, xác suất để có ít nh t 1 l i trên cuấ ỗ ốn sách đó l
bao nhiêu?
Giải: G i X là s l i trên 1 trang c ọ ố ỗ ụthể. X là bi n ng u nhiên Poisson v i tham s ế ẫ ớ ố
k=1/3=E(X) có công th c ứ
𝑃(𝑋 = 𝑘) =(1/3)𝑘𝑒−1/3
𝑛! Suy ra,:𝑃(𝑋 ≥ 1 = 1 − 𝑃 𝑋 = 0 = 1 − 𝑒) ( ) −13≈ 0.28
CHƯƠNG 3. BIẾN NG U NHIÊN LIÊN T C Ẫ Ụ
3.1Biến ng u nhiên liên t c ẫ ụ
3.1.1 Định nghĩa
A.Biến ng u nhiên liên t c ẫ ụ
Nếu v i bi n ng u nhiên r i rớ ế ẫ ờ ạc ta có thể liệt kê các giá tr có th , thì biị ể ến ngẫu nhiên liên t c các giá tr có th có c a nó lụ ị ể ủ ấp đầy m t kho ng và không thộ ả ể liệt kê chi tiết ra được.
Trong th c t , có nhi u bi n ng u nhiên b n ch t là r i r c, tuy nhiên vì sự ế ề ế ẫ ả ấ ờ ạ ốlượng giá tr c u nó là r t nhiị ả ấ ều nên cũng có thể xét như l biến ngẫu nhiên liên tục.
+Ví d : ụ
Trọng lượng của một loại sản phẩm, mực nước biển tại một thời điểm là những đại
lượng ngẫu nhiên liên tục.
B.Hàm mật độ xác su t (Probability density function) ấ
i. Cho X l đại lượng ng u nhiên liên t c, có hàm phân ph i F(x) là mẫ ụ ố ột
đạo hm. Khi đó ta gọi hàm:
𝑓(𝑥) = 𝐹′(𝑥) là hàm mật độ xác su t ấ
Hàm mật độ xác su t c a bi n ng u nhiên liên t c X, ký hi u là f(x), là hàm s ấ ủ ế ẫ ụ ệ ố
không âm trong kho ng giá tr c a X và di n tích t o b i hàm sả ị ủ ệ ạ ở ốđó v trục hoành bằng 1, th ểhiện s phân ph i xác su t c a X. ự ố ấ ủ
ii. Tính ch t c a hàm mấ ủ ật độ xác suất
Hàm mật độ xác su t cấ ủa đại lượng ngẫu nhiên X có các tính ch t sau: ấ
∫ 𝑓(𝑥)𝑑𝑥−∞+∞ = 1
𝑃(𝑎 < 𝑋 < 𝑏) = ∫ 𝑓(𝑥)𝑑𝑥𝑎𝑏
𝐹(𝑥) = ∫ 𝑓(𝑡)𝑑𝑡−∞𝑥
Từ các tính chất trên có th rút ra các nh n xét sau: ể ậ
Với biến ngẫu nhiên liên t c X, ch xét xác suụ ỉ ất nhận giá tr trong mị ột khoảng. Xác su t X nh n giá tr t i mấ ậ ị ạ ột điểm bằng 0.
Khi xét xác su X nh n giá tr trong m t kho ng, không cất ậ ị ộ ả ần quan tâm đến cận.
Hình nh hàm mả ật độ xác su t cho bi t s t p trung c a xác su t, ch nào ấ ế ự ậ ủ ấ ỗ
hàm mật độ càng cao thì xác su t t p trung kho ng vây quanh giá trấ ậ ở ả ịđó
càng nhi u. Hàm mề ật độ xác su t b ng 0 là giá tr x y ra v i xác su t b ng 0. ấ ằ ị ả ớ ấ ằ +Ví d : ụ Cho hàm: { 0, 𝑥 < 1 1 2+14(𝑥 − 3 , 1 ≤ 𝑥 < 3) 1 2−14(𝑥 − 3 , 3 ≤ 𝑥 < 5) 0, 𝑥 ≥ 5
a) Chứng tỏ f(x) là hàm mật độ xác su t cấ ủa một đại lượng ngẫu nhiên X Hiển nhiên f(x)≥ 0 và diện tích c a tam giáủ c ABC trên đồ b ng 1 thị ằ
3.1.2 Các đặc trưng của biến ngẫu nhiên liên t c ụ
A.Kỳ vọng
Trường hợp X l đại lượng ngẫu nhiên liên t c có hàm mụ ật độ f(x) thì k v ng cỳ ọ ủa X là s : ố 𝐸(𝑋) = ∫ 𝑥𝑓(𝑥)𝑑𝑥+∞ −∞ B.Phương sai Nếu X liên t c, có hàm mụ ật độ xác su t f(x) , k v ng ,thì ta có ấ 𝜇là ỳ ọ 𝐷(𝑋) = ∫ (𝑥 − 𝜇)+∞ 2𝑓(𝑥)𝑑𝑥 −∞ +Ví d : ụ ng ng u nhiên có hàm m
Cho X l đại lượ ẫ ật độ
𝑓(𝑥) = {2𝑥 𝑛ế𝑢 𝑥𝜖[0,1]0 𝑛ế𝑢 𝑥 [0,1] Tìm kỳ v ng c a X ọ ủ Giải: E(X) =∫ 𝑥𝑓(𝑥)𝑑𝑥−∞+∞ = ∫ 2𝑥01 2𝑑𝑥 =23 𝐷(𝑋) = ∫ (𝑥 − 𝜇)+∞ 2𝑓(𝑥)𝑑𝑥 −∞ = ∫ (𝑥 −1 23)2× 2𝑥𝑑𝑥 0 =181 3.2 Các phân phối liên t c ụ 3.2.1 Phân phối đều
Phân phối đều liên tục là m t phân ph i ộ ố mà xác su t xấ ảy ra như nhau cho mọi kết cục c a bi n ng u nhiên liên tủ ế ẫ ục.
i. Đại lượng ngẫu nhiên X g i là phân phọ ối đều trên đoạn [a,b] nếu hàm mật độ của X là
𝑓(𝑥) = {𝑏 − 𝑎 𝑛ế𝑢 [𝑎, 𝑏] 10 𝑛ế𝑢 𝑥 𝑥𝜖[𝑎, 𝑏]
Trong trường hợp này ta ký hiệu 𝑋~𝑈(𝑎, 𝑏)
ii. Tính ch t c a phân phấ ủ ối đều Nếu 𝑋~𝑈(𝑎, 𝑏)
𝐸(𝑋) =𝑏+𝑎2 𝐷(𝑋) =(𝑏−𝑎)12 2
+Ví d : ụ
Bắt đầu từ 5 giờ sáng, mỗi 30 phút sẽ có duy nhất 1 chuyến bay từ Hà nội đến Thành ph H Chí Minh. M t ng i mu n bay t Hà N i vào thành phố ồ ộ ờ ố ừ ộ ố, người ấy
đến sân bay kho ng 8 giả ờ 45 phút và 9 giờ 45 phút. Giả s luôn luôn có chử ỗ ố tr ng trên máy bay. Tìm xác suất khi người đó phải đợi 10 phút.
Giải: G i X là s phút sau 8 gi 45 phút. V y X là biọ ố ờ ậ ến có phân phô đề ừu t [0,60]. Có hàm mật độ là
𝑓(𝑥) = {0,60 ,1 𝑡𝑟ườ𝑛𝑔 ℎợ𝑝 𝑘ℎá𝑐𝑛ế𝑢 0 < 𝑥 < 60
Nếu người ấy phải đợi 10 trong kho ng th i gian t 8 gi ả ờ ừ ờ 50 phút đến 9 giờ , hoặc từ 9 gi ờ 20 phút đến 9 giờ 30 phút. V y ta có khoậ ảng xác định biến X là 5 < 𝑋 < 15 ℎ𝑜ặ𝑐 < 𝑋 < .35 45 V y xác su t c n tìm là ậ ấ ầ
𝑃(5 < 𝑋 < 15) + 𝑃(35 < 𝑋 < 45) = ∫15160 𝑑𝑥
5 + ∫45160 𝑑𝑥
35 =13
3.2.2 Phân phối mũ (Exponential Distribution)
Phân phối mũ (Exponential Distribution) ho c phân phặ ối mũ phủ định đại diện cho một phân ph i xác su t giúp mô t ố ấ ảthời gian gi a hai s ữ ựkiện trong một quá trình Poisson. Trong quá trình Poisson, các s ựkiện x y ra liên tả ục v độ ậc l p theo một tần suất trung bình không đổi.
Biến ng u nhiên có phân phẫ ối mũ có thểđược coi là một phiên b n liên t c c a các ả ụ ủ
biến ng u nhiên hình h c. ẫ ọ Nó mô hình hóa th i gian ch ờ ờ đợi cho đến khi m t s ộ ự
kiện được tạo ng u nhiên x y ra trong th i gian liên t c. ẫ ả ờ ụ
Phân phối mũ được sử sụng với các bi n ngế ẫu nhiên liên t c chuyụ ển tr ng thái , ạ
những s ki n c c k ự ệ ự ỳhiếm x y ra ho c là có biả ặ ến động cực kì lớn:
Thời gian cho đến khi xảy ra t i n n giao thông tạ ạ ại ngã tư Thời gian gi a hai l n xữ ầ ảy ra động đất tiếp theo t i mạ ột địa điểm i. Đại lượng ngẫu nhiên X g i là phân phọ ối mũ với tham s ( >0) nố ếu
𝑓(𝑥) = { 𝑒− 𝑥 𝑛ế𝑢 𝑥 ≥ 0 0 𝑛ế𝑢 𝑥 < 0
Trong trường hợp này ta ký hiệu 𝑋~𝐸() ii. Tính ch t cấ ủa phân phối mũ
Nếu 𝑋~𝐸() 𝐸(𝑋) =1 𝐷(𝑋) =12
+Ví d : ụ
Thời h n s d ng c a Tivi là bi n có phân phạ ử ụ ủ ế ối mũ với thời gian tối đa l 10 năm.
Nếu một người mua Tivi của anh ấy vo 10 năm trước, vậy xác suất Tivi còn s ử
dụng được thêm 10 năm tiếp theo là bao nhiêu?
Giải: G i X là th i h n s dọ ờ ạ ử ụng c a Tivi. Do bi n X là bi n ngủ ế ế ẫu nhiên có phân phối mũ, vậy:
𝑃(𝑋 >20|𝑋 > ) = 𝑃 𝑋 >10 ( 10)= 1 − (1 − 𝑒(− 110)10) ≈ 0.37
3.2.3 Phân phối chuẩn (Normal Distribution) A.Phân ph i chu n ố ẩ
Bây gi chúng ta chuy n sang m t trong nh ng phân ph i quan tr ng nh t trong ờ ể ộ ữ ố ọ ấ
xác su t và th ng kê - Phân ph i chuấ ố ố ẩn.
Thật vậy, Định lý Gi i h n Trung tâm (Central Limit Theorem) nói r ng t ng cớ ạ ằ ổ ủa một sốlượng l n các bi n ngớ ế ẫu nhiên độ ậc l p và có phân ph i gi ng hố ố ệt nhau được
phân ph i gố ần đúng chuẩn không ph thu c vào phân phụ ộ ối cơ bản cụ thể ới điề, v u kiệ ằn r ng nó có h u h n giá tr trunữ ạ ị g bình v phương sai .
i. Phân ph i chu n (Normal Distribution) là s phân b dố ẩ ự ố ữ liệu mà ởđó giá
trị t p trung nhi u nhậ ề ất ở khoảng gi a và các giá tr còn l i rữ ị ạ ải đều đối xứng vềphía các điểm c c trự ị(Phân ph i chuố ẩn, 2021).Nó là họ phân phối có d ng t ng quát gi ng nhau, ch khác tham sạ ổ ố ỉ ố vị trí (giá trị trung bình ) và t l ỉ ệ (phương sai ).
Abraham de Moivre l người đầu tiên đưa ra phân phối chuẩn trong bi báo năm 1734 (được in lại trong ấn bản lần 2 The Doctrine of Chances, 1738) khi muốn xấp xỉ m t phân ph i nhộ ố ị thức v i n l n. K t quớ ớ ế ảđược m rở ộng b i Laplace trong cuở ốn sách Analytical Theory of Probabilities (1812), và bây gi gờ ọi l định lý Moivre- Laplace.
Biểu diễn đồ thị của một phân phối chuẩn đôi khi được gọi l đường cong hình chuông vì hình d ng loe r ng ra c a nó. Hình d ng chính xác có thạ ộ ủ ạ ểthay đổi tùy theo t p toàn th c a phân phậ ể ủ ối nhưng đỉnh luôn luôn ở giữa v đường cong luôn
đối x ng. Trong mứ ột phân ph i chu n, giá trố ẩ ị trung bình, yếu vị và trung vị là giống nhau.Tên gọi "đường cong chuông" do Jouffret, người đầu tiên dùng thuật ngữ "bề mặt hình chuông" năm 1872 cho phân phối chu n hai chi u v i các thành ẩ ề ớ
phần độc lập. Tên gọi "phân phối chuẩn" được tạo ra bởi Charles S. Peirce, Francis Galton và Wilhelm Lexis khoảng năm 1875.
ii. Đại lượng ngẫu nhiên X g i là phân ph i chu n n u hàm mọ ố ẩ ế ật độ của X có dạng:
𝑓(𝑥) = 1 𝜎√2𝜋𝑒
−(𝑥−𝑎2𝜎2)2, 𝑣ớ𝑖 𝜎 > 0
Trong công th c trên, x là giá tr c a bi n ngứ ị ủ ế ẫu nhiên; a v σ2 là các tham số; π v
e là các h ng s c a tằ ố ủ ựnhiên, π ≈ 3,14; e 2,718. Công th c khá ph c t p, tuy ≈ ứ ứ ạ
nhiên vi c tính toán sệ ẽđơn giản vì các giá tr c n tìm sị ầ ẽđược cho s n trong bẵ ảng số.
iii. Tính ch t cấ ủa phân ph i chu n ố ẩ
Nếu 𝑋~𝑁 𝑎, 𝜎( 2) E(X)=a 𝐷(𝑋) = 𝜎2
B.Phân ph i chuố ẩn chuẩn t c ắ
Tuy v y m t trong nh ng ng dậ ộ ữ ứ ụng đầu tiên được Gauss áp d ng phân ph i chuụ ố ẩn
vo năm 1809, khi ông dùng nó để nghiên cứu thiên văn học. Nhưng trong cuốn An Introduction to Mathematical Statistics and Its Application c a Larsen và ủ
Marx, Lambert Quetelet lần đầu đưa dữ liệu th ng kê trong nhiố ều trường h p trong ợ
xã h (Ghahramani, 1999) ội.
Các bi n ng u nhiên phân ph i Chuế ẫ ố ẩn có đồ thị quả chuông t i vạ ịtrí khác nhau, độ
cao thấp khác nhau, do đó không thuận l i trong tính toán các xác suợ ất. Để việc
tính toán được thuận lợi, ta xét một biến ngẫu nhiên phân phối Chuẩn đặc biệt là biến ng u nhiên phân ph i Chu n hóa. ẫ ố ẩ
Là phân ph i chu n v i giá tr trung bình bố ẩ ớ ị ằng 0 v độ lệch chuẩn bằng 1. i. Đại lượng ngẫu nhiên 𝑋~𝑁 0,1( ) gọi là phân ph i chu n chu n t c ố ẩ ẩ ắ
Nếu X có phân ph i chu n chu n t c thì hàm mố ẩ ẩ ắ ật độ ủ c a X là 𝑓(𝑥) =√2𝜋1 𝑒−𝑥22 là hàm mật độ Gauss.
Hình 6. Biểu đồ hàm mật độ phân ph i chuố ẩn chu n tẩ ắc ii. Tính ch t c a phân ph i chu n chu n t c ấ ủ ố ẩ ẩ ắ