D. Phân ph i nh ố ị thứ c (Binomial distribution)
B. Hàm m ật độ xác su t (Probability density function) ấ
i. Cho X l đại lượng ng u nhiên liên t c, có hàm phân ph i F(x) là mẫ ụ ố ột đạo hm. Khi đó ta gọi hàm:
𝑓(𝑥) = 𝐹′(𝑥) là hàm mật độ xác su t ấ
Hàm mật độ xác su t c a bi n ng u nhiên liên t c X, ký hi u là f(x), là hàm s ấ ủ ế ẫ ụ ệ ố
không âm trong kho ng giá tr c a X và di n tích t o b i hàm sả ị ủ ệ ạ ở ố đó v trục hoành bằng 1, th ểhiện s phân ph i xác su t c a X. ự ố ấ ủ
ii. Tính ch t c a hàm mấ ủ ật độ xác suất
Hàm mật độ xác su t cấ ủa đại lượng ngẫu nhiên X có các tính ch t sau: ấ
∫ 𝑓(𝑥)𝑑𝑥−∞+∞ = 1
𝑃(𝑎 < 𝑋 < 𝑏) = ∫ 𝑓(𝑥)𝑑𝑥𝑎𝑏
𝐹(𝑥) = ∫ 𝑓(𝑡)𝑑𝑡−∞𝑥
Từ các tính chất trên có th rút ra các nh n xét sau: ể ậ
Với biến ngẫu nhiên liên t c X, ch xét xác suụ ỉ ất nhận giá tr trong mị ột
khoảng. Xác su t X nh n giá tr t i mấ ậ ị ạ ột điểm bằng 0.
Khi xét xác su X nh n giá tr trong m t kho ng, không cất ậ ị ộ ả ần quan tâm đến
cận.
Hình nh hàm mả ật độ xác su t cho bi t s t p trung c a xác su t, ch nào ấ ế ự ậ ủ ấ ỗ
hàm mật độ càng cao thì xác su t t p trung kho ng vây quanh giá trấ ậ ở ả ị đó
càng nhi u. Hàm mề ật độ xác su t b ng 0 là giá tr x y ra v i xác su t b ng 0. ấ ằ ị ả ớ ấ ằ +Ví d : ụ Cho hàm: { 0, 𝑥 < 1 1 2+14(𝑥 − 3 , 1 ≤ 𝑥 < 3) 1 2−14(𝑥 − 3 , 3 ≤ 𝑥 < 5) 0, 𝑥 ≥ 5
a) Chứng tỏ f(x) là hàm mật độ xác su t cấ ủa một đại lượng ngẫu nhiên X
Hiển nhiên f(x)≥ 0 và diện tích c a tam giáủ c ABC trên đồ b ng 1 thị ằ
3.1.2 Các đặc trưng của biến ngẫu nhiên liên t c ụ
A.Kỳ vọng
Trường hợp X l đại lượng ngẫu nhiên liên t c có hàm mụ ật độ f(x) thì k v ng cỳ ọ ủa
X là s : ố 𝐸(𝑋) = ∫ 𝑥𝑓(𝑥)𝑑𝑥+∞ −∞ B.Phương sai Nếu X liên t c, có hàm mụ ật độ xác su t f(x) , k v ng ,thì ta có ấ 𝜇là ỳ ọ 𝐷(𝑋) = ∫ (𝑥 − 𝜇)+∞ 2𝑓(𝑥)𝑑𝑥 −∞ +Ví d : ụ ng ng u nhiên có hàm m
Cho X l đại lượ ẫ ật độ
𝑓(𝑥) = {2𝑥 𝑛ế𝑢 𝑥𝜖[0,1]0 𝑛ế𝑢 𝑥 [0,1] Tìm kỳ v ng c a X ọ ủ Giải: E(X) =∫ 𝑥𝑓(𝑥)𝑑𝑥−∞+∞ = ∫ 2𝑥01 2𝑑𝑥 =23 𝐷(𝑋) = ∫ (𝑥 − 𝜇)+∞ 2𝑓(𝑥)𝑑𝑥 −∞ = ∫ (𝑥 −1 23)2× 2𝑥𝑑𝑥 0 =181 3.2 Các phân phối liên t c ụ 3.2.1 Phân phối đều
Phân phối đều liên tục là m t phân ph i ộ ố mà xác su t xấ ảy ra như nhau cho mọi kết
i. Đại lượng ngẫu nhiên X g i là phân phọ ối đều trên đoạn [a,b] nếu hàm
mật độ của X là
𝑓(𝑥) = {𝑏 − 𝑎 𝑛ế𝑢 [𝑎, 𝑏] 10 𝑛ế𝑢 𝑥 𝑥𝜖[𝑎, 𝑏]
Trong trường hợp này ta ký hiệu 𝑋~𝑈(𝑎, 𝑏)
ii. Tính ch t c a phân phấ ủ ối đều Nếu 𝑋~𝑈(𝑎, 𝑏)
𝐸(𝑋) =𝑏+𝑎2 𝐷(𝑋) =(𝑏−𝑎)12 2
+Ví d : ụ
Bắt đầu từ 5 giờ sáng, mỗi 30 phút sẽ có duy nhất 1 chuyến bay từ Hà nội đến Thành ph H Chí Minh. M t ng i mu n bay t Hà N i vào thành phố ồ ộ ờ ố ừ ộ ố, người ấy đến sân bay kho ng 8 giờ 45 phút và 9 giờ 45 phút. Giả s ln ln có chỗ ốả ử tr ng trên máy bay. Tìm xác suất khi người đó phải đợi 10 phút.
Giải: G i X là s phút sau 8 gi 45 phút. V y X là biọ ố ờ ậ ến có phân phơ đề ừu t [0,60]. Có hàm mật độ là
𝑓(𝑥) = {0,60 ,1 𝑡𝑟ườ𝑛𝑔 ℎợ𝑝 𝑘ℎá𝑐𝑛ế𝑢 0 < 𝑥 < 60
Nếu người ấy phải đợi 10 trong kho ng th i gian t 8 gi ả ờ ừ ờ 50 phút đến 9 giờ , hoặc
từ 9 gi ờ 20 phút đến 9 giờ 30 phút. V y ta có khoậ ảng xác định biến X là 5 < 𝑋 < 15 ℎ𝑜ặ𝑐 < 𝑋 < .35 45 V y xác su t c n tìm là ậ ấ ầ
𝑃(5 < 𝑋 < 15) + 𝑃(35 < 𝑋 < 45) = ∫15160 𝑑𝑥
5 + ∫45160 𝑑𝑥
35 =13
3.2.2 Phân phối mũ (Exponential Distribution)
Phân phối mũ (Exponential Distribution) ho c phân phặ ối mũ phủ định đại diện cho một phân ph i xác su t giúp mô t ố ấ ảthời gian gi a hai s ữ ựkiện trong một quá trình Poisson. Trong quá trình Poisson, các s ựkiện x y ra liên tả ục v độ ậc l p theo một
tần suất trung bình khơng đổi.
Biến ng u nhiên có phân phối mũ có thể được coi là một phiên b n liên t c c a các ẫ ả ụ ủ
biến ng u nhiên hình h c. ẫ ọ Nó mơ hình hóa th i gian ch ờ ờ đợi cho đến khi m t s ộ ự
kiện được tạo ng u nhiên x y ra trong th i gian liên t c. ẫ ả ờ ụ
Phân phối mũ được sử sụng với các bi n ngế ẫu nhiên liên t c chuyụ ển tr ng thái , ạ
những s ki n c c k ự ệ ự ỳhiếm x y ra ho c là có biả ặ ến động cực kì lớn: Thời gian cho đến khi xảy ra t i n n giao thông tạ ạ ại ngã tư Thời gian gi a hai l n xữ ầ ảy ra động đất tiếp theo t i mạ ột địa điểm i. Đại lượng ngẫu nhiên X g i là phân phọ ối mũ với tham s ( >0) nố ếu
𝑓(𝑥) = { 𝑒− 𝑥 𝑛ế𝑢 𝑥 ≥ 0 0 𝑛ế𝑢 𝑥 < 0
Trong trường hợp này ta ký hiệu 𝑋~𝐸() ii. Tính ch t cấ ủa phân phối mũ
Nếu 𝑋~𝐸() 𝐸(𝑋) =1 𝐷(𝑋) =12
+Ví d : ụ
Thời h n s d ng c a Tivi là bi n có phân phạ ử ụ ủ ế ối mũ với thời gian tối đa l 10 năm.
Nếu một người mua Tivi của anh ấy vo 10 năm trước, vậy xác suất Tivi còn s ử
dụng được thêm 10 năm tiếp theo là bao nhiêu?
Giải: G i X là th i h n s dọ ờ ạ ử ụng c a Tivi. Do bi n X là bi n ngủ ế ế ẫu nhiên có phân
phối mũ, vậy:
𝑃(𝑋 >20|𝑋 > ) = 𝑃 𝑋 >10 ( 10)= 1 − (1 − 𝑒(− 110)10) ≈ 0.37
3.2.3 Phân phối chuẩn (Normal Distribution) A.Phân ph i chu n ố ẩ
Bây gi chúng ta chuy n sang m t trong nh ng phân ph i quan tr ng nh t trong ờ ể ộ ữ ố ọ ấ
xác su t và th ng kê - Phân ph i chuấ ố ố ẩn.
Thật vậy, Định lý Gi i h n Trung tâm (Central Limit Theorem) nói r ng t ng cớ ạ ằ ổ ủa
phân ph i gố ần đúng chuẩn không ph thu c vào phân phụ ộ ối cơ bản cụ thể ới điều , v kiệ ằn r ng nó có h u h n giá tr trunữ ạ ị g bình v phương sai .
i. Phân ph i chu n (Normal Distribution) là s phân b dố ẩ ự ố ữ liệu mà ở đó giá
trị t p trung nhi u nhậ ề ất ở khoảng gi a và các giá tr còn l i rữ ị ạ ải đều đối
xứng về phía các điểm c c trự ị(Phân ph i chuố ẩn, 2021).Nó là họ phân phối có d ng t ng quát gi ng nhau, ch khác tham số vị trí (giá trị trung ạ ổ ố ỉ
bình ) và t l ỉ ệ (phương sai ).
Abraham de Moivre l người đầu tiên đưa ra phân phối chuẩn trong bi báo năm 1734 (được in lại trong ấn bản lần 2 The Doctrine of Chances, 1738) khi muốn xấp
xỉ m t phân ph i nhộ ố ị thức v i n l n. K t quớ ớ ế ả được m rở ộng b i Laplace trong cuở ốn
sách Analytical Theory of Probabilities (1812), và bây gi gờ ọi l định lý Moivre- Laplace.
Biểu diễn đồ thị của một phân phối chuẩn đôi khi được gọi l đường cong hình chng vì hình d ng loe r ng ra c a nó. Hình d ng chính xác có thạ ộ ủ ạ ể thay đổi tùy theo t p toàn th c a phân phậ ể ủ ối nhưng đỉnh luôn luôn ở giữa v đường cong luôn
đối x ng. Trong một phân ph i chu n, giá trị trung bình, yếu vị và trung vị là ứ ố ẩ
giống nhau.Tên gọi "đường cong chuông" do Jouffret, người đầu tiên dùng thuật ngữ "bề mặt hình chng" năm 1872 cho phân phối chu n hai chi u v i các thành ẩ ề ớ
phần độc lập. Tên gọi "phân phối chuẩn" được tạo ra bởi Charles S. Peirce, Francis Galton và Wilhelm Lexis khoảng năm 1875.
ii. Đại lượng ngẫu nhiên X g i là phân ph i chu n n u hàm mọ ố ẩ ế ật độ của X có
dạng:
𝑓(𝑥) = 1 𝜎√2𝜋𝑒
−(𝑥−𝑎2𝜎2)2, 𝑣ớ𝑖 𝜎 > 0
Trong công th c trên, x là giá tr c a bi n ngứ ị ủ ế ẫu nhiên; a v σ2 là các tham số; π v
e là các h ng s c a tằ ố ủ ự nhiên, π ≈ 3,14; e 2,718. Công th c khá ph c t p, tuy ≈ ứ ứ ạ
nhiên vi c tính tốn sệ ẽ đơn giản vì các giá tr c n tìm sị ầ ẽ được cho s n trong bẵ ảng
số.
iii. Tính ch t cấ ủa phân ph i chu n ố ẩ
Nếu 𝑋~𝑁 𝑎, 𝜎( 2) E(X)=a 𝐷(𝑋) = 𝜎2
B.Phân ph i chuố ẩn chuẩn t c ắ
Tuy v y m t trong nh ng ng dậ ộ ữ ứ ụng đầu tiên được Gauss áp d ng phân ph i chuụ ố ẩn vo năm 1809, khi ơng dùng nó để nghiên cứu thiên văn học. Nhưng trong cuốn An Introduction to Mathematical Statistics and Its Application c a Larsen và ủ
Marx, Lambert Quetelet lần đầu đưa dữ liệu th ng kê trong nhiố ều trường h p trong ợ
xã h (Ghahramani, 1999) ội.
Các bi n ng u nhiên phân ph i Chuế ẫ ố ẩn có đồ thị quả chng t i vạ ị trí khác nhau, độ
cao thấp khác nhau, do đó khơng thuận l i trong tính tốn các xác suợ ất. Để việc tính tốn được thuận lợi, ta xét một biến ngẫu nhiên phân phối Chuẩn đặc biệt là biến ng u nhiên phân ph i Chu n hóa. ẫ ố ẩ
Là phân ph i chu n v i giá tr trung bình bố ẩ ớ ị ằng 0 v độ lệch chuẩn bằng 1.
i. Đại lượng ngẫu nhiên 𝑋~𝑁 0,1( ) gọi là phân ph i chu n chu n t c ố ẩ ẩ ắ
Nếu X có phân ph i chu n chu n t c thì hàm mố ẩ ẩ ắ ật độ ủ c a X là 𝑓(𝑥) =√2𝜋1 𝑒−𝑥22 là hàm mật độ Gauss.
Hình 6. Biểu đồ hàm mật độ phân ph i chuố ẩn chu n tẩ ắc ii. Tính ch t c a phân ph i chu n chu n t c ấ ủ ố ẩ ẩ ắ
Nếu 𝑋~𝑁 𝑎, 𝜎( 2) thì 𝑌 =𝑋−𝑎𝜎 ~𝑁 0,1( )
C.Tích phân Laplace
i. Cho f(x) là hàm mật độ Gauss. Khi đó ta có hm phân phối Gauss
𝐹(𝑢) = ∫ 𝑓(𝑥)𝑑𝑥−∞𝑢
Và tích phân Laplace 𝛷(𝑢) = ∫ 𝑓(𝑥)𝑑𝑥0𝑢 =√2𝜋1 ∫ 𝑒0𝑢 −𝑥22𝑑𝑥 Giữa hàm phân ph i Gauss và tích phân Laplace có mối liên h ố ệ F(u)=1/2+Φ(u) D.Cơng th c tính xác su t ứ ấ Nếu 𝑋~𝑁 𝑎, 𝜎( 2) 𝑃(𝛼 < 𝑋 < 𝛽 = 𝛷) (𝛽−𝑎𝜎 ) − 𝛷 (𝛼−𝑎𝜎 ) 𝑃(|𝑋 − 𝑎| < 𝛼) = 2𝛷 (𝛼𝜎) với α>0 Nếu 𝑋~𝑁 0,1( ) 𝑃(𝛼 < 𝑋 < 𝛽 = 𝛷) (𝛽)− 𝛷(𝛼) 𝑃(|𝑋| < 𝛼 = 2𝛷) (𝛼) với α>0
+Ví d : Bài toán c a Lambert Quetelet ụ ủ
Giả s ử trung bình độ ộ r ng c a ng c củ ự ủa một người đn ông trưởng thành trung bình l 39,8 inch v độ lệch chuẩn là 2.05 inch. V y xác su t khi ch n ng u nhiên ậ ấ ọ ẫ 20 người nam, 5 người đầu có độ rộng của ng c mình ít nh t 40inch? ự ấ
Giải: G i p là xác suọ ất khi chọn được người đn ơng có độ rộng ngực của mình t ừ
40 inch tr lên. Nở ếu X là bi n có phân ph i chu n v i tr ế ố ẩ ớ ị trung bình l 39.8 v độ
lệch chuẩn l 2.05 thì ta có đồ thị:
Hình 7. Hình th ểhiện ví d phân ph i chu n ụ ố ẩ
Gọi i l độ rộng của ngực i=33,…..Ta phân tích thấy được độ rộng i từ 33 đến 48 inch có t n s ầ ố tương đối với phần đồ có hàm mthị ật độ P(i- 1/2<X<1/2) khi X là bi n có phân phế ối đều với
X có phân ph i chuố ẩn 𝑋~𝑁 𝑎, 𝜎( 2)
Vậy sử dụng bảng tra tích phân Laplace ta có thể tìm được:
𝑝 = 𝑃 𝑋 ≥( 40)= 𝑃(𝑋 − .839
2.05 ≥40 39− .82.05 ) = 𝑃 (𝑋 − .82.05 ≥ 0.1)39 = 𝑃 𝑍 ≥ 0.1 = 1 − 𝛷 0.1 ≈ 1 − 0.5398 ≈ 0.( ) ( ) 46 Vậy xác suất để 5 người chọn đầu thỏa yêu c u bài toán là ầ
:𝐶205(0.46)5(0.54)15≈ 0.03
3.2.4 Phân phối Chi-Bình phương( Chi-Squared)
Phân ph i Chi-ố bình phương (Chi squared) đượ- c sử d ng r ng rãi trong thụ ộ ống kê để
tính tốn nh ng giá tr sau: ữ ị
Ước lượng khoảng tin cậy cho độ ệ l ch chu n c a t p t ng th i v i mẩ ủ ậ ổ ể đố ớ ột
phân ph i chu n, s dố ẩ ử ụng độ ệ l ch chu n c a mẩ ủ ẫu.
Để kiểm tra độ độc lập của hai phân lo i tiêu chuạ ẩn đối với các biến đa tính. Để nghiên cứu độbi n thiên mẫu trong trường hợp phân ph i là phân phế ố ối
chuẩn.
Để kiểm th l ch gi a các tử độ ệ ữ ần s kố ỳ v ng và t n s ọ ầ ốthự ếc t .
Nếu có n biến ngẫu nhiên Chuẩn hóa , khi bình phương các biến đó rồi lấy t ng, thì ổ
tổng đó sẽ phân ph i theo mố ột quy luật g i là quy luọ ật “Chi – bình phương”, ký
hiệu l χ2(n), đọc là quy luật “Chi – bình phương bậc tự do n”.