D. Trung vị
F. Biến ngẫu nhiên chuẩn hóa (Standardized random variables)
Cho X là biến ngẫu nhiên có kỳ vọng 𝜇và phương sai σ². Khi đó biến ngẫu nhiên với công thức :
𝑋∗ = 𝑋 − 𝜇𝜎
Đại lượng X*được gọi là biến ngẫu nhiên chuẩn hóa của X
Khi chuẩn hóa biến ngẫu nhiên X, ta biến nó trở thành giá trị kỳ vọng và biến đơn
không cần sự cạn thiệp của đơn vị đo ban đầu. Sự chuẩn hóa trở nên có ích khi
được so sánh hai hoặc nhiều biến ngẫu nhiên lại với nhau.
+Ví dụ:
Trong một lớp học, bạn Nam được điểm cuối kỳ trong môn toán và môn văn lần
lượt là 72 và 85. Trong đó, môn Văn có số điểm trung bình và độ lệch chuẩn lần
lượt là 82 và 7. Và môn Toán có sốđiểm trung bình và độ lệch chuẩn lần lượt là 68 và 4.
Đánh giá từ số liệu cuối kỳ, bạn Nam là một học sinh giỏi Văn hơn là một học sinh giỏi môn Toán. Nhưng thực tế có thể không phải như thế.
Khi chúng ta chuẩn hóa sốđiểm của bạn Nam: X(toán)=(72-68)/4=1(đơn vịđộ lệch chuẩn)
X(văn)=(85-82)/7=0.43(đơn vịđộ lệch chuẩn)
Điều này đi tới kết luận, độ lệch so với giá trị trung bình môn trong lớp toán của bạn Nam lớn hơn số liệu trong lớp văn. Vậy thực chất, bạn Nam giỏi môn Toán
hơn giỏi môn văn.
2.1.3 Hàm và phân phối của biến ngẫu nhiên rời rạc A. Hàm khối xác suất ( Probrability mass function) A. Hàm khối xác suất ( Probrability mass function)
i. Hàm khối xác suất p(x) của một biến ngẫu nhiên rời rạc X được định
nghĩa là :
𝑝(𝑥) = 𝑃(𝑋 = 𝑥)
Giả sử X là các giá trị X={x1,x2,…,xn,…} khi ấy: ta được X=xi: p(xi)=P(X=xi)≠0 ii. Tính chất của hàm khối
0 ≤ 𝑝(𝑥) ≤ 1 ∑𝑛𝑖=1𝑝(𝑥𝑖) = 1
+Ví dụ:
Cho bảng phân phối sau: Tìm α và P(2≤ 𝑋 ≤ 4)
x 1 2 3 4 5
𝑝(𝑥) α 2α 3α 4α 5α
Giải: ∑𝑛𝑖=1𝑝(𝑥𝑖) = 1 => 𝛼 + 2𝛼 + 3𝛼 + 4𝛼 + 5𝛼 = 15𝛼 = 1 => 𝛼 = 1/15
P(2≤ 𝑋 ≤ 4) = 2/15 + 3/15 + 4/15 = 9/15
B. Hàm phân phối xác suất
i. Cho X là một đại lượng ngẫu nhiên. Ta gọi hàm:
𝐹(𝑥) = 𝑃(𝑋 < 𝑥) là hàm phân phối xác suất của đại lượng ngẫu nhiên
Hàm phân phối xác suất là quy luật cho biết cách gán mỗi xác suất cho mỗi khoảng giá trị của tập số thực, sao cho các tiên đề xác suất được thỏa mãn.(Phân phối xác suất, 2021) ii. Tính chất của hàm phân phối xác suất F(x) không giảm F(-∞) = lim𝑥→−∞𝐹(𝑥) = 0; 𝐹(+∞) = lim𝑥→∞𝐹(𝑥) = 1 P( a≤ 𝑋 ≤ 𝑏) = 𝐹(𝑏) − 𝐹(𝑎) +Ví dụ:
Mỗi ngày, xe buýt đến trạm khoảng từ 10 giờđến 10 giờ 30 sáng. Coi X là thời
Giải: Xe buýt đến trạm ở thời điểm bất kỳ, từ 10 đến 1012 , suy ra ta có t 𝑡 𝜖 (10; 1012), ta có hệphương trình { 𝐹(𝑡) = 𝑃(𝑋 ≤ 𝑡) = 0, 𝑣ớ𝑖 𝑡 ≤ 0 𝐹(𝑡) = 𝑃(𝑋 ≤ 𝑡) = 𝑡 − 10 10 12 − 10= 2(𝑡 − 10), 𝑣ớ𝑖 10 ≤ 𝑡 < 10 1 2 𝐹(𝑡) = 𝑃(𝑋 ≤ 𝑡) = 1, 𝑣ớ𝑖 𝑡 ≥ 1012 Hình 4. Hàm phân phối của ví dụ xe buýt
C. Phân phối Bernoulli
Nếu thử nghiệm ngẫu nhiên có hai kết quả có thể xảy ra: Thành công và thất bại
Đúng và sai
Thì những thử nghiệm trên thường được gọi là phép thử Bernoulli.
i. Một biến ngẫu nhiên rời rạc X có phân phối Bernoulli với tham số p, trong
đó 0 ≤ 𝑝 ≤ 1, nếu hàm khối xác suất của nó được cho bởi p(1)=P(X=1)=p và p(0)= P(X=0)=1-q, với tham số p có giá trị bằng 1.
ii. Tính chất của phân phối Bernoulli(Ghahramani, 1999):
𝐸(𝑋) = 0. 𝑃(𝑋 = 0) + 1. 𝑃(𝑋 = 1) = 𝑃(𝑋 = 1) = 𝑝 𝐸(𝑋2) = 0. 𝑃(𝑋 = 0) + 1. 𝑃(𝑋 = 1) = 𝑝
𝐷(𝑥) = 𝑝 − 𝑝2 = 𝑝(1 − 𝑝)
+Ví dụ:
Tung 1 con xúc xắc để xảy ra mặt 4 hoặc mặt 6 là thành công và ra mặt 1,2,3 hoặc 5 là thất bại ta có hệ phương trình:
Đại lượng X là biến ngẫu nhiên Bernoulli với tham số p =1/3 . Vậy ta có hàm xác suất như sau: 𝑝(𝑥) = { 2 3 , 𝑣ớ𝑖 𝑥 = 0 1 3 , 𝑣ớ𝑖 𝑥 = 1 0 , 𝑛ơ𝑖 𝑘ℎá𝑐
Vậy kỳ vọng E(X) =p=1/3 và phương sai D(X)=1/3(1-1/3)=2/9
D. Phân phối nhị thức (Binomial distribution)
Phân phối nhị thức (Binomial Distribution) là một dạng lan truyền xác suất rời rạc.
Nó được sử dụng trong trường hợp thí nghiệm chỉ có hai khả năng – thành công và thất bại. Phân phối nhị thức là một phân phối xác suất rời rạc, nó thể hiện xác suất của một tập gồm hai kết quả khác nhau: thành công (p) và thất bại (q).
i. Đại lượng ngẫu nhiên rời rạc 𝑋 = {0,1,2, … , 𝑛} gọi là phân phối nhị thức nếu tồn tại số𝑝 ∈ (0,1) sao cho:
𝑝𝑘 = 𝑃(𝑋 = 𝑘) = 𝐶𝑛𝑘𝑝𝑘𝑞𝑛−𝑘, 𝑞 = 1 − 𝑞, 𝑘 = 0, 𝑛 Trong trường hợp này ta ký hiệu 𝑋~𝐵(𝑛, 𝑝)
Nếu bài toán thỏa mãn lược đồ Bernoulli, nghĩa là chỉra được: Có n phép thử độc lập.
Trong mỗi phép thử, xác suất xuất hiện biến cốA không đổi là P(A) = p. X là số lần xuất hiện biến cố A trong n phép thử đó thì X phân phối theo quy
luật Nhị thức.
ii. Tính chất của phân phối nhị thức
𝐸(𝑋) = 𝐸 (∑ 𝑋𝑖 𝑛 𝑖=1 ) = ∑ 𝐸(𝑋𝑖) 𝑛 𝑖=1 = 𝑛𝑝
Phương sai của biến ngẫu nhiên X bằng tổng các phương sai thành phần
𝐷(𝑋) = 𝐸(𝑋2) − (𝐸(𝑋))2 = 𝑛𝑝(1 − 𝑝) = 𝑛𝑝𝑞
+Ví dụ:
Trong bệnh viện vào thứ Năm tuần trước, có 10 đứa bé chào đời, trong đó có 6 đứa bé trai. Tìm xác suất để 6 đứa bé đầu chào đời liên tiếp là bé trai?
Gọi A là biến cố6 đứa bé đầu là bé train ad 4 đứa còn lại là bé gái. Gọi X là số bé t, vậy X là biến nhị thức có tham số là 10 và ½. Vậy xác suất cần tìm là
𝑃(𝐴𝑋 = 6) =𝑃(𝐴 𝑣à 𝑋 = 6)𝑃(𝑋 = 6) = 𝑃(𝑋 = 6) =𝑃(𝐴) 𝐶 (1/2)10
106 × (1/2)6× (1/2)4 = 0.0048
E. Phân phối hình học
Phân phối hình học (Geometric Distribution) là dạng đặc biệt của phân phối nhị
thức âm. Nó liên quan tới sốlượt thử cần thiết cho một lần thành công duy nhất. Vì vậy phân phối hình học là một phân phối nhị thức âm với số lần thành công là 1.
i. Một biến ngẫu nhiên rời rạc X có phân phối hình học với tham số p,
trong đó 𝑝 ∈ (0,1) , có công thức xác suất thành công với n lần thử:
𝑃(𝑋 = 𝑛) = 𝑝 × 𝑞𝑛−1
Với p là xác thành công cho một lần thử duy nhất q là xác suất thất bại cho một lần thử duy nhất n là số lần thử
ii. Tính chất của phân phối hình học
𝐸(𝑋) = 1𝑝 𝐷(𝑋) = 1−𝑝𝑝2
+Ví dụ:
Trong bộ bài 52 lá, ta rút thử 1 lá .Thửcho đến khi rút được lá Át thì dừng lại. Xác suất để ít nhất 10 lần rút được lá Át?
Giải: Gọi X là sốlá bài rút được cho đến khi gặp lá Át. X là biến ngẫu nhiên có phân phối hình học với tham số p=1/13 , vậy 𝑃(𝑋 = 𝑛) = (1213)𝑛−1(1/13) 𝑣ớ𝑖 𝑛 = 1,10 Vậy xác suất cần tìm là 𝑃(𝑋 ≥ 10) = ∑ (1213)𝑛−1(13)1 ∞ 𝑛=10 = 13 .1 (12/13)9 1 − 12/13 ≈ 0.49 F. Phân phối Poisson
Trong phân phối nhị thức, khi xảy ra n! số lần thử, dãy số nào quá lớn để có thể
phục vụ cho công tác này. Là xác suất của biến ngẫu nhiên rời rạc và nó thường
được sử dụng rộng rãi trong các công việc có thể đo đạc được. Sự phân bố này
được đưa ra bởi nhà toán học người Pháp, tiến sỹ Simon Denis Poisson vào năm
1837 và phân bố này được đặt theo tên ông. Sau khi ông qua đời, nhà toán học
người Nga L.V.Bortkiewicz đã hoàn tất những công việc còn lại. Hiện nay, phân phối Poisson được phổ biến nhất, chỉ đứng sau phân phối nhị thức và phân phối chuẩn trong ngành thống kê.
Phép tuần hoàn Poisson được tận dụng như một phần của các trường hợp mà xác suất xuất hiện của một sự kiện là nhỏ, nghĩa là sự kiện chỉ xảy ra một lần sau một khoảng thời gian dài. Ví dụ, xác suất xảy ra lỗi trong quá trình thành lập tập đoàn
là nhỏ, xác suất xảy ra chấn động trong một năm là nhỏ, việc rủi ro xảy ra trên
đường phố là nhỏ, và tương tự như vậy. Tất cả đều là những trường hợp mà xác suất xảy ra sự kiện là nhỏ.
i. Đại lượng ngẫu nhiên 𝑋 = {0,1,2, … , 𝑛} gọi là có phân phối Poisson nếu tồn tại 𝑎 > 0, a là tham số của phân phối Poisson:
𝑝𝑘 = 𝑃(𝑋 = 𝑘) = 𝑒−𝑎 × 𝑎𝑘
𝑘! , 𝑘 = 0,1,2, …
ii. Tính chất của phân phối Poisson:
𝐸(𝑋) = 𝑎
𝐸(𝑋2) = 𝑎(𝑎 + 1) 𝐷(𝑋) = 𝑎
Trung bình trong một cuốn sách, cứ 3 trang là có 1 lỗi đánh máy. Nếu số lồi đánh
máy là biến ngẫu nhiên Poisson, xác suất để có ít nhất 1 lỗi trên cuốn sách đó là
bao nhiêu?
Giải: Gọi X là số lỗi trên 1 trang cụ thể. X là biến ngẫu nhiên Poisson với tham số
k=1/3=E(X) có công thức
𝑃(𝑋 = 𝑘) = (1/3)𝑘𝑒−1/3 𝑛!
CHƯƠNG 3. BIẾN NGẪU NHIÊN LIÊN TỤC 3.1Biến ngẫu nhiên liên tục 3.1Biến ngẫu nhiên liên tục
3.1.1 Định nghĩa
A. Biến ngẫu nhiên liên tục
Nếu với biến ngẫu nhiên rời rạc ta có thể liệt kê các giá trị có thể, thì biến ngẫu nhiên liên tục các giá trị có thể có của nó lấp đầy một khoảng và không thể liệt kê chi tiết ra được.
Trong thực tế, có nhiều biến ngẫu nhiên bản chất là rời rạc, tuy nhiên vì số lượng giá trị cảu nó là rất nhiều nên cũng có thể xét như là biến ngẫu nhiên liên tục.
+Ví dụ:
Trọng lượng của một loại sản phẩm, mực nước biển tại một thời điểm là những đại
lượng ngẫu nhiên liên tục.
B. Hàm mật độ xác suất (Probability density function)
i. Cho X là đại lượng ngẫu nhiên liên tục, có hàm phân phối F(x) là một
đạo hàm. Khi đó ta gọi hàm:
𝑓(𝑥) = 𝐹′(𝑥) là hàm mật độ xác suất
Hàm mật độ xác suất của biến ngẫu nhiên liên tục X, ký hiệu là f(x), là hàm số
không âm trong khoảng giá trị của X và diện tích tạo bởi hàm sốđó và trục hoành bằng 1, thể hiện sự phân phối xác suất của X.
ii. Tính chất của hàm mật độ xác suất
Hàm mật độ xác suất của đại lượng ngẫu nhiên X có các tính chất sau:
∫ 𝑓(𝑥)𝑑𝑥−∞+∞ = 1
𝑃(𝑎 < 𝑋 < 𝑏) = ∫ 𝑓(𝑥)𝑑𝑥𝑎𝑏 𝐹(𝑥) = ∫ 𝑓(𝑡)𝑑𝑡−∞𝑥
Từ các tính chất trên có thể rút ra các nhận xét sau:
Với biến ngẫu nhiên liên tục X, chỉ xét xác suất nhận giá trị trong một khoảng. Xác suất X nhận giá trị tại một điểm bằng 0.
Khi xét xác suất X nhận giá trị trong một khoảng, không cần quan tâm đến cận.
Hình ảnh hàm mật độ xác suất cho biết sự tập trung của xác suất, chỗ nào hàm mật độ càng cao thì xác suất tập trung ở khoảng vây quanh giá trị đó
càng nhiều. Hàm mật độ xác suất bằng 0 là giá trị xảy ra với xác suất bằng 0. +Ví dụ: Cho hàm: { 0, 𝑥 < 1 1 2+14(𝑥 − 3), 1 ≤ 𝑥 < 3 1 2−14(𝑥 − 3), 3 ≤ 𝑥 < 5 0, 𝑥 ≥ 5
a) Chứng tỏ f(x) là hàm mật độ xác suất của một đại lượng ngẫu nhiên X Hiển nhiên f(x)≥ 0 và diện tích của tam giác ABC trên đồ thị bằng 1
3.1.2 Các đặc trưng của biến ngẫu nhiên liên tục A. Kỳ vọng A. Kỳ vọng
Trường hợp X là đại lượng ngẫu nhiên liên tục có hàm mật độ f(x) thì kỳ vọng của X là số: 𝐸(𝑋) = ∫ 𝑥𝑓(𝑥)𝑑𝑥+∞ −∞ B. Phương sai Nếu X liên tục, có hàm mật độ xác suất f(x) , 𝜇 là kỳ vọng ,thì ta có 𝐷(𝑋) = ∫ (𝑥 − 𝜇)+∞ 2𝑓(𝑥)𝑑𝑥 −∞ +Ví dụ:
Cho X là đại lượng ngẫu nhiên có hàm mật độ
𝑓(𝑥) = {2𝑥 𝑛ế𝑢 𝑥𝜖[0,1]0 𝑛ế𝑢 𝑥 [0,1] Tìm kỳ vọng của X Giải: E(X) =∫ 𝑥𝑓(𝑥)𝑑𝑥−∞+∞ = ∫ 2𝑥01 2𝑑𝑥 =23 𝐷(𝑋) = ∫ (𝑥 − 𝜇)+∞ 2𝑓(𝑥)𝑑𝑥 −∞ = ∫ (𝑥 −1 23)2× 2𝑥𝑑𝑥 0 =181 3.2 Các phân phối liên tục 3.2.1 Phân phối đều
Phân phối đều liên tục là một phân phối mà xác suất xảy ra như nhau cho mọi kết cục của biến ngẫu nhiên liên tục.
i. Đại lượng ngẫu nhiên X gọi là phân phối đều trên đoạn [a,b] nếu hàm mật độ của X là
𝑓(𝑥) = {𝑏 − 𝑎 𝑛ế𝑢 𝑥𝜖[𝑎, 𝑏] 1 0 𝑛ế𝑢 𝑥 [𝑎, 𝑏] Trong trường hợp này ta ký hiệu 𝑋~𝑈(𝑎, 𝑏)
ii. Tính chất của phân phối đều Nếu 𝑋~𝑈(𝑎, 𝑏)
𝐸(𝑋) = 𝑏+𝑎2 𝐷(𝑋) = (𝑏−𝑎)12 2
+Ví dụ:
Bắt đầu từ 5 giờ sáng, mỗi 30 phút sẽ có duy nhất 1 chuyến bay từ Hà nội đến Thành phố Hồ Chí Minh. Một ngời muốn bay từ Hà Nội vào thành phố, người ấy
đến sân bay khoảng 8 giờ 45 phút và 9 giờ 45 phút. Giả sử luôn luôn có chỗ trống trên máy bay. Tìm xác suất khi người đó phải đợi 10 phút.
Giải: Gọi X là số phút sau 8 giờ 45 phút. Vậy X là biến có phân phô đều từ [0,60]. Có hàm mật độ là
𝑓(𝑥) = {60 ,1 𝑛ế𝑢 0 < 𝑥 < 60 0, 𝑡𝑟ườ𝑛𝑔 ℎợ𝑝 𝑘ℎá𝑐
Nếu người ấy phải đợi 10 trong khoảng thời gian từ 8 giờ50 phút đến 9 giờ , hoặc từ 9 giờ20 phút đến 9 giờ 30 phút. Vậy ta có khoảng xác định biến X là 5 < 𝑋 < 15 ℎ𝑜ặ𝑐 35 < 𝑋 < 45. Vậy xác suất cần tìm là
𝑃(5 < 𝑋 < 15) + 𝑃(35 < 𝑋 < 45) = ∫1560 𝑑𝑥1
5 + ∫4560 𝑑𝑥1 35 = 13
3.2.2 Phân phối mũ (Exponential Distribution)
Phân phối mũ (Exponential Distribution) hoặc phân phối mũ phủđịnh đại diện cho một phân phối xác suất giúp mô tả thời gian giữa hai sự kiện trong một quá trình Poisson. Trong quá trình Poisson, các sự kiện xảy ra liên tục và độc lập theo một tần suất trung bình không đổi.
Biến ngẫu nhiên có phân phối mũ có thể được coi là một phiên bản liên tục của các biến ngẫu nhiên hình học. Nó mô hình hóa thời gian chờđợi cho đến khi một sự
kiện được tạo ngẫu nhiên xảy ra trong thời gian liên tục.
Phân phối mũ được sử sụng với các biến ngẫu nhiên liên tục chuyển trạng thái , những sự kiện cực kỳ hiếm xảy ra hoặc là có biến động cực kì lớn:
Thời gian cho đến khi xảy ra tại nạn giao thông tại ngã tư
Thời gian giữa hai lần xảy ra động đất tiếp theo tại một địa điểm
i. Đại lượng ngẫu nhiên X gọi là phân phối mũ với tham số (>0) nếu hàm mật độ của X là:
𝑓(𝑥) = {𝑒0 𝑛ế𝑢 𝑥 < 0−𝑥 𝑛ế𝑢 𝑥 ≥ 0 Trong trường hợp này ta ký hiệu 𝑋~𝐸()
ii. Tính chất của phân phối mũ
Nếu 𝑋~𝐸() 𝐸(𝑋) = 1 𝐷(𝑋) = 12
+Ví dụ:
Thời hạn sử dụng của Tivi là biến có phân phối mũ với thời gian tối đa là 10 năm.
Nếu một người mua Tivi của anh ấy vào 10 năm trước, vậy xác suất Tivi còn sử
dụng được thêm 10 năm tiếp theo là bao nhiêu?
Giải: Gọi X là thời hạn sử dụng của Tivi. Do biến X là biến ngẫu nhiên có phân phối mũ, vậy:
𝑃(𝑋 > 20|𝑋 > 10) = 𝑃(𝑋 > 10) = 1 − (1 − 𝑒(− 110)10) ≈ 0.37
3.2.3 Phân phối chuẩn (Normal Distribution) A. Phân phối chuẩn A. Phân phối chuẩn
Bây giờ chúng ta chuyển sang một trong những phân phối quan trọng nhất trong xác suất và thống kê - Phân phối chuẩn.
Thật vậy, Định lý Giới hạn Trung tâm (Central Limit Theorem) nói rằng tổng của một sốlượng lớn các biến ngẫu nhiên độc lập và có phân phối giống hệt nhau được
phân phối gần đúng chuẩn không phụ thuộc vào phân phối cơ bản cụ thể, với điều kiện rằng nó có hữu hạn giá trị trung bình và phương sai .
i. Phân phối chuẩn (Normal Distribution) là sự phân bố dữ liệu mà ở đó giá
trị tập trung nhiều nhất ở khoảng giữa và các giá trị còn lại rải đều đối xứng về phía các điểm cực trị(Phân phối chuẩn, 2021).Nó là họ phân phối có dạng tổng quát giống nhau, chỉ khác tham số vị trí (giá trị trung bình ) và tỉ lệ(phương sai ).
Abraham de Moivre là người đầu tiên đưa ra phân phối chuẩn trong bài báo năm1734 (được in lại trong ấn bản lần 2 The Doctrine of Chances, 1738) khi muốn xấp 1734 (được in lại trong ấn bản lần 2 The Doctrine of Chances, 1738) khi muốn xấp xỉ một phân phối nhị thức với n lớn. Kết quảđược mở rộng bởi Laplace trong cuốn sách Analytical Theory of Probabilities (1812), và bây giờ gọi là định lý Moivre-