C 9 a) Tớnh tỷ lệ phần trăm cỏc giỏ trị trong mỗi nhúm
()x x n x x n
5.3.3 Phõn phối normal chuẩn húa (standard normal distribution)
Biện phỏp chuẩn húa dữ liệu mà chỳng ta đó nghiờn cứu ở chương 4 được cỏc nhà thống kờ vận dụng để chỉ cần xõy dựng một bảng tra duy nhất cung cấp tất cả những xỏc suất mà chỳng ta cần tớnh, bằng cỏch sử dụng cụng thức chuẩn húa đó biết thỡ bất kỳ một biến ngẫu nhiờn X nào cú phõn phối normal với trung bỡnh μ và phương sai σ2 cũng cú thể chuyển thành một biến ngẫu nhiờn chuẩn húa Z. Dự cho dữ liệu nguyờn thủy của biến X cú μ và σ2 như thế nào đi nữa thỡ biến Z luụn luụn chỉ cú trung bỡnh μ = 0 và phương sai σ2 = 1. Từ đõy chỳng ta cú thể đoỏn ra nếu chỉ cú một cặp kết hợp duy nhất của trung bỡnh và phương sai thỡ chỉ cần xõy dựng một bảng tra là đủ.
Biến ngẫu nhiờn chuẩn húa Z cú phõn phối được gọi là phõn phối normal chuẩn húa cú liờn quan mật thiết về bản chất với phõn phối normal. Hàm mật độ xỏc suất của biến ngẫu nhiờn chuẩn húa Z được gọi là hàm mật độ xỏc suất của phõn phối normal chuẩn húa với cụng thức như sau: 2 z 2 1 f (z) e 2 − = π
0 Zf(z) f(z)
z là giỏ trị bất kỳ của biến ngẫu nhiờn chuẩn húa Z. Đại lượng ngẫu nhiờn Z phõn phối theo quy luật normal chuẩn húa cú μ = 0 và phương sai σ2 = 1, được ký hiệu là Z ~ N(0,1).
Hỡnh 5.4 dưới đõy biểu diễn đường cong hàm mật độ xỏc suất của phõn phối normal chuẩn húa với μ = 0 và phương sai σ2 = 1.
Hỡnh 5.4. Biểu đồ phõn phối normal chuẩn húa
Như vậy phõn phối của Z tương tự như phõn phối normal nhưng luụn luụn cú μ = 0 và phương sai σ2 = 1, nờn nú mới được gọi là phõn phối normal chuẩn húa. Khỏi niệm chuẩn húa này cũn nhằm ỏm chỉ việc chuyển húa biến X bất kỳ thành một biến Z với trung bỡnh luụn bằng 0 và phương sai luụn bằng 1. Toàn bộ diện tớch nằm dưới đường cong giới hạn bởi trục hoành của phõn phối normal chuẩn húa cũng bằng 1.
Vớ dụ biến ngẫu nhiờn liờn tục X cú phõn phối normal với trung bỡnh bằng 7 và độ lệch chuẩn bằng 2, với một giỏ trị cụ thể mà biến X nhận là 15, chỳng ta tiến hành chuẩn húa nú thành biến Z như sau:
Kết quả này cho thấy biến X cú giỏ trị = 15 lệch so với trung bỡnh (15-7=8) về phớa bờn phải của phõn phối đỳng 4 lần so với độ lệch chuẩn (8/2=4). Chỳng ta thấy thực ra chỉ cú thang đo là thay đổi cũn bản chất vấn đề như nhau. Chỳng ta cú thể diễn tả vấn đề bằng đơn vị X nguyờn thủy hoặc bằng đơn vị chuẩn húa Z đều được. Chỳ ý là trong phõn phối normal chuẩn húa độ lệch chuẩn chớnh là đơn vị đo lường, chỳng ta cú thể phỏt biểu là biến số chỳng ta quan sỏt nhận giỏ trị ở vị trớ trờn hoặc dưới trung bỡnh mấy độ lệch chuẩn.
Bõy giờ chỳng ta trở lại vấn đề đó khiến chỳng ta phải tỡm hiểu về phõn phối Z, đú là cỏch tớnh P(a<X<b) nhanh nhất thụng qua một bảng tra đó được lập sẵn.
Giả sử X ~ N(μ,σ2), xỏc suất để X nhận giỏ trị trong khoảng (a,b) với a<b là:
a X b a b P(a X b) P( ) P( Z ) b a ( ) ( ) − à − à − à − à − à < < = < < = < < σ σ σ σ σ − à − à = ϕ − ϕ σ σ
Trong đú:
z 0
(z) f (z)dz ϕ =∫
được gọi là tớch phõn Laplace. Hàm φ(z) là một hàm lẻ. Vỡ vậy chỳng ta chỉ cần quan tõm cỏc giỏ trị φ(z) với z>0 là đủ. Hàm φ(z) được tớnh bằng mỏy tớnh và lập bảng sẵn gọi là bảng tớch phõn Laplace cho ở phụ lục cuối sỏch.
Vớ dụ 2: Thời gian download (download time) trang chủ website của một cụng ty cú phõn phối chuẩn với trung bỡnh μ = 7 giõy và độ lệch chuẩn σ = 2 giõy.
a) Tớnh xỏc suất mà thời gian download sẽ lớn hơn 9 giõy b) Tớnh P(7 <X< 9)
c) Tớnh P(X< 7 hoặc X> 9) d) Tớnh P(5 <X< 9)
Giải:
a) Gọi X là thời gian dowload trang chủ website của cụng ty. Theo bài ra ta cú: X~N(7,4) b)
c) d)
Vỡ φ(z) là hàm lẻ nờn φ(-z) = - φ(z).