hái niệm chung 2. Kiểm định giả thiết thống kê 3. Hàm phân bố 4. Quan hệ giữa các hàm phân bố 5. Ứng dụng của các hàm phân bốhái niệm chung 2. Kiểm định giả thiết thống kê 3. Hàm phân bố 4. Quan hệ giữa các hàm phân bố 5. Ứng dụng của các hàm phân bốhái niệm chung 2. Kiểm định giả thiết thống kê 3. Hàm phân bố 4. Quan hệ giữa các hàm phân bố 5. Ứng dụng của các hàm phân bốhái niệm chung 2. Kiểm định giả thiết thống kê 3. Hàm phân bố 4. Quan hệ giữa các hàm phân bố 5. Ứng dụng của các hàm phân bố
Trang 1ĐẠI HỌC QUỐC GIA TP HỒ CHÍ MINH
TRƯỜNG ĐẠI HỌC BÁCH KHOA
(Data Analysis and Design of Experiment)
Trang 2KIỂM ĐỊNH GIẢ THIẾT & CHUẨN THỐNG KÊ
trinhvandung190361
Trang 3KIỂM ĐỊNH GIẢ THIẾT & CHUẨN THỐNG KÊ
1 Khái niệm chung
Trang 4KIỂM ĐỊNH GIẢ THIẾT & CHUẨN THỐNG KÊ
1 Khái niệm chung
Khi nghiên cứu thực nghiệm ban đầu:
á
-Thường coi đối tượng là “Hộp đen”
-Tiến hành khảo sát theo sơ đồ:
“Hộp đen”
y j
Trang 5KIỂM ĐỊNH GIẢ THIẾT & CHUẨN THỐNG KÊ
Nồng độ
Nhiệt độ
Chưa chỉnh được Hiệu suất
Nhiệt độ
Áp suất
Năng suất Chi phí
Trang 6KIỂM ĐỊNH GIẢ THIẾT & CHUẨN THỐNG KÊ
Bước 1: Khảo sát ảnh hưởng của từng biến đơn lẻ;
Bước 2: Khảo sát ảnh hưởng đồng thời nhiều biến: một mục tiêu;
Trang 7KIỂM ĐỊNH GIẢ THIẾT & CHUẨN THỐNG KÊ
Số liệu đo được là một đại lượng ngẫu nhiên, nên:
Tìm các thông số đặc trưng của chúng;
Trang 8KIỂM ĐỊNH GIẢ THIẾT & CHUẨN THỐNG KÊ
y 1
y 2 y
“Hộp đen”
Nội dung chính của phương pháp:
-Phân tích khi các yếu tố thí nghiệm được phân thành từng cặp;
- Các yếu tố thí nghiệm được chọn ngẫu nhiên;
Trang 9KIỂM ĐỊNH GIẢ THIẾT & CHUẨN THỐNG KÊ
y 1
y 2 y
Trang 10KIỂM ĐỊNH GIẢ THIẾT & CHUẨN THỐNG KÊ
Trang 11KIỂM ĐỊNH GIẢ THIẾT & CHUẨN THỐNG KÊ
1 Khái niệm chung
Tính chất đầy đủ của biến ngẫu nhiên được đánh giá bằng hàm mật
Trang 12KIỂM ĐỊNH GIẢ THIẾT & CHUẨN THỐNG KÊ
2 Kiểm định giả thiết thống kê ị g g
Ta cần lựa chọn các giả thuyết H 0 nào đó là đúng hay sai
H 0 liên quan, hay xác suất của một sự kiện ngẫu nhiên
Chọn một đối giả thuyết H 1 đối lập với H 0
Việc lựa chọn H 0 tương ứng với bác bỏ H 1
Ngược lại chấp nhận H 1 tức bác bỏ H 0
Cần xây dưng một tiêu chuẩn ra quyết định:
-Xây dựng một hàm mục tiêu chuẩn chỉ nhận giá trị 0 hoặc 1
- 0 ứng với chấp nhận H 0
1 b ù b û H
- 1 bac bo H 0
Trang 13KIỂM ĐỊNH GIẢ THIẾT & CHUẨN THỐNG KÊ
2 Kiểm định giả thiết thống kê
Khi lựa chọn giả thuyết theo các sai lầm:
Sai lầm loai 1: chấp nhận H 1 (tức bác bỏ H 0 ) trong khi H 0 đúng;
Sai lam loại 1: chap nhận H 1 (tưc bac bo H 0 ) trong khi H 0 đung;
Sai lầm loại 2: bác bỏ H 1 (tức chấp nhận H 0 ) trong khi H 0 sai;
So sánh với chuẩn (mẫu)
Trang 14KIỂM ĐỊNH GIẢ THIẾT & CHUẨN THỐNG KÊ
2 Kiểm định giả thiết thống kê
Xác suất gặp phải các sai lầm đó gọi là xác suất sai lầm:
Trang 15KIỂM ĐỊNH GIẢ THIẾT & CHUẨN THỐNG KÊ
2 Kiểm định giả thiết thống kê
Để giảm khó khăn:
-Xét trong các tiêu chuẩn có XSSL I ≤ = const
- khá nhỏ gọi (mức có nghĩa): 1%, 5% hay 10% tuỳ yêu cầu
Các tiêu chuẩn này được so sánh bởi LLTC của chúng, cĩ giá trị càng lớn càng tốt.
Trang 16KIỂM ĐỊNH GIẢ THIẾT & CHUẨN THỐNG KÊ
2 Kiểm định giả thiết thống kê
Các bước thực hiện:
Giả sử có mẫu g(x 1 , x 2 , …., x n ) lấy từ tập hợp gốc {X, F(x, )}
g( 1 , 2 , , n ) y äp ïp g { , ( , )}
1 Chọn thống kê g(x 1 , x 2 , …., x n ) có liên quan đến H 0 ;
2 Dựa vào các định lý thống kê để xem thống kê đó tuân theo luật
phân bố nào;
3 Chọn mức có nghĩa ;
4 Dựa vào mẫu tính:
Nếu g thì công nhận H 0 ; Nếu ggˆ gˆ thì bác bỏ H 0 ;
Trang 17KIỂM ĐỊNH GIẢ THIẾT & CHUẨN THỐNG KÊ
2 Kiểm định giả thiết thống kê
Kiểm định giả thiết thống kê gồm:
Trang 18KIỂM ĐỊNH GIẢ THIẾT & CHUẨN THỐNG KÊ
2 Kiểm định giả thiết thống kê
Kiểm định phương trình hồi quy:
1 Kiểm định các hệ số của phương trình hồi qui và khoảng xác
định sai lệch của chúng
2 Kiểm định sự bằng nhau của phương sai
3 Kiểm định sự tương hợp của phương trình hồi qui
4 Tìm khoảng sai lệch y i
4 Tìm khoang sai lệch y i
Trang 19KIỂM ĐỊNH GIẢ THIẾT & CHUẨN THỐNG KÊ
Trang 20KIỂM ĐỊNH GIẢ THIẾT & CHUẨN THỐNG KÊ
3.1 Hàm Gauss (phân bố chuẩn) (p )
Trang 21KIỂM ĐỊNH GIẢ THIẾT & CHUẨN THỐNG KÊ
3.1 Hàm Gauss (phân bố chuẩn) (p )
Trang 22KIỂM ĐỊNH GIẢ THIẾT & CHUẨN THỐNG KÊ
3.1 Hàm Gauss (phân bố chuẩn) (p )
Phân bố chuẩn:
-Thường được sử dụng trong phân tích dữ liệu
Ch ột ô hì h tốt đối ới á hiệ t th
-Cho một mô hình tốt đối với các hiện tượng thực:
-có xu hướng mạnh mẽ để dữ liệu tập trung xung quanh trung tâm; -Độ lệch dương và âm từ trung tâm đều có thể xảy ra;
2
2
2
) (
1 )
Trang 23KIỂM ĐỊNH GIẢ THIẾT & CHUẨN THỐNG KÊ
1 )
M x
u
Trang 24KIỂM ĐỊNH GIẢ THIẾT & CHUẨN THỐNG KÊ
2
12
1exp
(
u
e u
u F
2
) (
Trang 25KIỂM ĐỊNH GIẢ THIẾT & CHUẨN THỐNG KÊ
3.2 Hàm Gauss trung tâm
.
g
Trang 26KIỂM ĐỊNH GIẢ THIẾT & CHUẨN THỐNG KÊ
3.2 Hàm phân bố logarit chuẩn p g
Biến ngẫu nhiên có logarit tự nhiên của nó tuân theo luật phân phối chuẩn gọi là phân bố logarit chuẩn, hoặc phân bố loga
ố
Phân phối loga được sử dụng:
-Khi mô hình hóa các biến số: thu nhập, tuổi của vợ chồng mới cưới -Sự sai lệch cho phép từ tiêu chuẩn các chất độc hại trong thực phẩm Sự sai lệch cho phép từ tiêu chuẩn các chất độc hại trong thực phẩm
Vì vậy, nếu giá trị của x có phân phối chuẩn thì số lượng y = e x có sự phân bố loga
1 )
a x
e x
Trang 27KIỂM ĐỊNH GIẢ THIẾT & CHUẨN THỐNG KÊ
3.2 Hàm phân bố logarit chuẩn p g
Biến ngẫu nhiên có logarit tự nhiên của nó tuân theo luật phân phối chuẩn gọi là phân bố logarit chuẩn, hoặc phân bố loga
ố
Phân phối loga được sử dụng:
-Khi mô hình hóa các biến số: thu nhập, tuổi của vợ chồng mới cưới -Sự sai lệch cho phép từ tiêu chuẩn các chất độc hại trong thực phẩm Sự sai lệch cho phép từ tiêu chuẩn các chất độc hại trong thực phẩm
Vì vậy, nếu giá trị của x có phân phối chuẩn thì số lượng y = e x có sự phân bố loga
0.1
0.05
Trang 28KIỂM ĐỊNH GIẢ THIẾT & CHUẨN THỐNG KÊ
Khi a > 1 phân bố Gamma có: M 0 a 1
Khi a 1 phân bố Gamma có: M
b
0
Trang 29KIỂM ĐỊNH GIẢ THIẾT & CHUẨN THỐNG KÊ
3.3 Hàm Gamma
1 1
!
1 lim
Z
x b
Trang 30KIỂM ĐỊNH GIẢ THIẾT & CHUẨN THỐNG KÊ
1 2
1 1
f
f
t f
f f
f
f
f f
Trang 31KIỂM ĐỊNH GIẢ THIẾT & CHUẨN THỐNG KÊ
2
2 2
Trang 32KIỂM ĐỊNH GIẢ THIẾT & CHUẨN THỐNG KÊ
3.5 Hàm phân bố p (2 (Khi bình phương) p g)
Biến thiên trong khoảng sau: 0 2 <
Hàm 2 khác hàm (t) ở chỗ biến 2 chỉ thay đổi trong khoảng [0, )
f
f f
Trang 33KIỂM ĐỊNH GIẢ THIẾT & CHUẨN THỐNG KÊ
1 2
II I I
I f
f I
II I
F
f F
f
f f
II II
II I
F f
F f
f f
II
I S S
F
Trang 34KIỂM ĐỊNH GIẢ THIẾT & CHUẨN THỐNG KÊ
1 2
II I I
I f
f I
II I
F
f F
f f
f
f f
II II
Trang 35KIỂM ĐỊNH GIẢ THIẾT & CHUẨN THỐNG KÊ
Trang 36KIỂM ĐỊNH GIẢ THIẾT & CHUẨN THỐNG KÊ
0.09 0.12 0.15
Gọi phân bố các sự kiện hiếm hoi
Ví d ề các biến được phân phối
10 14 18 22 26 30 0
x
Ví dụ về các biến được phân phối
theo luật của Poisson có thể là:
-số vụ tai nạn
-số lượng khuyết tật trong quá
Trang 37KIỂM ĐỊNH GIẢ THIẾT & CHUẨN THỐNG KÊ
3.8 Tính chất của các hàm phân bố p
Các hàm phân bố trên đều có tính chất chung của hàm phân bố:
•Tích phân trong khoảng biến thiên của biến đều bằng 1;
Có í h đối ứ
•Có tính đối xứng;
Các hàm phân bố có quan hệ với nhau:
•Các biến ngẫu nhiên F, g , , , 2 ,t, u có mối quan hệ với nhau; q ệ ;
•Các hàm phân bố Student, 2 và F đều là các hàm phân bố mẫu:
hàm F có hai sô bậc tự do f I và f II nên khi f I = 1 và f II = f thì F = t 2
f I = f và f II thì
f F
2
Trang 38KIỂM ĐỊNH GIẢ THIẾT & CHUẨN THỐNG KÊ
0.18
dlogis x 10 ( 2 ) dpois x 20 ( )
0.12 dgamma x 5 ( )
dnorm x 0 ( 1.5 )
Trang 39KIỂM ĐỊNH GIẢ THIẾT & CHUẨN THỐNG KÊ
3.9 Mối quan hệ giữa các hàm phân bố
Quan hệ giữa các biến và hàm phân phối như sau:
2
Phaân boá Student
Trang 40KIỂM ĐỊNH GIẢ THIẾT & CHUẨN THỐNG KÊ
4 Kiểm định giả thiết thống kê
Kiểm định giả thiết thống kê có thể dùng các chuẩn:
Trang 41KIỂM ĐỊNH GIẢ THIẾT & CHUẨN THỐNG KÊ
Trang 42KIỂM ĐỊNH GIẢ THIẾT & CHUẨN THỐNG KÊ
mẫu: σ 1 2 và σ 2 2 rút ra từ hai tập hợp mẫu X 1 và X 2
Ký hiệu mẫu có phương sai lớn là σ 1 2 và nhỏ là σ 2 2 thì tính:
Ký hiệu mẫu có phương sai lớn là σ 1 và nhỏ là σ 2 thì tính:
2 1 2 2
Trang 43KIỂM ĐỊNH GIẢ THIẾT & CHUẨN THỐNG KÊ
Trang 44KIỂM ĐỊNH GIẢ THIẾT & CHUẨN THỐNG KÊ
Trang 45KIỂM ĐỊNH GIẢ THIẾT & CHUẨN THỐNG KÊ
2 2
n n x
x t
Trang 46KIỂM ĐỊNH GIẢ THIẾT & CHUẨN THỐNG KÊ
Trang 47KIỂM ĐỊNH GIẢ THIẾT & CHUẨN THỐNG KÊ
Trang 48KIỂM ĐỊNH GIẢ THIẾT & CHUẨN THỐNG KÊ
Thì R = x 1 – x n gọi la độ banh (rộng) cua day so.
Khi đó nếu nghi ngờ x* i nào đó thì tính:
Trang 49KIỂM ĐỊNH GIẢ THIẾT & CHUẨN THỐNG KÊ
4.3 Kiểm định giả thiết thống kê bằng chuẩn Poisson
Khi n = 3, trong đó có hai giá trị trùng nhau thì không thể áp dụng chuẩn Q vì luôn có: Q tn = 1 > Q TR.
Trang 50KIỂM ĐỊNH GIẢ THIẾT & CHUẨN THỐNG KÊ
4.3 Kiểm định giả thiết thống kê bằng chuẩn Poisson
Trong đó Q tr tra trong bảng sau:
Trang 51KIỂM ĐỊNH GIẢ THIẾT & CHUẨN THỐNG KÊ
4.3 Kiểm định giả thiết thống kê bằng chuẩn Poisson ị g g g
Khi n = 3, trong đó có hai giá trị trùng nhau thì không thể áp dụng chuẩn Q vì luôn có: Q tn = 1 > Q TR
Trang 52KIỂM ĐỊNH GIẢ THIẾT & CHUẨN THỐNG KÊ
4.3 Kiểm định giả thiết thống kê bằng chuẩn Poisson
Khi đo lưu lượng Nito trong thiết bị pilot (x) thu được kết quả sau
Hãy kiểm tra những giá trị đo bất thường?
Trang 53KIỂM ĐỊNH GIẢ THIẾT & CHUẨN THỐNG KÊ
Khi 3 n 8 dùng chuẩn 3 dùng chuẩn Q;
Khi 8 n dùng chuẩn ;
Nếu nghi ngờ x* i thì tính: *
n
n
Trang 54KIỂM ĐỊNH GIẢ THIẾT & CHUẨN THỐNG KÊ
t < tr không nên bỏ x* i ;
t > tr có thể bỏ x* i ;
Trang 55KIỂM ĐỊNH GIẢ THIẾT & CHUẨN THỐNG KÊ
Trang 56KIỂM ĐỊNH GIẢ THIẾT & CHUẨN THỐNG KÊ
4.4 Kiểm định giả thiết thống kê bằng chuẩn “ ”
Biến Q không tận dụng hết các số liệu của tập hợp mẫu
Do mỗi lần kiểm định chỉ dùng 3 giá trị x 1 , x 2 và x n
hoặc x 1 , x n-1 , x n Nên khi n càng lớn Q trở nên càng không phù hợp;
Biến tận dụng hết tất cả các số liệu nên có thể dùng cho cả n lớn
Biến tận dụng hết tất cả các số liệu nên có thể dùng cho cả n lớn
và nhỏ;
Trang 57KIỂM ĐỊNH GIẢ THIẾT & CHUẨN THỐNG KÊ
4.5 Kiểm định giả thiết thống kê bằng chuẩn χ2 ị g g g χ
Dùng để kiểm định độ chính xác thực tế so với độ chính xác qui định của :
- dụng cụ đo
- phương pháp đo, phân tích
tay nghề ;
- tay nghề ;
Sự kiểm định tuân theo luật phân bố chuẩn;
Kiểm định tính đồng nhất của một dãy phương sai mẫu;
Biế độ hí h á
Biết độ chính xác
Trang 58KIỂM ĐỊNH GIẢ THIẾT & CHUẨN THỐNG KÊ
4.5 Kiểm định giả thiết thống kê bằng chuẩn χ2 ị g g g χ
Cách tính χ2 cho mỗi mục đích kể trên là khác nhau:
-Để kiểm định độ chính xác cách tính χ2 theo biểu thức thông
Trang 59KIỂM ĐỊNH GIẢ THIẾT & CHUẨN THỐNG KÊ
4.5.1 Kiểm tra độ chính xác bằng chuẩn χ2 ộ g χ
Độ chính xác được cung cấp bởi:
-nhà sản xuất dụng cụ đo
2
2 2
2
2
5 ,
0 P và P
Trang 60KIỂM ĐỊNH GIẢ THIẾT & CHUẨN THỐNG KÊ
4.5.1 Kiểm tra độ chính xác bằng chuẩn χ2 ộ g χ
2
2 5 , 0
2 2
2 5 ,
0 P TR P
Nếu thì độ chính xác đạt yêu cầu
2 2
2 2
2 2
2 5 ,
2
P TR
thì độ chính xác vượt trội độ chính xác yêu cầu;
Trang 61KIỂM ĐỊNH GIẢ THIẾT & CHUẨN THỐNG KÊ
Trang 62KIỂM ĐỊNH GIẢ THIẾT & CHUẨN THỐNG KÊ
4.5.2 Kiểm tra tuân theo luật phân bố chuẩn bằng χ2 ậ p g χ
Pearrson đề nghị cách kiểm định theo chuẩn χ2
khi tập hợp mẫu trong khoảng 50 ÷ 150
1
Tra χ 2
, f ứng với f = k – 3
Trang 63KIỂM ĐỊNH GIẢ THIẾT & CHUẨN THỐNG KÊ
Trang 64KIỂM ĐỊNH GIẢ THIẾT & CHUẨN THỐNG KÊ
4.5.2 Kiểm tra sự đồng nhất của dãy phương sai χ2 ự g y p g χ
Khi có k phương sai mẫu S i 2 đánh số i = 1, 2, 3, ., k
f
S f S
1
1 2
i 1
k n
f f
k
i
i k
Trang 65KIỂM ĐỊNH GIẢ THIẾT & CHUẨN THỐNG KÊ
S f
k
i
i i
ts ts
2
lglg
303,
3
11
Trang 66KIỂM ĐỊNH GIẢ THIẾT & CHUẨN THỐNG KÊ
4.5.2 Kiểm tra tuân theo luật phân bố chuẩn bằng χ2
Khi đo pH của mẫu nước từ 3 phòng thí nghiệm thu được kết quả sau: 5 8; 5 2; 5 4; 5 3; 5 5
5,8; 5,2; 5,4; 5,3; 5,5 5,5; 5,1; 5,0; 5,3; 5,0 5,4; 5,1; 5,0; 5,7; 5,0 , ; , ; , ; , ; ,
Ước lượng các sai số đo ngẫu nhiên và với xác suất là 0,95 sự hiện
diện của sai số tổng thể trong các kết quả đo đơn lẻ nhất định.
Có thể xem xét các lỗi ngẫu nhiên giống nhau trong các phép đo trong ba phòng thí nghiệm? g p g g ệ
Trang 67KIỂM ĐỊNH GIẢ THIẾT & CHUẨN THỐNG KÊ
4.5.2 Kiểm tra tuân theo luật phân bố chuẩn bằng χ2
Phân tích hàm lượng formandehyt (mg/m 3 ) của không khí một xưởng của phòng thí nghiệm thu được: