7 CẤU TRÚC LUẬN VĂN
1.3.4 Kiểm định giả thiết
a. Bài toán kiểm định giả thiết
Giả thiết thống kê: giả sử đại lượng ngẫu nhiên X có phân phốiF(x). Giả thiết về phân phối F(x) được gọi là giả thiết thống kê và kí hiệu là
thiết, kí hiệu là H1. Khi phân phối F(x, θ) phụ thuộc vào tham số θ thì những giả thiết về phân phối F(x, θ) được chuyển sang giả thiết về tham số θ.
Bài toán kiểm định giả thiết thống kê là bài toán chọn một trong hai quyết định là bác bỏ giả thiết H0 hoặc chấp nhận giả thiết H0.
b. Tiêu chuẩn kiểm định giả thiết
Để có được quyết định bác bỏ hoặc chấp nhận giả thiết H0 ta phải dựa vào một tiêu chuẩn, gọi là tiêu chuẩn kiểm định giả thiết. Tiêu chuẩn kiểm định giả thiết là một đại lượng ngẫu nhiên Z phụ thuộc vào các quan sát X1, X2, . . . , Xn và không phụ thuộc vào tham số θ, nghĩa là
Z = Z(X1, X2, . . . , Xn) xác định trên không gian mẫu Rn. Vì Z(X) xác định trên không gian mẫu Rn nên Rn được chia thành hai bộ phận. ta gọi W là một bộ phận của Rn, nếu mẫu (X1, X2, . . . , Xn) ∈ W thì ta bác bỏ giả thiết H0. Khi đó, W được gọi là miền tiêu chuẩn. Đặt X = (X1, X2, . . . , Xn). Tiêu chuẩn kiểm định giả thiết thể hiện ở một trong ba dạng sau:
1) Tiêu chuẩn một phía phải: [X ∈ W] ⇔ Z(X) > Cu : bác bỏ giả thiết H0.
2) Tiêu chuẩn một phía trái: [X ∈ W] ⇔ Z(X) < Cv : bác bỏ giả thiết H0.
3) Tiêu chuẩn hai phía: [X ∈ W] ⇔ Z(X) > Cu hoặc Z(X) < Cv :
bác bỏ giả thiết H0.
Cu, Cv được gọi là điểm tiêu chuẩn.
c. Sai lầm thống kê Khi xác định miền tiêu chuẩn W hay tiêu chuẩn kiểm định Z ta căn cứ vào hai loại sai lầm sau:
• Sai lầm loại I: Nếu giả thiết H0 là giả thiết đúng mà bác bỏ H0 thì ta mắc sai lầm. Khi đó xác suất P[W/H0đúng] được gọi là xác suất mắc sai lầm loại I.
• Sai lầm loại II: Nếu giả thiết H0 là giả thiết sai mà chấp nhận giả thiết thì ta mắc sai lầm. Khi đó xác suất P[W/H0sai]được gọi là xác suất
mắc sai lầm loại II.
Như vậy để tìm tiêu chuẩn kiểm định ta phải đồng thời hạn chế tới mức tối thiểu khả năng mắc hai loại sai lầm trên, nghĩa là ta phải đồng thời cực tiểu hóa các xác suất mắc sai lầm loại I và xác suất mắc sai lầm loại II. Thực tế việc này rất khó nên người ta cho phép được mắc sai lầm loại I ở mức xác suất α nào đó (tùy theo tầm quan trọng của sai lầm loại I). Sau đó cực tiểu xác suất sai lầm loại II.
d. Bài toán kiểm định giả thiết về giá trị trung bình
Tiêu chuẩn hai phía.
Giả sử(X1, X2, . . . , Xn)là mẫu ngẫu nhiên có phân phối chuẩnN(µ, σ2). Kiểm định giả thiết H0 : µ = µ0 với đối thiết H1 : µ 6= µ0 và với mức ý nghĩa α.
Tiêu chuẩn để kiểm định giả thiết trên được gọi là tiêu chuẩn kiểm định hai phía và được phát biểu dưới dạng sau:
• Trường hợp σ đã biết.
Giả thiết H0 bị bác bỏ nếu:
|Z| = |x¯−µ0|√n
σ > xα
Nếu |Z| < xα thì chấp nhận giả thiết H0, trong đó xα tra ở bảng giá trị
của hàm phân phối chuẩn N(0,1) sao cho φ(xα) = 1− α2.
• Trường hợp σ chưa biết.
Giả thiết H0 bị bác bỏ nếu:
|Z| = |x¯−µ0|√n
Sn∗(x) > tα.
Nếu|Z| < tαthì chấp nhận giả thiếtH0, trong đóSn∗2(x) = n−11
n
P
i=1
(xi −x¯)2
còn tα tra ở bảng như sau:
Nếu n > 30thì tα tra ở bảng giá trị của hàm phân phối chuẩn N(0,1)
sao cho φ(tα) = 1− α2.
Nếu n6 30 thì tra ở bảng phân phối Student với n−1 bậc tự do và mức ý nghĩa α (bảng giá trị tiêu chuẩn hai phía).
Tiêu chuẩn phía phải.
Nếu x > µ¯ 0 thì ta có bài toán kiểm định giả thiết: H0 : µ = µ0 với
H1 : µ > µ0 ở mức α. Tiêu chuẩn để kiểm định giả thiết này được phát
biểu dưới dạng:
• Trường hợp σ đã biết.
Giả thiết H0 bị bác bỏ nếu:
Z = (¯x−µ0)√
n
σ > xα
Nếu Z < xα thì chấp nhận giả thiết H0, trong đó xα tra ở bảng giá trị của
hàm phân phối chuẩn N(0,1) sao cho φ(xα) = 1−α.
• Trường hợp σ chưa biết.
Giả thiết H0 bị bác bỏ nếu:
Z = (¯x−µ0)√
n S∗
n(x) > tα
NếuZ < tαthì chấp nhận giả thiếtH0, trong đóSn∗2(X) = n−11
n
P
i=1
(xi −x¯)2
còn tα tra ở bảng như sau:
Nếu n > 30thì tα tra ở bảng giá trị của hàm phân phối chuẩn N(0,1)
sao cho φ(tα) = 1−α.
Nếu n < 30 thì tra ở bảng phân phối Student với n−1 bậc tự do và
mức ý nghĩa α (bảng giá trị tiêu chuẩn một phía).
Tiêu chuẩn phía trái.
Nếu X < µ¯ 0 thì ta có bài toán kiểm định giả thiết: H0 : µ = µ0 với
K : µ < µ0 ở mức α. Tiêu chuẩn để kiểm định giả thiết này được phát
biểu dưới dạng:
• Trường hợp σ đã biết.
Giả thiết H0 bị bác bỏ nếu:
Z = (µ0 −x¯)√
n
σ > xα
Nếu Z < xα thì chấp nhận giả thiết H0, trong đó xα tra ở bảng giá trị của
• Trường hợp σ chưa biết.
Giả thiết H0 bị bác bỏ nếu:
Z = (µ0 −x¯)√
n S∗
n(x) > tα
NếuZ < tαthì chấp nhận giả thiếtH0, trong đóSn∗2(X) = n−11
n
P
i=1
(xi −x¯)2
còn tα tra ở bảng như sau:
Nếu n > 30thì tα tra ở bảng giá trị của hàm phân phối chuẩn N(0,1)
sao cho φ(tα) = 1−α.
Nếu n < 30 thì tra ở bảng phân phối Student với n−1 bậc tự do và
CHƯƠNG 2
MÔ HÌNH HỒI QUY TUYẾN TÍNH CỔ ĐIỂN
2.1. PHÂN TÍCH HỒI QUY
Phân tích hồi quy là nghiên cứu mối liên hệ phụ thuộc của một biến (gọi là biến phụ thuộc hay biến được giải thích) với một hay nhiều biến khác (được gọi là (các) biến độc lập hay giải thích) nhằm ước lượng hoặc tiên đoán giá trị trung bình của biến phụ thuộc với các giá trị đã biết của biến độc lập. Nó cũng được vận dụng để đánh giá hiệu quả tác động của biến độc lập với biến phụ thuộc. Cụ thể khi biết một số giá trị thực nghiệm của các đại lượng:X1, Y1, X2, Y2, . . . , Xn, Yn, cần biểu thị đại lượng
Y thông qua X (hoặc ngược lại), nghĩa là ta phải đi tìm hàm y = f(x) +ε
(hoặc x = ϕ(y) +ε1).