KIỂM ĐỊNH T CHO MỘT TRUNG BÌNH

Một phần của tài liệu GIÁO TRÌNH MÔN HỌC XÁC SUẤT VÀ THỐNG KÊ Y DƯỢC (Trang 27 - 31)

Trong kiểm định Z, ta phải cần biết phương sai của dân số (σ2). Tuy nhiên điều này không phải lúc nào cũng có thể thực hiện được. Trong thực tế nghiên cứu, số liệu thường được thu thập trên một hoặc nhiều mẫu nhất định, từ đó có thể tính các giá trị như trung bình và phương sai của mẫu. Các kiểm định loại này dựa trên mẫu mà không cần biết phương sai của toàn bộ dân số

A. Phân phối t (Student’s t distribution)

Nhắc lại phân phối chuẩn Z

Với là phương sai dân số và là sai số chuẩn

Giả sử x1, x2,x3,…,xn là các biến số có phân phối chuẩn được rút ngẫu nhiên từ một dân số có trung bình là µ

thì T sẽ có một phân phối t (Student’s t distribution) với n – 1 độ tự do, degree of freedom). Phụ lục B trình bày phân phối T

( gọi là phương sai mẫu và là sai số chuẩn)

Chú ý :

Đặc điểm của phân phối t

1. Có dạng hình chuông, đối xứng qua đường thẳng đứng kẻ qua giá trị trung bình 2. Khá giống với phân phối chuẩn, tuy nhiên xác suất cao hơn ở ngoại vi (hai đầu)

3. Không giống với phân phối chuẩn, phân phối t tùy thuộc vào cỡ mẫu. Cỡ mẫu xác định độ tự do (n – 1). Mỗi một độ tự do có một phân phối t khác nhau. Khi độ tự do lớn, phân phối t khá tương đồng với phân phối chuẩn.

Ví dụ, với độ tự do = 5, tìm tα/2 = t0,025 = , Zα/2 = Z0,025 = và 1-α/2 = t0,975 = , Z1-α/2 = Z0,975 = Với độ tự do = 65, tìm tα/2 = t0,025 = , Zα/2 = Z0,025 =

Điều kiện để áp dụng kiểm định t-test

1. Mẫu phải được chọn ngẫu nhiên 2. Số liệu là biến số liên tục

3. Số liệu phải có phân phối bình thường. Theo định lý giới hạn trung tâm, cỡ mẫu trên 30 là đủ để có phân phối xấp xỉ bình thường. Hơn nữa, ngay cả khi cỡ mẫu tương đối nhỏ (trên 10), kiểm định t-test ít bị ảnh hưởng nếu phân phối không quá lệch.

B. Kiểm định giả thiết cho một trung bình (không biết )

Nếu muốn so sánh trung bình của một mẫu với một trị số tham khảo nào đó, ta có thể dùng kiểm định t-test. Các bước tiến hành tương tự như kiểm định Z.

(1) Xây dựng giả thiết không (H0)

(2) Tính giá trị thống kê của phép kiểm định và giá trị T giới hạn (tra phụ lục B) (3) Chấp nhận hay bác bỏ H0

Ví dụ. Một test để đánh giá mức độ căng thẳng có giá trị là 20,00 trên người bình thường. Test này được tiến hành trên 81 sinh viên cao đẳng 1 tuần trước kỳ thi tốt nghiệp, có kết quả trung bình là 22,50, độ lệch chuẩn là 9,00. Hỏi mức độ căng thẳng của nhóm sinh viên cao đẳng này có khác so với trị số bình thường không, với độ tin cậy 0,05 ?

Bước 1. Ký hiệu: µ = 20, , SX = 9, n = 81, α = 0,05

Bước 2. Xây dựng giả thiết không (H0)

H0 : Mẫu được rút ra ngẫu nhiên từ một dân số có trung bình không khác 20 H1 : Mẫu được rút ra ngẫu nhiên từ một dân số có trung bình khác 20

Hoặc

H0 : µ = 20 H1 : µ≠ 20

Bước 3. Vẽ hình. H0 và H1 được rút ra từ các dân số sau

Bước 4. Tính giá trị thống kê của phép kiểm định: Chọn phép kiểm định t-test

Bước 5. Chọn lựa giá trị T giới hạn (T critical). Tra bảng tìm giá trị T giới hạn. Với α =

0,05, độ tự do = 81 – 1 = 80, ta có tα/2 = t0,025 = - 1.99, và 1-α/2 = t0,975 = 1,99

Bước 6. Kết luận:

Vì T thống kê (2,5) > t1-α/2 (1,99) nên ta bác bỏ giả thiết không rằng trung bình của mẫu không khác 20. Kết luận mức độ căng thẳng của nhóm sinh viên cao đẳng khác biệt có ý nghĩa thống kê so với trị số bình thường, T= 2,5, p < 0,05)

Thực hành tại lớp. Nghiên cứu trên một mẫu gồm 10 trẻ có số cân nặng (kg) như sau: 23, 41,

33, 25, 39, 33, 29, 27, 35, và 27 Hỏi cân nặng trung bình của nhóm trẻ này có khác với trung bình của trẻ bình thường là 30 không ở ngưỡng α = 0,05

Bài làm:

µ≠ 20 µ = 20 µ≠ 20

t0.975= 1,99 t0.025= -1,99

Ví dụ. Theo ví dụ về test đánh giá mức độ lo lắng của sinh viên cao đẳng ( , SX = 9), khoảng tin cậy 95% cho một trung bình mẫu là

Ta có thể kết luận rằng 95% khả năng dân số sinh viên cao đẳng có mức độ lo âu nằm trong khoảng .

Lưu ý: Có 3 cách kiểm định giả thiết không (H0)

(1) Tính T thống kê rồi so sánh với giá trị T giới hạn, xem rơi vào vùng chấp nhận hay vùng bác bỏ H0

(2) Tính T thống kê rồi tính p-value (các phầm mềm thống kê hoặc hàm TDIST trong Excel). Nếu p-value < α thì ta bác bỏ H0

(3) Tính khoảng tin cậy 95%, nếu khoảng tin cậy này không chứa giá trị cần so sánh thì ta bác bỏ H0. Trong ví dụ trên, vì khoảng không chứa giá trị µ = 20 nên ta bác bỏ H0.

Bài tập về nhà

1. Giả sử rằng một loại thuốc an thần được thử nghiệm trên 10 người. Mỗi người tham gia thử nghiệm được đo thời gian ngủ trước và sau khi uống thuốc. Bảng sau đây cho kết quả thời gian ngủ tăng thêm tính bằng giờ. Chú ý nếu giờ ngủ thêm = 0 thì thuốc không có tác dụng. Nếu giờ ngủ thêm > 0 thuốc gây ngủ và ngược lại.

Người Giờ ngủ thêm Người Giờ ngủ thêm

1 0,7 6 3,4

2 -1,1 7 3,7

3 -0,2 8 0,8

4 -1,2 9 1,8

5 -0,1 10 2,0

Xây dựng giả thiết thống kê (H0 vả H1). Tiến hành kiểm định giả thiết ở ngưỡng 0,05 2. Số liệu sau đây là số đo độ nhớt máu chuột trong phòng thí nghiệm

3,29 3,91 4,64 3,55 3,67 4,18 3,74 3,03 4,61 3,84

Tiến hành một kiểm định để trả lời rằng độ nhớt máu mẫu chuột đó có khác với trị số trung bình dân số µ = 3,95 không ở ngưỡng thống kê 0,05. Xác định khoảng tin cậy 95% cho mẫu đó để chấp nhận hay bác bỏ giả thiết thống kê.

Bài 7

Một phần của tài liệu GIÁO TRÌNH MÔN HỌC XÁC SUẤT VÀ THỐNG KÊ Y DƯỢC (Trang 27 - 31)