Nguyễn Thống 8 THỐNG KÊ ỨNG DỤNG TRONG QUẢN LÝ & KỸ THUẬT Chương 3: Lý thuyết kiểm định thống kê THỐNG KÊ ỨNG DỤNG TRONG QUẢN LÝ & KỸ THUẬT Chương 3: Lý thuyết kiểm định thống kê THỐ
Trang 1Chương 3: Lý thuyết kiểm định thống kê
Khoa KTXD - Bộ mơn KTTNN
Giảng viên: PGS TS NGUYỄN THỐNG
E-mail : nguyenthong@hcmut.edu.vn or nthong56@yahoo.fr
Chương 1bis Xác suất & phân phối thống kê
Chương 2 Khoảng tin cậy
Chương 3 Lý thuyết kiểm định thống kê
Chương 4 Kiểm định Cronbach’s Alpha
Chương 5 Phân tích phương sai (ANOVA)
Chương 6 Hồi quy tuyến tính & giả tuyến tính
Chương 7 Xử lý số liệu thực nghiệm
Chương 8 Giới thiệu phần mềm SPSS.
QUẢN LÝ & KỸ THUẬT
THỐNG KÊ ỨNG DỤNG TRONG QUẢN LÝ & KỸ THUẬT
Chương 3: Lý thuyết kiểm định thống kê
KIỂM ĐỊNH THỐNG KÊ
kết luận liên quan đến các biến
Ví dụ: So sánh 2 giá trị của biến
thống kê Xét 2 biến thống kê dạng
liên tục Xác suất để 2 biến này BẰNG
với Hàm mật độ xác suất
THỐNG KÊ ỨNG DỤNG TRONG QUẢN LÝ & KỸ THUẬT
Chương 3: Lý thuyết kiểm định thống kê
KIỂM ĐỊNH THỐNG KÊ
một biến quan sát có bản chất
là biến xác suất so với một quy
luật xác suất DỰ KIẾN
so sánh giữa các biến thống kê
Các bước kiểm định :
• Bước 1 : Thành lập giả thiết H0 và phản giả thiết H1
• Bước 2 : Đề xuất ngưỡng chấp nhận của kiểm định
• Bước 3 : Chọn lựa tham số thống kê thích hợp cho
Trang 2PGS TS Nguyễn Thống 7 PGS TS Nguyễn Thống 8
THỐNG KÊ ỨNG DỤNG TRONG QUẢN LÝ & KỸ THUẬT
Chương 3: Lý thuyết kiểm định thống kê
THỐNG KÊ ỨNG DỤNG TRONG QUẢN LÝ & KỸ THUẬT Chương 3: Lý thuyết kiểm định thống kê
THỐNG KÊ ỨNG DỤNG TRONG QUẢN LÝ & KỸ THUẬT
Chương 3: Lý thuyết kiểm định thống kê
THỐNG KÊ ỨNG DỤNG TRONG QUẢN LÝ & KỸ THUẬT Chương 3: Lý thuyết kiểm định thống kê
Trang 3Chương 3: Lý thuyết kiểm định thống kê
Chương 3: Lý thuyết kiểm định thống kê
KIỂM ĐỊNH GIÁ TRỊ TRUNG BÌNH THỐNG KÊ
Để kiểm định người ta dùng hoặc:
Phân phối chuẩn
Dùng phân phối Student
THỐNG KÊ ỨNG DỤNG TRONG QUẢN LÝ & KỸ THUẬT
Chương 3: Lý thuyết kiểm định thống kê
Hoặc n < 30, tập hợp mẹ theo
phân phối chuẩn và biết σ
THỐNG KÊ ỨNG DỤNG TRONG QUẢN LÝ & KỸ THUẬT Chương 3: Lý thuyết kiểm định thống kê
Ví dụ Kết quả chịu lực trung bình của vật liệu
trị trung bình theo phân phối chuẩn
Để kiểm định giá trị trung bình, người ta lấy ngẫu nhiên n=60 mẫu và kết quả tính cho thấy giá trị chịu lực trung bình là 14000N/cm2, = 4000N/cm2
Hãy kiểm định sự sai biệt với mức độ rủi ro
=5% (độ tin cậy 95%)
THỐNG KÊ ỨNG DỤNG TRONG QUẢN LÝ & KỸ THUẬT
Chương 3: Lý thuyết kiểm định thống kê
H0: : giá trị chịu lực trung bình là bằng
t
t0-t0
Trang 4 t0 t t0 Pr
95
t t0 Pr
Ngoài ra từ số liệu mẫu ta thấy:
Giả thiết H0 được chấp nhận
Kết luận: Với mức độ rủi ro là 5% (độ tin cậy 95%) ta cĩ thể kết luận giá trị chịu
n
* 96 , 1 96 , 1
x 1000 a 1012 14 ,
THỐNG KÊ ỨNG DỤNG TRONG QUẢN LÝ & KỸ THUẬT
Chương 3: Lý thuyết kiểm định thống kê
bình của đất trong thiết kế được công bố là
16kN/m3
Để kiểm định số liệu, người ta lấy ngẫu nhiên
n=36 mẫu và kết quả tính cho thấy giá trị
trung bình và độ lệch chuẩn là 14.8kN/m3,
s= = 2kN/m3
Hãy kiểm định kết quả công bố với độ rũi ro là
=5% (độ tin cậy 95%)
THỐNG KÊ ỨNG DỤNG TRONG QUẢN LÝ & KỸ THUẬT Chương 3: Lý thuyết kiểm định thống kê
• Thực hiện trong SPSS: Menu → Analyze → Compare means → One-way T Test
THỐNG KÊ ỨNG DỤNG TRONG QUẢN LÝ & KỸ THUẬT
Chương 3: Lý thuyết kiểm định thống kê
KIỂM ĐỊNH GIÁ TRỊ TB VỚI SPSS
Kiểm định so sánh giá
trị TB từ mẫu so với giá trị định trước
THỐNG KÊ ỨNG DỤNG TRONG QUẢN LÝ & KỸ THUẬT Chương 3: Lý thuyết kiểm định thống kê
Trang 5Chương 3: Lý thuyết kiểm định thống kê
THỐNG KÊ ỨNG DỤNG TRONG QUẢN LÝ & KỸ THUẬT
Chương 3: Lý thuyết kiểm định thống kê
27
KIỂM ĐỊNH GIÁ TRỊ
TRUNG BÌNH VỚI PHÂN PHỐI
STUDENT
THỐNG KÊ ỨNG DỤNG TRONG QUẢN LÝ & KỸ THUẬT Chương 3: Lý thuyết kiểm định thống kê
Phân phối Student được áp dụng
thay thế phân phối chuẩn trong kiểm định giá trị trung bình khi:
Mẫu cĩ kích thước bé (n < 30);
Phân phối mẹ là phân phối chuẩn nhưng độ lệch chuẩn
khơng biết
THỐNG KÊ ỨNG DỤNG TRONG QUẢN LÝ & KỸ THUẬT
Chương 3: Lý thuyết kiểm định thống kê
Ví dụ Kết quả chịu lực trung bình của vật
liệu Z được công bố là 15000N/cm2
Để kiểm định giá trị trung bình công bố nêu
trên, người ta lấy mẫu ngẫu nhiên n=16
mẫu và kết quả tính cho thấy giá trị chịu
lực trung bình và độ lệch chuẩn của mẫu
là 14000N/cm2 và =1500N/cm2 .
Hãy kiểm định kết quả công bố với độ rũi ro
là =5% (độ tin cậy 95%)
THỐNG KÊ ỨNG DỤNG TRONG QUẢN LÝ & KỸ THUẬT Chương 3: Lý thuyết kiểm định thống kê
Ví dụ Cơ quan thống kê thành phố A cho biết thu nhập trung bình của dân thành phố là 15000$/năm
Để kiểm định kết quả này, người ta lấy một mẫu ngẫu nhiên n =16 gia đình và kết quả tính cho giá trị trung bình là 13500$
và độ lệch chuẩn của mẫu là 4000$
Hãy kiểm định kết quả công bố với độ rũi ro là
=5% (độ tin cậy 95%)
Trang 6Ngoài ra từ số liệu mẫu ta thấy:
Giả thiết H0 được chấp nhận
Kết luận: Với một độ tin cậy 95% (hay với mức độ rủi ro là 5%) ta cĩ thể nĩi là thu nhập bình quân của dân thành phố A là 15000$
Ví dụ: Tương tự bài trên với n=26 và giá trị độ lệch chuẩn tính từ mẫu là 3000$
Đáp số: Kết luận: H1 chấp nhận thu nhập trung bình khác 15000$
x 1500 a 2131
PGS TS Nguyễn Thống
THỐNG KÊ ỨNG DỤNG TRONG QUẢN LÝ & KỸ THUẬT
Chương 3: Lý thuyết kiểm định thống kê
33
KIỂM ĐỊNH GIẢ THIẾT
VỀ SỰ SAI BIỆT CỦA
GIÁ TRỊ TRUNG BÌNH VÀ 0
VỚI PHÂN PHỐI STUDENT
THỐNG KÊ ỨNG DỤNG TRONG QUẢN LÝ & KỸ THUẬT Chương 3: Lý thuyết kiểm định thống kê
Ví dụ Nghiên cứu một biến thống kê từ một mẫu ngẫu nhiên gồm n=16 phần tử, người ta xác định được giá trị trung bình X là 1,5 và độ lệch chuẩn từ mẫu là 2
Hãy kiểm định sự sai biệt của giá trị trung bình nói trên và giá trị 0 với độ rũi ro là 5% (độ tin cậy 95%)
THỐNG KÊ ỨNG DỤNG TRONG QUẢN LÝ & KỸ THUẬT
Chương 3: Lý thuyết kiểm định thống kê
Trang 7Chương 3: Lý thuyết kiểm định thống kê
Kết luận : Với độ tin cậy 95%, giá trị X là khác 0
theo quan điểm thống kê
1H 065 1 5 , 1
Gọi là T test !
X
/
THỐNG KÊ ỨNG DỤNG TRONG QUẢN LÝ & KỸ THUẬT
Chương 3: Lý thuyết kiểm định thống kê
Bài tập 1 : Nghiên cứu biến thống kê từ
mẫu n=9 cho thấy giá trị trung bình X
là 3,5 và độ lệch chuẩn của mẫu là 4
Kiểm định giả thiết sự sai biệt giữa X
và giá trị 0 với độ tin cậy 95% (H 1 )
(Kiểm định xem gía trị X là KHÁC 0 hay
BẰNG 0 theo quan điểm thống kê)
THỐNG KÊ ỨNG DỤNG TRONG QUẢN LÝ & KỸ THUẬT Chương 3: Lý thuyết kiểm định thống kê
THỐNG KÊ ỨNG DỤNG TRONG QUẢN LÝ & KỸ THUẬT
Chương 3: Lý thuyết kiểm định thống kê
CHÚ Ý Giá trị TB của 1 biến thống kê sẽ
khác 0 hay bằng 0 phụ thuộc
vào:
Bản thân giá trị TB tính ra
Độ lệch chuẩn của biến thống
kê nghiên cứu
THỐNG KÊ ỨNG DỤNG TRONG QUẢN LÝ & KỸ THUẬT Chương 3: Lý thuyết kiểm định thống kê
Ví dụ : Khảo sát một mẫu thống kê cĩ kích thước n=10, cho thấy giá trị trung bình là
xtb=10 và độ lệch chuẩn là s=6 Với rũi ro 5%, so sánh giá trị trung bình nêu trên với 0
Trang 8THỐNG KÊ ỨNG DỤNG TRONG QUẢN LÝ & KỸ THUẬT
Chương 3: Lý thuyết kiểm định thống kê
Kết luận: Với độ tin cậy là 95%, ta cĩ thể
kết luận là giá trị là khác 0
Ví dụ: Tương tự bài trên với n=6 và s=15
luận là giá trị là bằng 0
THỐNG KÊ ỨNG DỤNG TRONG QUẢN LÝ & KỸ THUẬT Chương 3: Lý thuyết kiểm định thống kê
trung bình của một biến thống kê khảo sát tính được sau đây với 0:
THỐNG KÊ ỨNG DỤNG TRONG QUẢN LÝ & KỸ THUẬT
Chương 3: Lý thuyết kiểm định thống kê
47
KIỂM ĐỊNH GIẢ THUYẾT
VỀ SỰ SAI BIỆT CỦA 2 GIÁ TRỊ TRUNG BÌNH
VỚI PHÂN PHỐI STUDENT
THỐNG KÊ ỨNG DỤNG TRONG QUẢN LÝ & KỸ THUẬT Chương 3: Lý thuyết kiểm định thống kê
ĐẶT VẤN ĐỀ
Trong thực hành, khi nghiên cứu giá trị trung bình của một biến thống kê ta cần xem xét sự sai biệt của 2 giá trị này có nghĩa (khác 0) hay
không
Trang 9Chương 3: Lý thuyết kiểm định thống kê
KIỂM ĐỊNH SỰ BẰNG NHAU CỦA TRUNG BÌNH 2
TỔNG THỂ
• Dữ liệu là 2 biến lượng được thu đồng thời có cỡ mẫu
bằng nhau VD: 2 biến chi tiêu trong tháng trước và
dự kiến chi tiêu tháng đến
• Bài toán: Kiểm định về sự bằng nhau của 2 trung
bình VD: Mức chi tiêukhông đổi, tức chi tiêu trung
bình của tháng trước bằng với mức dự kiến chitiêu
tháng tiếp theo
• Thực hiện trong SPSS: Menu → Analyze → Compare
means → Paired-Samples T Test
Chương 3: Lý thuyết kiểm định thống kê
KIỂM ĐỊNH 2 GIÁ TRỊ TB VỚI SPSS
Kiểm định so sánh 2 Giá trị TB từ 2 mẫu
THỐNG KÊ ỨNG DỤNG TRONG QUẢN LÝ & KỸ THUẬT
Chương 3: Lý thuyết kiểm định thống kê
So sánh 2 Gía trị TB của 2 mẫu này
THỐNG KÊ ỨNG DỤNG TRONG QUẢN LÝ & KỸ THUẬT Chương 3: Lý thuyết kiểm định thống kê
So sánh 2 Gía trị TB của 2 mẫu này
THỐNG KÊ ỨNG DỤNG TRONG QUẢN LÝ & KỸ THUẬT
Chương 3: Lý thuyết kiểm định thống kê
Trang 10PGS TS Nguyễn Thống 55
Giải:
biệt giữa 2 giá trị trung bình
trị trung bình
a X
X1 2
a X
X X
Ước lượng độ lệch chuẩn của tập hợp mẹ:
Độ lệch chuẩn của biến thống kê là hiệu 2 giá trị trung bình, theo lý thuyết thống kê:
68 3
2 n n
s ) 1 n ( s ) 1 n (
21
2222112
n
1 n
1
21X
THỐNG KÊ ỨNG DỤNG TRONG QUẢN LÝ & KỸ THUẬT
Chương 3: Lý thuyết kiểm định thống kê
Từ bảng tra phân phối Student với df=n1+n2-2
và =5%, ta xác định được:
Từ đó
Kết luận: CÓ sự khác biệt giữa 2 giá trị
trung bình Kết luận trên với rũi ro 5%
501 1 a 056 , 2 a
THỐNG KÊ ỨNG DỤNG TRONG QUẢN LÝ & KỸ THUẬT
Chương 3: Lý thuyết kiểm định thống kê
Bài tập 2: Một khảo sát liên quan đến
đánh giá mức độ quan trọng của
một biến xem xét lên một vấn đề
nghiên cứu Hai nhĩm được phỏng
vấn và kết quả như sau Hãy đánh
giá xem cĩ sự khác nhau về giá trị
• Dữ liệu là 2 biến: 1 biến lượng và 1 biến định danh cĩ
2 loại hình VD: Mức tiêu dùng và giới tính
• Bài tốn: Kiểm định về sự bằng nhau của 2 trung bình của hai nhĩm VD:Khơng cĩ sự khác biệt về mặt giới tính trong tiêu dùng cá
• Thực hiện trong SPSS: Menu → Analyze → Compare means →Independent-Samples T Test
Trang 11Chương 3: Lý thuyết kiểm định thống kê
KIỂM ĐỊNH SỰ BẰNG NHAU CỦA NHIỀU GIÁ TRỊ
TRUNG BÌNH: KIỂM ĐỊNH HẬU ANOVA
• Bài tốn: Khi thực hiện bài tốn ANOVA, giả
thuyết kiểm định là ít nhất cĩ 2giá trị trung bình
khác nhau Tuy nhiên, nĩ khơng cho biết 2
trung bình nào là khác nhau Phép kiểm định
hậu ANOVA giải đáp điều này
• Thực hiện trong SPSS: Menu → Analyze →
Compare means → One-WayANOVA → Post
hoc tests → Bonferoni test
Chương 3: Lý thuyết kiểm định thống kê
• Vì ở bước trước giả thuyết phương sai bằng nhau bị bác bỏ, do đĩ ta chọnthống kê Tanhane’T2 cho ví dụ minh họa tiếp theo
THỐNG KÊ ỨNG DỤNG TRONG QUẢN LÝ & KỸ THUẬT
Chương 3: Lý thuyết kiểm định thống kê
KIỂM ĐỊNH GIÁ TRỊ TB VỚI SPSS
THỐNG KÊ ỨNG DỤNG TRONG QUẢN LÝ & KỸ THUẬT Chương 3: Lý thuyết kiểm định thống kê
KIỂM ĐỊNH GIÁ TRỊ TB VỚI SPSS
THỐNG KÊ ỨNG DỤNG TRONG QUẢN LÝ & KỸ THUẬT
Chương 3: Lý thuyết kiểm định thống kê
KIỂM ĐỊNH GIẢ THUYẾT THỐNG KÊ
CỦA TỔNG BÌNH PHƯƠNG
BIẾN THỐNG KÊ
VỚI HÀM PHÂN PHỐI XÁC SUẤT 2
(xem bảng tra sau)
THỐNG KÊ ỨNG DỤNG TRONG QUẢN LÝ & KỸ THUẬT Chương 3: Lý thuyết kiểm định thống kê Đặt vấn đề : Xét một đại lượng là tổng các giá trị bình phương Mỗi giá trị bình phương là một biến thống kế
Trong một số trường hợp ta cần kiểm định xem một đại lượng này BẰNG zero hay KHƠNG theo quan đểm thống kê
Trang 12PGS TS Nguyễn Thống 67
Hàm mật độ xác suất 2 được sử dụng để kiểm
định các biến thống kê có dạng là một
S= = Pr( 2 > e)
KIỂM ĐỊNH VỚI 2
Ví dụ 1 : Kiểm định sự phù hợp (bài tốn 1D)
• Một nhà cung cấp tủ lạnh phân chia vùng kinh
doanh ra làm 4 khu vực Người ta muốn kiểm tra xem số tủ lạnh bán ra cĩ bằng nhau ở 4 khu vực này hay khơng?
Để kiểm tra giả thuyết này, người ta lấy một mẫu ngẫu nhiên gồm 40 hồ sơ khách hàng đã mua ở năm trước
Kết quả ghi nhận từng khu vực phân bố như sau:
THỐNG KÊ ỨNG DỤNG TRONG QUẢN LÝ & KỸ THUẬT
Chương 3: Lý thuyết kiểm định thống kê
KHƠNG có sự khác
biệt về doanh số của
4 khu vực (H0)
10 10 (=40/4)
10 10 40
2
0 e2
i 1,4 e
f f
4 f
Để đánh giá cĩ sự khác biệt hay khơng, ta sẽ
so sánh với giá trị lý thuyết:
• Nếu : : kết luận cĩ sự khác biệt ở
các khu A, B, C, D
• Nếu : : kết luận khơng cĩ sự khác
biệt ở các khu A, B, C, D Trong đó được xác định từ phân phối
cĩ bậc tự do dl=k-m-1 và ngưỡng rủi ro α (thường là 5%)
(k=4 số khu vực khảo sát, số tham số tính từ
số liệu mẫu khảo sát)
2
2
2
2
2 e
2
2 e
THỐNG KÊ ỨNG DỤNG TRONG QUẢN LÝ & KỸ THUẬT
Chương 3: Lý thuyết kiểm định thống kê
Với = 5 %, và dl =k-m-1 = 3 (mảng 1D)
Ta cĩ:
Ta thấy: , ta chấp nhận H0
Kết luận : Với mức độ rủi ro là 5 %, ta cĩ
thể nĩi số lượng tủ lạnh bán cho 4 khu
Trang 13Chương 3: Lý thuyết kiểm định thống kê
KIỂM ĐỊNH VỚI 2 (bài tốn 2D)
Ví dụ Người ta muốn kiểm tra xem
cĩ liên hệ hay khơng giữa chế
độ tưới nước nhằm bảo dưỡng
bê tơng sau khi đổ & cường độ
Kết quả thí nghiệm được trình
bày trong bảng sau Kiểm định
giả thiết với độ tin cậy 99%
Chương 3: Lý thuyết kiểm định thống kê
THỐNG KÊ ỨNG DỤNG TRONG QUẢN LÝ & KỸ THUẬT
Chương 3: Lý thuyết kiểm định thống kê
KIỂM ĐỊNH VỚI 2 (bài tốn 2D): f e
Số ngày tưới nước
sau khi đổ
Với = 1% và dl =1, tra từ bảng phân phối 2, ta có:
Kết luận: Với độ tin cậy là 99%, ta có thể kết luận chế độ bảo dưỡng và cường độ chịu lực bê tông là
KHÔNG ĐỘC LẬP
8 27 f
f f
2eo
63 , 6
THỐNG KÊ ỨNG DỤNG TRONG QUẢN LÝ & KỸ THUẬT
Chương 3: Lý thuyết kiểm định thống kê
KIỂM ĐỊNH VỚI 2 (bài tốn 2D)
Bài tập Một cửa hàng bán đĩa nhạc khảo
sát 200 khách hàng một cách ngẫu
nhiên để đánh giá xem có sự liên quan
hay không giữa tuổi tác & giới tính đối
với người đi mua nhạc với độ tin cậy
KIỂM ĐỊNH VỚI 2 (bài tốn 2D)
30 30 60 90
Trang 14PGS TS Nguyễn Thống 79
Bài tập: Trưởng phòng tổ chức một Cơng ty
muốn biết xem có sự quan hệ hay khơng giữa
những người “gắn bó” với Cơng ty và hoàn
cảnh gia đình (số lượng con phải nuơi) Hồ sơ
lưu của Cơng ty cho các kết quả sau:
Hãy kiểm định giả thiết với rũi ro =5%
Thời gian \ Số con nuơi >=3 <3
Lương CN May CN XD N dân Tổng
THỐNG KÊ ỨNG DỤNG TRONG QUẢN LÝ & KỸ THUẬT
Chương 3: Lý thuyết kiểm định thống kê
Bài tập : Người ta muốn biết các tầng lớp xã hội khác
nhau (A,B,C) nghiên cứu khác nhau này có ảnh
hưởng đến thu nhập của họ hay không
e
2eo2
THỐNG KÊ ỨNG DỤNG TRONG QUẢN LÝ & KỸ THUẬT
Chương 3: Lý thuyết kiểm định thống kê
83
KIỂM ĐỊNH THỐNG KÊ
DÙNG TRONG XÁC ĐỊNH QUY LUẬT PHÂN PHỐI XÁC SUẤT
THỐNG KÊ ỨNG DỤNG TRONG QUẢN LÝ & KỸ THUẬT Chương 3: Lý thuyết kiểm định thống kê
Bài tập Người ta giả thiết số sự cố xảy ra cho các thiết bị hoạt động trong một nhà máy tuân theo phân phối Poisson Bảng số liệu sau ghi được số lần sự cố xảy ra trong thời gian 40 chu kỳ quan sát ngẫu nhiên, mỗi chu kỳ quan sát dài 1 giờ
a Xác định số sự cố trung bình ( thông số
trong phân phối Poisson) Giá trị này sẽ được dùng để kiểm định giả thiết là số lượng sự cố thì phân bố theo một phân phối Poisson