Nói đến toán học ứng dụng không thể không nói đến bộ môn Xác suất – thống kê, sự ra đời và phát triển của nó đã xác lập những quy luật tất nhiên ẩn dấu sau những hiện tượng manh tính ngẫ
Trang 2LỜI CẢM ƠN
Em xin chân thành cảm ơn các thầy cô giáo khoa Toán, Trường Đại học Sư phạm Hà Nội 2 đã tạo điều kiện thuận lợi và giúp đỡ em trong học tập
và thực hiện khoá luận này
Em xin chân thành biết ơn sâu sắc tới TS Kiều Văn Hƣng đã giúp đỡ,
chỉ bảo tận tình trong việc triển khai thực hiện khoá luận
Xin chân thành cảm ơn các bạn sinh viên K36 Toán, Trường Đại học
Sư phạm Hà Nội 2 đã cổ vũ, động viên, giúp đỡ trong suốt quá trình học tập
và nghiên cứu
Hà Nội, ngày 15 tháng 5 năm 2014
Sinh viên
Trần Thanh Huyền
Trang 3LỜI CAM ĐOAN
Đề tài của em được hoàn thành dưới sự hướng dẫn của thầy Kiều Văn Hƣng cùng sự cố gắng của bản thân
Em xin cam đoan những kết quả trong khóa luận tốt nghiệp là kết quả nghiên cứu của em, không trùng với bất kì tác giả nào khác Nếu sai em xin chịu hoàn toàn trách nhiệm
Hà Nội, ngày 15 tháng 5 năm 2014
Sinh viên
Trần Thanh Huyền
Trang 4MỤC LỤC
MỞ ĐẦU 1
Chương 1 MỘT SỐ KIẾN THỨC CƠ SỞ 3
1.1 Biến ngẫu nhiên 3
1.1.1 Định nghĩa biến ngẫu nhiên 3
1.1.2 Biến ngẫu nhiên rời rạc 3
1.1.3 Biến ngẫu nhiên liên tục và hàm mật độ xác suất 4
1.1.3.1 Biến ngẫu nhiên liên tục 4
1.1.3.2 Hàm mật độ xác suất 4
1.2 Các đặc trưng của biến ngẫu nhiên 5
1.2.1 Kỳ vọng (Expectation) 5
1.2.2 Phương sai 5
1.2.3 Độ lệch tiêu chuẩn 6
1.3 Lý thuyết mẫu 6
1.3.1 Một số phương pháp lấy mẫu 6
1.3.2 Đặc trưng mẫu 7
1.3.2.1 Trung bình mẫu 7
1.3.2.2 Mode 7
1.3.2.3 Độ lệch trung bình 7
Chương 2 BÀI TOÁN KIỂM ĐỊNH GIẢ THUYẾT THỐNG KÊ 8
2.1 Khái niệm 8
2.1.1 Giả thuyết thống kê và kiểm định giả thuyết thống kê 8
2.1.2 Cách đặt giả thuyết 9
2.1.3 Miền bác bỏ - tiêu chuẩn kiểm định 10
2.1.4 Sai lầm loại I và sai lầm loại II 11
2.2 Bài toán kiểm định giả thuyết 14
Trang 52.2.1 Các bước tiến hành kiểm định giả thuyết thống kê 14
2.2.2 Bài toán kiểm định dùng một mẫu 14
2.2.2.1 Kiểm định giả thuyết cho kỳ vọng 14
2.2.2.2 Kiểm định giả thuyết cho tỷ lệ 17
2.2.3 Bài toán kiểm định dùng nhiều mẫu 19
2.2.3.1 So sánh hai kỳ vọng 19
2.2.3.2 So sánh hai tỷ lệ 23
Chương 3 MỘT SỐ BÀI TOÁN MINH HỌA 25
3.1 Bài toán kiểm định dùng một mẫu 25
3.1.1 Kiểm định giả thuyết cho kỳ vọng 25
3.1.1.1 Kiểm định giả thuyết cho kỳ vọng, trường hợp biết 2 25
3.1.1.2 Kiểm định giả thuyết cho kỳ vọng, trường hợp chưa biết 2 27
3.1.2 Kiểm định giả thuyết cho tỷ lệ 30
3.2 Bài toán kiểm định dùng nhiều mẫu 32
3.2.1 So sánh hai kỳ vọng 32
3.2.1.1 So sánh hai kỳ vọng, trường hợp phương sai 2 đã biết 32
3.2.1.2 So sánh hai kỳ vọng, trường hợp phương sai chưa biết 35
3.2.2 So sánh hai tỷ lệ 38
KẾT LUẬN 41
TÀI LIỆU THAM KHẢO 42
Trang 6MỞ ĐẦU
Ngày nay sự phát triển của tất cả các ngành khoa học cơ bản cũng như ứng dụng vào tất cả các ngành công nghiệp then chốt như: dầu khí, viễn thông, hàng không,… đều không thể thiếu Toán học và càng gắn bó với Toán học Sự ra đời và phát triển mạnh mẽ của công nghệ thông tin đã dẫn tới sự bùng nổ các ứng dụng của Toán học, đưa lại hiệu quả to lớn cho đời sống xã hội
Toán học ra đời bắt nguồn từ nhu cầu giải quyết các bài toán thực tiễn
Sự phát triển của Toán học gắn liền với sự phát triển của xã hội Cùng với thời gian, Toán học ngày cáng phát triển và được chia làm hai lĩnh vực: toán học l ý thuyết và toán học ứng dụng Nói đến toán học ứng dụng không thể không nói đến bộ môn Xác suất – thống kê, sự ra đời và phát triển của nó đã xác lập những quy luật tất nhiên ẩn dấu sau những hiện tượng manh tính ngẫu nhiên khi nghiên cứu một số lớn các hiện tượng tương tự Việc nắm bắt các quy luật này sẽ cho phép dự báo các hiện tượng ngẫu nhiên xảy ra như thế nào? Mà các hiện tượng ngẫu nhiên này thường gặp trong thực tế của các lĩnh vực kinh tế, nông nghiệp, lâm nghiệp, sinh học, y học,… Trong đó, các bài toán kiểm định giả thuyết thống kê là một vấn đề quan trọng của lý thuyết xác suất – thống kê
Dưới góc độ là một sinh viên chuyên ngành, được sự hướng dẫn tận
tình của thầy Kiều Văn Hƣng, em đã lựa chọn đề tài “Bài toán kiểm định giả thuyết thống kê” trong khóa luận tốt nghiệp đại học của mình
Nội dung chính của khóa luận gồm 3 chương:
Chương 1: Một số kiến thức cơ sở - Trình bày các kiến thức cơ sở về mặt lý thuyết: biến ngẫu nhiên, các đặc trưng của biến ngẫu nhiên, lý thuyết mẫu…
Trang 7Chương 2: Bài toán kiểm định giả thuyết - Trình bày về bài toán kiểm định tổng quát
Chương 3: Một số bài toán minh họa Chương này trình bày lời giải cụ thể của một số bài toán kiểm định thông qua những tính chất và ứng dụng
Do thời gian có hạn và điều kiện nghiên cứu, đặc biệt là về mặt tài liệu nên khóa luận không tránh khỏi những thiếu sót, em rất mong được sự quan tâm, góp ý, chỉ bảo của các thầy cô giáo và các bạn để khóa luận được hoàn thiện hơn
Trang 8Chương 1 MỘT SỐ KIẾN THỨC CƠ SỞ 1.1 Biến ngẫu nhiên
1.1.1 Định nghĩa biến ngẫu nhiên
Một đại lượng (hay một biến) nhận các giá trị của nó với xác suất tương
ứng nào đấy gọi là đại lượng ngẫu nhiên hay biến ngẫu nhiên
Các biến ngẫu nhiên được kí hiệu bởi X,Y,Z,… hoặc , , ,…
Các giá trị mà biến ngẫu nhiên nhận thường kí hiệu là x, y, z,…
Ví dụ 1.1 Tung một con xúc xắc Gọi X là số chấm xuất hiện trên mặt con
xúc xắc thì X là một đại lượng ngẫu nhiên nhận các giá trị có thể là 1, 2, 3, 4,
5, 6
1.1.2 Biến ngẫu nhiên rời rạc
Định nghĩa 1.1 Nếu tập các giá trị mà biến ngẫu nhiên nhận là một tập gồm
một số hữu hạn điểm hoặc vô hạn nhưng đếm được, khi đó biến ngẫu nhiên được gọi là biến ngẫu rời rạc
Ta có thể liệt kê các giá trị của đại lượng ngẫu nhiên rời rạc x x1, 2, ,x n
Ta kí hiệu đại lượng ngẫu nhiên X nhận giá trị x là X= n x và xác suất n
để X nhận giá trị x là ( n P X x n)
Ví dụ 1.2 Số chấm xuất hiện trên mặt con xúc xắc, số học sinh vắng mặt
trong một buổi học,… là các đại lượng ngẫu nhiên rời rạc
Bảng phân phối xác suất
Bảng phân phối xác suất dùng để thiết lập luật phân phối xác suất của đại lượng ngẫu nhiên rời rạc, nó gồm 2 thông tin: thông tin thứ nhất liệt kê các giá trị có thể x x1, 2, ,x của đại lượng ngẫu nhiên X và thông tin thứ hai n
liệt kê các xác suất tương ứng p p1, 2, ,p của các giá trị có thể đó n
Trang 9Do đó,
1
1
n i i
p
1.1.3 Biến ngẫu nhiên liên tục và hàm mật độ xác suất
1.1.3.1 Biến ngẫu nhiên liên tục
Định nghĩa 1.2 Nếu tập các giá trị mà biến ngẫu nhiên nhận lấp đầy một
khoảng trên trục số, khi đó biến ngẫu nhiên được gọi là biến ngẫu nhiên liên tục
Ví dụ 1.3 - Nhiệt độ không khí ở mỗi thời điểm nào đó
- Khoảng thời gian giữa hai ca cấp cứu của một bệnh viện
1.1.3.2 Hàm mật độ xác suất
Định nghĩa 1.3 Hàm mật độ xác suất của đại lượng ngẫu nhiên liên tục X là
hàm không âm ( )f x xác định với mọi x , thỏa mãn
B
P XB f x dx
với mọi tập số thực B
Trang 101.2 Các đặc trƣng của biến ngẫu nhiên
1.2.1 Kỳ vọng (Expectation)
Định nghĩa 1.4 Giả sử X là một biến ngẫu nhiên rời rạc có thể nhận các giá
trị x x1, 2, ,x với các xác suất tương ứng n p p1, 2, ,p n Kỳ vọng của biến ngẫu
nhiên X, kí hiệu EX, là số được xác định bởi
i
x p
Giả sử X là một biến ngẫu nhiên liên tục có hàm mật độ xác suất p(x)
Kỳ vọng của biến ngẫu nhiên X được xác định bởi
Định nghĩa 1.5 Phương sai (độ lệch bình phương trung bình) của đại lượng
ngẫu nhiên X, kí hiệu Var(X) hay DX, được định nghĩa bằng công thức
Trang 11phương sai phản ánh mức độ phân tán các giá trị của đại lượng ngẫu nhiên chung quanh giá trị trung bình
1.2.3 Độ lệch tiêu chuẩn
Đơn vị đo của phương sai bằng bình phương đơn vị đo của đại lượng ngẫu nhiên Khi cần đánh giá mức độ phân tán các giá trị của đại lượng ngẫu nhiên theo đơn vị của nó, người ta dùng một đặc trưng mới đó là độ lệch tiêu chuẩn
Định nghĩa 1.6 Độ lệch tiêu chuẩn của đại lượng ngẫu nhiên X, kí hiệu là
1.3.1 Một số phương pháp lấy mẫu
- Một tập hợp chính là tập hợp tất cả đối tượng có chung một tính
chất nào đó mà chúng ta đang quan tâm
- Mỗi phần tử của tập hợp chính được gọi là một cá thể
- Một biến lượng X (hay một dấu hiệu về lượng) là một ánh xạ từ tập
lên trục số Đó là một phép đo xác định trên mỗi cá thể của Tập tất cả các
số đo X trên tất cả các cá thể của làm thành một tập hợp chính các giá trị
Trang 12- Ngoài ra còn có các phương pháp lấy mẫu khác: chọn mẫu với xác suất không đều, theo nhóm trội xác suất đều, mẫu chuẩn
r x x
Nếu có bảng phân phối ghép lớp với m khoảng C C1, 2, ,C và tần số m
của khoảng C là i r i , thì trung bình mẫu x được tính bằng công thức (2), với
d
x x r M
Trang 13Chương 2 BÀI TOÁN KIỂM ĐỊNH GIẢ THUYẾT THỐNG KÊ
2.1 Khái niệm
2.1.1 Giả thuyết thống kê và kiểm định giả thuyết thống kê
Định nghĩa 2.1 Giả thuyết thống kê là những phát biểu về các tham số, quy
luật phân phối, hoặc tính độc lập của các đại lượng ngẫu nhiên Việc tìm ra kết luận để bác bỏ hay chấp nhận một giả thuyết gọi là kiểm định giả thuyết thống kê
Ví dụ 2.1 Giám đốc một nhà máy sản xuất bo mạch chủ máy vi tính tuyên bố
rằng tuổi thọ trung bình của một bo mạch chủ do nhà máy sản xuất ra là 5 năm; đây là một giả thuyết về kì vọng của biến ngẫu nhiên X bằng tuổi thọ của một bo mạch chủ Để đưa ra kết luận là chấp nhận hay bác bỏ giả thuyết
trên, ta cần dựa vào mẫu điều tra và quy tắc kiểm định thống kê
Định nghĩa 2.2 Trong bài toán kiểm định giả thuyết, giả thuyết cần được
kiểm định gọi là giả thuyết không (null hypothesis), kí hiệu là H0 Mệnh đề đối lập với H gọi là đối thuyết (alternative hypothesis), kí hiệu là 0 H 1
Ví dụ 2.2 a) Gọi là độ thay đổi trung bình trong huyết áp của một bệnh nhân sau khi dùng thuốc; Bác sĩ điều trị cần quan tâm đến giả thuyết sau:
0 1
H H
Trang 14b) Một khách hàng quan tâm đến tỷ lệ sản phẩm kém chất lượng trong một lô hàng mua của một nhà cung cấp Giả sử tỷ lệ sản phẩm kém tối đa được phép là 5% Khách hàng cần quan tâm đến giả thuyết sau
0 1
: 0,05: 0,05
- Khi đặt giả thuyết, ta thường so sánh cái chưa biết với cái đã biết Cái chưa biết là điều mà ta cần kiểm định, kiểm tra, làm rõ “ Cái đã biết” là những thông tin trong quá khứ, các định mức kinh tế, kĩ thuật
- Giả thuyết đặt ra thường mang ý nghĩa: “không khác nhau” hoặc “ khác nhau không có ý nghĩa” hoặc “ bằng nhau”
Tổng quát: Một bài toán kiểm định giả thuyết cho tham số sẽ có một trong 3 dạng dưới đây (0 là giá trị kiểm định đã biết):
Hai phía:
::
H H
Trang 15Một phía bên trái:
::
H H
2.1.3 Miền bác bỏ - tiêu chuẩn kiểm định
Định nghĩa 2.3 Xét bài toán kiểm định giả thuyết có giả thuyết H và đối 0
Khi đã có một tiêu chuẩn kiểm định G, với xác suất đã cho, người ta thiết lập một miền W (được gọi là miền bác bỏ giả thuyết) thỏa mãn điều kiện:
0
P G H đúng) = Nếu nhỏ (có thể: 0,1; 0,05; 0,01;…) theo nguyên lý xác suất nhỏ biến cố GW không xảy ra trong một phép thử X X1, 2, X n Vì vậy với một phép thửX X1, 2, X n nếu G X X( 1, 2, ,X n)W xảy ra nghĩa là H 0
sai; ta bác bỏ H chấp nhận 0 H1 Còn nếu G X X( 1, 2, ,X n)W không xảy ra ta chưa có cơ sở bác bỏ H 0
Trang 16Tập hợp W gọi là miền bác bỏ giả thuyết H và phần bù W0 gọi là miền chấp nhận giả thuyết H 0
Đại lượng ngẫu nhiên GG X X( 1, 2, X n;0) gọi là tiêu chuẩn kiểm định giả thuyết H 0
Giá trị gọi là mức ý nghĩa của bài toán kiểm định
2.1.4 Sai lầm loại I và sai lầm loại II
Trong bài toán kiểm định giả thuyết thống kê ta có thể mắc phải các loại sai lầm sau:
Sai lầm loại I: Là sai lầm mắc phải khi ta bác bỏ H trong khi thực tế giả 0
thuyết H đúng.Sai lầm loại I kí kiệu là 0 , chính là mức ý nghĩa của kiểm định
0
P G H
Sai lầm loại II: Là sai lầm mắc phải khi ta chấp nhận giả thuyết H trong khi 0
thực tế H sai Sai lầm loại II kí hiệu là 0
Trang 17Ví dụ 2.3 Khảo sát tốc độ cháy của một loại nhiên liệu rắn dùng để đẩy tên
lửa ra khỏi giàn phóng Giả sử biến ngẫu nhiên X bằng tốc độ cháy của nhiên liệu (cm/s) có phân phối chuẩn với kỳ vọng và độ lệch chuẩn 2,5
Ta cần kiểm định giả thuyết
0 1
H H
Ta có thể làm giảm sai lầm bằng cách mở rộng miền chấp nhận Giả
sử với cỡ mẫu n = 10, miền chấp nhận là 48 x 52 khi đó giá trị của là
Trang 18Xác suất sai lầm loại II được tính như sau
(không bác bỏ H khi 0 H sai) 0
Để tính ta cần chỉ ra một giá trị cụ thể cho tham số trong đối thuyết
1
H
Giả sử với cỡ mẫu n=10, miền chấp nhận của giả thuyếtH là 0
48,5 X 51,5, trong khi giá trị thực sự của 52
Sai lầm cho bởi
Trang 192.2 Bài toán kiểm định giả thuyết
2.2.1 Các bước tiến hành kiểm định giả thuyết thống kê
Bước 1 Phát biểu giả thuyết H và đối thuyết 0 H 1
Bước 2 Định mức ý nghĩa
Bước 3 Chọn tiêu chuẩn kiểm định G
Bước 4 Thiết lập miền bác bỏ H : W0 ;
Bước 5 Từ mẫu cụ thể ( ,x x1 2, ,x tính n) G x x( ,1 2, ,x n)
- G x x( ,1 2, ,x n)W : bác bỏ H chấp nhận 0 H 1
- G x x( ,1 2, ,x n)W : chấp nhận H 0
2.2.2 Bài toán kiểm định dùng một mẫu
2.2.2.1 Kiểm định giả thuyết cho kỳ vọng
Kiểm định giả thuyết cho kỳ vọng, trường hợp biết 2
Các giả định:
- Giả sử (X X1, 2, ,X là mẫu ngẫu nhiên rút từ biến ngẫu nhiên X có n)phân phối chuẩn 2
( , )
N với kỳ vọng chưa biết
- Phương sai 2 đã biết
- Cho trước giá trị 0, cần so sánh kỳ vọng với 0
Bài toán kiểm định có 3 trường hợp:
:):
H a H
H b H
H c H
Trang 20Bước 2 Xác định mức ý nghĩa
Bước 3 Lấy mẫu ngẫu nhiên cỡ n: (X X1, 2, ,X n) và tính thống kê kiểm định:
0 0
N với kỳ vọng và phương sai 2 chưa biết
- Sử dụng ước lượng không chệch S thay cho
- Cỡ mẫu nhỏ: n 30
Bài toán kiểm định có 3 trường hợp:
Trang 21a) 0 0
::
H H
H H
H H
Trang 22Kiểm định giả thuyết cho kỳ vọng trường hợp 2chưa biết, mẫu lớn
Các giả định:
- Giả sử(X X1, 2, ,X n) là mẫu ngẫu nhiên rút từ biến ngẫu nhiên X có phân phối chuẩn 2
( , )
N với kỳ vọng và phương sai 2 chưa biết
- Sử dụng ước lượng không chệch S thay cho
- Cỡ mẫu lớn: n 30
Khi cỡ mẫu lớn biến ngẫu nhiên
0 0
2.2.2.2 Kiểm định giả thuyết cho tỷ lệ
Bài toán: Cho biến ngẫu nhiên X có phân phối nhị thức B(1,p) Từ mẫu ngẫu
nhiên (X X1, 2, ,X hãy kiểm định giả thuyết n) H0: p p0
:)
H p p b
H p p c
Trang 23- Quan sát sự xuất hiện của biến cố “phần tử mang đặc tính A” trong n phép thử độc lập Gọi Y là số lần xuất hiện biến cố trên thì Y B n p Và ( , )
0(1 0)
P p Z
p p n
0(1 0)
P p Z
p p n
Trang 24Bước 5 (Kết luận) Bác bỏH / chưa đủ cơ sở để bác bỏ 0 H 0
2.2.3 Bài toán kiểm định dùng nhiều mẫu
- Biến ngẫu nhiên X và Y độc lập với nhau
- Các phương sai 12 và 22đã biết
Bài toán kiểm định giả thuyết trên hai mẫu độc lập gồm các dạng sau:
:)
Trang 25Đối thuyết Miền bác bỏ
Bảng 4: Miền bác bỏ cho so sánh hai kỳ vọng, phương sai đã biết
Bước 5 (Kết luận) Nếu bác bỏ H ta kết luận 0 H đúng với (11 )100%
độ tin cậy Ngược lại ta kết luận chưa đủ cơ sở để bác bỏ H với 0 cho trước
So sánh hai kỳ vọng, trường hợp phương sai chưa biết, mẫu lớn
Các giả định:
- (X X1, 2, ,X là mẫu ngẫu nhiên được chọn từ biến ngẫu nhiên X có n)
kỳ vọng 1 và phương sai 12 chưa biết
- ( , , ,Y Y1 2 Y là mẫu ngẫu nhiên được chọn từ biến ngẫu nhiên Y có m)
kỳ vọng2 và phương sai 22 chưa biết
- Biến ngẫu nhiên X và Y đối lập với nhau
- Cỡ mẫu lớn: n30 và m30
- Đối với trường hợp mẫu lớn, khi phương sai 12 và 22 chưa biết ta thay thế bằng các phương sai mẫu S và 12 S mà không tạo ra nhiều khác biệt 22