Tài liệu hạn chế xem trước, để xem đầy đủ mời bạn chọn Tải xuống
1
/ 45 trang
THÔNG TIN TÀI LIỆU
Thông tin cơ bản
Định dạng
Số trang
45
Dung lượng
1,6 MB
Nội dung
TRƯỜNG ĐẠI HỌC VINH KHOA TOÁN HỌC VŨ QUỲNH PHƯƠNG ỨNG DỤNG PHẦN MỀM MINITAB ĐỂ GIẢI BÀI TOÁN KIỂM ĐỊNH GIẢ THIẾT THỐNG KÊ KHÓA LUẬN TỐT NGHIỆP ĐẠI HỌC CHUYÊN NGÀNH TOÁN - TIN HỌC ỨNG DỤNG Vinh, năm 2012 TRƯỜNG ĐẠI HỌC VINH KHOA TOÁN HỌC KHÓA LUẬN TỐT NGHIỆP ĐẠI HỌC ỨNG DỤNG PHẦN MỀM MINITAB ĐỂ GIẢI BÀI TOÁN KIỂM ĐỊNH GIẢ THIẾT THỐNG KÊ Người hướng dẫn : ThS Nguyễn Thị Thanh Hiền Người thực : Vũ Quỳnh Phương Lớp : 49B - Toán - Tin học ứng dụng MSSV : 0851095194 Năm 2012 MỤC LỤC MỞ ĐẦU Chương BÀI TOÁN KIỂM ĐỊNH GIẢ THIẾT THỐNG KÊ 1.1 Các khái niệm 1.2 Quy trình tổng quát kiểm định giả thiết 1.3 Bài toán kiểm định giả thiết Chương PHẦN MỀM MINITAB 16 2.1 Cài đặt phần mềm Minitab 16 2.2 Khởi động phần mềm Minitab 17 2.3 Bảng tính Minitab 21 2.4 Nhập liệu vào bảng tính Minitab 26 2.5 Các đại lượng thống kê Minitab 27 Chương KIỂM ĐỊNH GIẢ THIẾT THỐNG KÊ TRÊN MINITAB 28 3.1 Kiểm định giả thiết giá trị trung bình với phương sai biết 28 3.2 Kiểm định giả thiết giá trị trung bình với phương sai chưa biết 30 3.3 Kiểm định giả thiết giá trị xác suất 32 KẾT LUẬN 41 TÀI LIỆU THAM KHẢO 42 MỞ ĐẦU Thống kê đời, phát triển từ nhu cầu thực tiễn xã hội môn khoa học xã hội có lịch sử lâu dài Đó trình phát triển khơng ngừng từ đơn giản đến phức tạp, đúc rút dần thành lý luận khoa học ngày trở thành môn khoa học độc lập Kể từ đời, thống kê đóng vai trò ngày quan trọng đời sống xã hội Thông qua việc phát hiện, phản ánh quy luật lượng tượng, số thống kê giúp cho việc kiểm tra, giám sát, đánh giá chương trình, kế hoạch định hướng phát triển kinh tế - xã hội tương lai V.L.Lê-nin khẳng định “thống kê kinh tế - xã hội công cụ mạnh mẽ để nhận thức xã hội” Ngày nay, thống kê coi công cụ quản lý vĩ mơ quan trọng, có vai trị cung cấp thơng tin trung thực, khách quan, xác, đầy đủ, kịp thời, phục vụ viêc đánh giá, dự báo tình hình, hoạch định chiến lược, sách để phát triển kinh tế - xã hội Đồng thời, số thống kê sở quan trọng để kiểm tra, đánh giá tình hình thực kế hoạch, sách Các hoạt động thống kê phải trải qua trình gồm nhiều giai đoạn nhau, có liên quan chặt chẽ với Kiểm định giả thiết thống kê phương pháp thường dùng nhằm đưa định quan trọng quản lý điều hành kinh doanh mặt sống Hiện có nhiều phần mềm ứng dụng để phân tích, xử lý số liệu thống kê SPSS, SATISTICA, EVIEWS, MINITAB…Tuy nhiên, Minitab phần mềm máy tính giải toán kiểm định giả thiết thống kê cách nhanh chóng tiết kiệm thời gian Phần mềm trở thành cơng cụ phân tích trình bày liệu hữu hiệu Minitab chương trình tồn diện dễ sử dụng Với chương trình giải tốn từ đơn giản yêu cầu tham số thống kê, tới toán phức tạp việc xác định ảnh hưởng yếu tố khác đến tính trạng phương pháp phân tích hồi qui, phương sai Ngồi xây dựng cho thí nghiệm hữu hiệu Minitab cho hàng loại cách vẽ đồ thị mang tính phân tích khoa học Để hiểu rõ phương pháp cách thức giải toán kiểm định giả thiết thống kê Minitab, lựa chọn đề tài luận văn Ứng dụng phần mềm Minitab để giải toán kiểm định giả thiết thống kê Nội dung khố luận trình bày thành ba chương: Chương Trình bày tốn kiểm định giả thiết thống kê Chương Trình bày phần mềm Minitab Chương Trình bày cách giải tốn kiểm định giả thiết thống kê Minitab Khoá luận thực hồn thành Khoa Tốn – Trường Đại Học Vinh viết dựa tài liệu sở Lý thuyết thống kê, website phần mềm Minitab Internet, hướng dẫn cô giáo ThS Nguyễn Thị Thanh Hiền.Tác giả bày tỏ lời cảm ơn sâu sắc đến cô giành nhiều thời gian quan tâm nhiệt tình hướng dẫn giúp đỡ tác giả trình học tập nghiên cứu Nhân dịp tác giả xin cảm ơn thầy giáo khoa Tốn tạo điều kiện giúp đỡ tác giả hoàn thành khố luận Mặc dù có nhiều cố gắng lực thời gian cịn nhiều hạn chế nên khố luận khơng thể tránh khỏi thiếu sót nội dung hình thức Vì vậy, tác giả mong nhận bảo lời nhận xét quý thầy cô bạn đọc để hồn chỉnh để sản phẩm có ứng dụng thực tiễn Vinh, tháng 04 năm 2012 Tác giả Chương BÀI TOÁN KIỂM ĐỊNH GIẢ THIẾT THỐNG KÊ 1.1 Các khái niệm 1.1.1 Giả thiết thống kê Khi nghiên cứu lĩnh vực thực tế ta thường đưa nhận xét khác đối tượng quan tâm Những nhận xét thường coi giả thiết, chúng sai.Việc định nghĩa tính sai giả thiết gọi kiểm định Sự hay sai giả thiết thống kê biết cách chắn, trừ ta khảo sát toàn tập hợp Điều không khả thi đa số trường hợp Thay vào ta ta lấy mẫu ngẫu nhiên từ tập hợp nghiên cứu sử dụng liệu có mẫu để đưa chứng mà qua ta chấp nhận hay khơng chấp nhận giả thiết Bằng chứng từ mẫu mẫu thuẫn với giả thiết đưa đến việc bác bỏ giả thiết, ngược lại chứng phù hợp với giả thiết đưa lại việc chấp nhận Thủ tục mà qua thơng tin mẫu ta đưa chứng để chấp nhận bác bỏ giả thiết thống kê gọi kiểm định giả thiết ( kiểm định thống kê, test thống kê ) Nội dung toán kiểm định giả thiết thống kê số liệu thu được, cho kết luận giả thiết thống kê mà ta quan tâm Một giả thiết thống kê giả thiết phân bố tập hợp xét Nếu phân bố đặc trưng tham số ( giá trị trung bình, phương sai, …) giả thiết thống kê giả thiết tham số phân bố Giả thiết đưa kiểm nghiệm kí hiệu H0 gọi “giả thiết khơng” Đó giả thiết ta nghi ngờ muốn bác bỏ Ngồi giả thiết H0 ra, ta cịn phải định rõ giả thiết cạnh tranh với H0 ( gọi đối thiết ) Đối thiết kí hiệu H1 H1 chấp nhận H0 bị bác bỏ Giả sử cần nghiên cứu tham số θ đại lượng ngẫu nhiên X người ta đưa giả thiết cần kiểm định: Gọi H1 đối thiết H0 thì: H0: µ = µ0 H1: µ ≠ µ0 Từ mẫu ngẫu nhiên WX= (X1, X2,….,Xn) ta chọn thống kê θ = θ (x1, x2,…,xn) cho H0 θ có phân phối hồn tồn xác định với mẫu cụ thể giá trị θ tính θ gọi tiêu chuẩn kiểm định giả thiết H 1.1.2 Kiểm định phía Nếu xảy trường hợp sau: - Giả thiết H0 đưa kiểm định có dạng : µ = µ0 cịn đối thiết H1 có dạng µ < µ0 (hoặc µ > µ0) - Giả thiết H0 đưa kiểm định có dạng : µ ≤ µ0 (µ ≥ µ0) đối thiết H1 tương ứng có dạng µ > µ0 ( µ < µ0) 1.1.3 Kiểm định phía Nếu giả thiết H0 đưa kiểm định có dạng : µ = µ0 cịn đối thiết H1 có dạng µ ≠ µ0 1.1.4 Miền bác bỏ, miền chấp nhận - Sau chọn tiêu chuẩn kiểm định, với α bé cho trước, thông thường α 0.01; 0.05 với điều kiện H0 ta tìm miền Wα cho α nhận giá trị miền Wα với xác suất α, tức P(θ Wα) = α Khi Wα gọi miền bác bỏ giả thiết H0, α gọi mức ý nghĩa kiểm định( hay cỡ miền bác bỏ) - Miền lại gọi miền chấp nhận giả thiết H0 - Miền nằm miền chấp nhận miền bác bỏ gọi giá trị tới hạn 1.1.5 Giá trị quan sát Thực phép thử mẫu ngẫu nhiên Wx= { X1, X2,…,Xn } ta mẫu cụ thể wx= ( x1,x2,…,xn ) Tính giá trị θ0 = θ ( x1,x2,…,xn : θ0 ) Khi θ0 gọi giá trị quan sát - Nếu θ0 Wα bác bỏ giả thiết H0 chấp nhận đối thiết H1 - Nếu θ0 Wα chấp nhận giả thiết H0 Như vậy, định bác bỏ giả thiết H0 xác suất xuất kiện quan sát được, tính điều kiện giả thiết H0 đúng, “nhỏ” 1.1.6 Tiêu chuẩn kiểm định giả thiết thống kê Giả sử ta cần nghiên cứu tham số θ BNN X, người ta cần đưa giả thiết cần kiểm định H0: θ = θ0 Từ BNN gốc tổng thể, lập mẫu ngẫu nhiên cỡ n : Wx = { X1, X2,…,Xn } ta chọn thống kê wx=( x1,x2,…,xn) Nếu H0 thống kê wx có phân phối hồn tồn xác định Khi thống kê wx gọi tiêu chuẩn kiểm định giả thiết H0 1.1.7 Quy tắc kiểm định Chúng ta bác bỏ hay chấp nhận giả thiết dựa nguyên lí sau đây: - Nguyên lý xác suất nhỏ: “ Nếu biến cố có xác suất nhỏ phép thử hay vài phép thử , biến cố khơng xảy ra” - Phương pháp phản chứng: “Để bác bỏ giả thiết A ta giả sử giả thiết A sau dẫn tới điều vơ lý” 1.1.8 Sai lầm loại sai lầm loại Trong đưa định tình huống, phải đứng trước lựa chọn hai giả thiết H0 H1, ta phạm hai loại sai lầm: - Sai lầm loại 1: sai lầm mắc phải ta bác bỏ giả thiết H0 H0 - Sai lầm loại 2: Chấp nhận H0 thực H0 sai Có khả xảy thể bảng đây: Kết luận Chấp nhận H0 Chấp nhận H1 H0 Kết luận Sai lầm loại H0 sai Sai lầm loại Kết luận Thực tế Sai lầm loại tương tự sai lầm quan tòa kết án nhầm người vơ tội, cịn sai lầm loại tương tự sai lầm “tha bổng kẻ có tội” Một kiểm định thống kê lý tưởng kiểm định làm cực tiểu sai lầm loại sai lầm loại Tiếc không tồn kiểm định lý tưởng Nếu làm giảm sai lầm loại làm tăng sai lầm loại ngược lại Trong xã hội văn minh, người ta có xu hướng thừa nhận việc kết án nhầm người vô tội sai lầm nghiêm trọng nhiều so với sai lầm tha bổng kẻ có tội Trong tốn kiểm định giả thiết vậy, ta coi sai lầm loại sai lầm nghiêm trọng sai lầm loại Do người ta cố định trước xác suất mắc sai lầm loại Xác suất mắc sai lầm loại mức ý nghĩa , kí hiệu α Xác suất sai lầm loại kí hiệu β Con số 1-β gọi lực lượng kiểm định Lực lượng kiểm định xác suất bác bỏ H0 H0 sai Thông thường α lấy 5%, 2% 1% Trong tập hợp kiểm định thống kê có mức ý nghĩa α, ( tức có xác suất mắc sai lầm loại nhau), kiểm định mức có xác suất mắc sai lầm loại nhỏ xem “ tốt nhất” Vì vậy, sau chọn mức ý nghĩa kiểm định ,việc lựa chọn dạng phân phối thích hợp Tùy thuộc vào giả thiết thống kê cần kiểm định mà người ta sử dụng số quy luật phân phối thông dụng : Quy luật phân phối chuẩn, phân phối T-Student, phân phối χ2, phân phối Fisher… Tuy nhiên, cần phải lưu ý kiểm định thống kê dẫn tới việc chấp nhận H0 xác suất mắc sai lầm loại ta khơng biết (thường khó biết) lớn Do vậy, việc chấp nhận H0 định dè dặt: Khi chấp nhận H0 ta không nên hiểu H0 mà nên hiểu chứng số liệu có chưa đủ sở để bác bỏ H0 cần phải nghiên cứu tiếp 1.2 Quy trình tổng quát kiểm định giả thiết Bước Xây dựng giả thiết Ta bắt đầu kiểm định giả thiết với giả định vài tham số tổng thể sử dụng liệu mẫu để kiểm tra tính logic giả định Nói cách khác, ta giả định có tổng thể giá trị kết luận định bác bỏ hay không bác bỏ giả định theo số liệu mẫu Việc thiết lập giả thiết tuỳ thuộc vào chất tình có định hướng hay khơng định hướng Nếu tình khơng có định hướng khác biệt, giả thiết phía, có tính định hướng ta có giả thiết phía Để xác định phái trái hay phía phải ta dựa vào nguyên tắc tránh sai lầm loại Tuy nhiên, thất bại việc loại H0 không đồng nghĩa với việc chứng minh H0 đúng, mà không đủ chứng thống kê để loại bỏ mà thôi.Ở bước phát biểu giả thiết H0 đối thiết H1 Bước Chọn mức ý nghĩa mong muốn Khả phạm sai lầm loại gọi mức ý nghĩa kí hiệu α Ở bước xác định rõ mức ý nghĩa α (xác suất sai lầm loại 1) Trên thực tế có mức ý nghĩa thường dùng 0,1, 0,05 0,01 tương ứng với độ tin cậy 90%, 95% 99% Việc lựa chọn mức α phụ thuộc vào tính chủ quan người nghiên cứu chấp nhận rủi ro mức - Nếu nội dung nghiên cứu địi hỏi độ xác cao nên chọn mức α nhỏ, thông thường 1% (hay α = 0,01) - Nếu nội dung nghiên cứu có biến động lớn, thu thập thơng tin khó xác nên chọn mức α lớn, nhiên khơng nên tăng mức ý nghĩa α lớn bị tăng sai lầm loại Thông thường theo thống chung nhà thống kê mức ý nghĩa tối đa 10% - Nếu không quan tâm nhiều đến mức ý nghĩa chọn mức thống kê thơng thường 5% Bước Tính trị số thống kê hay giá trị thực tế kiểm định Chọn Test thống kê dựa vào lý thuyết thống kê mà lựa chọn công thức phù hợp để qui phân phối mẫu phân phối Giá trị thực tế kiểm định sở để định chấp nhận hay bác bỏ giả thiết Bước Chọn miền bác bỏ giả thiết H0 Tương ứng với mức ý nghĩa α giá trị test thống kê tìm giá trị lý thuyết kiểm định So sánh giá trị thực tế giá trị lý thuyết kiểm định để đưa kết luận hợp lí Chương KIỂM ĐỊNH GIẢ THIẾT THỐNG KÊ TRÊN MINITAB Minitab chương trình tồn diện dễ sử dụng Chương trình giải toán đơn giản yêu cầu tham số thống kê tới toán phức tạp việc kiểm định giả thiết, tìm khoảng tin cậy, mối quan hệ biến ảnh hưởng yếu tố khác Ngồi ra, Minitab cịn cung cấp nhiều tính lấy mẫu thống kê chi tiết,vẽ đồ thị mang tính phân tích khoa học 3.1 Kiểm định giả thiết giá trị trung bình với phương sai biết Bài toán : Từ tập hợp có phân bố chuẩn với kì vọng μ chưa biết độ lệch chuẩn = 5,2 người ta lấy mẫu kích thước n = 100 tính x = 27,56 Với mức ý nghĩa α = 5% kiểm định giả thiết H0: = 26 Với đối thiết H : ≠ 26 Các bước giải toán: Bước Khởi động chương trình Minitab Bước Chọn Stat \ Basic Statistic \ 1- Sample Z ( Test and Confidence interval ) (Hình 3.1) Chọn mục Summarized data gồm: Mục Sample size : điền kích thước mẫu Mục Mean : điền giá trị trung bình Mục Standard deviation : điền giá trị độ lệch chuẩn Chọn mục Perform hypothesis test Mục Hypothesized test : điền giá trị 0 28 Hình 3.1 Bước Chọn Option, xuất hộp thoại Ở mục Alternative chọn not equal (Hình 3.2) Hình 3.2 Bước Chọn Ok 29 Kết sau Hình 3.3 p-value < 0,05 Kết kiểm định theo trị thống kê bác bỏ H0 3.2 Kiểm định giả thiết giá trị trung bình với phương sai chưa biết (n ≥ 30) Bài tốn: Một nhóm nghiên cứu cơng bố trung bình người vào siêu thị A tiêu hết 140 ngàn đồng Chọn mẫu ngẫu nhiên 50 người mua hàng a tính số tiền trung bình họ tiêu 154 nghìn với độ lệch chuẩn 62 nghìn Với mức ý nghĩa 0,02 kiểm định xem cơng bố nhóm nghiên cứu có hay khơng? Các bước giải tốn: Bước Khởi động chương trình Minitab Bước Chọn Stat \ Basic Statistic \ 1- Sample t (Test and Confidence interval) (Hình 3.3) Chọn mục Summarized data gồm: Mục Sample size : điền kích thước mẫu Mục Mean : điền giá trị trung bình 30 Mục Standard deviation : điền giá trị độ lệch chuẩn Chọn mục Perform hypothesis test Mục Hypothesized test : điền giá trị 0 Hình 3.4 Bước Chọn Option, xuất hộp thoại (Hình 3.5) Ở mục Alternative chọn not equal Hình 3.5 Bước Chọn OK 31 Kết sau: Hình 3.6 Kết kiểm định theo trị thống kê t bác bỏ H1, chấp nhận giả thiết H0 3.3 Kiểm định giả thiết giá trị xác suất Bài tốn: Một đảng trị bầu cử tổng thống tuyên bố 45% cử tri bỏ phiếu cho ứng viên A họ Chọn ngẫu nhiên 200 cử tri để thăm dò ý kiến cho thấy 80 người số tuyên bố bỏ phiếu cho ông A Với mức ý nghĩa α = 5% kiểm định dự đốn đảng trị có khơng? Các bước giải tốn: Bước Khởi động chương trình Minitab Bước Chọn Stat \ Basic Statistic \ Proportion ( Test and Confidence interval ) (Hình 3.7) Chọn mục Summarized data gồm: Mục number of trials : số phép thử Mục number of events : số lần biến cố xuất Chọn mục Perform hypothesis test 32 Mục Hypothesized test: điền giá trị p0 Hình 3.7 Bước Chọn Option, xuất hộp thoại (Hình 3.8) Ở mục Alternative chọn not equal Hình 3.8 Bước Chọn OK 33 Kết sau Test and CI for One Proportion Hình 3.9 Kết kiểm định theo trị thống kê bác bỏ H1, chấp nhận giả thiết H0 : Dự đoán Đảng 3.4 Kiểm định khác biệt giá trị trung bình hai tổng thể Bài toán: Giả sử tổ hợp nhà hàng muốn so sánh doanh thu hai nhà hàng hệ thống Doanh thu tương ứng hai tuần hoạt động ngẫu nhiên thu thập sau: ĐVT: trăm triệu đồng Nhà hàng X Nhà hàng Y 759 678 981 933 1005 918 1449 1302 1905 1782 2073 1971 693 639 34 873 825 1074 999 1338 1281 1932 1827 2106 2049 Với mức ý nghĩa α = 5% kiểm định doanh thu nhà hàng X lớn nhà hàng Y không? Các bước giải toán: Bước Nhập liệu vào bảng tính ( Hình 3.10) Hình 3.10 Bước (Hình 3.11) Với α = 0,1 Chọn Stat \ Basic statistic \ 2- Sample t Chọn Sampe in difference colums Điền X vào ô First Điền Y vào ô Second Chọn Assume equal variances 35 Hình 3.11 Bước Chọn Option (Hình 3.12) Ở mục Confidence level điền giá trị 90 Chọn OK Hình 3.12 Bước Kết sau: 36 Hình 3.13 Với mức ý nghĩa α = 1% Thực tương tự từ bước đến bước Ta có kết sau: Hình 3.14 Khi độ tin cậy thay đổi từ 90% lên 99% dẫn đến khoảng tin cậy thay đổi từ ( -285, 449) đến ( -520, 684) Sự khác kỳ vọng 37 doanh thu nhà hàng cho thấy doanh thu nhà hàng co lúc nhỏ nhà hàng Tuy nhiên với số liệu thống kê cho ta thấy doanh thu nhà hàng lớn doanh thu nhà hàng Nguyên nhân dẫn đến kết luận sai lầm hai mẫu thử tiến hành không độc lập Tuy nhiên, việc tiến hành thu thập hai mẫu thử độc lập trường hợp khơng thực tế, doanh thu biến động nhiều có quy luật Do tiêu chuẩn kiểm định dựa vào phân bố Student không phát sai lệch kì vọng Để khắc phục sai lầm trên, ta thêm cột liệu C3 có tên sailech chênh lệch doanh thu hai nhà hàng Bước Tính sai lệch mẫu (Hình 3.15) Chọn Calc \ Calculator Nhập sailech vào Store result in variable Nhập (‘X’ – ‘Y’) vào Expression Hình 3.15 Chọn OK Kết sau (Hình 3.16) 38 Hình 3.16 Bước Chọn Stat \ Basic statistic \ 1- Sample t Ở mục Sample in columns nhập sailech Hình 3.17 Bước Chọn Option 39 Ở mục Ở mục Confidence level điền giá trị 95 Chọn OK Hình 3.18 Kết sau: Hình 3.19 Kết cho thấy doanh thu nhà hàng X lớn doanh thu nhà hàng Y 40 KẾT LUẬN Khoá luận thực kết sau đây: Trình bày cách có hệ thống khái niệm quy trình kiểm định giả thiết thống kê Giải thích rõ ràng thuật ngữ cách sử dụng phần mềm Minitab Giải toán kiểm định giả thiết phần mềm Minitab trường hợp cụ thể Vấn đề tiếp tục nghiên cứu Kiểm định phi tham số Minitab Xin chân thành cảm ơn! 41 TÀI LIỆU THAM KHẢO [1] Đào Hữu Hồ, Xác suất thống kê, NXB Đại học Quốc gia Hà Nội, 1996 [2] Đặng Hùng Thắng, Thống kê ứng dụng, NXB Giáo dục, 1998 [3] Nguyễn Vũ Quang, Phân tích thống kê phần mềm Minitab [4] Bùi Thế Tâm, Giáo trình tin học văn phịng, NXB Giao thơng vận tải, 2001 42 ... chứng để chấp nhận bác bỏ giả thiết thống kê gọi kiểm định giả thiết ( kiểm định thống kê, test thống kê ) Nội dung tốn kiểm định giả thiết thống kê số liệu thu được, cho kết luận giả thiết thống. .. Trình bày cách có hệ thống khái niệm quy trình kiểm định giả thiết thống kê Giải thích rõ ràng thuật ngữ cách sử dụng phần mềm Minitab Giải toán kiểm định giả thiết phần mềm Minitab trường hợp... Chương KIỂM ĐỊNH GIẢ THIẾT THỐNG KÊ TRÊN MINITAB Minitab chương trình tồn diện dễ sử dụng Chương trình giải toán đơn giản yêu cầu tham số thống kê tới toán phức tạp việc kiểm định giả thiết,