Trong buổi thảo luận ngày hôm nay, chúng ta sẽ cùng nhau khám phá cáckhái niệm cơ bản, từ giả thuyết không H và giả thuyết thay thế H , đến ý₀ ₁nghĩa của giá trị p và mức ý nghĩa, áp dụ
Trang 1BÀI THẢO LUẬN
HỌC PHẦN: TOÁN ĐẠI CƯƠNG
TRƯỜNG ĐẠI HỌC THƯƠNG MẠI KHOA MARKETING - -
Trang 2BẢNG PHÂN CÔNG NHIỆM VỤ
phân công
Mức độ hoàn thành
Tốt
57 Nguyễn Thùy
Trang
Thành viên 4.36; 4.37 Tốt
Trang 358 Trần Thị Trang Thành viên 4.46; 4.47 +
Tìm bài bênngoài
Trang 4Bộ môn Toán đại cương không chỉ bổ ích mà còn có tính thực tế cao Tuynhiên, do vốn kiến thức còn nhiều hạn chế và khả năng tiếp thu thực tế còn nhiều bỡ ngỡ Mặc dù chúng em đã cố gắng hết sức nhưng chắc chắn bài tiểu luận khó có thể tránh khỏi những thiếu sót và nhiều chỗ còn chưa chính xác, kính mong thầy và các bạn xem xét và góp ý để bài thảo luận của nhóm em được hoàn thiện hơn.
Chúng em xin chân thành cảm ơn!
Trang 5MỞ ĐẦU
Thống kê học có thể được định nghĩa một cách khái quát như là khoa học,
kỹ thuật hay nghệ thuật của việc rút ra thông tin từ dữ liệu quan sát, nhằm giàiquyết các bài toán từ thực tế cuộc sống Việc rút ra thông tin đó có thể là kiểmđịnh một giả thuyết khoa học, ước lượng một đại lượng chưa biết hay dự đoánmột sự kiện trong tương lai
Lí thuyết kiểm định các giả thuyết thống kê đóng vai trò là bộ phận khôngthể thiếu của thống kê toán Đây là một công cụ mạnh mẽ và phổ biến không chỉtrong nghiên cứu khoa học mà còn trong nhiều lĩnh vực thực tiễn như kinh tế, yhọc, kỹ thuật, và xã hội học Thống kê toán nói chung hay bài toán kiểm địnhnói riêng có ứng dụng rất rộng rãi trong thực tế và đời sống Trên thực tế cónhững biến cố xảy ra và con người không thể lường trước được Vì vậy thường
có những giả thuyết kiểm định mang tính định tính kết quả đúng sai về cáctrường hợp xảy ra của biến cố Kiểm định giả thuyết giúp chúng ta đưa ra nhữngquyết định dựa trên dữ liệu, thay vì dựa vào cảm tính hay phỏng đoán Nó cungcấp một cách tiếp cận hệ thống để kiểm tra tính chính xác của các giả thuyết, trảlời các câu hỏi như: “Liệu một loại thuốc mới có hiệu quả hơn phương phápđiều trị hiện tại không?”, hay “Liệu có sự khác biệt giữa thu nhập của hai nhómdân số?”
Trong buổi thảo luận ngày hôm nay, chúng ta sẽ cùng nhau khám phá cáckhái niệm cơ bản, từ giả thuyết không (H ) và giả thuyết thay thế (H ), đến ý₀ ₁nghĩa của giá trị p và mức ý nghĩa, áp dụng những kiến thức đã học để giảiquyết bài tập về kiểm định giả thuyết về một kỳ vọng toán của 1 ĐLNN và kiểmđịnh giả thuyết về tỷ lệ của đám đông
Trang 6M.c l.c
I Lý thuyết 2
1 Kiểm định giả thuyết về kì vọng toán của một ĐLNN 2
1.1 ĐLNN X trên đám đông có phân phối chuẩn với σ 2 đã biết 2
1.2 ĐLNN X trên đám đông có phân phối chuẩn với σ 2 chưa biết 3
1.3 Chưa biết quy luật phân phối xác suất của X nhưng n > 30 3
2 Kiểm định giả thuyết về tỉ lệ của đám đông 4
II Bài tập 4
1 Kiểm định giả thuyết về kì vọng toán của một ĐLNN 4
2 Kiểm định giả thuyết về tỉ lệ của đám đông 12
Trang 7KIỂM ĐỊNH GIẢ THUYẾT THỐNG KÊ VỀ CÁC THAM SỐ
I Lý thuyết
1 Kiểm định giả thuyết về kì vọng toán của một ĐLNN
Trang 91.3 Chưa biết quy luật phân phối xác suất của X nhưng n > 30
Trang 10bị tiền lãi trung bình đã thay đổi hay không ? Biết liền lãi mỗi ngày của cửa hang là một ĐLNN phân phối chuẩn với độ lệch tiêu chuẩn là 0,6 triệu đồng
X là ĐLNN chỉ tiền lãi trung bình
H1=μ ≠ μ0
Bài 4.30: Theo dõi 25 bệnh nhân mắc bênh ung thư gan thấy thời gian trung bình từ khi
phát hiện ra bệnh đến khi chết kéo dài 49 tháng
Với mức ý nghĩa 0,05 có thể nói rằng thời gian trung bình từ khi phát hiện ra bệnh đến khi chết kéo dài hơn 4 năm hay không?
Biết thời gian từ khi phát hiện ra bệnh ung thư gan đến khi chết của bệnh nhân
là một ĐLNN có phân phối chuẩn với độ lệch tiêu chuẩn là 4 tháng
Trang 11Gọi X là ĐLNN chỉ thời gian từ khi phát hiện ra bệnh đến khi chết của bệnh nhân
trên mẫu
µ là thời gian trung bình từ khi phát hiện ra bệnh đến khi chết của bệnh nhân trên đám đông
Với mức ý nghĩa α=0,05 cần kiểm định:
Bài 4.31: Cân thử lượng ga trong 9 bình được kết quả: 11,8 kg; 11,7 kg; 11,6 kg; 11,4
Gọi X là ĐLNN chỉ trọng lượng của mỗi bình ga
µ là trọng lượng trung bình của mỗi bình ga trên đám đông
Với mức ý nghĩa α=0,01 cần kiểm định:
Trang 12Bài 4.32: Trước khi thay đổi nhân viên phục vụ, trung bình mỗi khách hàng vào cửa hàng
ăn uống A tiêu hết 80 nghìn đồng Sau khi thay đổi nhân viên phục vụ, theo dõi 100 khách vào cửa hàng thấy mức tiêu trung bình của mỗi người là 78 nghìn đồng và độ lệch tiêu chuẩn mẫu điều chỉnh là 16 nghìn đồng Với mức ý nghĩa 0,05 có thể nói rằng do thay đổi nhân viên phục vụ nên số tiền chi tiêu trung bình của mỗi khách hàng một lần vào cửa hàng đã thay đổi hay không?
Gọi X là ĐLNN chỉ số tiền chi tiêu của mỗi khách hàng một lần vào cửa hàng
Trang 13u =tn 78 80−
16/√100=-1,25 => u tn∉ Wα
Kết luận: Với mức ý nghĩa α=0,05, ta không thể nói rằng do thay đổi nhân viên phục
vụ nên số tiền chi tiêu trung bình của mỗi khách hàng một lần vào cửa hàng đã thay đổi
Bài 4.33: Theo dõi thời gian cần thiết để sản xuất ra một đơn vị sản phẩm cùng loại của
49 công nhân được kết quả:
Gọi X là ĐLNN chỉ thời gian cần thiết để sản xuất ra một đơn vị sản phẩm
µ là thời gian trung bình cần thiết để sản xuất ra một đơn vị sản phẩm trên đám đông
Trang 14Bài 4.34: Thống kê doanh thu 36 ngày liên tiếp của một của hàng và tính được doanh thu
trung bình của một ngày là 63 triệu đồng và độ chênh lệch tiêu chuẩn mẫu điều chỉnh là 9triệu đồng Với mức ý nghĩa 0,05 có thể nói rằng doanh thu trung bình trong một ngày của cửa hàng là lớn hơn 60 triệu đồng hay không ?
Gọi X là doanh thu của của hàng trong một ngày
Gọi µ là dòng doanh thu trung bình của cửa hàng trong một ngày trên đám đông
Vì giá trị thống kê kiểm định t = 2 lớn hơn giá trị tới hạn t0.05,35≈ 1.69, ta bác
bỏ giả thuyết H Điều này có nghĩa là với mức ý nghĩa 0.05, ta có đủ bằng 0
chứng thống kê để kết luận rằng doanh thu trung bình trong một ngày của cửa hàng lớn hơn 60 triệu đồng
Bài 4.35 Năng suất của một giống lúa là một ĐLNN phân phối theo quy luật chuẩn
Thống kê năng suất lúa ở 9 thửa ruộng tính được năng suất trung bình là 61 tạ trên một héc ta và độ lệch tiêu chuẩn mẫu điều chỉnh là 1,6129 tạ
H1:μ ≠60
Gọi X là năng suất của giống lúa trên 1ha
là năng suất trung bình của giống lúa trên 1ha trên mẫu
µ là năng suất trung bình của giống lúa trên 1ha trên đám đông
Trang 15Với mức ý nghĩa α = 0,05 cần kiểm định {H0:μ =μ0(¿60)
Vậy với mức ý nghĩa 0,05 thì năng suất lúa trung bình là 61 tạ trên 1 hecta
Bài 4.36 Điều tra giá bán lẻ thịt lợn ở 9 cửa hàng thấy giá trung bình 1 kg là 53500 đồng
và độ lệch tiêu chuẩn mẫu điều chỉnh là 517,9558 đồng Với mức ý nghĩa 0,05 có thể kết luận rằng giá thịt lợn cao hơn so với cùng kì tháng trước hay không? Biết giá bán thịt lợn
là một ĐLNN phân phối theo quy luật chuẩn và giá cùng kì tháng trước là 53000 đồngGọi X là ĐLNN chỉ giá 1kg thịt lợn (đồng)
µ là giá trung bình trên đám đông (đồng)
Trang 16Vậy bác bỏ H , nhận H =>Đủ bằng chứng kết luận giá hiện tại cao hơn so với ₀ ₁tháng trước.
Bài 4.37 Kiểm tra 9 ngày liên tiếp lượng thịt lợn không qua kiểm dịch bán
thể nói rằng lượng thịt lợn không qua kiểm dịch trung bình được bán tại chợ nhiều hơn 1 tạ hay không? Biết lượng thịt lợn không qua kiểm dịch được bán tại chợ là một ĐLNN phân phối theo quy luật chuẩn
Ta muốn kiểm định giả thuyết:
Với mức ý nghĩa α=0.1
Phương sai mẫu: (S’)²= (0,1)²=0,01 tạ²
Phương sai mẫu hiệu chỉnh:
Trang 17Vì t= > t5,66 0.1,8=1,397, ta b c b gi thuy t tá ỏ ả ế 0.1,8=1,397, ta bác bỏ giả thuyết H Có₀
đủ bằng chứng thống kê ở mức ý nghĩa 0.1 để kết luận rằng lượng thịt lợn không qua kiểm dịch trung bình được bán tại chợ nhiều hơn 1 tạ
Gọi là ĐLNN chỉ tuổi thọ của người dân ở các làng nghề
Miền bác bỏ: W = {u : |u| > α u0.025❑ } W = {u : |u| > α 1.96}
Từ bảng giá trị, ta tính tuổi thọ trung bình của mẫu 100 người ở các làng nghề:
x=Σ(x i , fⅈ)
n =1 0+50 24+ ∗57.5 36+ ∗62.5+20∗675+10∗80
Trang 18Vậy với mức ý nghĩa 0,05, tác giả của bài báo cáo đã đánh giá vấn đề trầmtrọng hơn sự thật.
Gọi X là ĐLNN chỉ tuổi thọ của sản phẩm
µ là tuổi thọ trung bình của sản phẩm trên đám đông
Trang 19Vậy với mức ý nghĩa 0,05, ý kiến cho rằng tuổi thọ trung bình của một loại sản phẩm theo thiết kế là 5 năm là sai.
2 Kiểm định giả thuyết về tỉ lệ của đám đông
Bài 4.40 Tỉ lệ sản phẩm hai loại của một nhà máy theo quy định là 10% Kiểm tra ngẫu
nhiên 100 sản phẩm của nhà máy thấy có 18 sản phẩm loại hai Với mức ý nghĩa 0,05 hãycho kết luận xem tỉ lệ quy định trên có còn phù hợp hay không
Gọi p là ĐLNN chỉ tuổi thọ của người dân ở các làng nghề
f là tuổi thọ trung bình của người dân ở các làng nghề trên mẫu
Trang 20Bài 4.41 Theo báo cáo của một tỉnh thì 6% số người bị nhiễm chất độc màu da cam được
hưởng trợ cấp của nhà nước Nghi ngờ tỉ lệ báo cáo trên cao hơn so với thực tế Điều tra ngẫu nhiên 200 người thì thấy có 10 người được hưởng trợ cấp của nhà nước Với mức ý nghĩa 1% hãy cho kết luận về điều nghi ngờ trên
Gọi p là tỉ lệ người nhiễm chất độc màu da cam đưởng hưởng trợ cấp của nhà nước trên đám đông
f là tỉ lệ người nhiễm chất độc màu da cam được hưởng trợ cấp của nhà nước trên mẫu
≈−0,6
< uα
Vậy với mức ý nghĩa 0,01 điều nghi ngờ trên là sai
Bài 4.42 Theo báo cáo của cơ quan vệ sinh dịch tễ thì 20% cơ sở sản xuất nước khoáng
không đảm bảo chất lượng sản phẩm Có ý kiến cho rằng tỉ lệ trên thấp hơn so với thực
tế Kiểm tra ngẫu nhiên 100 cơ sở sản xuất nước khoáng thì thấy có 30 cơ sở chưa đảm bảo chất lượng sản phẩm Với mức ý nghĩa 5% hãy kết luận xem ý kiến trên có xác đáng hay không ?
Gọi p là tỉ lệ cơ sở sản xuất nước khoáng không đảm bảo chất lượng sản phẩm trên đám đông
f là tỉ lệ cơ sở sản xuất nước khoáng không đảm bảo chất lượng sản phẩm trên mẫu
Trang 21Bài 4.43 Theo báo cáo của cơ quan y tế thì sau khi cai nghiện ma túy có tới 95% số
người tái nghiện Để kiểm tra lại, người ta theo dõi 250 người sau khi cai nghiện thấy có
238 người tái nghiện Với mức ý nghĩa 0,05 có thể nói con số trong báo cáo trên là hợp lí hay không ?
Gọi p là tỉ lệ người tái nghiện trên đám đông
f là tỉ lệ người tái nghiện trên mẫu
Trang 22Vì α khá bé, theo nguyên lý xác nhỏ ta có miền bác bỏ W = {u : u > u }α tn tn α
Bài 4.44 Điều tra 300 học sinh phổ thông trung học ở Hà Nội thấy có 66 em bị cận thị
Với mức ý nghĩa 1% có thể nói rằng tỉ lệ học sinh phổ thông trung học cơ sở ở Hà Nội bị cận thị nhỏ hơn 25% hay không?
Gọi p là tỉ lệ học sinh phổ thông trung học cơ sở ở Hà Nội bị cận thị trên đám đông
f là tỉ lệ học sinh phổ thông trung học cơ sở ở Hà Nội bị cận thị trên mẫu
=> Với mức ý nghĩa 1%, có thể nói rằng tỉ lệ học sinh phổ thông trung học cơ
sở ở Hà Nội bị cận thị lớn hơn hoặc bằng 25%
H 0 : p=p 0 (=25%)
H 1 : p<p 0
Trang 23Bài 4.45 Tỉ lệ sản phẩm loại II của một lô hàng theo thông báo là 15% Nghi ngờ
tỉ lệ này có khả năng cao hơn Kiểm tra ngẫu nhiên 100 sản phẩm thấy có 25 sản phẩm loại II Với mức ý nghĩa 0,01 hãy cho kết luận về điều nghi ngờ trênGọi p là tỉ lệ sản phẩm loại II của một lô hàng theo thông báo trên đám đông
f là tỉ lệ sản phẩm loại II của một lô hàng theo thông báo trên mẫu
Bài 4.46 Theo báo cáo của cơ quan Y tế thì tỉ lệ người bị mắc bệnh về mắt ở một địa
phương là 8% Để kiểm tra lại, người ta điều tra ngẫu nhiên 250 người ở địa phương nóitrên và thấy có 22 người mắc bệnh về mắt Với mức ý nghĩa 1% có thể nói con số đưa racủa cơ quan Y tế là chính xác hay không?
Gọi p là tỉ lệ người mắc bệnh về mắt trên đám đông
f là tỉ lệ người mắc bệnh về mắt trên mẫu
Trang 24XDTCKĐ: U=
f −p 0
√p 0 q 0 n
Bài 4.47 Điều tra 150 hộ dân ở một địa phương thấy có 18 hộ thuộc diện nghèo Với mức
ý nghĩa 0,05 có thể nói tỉ lệ hộ nghèo ở địa phương nói trên là lớn hơn 10% hay không?Gọi p là tỉ lệ hộ dân thuộc diện hộ nghèo trên đám đông
f là tỉ lệ dân thuộc diện hộ nghèo trên mẫu
diện hộ nghèo lớn hơn 10%
H1: p>p0
Trang 25BÀI TẬP BỔ SUNG
Bài 1 Một nghiên cứu mới đây công bố tuổi kết hôn lần đầu nữ ở một địa phương là 19
tuổi với độ lệch tiêu chuẩn là 1,1 tuổi Nghi ngờ kết quả của nghiên cứu này, một cuộc điều tra được tiến hành với cỡ mẫu là 7584 người Theo đó, tính tuổi kết hôn lần đầu của
nữ là 19,6 trên toàn mẫu Với mức ý nghĩa là 5%, hãy kiểm định giả thuyết trên giải bài tập
Gọi X là ĐLNN chỉ tuổi kết hôn lần đầu ở nữ (tuổi)
µ là tuổi kết hôn lần đầu của nữ trên đám đông (tuổi)
Wα={u ;|u |>u }tn tn α/2
Trang 26Bài 2: Thời gian chờ trả buồng của khách sạn M trung bình là 10,73 phút với độ lệch tiêu
chuẩn là 5,8 phút Gần đây, trong một nỗ lực làm giảm thời gian chờ đợi, khách sạn đã sửdụng thử nghiệm một hệ thống thanh toán mới Một mẫu ngẫu nhiên với 100 khách hàng
sử dụng hệ thống thanh toán mới này được chọn ra Thời gian chờ trả buồng trung bình của họ được tính là 9,52 phút, với mức ý nghĩa 0,05, liệu có thê chứng minh rằng, thời gian chờ đợi trung bình để trả phòng của khách ở khách sạn là nhỏ hơn 10,73 phút hay không
Gọi Gọi X là ĐLNN chỉ thời gian chờ đợi để trả phòng của khách (phút)
µ là chỉ thời gian chờ đợi để trả phòng của khách trên đám đông (phút)
Wα={u :u <-utn tn α}, Ta có α=0,05 nên Wα={u :u <-utn tn 0,05}= {utn:u <-1,65}tn
u =tn 9,52 10,73−
5,8/ √100 =-2,086<-1,65 => utn W => Bác bỏ Hα 0
Vậy với mức ý nghĩa α=0,05 ta kết luận được thời gian chờ đợi trung bình để trả phòng của khách ở khách sạn là nhỏ hơn 10,73 phút
Trang 27Baì 3
Trang 28Bài 4