Có rất nhiều nguyên nhân để dẫn đến vấn đề các sinh viên đi học muộn và nó đã trở thành thói quen rất xấu trong xã hội.Vì vậy nhóm chúng em đã chọn đề tài “ Tỷ lệ sinh viên TMU đi học mu
Trang 1Trường Đại Học Thương Mại
Viện Đào Tạo Quốc tế
-*** -Tiểu Luận Môn Học: Lý thuyết xác suất và thống kê toán
Đề Tài:
“Tỷ lệ sinh viên trường Đại học Thương Mại đi học muộn”
HÀ NỘI 2024
Trang 3BẢNG PHÂN CÔNG NHIỆM VỤ
STT Họ và tên Nhiệm vụ bài thảo luận Mức độ hoàn thành
1 Nguyễn Thị Minh Phương
Thực hiện phần cơ sở lý thuyết, chỉnh sửa word, thực hiện khảo sát
A+
Thực hiện phần xử lý số liệu, làm Powerpoint, thực hiện khảo sát
B
Thực hiện phần tính toán ước lượng kiểm định, thực hiện khảo sát
A+
4 Mai Thị Như Quỳnh
Phân công nhiệm vụ cho thành viên, thực hiện phần tính toán ước lượng kiểm định, thực hiện khảo sát
A+
5 Hà Thị Thanh Tâm
Thực hiện phần xử lý số liệu, thuyết trình, thực hiện khảo sát
A
6 Dương Hoài Thương
Thực hiện phần xử lý số liệu, làm Powerpoint, thực hiện khảo sát
A
7 Lê Thị Hoài Thương
Thực hiện phần xử lý số liệu, thuyết trình, thực hiện khảo sát
A
Trang 4MỤC LỤC
Lời Mở Đầu 2
PHẦN I CƠ SỞ LÝ THUYẾT 3
1 Ước lượng kỳ vọng toán của ĐLNN 3
2 Kiểm định giả thuyết về tỷ lệ đám đông 6
PHẦN II XỬ LÍ SỐ LIỆU: 9
PHẦN III BÀI TẬP 14
Trang 5Lời Mở Đầu
Trong đời sống hiện nay có rất nhiều các vấn đề xã hội được quan tâm rất nhiều và việc đi trễ là vấn đề được quan tâm nhiều Cụ thể là vấn đề các sinh viên đi học muộn ở các trường đại học hiện nay nó ngày càng được phổ biến đến mức báo động Có rất nhiều nguyên nhân
để dẫn đến vấn đề các sinh viên đi học muộn và nó đã trở thành thói quen rất xấu trong xã hội.Vì vậy nhóm chúng em đã chọn đề tài “ Tỷ lệ sinh viên TMU đi học muộn” để hoàn thành bài tập lớn “ Lý thuyết xác suất thống kê”
Bài thảo luận này được xây dựng dựa trên: giáo trình lý thuyết xác suất và thống kê của trường đại học Thương Mại với những kiến thức đã được tiếp thu từ các bài giảng của giảng viên trường đại học Thương Mại
Chúng em xin gửi lời cảm ơn tới Ths Nguyễn Đức Minh người đã tận tình hướng dẫn, chỉ bảo chúng em trong suốt quá trình tìm hiểu, nghiên cứu và hoàn thiện bài tập lớn Kính chúc
cô luôn mạnh khỏe, hạnh phúc và gặt hái được nhiều thành công trong cuộc sống
Do thời gian, điều kiện và khả năng có hạn, bài thảo luận nhóm chúng tôi không tránh khỏi những khiếm khuyết Chúng tôi rất mong nhận được sự cảm thông, chia sẻ và góp ý
từ phía các giảng viên, các bạn sinh viên và những ai quan tâm để bài thảo luận nhóm được hoàn thiện hơn!
Tập thể nhóm 8!
Trang 6PHẦN I CƠ SỞ LÝ THUYẾT
1 Ước lượng kỳ vọng toán của ĐLNN
Giả sử một đám đông ĐLNN có E(x)= và Var(x)= 2 Trong đó chưa biết , cần phải ước lượng Từ đám đông ta lấy mẫu này ta tìm được trung bình mẫu X và phương sai mẫu điều chỉnh S’ Dựa vào những đặc trưng này ta sẽ xây dựng thống kê G thích hợp Có 3 trường 2
hợp cần xét:
Trường hớp 1: ĐLNN X phân phối theo quy luật chuẩn, 2 đã biết
Trường hợp 2: ĐLNN gốc X phân phối theo quy luật chuẩn, phương sai chưa biết 2
Trường hợp 3: Chưa biết quy luật phân phối xác suất của X trên đám đông, nhưng kích
thước mẫu n>30
Theo yêu cầu thảo luận sau đây chúng ta sét trường hợp 3
Vì W=X1,X ,…,X2 n là ngẫu nhiên và n khá lớn, theo định lý giới hạn trung tâm thì X có phân phối xấp xỉ chuẩn: X= ( , /n)2
U=X − ¿
(U có phân phối chuẩn xấp xỉ chuẩn hoá) Khi đó ta có thể tìm được phân vị u /2 sao cho:
P(|U| < u )/2 ¿ 1- (2) Thay biểu thức U ở (1) vào (2) và biến đổi ta được:
P(¿ < ❑
P(X- < <X+ )≈1- (4)
Từ (4) ta có độ tin cậy của ước lượng là 1
Khoảng tin cậy đối xứng của là:
Trang 7(X - ; X + ) (6)
Độ dài của khoảng tin cậy là 2
Sai số của ước lượng là , được tính bằng công thức (5)
Từ đó ta có sai số của ước lượng bằng một nửa độ dài của khoảng tin cậy Vì vậy nếu biết khoảng tin cậy đối xứng (a,b) thì sai số được tính theo công thức:
b−a
Chú ý: Từ biểu thức trên ta thấy:
Nếu giữ nguyên kích thước mẫu n và giảm số thì u cũng giảm, có nghĩa là giảm độ tin /2
cậy Ngược lại nếu giữ kích thước mẫu n không đổi và tăng độ tin cậy 1 thì sẽ làm tăng u /2
dẫn đến sai số cũng tăng theo
Tương tự như vậy nếu giữ nguyên sai số đồng thời giamr kích thước mẫu n thì u cũng /2
giảm, tức là độ tin cậy giảm Nếu giữ nguyên độ tin cậy 1 và tăng kích thước mẫu n thì sai số giảm
VD: Giả sử đường kính của một loại chi tiết máy là một ĐLNN phân phối chuẩn với độ lệch tiêu chuẩn = 1cm Lấy ngẫu nhiên một mẫu gồm 25 chi tiết và tính được đường kính trung bình của một chi tiết là 10cm
a) Với độ tin cậy 95% hãy ước lượng đường kính trung bình của loại chi tiết máy đó b) Để dảm bảo khi ước lượng đạt độ tin cậy 99% và sai số không vượt quá 0,2cm thì cần điều tra một mẫu gồm bao nhiêu chi tiết?
Giải
a) Gọi X là đường kính của chi tiết máy
Gọi X là đường kính trung bình của các chi tiết trên mẫu
Gọi là đường kính trung bình của các chi tiết trên đám đông
Vì theo giả thiết, X có phân phối chuẩn nên ĐLNN trung bình mẫu X cũng có phân phối chuẩn: X N ( 2/n) Vì vậy
U=X − ¿❑
√n
¿
N (0,1)
Ta tìm được u sao cho
P(|U|<u
Trang 8)=1-Thay biểu thức của U vào công thức trên và biến đổi ta có
P(¿<❑
√n u ) = 1-P(X - X + )=
√n u (*)
Vì độ tin cậy 1- nên u =u0,025=1,96 Theo giả thiết n=25, từ (*) ta có
= √125.1,96=0,392 Theo đầu bài ra ta có X= 10, vậy với độ tin cậy 0,95 ta có khoảng tin cậy cụ thể của là (10-0,392; 10+0,392) hay (9,608; 10,392) (đơn vị là cm)
b) Theo câu a từ (*) ta có n = ❑ ❑2 2
❑2
Vì độ tin cậy theo yêu cầu là 1- =0,99 nên Tra bảng ta có u0,005=2,58 Từ đó ta
có n= 1
¿
0,22= 166,41
Vậy để bảo đảm khi ước lượng đạt độ tin cậy 99% và sai số không vượt quá 0,2 thì cần điều tra một mẫu gồm ít nhất 167 chỉ tiêu
2 Kiểm định giả thuyết về tỷ lệ đám đông
Xét một đám đông kích thước N, trong đó có M phần tử mang dấu hiệu A Khi đó P(A)=MN
=p là tỷ lệ phần tử mang dấu hiệu A trên đám đông Từ một cơ sở nào đó người ta tìm được p=p0 nhưng nghi ngờ về điều này Với mức ý nghĩa ta cần kiểm định giả thuyết H : p=p0 0.
Để kiểm định giả thuyết trên , từ đám đông ta lấy ra một mẫu kích thước n Gọi f là tỷ lệ phần tử mang dấu hiệu A trên mẫu Theo quy luật phân phối xác suất của tần suất mẫu, khi n khá lớn thì f≅N(p,pqn ¿ Ta xây dựng tiêu chuẩn kiểm định:
U=
f −p 0
√poqo n , trong đó q = 1-po o
Nếu H đúng thì U = N(0,1)0
Với khá bé, theo nguyên lý xác suất nhỏ và tuỳ thuộc vào từng đối thuyết H1 ta có miền bác bỏ W như sau:
Trang 9Loại giả
thuyết
2 Phía p = po p ≠ po P(|U| > u )= W = { U : tn |Utn| > U 2
Phải p = po p ¿ po P(U > u )= W = {U : U > U }tn tn
Trái p = po p ¿ po P(U < -u ) = W = {U : U < -U }tn
Trường hợp 1: {Ho: p=po
H 1 : p≠ po
Với mức ý nghĩa cho trước ta tìm được U sao cho P(|U| > U ) =
Vì khá bé, theo nguyên lý xác suất nhỏ ta có miền bác bỏ:
W = { U : tn |Utn| > U 2 } VD: Một máy tự động đóng gói đường với trọng lượng quy định là 500 gam/gói Giả sử trọng lượng các gói đường do máy đóng là một ĐLNN phân phối chuẩn với độ lệch chuẩn là = 5 gam Lấy ngẫu nhiên 16 gói do máy đóng và tính được trọng lượng trung bình của mỗi gói là 497 gam Với mức ý nghĩa = 5% hãy cho kết luận về ý kiến cho rằng máy có sự cố
đã làm thay đổi trọng lượng trung bình của gói đường so với trọng lượng quy định Giải:
Gọi X là trọng lượng của gói đường do máy đóng
Gọi X là trọng lượng trung bình gói đường trên mẫu
Gọi là trọng lượng trung bình gói đường trên đám đông
Vì X có phân phối chuẩn nên X N( ❑2
n) Với mức ý nghĩa = 0.05 cần kiểm định {Ho p: = po (¿500)
H 1 : p ≠ po XDTCKĐ: U=X−o
√n Nếu H đúng thì U 0 N(0,1) Ta tìm được u sao cho P(|U| > u )= Vì khá bé, theo nguyên lý xác suất nhỏ ta có miền bác bỏ:
W = { U : tn |Utn| > U 2 }
Ta có u = u0,025 = 1,96
Trang 10utn = x−o√n = 497 5005 /−√16 = -2,4 => utn W => bác bỏ H o
Kết luận: Với mức ý nghĩa 5% ta có thể nói rằng máy có sự cố đã làm thay đổi trọng lượng trung bình của gói đường so với trọng lượng quy định
Trường hợp 2: {Ho: p=po
H 1 : p> po Với mức ý nghĩa cho trước ta tìm được U sao cho P(U > u ) = Lập luận như trong trường hợp 1 ta thu được miền bác bỏ W = {U : U > U }tn
VD: Theo quy định, 1kg đỗ đem ủ giá thu được 5kg giá Có ý kiến cho rằng: lượng giá thu được từ một kg đỗ có khả năng cao hơn Để kiểm tra lại, người ta đem 9kg đỗ ủ riêng từng
kg và tính được lượng giá trung bình thu được từ 1kg đỗ là 5,1kg Giả sử lượng giá thu được
từ 1kg đỗ phân phối theo quy luật chuẩn với = 0,4kg Với mức ý nghĩa = 0,05 hãy cho ý kiến về điều nghi ngờ trên
Giải
Gọi X là lượng giá thu được từ 1kg đỗ
Gọi X là lượng giá trung bình thu được từ 1 kg đỗ trên mẫu
Gọi là lượng giá trung bình thu được từ 1kg đỗ trên đám đông
Vì X phân phối chuẩn nên X N( ,❑2
n) Với mức ý nghĩa = 0,05 cần kiểm định {Ho: p= po (¿5)
H 1 : p> po
XDTCKĐ: : U=X−o√n Nếu H đúng thì Uo N(0,1) Ta tìm được u sao cho P(U > u )= Vì khá bé, theo nguyên lý xác suất nhỏ ta có Miền bác bỏ
W = {U : U > U }tn tn
Ta có u = u0,05 = 1,65
utn = 5,1 5,0−
o , 4 /√25 = 1,25 < 1,64 => utn W
Chưa có cơ sơ bác bỏ Ho
Kết luận: Với mức ý nghĩa 0,05 ta có thể nói rằng lượng giá trung bình thu được từ 1kg đỗ
là 5kg
Trang 11Trường hợp 3: {Ho: p=po
H 1 : p< po Với cho trước ta xác định được U sao cho: P( U < -u ) =
Vì khá bé, theo nguyên lý xác suất nhỏ ta có miền bác bỏ:
W = {U : U < -U }tn
VD: Định mức cho một công nhân là 5,5 sản phẩm / giờ lao động Có ý kiến cho rằng định mức trên là cao Để kiểm tra lại, người ta theo dõi 36 công nhân làm công việc đó và tính được năng suất lao động trung bình là 5,2 sản phẩm/giờ lao động Với mức ý nghĩa α=0.01 hãy cho kết luận về vấn đề trên.Biết năng suất lao động của công nhân trong 1 giờ lao động
là một ĐLNN phân phối chuẩn với độ lệch tiêu chuẩn là 0.4 sản phẩm
Giải
Gọi X là năng suất lao động của một công nhân trong một giờ lao động
Gọi X là năng suất lao động trung bình của một công nhân trong một giờ lao động trên mẫu
Gọi μlà năng suất lao động trung bình của một công nhân trong một giờ lao động trên đám đông
Vì X có phân phối chuẩn nên X N¿)
Với mức ý nghĩa = 0,01 cần kiểm định {Ho: μ=μ0(¿5,5)
H 1 :μ <μ0
XDTCKĐ: : U=X−o√n Nếu H đúng thì Uo N(0,1) Ta tìm được u sao cho P(U <-u )= Vì khá bé, theo nguyên lý xác suất nhỏ ta có Miền bác bỏ
W = {U : U <- U }tn tn
Ta có u = u0,01 = 2,33
u = tn
5,2 5,5−
o , 4 /√36 = -4,5 <-2,33 => utn ∈ W
nên ta bác bỏ H0
Kết luận: Với mức ý nghĩa 0,01 ta có thể nói rằng năng xuất lao động trung bình thấp hơn
5,5 sản phẩm /giờ lao động, tức định mức trên là cao so với thực tế
Trang 12PHẦN II XỬ LÍ SỐ LIỆU:
I Cách lấy mẫu
- Với đề tài Khảo sát thói quen đi học muộn của sinh viên trường Đại học Thương mại, vì số lượng mẫu quá lớn, nhóm đã chọn ngẫu nhiên 110 sinh viên của trường để khảo sát Trong nhóm sử dụng phương pháp lấy mẫu sau:
+ Trực tiếp khảo sát sinh viên của trường thông qua Bảng câu hỏi
II Bảng câu hỏi
1.Giới tính của bạn? 7.Bạn thường đi học muộn vào những ca
nào?
2.Hiện tại bạn đang là sinh viên năm mấy? 8.Lý do khách quan dẫn đến bạn đi học
muộn?
3.Số ca bạn học trong một tuần? 9.Lý do chủ quan dẫn đến việc bạn đi học
muộn?
4.Bạn đã từng đi học muộn chưa? 10.Bạn thường đến muộn bao nhiêu phút? 5.Trong năm học vừa qua bạn đã từng đi
học muộn bao nhiêu lần?
11.Bạn cảm thấy như thế nào về việc đi học muộn?
6.Bạn hãy tự đánh giá mức độ đi học
muộn của bạn ?
III Kết quả thu được
Sau 1 tuần thu thập dữ liệu, nhóm đã thu được kết quả như sau:
1 Giới tính của bạn?
2 Hiện tại bạn đang là sinh viên năm mấy?
Trang 13Năm 2 45 41
3 Số ca bạn học trong một tuần?
4 Bạn đã từng đi học muộn chưa?
Số sinh viên Tần suất (%)
8,2%
91,8%
tỉ lệ sinh viên đã từng đi học muộn
Chưa từng
Đã từng
Nhận xét: Theo dữ liệu thu thập được từ việc khảo sát ngẫu nhiên 110 sinh viên
trường Đại học Thương Mại cho thấy: tỉ lệ sinh viên đã từng đi học muộn chiếm tỉ
Trang 14trọng rất cao ( 91,8%) so với tỉ lệ sinh viên chưa từng đi học muộn (8,2%) Nguyên nhân dẫn đến sự chênh lệch cao này đến từ nhiều yếu tố khách quan và chủ quan như tắc đường, nhà xa, xe hỏng hay ngủ quên, giáo viên không điểm danh (điểm danh muộn)
5 Trong năm vừa qua bạn đã từng đi học muộn bao nhiêu lần?
Số lần đi học
muộn
0-2 2-4 4-6 6-8 8-10
Số sinh viên 40 21 21 11 17
6 Bạn thường đi học muộn vào những ca nào?
Ca học Số sinh viên Tần suất (%)
Trang 15Ca 1 Ca 2 Ca 3 Ca 4
0
10
20
30
40
50
60
70
80
90
Tần suất sinh viên đi học muộn theo ca học
Tần suất
Nhận xét: Theo như biểu đồ, ta có thể thấy với ca học đầu tiên, tỉ lệ sinh viên đi học
muộn chiếm tỉ trọng cao nhất là 80,9% Tiếp đó là ca học số 2, với số sinh viên đi học muộn không đáng kể nhưng vẫn chiếm số % cao thứ hai trong biểu đồ là 15,5% Cuối cùng là ca học 3 và 4, tỉ lệ sinh viên đi học muộn rất thấp, riêng với ca học số 4 thì không có số sinh viên đi học muộn Nguyên nhân có thể do thói quen sinh hoạt thường xuyên thức khuya của sinh viên và một phần do giờ học ca đầu khá sớm
7 Bạn thường đi muộn bao nhiêu phút?
Thời gian đi muộn
(phút) Số sinh viên Tần suất (%)
Trang 16Nhận xét: Theo như số liệu đã thống kê của 110 sinh viên trường Đại học Thương
Mại, ta có thể thấy số học sinh đi học muộn dưới 10 phút chiếm tỉ lệ cao nhất lên đến 61% số sinh viên, trong đó số học sinh đi muộn trong khoảng thời gian từ 15-20 trở lên chỉ chiểm tổng 11% trên tổng số 110 sinh viên
PHẦN III BÀI TẬP
1 BT1: Điều tra ngẫu nhiên 110 sinh viên trường Đại học Thương Mại thấy có 101 sinh viên đã từng đi học muộn Với độ tin cậy 95% hãy ước lượng tỉ lệ sinh viên từng đi học muộn trong toàn trường.
Giải
Gọi f là tỷ lệ sinh viên trường Đại học Thương Mại đã từng đi học muộn trên mẫu Gọi p là tỷ lệ sinh viên trường Đại học Thương Mại đã từng đi học muộn trên đám đông
Vì n=110 khá lớn nên f có phân phối xấp xỉ chuẩn:
Trang 17f ≅ N(p,pq
n ¿⇒ : U =
f − p0
√p0.q0
n
≅ N(0,1)
Ta tìm được µα sao cho P(|U| < uα) = 1 – α = γ
Thay biểu thức của U vào công thức trên và biến đổi tương đương ta có:
P¿)≈1-α⇔P (f −ε< p<f +ε )≈ 1−α
Trong đó ε=√pq
n uα/ 2
Vì p chưa biết, n lớn nên ta lấy p ≈f = 101110=0,918; q≈1 – f = 0,082
Mặt khác ta có 1 – α = 0,95 ⇒α /2 = 0,025, tra bảng ta có u0,025 = 1,96 nên
ε ≈√0,918.0,082
110 .1,96 0,026.1,96 0,0513= =
Thay số vào ta có
0,918 – 0,0513 < p < 0,918 + 0,0513 hay 0,8667 < p < 0,9693
Kết luận: Với độ tin cậy 95% ta có thể nói rằng tỷ lệ sinh viên trường Đại học Thương Mại
đã từng đi học muộn nằm trong khoảng (0,8667 ; 0,9693)
2 BT2: Phỏng vấn ngẫu nhiên 110 sinh viên trường Đại học Thương Mại về số lần
đi học muộn trong một năm vừa qua được kết quả (đơn vị lần):
Số lần đi
Với độ tin cậy 95%, hãy ước lượng số lần đi học muộn trung bình của một sinh viên trường Đại học Thương Mại trong một năm.
Giải
Đây là bài toán Ước lượng kì vọng khi X phân phối chuẩn và ❑2 chưa biết
Gọi X là số lần đi học muộn của sinh viên trường DHTM
Gọi X là số lần đi học muộn trung bình của sinh viên trường DHTM trong một nămtrên mẫu Gọi µ là số lần đi học muộn trung bình của sinh viên trường DHTM trong một năm trên đám đông
Trang 18Theo bài ra ta có X N(µ ,❑2) thì X N(µ,❑2
n ) Xét thống kê U=X−µ❑0
√n
T(n −1 )
Tính phân vị uα sao cho P (|U|<uα) = 1 – α Thay U và biến đổi ta có:
P(X−❑
√n α<µ<X +❑
√n α)=1−α
Từ giả thiết ta tính được: x=3,98 ; s'=√0,854
n=110>30 ⇒≈ s';α
2=0,025⇒ uα=u0,025=1,96 Vậy khoảng tin cậy đối xứng cụ thể của µ là (3,98 1,96.− √0,854
√110 ; 3,98 1,96.+ √0,854
√110 ) hay (3,807 ; 4,152)
Kết luận: Với độ tin cậy 95% thì có thể nói số lần đi học muộn của sinh viên trường Đại
học Thương Mại trong 1 năm nằm trong khoảng từ 3,807 đến 4,152
3 BT3: Một báo cáo cho biết khi điều tra về tỷ lệ đi học muộn của sinh viên trường Đại học Thương Mại thì có khoảng 90% số sinh viên đi học muộn Có ý kiến cho rằng tỉ lệ trong báo cáo trên thấp hơn so với thực tế Để kiểm tra, điều tra ngẫu nhiên 110 sinh viên trường Đại học Thương Mại thu được kết quả 101 sinh viên
đã từng đi học muộn Với mức ý nghĩa 5%, kết luận lại vấn đề trên Biết số sinh viên từng đi học muộn là một ĐLNN phân phối chuẩn.
Giải
Kiểm định tỷ lệ
Gọi f là tỷ lệ sinh viên trường DHTM đi học muộn trên mẫu
Gọi p là tỷ lệ sinh viên trường DHTM đi học muộn trên đám đông
Vì n=110 khá lớn nên f ≅ N(p,pq
n ¿. Với mức ý nghĩa α = 0,05 cần kiểm định: {H0: µ µ= 0(¿0,05)
H 1: µ<µ0
XDTCKD: U =
f − p0
√p0.q0
n
Nếu H0 đúng thì U ≅ N(0,1) Ta tìm được phân vị chuẩn uα