Tính tỉ lệ nữ có mức lương cao hơn mức lương trung bình.... Tính giá trị trung bình mức lương khởi điểm của tập S1, S2.. Phân I: Trong một khảo sát mức lương khởi điểm của sinh viên vừa
Trang 1TONG LIEN DOAN LAO DONG VIET NAM
TRƯỜNG ĐẠI HỌC TỒN ĐỨC THẮNG
KHOA CÔNG NGHỆ THÔNG TIN
rat BAO CAO CUOI KY MON XAC SUAT THONG KE UNG DUNG CHO CONG NGHE THONG TIN
BAO CAO CUOI KY
Người hướng dân: TS NGUYÊN THỊ HUỲNH TRÂM Người thực hiện: VÕ VĂN SÁNG — 52200132
Lớp : 22050201 Khoá : 26
THÀNH PHÓ HỖ CHÍ MINH, NAM 2023
Trang 2TONG LIEN DOAN LAO DONG VIET NAM
TRUONG DAI HQC TON BUC THANG
KHOA CONG NGHE THONG TIN
rat
BAO CAO CUOI KY MON XAC SUAT THONG KE UNG DUNG CHO CONG NGHE THONG TIN
BAO CAO CUOI KY
Người hướng dân: TS NGUYÊN THỊ HUỲNH TRÂM Người thực hiện: VÕ VĂN SÁNG — 52200132
Lớp : 22050201 Khoá : 26
THÀNH PHÓ HỖ CHÍ MINH, NAM 2023
Trang 3LOI CAM ON
Em xin cám ơn TS Nguyễn Thị Huynh Trâm đã hướng dẫn em trong quá trình
học tập.
Trang 4ĐÔ ÁN ĐƯỢC HOÀN THÀNH _
TAI TRUONG DAI HOC TON DUC THANG
Tôi xin cam đoan đây là sản phẩm đồ án của riêng tôi và được sự hướng dẫn của
TS Nguyễn Thị Huỳnh Trâm Các nội dung nghiên cứu, kết quả trong đề tài này là trung thực và chưa công bố đưới bất kỳ hình thức nào trước đây Những số liệu trong các bảng biểu phục vụ cho việc phân tích, nhận xét, đánh giá được chính tác giả thu
thập từ các nguồn khác nhau có ghi rõ trong phần tài liệu tham khảo
Ngoài ra, trong đồ án còn sử dụng một số nhận xét, đánh giá cũng như số liệu của các tác giả khác, cơ quan tô chức khác đều có trích dẫn và chú thích nguồn gốc
Nếu phát hiện có bất kỳ sự gian lận nào tôi xin hoàn toàn chịu trách nhiệm
về nội dung đồ án của mình Trường đại học Tôn Đức Thắng không liên quan đến những vi phạm tác quyền, bản quyền do tôi gây ra trong quá trình thực hiện (nếu có)
TP Hỗ Chí Minh, ngày thủng năm
Tác giả (ký tên và ghi rõ họ tên)
V6 Van Sang
Trang 51H
PHAN XAC NHAN VA DANH GIA CUA GIANG VIEN
Phần xác nhận của GV hướng dan
Tp Hồ Chí Minh ngày tháng năm
(kí và ghi họ tên)
Phần đánh giá của GV chấm bài
Tp Hồ Chí Minh ngày tháng năm
(kí và ghi họ tên)
Trang 6TOM TAT
Ứng dụng những kiến thức trong suốt quá trình học đề có thê ứng dụng và giải cac bai tap
Trang 7
MUC LUC
PHAN XAC NHẬN VÀ ĐÁNH GIÁ CỦA GIẢNG VIÊN ccs-cee iii
2 Tính tỉ lệ nữ có mức lương cao hơn mức lương trung bình 3
3 Tính tỉ lệ nam có mức lương cao hơn mức lương trung bình 3
4 — Xác suất 4
5 Gọi S1 là mẫu gồm 30 sinh viên và tập S2 là mẫu gồm 15 sinh viên
Có bao nhiêu cách lấy I tập mẫu S1? Có bao nhiêu cách lấy Í tập mẫu S2?5
6 Diễn giải chỉ tiết phương pháp lấy ngẫu nhiên tập S1, S2 bằng cách
chụp màn hình kết quả làm mình chứng 5
7 Tính giá trị trung bình mức lương khởi điểm của tập S1, S2 Bạn có kết luận gì về các giá trị này so với giá trị trung bình của tông thể 5
8 Ước lượng khoảng tin cậy Biết ø=36.40666432 -ccssc 6
9, Kiểm định giả thuyết khi biết ơ cho tập mẫu SI - 7
10 Hãy thực hiện lại các bước tính toán theo yêu cầu trong câu 8, 9 9 Phan III: il
11 Giả sử rằng sau mỗi Í năm làm việc, tiền lương của mỗi người sẽ
Trang 8Phân I:
Trong một khảo sát mức lương khởi điểm của sinh viên vừa ra trường của một lớp học gồm 65 sinh viên, kết quả được đánh số thứ tự như bảng sau Đơn vị của mức lương là X00,000 đồng (Ví dụ 27 tức là 2,700,000 VNĐ) Giới tính: W là nữ, M là nam
Tiên lương 27 61 52 69 88 85 79 99 77 165 STT 11 12 13 14 15 16 17 18 19 20
Tién luong 41 83 144 74 143 | 131 34 59 46 105
STT 21 22 23 24 25 26 27 28 29 30
Giới tính M Ww W Ww M M W M M Ww Tiên lương 61 118 | 114 | 138 24 67 130 56 99 125 STT 31 32 33 34 35 36 37 38 39 40
Tién luong 87 30 119 40 25 44 123 45 25 94 STT 41 42 43 44 45 46 47 48 49 50
Tién luong 86 128 69 102 91 106 | 119 | 139 | 67 47 STT 51 52 53 54 55 56 57 58 59 60 Giới tính WwW W WwW M M M W WwW W M
Tiên lương 62 92 124 31 49 68 109 | 138 | 105 84 STT 61 62 63 64 65
Giới tính M M Ww W M
Tiên lương 86 66 128 | 146 59
1 Tính giá trị trung bình và độ lệch chuan
Trang 9Giá trị trung bình của tổng thẻ (1):
N
xi
=1 _27+61+52+ +128+146+59 =e = 85,0307692307692
Phương sai của tông thể (ơ?):
N
2
ge a lâu _ [27 ~85.0307682307692̈+ +|59—85.0307692307692)” _ 86153.93846 _
Độ lệch chuẩn (Ø):
ơ=3jg°=+J1325.445207 = 36.40666432
Kết luận: Vậy giá trị trung bình (#') bằng 85.0307692307692 (lương khởi điểm
của sinh viên vừa ra trường khoảng 8,503,000 VNĐ) và độ lệch chuân (ở) băng
36.40666432
2 Tính dỉ lệ nữ có mức lương cao hơn mức lương trung bình
Gọi W là tập chứa các sinh viên nữ Các phần tử của W là:
W= {xi, x4, x7, x10, x12, x14, x18, x22, x23, x24, x27, x30, x33, x34, x37, x41, x42, x43, x44, x47, x51, x52, x53, x57, x58, x59, x63, x64}
- n(W) = 28 (sé phan tir cua W)
Gọi w là tập chứa phần tử của các sinh viên nữ có mức lương cao hơn trung
bình Các phần tử của w là:
w= {x10, x22, x23, x24, x27, x30, x33, x37, x41, x42, x44, x47, x52, x53, x57, x58, x59, x63, x64}
- n(w)=19,
19
i lé —=0.67857142'
Vay tí lệ nữ có mức lương cao hơn mức lương trung bình là 0.678571429 (19
sinh viên trong 28 số sinh viên nữ được khảo sát)
3 Tinh đỉ lệ nam có mức lương cao hơn mức lương trung bình
Gọi M là tập chứa các sinh viên nam Các phần tử của M là:
M = {x2, x3, x5, x6, x8, x9, x11, x13, x15, x16, x17, x19, x20, x21, x25, x26,
x28, x29, x31, x32, x35, x36, x38, x39, x40, x45, x46, x48, x49, x50, x54, x55,
x56, x60, x61, x62, x65}
- n(M)=37
Gọi m là tập chứa phân tử của các sinh viên nữ có mức lương cao hơn trung
bình Các phần tử của m là:
Trang 10m = {x5, x8, x13, x15, x16, x20, x29, x31, x40, x45, x46, x48, x61}
- n(m)=13
>, 13_
Ti lệ 37 0.301351351
Vậy tỉ lệ nam có mức lương cao hơn mức lương trung bình là 0.351351351 (13
sinh viên trong 37 số sinh viên nam được khảo sát)
4 Xác suất
Ta có một nhóm nam và một nhóm nữ, biết xác xuất chọn mỗi nhóm là như
nhau
> Nhom nam ky higu la HÍ; với xác suất chọn la 5 Nhom nit ky hiệu là #2 với xác
suât chọn là 5-
a Tính xác suất chọn được người có mức lương thấp hơn mức lương trung bình
Từ câu 3 > Tỉ lệ nữ có mức lương thấp hơn trung bình là: 138 =2 Tỉ lệ
nam có mức lương thập hơn trung bình là: 1— B-5
Goi A la bién cé chon duoc mét người có mức lương thấp hơn trung bình
2x9 2x24 PIAI=Y`PIH) PlA|H)=S— (AIE3,P|H) PA|Hj=“-tˆnp =0.48503861
Kết luận: Vậy xác suất chọn được một người có mức lương thấp hơn trung
bình là 48.5%
b Tính xác suất chọn được một người có mức lương cao hơn mức lương trung bình biết rắng người đó là nam
Gợi B là biến cố chọn được một người có mức lương cao hơn trung bình
Xác suất chọn được một người có mức lương cao hơn mức lương trung bình
mà đó là nam
Trang 111
2*13
Plnvej= PP BME) _ ŸP—— =0agIiaag3
> P[H,|P[BJH,| +19 5 *13
Kết luận: Vậy xác suất chọn được một có mức lương cao hơn trung bình mà
do la nam la: 34.11%
5, Gọi SI là mẫu gồm 30 sinh viên và tập S2 là mẫu gồm lỗ sinh viên Có bao nhiêu cách lấy 1 tập mẫu SI? Có bao nhiêu cách lấy 1 tập mẫu
$2?
Sé cach lay tap mau S1=Cz=3,009, 106, 305,270,640,000
Số cách lấy tập mẫu S2=C¿=207,374,699,821,536
Kết luận: Có 3,009,106,305,270,640,000 cách lây tập mẫu S1 và
207,374,699 821,536 cách lấy tập mẫu 82
6 Diễn giải chỉ tiết phương pháp lấy ngẫu nhiên tập S1, S2 bằng cách chụp màn hình kết quá làm mình chứng
Kết quả lay duoc:
Trang 12œ
Tinh gia tri trung bình mức lương khởi điểm của tập S1, S2 Bạn có kết luận gì về các giá trị này so với giá trị trung bình của tổng thể
Giá trị trung bình S1 (Š¡):
a
»
= Sn ST ee = 82.00666667
Giá trị trung bình S2 (X;):
a
Dx,
Kết luận: Giá trị trung bình của 2 tập mẫu không bằng của tông thê mà chêch
lệch S1 chêch lệch khoảng 3 đơn vị so voi tong the S2 chéch léch khoảng 10 đơn vị so với tông thể Và khi khi dùng các giá trị của tập mẫu tính toán chỉ đưa
ra dự đoán tương đôi
xX j=
Ước lượng khoảng tin cậy Biết ơ=36.40666432
Với khoảng tin cậy 809% Ta co:
—108_ 100 ~ œ=0.2 ~ 5 =0.1 = z=1.28
> /2,/=1.28 2
Với khoảng tin cậy 95% Ta co:
100l1—ưø]_ 95 _ a_ _
— 700 100 — #=0.05 ¬› 570.025 — z=1.96
> 2, =196
2
a) Tính cho tập S1 Xi=82.066666G7,
1 Độ tin cậy 80%.
Trang 13
L,U]Ì=x+-ˆ—=Ìx+-`—,x >— ae ae al a nu nn
¿ÍB2.0666ses7— L28* 25 596848 .82.06666667+ Ha
¿(73.55861279,90.57472055) Vậy mức lương khởi điểm trung binh của sinh vừa ra trường trong khoảng 7,356,000 VNĐ đến 9,057,000 VNĐ với độ tín cậy 80%
u Dé tin cay 95%
Z„*Ø Z„*Ø Z„*Ø L,U]Ì=x+->—=Ìx+-`ˆ—,x—-*>—
¿Í 82.06666667— 1.96 *36.40666432 2,05599567 +1 S6*36 9666422
4 (69.03870916 ,95.09462418) Vậy mức lương khởi điểm trung binh của sinh vừa ra trường trong khoảng 6,904,000 VNĐ đến 9,509,000 VND voi dé tin cay 95%
b) Tính cho tập S2 X:=74.73333333,
1 Độ tin cậy 80%
Za*0 Za*0 Za*0Ø
L,U=x+-2— =Ìx—-?— s2 —
Q varagaaaag LẺB+1E 20081), ;aagasa, L2H+SE 066481
¿(62.70112814,86.76553852)
Vậy mức lương khởi điểm trung binh của sinh vừa ra trường trong khoảng 6,270,000 VNĐ đến 8,677,000 VNĐ với dé tin cay 80%
u Dé tin cay 95%
[BA U)exs ele
¿| 74.73333333— Se ,74,73333333-+ 120% 36.40666432 “ee |
¿(56.30901913, 93.15764753)
Vậy mức lương khởi điểm trung binh của sinh vừa ra trường trong khoảng 5,631,000 VNĐ đến 9,315,000 VNĐ với dé tin cay 95%
Trang 14Kết luận: Giá trị trung bình của tông thể đều nằm các khoảng tin cậy trên
9 Kiểm định giả thuyết khi biết ø cho tập mẫu SI
Ta co:
-_ Hạ=85.0307692307692 (Trung bình của tổng thé)
- 0=36.40666432(D6 léch chuẩn tông thé)
- X=é 82.06666667 (Giá trị trung binh cia tap mau S1)
pe ~„ Œ@=0.05 = z,=1.65 ¬ Z„=1.96
- _ Với mức ý nghĩa :
- Théng ké kiém dinh:
pn kaha — 82.06666667—85.0307692307692 9 445936442
Kiém dinh gia thuyét trái
H,:u>85.0307692307692
H,:u<85.0307692307692
Theo qui tắc kiểm định trải ta sẽ bac bo Hy néu2S—2,
Nhung 2=— 0.445936442>—z,=—1.65,
Không thé bac bỏ gia thuyết Hụ |u>85.0307692307692] không đủ bằng
chứng thống kê để cho rằng H, lu<85.0307692307692] đúng
Kiếm định giả thuyết phải
H,:r<85.0307692307692
H,:u>85.0307692307692
Theo qui tắc kiểm định trải ta sẽ bác bỏ Ïfo nếu Z>Z,
Nhưng Z=— 0.445936442<z, = 1.65
Không thé bac bo gia thuyết H, |¡<85.0307692307692]không đủ bằng chứng thống kê để cho rằng H,„(z>85.0307692307692) đúng
Kiếm định giả thuyết hai bên
Hy: #=85.0307692307692
H,:uz85.0307692307692
Theo qui tắc kiểm định trải ta sẽ bác bỏ Hạ nếu Z<—Z„ hoặc Z> Z
Nhưng —Z,=—1.86<z=~—0.445936442<z : =196
Không thê bác bỏ giả thuyết H, lu=85.0307692307692 không đủ bằng chứng thống kê để cho rằng H,(¡:z85.0307692307692) đúng
Trang 15Kết luận: Kiểm định giả thuyết đúng với thực tế, còn kiểm định gia thuyết trái
và giả thuyết hai bên sai thực tê
Trang 16Phan II:
Giả sử tập đữ liệu gồm 65 sinh viên trên là tập mẫu trong mnột tổng thê là hữu hạn, tuy nhiên do nhiều điều kiện khác nhau nên không thê tiễn hành thu thập đữ liệu của tông
thê
10 Hãy thực hiện lại các bước tính toán theo yêu cầu trong câu 8, 9
Giả sử tập đữ liệu gồm 65 sinh viên trên là tập mẫu, ta có:
-_ x=85.0307692307692 (Trung bình mẫu)
- _ Tính độ lệch chuan mau (s):
N
=2
ge 2 [xR] _ |27—85.0307692307692)”+ + 59—85.0307692307692 P _
> s= 1346.155288 =36.68998894
a Ước lượng khoang tin cay
Khoang tin cậy 80%
> «=0.2- =0 ¬t,—=1⁄296,
ty *S te {¥S
(LU0Ì=x+ SE” — =|x< 2” ——,x+-°” —— |=|85.0307692307692— 1-236*36.689988 vn vn vn v65
Vậy mức lương khởi điểm trung bình của sinh vừa ra trường trong
khoảng 7,913,000 VNĐ đến 9,092,000 VNĐ với độ tin cậy 80%
Khoang tin cậy 95%
> ơ=0.05 = 50.025 ty =2
Su h xa ` 2+36.68998894
L,U|=x+-?“——=|x— ae ,xe-?”—— |=|85.0307692307692—^* 19.00228822,
Vậy mức lương khởi điểm trung bình của sinh vừa ra trường trong
khoảng 7,592,000 VNĐ đến 9,413,000 VND voi dé tin cay 95%
b Kiểm định giả thuyết
Trang 17Chọn ngẫu nhiên một giá trị nguyên trong khoảng tin cậy 95% trong khoảng
(75.92910315, 94.132435316
random
random.randint
sers\ACER>python -u "e:\TaiLieu\HK3\Applied Probability and Statistic for IT\Final term\Text.py”
Users\ACER›l
Chọn được My =91
Với cỡ mầu lớn n=65 >30
œ=0.05 —¬ Z„=1.65 ¬ z„=1.96 :
Với mức ý nghĩa
Thống kê kiểm định:
X~ tụ _ 85.0307692307692—91
—* hon ==—=—1.311678701
` siVn 36.68998894/V65
Kiểm định giả thuyết trái
Hụ:u>91
H,:u<91
Theo qui tắc kiểm định trải ta sẽ bác bỏ Hạ nêu Z<~ Z4
Nhưng Z=— 1.311678701>—z„=—1.65,
Không thê bác bỏ giả thuyết Hạ |u>91]không đủ bằng chứng thông kê dé cho
rằng H,(u<91] đúng
Kiểm định giả thuyết phải
Ay: ps91
H,:u>91
Theo qui tắc kiểm định trải ta sẽ bác bỏ Hạ nếu Z> Z„
Nhưng z=— 1.311678701<z„=1.65,
Không thể bác bỏ giả thuyết Hạ lu<91)không đủ bằng chứng thống kê để cho
rằng H,(u>91) đúng
Kiểm định giả thuyết hai bên
Hạ:u=91
H,:uz91
Theo qui tắc kiếm định trái ta sẽ bác bỏ Hạ nếu z<—Z„ hoặc Z>Z„
Nhưng —Z2E—~1.96<z=—1.311678701<z =196
Không thê bác bỏ giả thuyết H, |u=91]không đủ bằng chứng thống kê để cho
rằng H,(##91) đúng