1 Bảng mức lương khởi điểm của sinh viên vừa ra trường của một lớp học gồm 65 sinh viên sau khi sắp xếp...4 Bảng 1.. 2 Bảng phân bố tần số mức lương khởi điểm của sinh viên vừa ra trường
Trang 1TỔNG LIÊN ĐOÀN LAO ĐỘNG VIỆT NAM
TRƯỜNG ĐẠI HỌC TÔN ĐỨC THẮNG
KHOA CÔNG NGHỆ THÔNG TIN
BÁO CÁO CUỐI KỲ MÔN XÁC SUẤT THỐNG KẾ
ỨNG DỤNG CHO CNTT
Người hướng dẫn: TS NGUYỄN THỊ HUỲNH TRÂM Người thực hiện: NGUYỄN TRƯỜNG THỊNH – 52000139
Lớp : 20050201 Khoá : 24
THÀNH PHỐ HỒ CHÍ MINH, NĂM 2021
Trang 2TỔNG LIÊN ĐOÀN LAO ĐỘNG VIỆT NAM
TRƯỜNG ĐẠI HỌC TÔN ĐỨC THẮNG
KHOA CÔNG NGHỆ THÔNG TIN
BÁO CÁO CUỐI KỲ
THÀNH PHỐ HỒ CHÍ MINH, NĂM 2021
Trang 3LỜI CẢM ƠN
Để có thể hoàn thành được bài báo cáo này, em xin gửi lời cảm ơn chân thànhđến cô Nguyễn Thị Huỳnh Trâm - giảng viên đã đồng hành cùng em trong môn học
Xác suất thống kê ứng dụng cho CNTT thời gian cũng là người đã tận tình hướng dẫn
em hoàn thành bài báo cáo này
Bài báo cáo này được hoàn thành trong thời gian học online nên cũng gặp phảikhông ít những khó khăn Trong suốt quá trình làm bài báo cáo thì không thể tránhkhỏi những thiếu sót, em rất mong nhận được những ý kiến đóng góp của các thầy cô
để rút kinh nghiệm và hoàn thiện hơn ở những bài báo cáo sau
Em xin chân thành cảm ơn ạ!
Trang 4ĐỒ ÁN ĐƯỢC HOÀN THÀNH TẠI TRƯỜNG ĐẠI HỌC TÔN ĐỨC THẮNG
Tôi xin cam đoan đây là sản phẩm đồ án của riêng tôi và được sự hướng dẫn của
TS Nguyễn Thị Huỳnh Trâm Các nội dung nghiên cứu, kết quả trong đề tài này làtrung thực và chưa công bố dưới bất kỳ hình thức nào trước đây Những số liệu trongcác bảng biểu phục vụ cho việc phân tích, nhận xét, đánh giá được chính tác giả thuthập từ các nguồn khác nhau có ghi rõ trong phần tài liệu tham khảo
Ngoài ra, trong đồ án còn sử dụng một số nhận xét, đánh giá cũng như số liệucủa các tác giả khác, cơ quan tổ chức khác đều có trích dẫn và chú thích nguồn gốc
Nếu phát hiện có bất kỳ sự gian lận nào tôi xin hoàn toàn chịu trách nhiệm
về nội dung đồ án của mình Trường đại học Tôn Đức Thắng không liên quan đến
những vi phạm tác quyền, bản quyền do tôi gây ra trong quá trình thực hiện (nếu có)
TP Hồ Chí Minh, ngày 20 tháng 06 năm 2022
Tác giả (ký tên và ghi rõ họ tên)
Nguyễn Trường Thịnh
Trang 5PHẦN XÁC NHẬN VÀ ĐÁNH GIÁ CỦA GIẢNG VIÊN
Phần xác nhận của GV hướng dẫn
_ _ _ _ _ _ _
Tp Hồ Chí Minh, ngày tháng năm (kí và ghi họ tên)
Phần đánh giá của GV chấm bài
_ _ _ _ _ _ _
Tp Hồ Chí Minh, ngày tháng năm (kí và ghi họ tên)
Trang 6o Xem lại những nội dung đã được học trên lớp qua slide bài giảng và ghi chép.
o Tham khảo thêm các tài liệu trên Internet
o Vận dụng những kiến thức đó để giải quyết vấn đề
4 Kết quả đạt được
o Củng cố lại những kiến thức đã học
o Vận dụng để giải quyết những vấn đề liên quan đến lập trình
Có được kiến thức nền tảng phục vụ cho những môn học sau
Trang 7DANH MỤC BẢNG BIỂU, HÌNH VẼ
DANH MỤC BẢNG
Bảng 1 1 Bảng mức lương khởi điểm của sinh viên vừa ra trường của một lớp học gồm 65 sinh viên sau khi sắp xếp 4 Bảng 1 2 Bảng phân bố tần số mức lương khởi điểm của sinh viên vừa ra trường của một lớp học gồm 65 sinh viên 4
DANH MỤC HÌNH
Hình 1 1 Biểu đồ phân bố tần số mức lương khởi điểm của sinh viên vừa ra trường của một lớp học gồm 65 sinh viên 5
Trang 8MỤC LỤC
LỜI CẢM ƠN i
PHẦN XÁC NHẬN VÀ ĐÁNH GIÁ CỦA GIẢNG VIÊN iii
TÓM TẮT iv
DANH MỤC BẢNG BIỂU, HÌNH VẼ v
MỤC LỤC 1
PHẦN 1 3
1.1 Câu hỏi 1: 3
1.1.1 Nội dung câu hỏi 3
1.1.2 Trả lời 3
1.2 Câu hỏi 2: 7
1.2.1 Nội dung câu hỏi 7
1.2.2 Trả lời 8
1.3 Câu hỏi 3: 9
1.3.1 Nội dung câu hỏi 9
1.3.2 Trả lời 9
1.4 Câu hỏi 4: 9
1.4.1 Nội dung câu hỏi 9
1.4.2 Trả lời 9
1.5 Câu hỏi 5: 9
1.5.1 Nội dung câu hỏi 9
1.5.2 Trả lời 10
1.6 Câu hỏi 6: 10
1.6.1 Nội dung câu hỏi 10
1.6.2 Trả lời 10
1.7 Câu hỏi 7 11
1.7.1 Nội dung câu hỏi 11
Trang 91.7.2 Trả lời 11
1.8 Câu hỏi 8: 13
1.8.1 Nội dung câu hỏi 13
1.8.2 Trả lời 13
PHẦN 2 16
1.1 Câu hỏi 9: 16
1.1.1 Nội dung câu hỏi 16
1.1.2 Trả lời 16
TÀI LIỆU THAM KHẢO 19
Trang 10PHẦN 1
Khảo sát mức lương khởi điểm của sinh viên vừa ra trường của một lớp học gồm 65sinh viên Kết quả được đánh số thứ tự như bảng sau Giới tính: W là nữ, M là nam.Đơn vị của mức lương là X00.000 đồng (Ví dụ 27 tức là 2.700.000 VNĐ)
Giả sử tập dữ liệu trên là tập dữ liệu của một tổng thể
1.1 Câu hỏi 1:
1.1.1 Nội dung câu hỏi
Dùng thống kê mô tả gồm lập bảng phân bố tần số, vẽ biểu đồ phân bố tần số,tính trung bình, trung vị và số mode, độ lệch chuẩn để mô tả cho bảng số liệu này
1.1.2 Trả lời
Bảng số liệu sau khi được sắp xếp theo thứ tự tiền lương tăng dần
Trang 11gồm 65 sinh viên sau khi sắp xếp
Trang 12Hình 1 1 Biểu đồ phân bố tần số mức lương khởi điểm của sinh viên vừa ra trường
của một lớp học gồm 65 sinh viên.
Tính trung bình (Mean)
Gọi là giá trị trung bình của tổng thể
Gọi N = 65 là số lượng quan sát trong tổng thể
Gọi S = = 15 + 24 + 25 + 27 + 31 + 34 + 39 + 40 + 40 + 41 + 41 + 42 + 44 + 45 + 46 + 47 + 52 + 56 + 59 + 61 + 61 + 66 + 67 + 67 + 68 + 69 + 69 + 74 + 76 + 77 + 79 + 83+ 84 + 85 + 86 + 87 + 88 + 90 + 91 + 94 + 99 + 100 + 102 + 102 + 105 + 106 + 108 +
113 + 114 + 119 + 119 + 124 + 128 + 128 + 128 + 130 + 131 + 138 + 138 + 139 + 140 + 143 + 145 + 145 + 146 = 5460
Vậy: Mức lương trung bình của sinh viên vừa ra trường của một lớp học gồm 65 sinh
viên là 8.400.000 đồng
Tính trung vị (Median)
Tổng số quan sát của bộ dữ liệu là 65 quan sát
Đây là số lẻ
Trang 13Do đó giá trị trung vị sẽ nằm ở vị trí
Vậy: Giá trị trung vị của bộ dữ liệu là 8.400.000 đồng.
Tính số Mode (yếu vị)
Trong bộ dữ liệu giá trị 128 có số lần xuất hiện lớn nhất (3 lần)
Vậy: Số mode của bộ dữ liệu là 12.800.00 đồng.
Tính độ lệch chuẩn (Standard Deviation)
Gọi là phương sai của tổng thể
Trang 141.2.1 Nội dung câu hỏi
Sắp xếp tăng dần 3 số khác không, khác nhau và từ bên phải qua trong MSSV của bạn.Gọi 3 số đó là abc với a<b<c Chọn ngẫu nhiên c sinh viên để phỏng vấn Tính xác suất
để có
a) Có a sinh viên nam
b) Có ít nhất b sinh viên nữ
Trang 151.2.2 Trả lời
MSSV: 52000139 a = 1 b = 3 c = 9
Ta có: Chọn ngẫu nhiên 9 bạn (không kể thứ tự) trong 65 bạn có cách chọn
Từ bộ dữ liệu trên ta biết được trong tổng số 65 sinh viên có sinh viên nam và 37 28
sinh viên nữ
a) Gọi A là biến cố “Chọn 9 bạn trong đó có 1 sinh viên nam” Khi đó:
Kết luận: Xác suất để trong 9 sinh viên được chọn có 1 sinh viên nam là:
b) Gọi B là biến cố “Chọn 9 bạn trong đó có ít nhất 3 sinh viên nữ” Để đếm ta phânlàm các trường hợp sau:
1.3.1 Nội dung câu hỏi
Bảng dữ liệu trên bao gồm hai nhóm nam và nữ Từ nhóm đã chọn, chọn ngẫu nhiên 1bạn để phỏng vấn
Trang 16a Vẽ sơ đồ cây
b Tính xác suất chọn được bạn có mức lương thấp hơn mức lương trung bình
c Xem xét 01 chữ số cuối cùng khác không trong MSSV của bạn Nếu là số chẵn thìgiới tính được chọn là nữ, nếu là số lẻ thì giới tính được chọn là nam Tính xác suấtchọn được một bạn có mức lương cao hơn mức lương trung bình mà bạn đó có giớitính theo giới tính vừa được chọn
1.3.2 Trả lời
1.4 Câu hỏi 4:
1.4.1 Nội dung câu hỏi
Gọi S1 là mẫu gồm 30 sinh viên và tập S2 là mẫu gồm 15 sinh viên Có bao
nhiêu cách lấy 1 tập mẫu S1? Có bao nhiêu cách lấy 1 tập mẫu S2?
1.4.2 Trả lời
Gọi S1 là tập mẫu gồm 30 sinh viên Có cách chọn tập S1
Gọi S2 là tập mẫu gồm 15 sinh viên Có cách chọn tập S2
Kết luận: Có 3009106305270645216 cách chọn tập S1 và có cách chọn tập S2
1.5 Câu hỏi 5:
1.5.1 Nội dung câu hỏi
Diễn giải chi tiết phương pháp lấy ngẫu nhiên tập S1, S2 bằng cách chụp màn hình kếtquả làm minh chứng
1.5.2 Trả lời
Tạo một danh sách tên number gồm các phần tử có giá trị từ 1 đến 65 (tươngứng với số thứ tự của từng quan sát trong tổng thể) Sử dụng hàm sample() từ thư việnrandom trong Python để chọn ngẫu nhiên từ number
Trang 17Kết quả thu được sau khi thực thi chương trình
Từ kết quả trên ta thu được tập S1 và S2 như sau:
1.6 Câu hỏi 6:
1.6.1 Nội dung câu hỏi
Tính giá trị trung bình mức lương khởi điểm của tập S1, S2 Em có kết luận gì
về các giá trị này so với giá trị trung bình của tổng thể
1.6.2 Trả lời
Tính trung bình của tập S1
Gọi là giá trị trung bình của tập S1
Gọi n = 30 là số lượng quan sát trong tập mẫu S11
Gọi A = = 128 + 90 + 128 + 99 + 84 + 68 + 130 + 45 + 102 + 61 + 56 + 119 + 100 + 1
42 + 69 + 94 + 119 + 41 + 27 + 145 + 124 + 61 + 113 + 74 + 15 + 40 + 106 + 105 +
128 + 66 = 2579
Tính trung bình của tập S2
Gọi là giá trị trung bình của tập S2
Gọi n = 15 là số lượng quan sát trong tập mẫu S2.2
Gọi A = = 94 + 47 + 39 + 99 + 31 + 40 + 85 + 108 + 128 + 140 + 24 + 138 + 145 + 2
128 + 102 = 1348
Trang 181.7.1 Nội dung câu hỏi
Gọi 02 chữ số cuối cùng khác không trong MSSV của bạn là e, f Uớc lượng khoảngtin cậy đối với giá trị trung bình của tập S1, S2 với độ tin cậy là (80+e)% và (90+f)%
Em có kết luận gì về khoảng giá trị này so với giá trị trung bình của tổng thể và so vớinhau
1.7.2 Trả lời
MSSV: 52000139 e = 3 f = 9 và khoảng tin cậy cần tính là 83% và 99%
Gọi là hệ số tin cậy của giá trị trung bình khi xét với độ tin cậy là 83%
Ước lượng khoảng tin cậy của giá trị trung bình của tập S1
- Gọi là độ lệch chuẩn của tổng thể, là giá trị trung bình của tập S1 và n = 30 là sốlượng quan sát trong tập S1
Độ tin cậy 83%
Trang 19- Thay các giá trị vào công thức ta được:
Độ tin cậy 99%
- Thay các giá trị vào công thức ta được:
Ước lượng khoảng tin cậy của giá trị trung bình của tập S2
- Gọi là độ lệch chuẩn của tổng thể, là giá trị trung bình của tập S2 và n = 15 là sốlượng quan sát trong tập S2
Trang 20- Khi xét tập mẫu S2, mức lương trung bình của sinh viên mới ra trường nằm trongkhoảng từ 7.680.000 đồng đến 10.292.000 đồng với độ tin cậy 83% và nằm trongkhoảng từ 6.527.000 đồng đến 11.445.000 đồng với độ tin cậy 99%
- Giá trị trung bình của tổng thể đều nằm trong những khoảng kể trên vì vậy đây đều lànhững kết luận đúng
1.8 Câu hỏi 8:
1.8.1 Nội dung câu hỏi
Với mức ý nghĩa 0.05, hãy thực kiểm định giả thuyết trái, phải, hai bên của giámtrịtrung bình của S1 so với giá trị trung bình của tổng thể Kết luận của kiểm định giảthuyết có mắc sai lầm không, nếu có thì là sai lầm loại mấy?
Trang 21H0:
Ha:
Kết luận: Không có đủ bằng chứng thống kê để bác bỏ H0
Ở đây ta không bác bỏ H0 (nghĩa là chấp nhận nó) (1)Xét H : 0
Kết luận: Không có đủ bằng chứng thống kê để bác bỏ H0
Ở đây ta không bác bỏ H0 (nghĩa là chấp nhận nó) (1)Xét H0:
Ta có H0 sai (2)
Từ (1) và (2) Mắc sai lầm loại II
Trang 22PHẦN 2
1.1 Câu hỏi 9:
1.1.1 Nội dung câu hỏi
Giả sử tập dữ liệu gồm 65 sinh viên trên là tập mẫu trong một tổng thể là hữu hạn, tuynhiên do nhiều điều kiện khác nhau nên không thể tiến hành thu thập dữ liệu của tổngthể Gọi tập dữ liệu này là S3 Hãy thực hiện lại các bước tính toán theo yêu cầu trong
câu 6,7,8 cho tập S3
1.1.2 Trả lời
Gọi n = 65 là số lượng quan sát của tập mẫu S3
Gọi s = 36.911536 là độ lệch chuẩn của tập mẫu S3 (lấy kết quả từ câu 1)
Tính giá trị trung bình
Gọi là giá trị trung bình của tập mẫu S3 (lấy kết quả từ câu 1)
Ước lượng khoảng tin cậy
Gọi n – 1 = 65 – 1 = 64 là bậc tự do
Gọi là hệ số tin cậy của giá trị trung bình khi xét với độ tin cậy là 83%
Ta có: và
Đối chiếu với bảng t DISTRIBUTION ta tìm được
Gọi là hệ số tin cậy của giá trị trung bình khi xét với độ tin cậy là 99%
Trang 23- Thay các giá trị vào công thức ta được:
Kết luận: Mức lương trung bình của sinh viên mới ra trường nằm trong khoảng từ
7.807.000 đồng đến 8.992.000 đồng với độ tin cậy 83% và nằm trong khoảng từ 7.184.000 đồng đến 9.615.000 đồng với độ tin cậy 99%
Kiểm định giả thuyết
Xét khoảng tin cậy 99%, chọn ngẫu nhiên một giá trị nguyên trong khoảng này để làm giá trị
Đây là trường hợp chưa biết nên ta áp dụng công thức:
Trang 25TÀI LIỆU THAM KHẢO