Qua cuộc nghiên cứu, ta có thể thấy được mức chi tiêu trung bình của các bạn sinh viên và tỷ lệ các bạn sinh viên đang đi và không đi làm, sự khác nhau trong chi tiêu của sinh viên đang đi làm thêm và không đi làm thêm. Từ đó khái quát và đánh giá được tình trạng đi làm, mức chi tiêu của sinh viên Đại học Thương mại. Ý nghĩa của đề tài trên bám sát thực tiễn và thiết thực đối với mỗi sinh viên Thương mại
Trang 11
BỘ MÔN: TOÁN HỌC PHẦN: LÝ THUYẾT XÁC SUẤT VÀ THỐNG KÊ TOÁN
- -
BÀI THẢO LUẬN
Đề tài:
NGHIÊN CỨU CHI TIÊU TRUNG BÌNH CỦA SINH VIÊN TRƯỜNG ĐẠI HỌC THƯƠNG MẠI ĐỐI VỚI ĐỐI TƯỢNG ĐANG ĐI LÀM THÊM VÀ KHÔNG ĐI LÀM THÊM
Giáo viên hướng dẫn: Thầy Mai Hải An
Nhóm thực hiện: Nhóm 09
Mã học phần: H2101AMAT0111
HÀ NỘI - 2021
Trang 22
DANH SÁCH THÀNH VIÊN:
Trang 33
MỤC LỤC
Contents
MỤC LỤC 3
LỜI MỞ ĐẦU 4
A LÝ THUYẾT 5
1 Trung bình mẫu: 5
2 Phương sai mẫu: 5
3 Ước lượng bằng khoảng tin cậy 6
4 Kiểm định 7
B.BÀI TOÁN THỰC TẾ: 9
I Ước lượng 9
1.Ước lượng mức chi tiêu trung bình hàng tháng của các bạn sinh viên đang đi làm thêm: 9
2.Ước lượng tỷ lệ các bạn sinh viên đang đi làm thêm: 11
II Kiểm định 12
1.Kiểm định mức chi tiêu TB hàng tháng của các bạn sinh viên nữ đang đi làm thêm đến 2,7 triệu đồng 1 tháng không 12
2.Kiểm định mức chi tiêu trung bình hàng tháng của các bạn sinh viên đang đi làm thêm và không đi làm thêm: 13
KẾT LUẬN 17
Trang 44
LỜI MỞ ĐẦU
Xác suất thống kê là một một môn học được ứng dụng sâu rộng vào trong các ngành kinh tế - xã hội và khoa học kỹ thuật Môn học không chỉ khái quát chặt chẽ một phần của toán học mà hơn thế, nó còn mang tính ứng dụng thực tế cao Để giải quyết những bài toán đặt ra trong thực tiễn, cụ thể là “Vấn đề chi tiêu trung bình của các bạn sinh viên đang đi làm hoặc không đi làm tại Đại học Thương mại”, nhóm 9 đã thực hiện khảo sát để nghiên cứu vấn đề trên Với không gian là trường Đại học Thương mại, thời gian nghiên cứu là tháng 6/2021, đã có 110 bạn sinh viên tham gia khảo sát với số lượng sinh viên đang đi làm thêm là 60 người, số sinh viên không đi làm thêm là 50 người
Qua cuộc nghiên cứu, ta có thể thấy được mức chi tiêu trung bình của các bạn sinh viên và tỷ lệ các bạn sinh viên đang đi và không đi làm, sự khác nhau trong chi tiêu của sinh viên đang đi làm thêm và không đi làm thêm Từ đó khái quát và đánh giá được tình trạng đi làm, mức chi tiêu của sinh viên Đại học Thương mại Ý nghĩa của đề tài trên bám sát thực tiễn và thiết thực đối với mỗi sinh viên Thương mại Nhận thấy được rằng, xác suất thống kê chính là một môn học vô cùng hữu ích trong cuộc sống
Trang 55
A LÝ THUYẾT
Bảng phân phối thực nghiệm
- Bảng phân phối tần số:
Ta sắp xếp các giá trị quan sát theo thứ tự tăng dần 𝑥1 < 𝑥2 < ⋯ < 𝑥𝑘
Trong đó 𝑛𝑖 là tần số của quan sát 𝑥𝑖
+ Tính chất:
0 ≤ 𝑛𝑖 ≤ 𝑛 𝑣ớ𝑖 𝑖 = 1,2 … 𝑘
∑𝑘 𝑛𝑖 = 𝑛
𝑖=1
- Bảng phân phối tần suất:
Trong đó 𝑓𝑖 =𝑛𝑖
𝑛 là tần số của giá trị quan sát 𝑥𝑖 Khi đó:
0 ≤ 𝑓𝑖 ≤ 1 𝑣ớ𝑖 𝑖 = 1,2 … 𝑘
∑𝑘 𝑓𝑖 = 1
𝑖=1
1 Trung bình mẫu:
a Định nghĩa: Giả sử ta có mẫu ngẫu nhiên về dấu hiệu cần nghiên cứu X
W= (X1, X2, …, Xn) 𝑋̅ = 1𝑛∑𝑛 𝑋𝑖
𝑖=1 (𝑋̅ cũng là một ĐLNN)
Với mẫu cụ thể:
𝑥̅ = 1𝑛∑𝑛 𝑥𝑖
𝑖=1 =𝑛1∑𝑘 𝑛𝑖 𝑥𝑖
𝑖=1
b Tính chất: Nếu 𝐸(𝑋) = µ, 𝑉𝑎𝑟(𝑋) = 𝜎2
𝐸(𝑋̅) = 𝜇
𝑉𝑎𝑟(𝑋̅) = 𝜎2
𝑛
2 Phương sai mẫu:
2.1 Định nghĩa:
- Từ đám đông lấy ra mẫu ngẫu nhiên 𝑊 = (𝑋1, 𝑋2, … , 𝑋𝑛) Khi đó phương sai mẫu được ký hiệu là 𝑆2
𝑆2 =1
𝑛∑ (𝑋𝑛 𝑖 − 𝑋̅)2 𝑖=1 (𝑆2cũng là một ĐLNN)
2.2 Tính chất:
Nếu ĐLNN X có 𝐸(𝑋) = µ, 𝑉𝑎𝑟(𝑋) = 𝜎2 thì:
Trang 66
𝐸(𝑆2) = 𝑛 − 1
𝑛 𝜎2
2.3 Phương sai mẫu điều chỉnh
Phương sai mẫu điều chỉnh được ký hiệu: 𝑆′2
𝑆′2 =𝑛−11 ∑ (𝑋𝑛 𝑖− 𝑋̅)2
𝑖=1 (𝑆′2 cũng là một ĐLNN)
2.4 Độ lệch tiêu chuẩn mẫu và Độ lệch tiêu chuẩn mẫu điều chỉnh
𝑆 = √𝑆2 = √1
𝑛∑𝑛 (𝑋𝑖− 𝑋̅)2 𝑖=1 và 𝑆′ = √𝑆′2 = √ 1
𝑛−1∑𝑛 (𝑋𝑖 − 𝑋̅)2
3 Ước lượng bằng khoảng tin cậy
Ước lượng kỳ vọng toán của ĐLNN
- Giả sử ĐLNN X trên đám đông có 𝐸(𝑋) = µ, 𝑉𝑎𝑟(𝑋) = 𝜎2, trong đó 𝜇 chưa biết
3.1 ĐLNN X có phân phối chuẩn, phương sai đã biết
- Vì 𝑋~𝑁(µ, 𝜎2) nên:
𝑋̅~ 𝑁 (µ,𝜎
2
𝑛) → 𝑈 =
𝑋̅ − 𝜇 𝜎
√𝑛
~𝑁(0,1)
- Khoảng tin cậy:
Xác suất Khoảng tin cậy Hai phía 𝑃 (|𝑈| < 𝑈𝛼
2) = 1 − 𝛼 = 𝛿 (𝑋̅ − 𝑈𝛼
2 𝜎
√𝑛; 𝑋̅ + 𝑈𝛼2 𝜎
√𝑛) Trái 𝑃(𝑈 > −𝑈𝛼) = 1 − 𝛼 = 𝛿 (−∞; 𝑋̅ + 𝑈
𝛼 𝜎
√𝑛) Phải 𝑃(𝑈 < 𝑈𝛼) = 1 − 𝛼 = 𝛿 (𝑋̅ − 𝑈
𝛼 𝜎
√𝑛; +∞)
3.2 ĐLNN X có phân phối chuẩn, phương sai chưa biết, 𝑛 < 30
- Vì 𝑋~𝑁(µ, 𝜎2) nên ta xây dựng thống kê:
𝑇 = 𝑋̅ − 𝜇𝑆′
√𝑛
- Khoảng tin cậy:
Xác suất Khoảng tin cậy Hai phía 𝑃 (|𝑇| < 𝑡𝛼
2
𝑛−1) = 1 − 𝛼 = 𝛿 (𝑋̅ − 𝑡𝛼
2
𝑛−1 𝑆′
√𝑛; 𝑋̅ + 𝑡𝛼2
𝑛−1 𝑆′
√𝑛) Trái 𝑃(𝑇 > −𝑡𝛼𝑛−1) = 1 − 𝛼 = 𝛿
(−∞; 𝑋̅ + 𝑡𝛼
2 𝑛−1 𝑆
′
√𝑛)
Trang 77
Phải 𝑃(𝑇 < 𝑡𝛼𝑛−1) = 1 − 𝛼 = 𝛿
(𝑋̅ − 𝑡𝛼
2
𝑛−1 𝑆′
√𝑛; +∞)
3.3 Chưa biết quy luật phân phối của ĐLNN X, 𝑛 > 30
- Vì 𝑛 > 30 nên:
𝑋̅ ≅ 𝑁 (µ,𝜎2
𝑛 ) → 𝑈 =
𝑋̅ − 𝜇 𝜎
√𝑛
≅ 𝑁(0,1)
Từ đó các bài toán được giải quyết tương tự trường hợp X có phân phối chuẩn
Chú ý: Do 𝜎 chưa biết, vì 𝑛 > 30 nên ta lấy 𝜎 ≈ 𝑠′
4 Kiểm định
4.1 ĐLNN X có phân phối chuẩn với 𝝈𝟐 đã biết
Do X có phân phối chuẩn với 𝜎2 đã biết nên 𝑋̅ ~ N (𝜇,𝜎2
𝜇) TCKĐ: U = 𝑋 ̅ − 𝜇0
𝜎
√𝑛
Nếu 𝐻0 đúng thì U ~ N ( 0, 1)
𝐻0 𝐻1 P (𝐺 ∈ 𝑊∝
𝐻0)= ∝ Miền bác bỏ 𝑊∝
𝜇= 𝜇0 𝜇 ≠ 𝜇0 P (|𝑈| > 𝑈∝
2) = ∝ 𝑊∝ = {𝑈𝑡𝑛 ∶ |𝑈𝑡𝑛| > 𝑈∝
2}
𝜇 > 𝜇0 P (𝑈 > 𝑈∝) = ∝ 𝑊∝ = {𝑈𝑡𝑛: 𝑈𝑡𝑛 > 𝑈∝}
𝜇 < 𝜇0 P (𝑈 < −𝑈∝) = ∝ 𝑊∝ = {𝑈𝑡𝑛: 𝑈𝑡𝑛 < −𝑈∝}
4.2 ĐLNN có phân phối chuẩn với 𝝈𝟐 chưa biết
Do X có phân phối chuẩn với 𝜎2 chưa biết nên
XĐTCKĐ: T= 𝑋̅−𝜇0
𝑆′
√𝑛
Nếu 𝐻0 đúng thì T ~ T ( n- 1)
𝐻0 𝐻1 P (𝐺 ∈ 𝑊 ∝
𝐻0)= ∝ Miền bác bỏ 𝑊∝
𝜇= 𝜇0 𝜇 ≠ 𝜇0 P (|𝑇| > 𝑡∝
2
⁄
(𝑛−1)) = ∝ 𝑊∝ = {𝑡𝑡𝑛 ∶ |𝑡𝑡𝑛| > 𝑡∝
2
⁄ (𝑛−1)}
𝜇 > 𝜇0 P (𝑇 > 𝑡∝(𝑛−1))= ∝ 𝑊∝ = {𝑡𝑡𝑛: 𝑡𝑡𝑛 > 𝑡∝(𝑛−1) }
𝜇 < 𝜇0 P (𝑇 < −𝑡∝(𝑛−1) )= ∝ 𝑊∝ = {𝑡𝑡𝑛: 𝑡𝑡𝑛 < −𝑡∝(𝑛−1) }
Trang 88
4.3 Kiểm định giả thuyết về tỷ lệ của đám đông
Giả sử trên một đám đông tỷ lệ phần tử mang dấu hiệu A là p Với mức ý nghĩa
∝ ta cần kiểm định giả thuyết 𝐻0, p= 𝑝0
Chọn từ đám đông mẫu có kích thước n từ đó ta tìm được f là tỷ lệ phần tử mang dấu hiệu A trên mẫu
Khi n đủ lớn, ta có : f ≅ N(𝑝;𝑝𝑞𝑛)
XĐTCKĐ: U= 𝑓−𝑝𝑜
√𝑝0𝑞0𝑛
𝐻0 𝐻1 P (𝐺 ∈ 𝑊∝
𝐻 0)= ∝ Miền bác bỏ 𝑊∝
𝑝= 𝑝0 𝑝 ≠ 𝑝0 P (|𝑈| > 𝑈∝
2) = ∝ 𝑊∝ = {𝑈𝑡𝑛 ∶ |𝑈𝑡𝑛| > 𝑈∝
2}
𝑝 > 𝑝0 P (𝑈 > 𝑈∝)= ∝ 𝑊∝ = {𝑈𝑡𝑛: 𝑈𝑡𝑛 > 𝑈∝}
𝑝 < 𝑝0 P (𝑈 < −𝑈∝)= ∝ 𝑊∝ = {𝑈𝑡𝑛: 𝑈𝑡𝑛 < −𝑈∝}
4.4 Kiểm định giả thuyết về phương sai của ĐLNN phân phối chuẩn
Giả sử ĐLNN X có E(X) = 𝜇, Var(X)= 𝜎2 Với mức ý nghĩa ∝ ta cần kiểm định giả thuyết 𝐻0: 𝜎2= 𝜎02
Lấy mẫu W= (𝑋1, 𝑋2, 𝑋𝑛) từ đó ta tìm được :
𝑋̅ = 1
𝑛 (∑𝑛 𝑋𝑖
𝑖=1 ) ; 𝑆′2= 1
𝑛−1 ∑𝑛 (𝑋𝑖− 𝑋̅)2 𝑖=1
Do X có phân phối chuẩn nên ta có TCKĐ
𝑥2 = (𝑛−1)𝑆
′2
𝜎0
Nếu 𝐻0 đúng thì 𝑋2 ~ 𝑋2(𝑛 − 1)
𝐻0 𝐻1 P (𝐺 ∈ 𝑊∝
𝐻0)= ∝ Miền bác bỏ 𝑊∝
𝜎2= 𝜎02 𝜎2 ≠ 𝜎02
P[(𝑥2 < 𝑥2(𝑛−1)
1−∝2) + (𝑥2 > 𝑥2(𝑛−1)∝
2)] = ∝
𝑊∝ = {𝑥2
𝑡𝑛: 𝑥2
𝑡𝑛 < 𝑥2(𝑛−1)
1−∝2}
U {𝑥2
𝑡𝑛: 𝑥2
𝑡𝑛 > 𝑥2(𝑛−1)∝
2}
𝜎2 > 𝜎02 P(𝑥2 > 𝑥2(𝑛−1)
∝)= ∝ 𝑊∝ = {𝑥2
𝑡𝑛: 𝑥2
𝑡𝑛 > 𝑥2(𝑛−1)
∝}
𝜎2 < 𝜎02 P(𝑥2 < 𝑥2(𝑛−1)
1−∝)= ∝ 𝑊∝ = {𝑥2
𝑡𝑛: 𝑥2
𝑡𝑛 < 𝑥2(𝑛−1)
1−∝}
Trang 99
B.BÀI TOÁN THỰC TẾ:
Đề tài: Tiến hành khảo sát điều tra mẫu về các bạn sinh viên ĐHTM để giải quyết các
đề tài sau với mức ý nghĩa 5%, độ tin cậy 95%
a, Vấn đề 1: Ước lượng mức chi tiêu trung bình hàng tháng của các bạn sv đang đi làm thêm
b, Vấn đề 2: Ước lượng tỷ lệ các bạn sinh viên đang đi làm thêm
c, Vấn đề 3: Liệu mức chi tiêu TB hàng tháng của các bạn sinh viên nữ đang đi làm thêm đến 2,7 triệu đồng 1 tháng hay không?
d, Vấn đề 4: So sánh mức chi tiêu TB hàng tháng của các bạn sv đang đi làm thêm và
ko đi làm thêm
→ Với mẫu thu được là 110 – chủ yếu là sinh viên đến từ các khoa: Marketing, Thương mại điện tử, Hệ thống thông tin quản lý, với 51 sinh viên nam, 59 sinh viên
nữ, 60 sinh viên đang đi làm, 50 sinh viên không đi làm thêm nhóm 9 thu được số liệu như trong bảng excel (gửi kèm bài thảo luận)
I Ước lượng
1.Ước lượng mức chi tiêu trung bình hàng tháng của các bạn sinh viên đang đi làm thêm:
Trong excel thực hiện lệnh: Data/ Data Analysis/ Desciptive Statistics, ta có:
(Độ tin cậy 95%, n=60)
Mức chi tiêu trung bình trong 1 tháng
Bảng thống kê mô tả
Bài làm:
Gọi: X là mức chi tiêu trung bình hàng tháng của các bạn sinh viên đang đi làm thêm
Trang 1010
𝑋̅ mức chi tiêu trung bình hàng tháng của các bạn sinh viên đang đi làm thêm trên
mẫu
𝜇 mức chi tiêu trung bình hàng tháng của các bạn sinh viên đang đi làm thêm trên
đám đông
Vì n = 60 > 30 nên 𝑋̅ ≅ 𝑁 (𝜇,𝜎2
√𝑛) do đó 𝑈 = 𝜎𝑋̅− 𝜇
√𝑛
⁄ ≅ N(0,1) Với độ tin cậy 95%, ta tìm khoảng tin cậy đối xứng:
(𝑋̅ − 𝑈𝛼
2
⁄ 𝜎
√𝑛; 𝑋̅ + 𝑈𝛼⁄2 𝜎
√𝑛) Với 𝛾 ta tìm được 𝑈𝛼
2
⁄ sao cho:
P ( | U | < 𝑈𝛼
2
⁄ ) = 1 – 𝛼 = 𝛾
Vì 𝜎 chưa biết mà n đủ lớn nên ta lấy 𝜎 = 𝑠′ = √0,782
Ta có: 𝑈𝛼
2
⁄ = 𝑈0.025 = 1,96
Khoảng tin cậy đối xứng
(3,395 + 1,96.√0,782
√60 ; 3,395 − 1,96.√0,782
√60 ) (3,193;3,597)
Kết luận: Với độ tin cậy 95% thì khoảng tin cậy đối xứng cho chi tiêu trung bình hàng tháng của các bạn sinh viên đang đi làm thêm trong khoảng từ 3,193 đến 3,597 triệu đồng
Kiểm tra kết quả qua bảng excel:
Khoảng tin cậy đối xứng cho chi tiêu trung bình hàng tháng của các bạn sinh viên đang đi làm thêm (𝜇):
𝑥 ̅ ± 𝑀𝐸 = 3,395 ± 0,202 → (3,193;3,597)
Vậy với độ tin cậy 95% thì khoảng tin cậy đối xứng cho chi tiêu trung bình hàng tháng của các bạn sinh viên đang đi làm thêm trong khoảng từ 3,193 đến 3,597 triệu đồng
Trang 1111
2.Ước lượng tỷ lệ các bạn sinh viên đang đi làm thêm:
Trong excel thực hiện lệnh: Data/ Data Analysis/ Desciptive Statistics, ta có:
(Độ tin cậy 95%, n=110, Tình trạng làm thêm: Có-1, Không-0)
Tình trạng làm thêm
Confidence
Bảng thống kê mô tả
Bài làm:
Gọi f là tỷ lệ sinh viên ĐHTM đang đi làm thêm trên mẫu
p là tỷ lệ sinh viên ĐHTM đang đi làm thêm trên đám đông
- Bước 1: Với n=110 khá lớn nên f có phân phối xấp xỉ chuẩn: 𝑓 ≃ 𝑁 (𝑝,𝑝𝑞
𝑛) XDTK:
𝑈 =𝑓 − 𝑝
√𝑝 𝑞𝑛
≃ 𝑁(0,1)
- Bước 2: Với độ tin cậy 𝛾 = 0,95 ta có:
𝑃(−𝑢𝛼/2 < 𝑈 < 𝑢𝛼/2) = 𝛾
⇒ 𝑃(𝑓 − 𝜀 < 𝑝 < 𝑓 + 𝜀) = 𝛾 Với
𝜀 = 𝑢𝛼/2 √𝑝 𝑞
𝑛
- Bước 3: Có:
𝛾 = 0,95
⇒ 𝛼 = 1 − 𝛾 = 1 − 0,95 = 0,05
⇒ 𝑢𝛼/2 = 𝑢0,05/2 = 𝑢0,025 = 1,96
Có:
𝜀 = 𝑢𝛼/2 √𝑝 𝑞
𝑛
Trang 1212
Vì p chưa biết, n khá lớn
⇒ {𝑝 ≈ 𝑓 =
𝑛𝐴
𝑛 =
60
110≈ 0,545
𝑞 ≈ 1 − 𝑓 = 0,455
⇒ 𝜀 = 𝑢𝛼/2 √𝑝 𝑞
𝑛 = 1,96 √
0,545.0,455
110 ≈ 0,0931
⇒ 𝑓 − 𝜀 = 0,545 − 0,0931 = 0,4519
𝑓 + 𝜀 = 0,545 + 0,0931 = 0,6381
Kết luận: Với độ tin cậy 95%, ta có thể nói rằng tỷ lệ sinh viên ĐHTM đang đi làm
thêm nằm trong khoảng (45,19;63,81)%
Kiểm tra kết quả qua bảng excel:
Khoảng tin cậy cho tỷ lệ với mẫu lớn (n ≥ 100)
𝑓 = ∑ 𝑥𝑖
𝑛 = 𝑥̅, 𝑥𝑖 𝜖 {0; 1}, √𝑓(1−𝑓)𝑛 ≈ 𝑠𝑒(𝑋) = 𝑠
√𝑛 Khoảng tin cậy cho tỷ lệ các bạn sinh viên đang đi làm thêm (p) với mẫu n=110:
𝑓 ± 𝑀𝐸 = 0,5455 ± 0,0945→ (0,451;0,64)
Vậy với độ tin cậy 95% thì khoảng tin cậy cho tỷ lệ các bạn sinh viên đang đi làm
thêm tại trường Đại học Thương mại là: (0,451;0,64)
II Kiểm định
1.Kiểm định mức chi tiêu TB hàng tháng của các bạn sinh viên nữ đang đi làm thêm đến 2,7 triệu đồng 1 tháng hay không?
Trong excel thực hiện lệnh: Data/ Data Analysis/ Desciptive Statistics, ta có:
(Độ tin cậy 95%, n=40)
Mức chi tiêu trung bình trong 1 tháng (Triệu đồng)
Trang 1313
Bảng thống kê mô tả
Gọi X là mức chi tiêu trung bình hàng tháng của các bạn sinh viên nữ đang đi làm
thêm
𝑥̅ là mức chi tiêu trung bình hàng tháng của các bạn sinh viên nữ đang đi làm thêm
trên mẫu
n=40; 𝑥̅ = 3,385; s’ = 0,8008; 𝛼 = 0,05; 𝜇0 = 2,7
{𝐻𝐻0: 𝜇 = 𝜇0
1: 𝜇 > 𝜇0
Xây dựng tiêu chuẩn kiểm định : 𝑈 =𝑥̅−𝜇0
𝜎 √𝑛 ≈ N(0,1) Nếu 𝐻0 đúng:
𝛼=0,05 =>𝑢𝛼= 𝑢0,05 = 1,65
P(𝑢 >𝑢𝛼) = 𝛼 P(𝑢 >1,65) = 𝛼
Vì 𝛼 khá nhỏ nên theo nguyên lý xác suất nhỏ ta được:
𝑊𝛼 = {𝑢𝑡𝑛: 𝑢𝑡𝑛 > 1,65}
Trên mẫu cụ thể : n>30
𝑢𝑡𝑛 =𝑥̅−2,7
𝜎 √𝑛 ≈ 𝑥̅−2,7𝑠′ √𝑛 = 3,385−2,70,8008 √40 ≈ 5.4 > 2,7
=> 𝑢𝑡𝑛 ∈ 𝑊𝛼
Kết luận: với 𝛼 = 0,05 có thể nói rằng là mức chi tiêu trung bình hàng tháng của các bạn sinh viên nữ đang đi làm thêm lớn hơn 2,7 triệu đồng
2.Kiểm định mức chi tiêu trung bình hàng tháng của các bạn sinh viên đang đi làm thêm và không đi làm thêm:
2.1 Báo cáo tổng hợp
Trong excel sử dụng bảng Pivot Table, ta có:
Trang 1414
Tình trạng
làm thêm
Average of Mức chi tiêu trung bình trong 1 tháng (Triệu đồng)
(blank)
Mức chi tiêu trung bình trong một tháng của sinh viên đang đi làm thêm là 3,395 triệu đồng
Mức chi tiêu trung bình trong một tháng của sinh viên không đi làm thêm là 3,018
triệu đồng
2.2 Đồ thị biểu diễn mức chi tiêu của sinh viên đang đi làm thêm và không đi làm
thêm:
Nhận xét:
- Chi tiêu của hai nhóm dao động quanh giá trị 3 (triệu đồng)
- Biên độ dao động mức chi tiêu của nhóm không đi làm thêm dường như rộng hơn (phương sai lớn hơn) nhóm không đi làm thêm
2.3So sánh 2 phương sai của nhóm đang đi làm thêm và không đi làm thêm:
Kiểm định bằng p-value
- p-value < 𝛼 =0,05 → Bác bỏ 𝐻0, chấp nhận 𝐻1
- p-value > 𝛼 =0,05 → Chấp nhận 𝐻0, bác bỏ 𝐻1
0
2
4
6
8
10
12
1 3 5 7 9 11 13 15 17 19 21 23 25 27 29 31 33 35 37 39 41 43 45 47 49 51 53 55 57 59
Có Không
Trang 1515
→ Kiểm định: Mức chi tiêu của các sinh viên đang đi làm thêm ổn định hơn (ít dao
động hơn, đồng đều hơn) so với các sinh viên không đi làm thêm
- { 𝐻𝑜: 𝜎𝐶 = 𝜎𝐾
𝐻1: 𝜎𝐶 < 𝜎𝐾
Sử dụng excel, Data/ Data Analysis/ F-test Two-sample for Variances, 𝛼 =0,05 :
Có làm thêm
Không làm thêm
P(F<=f)
F Critical
F-Test Two-Sample for Variances
Như vậy, p-value = 0,00136 < 𝛼 =0,05 → Bác bỏ 𝐻0, chấp nhận 𝐻1
Kết luận với mức ý nghĩa 5%, mức chi tiêu của các sinh viên đang đi làm thêm ổn
định hơn (ít dao động hơn, đồng đều hơn) so với các sinh viên không đi làm thêm
2.4 Kiểm định mức chi tiêu trung bình hàng tháng của các bạn sinh viên đang đi làm thêm và không đi làm thêm là như nhau hay không?
- { 𝐻𝑜: 𝜇𝐶 = 𝜇𝐾
𝐻1: 𝜇𝐶 ≠ 𝜇𝐾
Với 𝜎𝐶 ≠ 𝜎𝐾, trong excel chọn Data/ Data Analysis/ t-Test: two-sample Assuming Unequal Variances, 𝛼 =0,05, ta có:
Không làm thêm
Hypothesized Mean
Trang 1616
t-Test: Two-Sample Assuming Unequal Variances
Đề bài: Sau khi tiến hành khảo sát 110 sv , ta thu được thống kê rằng: Có 60 sv đi làm
thêm, trung bình mức chi tiêu hàng tháng là 3,24 triệu/ng , độ lệch chuẩn hiệu chỉnh là 1tr/ng; 50 sv không đi làm thêm, trung bình mức chi tiêu hàng tháng là 3,22 triệu/ng,
độ lệch chuẩn hiệu chỉnh 1 triệu/người.Có thông tin cho rằng, mức chi tiêu trung bình hàng tháng của các bạn sinh viên đang đi làm thêm và không đi làm thêm là như nhau Kiểm định giả thuyết vừa nêu
Giải:
Ta có: 𝑛𝑥 = 60; 𝑥̅ = 3,24; 𝑠𝑥 = 1: 𝑛𝑦 = 50; 𝑦̅ = 3,22; 𝑠𝑦 = 0,9
Gọi 𝜇𝑥, 𝜇𝑦 lần lượt là trung bình mức chi tiêu hàng tháng của sv đang đi làm thêm và
sv không đi làm thêm
Đặt giả thuyết {𝐻0: 𝜇𝑥 = 𝜇𝑦
𝐻1: 𝜇𝑥 ≠ 𝜇𝑦
Giá trị kiểm định: 𝑍 = 𝑥̅−𝑦̅−𝐷0
√ 𝜎𝑥2
𝑛𝑥+
𝜎𝑦2 𝑛𝑦
=3,24−3,22−0
√12
60 +0,9250
= 0,104
Với mức ý nghĩa 5%, ta có𝑍𝛼
2 = 𝜑−1(1−0,052 ) = 𝜑−1(0,045) = 1,96
Ta có |𝑍| < 𝑍𝛼
2 nên ta chấp nhận giả thuyết 𝐻0, bác bỏ giả thuyết 𝐻1
Kết luận: Với mức ý nghĩa 5%, mức chi tiêu trung bình của các sinh viên đang đi làm thêm giống mức chi tiêu trung bình của các bạn sinh viên không đi làm thêm
Kiểm tra kết quả qua bảng excel:
Như vậy, p-value = 0,05663 > 𝛼 =0,05 → Chấp nhận 𝐻0, bác bỏ 𝐻1
Vậy với mức ý nghĩa 5%, mức chi tiêu trung bình của các sinh viên đang đi làm thêm giống mức chi tiêu trung bình của các bạn sinh viên không đi làm thêm