khi mà dành vào việchọc tập giải trí của sinh viên và đó chính là kiểm định , giả lượng độ cận củasinh viên , Cuối cùng là tìm mối quan hệ của các khoảng thời gian trên và độcận của sinh
Trang 1GROUP ASSIGNMENT
MAS202 - MKT1616
LECTURE:NGUYEN VIET ANH
FALL 2022
Trang 2I Giới thiệu
- Population: Toàn bộ học sinh , sinh viên trong khuôn viên trường Đại học FPT
Hà Nội
- Parameter: Số thời gian học tập của sinh viên, số thời gian chơi game của sinh viên, số thời gian sử dụng MXH của sinh viên , Độ cận của sinh viên (sinh viên
ĐH FPT HN)
- Tính toán khoảng thời gian trung bình , độ lệch chuẩn … khi mà dành vào việc học tập giải trí của sinh viên và đó chính là kiểm định , giả lượng độ cận của sinh viên , Cuối cùng là tìm mối quan hệ của các khoảng thời gian trên và độ cận của sinh viên
II Thu thập dữ liệu mẫu
- 100% dữ liệu được sử dụng là dữ liệu sơ cấp được các thành viên trong
nhóm suy nghĩ và đặt câu hỏi sau đó đã phỏng vấn trực tiếp hơn 70 bạn sinh viên trong khuôn viên trường ĐH FPT HN
- Những dữ liệu đều ngẫu nhiên đó chính là: về khoảng thời gian, mỗi bạn sẽ cho những con số hoàn toàn khác nhau và sự trùng lặp là rất ít, độ cận cũng vậy
- Tất cả dữ liệu trên đều đáp ứng được những yêu cầu của 1 bài toán cần có như
là ta có thể tính được độ cận trung bình của sinh viên, giả định độ cận và có thể đưa ra một kết luận nữa là bài toán hồi quy tuyến tính nói lên được mối quan
hệ giữa việc sử dụng những khoảng thời gian trên có thể ảnh hưởng tới độ cận của sinh viên
- Tóm tắt kết quả : Qua khảo sát và tính toán thì ta có kết quả như sau
+ Đại diện phần Mô tả dữ liệu mẫu ( Kết quả học tập ) : Ta thấy được khoảng thời gian thấp và cao nhất lần lượt là 0.5 và 16 giờ , độ lệch chuẩn là 2.8797giờ , Thời gian trung bình là 5,3056 giờ
+ Sử dụng biểu đồ histogram
+ Đại diện phần tìm khoảng tin cậy ( Thời gian học tập ): Ta thấy được Với độ tin cậy 95%, trung bình dân số của "Thời gian học tập" sẽ nằm trong khoảng từ 4,6289 đến 5,9823
+ Về phần bài toán kiểm định giả thuyết : => Không có bằng chứng cho thấy trung bình dân số của "độ cận" lớn hơn 3
- Data :
III Mô tả dữ liệu mẫu
3.1 Thời gian học tập
2
Trang 3- Theo bảng ta có Min = 0.5 , Max = 16 , Mean = 5.3056 , Q1 = 3 , Q2 = 5 , Q3 = 7 , s = 2.8797
Mean = 𝑖=1 = 5.3056
𝑛
∑ 𝑥𝑖
𝑛
2
72+1 2
36𝑡ℎ 𝑣𝑎𝑙𝑢𝑒+37𝑡ℎ 𝑣𝑎𝑙𝑢𝑒 2
Mode là số xuất hiện nhiều lần nhất Mode = 5
Standard deviation = 𝑖=1 = 2.8797
𝑛
∑ (𝑥𝑖− 𝑥)2 𝑛−1
= ranked value= ranked value = 18 value = 3th
𝑄
1
𝑛+1
4
72+1 4
= ranked value= ranked value = 55thvalue = 7
𝑄
3
3(𝑛+1)
4
3(72+1) 4
- Biểu đồ
Trang 43.2 Thời gian sử dụng MXH
- Theo bảng ta có Min = 0 , Max = 7 , Mean = 2.4306 , Q1 = 1 , Q2 = 2 , Q3
= 3 , s = 1.5412
Mean = 𝑖=1 = 2.4306
𝑛
∑ 𝑥𝑖
𝑛
2
72+1 2
36𝑡ℎ 𝑣𝑎𝑙𝑢𝑒+37𝑡ℎ 𝑣𝑎𝑙𝑢𝑒 2
Mode là số xuất hiện nhiều lần nhất Mode = 3
Standard deviation = 𝑖=1 =1.5412
𝑛
∑ (𝑥
𝑖 − 𝑥)2 𝑛−1
= ranked value= ranked value = 18 value = 1th
𝑄
1
𝑛+1
4
72+1 4
= ranked value= ranked value = 55thvalue = 3
𝑄
3
3(𝑛+1)
4
3(72+1) 4
- Biểu đồ
3.1 Thời gian chơi game
4
Trang 5- Theo bảng ta có Min = 0 , Max = 9 , Mean = 2.2986 , Q1 = 0 , Q2 = 2 , Q3
= 4 , s = 2.3281
Mean = 𝑖=1 = 2.2986
𝑛
∑ 𝑥
𝑖
𝑛
Median (Q2)= 𝑛+12 ranked value= 72+12 ranked value = 36𝑡ℎ 𝑣𝑎𝑙𝑢𝑒+37𝑡ℎ 𝑣𝑎𝑙𝑢𝑒2 = 2 Mode là số xuất hiện nhiều lần nhất Mode = 0
Standard deviation = 𝑖=1 = 2.3281
𝑛
∑ (𝑥𝑖− 𝑥)2 𝑛−1
= ranked value= ranked value = 18 value = 0th
𝑄
1
𝑛+1
4
72+1 4
= ranked value= ranked value = 55thvalue = 4
𝑄
3
3(𝑛+1)
4
3(72+1) 4
- Biểu đồ
4.1 Độ cận
Trang 6- Theo bảng ta có Min = 0 , Max = 7 , Mean = 2.9132 , Q1 = 2 , Q2 = 3 , Q3 =
4 , s = 1.7753
Mean = 𝑖=1 = 2.9132
𝑛
∑ 𝑥𝑖
𝑛
2
72+1 2
36𝑡ℎ 𝑣𝑎𝑙𝑢𝑒+37𝑡ℎ 𝑣𝑎𝑙𝑢𝑒 2
Mode là số xuất hiện nhiều lần nhất Mode = 3
Standard deviation = 𝑖=1 = 1.7753
𝑛
∑ (𝑥𝑖− 𝑥)2 𝑛−1
= ranked value= ranked value = 18 value = 2th
= ranked value= ranked value = 55thvalue = 4
- Biểu đồ
6
Trang 7IV Tìm khoảng tin cậy
1 Tính toán và kết luận
a Thời gian học tập
- Ta có mean = 5.3056, sample standard deviation = 2.8797, n = 72, dạng bài toán tính CI for the mean với unknownσ
=> Áp dụng công thức
= 5.3056 ± E
mà E = t_0,025;71 2.8797/* 72= 0.6767
- Kết luận : 95% CI for the population mean of "thời gian học tập"
With 95% confidence, the population mean of "thời gian học tập" will be between 4,6289 to 5,9823
b Thời gian sử dụng MXH
Trang 8- Ta có mean = 2.4306, sample standard deviation = 1.5412, n = 72 , dạng bài toán tính CI for the mean với unknownσ
=> Áp dụng công thức
= 2.3206 ± E
mà E = t_0,025,71*1.5412/ 72= 0.3622
- Kết luận : 95% CI for the population mean of "thời gian sử dụng MXH"
With 95% confidence, the population mean of "thời gian sử dụng MXH" will
be between 2.0684 to 2.7928
c Thời gian chơi game
8
Trang 9- Ta có mean = 2.2986, sample standard deviation = 2.3281, n = 72, dạng bài toán tính CI for the mean unknownσ
- Áp dụng công thức
= 2.2986 ± E
mà E = t_0,025;71* 2.3281/ 72= 0.5471
- Kết luận : 95% CI for the population mean of "thời gian chơi game"
-With 95% confidence, the population mean of "thời gian chơi game " will be between 1.7515 to 2.8457
d Độ cận
Trang 10- Ta có mean = 2.9132, sample standard deviation = 1.7753, n = 72 , dạng bài toán tính CI for the mean unknownσ
- Áp dụng công thức
= 2.9132 ± E
mà E = t_0,025;71*1.7753/ 72= 0.4172
- Kết luận : 95% CI for the population mean of "Độ cận"
With 95% confidence, the population mean of "độ cận" will be between 2.496
to 3.3304
VI Kiểm định giả thuyết
10
Trang 11- Ta có : Mean = 2.9132 , s = 1.7753, n=72
Question: Is there evidence that the population mean of "độ cận" is greater than 3 ?
- Xác định bài toán : Test for the mean unknownσ
- Xác định H0, H1 :
+ H_0: μ=3
+ H_1: μ>3
- t_critical value =tα; 𝑑𝑓 = 𝑡0 05; 71 = 1 6666
- Ta có công thức :
= 2.9132-3/1 7753/ 72 =-0.4149
- Kết luận : t_STAT =-0.4149, t_critical value = 1.6666
Because -0.4149 < 1.6666, DO NOT REJECT H0, REJECT H1
=> There is not evidence that the population mean of " độ cận " greater than 3
VII Hồi quy tuyến tính
Trang 121 Nêu X,Y
- X (biến độc lập): thời gian học tập, thời gian chơi game, thời gian sử dụng MXH
Y (biến phụ thuộc): GPA
2 Dữ liệu mẫu cần thiết để ước lượng "độ cận"
- Let E = ± 0 5
- t critical value =1.9939
- Standard Deviation =1.7753
- Vậy dữ liệu mẫu cần thiết là 51
3 Phương trình hồi quy
-V Lời kết
1 TỔNG HỢP KẾT QUẢ
a Mô tả dữ liệu mẫu
- Thời gian học tập : Min = 0.5 , Max = 16 , Mean = 5.3056 , Q1 = 3 , Q2 = 5
, Q3 = 7 , s = 2.8797
- Thời gian sử dụng MXH : Min = 0 , Max = 7 , Mean = 2.4306 , Q1 = 1 , Q2
= 2 , Q3 = 3 , s = 1.5412
12
Trang 13- Thời gian chơi game : Min = 0 , Max = 9 , Mean = 2.2986 , Q1 = 0 , Q2 = 2
, Q3 = 4 , s = 2.3281
- Độ cận : Min = 0 , Max = 7 , Mean = 2.9132 , Q1 = 2 , Q2 = 3 , Q3 = 4 , s =
1.7753
b Tìm khoảng tin cậy
- Thời gian học tập : With 95% confidence, the population mean of "thời gian học tập" will be between 4,6289 to 5,9823
- Thời gian sử dụng MXH : With 95% confidence, the population mean of "thời gian sử dụng MXH" will be between 2.0684 to 2.7928
- Thời gian chơi game : With 95% confidence, the population mean of "thời gian chơi game " will be between 1.7515 to 2.8457
- Độ cận : With 95% confidence, the population mean of "độ cận" will be between 2.496 to 3.3304
c Kiểm định giả thuyết
- Question: Is there evidence that the population mean of "độ cận" is greater than
3 ?
- ANSWER : There is not evidence that the population mean of " độ cận " greater than 3
d Hồi quy tuyến tính
-2 Ý nghĩa của project
- Việc ngày nay thời đại công nghệ số và việc học tập vô cùng áp lực dành cho các bạn học sinh , sinh viên thì chúng ta hãy cân bằng giữa sức khỏe và học tập bằng việc hãy luôn bảo vệ đôi mắt của chúng ta nhé Có một đôi mắt khỏe đẹp thì việc nhìn xa về tương lai cũng “ rõ ràng” hơn nhá
3 Kỹ năng học thêm được
- Cách làm việc nhóm khi đi thu thập dữ liệu , hiểu rõ hơn về các bài toán so với đời thực , cuối cùng đó chính là kỹ năng Excel
- Cuối cùng thì nhóm chúng em xin cảm ơn Thầy Việt Anh đã giảng dạy và support chúng em để hoàn thành bài report thành công nhất