Bộ đữ liệu chiều cao và cân nặng với 150 quan sát được chúng em thu thập băng mẫu khảo sát, phỏng vấn trực tiếp.. ¢ Tan sé Gidi tinh Nam xuat hién 66 lan va chiém 44% trong mau quan sát
Trang 1DAI HOC QUOC GIA THANH PHO HO CHi MINH TRUONG DAI HOC KINH TE - LUAT
Khoa : Kế Toán - Kiểm Toán
MÔN HỌC: THỐNG KÊ TRONG KINH DOANH BÀI BÁO CÁO KẾT QUÁ PHÂN TÍCH DỮ LIỆU VỀ CHIỂU CAO,
CAN NANG CUA MOT NHOM SINH VIEN BANG PHAN MEM
STATA
Tén thanh vién
1 Đào Thị Thanh Tâm - K234091095
2 Trần Nguyễn Khánh Huyền - K234091070
3 Trần Hồ Diễm Quỳnh - K234091094
4 Nguyễn Thị Ngọc Linh - K234091075
5 Nguyễn Thị Ngân - K234091083
Thời gian: HK2, 2023-2024
TP HCM, THÁNG 2 NĂM 2023
Trang 2Mô tả bộ dữ liệu:
1 Nữ
2 Nam
3 Nữ
4 Nữ
5 Nữ
6 Nữ
7 Nam
8 Nam
9 Nam
10 Nữ
11 Nữ
12 Nam
13 Nữ
14 Nữ
15 Nam
16 Nam
17 Nữ
18 Nam
19 Nữ
20 Nữ
21 Nam
22 Nữ
23 Nam
24 Nam
25 Nữ
26 Nữ
47
75
48
42
43
75
52
63
61
43
52
76
57
62
65
45
47
Chieucao
160
173
162
158
150
158
170
175
172
165
155
183
160
162
176
175
165
165
152
167
183
162
174
178
160
163
Dotuoi
17
19
16
18
20
18
22
18
19
19
17
20
20
19
21
20
21
19
16
17
22
19
21
22
18
18
Trang 327 Nữ
28 Nam
29 Nam
30 Nữ
31 Nam
32 Nam
33 Nam
34 Nam
35 Nữ
36 Nam
37 Nữ
38 Nam
39 Nam
40 Nam
41 Nam
42 Nữ
43 Nữ
44 Nữ
45 Nam
46 Nam
47 Nữ
48 Nữ
49 Nam
50 Nữ
51 Nam
52 Nữ
42
70
46
65
55
77
47
49
65
72
160
175
183
151
168
172
172
163
161
170
167
167
170
170
179
159
161
160
168
165
162
150
160
166
162
155
17
19
20
16
18
22
20
19
19
20
19
20
20
21
22
18
18
18
19
22
17
17
18
19
20
22
Trang 453 Nữ
54 Nữ
55 Nam
56 Nam
57 Nữ
58 Nam
59 Nam
60 Nữ
61 Nam
62 Nữ
63 Nữ
64 Nam
65 Nam
66 Nữ
67 Nam
68 Nữ
69 Nữ
70 Nam
71 Nữ
72 Nam
73 Nam
74 Nữ
75 Nam
76 Nam
77 Nữ
78 Nam
40
72
107
82
55
42
77
74
59
83
59
75
63
63
74
40
150
160
172
175
161
170
165
155
173
161
150
171
169
162
173
156
170
165
172
167
172
152
168
175
168
169
18
22
22
21
7
20
17
20
22
21
17
17
20
22
21
20
19
19
20
22
22
21
20
19
17
18
Trang 579 Nữ
80 Nữ
81 Nam
82 Nữ
83 Nam
84 Nữ
85 Nam
86 Nam
87 Nam
88 Nữ
89 Nam
90 Nữ
91 Nữ
92 Nữ
93 Nam
94 Nữ
95 Nam
96 Nữ
97 Nữ
98 Nữ
99 Nữ
100 Nam
101 Nữ
102 Nam
103 Nữ
104 Nữ
49
45
55
51
65
65
288
SS
53
72
45
35
47
69
41
46
52
159
151
175
160
185
158
176
177
160
165
177
162
157
161
178
158
176
162
165
155
156
175
156
152
171
16
16
17
18
19
20
21
22
18
16
17
20
19
21
22
16
17
18
19
20
21
22
16
7
18
19
Trang 6Bộ đữ liệu chiều cao và cân nặng với 150 quan sát được chúng em thu thập băng mẫu khảo sát, phỏng vấn trực tiếp
Phân loại:
Tênbiến Loại dữ liệu Thang đo Đơn vị
Tuoi Định lượng Thang ổo tỉ lệ
Gioitinh Định tính Thang đo định danh
Cannang ĐỊnh lượng Thang đo khoảng đơn vị đo khối lượng
Trang 7Chieucao Dinhluong Thang do khoang don vi do chiéu cao
Giải thích: Gồm các biến ( Variable): Dotuoi, Cannang, Chieucao
Mẫu quan sát: 150
Gọi XI là độ tuổi — XI (19.16 ~ 1.893401); tuôi nhỏ nhất là L6, cao nhất là 22
Gọi X2 là cân nặng —> X2 ( 57.62 ~ 13.33246); cân nặng nhỏ nhất là 35kg, cân nặng cao
nhất là 107kg
Gọi X3 là chiều cao — X3 ( 164.86 ~ 8.108352); chiều cao thấp nhất là 143cm, cao nhất
là 185cm
Giải thích:
Trung vị của biến Dotuoi = 19
Phuong sai = 3.584966
Hệ số nhọn = -0.0347333
Trang 8D6 nhon = 1.897961
Giai thich:
Trung vi cua bién Cannang = 55 Phuong sai = 152.0895
Hệ số nhọn = 0.8540095
Độ nhọn = 3.71489
Giải thích:
Trung vị của biến Chieucao = 165 Phuong sai = 65.74537
Trang 9Hé sé nhon = 0.0722514 D6 nhon = 2.600255
Trang 10Giai thich:
Bảng trên cho thấy sắp xếp tần số (Freq) và phần trăm (percent) tir cao dén thap, phan trăm tích lũy cộng phần trăm từ trên xuống (Cn.)
Vd: Cân nặng 48kg tần số xuất hiện là 13 lần và chiếm 8.67% của mẫu quan sát Yếu vị:
Vị dụ: Tìm yếu vị của biến Cannang, Chieucao, Dotuoi?
Vậy yếu vị của biến Cannang 1a 48, Chieucao 1a 160, Dotuoi là 20
Trang 11« - Đối với những máy chưa cài đặt săn thì ta sử dụng lệnh sau đề cài đặt:
Ví dụ: Xác định xem có bao nhiêu người thừa cân ( Chỉ số BMI >= 23 ) 2
Giải thích:
biến 0 là bình thường, biến I là thừa cân
Từ kết quả cho thấy có :
+ 36 người thừa cân, chiếm 24% của mẫu quan sát
+ 114 người có cân nặng bình thường, chiếm 76% của mẫu quan sát
Mã hóa biến định tính Gioitinh
Dựa vào bảng số liệu:
Trang 12¢ Tan sé Gidi tinh Nam xuat hién 66 lan va chiém 44% trong mau quan sát
« _ Tần số Giới tính Nữ xuất hiện 84 lần và chiếm 56% trong mẫu quan sát
Dùng lệnh bysort GioitinhMH: sum Cannang đề tách cân nặng của nam và nữ ra riêng
Giải thích: Dựa vào bảng số liệu
11.19386, người có cân nặng cao nhất là 107 và nhỏ nhất là 45
« - Nữ: Có 84 người, cân nặng trung bình là 50.77381 có độ lệch chuan 1a 8.191019,
người có cân nặng cao nhất là 85 và nhỏ nhất là 35
Ước lượng khoảng tin cậy
Ví dụ 1: Hãy ước lượng chiều cao trung bình của tông thế với độ tin cậy 99%,
Giải thích: Với độ tin cậy 99% thì chiều cao trung bình nằm trong khoảng từ 163.1326
đến 166.5874
Vĩ đụ 2: Hãy ước lượng cân nặng trung bình của nam và nữ ở mức tin cậy 90%
Trang 13Giải thích: Với độ tin cậy 90% thì cân nặng trung bình của Nam năm trong khoảng từ
64.03417 đến 68.6325 và của Nữ năm trong khoảng từ 49.28719 đến 52.26043
Ví dụ 4: Ước lượng chỉ số bmi trung bình của nữ với mức tin cậy 80% ?
Giải thích: Với độ tin cậy 80% thì chỉ số bmi trung bình của nữ nằm trong khoảng từ
19.40287 đến 20.24657
Phân tổ dữ liệu
Ví dụ: Phân tổ biến Cannang
Trang 14- gen Cannangpt = Cannang
- recode Cannangpt (35/5@=1) (51/65=2) (
> 66/80=3) (81/95=4) (96/110=5)
(15@ changes made to Cannangpt)
- tab Cannangpt
> Cum
|
>
> 37.33
> 76.67
> 96.00
> 99.33
> 100.00
|
>
Total | 159 190.09
Giải thích:
Từ 30-50køg có tần số tích lũy là 37.33% có tần số xuất hiện là 56 lần chiếm 37.33% trong mẫu quan sát, 5I-65kg có tần số tích lũy là 76.67% có tần số xuất hiện là 59 lần chiếm 39.33% trong mau quan sat, 66-80kg có tần số tích lũy là 96% có tần số xuất hiện là 29 lần chiếm 19.33% trong mẫu quan sát, 81-95kg có tần số tích lũy là 99.33% có tần số xuất hiện là 5 lần chiếm 3.33% trong mẫu quan sát, 96-110kg có tần số tích lũy là 100%
có tân số xuất hiện là I lân chiêm 0.67% trong mau quan sat
Cac dang biéu dé:
Biểu đồ tròn:
Ví dụ: Vẽ biểu đồ tròn của biến Cannangpt và dán nhãn cho từng giá trị:
Trang 15Graphics Legend -> Pie Chart -> Override default keys -> Nhap nhan can gan cho Biểu đồ
v Standard legend options (legend)
Legend behavior
O Default
© Show legend
O Hide legend
@ Override default keys
Specify order of keys and optionally change labels:
1 "35-50 kg” 2 "51-65 kg” 3 "66-80 kg" 4 "81-95 kg" 5 "96-110 kg"
Cach hién thị tỷ lệ phần tram: Graphics -> Pie Chart -> Slices -> Label properties (all) Label type -> Percent -> Accept
Két qua:
Tỉ lệ cân nặng
MM 35-50 kg MMM 51-65 kg
MN 66-80 kg I) 81-95 kg MMM 96-110 kg
Nh
ân xét: Số sinh viên có cân nặng từ 35-50kg chiém 37.33%, tir 51-65kg chiếm tỉ lệ cao
Trang 16nhat 1a 39.33%, 66-80kg chiém 19.33%, 81-95kg chiém 3.33%, 96-110kg chiém ti 1é thấp nhất là 0.67%
Biểu đồ cột:
Ví dụ: Vẽ biểu đồ tròn của biến Cannangpt và dán nhãn cho từng giá trị:
Graphics -> Histogram ->Legens -> Main (dé hién thi phan tram)
3 histogram - Histograms for continuous and categorical variables
Standard legend options (legend)
Legend behavior
O Default
O Show legend
O Hide legend
@ Override default keys
Specify order of keys and optionally change labels:
1 “30-50 kg” 2 “51-65 kg" 3 “66-80 kg” 4 “81-95 kg” 5 “96-110 kg”
Data
L) Width of bins O Frequency
Bar label properties * (Recalculate bin sizes when by( is specified
Két qua:
Trang 1739.33
#1 37.33
=
œ
te
ON
o
C4
3.333
.6667
Cannangpt
— 30-50kg
51-65 kg 66-80 kg 81-95 kg 96-110 kg
Nhận xét:
- Số sinh viên có cân nặng từ 30-50kg chiếm 37.33%, từ 51-65kg chiếm tỉ lệ cao nhất là 39.33%, 66-80kg chiếm 19.33%, 81-95kg chiếm 3.33%, 96-110kg chiếm tỉ lệ thấp nhất
là 0.67%
- Cột giá trị đạt mode nằm trong khoảng cột giá trị từ 5I-65kg Cột giá trị thấp nhất trong khoảng từ 96-L 10kg
Kiếm dinh
Ví dụ 1: Kiêm định cân nặng trung bình của mẫu = 55kg là đúng hay sai ?
Trang 18One-sample t test
Nhận xét:
« - Với cặp Ho: t=55, HI: t<55, ta thay P- Value = 99.49% > 5% —› chấp nhận Ho, bác bỏ HI
« - Với cặp Ho: u=55, HI: tu khác 55, ta thay P - Value = 1.02% < 5% — bac bo Ho,
chấp nhận HI
¢ Voi cap Ho: u= 55, HI: > 55, ta thay P - Value = 0.51% < 5% — bác bỏ Ho,
chấp nhận HI
Kết luận: Vậy cân nặng trung bình của mẫu quan sát là lớn hơn 55kg
Ví dụ 2: Hãy kiêm định cân nặng trung bình của Nam có bằng 70kg hay không ?
bysort GioitinhMH: ttest Cannang = 70
:> GioitinhMH = Nam
)ne-sample t test
Pr(T < t) = 9.0949 Pr(|T| > |t|) = @898 Pr(T > t) = 0.9951
Giải thích:
« - Với cặp Ho: t=70, HI: q<70, ta thấy P- Value = 0.49% < 5% —> bác bỏ Ho, chấp nhận HI
« - Với cặp Ho: u=70, HI: tu khác 70, ta thay P - Value = 0.98% < 5% — bac bo Ho,
chấp nhận HI
Trang 19¢ Voi cap Ho: p= 70, HI: > 70, ta thay P - Value = 99.51% > 5% — chap nhan
Ho, bác bỏ HI
Kết luận: Vậy cân nặng trung bình của Nam là nhỏ hơn 70kg
Ví dụ 3: Hãy kiêm định phương sai chiều cao của cả Nam và Nữ có bằng nhau hay không
?
sdtest Chieucao, by( Gioitinh)
Jariance ratio test
Pr(F < f) = 9.8475 2*Pr(F > f) = 9.3050 Pr(F > f) = 0.1525
Giải thích:
Giả thuyết không (H0): Chiều cao trung bình của nam và nữ bằng nhau
Giả thuyết thay thế (Ha): Chiều cao trung bình của nam và nữ không bằng nhau Hàng quan trọng nhất trong bang là hàng "tỷ lệ" Hàng này hiển thị thống kê F và giá trị p tương ứng Trong trường hợp này, thống kê F là 1,2687 và giá trị p là 0,3050
Vì giá trị p lớn hơn 0,05 nên chúng tôi không thể bác bỏ giả thuyết khống và kết
luận rằng không có đủ bằng chứng cho thấy chiều cao trung bình của nam và nữ là khác nhau đáng kế
Ví dụ 4: Kiêm định phương sai của chỉ số bmi của nam có bằng L hay không
Trang 20-> GioitinhMH =
2ne-sample test
Nam
of variance
Pr(C < c) = 1.0000 2*Pr(C > c) = 0.9998 Pr(C > c) = 0.0000 Giải thích:
Giả thuyết không (H0) là phương sai tong thé bang 1
Giả thuyết thay thế (Ha) là phương sai tổng thé khong bang 1
Thống kê kiểm tra là thống kê chỉ bình phương, được tính như sau:
chi-squared = (n - 1) # (s2 - 1}^2/1
Ở đây:
«e nlàcỡ mâu
« - s^2 là phương sai mẫu
Bậc tự do của phép thử là n - l
Trong trường hợp này, cỡ mẫu là 66, phương sai mẫu là 3,552371 và thống kê chỉ bình phương là 820,2571 Bậc tự do là 65
Giá trị p cho thử nghiệm được tính bằng cách sử đụng phân phối chi bình phương với 65 bậc tự do Trong trường hợp này, giá trị p là 0,0000
Vì giá trị p nhỏ hơn 0,05 nên chúng tôi bác bỏ giá thuyết khống và kết luận rằng phương sai tổng thể khác biệt đáng kể so với I
Kết luận: Vậy phương sai của chỉ số BMI của nam có khác biệt đáng kế so với 1 Điều
này cho thấy biến BMI không có phân phối chuẩn
THE END