1. Trang chủ
  2. » Luận Văn - Báo Cáo

bài báo cáo kết quả phân tích dữ liệu về chiều cao cân nặng của một nhóm sinh viên bằng phần mềm stata

20 0 0
Tài liệu được quét OCR, nội dung có thể không chính xác
Tài liệu đã được kiểm tra trùng lặp

Đang tải... (xem toàn văn)

Tài liệu hạn chế xem trước, để xem đầy đủ mời bạn chọn Tải xuống

THÔNG TIN TÀI LIỆU

Thông tin cơ bản

Tiêu đề Phân Tích Dữ Liệu Về Chiều Cao, Cân Nặng Của Một Nhóm Sinh Viên Bằng Phần Mềm STATA
Tác giả Đào Thị Thanh Tâm, Trần Nguyễn Khánh Huyền, Trần Hồ Diễm Quỳnh, Nguyễn Thị Ngọc Linh, Nguyễn Thị Ngân
Trường học Trường Đại Học Kinh Tế - Luật
Chuyên ngành Thống Kê Trong Kinh Doanh
Thể loại Bài Báo Cáo
Năm xuất bản 2023-2024
Thành phố TP HCM
Định dạng
Số trang 20
Dung lượng 2,1 MB

Nội dung

Bộ đữ liệu chiều cao và cân nặng với 150 quan sát được chúng em thu thập băng mẫu khảo sát, phỏng vấn trực tiếp.. ¢ Tan sé Gidi tinh Nam xuat hién 66 lan va chiém 44% trong mau quan sát

Trang 1

DAI HOC QUOC GIA THANH PHO HO CHi MINH TRUONG DAI HOC KINH TE - LUAT

Khoa : Kế Toán - Kiểm Toán

MÔN HỌC: THỐNG KÊ TRONG KINH DOANH BÀI BÁO CÁO KẾT QUÁ PHÂN TÍCH DỮ LIỆU VỀ CHIỂU CAO,

CAN NANG CUA MOT NHOM SINH VIEN BANG PHAN MEM

STATA

Tén thanh vién

1 Đào Thị Thanh Tâm - K234091095

2 Trần Nguyễn Khánh Huyền - K234091070

3 Trần Hồ Diễm Quỳnh - K234091094

4 Nguyễn Thị Ngọc Linh - K234091075

5 Nguyễn Thị Ngân - K234091083

Thời gian: HK2, 2023-2024

TP HCM, THÁNG 2 NĂM 2023

Trang 2

Mô tả bộ dữ liệu:

1 Nữ

2 Nam

3 Nữ

4 Nữ

5 Nữ

6 Nữ

7 Nam

8 Nam

9 Nam

10 Nữ

11 Nữ

12 Nam

13 Nữ

14 Nữ

15 Nam

16 Nam

17 Nữ

18 Nam

19 Nữ

20 Nữ

21 Nam

22 Nữ

23 Nam

24 Nam

25 Nữ

26 Nữ

47

75

48

42

43

75

52

63

61

43

52

76

57

62

65

45

47

Chieucao

160

173

162

158

150

158

170

175

172

165

155

183

160

162

176

175

165

165

152

167

183

162

174

178

160

163

Dotuoi

17

19

16

18

20

18

22

18

19

19

17

20

20

19

21

20

21

19

16

17

22

19

21

22

18

18

Trang 3

27 Nữ

28 Nam

29 Nam

30 Nữ

31 Nam

32 Nam

33 Nam

34 Nam

35 Nữ

36 Nam

37 Nữ

38 Nam

39 Nam

40 Nam

41 Nam

42 Nữ

43 Nữ

44 Nữ

45 Nam

46 Nam

47 Nữ

48 Nữ

49 Nam

50 Nữ

51 Nam

52 Nữ

42

70

46

65

55

77

47

49

65

72

160

175

183

151

168

172

172

163

161

170

167

167

170

170

179

159

161

160

168

165

162

150

160

166

162

155

17

19

20

16

18

22

20

19

19

20

19

20

20

21

22

18

18

18

19

22

17

17

18

19

20

22

Trang 4

53 Nữ

54 Nữ

55 Nam

56 Nam

57 Nữ

58 Nam

59 Nam

60 Nữ

61 Nam

62 Nữ

63 Nữ

64 Nam

65 Nam

66 Nữ

67 Nam

68 Nữ

69 Nữ

70 Nam

71 Nữ

72 Nam

73 Nam

74 Nữ

75 Nam

76 Nam

77 Nữ

78 Nam

40

72

107

82

55

42

77

74

59

83

59

75

63

63

74

40

150

160

172

175

161

170

165

155

173

161

150

171

169

162

173

156

170

165

172

167

172

152

168

175

168

169

18

22

22

21

7

20

17

20

22

21

17

17

20

22

21

20

19

19

20

22

22

21

20

19

17

18

Trang 5

79 Nữ

80 Nữ

81 Nam

82 Nữ

83 Nam

84 Nữ

85 Nam

86 Nam

87 Nam

88 Nữ

89 Nam

90 Nữ

91 Nữ

92 Nữ

93 Nam

94 Nữ

95 Nam

96 Nữ

97 Nữ

98 Nữ

99 Nữ

100 Nam

101 Nữ

102 Nam

103 Nữ

104 Nữ

49

45

55

51

65

65

288

SS

53

72

45

35

47

69

41

46

52

159

151

175

160

185

158

176

177

160

165

177

162

157

161

178

158

176

162

165

155

156

175

156

152

171

16

16

17

18

19

20

21

22

18

16

17

20

19

21

22

16

17

18

19

20

21

22

16

7

18

19

Trang 6

Bộ đữ liệu chiều cao và cân nặng với 150 quan sát được chúng em thu thập băng mẫu khảo sát, phỏng vấn trực tiếp

Phân loại:

Tênbiến Loại dữ liệu Thang đo Đơn vị

Tuoi Định lượng Thang ổo tỉ lệ

Gioitinh Định tính Thang đo định danh

Cannang ĐỊnh lượng Thang đo khoảng đơn vị đo khối lượng

Trang 7

Chieucao Dinhluong Thang do khoang don vi do chiéu cao

Giải thích: Gồm các biến ( Variable): Dotuoi, Cannang, Chieucao

Mẫu quan sát: 150

Gọi XI là độ tuổi — XI (19.16 ~ 1.893401); tuôi nhỏ nhất là L6, cao nhất là 22

Gọi X2 là cân nặng —> X2 ( 57.62 ~ 13.33246); cân nặng nhỏ nhất là 35kg, cân nặng cao

nhất là 107kg

Gọi X3 là chiều cao — X3 ( 164.86 ~ 8.108352); chiều cao thấp nhất là 143cm, cao nhất

là 185cm

Giải thích:

Trung vị của biến Dotuoi = 19

Phuong sai = 3.584966

Hệ số nhọn = -0.0347333

Trang 8

D6 nhon = 1.897961

Giai thich:

Trung vi cua bién Cannang = 55 Phuong sai = 152.0895

Hệ số nhọn = 0.8540095

Độ nhọn = 3.71489

Giải thích:

Trung vị của biến Chieucao = 165 Phuong sai = 65.74537

Trang 9

Hé sé nhon = 0.0722514 D6 nhon = 2.600255

Trang 10

Giai thich:

Bảng trên cho thấy sắp xếp tần số (Freq) và phần trăm (percent) tir cao dén thap, phan trăm tích lũy cộng phần trăm từ trên xuống (Cn.)

Vd: Cân nặng 48kg tần số xuất hiện là 13 lần và chiếm 8.67% của mẫu quan sát Yếu vị:

Vị dụ: Tìm yếu vị của biến Cannang, Chieucao, Dotuoi?

Vậy yếu vị của biến Cannang 1a 48, Chieucao 1a 160, Dotuoi là 20

Trang 11

« - Đối với những máy chưa cài đặt săn thì ta sử dụng lệnh sau đề cài đặt:

Ví dụ: Xác định xem có bao nhiêu người thừa cân ( Chỉ số BMI >= 23 ) 2

Giải thích:

biến 0 là bình thường, biến I là thừa cân

Từ kết quả cho thấy có :

+ 36 người thừa cân, chiếm 24% của mẫu quan sát

+ 114 người có cân nặng bình thường, chiếm 76% của mẫu quan sát

Mã hóa biến định tính Gioitinh

Dựa vào bảng số liệu:

Trang 12

¢ Tan sé Gidi tinh Nam xuat hién 66 lan va chiém 44% trong mau quan sát

« _ Tần số Giới tính Nữ xuất hiện 84 lần và chiếm 56% trong mẫu quan sát

Dùng lệnh bysort GioitinhMH: sum Cannang đề tách cân nặng của nam và nữ ra riêng

Giải thích: Dựa vào bảng số liệu

11.19386, người có cân nặng cao nhất là 107 và nhỏ nhất là 45

« - Nữ: Có 84 người, cân nặng trung bình là 50.77381 có độ lệch chuan 1a 8.191019,

người có cân nặng cao nhất là 85 và nhỏ nhất là 35

Ước lượng khoảng tin cậy

Ví dụ 1: Hãy ước lượng chiều cao trung bình của tông thế với độ tin cậy 99%,

Giải thích: Với độ tin cậy 99% thì chiều cao trung bình nằm trong khoảng từ 163.1326

đến 166.5874

Vĩ đụ 2: Hãy ước lượng cân nặng trung bình của nam và nữ ở mức tin cậy 90%

Trang 13

Giải thích: Với độ tin cậy 90% thì cân nặng trung bình của Nam năm trong khoảng từ

64.03417 đến 68.6325 và của Nữ năm trong khoảng từ 49.28719 đến 52.26043

Ví dụ 4: Ước lượng chỉ số bmi trung bình của nữ với mức tin cậy 80% ?

Giải thích: Với độ tin cậy 80% thì chỉ số bmi trung bình của nữ nằm trong khoảng từ

19.40287 đến 20.24657

Phân tổ dữ liệu

Ví dụ: Phân tổ biến Cannang

Trang 14

- gen Cannangpt = Cannang

- recode Cannangpt (35/5@=1) (51/65=2) (

> 66/80=3) (81/95=4) (96/110=5)

(15@ changes made to Cannangpt)

- tab Cannangpt

> Cum

|

>

> 37.33

> 76.67

> 96.00

> 99.33

> 100.00

|

>

Total | 159 190.09

Giải thích:

Từ 30-50køg có tần số tích lũy là 37.33% có tần số xuất hiện là 56 lần chiếm 37.33% trong mẫu quan sát, 5I-65kg có tần số tích lũy là 76.67% có tần số xuất hiện là 59 lần chiếm 39.33% trong mau quan sat, 66-80kg có tần số tích lũy là 96% có tần số xuất hiện là 29 lần chiếm 19.33% trong mẫu quan sát, 81-95kg có tần số tích lũy là 99.33% có tần số xuất hiện là 5 lần chiếm 3.33% trong mẫu quan sát, 96-110kg có tần số tích lũy là 100%

có tân số xuất hiện là I lân chiêm 0.67% trong mau quan sat

Cac dang biéu dé:

Biểu đồ tròn:

Ví dụ: Vẽ biểu đồ tròn của biến Cannangpt và dán nhãn cho từng giá trị:

Trang 15

Graphics Legend -> Pie Chart -> Override default keys -> Nhap nhan can gan cho Biểu đồ

v Standard legend options (legend)

Legend behavior

O Default

© Show legend

O Hide legend

@ Override default keys

Specify order of keys and optionally change labels:

1 "35-50 kg” 2 "51-65 kg” 3 "66-80 kg" 4 "81-95 kg" 5 "96-110 kg"

Cach hién thị tỷ lệ phần tram: Graphics -> Pie Chart -> Slices -> Label properties (all) Label type -> Percent -> Accept

Két qua:

Tỉ lệ cân nặng

MM 35-50 kg MMM 51-65 kg

MN 66-80 kg I) 81-95 kg MMM 96-110 kg

Nh

ân xét: Số sinh viên có cân nặng từ 35-50kg chiém 37.33%, tir 51-65kg chiếm tỉ lệ cao

Trang 16

nhat 1a 39.33%, 66-80kg chiém 19.33%, 81-95kg chiém 3.33%, 96-110kg chiém ti 1é thấp nhất là 0.67%

Biểu đồ cột:

Ví dụ: Vẽ biểu đồ tròn của biến Cannangpt và dán nhãn cho từng giá trị:

Graphics -> Histogram ->Legens -> Main (dé hién thi phan tram)

3 histogram - Histograms for continuous and categorical variables

Standard legend options (legend)

Legend behavior

O Default

O Show legend

O Hide legend

@ Override default keys

Specify order of keys and optionally change labels:

1 “30-50 kg” 2 “51-65 kg" 3 “66-80 kg” 4 “81-95 kg” 5 “96-110 kg”

Data

L) Width of bins O Frequency

Bar label properties * (Recalculate bin sizes when by( is specified

Két qua:

Trang 17

39.33

#1 37.33

=

œ

te

ON

o

C4

3.333

.6667

Cannangpt

— 30-50kg

51-65 kg 66-80 kg 81-95 kg 96-110 kg

Nhận xét:

- Số sinh viên có cân nặng từ 30-50kg chiếm 37.33%, từ 51-65kg chiếm tỉ lệ cao nhất là 39.33%, 66-80kg chiếm 19.33%, 81-95kg chiếm 3.33%, 96-110kg chiếm tỉ lệ thấp nhất

là 0.67%

- Cột giá trị đạt mode nằm trong khoảng cột giá trị từ 5I-65kg Cột giá trị thấp nhất trong khoảng từ 96-L 10kg

Kiếm dinh

Ví dụ 1: Kiêm định cân nặng trung bình của mẫu = 55kg là đúng hay sai ?

Trang 18

One-sample t test

Nhận xét:

« - Với cặp Ho: t=55, HI: t<55, ta thay P- Value = 99.49% > 5% —› chấp nhận Ho, bác bỏ HI

« - Với cặp Ho: u=55, HI: tu khác 55, ta thay P - Value = 1.02% < 5% — bac bo Ho,

chấp nhận HI

¢ Voi cap Ho: u= 55, HI: > 55, ta thay P - Value = 0.51% < 5% — bác bỏ Ho,

chấp nhận HI

Kết luận: Vậy cân nặng trung bình của mẫu quan sát là lớn hơn 55kg

Ví dụ 2: Hãy kiêm định cân nặng trung bình của Nam có bằng 70kg hay không ?

bysort GioitinhMH: ttest Cannang = 70

:> GioitinhMH = Nam

)ne-sample t test

Pr(T < t) = 9.0949 Pr(|T| > |t|) = @898 Pr(T > t) = 0.9951

Giải thích:

« - Với cặp Ho: t=70, HI: q<70, ta thấy P- Value = 0.49% < 5% —> bác bỏ Ho, chấp nhận HI

« - Với cặp Ho: u=70, HI: tu khác 70, ta thay P - Value = 0.98% < 5% — bac bo Ho,

chấp nhận HI

Trang 19

¢ Voi cap Ho: p= 70, HI: > 70, ta thay P - Value = 99.51% > 5% — chap nhan

Ho, bác bỏ HI

Kết luận: Vậy cân nặng trung bình của Nam là nhỏ hơn 70kg

Ví dụ 3: Hãy kiêm định phương sai chiều cao của cả Nam và Nữ có bằng nhau hay không

?

sdtest Chieucao, by( Gioitinh)

Jariance ratio test

Pr(F < f) = 9.8475 2*Pr(F > f) = 9.3050 Pr(F > f) = 0.1525

Giải thích:

Giả thuyết không (H0): Chiều cao trung bình của nam và nữ bằng nhau

Giả thuyết thay thế (Ha): Chiều cao trung bình của nam và nữ không bằng nhau Hàng quan trọng nhất trong bang là hàng "tỷ lệ" Hàng này hiển thị thống kê F và giá trị p tương ứng Trong trường hợp này, thống kê F là 1,2687 và giá trị p là 0,3050

Vì giá trị p lớn hơn 0,05 nên chúng tôi không thể bác bỏ giả thuyết khống và kết

luận rằng không có đủ bằng chứng cho thấy chiều cao trung bình của nam và nữ là khác nhau đáng kế

Ví dụ 4: Kiêm định phương sai của chỉ số bmi của nam có bằng L hay không

Trang 20

-> GioitinhMH =

2ne-sample test

Nam

of variance

Pr(C < c) = 1.0000 2*Pr(C > c) = 0.9998 Pr(C > c) = 0.0000 Giải thích:

Giả thuyết không (H0) là phương sai tong thé bang 1

Giả thuyết thay thế (Ha) là phương sai tổng thé khong bang 1

Thống kê kiểm tra là thống kê chỉ bình phương, được tính như sau:

chi-squared = (n - 1) # (s2 - 1}^2/1

Ở đây:

«e nlàcỡ mâu

« - s^2 là phương sai mẫu

Bậc tự do của phép thử là n - l

Trong trường hợp này, cỡ mẫu là 66, phương sai mẫu là 3,552371 và thống kê chỉ bình phương là 820,2571 Bậc tự do là 65

Giá trị p cho thử nghiệm được tính bằng cách sử đụng phân phối chi bình phương với 65 bậc tự do Trong trường hợp này, giá trị p là 0,0000

Vì giá trị p nhỏ hơn 0,05 nên chúng tôi bác bỏ giá thuyết khống và kết luận rằng phương sai tổng thể khác biệt đáng kể so với I

Kết luận: Vậy phương sai của chỉ số BMI của nam có khác biệt đáng kế so với 1 Điều

này cho thấy biến BMI không có phân phối chuẩn

THE END

Ngày đăng: 27/08/2024, 20:55

TÀI LIỆU CÙNG NGƯỜI DÙNG

TÀI LIỆU LIÊN QUAN

w