1. Trang chủ
  2. » Luận Văn - Báo Cáo

Bài tập Thống kê mô tả

18 1,5K 1

Đang tải... (xem toàn văn)

Tài liệu hạn chế xem trước, để xem đầy đủ mời bạn chọn Tải xuống

THÔNG TIN TÀI LIỆU

Thông tin cơ bản

Định dạng
Số trang 18
Dung lượng 878,7 KB

Nội dung

GIỚI THIỆU VỀ BỘ DỮ LIỆU CHỈ SỐ IQ.... Bộ dữ liệu về chỉ số IQ câu lạc bộ toán học.... Bảng tần số, tần suất các trường dữ liệu .... Các thước đo về vị trí tương đối .... Biều đồ hình qu

Trang 1

TRƯỜNG ĐẠI HỌC KHOA HỌC TỰ NHIÊN KHOA CÔNG NGHỆ THÔNG TIN

MÔN HỌC: XÁC SUẤT THỐNG KÊ CHUYÊN SÂU

THỰC NGHIỆM THỐNG KÊ MÔ TẢ

BẰNG NGÔN NGỮ R

GVHD: PGS.TS ĐINH NGỌC THANH HV: LƯƠNG MINH LIÊM PHA - 17C12014 KHÓA: 2017-2019

TPHCM, 07/2018

Trang 2

MỤC LỤC

1 GIỚI THIỆU VỀ BỘ DỮ LIỆU CHỈ SỐ IQ 3

1.1 Bộ dữ liệu về chỉ số IQ câu lạc bộ toán học 3

1.2 Nạp và hiển thị dữ liệu: 3

2 CÁC THAM SỐ THỐNG KÊ MÔ TẢ 5

2.1 Bảng tần số, tần suất các trường dữ liệu 5

2.2 Đo lường khuynh hướng trung tâm 6

2.2.1 Giá trị trung bình chỉ số IQ 6

2.2.2 Giá trị trung vị chỉ số IQ 6

2.2.3 Giá trị mode chỉ số IQ 6

2.3 Đo lường mức độ phân tán 7

2.3.1 Phương sai chỉ số IQ 7

2.3.2 Độ lệch chuẩn chỉ số IQ 7

2.4 Các thước đo về vị trí tương đối 7

2.4.1 Khoảng phân vị chỉ số IQ 7

2.4.2 Khoảng biến thiên của chỉ số IQ 7

3 CÁC BIỂU ĐỒ, ĐỒ THỊ MÔ TẢ 8

3.1 Biểu đồ tần số, tần suất chỉ số IQ 8

3.2 Biểu đồ hộp chỉ số IQ 9

3.3 Biều đồ hình quạt về các lớp trí tuệ của chỉ số IQ 10

3.4 Biểu đồ thanh phân loại trí tuệ chỉ số IQ 13

3.5 Đồ thị cành lá chỉ số IQ 13

4 THỐNG KÊ GIỮA NAM VÀ NỮ 14

4.1 Thống kê xem nhóm nào có trí thông minh cao hơn 14

4.2 Kiểm định t-test 15

5 BỘ DỮ LIỆU VỀ CHIỀU CAO CỦA 10 ĐỨA TRẺ THEO THÁNG TUỔI 16

5.1 Nạp và đọc dữ liệu: 16

5.2 Đồ thị phân tán chiều cao và tháng tuổi 16

5.3 Đường biểu diễn tương quan giữa chiều cao và tháng tuổi 17

TÀI LIỆU THAM KHẢO 18

Trang 3

1 GIỚI THIỆU VỀ BỘ DỮ LIỆU CHỈ SỐ IQ

1.1 Bộ dữ liệu về chỉ số IQ câu lạc bộ toán học

Bộ dữ liệu thu thập gồm chỉ số IQ của 100 người trong câu lạc bộ toán học với các trường: STT, ChiSoIQ, GioiTinh

sát

khảo sát

khảo sát 1.2 Nạp và hiển thị dữ liệu:

Thiết lập thư mục làm việc vào đường dẫn D:/BAITAP

> #Thiet lap thu muc lam viec

> setwd("D:/BAITAP")

Đọc dữ liệu chisoIQ.csv lưu vào biến data và hiển thị dữ liệu

> #Doc va hien thi du lieu

> data<-read.csv("chisoIQ.csv",header=TRUE)

> data

STT ChiSoIQ GioiTinh

1 115 Nu

2 113 Nam

3 110 Nu

4 100 Nam

5 125 Nam

6 125 Nam

7 116 Nam

8 117 Nu

9 118 Nam

10 111 Nam

11 99 Nam

12 121 Nam

13 115 Nu

14 110 Nu

15 100 Nam

16 100 Nu

17 119 Nam

18 121 Nu

19 105 Nam

20 108 Nu

21 109 Nu

22 113 Nam

23 110 Nam

Trang 4

24 115 Nam

25 116 Nam

26 125 Nam

27 107 Nu

28 115 Nam

29 119 Nu

30 116 Nam

31 125 Nam

32 95 Nu

33 114 Nam

34 109 Nu

35 108 Nam

36 116 Nam

37 115 Nam

38 123 Nam

39 90 Nam

40 92 Nam

41 116 Nam

42 114 Nam

43 115 Nu

44 113 Nam

45 112 Nam

46 117 Nu

47 101 Nam

48 105 Nu

49 109 Nam

50 108 Nam

51 103 Nam

52 121 Nu

53 145 Nam

54 111 Nu

55 94 Nam

56 96 Nu

57 94 Nam

58 115 Nam

59 116 Nu

60 100 Nam

61 101 Nu

62 103 Nam

63 104 Nam

64 105 Nam

65 114 Nu

66 119 Nam

67 121 Nu

68 109 Nam

69 108 Nam

70 116 Nam

71 110 Nam

72 130 Nam

73 140 Nu

74 145 Nam

75 120 Nu

76 105 Nam

77 120 Nam

78 124 Nam

79 150 Nam

80 104 Nam

Trang 5

81 95 Nam

82 99 Nam

83 138 Nam

84 142 Nam

85 126 Nam

86 131 Nam

87 127 Nu

88 122 Nam

89 133 Nam

90 144 Nu

91 99 Nam

92 92 Nu

93 141 Nam

94 146 Nam

95 115 Nam

96 118 Nu

97 112 Nam

98 150 Nam

99 135 Nu

100 116 Nam

Lưu và nạp lại dữ liệu cho những lần sử dụng kế tiếp

> # Luu du lieu

> save(data,file="data.rda")

> # Nap lai du lieu data vao R

> load("data.rda")

Truy cập nội dung các biến của khung dữ liệu trực tiếp bằng tên biến nhờ vào hàm attach

> #truy cap truc tiep

> attach(data)

2 CÁC THAM SỐ THỐNG KÊ MÔ TẢ

2.1 Bảng tần số, tần suất các trường dữ liệu

Bảng tần số chỉ số IQ

> table(ChiSoIQ)

ChiSoIQ

90 92 94 95 96 99 100 101 103 104 105 107 108 109 110 111 112 113 114

1 2 2 2 1 3 4 2 2 2 4 1 4 4 4 2 2 3 3

115 116 117 118 119 120 121 122 123 124 125 126 127 130 131 133 135 138 140

8 8 2 2 3 2 4 1 1 1 4 1 1 1 1 1 1 1 1

141 142 144 145 146 150

1 1 1 2 1 2

Bảng tần suất chỉ số IQ

> tableChiSoIQ<-table(ChiSoIQ)

Trang 6

> prop.table(tableChiSoIQ)

ChiSoIQ

90 92 94 95 96 99 100 101 103 104 105 107 108 109 110 0.01 0.02 0.02 0.02 0.01 0.03 0.04 0.02 0.02 0.02 0.04 0.01 0.04 0.04 0.04

111 112 113 114 115 116 117 118 119 120 121 122 123 124 125 0.02 0.02 0.03 0.03 0.08 0.08 0.02 0.02 0.03 0.02 0.04 0.01 0.01 0.01 0.04

126 127 130 131 133 135 138 140 141 142 144 145 146 150 0.01 0.01 0.01 0.01 0.01 0.01 0.01 0.01 0.01 0.01 0.01 0.02 0.01 0.02

Bảng tần số giới tính

> table(GioiTinh)

GioiTinh

Nam Nu

70 30

Bảng tần suất giới tính

> tableGioiTinh<-table(GioiTinh)

> prop.table(tableGioiTinh)

GioiTinh

Nam Nu

0.7 0.3

2.2 Đo lường khuynh hướng trung tâm

2.2.1 Giá trị trung bình chỉ số IQ

> mean(ChiSoIQ)

[1] 115.14

Chỉ số IQ trung bình của câu lạc bộ là 115.4

2.2.2 Giá trị trung vị chỉ số IQ

> median(ChiSoIQ)

[1] 115

Vị trí trung tâm của chỉ số IQ là 115, nghĩa là không có quá 50% dữ liệu chỉ số IQ nhỏ hơn 115 và không có quá 50% dữ liệu chỉ số IQ lớn hơn 115

2.2.3 Giá trị mode chỉ số IQ

Giá trị IQ có tần số cao nhất:

> max(table(ChiSoIQ))

[1] 8

Vị trí có tần số cao nhất:

> which(table(ChiSoIQ)==8)

Trang 7

115 116

20 21

Kết quả trên cho thấy giá trị mode (giá trị chỉ số IQ mà tại đó có tần số cao nhất) là

115 hoặc 116 tại vị trí thứ 20, 21 trong bảng tần số

2.3 Đo lường mức độ phân tán

2.3.1 Phương sai chỉ số IQ

> var(ChiSoIQ)

[1] 184.1822

Kết quả trên cho thấy phương sai của chỉ số IQ là 184.1822

2.3.2 Độ lệch chuẩn chỉ số IQ

> sd(ChiSoIQ)

[1] 13.57138

Kết quả trên cho thấy độ lệch chuẩn của chỉ số IQ là 13.57138

2.4 Các thước đo về vị trí tương đối

2.4.1 Khoảng phân vị chỉ số IQ

Khoảng phân vị mặc định trong hàm quantile:

> quantile(ChiSoIQ)

0% 25% 50% 75% 100%

90.0 106.5 115.0 121.0 150.0

Từ kết quả trên cho thấy

- Không có người có IQ nhỏ hơn 90

- Khoảng 25% người có IQ nhỏ hơn 106.5 và 75% người có IQ cao hơn 106.5

- Khoảng 50% người có IQ nhỏ hơn 115 và 50% người có IQ cao hơn 115

- Khoảng 75% người có IQ nhỏ hơn 121và 25% người có IQ cao hơn 121

- 100% người có IQ nhỏ hơn hoặc bằng 150

Khoảng phân vị bất kỳ

> quantile(ChiSoIQ,0.9)

90%

135.3

Từ kết quả này cho thấy 90% số người có IQ nhỏ hơn 135.3

2.4.2 Khoảng biến thiên của chỉ số IQ

> max(ChiSoIQ)

[1] 150

Chỉ số IQ cao nhât là 150

Trang 8

> min(ChiSoIQ)

[1] 90

Chỉ số IQ thấp nhất là 90

> range(ChiSoIQ)

[1] 90 150

Chỉ số IQ nằm từ 90 đến 150

> range(ChiSoIQ)[2]-range(ChiSoIQ)[1]

[1] 60

Chỉ số IQ cao nhất lớn hơn chỉ số IQ thấp nhất là 60

> summary(ChiSoIQ)

Min 1st Qu Median Mean 3rd Qu Max

90.0 106.5 115.0 115.1 121.0 150.0

Tóm lại từ lệnh summary là có thể thấy các thông kê mô tả cơ bản và tần số của bộ

dữ liệu bao gồm : giá trị nhỏ nhất, tứ phân vị thứ nhất, trung vị median, giá trị trung bình mean, tứ phân vị thứ ba và giá trị lớn nhất Kết quả cho thấy độ trải giữa của dữ liệu chỉ

số IQ từ tứ phân vị thứ nhất đến tứ phân vị thứ 3 là 106.5 đến 121

3 CÁC BIỂU ĐỒ, ĐỒ THỊ MÔ TẢ

3.1 Biểu đồ tần số, tần suất chỉ số IQ

Biểu đồ tần số chỉ số IQ với 10 thanh

> hist(ChiSoIQ, breaks=10, col="blue", border = "white", xlab = "Chỉ số IQ", ylab = "Số lượng người", main = "Biểu đồ phân bố chỉ số IQ")

Trang 9

Biểu đồ tần số chỉ số IQ với 30 thanh

> hist(ChiSoIQ, breaks=30, col="blue", border = "white", xlab = "Chỉ số IQ", ylab = "Số lượng người", main = "Biểu đồ phân bố chỉ số IQ")

Biểu đồ tần suất chỉ số IQ với 30 thanh

> hist(ChiSoIQ, freq = FALSE, breaks=30, col="blue", border = "white", xlab

= "Chỉ số IQ", ylab = "Tần suất", main = "Biểu đồ tần suất chỉ số IQ")

3.2 Biểu đồ hộp chỉ số IQ

> boxplot(ChiSoIQ, col="blue", xlab="Chỉ số IQ", main="Biểu đồ hộp Chỉ số IQ")

Trang 10

3.3 Biều đồ hình quạt về các lớp trí tuệ của chỉ số IQ

Qui định về trí tuệ với các mức IQ như sau:

- Người bình thường: từ 85 <= IQ <=115

- Người thông minh: IQ từ 116 <= IQ <=130

- Người thông minh cao: IQ từ 131 <= IQ <=150

Ta có bảng trí tuệ tương ứng của 100 người:

> tritue<-c()

> tritue[ChiSoIQ<=115]<-"Bình thường"

> tritue[ChiSoIQ>115 & ChiSoIQ <=130]<-"Thông minh"

> tritue[ChiSoIQ>130]<-"Thông minh cao"

> tritue

[1] "Bình thuờng"

[2] "Bình thuờng"

[3] "Bình thuờng"

[4] "Bình thuờng"

[5] "Thông minh"

[6] "Thông minh"

[7] "Thông minh"

[8] "Thông minh"

[9] "Thông minh"

[10] "Bình thuờng"

[11] "Bình thuờng"

[12] "Thông minh"

[13] "Bình thuờng"

[14] "Bình thuờng"

[15] "Bình thuờng"

[16] "Bình thuờng"

[17] "Thông minh"

[18] "Thông minh"

[19] "Bình thuờng"

[20] "Bình thuờng"

[21] "Bình thuờng"

Trang 11

[22] "Bình thuờng" [23] "Bình thuờng" [24] "Bình thuờng" [25] "Thông minh" [26] "Thông minh" [27] "Bình thuờng" [28] "Bình thuờng" [29] "Thông minh" [30] "Thông minh" [31] "Thông minh" [32] "Bình thuờng" [33] "Bình thuờng" [34] "Bình thuờng" [35] "Bình thuờng" [36] "Thông minh" [37] "Bình thuờng" [38] "Thông minh" [39] "Bình thuờng" [40] "Bình thuờng" [41] "Thông minh" [42] "Bình thuờng" [43] "Bình thuờng" [44] "Bình thuờng" [45] "Bình thuờng" [46] "Thông minh" [47] "Bình thuờng" [48] "Bình thuờng" [49] "Bình thuờng" [50] "Bình thuờng" [51] "Bình thuờng" [52] "Thông minh" [53] "Thông minh cao" [54] "Bình thuờng" [55] "Bình thuờng" [56] "Bình thuờng" [57] "Bình thuờng" [58] "Bình thuờng" [59] "Thông minh" [60] "Bình thuờng" [61] "Bình thuờng" [62] "Bình thuờng" [63] "Bình thuờng" [64] "Bình thuờng" [65] "Bình thuờng" [66] "Thông minh" [67] "Thông minh" [68] "Bình thuờng" [69] "Bình thuờng" [70] "Thông minh" [71] "Bình thuờng" [72] "Thông minh" [73] "Thông minh cao" [74] "Thông minh cao" [75] "Thông minh"

Trang 12

[76] "Bình thuờng"

[77] "Thông minh"

[78] "Thông minh"

[79] "Thông minh cao"

[80] "Bình thuờng"

[81] "Bình thuờng"

[82] "Bình thuờng"

[83] "Thông minh cao"

[84] "Thông minh cao"

[85] "Thông minh"

[86] "Thông minh cao"

[87] "Thông minh"

[88] "Thông minh"

[89] "Thông minh cao"

[90] "Thông minh cao"

[91] "Bình thuờng"

[92] "Bình thuờng"

[93] "Thông minh cao"

[94] "Thông minh cao"

[95] "Bình thuờng"

[96] "Thông minh"

[97] "Bình thuờng"

[98] "Thông minh cao"

[99] "Thông minh cao"

[100] "Thông minh"

Tần số về trí tuệ

> table(tritue)

tritue

Bình thuờng Thông minh Thông minh cao

56 31 13

Tần suất về trí tuệ

> prop.table(tabletritue)

tritue

Bình thuờng Thông minh Thông minh cao

0.56 0.31 0.13

Vẽ biểu đồ hình quạt phân loại trí tuệ:

> pie(tabletritue, main = "Biểu đồ hình quạt phân loại trí tuệ")

Trang 13

3.4 Biểu đồ thanh phân loại trí tuệ chỉ số IQ

> barplot(phanloaitritue, main = "Biểu đồ thanh phân loại trí tuệ", xlab = "T

rí tuệ", ylab = "Tần số")

3.5 Đồ thị cành lá chỉ số IQ

> stem(ChiSoIQ)

The decimal point is 1 digit(s) to the right of the |

9 | 02244556999

Trang 14

10 | 00001133445555788889999

11 | 0000112233344455555555666666667788999

12 | 001111234555567

13 | 01358

14 | 0124556

15 | 00

4 THỐNG KÊ GIỮA NAM VÀ NỮ

4.1 Thống kê xem nhóm nào có trí thông minh cao hơn

Với qui định trí người thông minh có IQ >=116

Lập bảng thống kê tần số, tần suất:

> data01 <- data

> data01$thongminh[data01$ChiSoIQ>=116]<-"Thông minh"

> data01$thongminh[data01$ChiSoIQ<116]<-"Không thông minh"

> data01Nam<-data01$thongminh[data01$GioiTinh=="Nam"]

> tableNam<-table(data01Nam)

> data01Nu<-data01$thongminh[data01$GioiTinh=="Nu"]

> tableNu<-table(data01Nu)

> cbind("Tan so [Nam]" = tableNam, "Tan suat [Nam]" = prop.table(tableNam), + "Tan so [Nu]"=tableNu, "Tan suat [Nu]" = prop.table(tableNu))

Tan so [Nam] Tan suat [Nam] Tan so [Nu] Tan suat [Nu]

Không thông minh 39 0.5571429 17 0.5666667

Thông minh 31 0.4428571 13 0.4333333

Biểu đồ quạt tỷ lệ thông minh của Nam:

> tableNamPercent <- round(100*tableNam/sum(tableNam), 1)

> pie(tableNam, labels = tableNamPercent, main="Ty le thong minh cua Nam",co l=rainbow(length(tableNam)))

> legend("topright", c("Thong minh (>=116)","Khong thong minh (<116)"), cex

= 0.7,fill = rainbow(length(tableNam)))

Ngày đăng: 10/01/2019, 18:47

TỪ KHÓA LIÊN QUAN

w