GIỚI THIỆU VỀ BỘ DỮ LIỆU CHỈ SỐ IQ.... Bộ dữ liệu về chỉ số IQ câu lạc bộ toán học.... Bảng tần số, tần suất các trường dữ liệu .... Các thước đo về vị trí tương đối .... Biều đồ hình qu
Trang 1TRƯỜNG ĐẠI HỌC KHOA HỌC TỰ NHIÊN KHOA CÔNG NGHỆ THÔNG TIN
MÔN HỌC: XÁC SUẤT THỐNG KÊ CHUYÊN SÂU
THỰC NGHIỆM THỐNG KÊ MÔ TẢ
BẰNG NGÔN NGỮ R
GVHD: PGS.TS ĐINH NGỌC THANH HV: LƯƠNG MINH LIÊM PHA - 17C12014 KHÓA: 2017-2019
TPHCM, 07/2018
Trang 2MỤC LỤC
1 GIỚI THIỆU VỀ BỘ DỮ LIỆU CHỈ SỐ IQ 3
1.1 Bộ dữ liệu về chỉ số IQ câu lạc bộ toán học 3
1.2 Nạp và hiển thị dữ liệu: 3
2 CÁC THAM SỐ THỐNG KÊ MÔ TẢ 5
2.1 Bảng tần số, tần suất các trường dữ liệu 5
2.2 Đo lường khuynh hướng trung tâm 6
2.2.1 Giá trị trung bình chỉ số IQ 6
2.2.2 Giá trị trung vị chỉ số IQ 6
2.2.3 Giá trị mode chỉ số IQ 6
2.3 Đo lường mức độ phân tán 7
2.3.1 Phương sai chỉ số IQ 7
2.3.2 Độ lệch chuẩn chỉ số IQ 7
2.4 Các thước đo về vị trí tương đối 7
2.4.1 Khoảng phân vị chỉ số IQ 7
2.4.2 Khoảng biến thiên của chỉ số IQ 7
3 CÁC BIỂU ĐỒ, ĐỒ THỊ MÔ TẢ 8
3.1 Biểu đồ tần số, tần suất chỉ số IQ 8
3.2 Biểu đồ hộp chỉ số IQ 9
3.3 Biều đồ hình quạt về các lớp trí tuệ của chỉ số IQ 10
3.4 Biểu đồ thanh phân loại trí tuệ chỉ số IQ 13
3.5 Đồ thị cành lá chỉ số IQ 13
4 THỐNG KÊ GIỮA NAM VÀ NỮ 14
4.1 Thống kê xem nhóm nào có trí thông minh cao hơn 14
4.2 Kiểm định t-test 15
5 BỘ DỮ LIỆU VỀ CHIỀU CAO CỦA 10 ĐỨA TRẺ THEO THÁNG TUỔI 16
5.1 Nạp và đọc dữ liệu: 16
5.2 Đồ thị phân tán chiều cao và tháng tuổi 16
5.3 Đường biểu diễn tương quan giữa chiều cao và tháng tuổi 17
TÀI LIỆU THAM KHẢO 18
Trang 31 GIỚI THIỆU VỀ BỘ DỮ LIỆU CHỈ SỐ IQ
1.1 Bộ dữ liệu về chỉ số IQ câu lạc bộ toán học
Bộ dữ liệu thu thập gồm chỉ số IQ của 100 người trong câu lạc bộ toán học với các trường: STT, ChiSoIQ, GioiTinh
sát
khảo sát
khảo sát 1.2 Nạp và hiển thị dữ liệu:
Thiết lập thư mục làm việc vào đường dẫn D:/BAITAP
> #Thiet lap thu muc lam viec
> setwd("D:/BAITAP")
Đọc dữ liệu chisoIQ.csv lưu vào biến data và hiển thị dữ liệu
> #Doc va hien thi du lieu
> data<-read.csv("chisoIQ.csv",header=TRUE)
> data
STT ChiSoIQ GioiTinh
1 115 Nu
2 113 Nam
3 110 Nu
4 100 Nam
5 125 Nam
6 125 Nam
7 116 Nam
8 117 Nu
9 118 Nam
10 111 Nam
11 99 Nam
12 121 Nam
13 115 Nu
14 110 Nu
15 100 Nam
16 100 Nu
17 119 Nam
18 121 Nu
19 105 Nam
20 108 Nu
21 109 Nu
22 113 Nam
23 110 Nam
Trang 424 115 Nam
25 116 Nam
26 125 Nam
27 107 Nu
28 115 Nam
29 119 Nu
30 116 Nam
31 125 Nam
32 95 Nu
33 114 Nam
34 109 Nu
35 108 Nam
36 116 Nam
37 115 Nam
38 123 Nam
39 90 Nam
40 92 Nam
41 116 Nam
42 114 Nam
43 115 Nu
44 113 Nam
45 112 Nam
46 117 Nu
47 101 Nam
48 105 Nu
49 109 Nam
50 108 Nam
51 103 Nam
52 121 Nu
53 145 Nam
54 111 Nu
55 94 Nam
56 96 Nu
57 94 Nam
58 115 Nam
59 116 Nu
60 100 Nam
61 101 Nu
62 103 Nam
63 104 Nam
64 105 Nam
65 114 Nu
66 119 Nam
67 121 Nu
68 109 Nam
69 108 Nam
70 116 Nam
71 110 Nam
72 130 Nam
73 140 Nu
74 145 Nam
75 120 Nu
76 105 Nam
77 120 Nam
78 124 Nam
79 150 Nam
80 104 Nam
Trang 581 95 Nam
82 99 Nam
83 138 Nam
84 142 Nam
85 126 Nam
86 131 Nam
87 127 Nu
88 122 Nam
89 133 Nam
90 144 Nu
91 99 Nam
92 92 Nu
93 141 Nam
94 146 Nam
95 115 Nam
96 118 Nu
97 112 Nam
98 150 Nam
99 135 Nu
100 116 Nam
Lưu và nạp lại dữ liệu cho những lần sử dụng kế tiếp
> # Luu du lieu
> save(data,file="data.rda")
> # Nap lai du lieu data vao R
> load("data.rda")
Truy cập nội dung các biến của khung dữ liệu trực tiếp bằng tên biến nhờ vào hàm attach
> #truy cap truc tiep
> attach(data)
2 CÁC THAM SỐ THỐNG KÊ MÔ TẢ
2.1 Bảng tần số, tần suất các trường dữ liệu
Bảng tần số chỉ số IQ
> table(ChiSoIQ)
ChiSoIQ
90 92 94 95 96 99 100 101 103 104 105 107 108 109 110 111 112 113 114
1 2 2 2 1 3 4 2 2 2 4 1 4 4 4 2 2 3 3
115 116 117 118 119 120 121 122 123 124 125 126 127 130 131 133 135 138 140
8 8 2 2 3 2 4 1 1 1 4 1 1 1 1 1 1 1 1
141 142 144 145 146 150
1 1 1 2 1 2
Bảng tần suất chỉ số IQ
> tableChiSoIQ<-table(ChiSoIQ)
Trang 6> prop.table(tableChiSoIQ)
ChiSoIQ
90 92 94 95 96 99 100 101 103 104 105 107 108 109 110 0.01 0.02 0.02 0.02 0.01 0.03 0.04 0.02 0.02 0.02 0.04 0.01 0.04 0.04 0.04
111 112 113 114 115 116 117 118 119 120 121 122 123 124 125 0.02 0.02 0.03 0.03 0.08 0.08 0.02 0.02 0.03 0.02 0.04 0.01 0.01 0.01 0.04
126 127 130 131 133 135 138 140 141 142 144 145 146 150 0.01 0.01 0.01 0.01 0.01 0.01 0.01 0.01 0.01 0.01 0.01 0.02 0.01 0.02
Bảng tần số giới tính
> table(GioiTinh)
GioiTinh
Nam Nu
70 30
Bảng tần suất giới tính
> tableGioiTinh<-table(GioiTinh)
> prop.table(tableGioiTinh)
GioiTinh
Nam Nu
0.7 0.3
2.2 Đo lường khuynh hướng trung tâm
2.2.1 Giá trị trung bình chỉ số IQ
> mean(ChiSoIQ)
[1] 115.14
Chỉ số IQ trung bình của câu lạc bộ là 115.4
2.2.2 Giá trị trung vị chỉ số IQ
> median(ChiSoIQ)
[1] 115
Vị trí trung tâm của chỉ số IQ là 115, nghĩa là không có quá 50% dữ liệu chỉ số IQ nhỏ hơn 115 và không có quá 50% dữ liệu chỉ số IQ lớn hơn 115
2.2.3 Giá trị mode chỉ số IQ
Giá trị IQ có tần số cao nhất:
> max(table(ChiSoIQ))
[1] 8
Vị trí có tần số cao nhất:
> which(table(ChiSoIQ)==8)
Trang 7115 116
20 21
Kết quả trên cho thấy giá trị mode (giá trị chỉ số IQ mà tại đó có tần số cao nhất) là
115 hoặc 116 tại vị trí thứ 20, 21 trong bảng tần số
2.3 Đo lường mức độ phân tán
2.3.1 Phương sai chỉ số IQ
> var(ChiSoIQ)
[1] 184.1822
Kết quả trên cho thấy phương sai của chỉ số IQ là 184.1822
2.3.2 Độ lệch chuẩn chỉ số IQ
> sd(ChiSoIQ)
[1] 13.57138
Kết quả trên cho thấy độ lệch chuẩn của chỉ số IQ là 13.57138
2.4 Các thước đo về vị trí tương đối
2.4.1 Khoảng phân vị chỉ số IQ
Khoảng phân vị mặc định trong hàm quantile:
> quantile(ChiSoIQ)
0% 25% 50% 75% 100%
90.0 106.5 115.0 121.0 150.0
Từ kết quả trên cho thấy
- Không có người có IQ nhỏ hơn 90
- Khoảng 25% người có IQ nhỏ hơn 106.5 và 75% người có IQ cao hơn 106.5
- Khoảng 50% người có IQ nhỏ hơn 115 và 50% người có IQ cao hơn 115
- Khoảng 75% người có IQ nhỏ hơn 121và 25% người có IQ cao hơn 121
- 100% người có IQ nhỏ hơn hoặc bằng 150
Khoảng phân vị bất kỳ
> quantile(ChiSoIQ,0.9)
90%
135.3
Từ kết quả này cho thấy 90% số người có IQ nhỏ hơn 135.3
2.4.2 Khoảng biến thiên của chỉ số IQ
> max(ChiSoIQ)
[1] 150
Chỉ số IQ cao nhât là 150
Trang 8> min(ChiSoIQ)
[1] 90
Chỉ số IQ thấp nhất là 90
> range(ChiSoIQ)
[1] 90 150
Chỉ số IQ nằm từ 90 đến 150
> range(ChiSoIQ)[2]-range(ChiSoIQ)[1]
[1] 60
Chỉ số IQ cao nhất lớn hơn chỉ số IQ thấp nhất là 60
> summary(ChiSoIQ)
Min 1st Qu Median Mean 3rd Qu Max
90.0 106.5 115.0 115.1 121.0 150.0
Tóm lại từ lệnh summary là có thể thấy các thông kê mô tả cơ bản và tần số của bộ
dữ liệu bao gồm : giá trị nhỏ nhất, tứ phân vị thứ nhất, trung vị median, giá trị trung bình mean, tứ phân vị thứ ba và giá trị lớn nhất Kết quả cho thấy độ trải giữa của dữ liệu chỉ
số IQ từ tứ phân vị thứ nhất đến tứ phân vị thứ 3 là 106.5 đến 121
3 CÁC BIỂU ĐỒ, ĐỒ THỊ MÔ TẢ
3.1 Biểu đồ tần số, tần suất chỉ số IQ
Biểu đồ tần số chỉ số IQ với 10 thanh
> hist(ChiSoIQ, breaks=10, col="blue", border = "white", xlab = "Chỉ số IQ", ylab = "Số lượng người", main = "Biểu đồ phân bố chỉ số IQ")
Trang 9Biểu đồ tần số chỉ số IQ với 30 thanh
> hist(ChiSoIQ, breaks=30, col="blue", border = "white", xlab = "Chỉ số IQ", ylab = "Số lượng người", main = "Biểu đồ phân bố chỉ số IQ")
Biểu đồ tần suất chỉ số IQ với 30 thanh
> hist(ChiSoIQ, freq = FALSE, breaks=30, col="blue", border = "white", xlab
= "Chỉ số IQ", ylab = "Tần suất", main = "Biểu đồ tần suất chỉ số IQ")
3.2 Biểu đồ hộp chỉ số IQ
> boxplot(ChiSoIQ, col="blue", xlab="Chỉ số IQ", main="Biểu đồ hộp Chỉ số IQ")
Trang 103.3 Biều đồ hình quạt về các lớp trí tuệ của chỉ số IQ
Qui định về trí tuệ với các mức IQ như sau:
- Người bình thường: từ 85 <= IQ <=115
- Người thông minh: IQ từ 116 <= IQ <=130
- Người thông minh cao: IQ từ 131 <= IQ <=150
Ta có bảng trí tuệ tương ứng của 100 người:
> tritue<-c()
> tritue[ChiSoIQ<=115]<-"Bình thường"
> tritue[ChiSoIQ>115 & ChiSoIQ <=130]<-"Thông minh"
> tritue[ChiSoIQ>130]<-"Thông minh cao"
> tritue
[1] "Bình thuờng"
[2] "Bình thuờng"
[3] "Bình thuờng"
[4] "Bình thuờng"
[5] "Thông minh"
[6] "Thông minh"
[7] "Thông minh"
[8] "Thông minh"
[9] "Thông minh"
[10] "Bình thuờng"
[11] "Bình thuờng"
[12] "Thông minh"
[13] "Bình thuờng"
[14] "Bình thuờng"
[15] "Bình thuờng"
[16] "Bình thuờng"
[17] "Thông minh"
[18] "Thông minh"
[19] "Bình thuờng"
[20] "Bình thuờng"
[21] "Bình thuờng"
Trang 11[22] "Bình thuờng" [23] "Bình thuờng" [24] "Bình thuờng" [25] "Thông minh" [26] "Thông minh" [27] "Bình thuờng" [28] "Bình thuờng" [29] "Thông minh" [30] "Thông minh" [31] "Thông minh" [32] "Bình thuờng" [33] "Bình thuờng" [34] "Bình thuờng" [35] "Bình thuờng" [36] "Thông minh" [37] "Bình thuờng" [38] "Thông minh" [39] "Bình thuờng" [40] "Bình thuờng" [41] "Thông minh" [42] "Bình thuờng" [43] "Bình thuờng" [44] "Bình thuờng" [45] "Bình thuờng" [46] "Thông minh" [47] "Bình thuờng" [48] "Bình thuờng" [49] "Bình thuờng" [50] "Bình thuờng" [51] "Bình thuờng" [52] "Thông minh" [53] "Thông minh cao" [54] "Bình thuờng" [55] "Bình thuờng" [56] "Bình thuờng" [57] "Bình thuờng" [58] "Bình thuờng" [59] "Thông minh" [60] "Bình thuờng" [61] "Bình thuờng" [62] "Bình thuờng" [63] "Bình thuờng" [64] "Bình thuờng" [65] "Bình thuờng" [66] "Thông minh" [67] "Thông minh" [68] "Bình thuờng" [69] "Bình thuờng" [70] "Thông minh" [71] "Bình thuờng" [72] "Thông minh" [73] "Thông minh cao" [74] "Thông minh cao" [75] "Thông minh"
Trang 12[76] "Bình thuờng"
[77] "Thông minh"
[78] "Thông minh"
[79] "Thông minh cao"
[80] "Bình thuờng"
[81] "Bình thuờng"
[82] "Bình thuờng"
[83] "Thông minh cao"
[84] "Thông minh cao"
[85] "Thông minh"
[86] "Thông minh cao"
[87] "Thông minh"
[88] "Thông minh"
[89] "Thông minh cao"
[90] "Thông minh cao"
[91] "Bình thuờng"
[92] "Bình thuờng"
[93] "Thông minh cao"
[94] "Thông minh cao"
[95] "Bình thuờng"
[96] "Thông minh"
[97] "Bình thuờng"
[98] "Thông minh cao"
[99] "Thông minh cao"
[100] "Thông minh"
Tần số về trí tuệ
> table(tritue)
tritue
Bình thuờng Thông minh Thông minh cao
56 31 13
Tần suất về trí tuệ
> prop.table(tabletritue)
tritue
Bình thuờng Thông minh Thông minh cao
0.56 0.31 0.13
Vẽ biểu đồ hình quạt phân loại trí tuệ:
> pie(tabletritue, main = "Biểu đồ hình quạt phân loại trí tuệ")
Trang 133.4 Biểu đồ thanh phân loại trí tuệ chỉ số IQ
> barplot(phanloaitritue, main = "Biểu đồ thanh phân loại trí tuệ", xlab = "T
rí tuệ", ylab = "Tần số")
3.5 Đồ thị cành lá chỉ số IQ
> stem(ChiSoIQ)
The decimal point is 1 digit(s) to the right of the |
9 | 02244556999
Trang 1410 | 00001133445555788889999
11 | 0000112233344455555555666666667788999
12 | 001111234555567
13 | 01358
14 | 0124556
15 | 00
4 THỐNG KÊ GIỮA NAM VÀ NỮ
4.1 Thống kê xem nhóm nào có trí thông minh cao hơn
Với qui định trí người thông minh có IQ >=116
Lập bảng thống kê tần số, tần suất:
> data01 <- data
> data01$thongminh[data01$ChiSoIQ>=116]<-"Thông minh"
> data01$thongminh[data01$ChiSoIQ<116]<-"Không thông minh"
> data01Nam<-data01$thongminh[data01$GioiTinh=="Nam"]
> tableNam<-table(data01Nam)
> data01Nu<-data01$thongminh[data01$GioiTinh=="Nu"]
> tableNu<-table(data01Nu)
> cbind("Tan so [Nam]" = tableNam, "Tan suat [Nam]" = prop.table(tableNam), + "Tan so [Nu]"=tableNu, "Tan suat [Nu]" = prop.table(tableNu))
Tan so [Nam] Tan suat [Nam] Tan so [Nu] Tan suat [Nu]
Không thông minh 39 0.5571429 17 0.5666667
Thông minh 31 0.4428571 13 0.4333333
Biểu đồ quạt tỷ lệ thông minh của Nam:
> tableNamPercent <- round(100*tableNam/sum(tableNam), 1)
> pie(tableNam, labels = tableNamPercent, main="Ty le thong minh cua Nam",co l=rainbow(length(tableNam)))
> legend("topright", c("Thong minh (>=116)","Khong thong minh (<116)"), cex
= 0.7,fill = rainbow(length(tableNam)))