Tài liệu hạn chế xem trước, để xem đầy đủ mời bạn chọn Tải xuống
1
/ 41 trang
THÔNG TIN TÀI LIỆU
Thông tin cơ bản
Định dạng
Số trang
41
Dung lượng
3,24 MB
Nội dung
ĐẠI HỌC QUỐC GIA THÀNH PHỐ HỒ CHÍ MINH TRƯỜNG ĐẠI HỌC BÁCH KHOA *** BÁO CÁO BÀI TẬP LỚN MÔN: XÁC XUẤT THỐNG KÊ CHỦ ĐỀ Giảng viê n hướ ng dản: Hoả ng Vản Hả Nho m sinh viê n thư c hiê n: Nho m 15 – L10 Họ tên MSSV Nhiệm vụ Trả n Nguyê n Xuả n Tiê n 2012189 Soả n bả o cả o , ly thuyêt Trướng Bả o Khả nh 2011396 Soả n bả o cả o, ly thuyêt Nguyê n Cướ ng Thinh 2014596 Soả n Codê Rstudio hoảt đo ng Phu ng Minh Đư c 2013012 Soản Codê Rstudio hoảt đo ng Hồ Chí Minh, ngày 08 tháng năm 2022 LỜI CẢM ƠN Trong thớ i giản ho c tả p bo mo n Xảc Xuảt Thong Kê ớ lớ p, chu ng êm đả co ho i tiêp xu c vả lảm quên với nhiê u kiên thư c, lả cớ sớ đê chu ng êm co thê hoả n thảnh bả i tả p lớ n nảy Đả y cu ng lả nhưng kiên thư c quy bảu phu c vu cho quả trình hoc tả p, lảm viê c sảu nả y cu ả chu ng êm Ngoải rả, chu ng êm cảm thảy bản thản co sư tiên bo viê c chu đo ng ho c tả p, tìm kiêm thong tin, trảu doi kì nảng lảm viê c nhom, tảo moi quản hê gản kêt với cả c bả n nho m lớp Đê co đước kêt quả nảy lả nhớ sư tả n tả m quả trình giảng dảy, truyên đảt kiên thư c ớ lớ p vả hướng dả n chu ng êm quả trình thư c hiê n bả i tả p lớ n cu ả Thả y Hoảng Vả n Hả Chu ng êm xin gư i lớ i cả m ớn sảu sả c vả chản thảnh đên thảy Mục lục Hoạt động 1: Cơ sở lý thuyết .3 3.1 3.1.1 Một số khái niệm 3.1.2 Mô tả liệu đồ thị 3.1.3 Mô tả liệu định lượng .5 3.1.4 Các phân phối thường gặp thống kê 3.2 Thống kê mô tả Phân ch phương sai – Kiểm định ANOVA (Analysic of Variance) .12 3.2.1 Phân ch phương sai yếu tố (One way ANOVA) 12 3.2.2 Phân ch phương sai hai yếu tố (Two way ANOVA) 16 THỰC HIỆN: 20 4.1 Đọc liệu, thực thống kê mô tả thực kiểm định: 20 4.2 Phân ch phương sai nhân tố (one way anova): .22 4.3 Phân ch phương sai nhân tố (two way anova): .27 Hoạt động 2: 30 5.1 Đọc liệu, thực thống kê mô tả thực kiểm định: 31 5.2 Phân ch phương sai nhân tố (one way anova): .33 5.3 Phân ch phương sai nhân tố (two way anova): .35 TÀI LIỆU THAM KHẢO 37 Hoạt động 1: Tả p tin Diêt.csv (cung cảp bớ i Đả i ho c Shêfiêld, Anh) chư ả tho ng tin vê mo t thư nghiê m vê hiê u quả cu ả cả c chê đo ản kiê ng viê c giả m cả n nả ng đoi vớ i nhưng ngưới trướng thả nh Mo t ngướ i thảm giả sê đước ả p du ng mo t bả chê đo ản kiê ng khả c nhảu vong tuả n lê Cả n nả ng cu ả ngướ i thảm giả sê đước ghi nhả n trước vả sảu kêt thu c thư nghiê m đê đả nh giả hiê u quả cu ả tưng chê đo ả n kiê ng Cảc biên chình bo dư liê u: • Pêrson = so thư tư cu ả ngướ i thảm giả thư nghiê m • gêndêr = giớ i tình cu ả ngướ i thảm giả (1 = nảm, = nư ) • Agê = tuoi (nảm) • Hêight = chiê u cảo (cm) • prê.wêight = cản nả ng trước ảp du ng chê đo ả n kiê ng (kg) • Diêt = chê đo ản kiê ng (3 chê đo khảc nhảu) • wêight6wêêks = cản nả ng sảu tuả n ản kiê ng Cảc bướ c thư c hiê n: Đo c dư liê u (Import dảtả): Diêt.csv Lả m sảch dư liê u (Dảtả clêảning): NA (dư liê u khuyêt) Lả m ro dư liê u: (Dảtả visuảlizảtion) (ả) Chuyên đoi biên (nêu cản thiêt) (b) Thong kê mo tả: dung thong kê mảu vả dung đo thi t.têst: Du ng mo t kiêm đinh phu hớ p cho hải biên prê.uêight vả uêight6wêêks ANOVA mo t nhản to: Chê đo ản kiê ng Diêt nảo hiê u quả nhảt viê c giả m cản ANOVA hải nhản to: Chê đo ản kiê ng Diêt vả giới tình gêndêr ả nh hướ ng thê nảo đên viê c giả m cản wêightLOST? Cơ sở lý thuyết 3.1 Thống kê mô tả 3.1.1 Một số khái niệm -Tong thê (populảtion): tả p hớp tảt cả nhưng phả n tư mảng đả c trưng quản tả m hảy cản nghiê n cư u -Mảu (sảmplê): lả mo t tả p đước chon rả tư tong thê -Thảm so (pảrảmêtêr): lả mo t đả c trưng cu thê cu ả mo t tong thê -Thong kê (stảtistic): lả mo t đả c trưng cu thê cu ả mo t mả u -Chon mo t mảu ngả u nhiê n: Mo t mảu ngả u nhiê n (rảndom sảmplê) go m n phả n tư đướ c cho n rả tư mo t tong thê phải tho ả cảc điê u kiê n sảu: Moi phả n tư ton g thê phải đướ c cho n ngảu nhiên vả đo c lả p Moi phản tư tong thê co khả nả ng đướ c cho n nhảu (xảc suảt đước chon bảng nhảu) Mo i mảu cớ n cu ng co cu ng khả nảng đướ c cho n tư tong thê -Phướng phả p cho n mảu ngảu nhiê n đớn giản (simplê rảndom sảmpling): Đả nh so cảc phản tư cu ả tong thê tư đên N Lả p cảc phiêu cu ng đả nh so vả y Tro n đê u cả c phiêu, sảu đo cho n co hoản lả i n phiêu Cảc phả n tư cu ả tong thê co so thư tư phiêu lảy rả sê đướ c cho n lả m mảu -Thong kê mo tả (dêscriptivê stảtistics): lả quả trình thu thả p, tong hớ p vả xư ly dư liê u đê biên đoi dư liê u thảnh tho ng tin Thu thả p dư liê u: khả o sảt, đo đảc, Biêu diê n dư liê u: du ng bảng vả đo thi Tong hớp dư liê u: tình cảc thảm so mảu trung bình mảu (sảmplê mêản), phướng sải mảu (sảmplê vảriảncê), trung vi (mêdiản), 3.1.2 Mô tả liệu đồ thị Giới thiệu: -Viê c mo tả dư liê u bả ng đo thi sê cho tả mo t cải nhìn tong quản vê dư liê u trướ c vảo phản tìch cu thê -Cả c loả i đo thi đướ c sư du ng sê phu thuo c vảo dảng biên cản phản tìch -Trong phản nảy, tả sê khảo sảt chu yêu vê đo thi to chưc tản so (histogrảm) -Phản bo tản so (frêquêncy distribution): lả mo t bảng chưả cảc khoảng đước phản nho m thêo dư liê u quản trả c vả cả c tả n so tướng ư ng cu ả dư liê u nảm bê n tưng khoả ng Phản bo tản so cho phêp mo tả phả n phoi cu ả dư liê u, xêm xê t tình đoi xưng/bảt đoi xư ng, tả p trung/phản tản cu ả dư liê u nhả n dả ng phả n phoi chuản (bêll-shảpêd), xảc đinh modê (unimodảl, bimodảl) -Phản bo tản so đướ c mo tả bảng đo thi to chư c tản so (histogrảm) Xây dựng phân bố tần số: -Trong mo t bảng phản bo tản so: Moi nhom co bê ro ng bảng nhảu Bê ro ng cu ả moi nho m đước xả c đinh bớ i: Giátrịlớnnhất −Giá trịbé nhất Số khoảngcầnchia Cả c khoảng kho ng tru ng nhảu Nên chon so khoảng toi thiêu ≥ -Đo thi biêu diên bảng phản bo tản so goi lả đo thi to chưc tản so (histogrảm) - Chiả dư liê u thảnh bảo nhiê u khoảng lả tot? lả quả trình "thư" vả "sải", đo thi to chư c tản so kho ng đướ c quả "lớ m chớ m", co nhiê u đình vả khong co dảng "khoi", chì rả đướ c sư biên thiên dư liê u -Dả ng điê u cu ả phả n phoi (shảpê of thê distribution) go i lả đoi xư ng (symmêtric) nêu cảc giả tri quản trảc cả n bả ng xung quảnh trung tả m -Dảng điê u cu ả phản phoi go i lả bảt đoi xưng (skêwêd) nêu dư liê u quản trả c kho ng phản bo đoi xư ng xung quảnh trung tảm -Sư du ng đo thi histogrảm đê nhả n biêt phản phoi xảc suảt cu ả mo t đả i lướng ngảu nhiên 3.1.3 Mô tả liệu định lượng Các độ đo trung tâm: -Trung bình (mêản) lả đả i lướ ng thướ ng đướ c sư du ng nhảt đê đo giả tri trung tảm cu ả dư liê u Vớ i mo t tong thê co N phả n tư, trung bình tong thê tì nh bớ i: N x ∑ = i μ= N x + x 2+ … + x N i = N Vớ i mo t mảu cớ n, trung bình mảu n x = x ∑ = x n i x + x 2+ … + x n = n Trung bình bi ả nh hướ ng bớ i cảc giả tri ngoải lải (outliêrs) -Trong mo t tả p dư liê u đước sả p xêp thêo thư tư tả ng dản, trung vi (mêdiản) lả giả tri "chình giư ả" cu ả dư liê u (50% bê n trê n, 50% bê n dưới) Trung vi kho ng bi ảnh hướ ng bớ i cảc điêm ngoả i lải (outliêrs) Vi trì cuả trung vi: sảp xêp dư liê u thêo thư tư tả ng dản, go i i lả vi trì cu ả trung vi i= n +1 + Nêu i chản, trung vi = Xi + Nêu i lê , trung vi¿ X [ i ] + X [ i ]+ , vớ i [i] lả phản nguyê n cu ả i -Modê (yêu vi) lả mo t đả i lướ ng đê đo xu hướ ng trung tảm cu ả dư liê u, lả giả tri thướng xảy rả nhảt, kho ng bi ả nh hướ ng bớ i cả c điêm ngoả i lải, co thê sư du ng cho cả dư liê u đinh tình vả dư liê u đinh lướ ng, co thê co nhiê u modê hoả c khong to n tả i modê Các độ đo biến thiên: -Khoảng biên thiên (rảngê) lả đo đo sư biên thiê n đớn giản nhảt, lả đo chê nh lê ch giưả giả tri lớ n nhảt vả bê nhảt cu ả dư liê u quản trả c Khoảng biến thiên= X max − X min Bo phả n bo cu ả dư liê u Bi ả nh hướ ng bớ i cả c điêm ngoải lải -Tả co thê loải bo cả c điêm ngoải bả ng cảch sư du ng khoả ng tư phản vi (IntêrQuảrtilê Rảngê-IQR) (hảy co n đướ c go i lả đo trải giưả ) Co ng thư c tì nh khoả ng tư phả n vi: IQR = Q3 − Q1 vớ i Q1 lả phản vi thư (mưc 25%) vả Q3 lả phản vi thư (mư c 75%) cu ả dư liê u Cảc điêm Q1, Q2, vả Q3 đướ c go i lả cảc điêm tư phản vi Co ng thư c tì m phản vi: Sảp xêp dư liê u thêo thư tư tả ng dả n, go i Q 1, Q2 (trung vi), Q3 lản lướ t lả phả n vi thư 1, vả cu ả dư liê u Vi trì cuả Q1, Q2 vả Q3 đướ c xảc đinh sảu: Vi trì phản vi thư nhảt = 0.25(n + 1) Vi trì phản vi thư hải = 0.5(n + 1) Vi trì phản vi thư bả = 0.75(n + 1) vớ i n lả so giả tri quản trảc -Đo thi ho p: Đê biêu diê n khoảng tư phản vi vả cảc điêm ngoải lải (outliêrs) tả dung đo thi ho p (boxplot) Khi vê nhiê u đo thi boxplot cu ả nhiê u tả p dư liê u khả c nhảu bê n cảnh nhảu, tả co n co thê so sả nh đướ c đo phả n tản vả so sả nh giả tri trung tảm (trung bình/trung vi) cu ả cả c tả p dư liê u nả y -Phướng sải (Vảriảncê) lả trung bình cuả bình phướng đo lê ch cả c giả tri so với trung bình Phướng sải phản ảnh đo phả n tản hảy sư biên thiê n cu ả dư liê u Phướng sải ton g thê N ( x − μ ) ∑ = i σ = i N vớ i N lả so phả n tư cu ả tong thê, µ lả trung bì nh tong thê, x i lả giả tri thư i cu ả biên x Phướng sải mả u n ( X − X ) ∑ = i S= i n −1 vớ i X lả trung bình mả u, n lả cớ mả u, Xi lả giả tri thư i cu ả biên X -Đo lê ch tiê u chuản (Stảndảrd dêviảtion) đước du ng đê đo sư biên thiê n, biêu diê n sư biên thiê n xung quảnh trung bình, Co cu ng đớn vi đo vớ i dư liê u goc Đo lê ch chuản cu ả tong thê, ky hiê u lả σ: Đo lê ch chuản mảu: -Hê so biên thiê n (Coêficiênt of Vảriảtion) đước sư du ng đê so sả nh sư biên thiê n cuả hải hảy nhiêu tả p dư liê u, co thê đo ớ cả c đớn vi khảc nhảu Đo moi liên hê giưả sư biên thiê n vả trung bình Đớn vi tình bảng % Co ng thưc: S CV = 100% X 3.1.4 Các phân phối thường gặp thống kê Phân phối chuẩn tắc: -Biên ngảu nhiên liên tuc X nhả n giả tri khoảng (−∞, +∞) đướ c go i lả co phản phoi chuản thảm so µ, σ nêu hảm mả t đo xả c suảt co dảng -Biên ngả u nhiên X đướ c go i lả co phả n phoi chuản tảc nêu no co phả n phoichuản vớ i thảm so µ = vả σ 2 = 1, ky hiê u X ∼ (0, 1) -Thêo quy ướ c, hả m phản nhiê n chuản ho ả đước ky phoi cu ả biên ngả u hiê u lả Φ(x), tưc lả Nhận xét: Biêu đo QQ-plot cho tả thảy như ng giả tri quản sảt đả phả n nảm trê n đướ ng thả ng kì vo ng cu ả phả n phoi chuản đo biên weightLOST ớ chê đo ản kiê ng tuản thêo phản phoi chuản Ngoải rả, tả co thê dung hảm shapiro.test đê kiêm trả: shảpiro.têst(diêt2$wêightLOST) Nhận xét: Giả thiêt H_0: Cản nả ng giả m ớ chêt đo ản kiê ng tuản thêo phản phoi chuản Giả thiêt H_1: Cản nả ng giả m ớ chê đo ản kiê ng kho ng tuản thêo phản phoi chuản Vì Pr(>F) = 0,8722 > mưc y nghìả α=0,05α=0,05 nên tả chảp nhả n giả thiêt H_0 Vả y biên weightLOST ớ chê đo ản kiê ng tuả n thêo phản phoi chuản Đoi vớ i chê đo ản kiê ng 3: diêt3 = subsêt(Diêt1, Diêt == 3) qqnorm(diêt3$wêightLOST) qqlinê(diêt3$wêightLOST) 25 Nhận xét: Biêu đo QQ-plot cho tả thảy như ng giả tri quản sảt đả phả n nảm trê n đướ ng thả ng kì vo ng cu ả phả n phoi chuản đo biên weightLOST ớ chê đo ản kiê ng tuản thêo phản phoi chuản Ngoải rả, tả co thê dung hảm shapiro.test đê kiêm trả: shảpiro.têst(diêt3$wêightLOST) Nhận xét: Giả thiêt H_0: Cản nả ng giả m ớ chê đo ản kiê ng tuản thêo phản phoi chuản Giả thiêt H_1: Cản nả ng giả m chê đo ản kiê ng khong tuản thêo phản phoi chuản Vì Pr(>F) = 0,372 > mư c y nghìả α=0,05α=0,05 nên tả chảp nhả n giả thiêt H_0 Vả y biên weightLOST ớ chê đo ản kiê ng tuả n thêo phản phoi chuản Tả du ng hảm leveneTest đê kiêm trả giả đinh tình đong nhảt cuả cảc phướng sải: library(cảr) #Yêu cầu gói lệnh 'car' để sử dụng hàm 'leveneTest' lêvênêTêst(wêightLOST ~ ảs.fảctor(Diêt),dảtả = Diêt1) #Thực kiểm định tính đồng phương sai Nhận xét: Giả thiêt H_0: Phướng sải cản nả ng giả m ớ cảc phướng phả p ả n kiê ng bả ng nhảu Giả thiêt H_1: Co ì t nhảt phướng phảp ản kiêng co phướng sải cản nả ng giả m khảc nhảu Vì Pr(>F) = 0.6313 > mưc y nghìả α=0,05α=0,05 nên tả chảp nhả n giả thiêt H_0 Vả y phướng sải cả n nả ng giảm ớ cả c phướng phảp ản kiê ng lả nhảu 26 ả Du ng lê nh aov đê thưc hiê n phả n tìch Anovả mo t nhản to: ảnovả1 = ảov(wêightLOST ~ ảs.fảctor(Diêt),dảtả = Diêt1) #Thực phân tích phương sai summảry(ảnovả1) #Tóm tắt kết mơ hình phân tích phương sai Nhận xét: Vì Pr(>F) < mư c y nghìả α=0,05α=0,05 nên bảc bo giả thiêt H_0, chảp nhả n giả thiêt H_1 Vả y co ìt nhảt phướng phảp ản kiêng co cản nả ng trung bình giảm khảc nhảu, tưc mư c đo hiê u quả đoi vớ i viê c giảm cả n giưả cảc phướng phả p ả n kiê ng lả khảc nhảu ả Du ng hả m TukeyHSD vả plot đê thưc hiê n cả c so sả nh bo i (multiplê compảrisons) sảu phản tìch phướng sải: TukêyHSD(ảnovả1) #Thực so sánh bội plot(TukêyHSD(ảnovả1)) #Vẽ đồ thị so sánh bội Nhận xét: Sự khác cân nặng giảm trung bình nhóm chế độ ăn kiêng 1: Giả thiêt H_0: Trung bình cản nả ng giảm ớ nho m chê đo ản kiê ng vả chê đo ả n kiê ng bảng nhảu Giả thiêt H_1: Trung bình cản nả ng giảm ớ nho m chê đo ản kiê ng vả chê đo ả n kiê ng khả c nhảu Tả nhả n thảy p ảdj = 0,9987711 > mư c y nghìả α=0,05α=0,05, nên tả chảp nhả n giả thiêt H_0 Vả y trung bình cản nả ng giảm ớ nho m chê đo ản kiê ng vả chê đo ả n kiê ng bảng nhảu 27 Sự khác cân nặng giảm trung bình nhóm chế độ ăn kiêng 1: Giả thiêt H_0: Trung bình cản nả ng giảm ớ nho m chê đo ản kiê ng vả chê đo ả n kiê ng bảng nhảu Giả thiêt H_1: Trung bình cản nả ng giảm ớ nho m chê đo ản kiê ng vả chê đo ả n kiê ng khả c nhảu Tả nhả n thảy p ảdj = 0,0188047 < mư c y nghìả α=0,05α=0,05, nê n tả bảc bo giả thiêt H_0, chảp nhả n giả thiêt H_1 Vả y trung bình cản nả ng giả m ớ nho m chê đo ả n kiê ng vả chê đo ả n kiê ng khảc nhảu Mả t khảc tả dưả vả o giả tri diff = 1,848148 > nên tả co thê kêt luả n trung bình cản nả ng giả m ớ nho m chê đo ản kiê ng cảo hớn so vớ i nho m chê đo ản kiê ng Sự khác cân nặng giảm trung bình nhóm chế độ ăn kiêng 2: Giả thiêt H_0: Trung bình cản nả ng giảm ớ nho m chê đo ản kiê ng vả chê đo ả n kiê ng bảng nhảu Giả thiêt H_1: Trung bình cản nả ng giảm ớ nho m chê đo ản kiê ng vả chê đo ả n kiê ng khả c nhảu Tả nhả n thảy p ảdj = 0.0152020 < mư c y nghìả α=0,05α=0,05, nê n tả bảc bo giả thiêt H_0, chảp nhả n giả thiêt H_1 Vả y trung bình cản nả ng giả m ớ nho m chê đo ả n kiê ng vả chê đo ả n kiê ng khảc nhảu Mả t khảc tả dưả vả o giả tri diff = 1.880148 > nên tả co thê kêt luả n trung bình cản nả ng giả m ớ nho m chê đo ản kiê ng cảo hớn so vớ i nho m chê đo ản kiê ng Kết luận: phướng phảp co cản nả ng giảm trung bình cảo hớn phướng phảp vả Vả y phướng phảp lả phướng phả p ả n kiê ng co hiê u quả nhảt viê c giảm cản 4.3 Phân tích phương sai nhân tố (two way anova): ả Thưc hiê n phản tìch phướng sải hải nhả n to đê đảnh giả sư ảnh hướ ng chế độ ăn kiêng vả giới tính đên sư giả m cản: ảnovả2 = ảov(wêightLOST ~ ảs.fảctor(gêndêr)*ảs.fảctor(Diêt),dảtả = Diêt1) #Thực phân tích phương sai summảry(ảnovả2) #Tóm tắt kết mơ hình phân tích phương sai Nhận xét:: Giả thiêt H_0: Cản nả ng trung bình giảm giư ả cả c giớ i tình bả ng nhảu Giả thiêt H_1: Cản nả ng trung bình giảm giu ả cả c giớ i tình lả khảc nhảu 28 Vì Pr(>F)= 0,82062 > mư c y nghìả α=0,05α=0,05 nên tả chảp nhả n giả thiêt H_0 Vả y giới tính kho ng ảnh hướ ng đên viê c giảm cả n Giả thiêt H_0: Cản nả ng trung bình giảm giư ả cả c phướng phả p ả n kiê ng Giả thiêt H_1: Co ì t nhảt phướng phảp ản kiêng co cản nả ng trung bình giảm khảc nhảu Vì Pr(>F) = 0,00546 < mưc y nghìả α=0,05α=0,05 nên bảc bo giả thiêt H_0, chảp nhả n giả thiêt H_1 Vả y chế độ ăn kiêng co ảnh hướ ng đên viê c giảm cả n ả Phả n tìch sư tướng tả c giưả chế độ ăn kiêng vả giới tính đên sư giảm cả n: Giả thiêt H_0: Kho ng co sư tướng tảc giưả giớ i tì nh vả phướng phả p ả n kiê ng Giả thiêt H_1: Co sư tướng tảc giưả giớ i tì nh vả phướng phả p ả n kiê ng Tư kêt quả cu ả phản tìch phướng sải, tả co Pr(>F) = 0,04884 < mư c y nghìả α=0,05α=0,05 nên bảc bo giả thiêt H_0, chảp nhả n giả thiêt H_1 Vả y co sư tướng tả c giưả giớ i tình vả chê đo ản kiê ng Ngoải rả, tả co thê vê đo thi đê đả nh giả sư tướng tả c: intêrảction.plot(Diêt1$Diêt,Diêt1$gêndêr,Diêt1$wêightLOST,typê="b",col=c(2:3), lêg.bty="o",lêg.bg="bêigê",lwd=2,pch=c(18,24)) Nhận xét:: Tả nhả n thảy đướ ng thảng trê n đo thi cảt nhảu, tư c co sư tướng tảc giưả giớ i tình vả phướng phả p ả n kiê ng 29 30 Hoạt động 2: Tả p tin Folds5x2_pp.ods (cung cảp bớ i Hêysêm Kảyả, Khoả Ky thut M y tỡnh, i ho c Bog ziỗi, TR-34342, Bêşiktảş, Istảnbul, Tho Nhì Ky vả Pìnảr Tu fêkci, Khoả Ky thuả t Çorlu, Đả i ho c Nảmìk Kêmảl, TR-59860 Çorlu, Têkirdảg , Tho Nhì Ky ) chưả 9568 điêm dư liê u đướ c thu thả p tư Nhả mảy điê n chu trì nh hon hớ p vong nảm (2006 - 2011), nhả mả y điê n nả y đướ c thiêt lả p đê lả m viê c vớ i đảy đu phu tả i. Cảc biên so mo i trướng xung quảnh trung bình hảng giớ Giả tri trung bình đướ c lảy tư cả c cảm biên khảc nhảu đả t xung quảnh nhả mảy ghi lả i cả c biên xung quảnh moi giảy Cả c biên đướ c đưả rả mả kho ng cả n chuản ho ả Cảc biên chình bo dư liê u: • AT = Nhiê t đo mo i trướng xung quảnh (oC) • V = chản kho ng xả (cmHg) • AP = ảp suảt mo i trướ ng xung quảnh (mbảr) • RH = Đo ảm tướng đoi (%) • PE = sả n lướ ng điê n nả ng thưc thêo giớ (MW) Cảc bướ c thư c hiê n: Đo c dư liê u (Import dảtả): dư liê u đước chuyên sảng dả ng csv => Folds5x2_pp csv Lả m sảch dư liê u (Dảtả clêảning): NA (dư liê u khuyêt) Lả m ro dư liê u: (Dảtả visuảlizảtion) Thong kê mo tả: du ng thong kê mả u vả du ng đo thi t.têst: Du ng mo t kiêm đinh phu hớp ANOVA mo t nhản to: ANOVA hải nhản to: nhiê t đo xung quảnh vả chản kho ng xả ả nh hướ ng đên sản lướ ng điê n 31 5.1 Đọc liệu, thực thống kê mô tả thực kiểm định: ả Đo c dư liê u vả o R: Đo c dư liê u tư ilê Foldsx2_pp.csv vả hiên thi 6 do ng dư liê u đảu tiê n Sêtwd(“C:/Usêrs/Admin/Dêsktop/Nêw foldêr/Activê2/CCPP") dảả sêtwd("C:/Usêrs/Admin/Dêsktop/Nêw foldêr/Activê2/CCPP") > dảả hêảd(dảả) ì AT V AP RH PE 14.96 41.76 1024.07 73.17 463.26 25.18 62.96 1020.04 59.08 444.37 5.11 39.40 1012.16 92.14 488.56 20.86 57.32 1010.24 76.64 446.48 10.82 37.50 1009.23 96.62 473.90 26.27 59.44 1012.23 58.77 443.67 b Lảm sảch dư liê u: Loả i bo giả tri khuyêt (NA) plảcê_NA=ảpply(is.nả(dảả),2,which) nêw_dảả=nả.omit(dảả) ảnyNA(dảả) c Lảm ro dư liê u Gả n cả c biên cho dư liê u: ATF)< 2ê-16 bê hớn mư c y nghìả α=0,05, nên tả bảc bo H_0, chảp nhả n giả thiêt H_1 Vả y Nhiệt độ ả nh hướ ng đên sản lướ ng điê n Giả thiêt H_0: Sản lướ ng điê n kho ng thảy đoi giư ả cả c điê u kiê n chản khong xả Giả thiêt H_1: Sản lướ ng điê n co sư thảy đoi giư ả cả c điê u kiê n chản kho ng xả Vì Pr(>F) = 6.85ê-11 bê hớn mưc y nghìả α=0,05α=0,05 nên bảc bo giả thiêt H_0, chảp nhả n giả thiêt H_1 Vả y Chân không xả co ảnh hướ ng đên sản lướ ng điê n 37 38 TÀI LIỆU THAM KHẢO Slidê bả i giảng thảy Hoả ng Vản Hả Hoảng Tro ng & Chu Nguyê n Mo ng (2008) Thống kê ứng dụng kinh tế xã hội, Nxb Thong Kê Tong Đình Quy Giáo trình Xác suất thống kê , Nxb Bảch Khoả – Hả No i Stêphảniê Glên , ANOVA Test: Definition, Types, Examples, SPSS, truy cả p tư: https://www.stảtisticshowto.com/probảbility-ảnd-stảtistics/hypothêsistêsting/ảnovả/ Bài 4: Phân tích phương sai (ANOVA) , 2020, truy cả p tư: http://ibf.iuh.êdu.vn/wp-contênt/uploảds/2020/10/BAI-4.-PHAN-TICHPHUONG-SAI.pdf Tải liê u hướng dả n sư du ng Rstudio: Nguyên Vản Tuản, Phân tích số liệu biểu đồ Rstudio, truy cả p tư: https://crản.r-projêct.org/doc/contrib/Intro_to_R_Viêtnảmêsê.pdf Kê nh Youtubê: Lêảrn to SCIENCE 39 ... .3 3.1 3. 1.1 Một số khái niệm 3. 1.2 Mô tả liệu đồ thị 3. 1 .3 Mô tả liệu định lượng .5 3. 1.4 Các phân phối thường gặp thống kê 3. 2 Thống kê mô tả... Mêản : 53. 91 Mêản :10 13. 6 3rd Qu.:25 .34 3rd Qu.:64.15 3rd Qu.:1017.5 Mảx :35 .56 Mảx :79.74 Mảx :1 030 .5 RH PE Min : 32 .80 Min :426.6 1st Qu.: 62.15 1st Qu.:441.8 Mêdiản : 74. 53 Mêdiản :451.1 Mêản... summảry(nêw_dảả) Kê? ??t quả: > summảry(nêw_dảả) ì AT V AP Min : 3. 94 Min :34 . 03 Min : 998.1 1st Qu.: 13. 76 1st Qu.:42.14 1st Qu.:1009.9 Mêdiản :20. 73 Mêdiản :52.51 Mêdiản :10 13. 4 Mêản :19.55 Mêản : 53. 91