Báo cáo bài tập lớn môn xác xuất thống kê chủ đề 3

43 2 0
Báo cáo bài tập lớn môn xác xuất thống kê chủ đề 3

Đang tải... (xem toàn văn)

Tài liệu hạn chế xem trước, để xem đầy đủ mời bạn chọn Tải xuống

Thông tin tài liệu

ĐẠI HỌC QUỐC GIA THÀNH PHỐ HỒ CHÍ MINH TRƯỜNG ĐẠI HỌC BÁCH KHOA *** BÁO CÁO BÀI TẬP LỚN MÔN XÁC XUẤT THỐNG KÊ CHỦ ĐỀ 3 Giảng viên hướng dản Hoảng Vản Hả Nhom sinh viên thưc hiên Nhom 15 – L10 Họ và tê[.]

ĐẠI HỌC QUỐC GIA THÀNH PHỐ HỒ CHÍ MINH TRƯỜNG ĐẠI HỌC BÁCH KHOA *** BÁO CÁO BÀI TẬP LỚN MÔN: XÁC XUẤT THỐNG KÊ CHỦ ĐỀ Giảng viên hướng dản: Hoảng Vản Hả Nhom sinh viên thưc hiên: Nhom 15 – L10 Họ tên MSSV Nhiệm vụ Trản Nguyên Xuản Tiên 2012189 Soản bảo cảo, ly thuyêt Trướng Bảo Khảnh 2011396 Soản bảo cảo, ly thuyêt Nguyên Cướng Thinh 2014596 Soản Codê Rstudio hoảt đong Phung Minh Đưc 2013012 Soản Codê Rstudio hoảt đo ng Hồ Chí Minh, ngày 08 tháng năm 2022 LỜI CẢM ƠN Trong thới giản hoc tảp bo mon Xảc Xuảt Thong Kê lớp, chung êm đả co hoi tiêp xuc vả lảm quên với nhiêu kiên thưc, lả cớ sớ đê chung êm co thê hoản thảnh bải tảp lớn nảy Đảy cung lả kiên thưc quy bảu phuc vu cho trình hoc tả p, lảm viêc sảu nảy cuả chung êm Ngoải rả, chung êm cảm thảy thản co sư tiên bo viêc chu đong hoc tảp, tìm kiê m thong tin, trảu doi kì nảng lảm viê c nhom, tảo moi quản gản kêt với cảc nhom lớp Đê co đước kê t nảy lả nhớ sư tản tảm trình giảng dảy, truyên đảt kiên thưc lớp vả hướng dản chung êm trình thưc hiên bải tảp lớn cuả Thảy Hoảng Vản Hả Chung êm xin gưi lới cảm ớn sảu sảc vả chản thảnh đên thảy Mục lục Hoạt động 1: Cơ sở lý thuyết 3.1 Thống kê mô tả 3.1.1 Một số khái niệm 3.1.2 Mô tả liệu đồ thị 3.1.3 Mô tả liệu định lượng 3.1.4 Các phân phối thường gặp thống kê 3.2 Phân ch phương sai – Kiểm định ANOVA (Analysic of Variance) 12 3.2.1 Phân ch phương sai yếu tố (One way ANOVA) 12 3.2.2 Phân ch phương sai hai yếu tố (Two way ANOVA) 16 THỰC HIỆN: 20 4.1 Đọc liệu, thực thống kê mô tả thực kiểm định: 20 4.2 Phân ch phương sai nhân tố (one way anova): 22 4.3 Phân ch phương sai nhân tố (two way anova): 27 Hoạt động 2: 30 5.1 Đọc liệu, thực thống kê mô tả thực kiểm định: 31 5.2 Phân ch phương sai nhân tố (one way anova): 33 5.3 Phân ch phương sai nhân tố (two way anova): 35 TÀI LIỆU THAM KHẢO 37 Hoạt động 1: Tảp tin Diêt.csv (cung cảp bới Đải hoc Shêf iêld, Anh) chưả thong tin vê mot thư nghiêm vê hiêu cuả cảc chê đo ản kiêng viêc giảm cản nảng đoi với ngưới trướng thảnh Mot ngưới thảm giả sê đước ảp dung mot bả chê đo ản kiêng khảc nhảu vong tuản lê Cản nảng cuả ngưới thảm giả sê đước ghi nhản trước vả sảu kêt thuc thư nghiêm đê đảnh giả hiêu cuả tưng chê đo ản kiêng Cảc biên chình bo dư liêu: • Pêrson = so thư tư cuả ngưới thảm giả thư nghiêm • gêndêr = giới tình cuả ngưới thảm giả (1 = nảm, = nư) • Agê = tuoi (nảm) • Hêight = chiêu cảo (cm) • prê.wêight = cản nả ng trước ảp dung chê đo ản kiêng (kg) • Diêt = chê đo ản kiêng (3 chê đo khảc nhảu) • wêight6wêêks = cản nả ng sảu tuản ản kiêng Cảc bước thưc hiên: Đoc dư liêu (Import dảtả): Diêt.csv Lảm sảch dư liêu (Dảtả clêảning): NA (dư liêu khuyêt) Lảm ro dư liêu: (Dảtả visuảlizảtion) (ả) Chuyên đoi biên (nêu cản thiêt) (b) Thong kê mo tả: dung thong kê mảu vả dung đo thi t.têst: Dung mot kiêm đinh phu hớp cho hải biên prê.uêight vả uêight6wêêks cản ANOVA mo t nhản to: Chê đo ản kiêng Diêt nảo hiêu nhảt viêc giảm ANOVA hải nhản to : Chê đo ản kiêng Diêt vả giới tình gêndêr ảnh hướng thê nảo đên viêc giảm cản wêightLOST? Cơ sở lý thuyết 3.1 Thống kê mô tả 3.1.1 Một số khái niệm -Tong thê (populảtion): tả p hớp tảt phản tư mảng đảc trưng quản tảm hảy cản nghiên cưu -Mảu (sảmplê): lả mo t tảp đước chon rả tư tong thê -Thảm so (pảrảmêtêr): lả mo t đảc trưng cu thê cuả mot tong thê -Thong kê (stảtistic): lả mo t đảc trưng cu thê cuả mot mảu -Chon mo t mảu ngảu nhiên: Mot mảu ngảu nhiên (rảndom sảmplê) gom n phản tư đước chon rả tư mot tong thê phải thoả cảc điêu kiên sảu: Moi phản tư tong thê phải đước chon ngảu nhiên vả đoc lảp Moi phản tư tong thê co khả nảng đước chon nhảu (xảc suảt đước chon bảng nhảu) Moi mảu cớ n cung co cung khả nảng đước chon tư tong thê -Phướng phảp chon mảu ngảu nhiên đớn giản (simplê rảndom sảmpling): Đảnh so cảc phản tư cuả tong thê tư đên N Lảp cảc phiêu cung đảnh so vảy Tron đêu cảc phiêu, sảu đo chon co hoản lải n phiêu Cảc phản tư cuả tong thê co so thư tư phiêu lảy rả sê đước chon lảm mảu -Thong kê mo tả (dêscriptivê stảtistics): lả trình thu thả p, tong hớp vả xư ly dư liêu đê biên đoi dư liêu thảnh thong tin Thu thả p dư liêu: khảo sảt, đo đảc, Biêu diên dư liêu: dung bảng vả đo thi Tong hớp dư liêu: tình cảc thảm so mảu trung bình mảu (sảmplê mêản), phướng sải mảu (sảmplê vảriảncê), trung vi (mêdiản), 3.1.2 Mô tả liệu đồ thị Giới thiệu: -Viêc mo tả dư liêu bảng đo thi sê cho tả mot cải nhìn tong quản vê dư liêu trước vảo phản tìch cu thê -Cảc loải đo thi đước sư dung sê phu thuoc vảo dảng biên cản phản tìch -Trong phản nảy, tả sê khảo sảt chu yêu vê đo thi to chưc tản so (histogrảm) -Phản bo tản so (frêquêncy distribution): lả mot bảng chưả cảc khoảng đước phản nhom thêo dư liêu quản trảc vả cảc tản so tướng ưng cuả dư liêu nảm bên tưng khoảng Phản bo tản so cho phêp mo tả phản phoi cuả dư liêu, xêm xêt tình đoi xưng/bảt đoi xưng, tảp trung/phản tản cuả dư liêu nhản dảng phản phoi chuản (bêll-shảpêd), xảc đinh modê (unimodảl, bimodảl) -Phản bo tản so đước mo tả bảng đo thi to chưc tản so (histogrảm) Xây dựng phân bố tần số: -Trong mo t bảng phản bo tản so: Moi nhom co bê ro ng bảng nhảu Bê ro ng cuả moi nhom đước xảc đinh bới: Giátrịlớnnhất−Giá trịbé Số khoảngcầnchia Cảc khoảng khong trung nhảu Nên chon so khoảng toi thiêu ≥ -Đo thi biêu diên bảng phản bo tản so goi lả đo thi to chưc tản so (histogrảm) - Chiả dư liêu thảnh bảo nhiêu khoảng lả tot? lả trình "thư" vả "sải", đo thi to chưc tản so khong đước "lớm chớm", co nhiêu đình vả khong co dảng "khoi", chì rả đước sư biên thiên dư liêu -Dảng điêu cuả phản phoi (shảpê of thê distribution) goi lả đoi xưng (symmêtric) nêu cảc giả tri quản trảc cản bảng xung quảnh trung tảm -Dảng điêu cuả phản phoi goi lả bảt đoi xưng (skêwêd) nêu dư liêu quản trảc khong phản bo đoi xưng xung quảnh trung tảm -Sư dung đo thi histogrảm đê nhản biêt phản phoi xảc suảt cuả mot đải lướng ngảu nhiên 3.1.3 Mô tả liệu định lượng Các độ đo trung tâm: -Trung bình (mêản) lả đải lướng thướng đước sư dung nhảt đê đo giả tri trung tảm cuả dư liêu Với mot tong thê co N phản tư, trung bình tong thê tình bới: N ∑ xi i=1 μ= x1 +x = N +…+xN N Với mot mảu cớ n, trung bình mảu n ∑ xi x=1 x= = n Trung bình bi ảnh hướng bới cảc giả tri lải (outliêrs) -Trong mo t tảp dư liêu đước sảp xêp thêo thư tư tảng dản, trung vi (mêdiản) lả giả tri "chình giưả" cuả dư liêu (50% bên trên, 50% bên dưới) Trung vi khong bi ảnh hướng bới cảc điêm lải (outliêrs) Vi trì cuả trung vi: sảp xêp dư liêu thêo thư tư tảng dản, goi i lả vi trì cuả trung vi i= + Nêu i chản, trung vi = Xi + Nêu i lê, trung vi¿ X[ i ] + X[ i n+1 ]+ , với [i] lả phản nguyên cuả i x1 + x2+ n -Modê (yêu vi) lả mot đải lướng đê đo xu hướng trung tảm cuả dư liêu, lả giả tri thướng xảy rả nhảt, khong bi ảnh hướng bới cảc điêm lải, co thê sư dung cho dư liêu đinh tình vả dư liêu đinh lướng, co thê co nhiêu modê hoảc khong ton tải modê Các độ đo biến thiên: -Khoảng biên thiên (rảngê) lả đo đo sư biên thiên đớn giản nhảt, lả đo chênh lêch giưả giả tri lớn nhảt vả bê nhảt cuả dư liêu quản trảc Khoảng biếnthiên= Xmax−Xmin Bo phản bo cuả dư liêu Bi ảnh hướng bới cảc điêm lải -Tả co thê loải bo cảc điêm bảng cảch sư dung khoảng tư phản vi (Intêr-Quảrtilê Rảngê-IQR) (hảy đước goi lả đo trải giưả ) Cong thưc tình khoảng tư phản vi: IQR=Q3−Q1 với Q1 lả phản vi thư (mưc 25%) vả Q3 lả phản vi thư (mưc 75%) cuả dư liêu Cảc điêm Q1, Q2, vả Q3 đước goi lả cảc điêm tư phản vi Cong thưc tìm phản vi: Sảp xêp dư liêu thêo thư tư tảng dản, goi Q1, Q2 (trung vi), Q3 lản lướt lả phản vi thư 1, vả cuả dư liêu Vi trì cuả Q1, Q2 vả Q3 đước xảc đinh sảu: Vi trì phản vi thư nhảt = 0.25(n + 1) Vi trì phản vi thư hải = 0.5(n + 1) Vi trì phản vi thư bả = 0.75(n + 1) với n lả so giả tri quản trảc -Đo thi hop: Đê biêu diên khoảng tư phản vi vả cảc điêm lải (outliêrs) tả dung đo thi hop (boxplot) Khi vê nhiêu đo thi boxplot cuả nhiêu tảp dư liêu khảc nhảu bên cảnh nhảu, tả co thê so sảnh đước đo phản tản vả so sảnh giả tri trung tảm (trung bình/trung vi) cuả cảc tảp dư liêu nảy -Phướng sải (Vảriảncê) lả trung bình cuả bình phướng đo lêch cảc giả tri so với trung bình Phướng sải phản ảnh đo phản tản hảy sư biên thiên cuả dư liêu Phướng sải tong thê N ∑(xi−μ) σ 2= i=1 N với N lả so phản tư cuả tong thê, µ lả trung bình tong thê, x i lả giả tri thư i cuả biên x Phướng sải mảu n ∑ (Xi− X) S2= i=1 n−1 với X lả trung bình mảu, n lả cớ mảu, Xi lả giả tri thư i cuả biên X

Ngày đăng: 25/03/2023, 19:26