Giáo trình nội bộ Xác suất thống kê: Phần 2

20 13 0
Giáo trình nội bộ Xác suất thống kê: Phần 2

Đang tải... (xem toàn văn)

Tài liệu hạn chế xem trước, để xem đầy đủ mời bạn chọn Tải xuống

Thông tin tài liệu

PhÇn thèng kª to¸n sÏ giíi thiÖu nh÷ng kiÕn thø ¬ b¶n nhÊt vÒ mét sè bµi to¸n quan träng trong thèng kª bµi to¸n ­í l­îng tham sè, bµi to¸n kiÓm ®Þnh gi¶ thuyÕt thèng kª vµ bµi to¸n t­¬n[r]

(1)

Phần Thống kê toán

(2)

Chương

C¬ së lý thuyÕt mÉu

Qtrìnhnghiênứuthốngkêgồmágiaiđoạn:thuthậpsốliệu,xửlýtổnghợpvàphân tíh, dựbáo Trong thuthập sốliệu thườngáp dnghai hìnhthứ hủyếu: báo áothống kê địnhkỳvàđiềutrathốngkê.Chươngnàynhằmgiớithiệumộtsốvấn đềầnquantâmkhibắt đầu làmmộtbàitốnthốngkê, đólàgiaiđoạnthuthậpvà xửlýsốliệu

3.1 Tỉng thĨ vµ mÉu

3.1.1 Tổng thể kíh thướ tổng thể

Địnhnghĩa 3.1.1 Tồnbộtậphợpáphầntửđồngnhấttheomộtdấu hiệunghiênứuđịnh tính hoặđịnh lượngnào đóđượgọi tổngthể nghiên ứu(population) (haytổngthể hoặ tậphính) Sốlượngáá thể(hayáphầntử)ủatổngthểđượgọilàkíhthướủatổng thể (sizeofpopulation),thườngđượ kíhiệulàN

Vớimỗi tổng thểta khơng nghiên ứutrự tiếptổng thể đómà thơng qua mộthay nhiều dấu hiệu đặ trưng ho tổng thể đó, đượ gọi dấu hiệu nghiên ứu Cá dấu hiệu ó thể định tính hoặđịnh lượng (ta ũngó thể gọi biến địnhtính hoặ biến địnhlượng) Chẳng hạn, để nghiên ứu hiều dài lúa giống lúa dấu hiệu nghiên ứu mang tính định lượng hính hiều dài bơng; nghiên ứu loại bệnh xuấthiệntrêngiaầmtạiđồngbằngBắBộthìđặtínhmàtaquantâmđếnởđâylàđặtính mangtínhđịnhtính,xtmỗiáthểgiaầmtrongtổngthểthìóhoặkhơngóloạibệnhmà ta quantâm

3.1.2 Mẫu vàphương pháp họn mẫu

Định nghĩa 3.1.2 Mộttập hợpá thể đượlấy từtổng thể đượgọi mẫu(sample) Sốlượngá thểtrongmộtmẫugọilàkíh thướmẫu(sizeofsample), thườngkíhiệulàn

(3)

ả mẫ thể lấy rađượ từ tổng thểđượ gọi làkhơng gian mẫu (sample spae) Thay nghiênứu tấtảá áthểó mặttrongtổngthể tahuyểnsang nghiênứumột bộphận ủatổngthểlàmẫuvì vậymẫuphảiđạidiệnmộtáhkháhquannhấthotổngthể.Taquan tâmđếná phươngpháp lấymẫusau đây:

a)Lấymẫungẫunhiênkhơnghồnlại:Đólàphươngpháplấymẫubằngáhđánhsốá áthểtrongtổngthểtừ1đếnN.Rútngẫunhiênlầnlượtnáthểđưavàomẫutheomộttrong haiáh sau

- Mẫu ngẫu nhiên đơn giản: Từ tổng thể kíh thướ N người ta dùng áh rút thămđơn giản n phầntử mẫu theo bảng số ngẫunhiên u điểm phươngpháp ho php thu đượ mẫu ó tính đại diện ao, ho php suy rộng kết mẫu hotổngthể vớimột saisố xáđịnh.Nhượ điểmủaphươngpháp làphảió đượ tồnbộdanhsáh ủatổngthểnghiênứu, mặtkháhiphíhọnmẫukhá lớn

-Mẫungẫunhiênhệthống:Làloạimẫungẫunhiênđãđượđơngiảnhốtrongáhhọn, trongđóhỉóphầntửđầutiênđượhọnmộtáhngẫunhiên, sauđódựatrêndanhsáhđã đượđánh sốủatổng thểđểhọnra áphầntửtiếptheovào mẫutheomộtthủ tnàođó Nhượđiểmủaphươngpháp nàylàdễmắsaisốhệthốngkhidanhsáhủatổngthểkhơng đượsắpxếpmộtáhngẫu nhiênmàlạitheomộttrậttựhủ quannàođó

b)Lấymẫungẫunhiênóhồnlại:Đánhsốááthểtrongtổngthểtừ1đếnN.Rútngẫu nhiêntừtổngthểra1áthể,ghiđặtínhủấthểnàyrồitrảáthểđóvềtổngthể, đặtính vừa ghilạiđượoilàphầntửđầutiênủamẫu.Việxáđịnháphầntửtiếptheoủamẫu ũngđượlàm tươngtựnhưtrên

Từphươngpháplấymẫungẫunhiênóhồnlạitathấyxásuấtđểmỗiáthểómặttrong mẫuđềulà 1/N.Mỗiáthểóthểó mặtnhiềulầntrongmẫu.Dễthấy,vớikíhthướn,số lượngámẫutrongtrườnghợplấymẫukhơnghồnlạilàA

n

N,sốlượngámẫutrongtrường hợplấhồnlạilà A

n

N =Nn.KhiN lớnhơnrấtnhiềusovới n thìA

n

N ≈Nn,khiđóviệ lấymẫuhồnlại vàkhơnghồnlạihotấ kếtquảsailệhkhơngđáng kể

) Lấy mẫutheo álớp: Chia tổngthể làmk lớp Rồi từ lớplấy ngẫunhiên số áthểđưa vàomẫu Nếusốlượng áá thểởlớpthứ ilà Ni thìsố áthể đượhọnvào mẫuủa lớpnàylà ni nênthỏa mãnđiềukiện

ni

n ≈ Ni

N

(4)

Cáphươngpháplấymẫutrênlàáphươngphápphổbiếntrongviệthuthậpádữliệu Việ lấymẫutốt,xấutheonghĩkháh quanhaykhơngảnhhưởngrất lớnđếnviệ đưara kết luậnóhínhxáhay khơngvềáđặ tínhómặttrongtổngthể

Chú ý3.1.3 Từ kết quảtập mẫu ó đượ ta ó thể suy kết hotổng thể baogiờũngóthểmắphảisailầmnhấtđịnh.Độsailệhlớnhaybphthuộvàophương pháp xây dựng mẫu kíh thướ mẫu Độ hínhxá trongthống kê thường đượ gọi độ tinậy(degree ofonfidene)ủakếtluận, kíhiệulàγ.Nếugọiα làtỉlệsaisót (haymứý nghĩa) ủakếtluậnthìα= 1−γ

3.1.3 MÉu ngÉunhiªn

Sauđây, mẫu đượ hiểu mẫu ó lặplại đượ lấy theo phương pháp ngẫu nhiên đơn giản GiảsửđặtrưngbiếnX ởmỗiáthểởtổngthểlàmộtbiếnngẫunhiên,ịnđượgọilà biến ngẫu nhiên gố, óhàm phânphối xá suấtF(x) Tatiến hành mộtphp lấy mẫu ngẫu nhiên ókíhthướ n.GọiXi biếnngẫunhiênhỉ giátrị X ủaá thểthứ itrongmẫu, ta thấyáXi làábiếnngẫunhiênóùngphânphốixásuấtvớiX.VớimỗimẫuthểXi sẽógiá trịxáđịnhlàxi.DoviệlấymẫuđộlậpnêndãyX1, X2, , Xn làábiếnngẫu nhiênđộ lập

Địnhnghĩa3.1.4 Mẫungẫu nhiên(randomsample)kíhthướn làtậphợpủan biếnngẫu nhiên độlậpX1, X2, , Xn đượthànhlậptừ biếnngẫunhiênX óùng quyluậtphân phốixá suấtvớiX,kýhiệulàW = (X1, X2, , Xn)

Giảsử X1 nhận giá trị x1,X2 nhận giá trị x2, ,Xn nhận giá trị xn Tập hợpn giá trị x1, x2, , xn tạo thành giátrị mẫu ngẫu nhiên, hay òn gọi mÉu thĨ, ký hiƯu w= (x1, x2, , xn)

Ví d3.1.5 Xttổngthểlà tậpsinhviênViệt Nam,biếnngẫu nhiêngốX làhiều aoủa sinh viên Xt mẫu ó kíh thướ n = 10, gọi Xi hiều ao sinh viên thứ i trongmẫu,khiđóW = (X1, X2, , X10)làmộtmẫungẫunhiên.Thựhiệnmộtphpthửđối với mẫu ngẫunhiên trên, tứlà tiến hànhđohiều aoủa 10sinh viênhọn vào mẫuta thu đượ mẫu thể x1 = 1,50;x2 = 1,52;x3 = 1,60;x4 = 1,65;x5 = 1,70;x6 = 1,81;x7 =

1,63;x8 = 1,77;x9 = 1,55, x10= 1,58(đơnvịlàmt), bộsố

(1,50; 1,52; 1,60; 1,65; 1,70; 1,81; 1,63; 1,77; 1,55; 1,58)

là mộtmẫuthể(haymộtthểhiện) ủamẫungẫunhiên(X1, X2, , X10)

(5)

ùnghàm phânphốixásuất F(x) màá thamsốđặ trưngủahúng ũngbằngá tham sốđặtrưng ủaX,tứ là:

E(X1) =E(X2) =· · ·=E(Xn) =E(X) (3.1)

V(X1) =V(X2) =· · ·=V(Xn) =V(X) (3.2)

3.2 Cá phương pháp mô tả mẫu ngẫu nhiên

3.2.1 S¾p xÕp sè liƯu thù nghiƯm

Đểkhaithávàxửlýá thơngtinhứađựngtrongdãysốliệunàytaầnsắpxếpsố liệu nhằm nhận đặtrưng dãy số liệu Thơng thường ta xếpsố liệu theo thứtự tăngdần Dãysốliệunàyưuđiểmhơndãysốliệubanđầu, taóthểdễdàngnhậnbiếtgiátrị nhỏ giá trị lớnnhất số liệumẫu, biếtđượ biên độ daođộng sốliệu mẫu Vớiáh sắpxếpnày tadễdàng nhậnbiết ásố liệuó mặttrongmẫu mộtlần vìá số liệubằng đượxếp liềnnhau Một số phươngpháp thường đượ dùngđể sắpxếpsố liệunhư sau

a)Phươngphápliệtkê Liệtkêtấtảáphầntửủamẫu Chẳnghạn,với mộtmẫuỡn,ta óthểviết x1 = 2,5;x2 = 2,6; , xn = 3,0

Nhượ điểm áh xếp không mô tả đượ mẫu ỡ lớn, tính tốn phứtạp, khơngkhoahọ

b)Phươngphápdùngbảngtầnsốvàbảngtầnsuất.Giảsửtừtổngthểủabiếnngẫunhiên gốX rútramộtmẫungẫunhiênkíhthướn,trongđógiátrịx1 xuấthiệnvới tầnsốn1,giá trị x2 xuất hiệnvới tần sốn2, , giátrị xk xuất hiệnvới tần sốnk,lú đósau khiá xi đượ xếptheo trình tự tăng dầngiá trị thể mẫu, t thể mơ tả mẫu thể bảngphânphốitầnsốthựnghiệmsau

xi x1 x2 xi xk ni n1 n2 ni nk

với n1+n2+ .+nk =n.Dịngtrênghiágiátrịóthể óủamẫutheothứtựtăngdần, dịngdướighitần sốtươngứng.Tầnsốmẫulà sốáthểóđặtính X=xi trongmẫu Bảng tầnsố hotanhiềuthơngtin hơndãysố liệuđượsắpxếptheothứtự tăngdần Ngồinhững thơngtin óđượnhưdãy sốliệusắpxếptheothứ tựtăngdần, quabảngtần sốtthể biết đượsốliệu nàmặtnhiềunhất, sốliệunàmặtítnhấttrongmẫu

Gäifi = ni

n,(i= 1, , k)làtầnsuấtủấthểóđặtínhxi trongmẫu,tbảngphân phốitầnsuấtthựnghiệmnhư sau

xi x1 x2 xi xk

(6)

với f1+f2+ .+fk = 1.Ngồi nhữngthơngtin óđượ nhưbảng tầnsố mẫu, tn bit tlphntrmúnggúpasliumu

Ví d 3.2.1 Gặt ngẫu nhiên100 điểm trồnglúa vùng, ta thuđượ số liệu đượ sắpxếpthànhbảngsau:

Nngsut(t/ha) 21 24 25 26 28 32 34 Sốđiểmgặttương ứng 10 20 30 15 10 10 5

Bảngphânphốitầnsuấtthựnghiệm:

xi 21 24 25 26 28 32 34

fi 0,1 0,2 0,3 0,15 0,1 0,1 0,05

Nhữngphươngpháptrên óưuđiểmlàmơ tảđượmẫuỡlớn,nhưngnhượđiểm làkhó mơ tảđượ mẫuliên t Khikíh thướmẫulớn đặtính địnhlượng ủatổng thểlà biếnngẫu nhiênliêntthìngườitathườngdùng phươngpháp sau

)Phươngphápphânkhoảng Phânhiasốliệutheolớpvớiùngmộtđộrộngđểthuậntiện hoviệ phântíhvà xửlýsốliệu.Giảsửxmin làgiátrị nhỏnhất,xmax làgiátrịlớnnhấtủa số liệu.Chia khoảng(xmin, xmax)thànhk khoảngáhđều nhauvớiđộ rộngủamỗikhoảng

h= xmax−xmin

k ,

Ngườitahứngminhđượrằngsốkhoảngđượhọntốiưuthengthứ:k = 1+3,322 lgn Tbảngsau(gọi làbảng ghplớp)

Kho¶ng x0−x1 x1−x2 xk−1−xk Tần sốdữliệutrongkhoảng n1 n2 . nk

trongúni làsốáthểóđặtínhX thỏamãnxi−1 6X 6xi, i= 1,2, , nótrongmẫu Phươngpháp óưu điểmlà mơ tảđượ mọidữ liệu, khoảng àngdầy thìàng hính xá,tính tốntrênmáytínhthuậnlợi

Víd3.2.2 Tiếnhànhđongẫunhiên100 âybạhđàntrồngtrongmộtkhurừngtáisinhsau

10năm, tathuđượá sốliệuđượsắpxếpthànhbảngsau:

Chiều ao(m) 3,54,5 4,55,0 5,05,5 5,56,0 6,0−6,5

Sè©y 10 20 30 25 15

3.2.2 Hàmphân phối thự nghiệm mẫu

(7)

Định nghĩa3.2.3 Hàmphân phối thựnghiệm mẫu (hayhàm phân phốimẫu) biến ngẫunhiênX,kíhiệulàFn(x),làmộthàmsốtheobiếnsốthựxvà đượxáđịnhnhư sau:

Fn(x) = m

n, x∈R (3.3)

trongđómlàsốphầntửủamẫtrịsốnhỏhơnx(Xi < x).VớiáhxâydựnghàmFn(x) rõràng saukhi lấy mẫu rồithì phân phốinày đượ xá địnhhoàn toàn Theo (3.3),Fn(x)làtầnsuấtủabiếnngẫunhiênX nhậngiá trịnhỏhơnxứngvớin php thửđộ lậpnên việđịnh nghĩaFn(x)trong(3.3)tươngđươngvới việ địnhnghĩaluật phânphốiPn xá địnhbởi:

Pn(X =Xi) = 1

n (i= 1,2, , n). (3.4)

Như rõ ràng hàm phânphối mẫu ũng hàmphân phối xá suất ỡ mẫu tăng vơ hạn thìhàm phânphốithựnghiệm Fn(x)tiến dầnđến hàmphânphốixá suất F(x) tổng thể Do đóóthể dùnghàm phânphốithựnghiệm ủamẫuđể biểudiễn mộtáh gần đúngquyluật phânphốixá suấtF(x)ủatổng thể

Víd3.2.4 Điềutramứđộsâubệnhtrên mộtánhđồngngơ,ngườitakiểmtra ngẫunhiên

500 hố,mỗi hốó2ây.Kếtquảkiểm tranhưsau

Sốâybịbệnh 0 1 2

Sốhố 242 185 73

HÃylậphàm phânphốithựnghiệm

Gii:Theo địnhnghĩathàmphânphốimẫuđượxáđịnh +Vớix <0thìFn(x) = 0;

+Víi0< x≤1th×Fn(x) =

242

500 = 0,484; +Víi1≤x <2th×Fn(x) =

242 + 185

500 =

427

500 = 0,854; +Víix≥2th×Fn(x) = 1

VËyFn(x) =         

0 x <0;

0,484 0< x≤1; 0,854 1≤x <2;

1 x≥2.

3.2.3 Biểu diễn số liệu biểu đồ

(8)

thống kênhưbiểuđồhìnhtrịn, hìnhột, biểuđồđường,biểu đồhìnhbậthang, Việsử dng loạibiểuđồnàođểbiểudiễnsốliệuhothíhhợpphthuộvàođặ tínhđặtrưngmà tanghiênứu(biếnđịnhtínhhaybiếnđịnhlượng), phthuộvàophươngphápsắpxếpsốliệu mđíhnghiênứuủahủ thể

a) Biểu đồ tần số Nếu sốliệu đượ xếpphân loại theotần số người ta thường dùng loạibiểuđồsauđểbiểudiễn:

-Biểuđồtầnsố hìnhột gồmnhiềuhìnhhữnhật,mỗiđặtínhứngvới mộtộthìnhhữ nhật, đáyủa áột trùng với trhồnhbiểu thị áđặ tínhtương ứng,tr tungbiểu thị tần sốvàđộ aoủa mỗiộthìnhhữnhậtthểhiện tầnsốủấđặtính

-Biểuđồđườngtầnsốhayđagiátầnsốlàđườngnốiáđiểm(x1, n1),(x2, n2), ,(xk, nk)

Ví d 3.2.5 Để nghiên ứuhất lượng họtập sinhviên nămthứ ởmột trường đại họ, ngườitathốngkêđiểm tổngkếttheoxếploạiA, B, C, Da400 sinhviờnnmthnht hnngunhiờntdanhsỏhv thubngsliu sau

Đánhgiá A B C D

TÇn sè 35 260 93 12

Hãy vẽbiểuđồhìnhtrịn vàhìnhộtbiểu diễnkếtquảhọtậpủa400 sinhviêntrên

Giải Tthểtổnghợpásốliệutrongbảngtrêndướidạngbảngthốngkêsauđểthuậntiện hoviệ biudinỏs liubngbiuhỡnhtrũn

Đánhgiá Tầnsố Tần suất Phần trăm Gótròn

A 35 35/400 = 0,09 9% 0,09×360 = 32,4o

B 260 260/400 = 0,65 65% 234o

C 93 93/400 = 0,23 23% 82,8o

D 12 12/400 = 0,03 3% 10,8o

Tæng sè 400 1,00 100% 360

o

50 100 150 200 250 300

0 A B C D

35

260

93

12

fi

xi

Hình3.1:Biểuđồtầnsốhình ột

65%

A C

32%

9%

D 3%

B

Hình3.2:Biểuđồhìnhtrịn

(9)

- Biểu đồ hình trịn biểu đồ gồm nhiều hình quạt, hình quạt biểu diễn tỷ lệ phần trămủa mỗiđặtínhsovớitồnbộá đặtínhthuđượở mẫu

-Biểuđồđườngtầnsuấthayđagiátầnsuấtlàđườngnốiáđiểm(x1, n1

n ),(x2, n2

n ), ,

(xk,

nk

n ).Gọipi =P(X =xi),theođịnhnghĩathốngkêvề xásuấtthì ni

n →pi khin → ∞, điềunàynghĩalàkhin lớnthìtungđộủabiểuđồđườngtầnsuấtxấpxỉtungđộủabiểuđồ đườngxásuấtầntìm.Dođóbiểuđồđườngtầnsuấtgiúptahìnhdungdạnghàmmậtđộủa biếnngẫunhiênX

Ví d 3.2.6 HÃy vẽ đa giá tần suất bảng số liệukiểm tra kết thi môn toán 20 häsinh:

xi 1 3 5 6 8

ni 2 4 8 5 1

Giải Taóbảngtần suất

xi 1 3 5 6 8

fi 0,1 0,2 0,4 0,25 0,05

Biểuđồđườngtần suấtódạngnhưhình3.3.

1 3 5 6 8 xi

0,1 0,2 0,4 0,6

fi

Hình3.3:Biểuđồ đườngtầnsuất

(10)

3.3 Cá đặ trưng mẫu ngẫu nhiên

3.3.1 Hµm thèng kê

Để nghiên ứu biến ngẫu nhiên gố X tỉng thĨ, nÕu hØ rót mét mÉu ngÉu nhiªn

(X1, X2, , Xn)th× míihØ ãmét vàikết luậnsơ bộvà rời rạvề X,vì giátrị Xi

mẫu ó quy luật phân phốixá suất với X,song quy luật lại hưa đượ xá định hoàntoàn.NhưngnếutổnghợpábiếnngẫunhiênX1, X2, , Xnnàylạithìtheoluậtsốlớn húng sẽbộ lộnhữngquy luậtmới làmơsở đểnhận địnhvề biếnngẫu nhiêngốX tổngthể Việtổnghợpmẫu(X1, X2, , Xn)đượthựhiệndướidạngmộthàmnàođóủa ágiátrịX1, X2, , Xnủamẫuđượgọilàhàmthốngkê(statistialfuntion)haythốngkê, ký hiệulàG=f(X1, X2, , Xn).Vớimẫu thể(x1, x2, , xn)thìg =f(x1, x2, , xn) giátrịthểmà thốngkêG=f(X1, X2, , Xn)nhậntương ứngvớimẫuđãho

Nhưvậy,vềthựhấtthốngkêlàmộthàmủấbiếnngẫunhiên, dođónóũnglàmột biến ngẫunhiêntn theomột quyluậtphânphối xásuất nhấtđịnhvà ũngó átham số đặ trưngnhưkỳ vọng,phươngsai, Cáthống kêùng vớiquyluậtphânphốixásuấtủa húnglà ơsởđểsuyrộngá thơngtinủamẫuhodấuhiệunghiên ứutổngthể

3.3.2 Trung b×nh mÉu

GiảsửtừtổngthểủabiếnngẫunhiêngốX,talậpmộtngẫunhiên(X1, X2, , Xn)ó kíhthướ n

Định nghĩa 3.3.1 Một thống kê đượ gọi trung bình mẫu (sample mean) trungbình sốhọủấgiá trịmẫu,kí hiệulàX,tứlàX đượ xáđịnhbởiX =

1

n n

P

i=1 Xi

Chú ý3.3.2 (i)Khithựhiện mộtphp thửđốivới mẫungẫunhiên, nósẽnhậnmột mẫu thể (x1, x2, , xn),dođótrungbìnhmẫuũngnhậnmột giátrịthể, kíhiệulàx

(ii)Trungbìnhmẫulà mộtthốngkênênnóũnglàmộtbiếnngẫunhiên,do đónóóá tham số đặtrưng tương ứng nhưkì vọng tốn, phương sai Nếubiến ngẫu nhiêngố X ó kì vọngtốnE(X)và phươngsai V(X)thì

E(X) = E(X); V(X) = V(X)

n ; σ(X) = σ(X)

n . (3.5)

Vậy biếnngẫu nhiên gố phân phối theoquy luật nào, trung bình mẫu X ũng ó kỳ vọng tốnbằngkỳvọng tốnủabiếnngẫunhiên gố,ịnphươngsaiV(X)ủanó nhỏhơn n lầnsovới phươngsaiủa biếnngẫunhiêngố,nghĩalà ágiátrịóthểóủa X ổnđịnh

(11)

3.3.3 Phương sai mẫu

Địnhnghĩa3.3.3 Phươngsaimẫu(samplevariane),kíhiệulàS 2

,làmộtthốngkêxáđịnh

S2 = 1

n

n

X

i=1

Xi2−( 1

n

n

X

i=1

Xi)2 =X2−(X)2.

Chú ý3.3.4 (i)Hồn tồntươngtự nhưtrungbình mẫu,khi homột mẫuthể thìphương saimẫusẽ nhậnmộtgiátrịthể, kíhiệulà s

2

(ii)Phươngsaimẫuũnglàmộtthốngkênênnóũnglàmộtbiếnngẫunhiênóátham sốđặtrưngxáđịnh.NếubiếnngẫunhiêngốXókìvọngtốnE(X)vàphươngsaiV(X)

E(S2) = n−1

n V(X). (3.6)

3.3.4 Phương sai điều hỉnh mẫu

Định nghĩa 3.3.5 Phương sai điềuhỉnh mẫu (samplestandard variane), kí hiệulà S ′2

, mộtthốngkê xáđịnhbởi

S′2 = 1

n−1 n

X

i=1

(Xi−X)2 =

n n−1S

2

Chúý3.3.6 (i)PhươngsaiđiềuhỉnhmẫuS ′2

làmộtthốngkê,khiómẫuthểthìphương saiđiềuhỉnhmẫu ũnglàmộtsốxá định,kíhiệu s

′2 (ii)Cũng giốngnhư phươngsai mẫuS

2,

phươngsai điềuhỉnh mẫuS ′2

òng làmột biến ngẫunhiênvà nóótínhhấtsau:

E(S2) = V(X) (3.7)

Từ (3.6) (3.7) ta thấy với biến ngẫu nhiên gố X phân phối theo quy luật thỡ phngsaimuS

2

ũngó kìvọngtoánbằng n1

n lầnphươngsaiủabiếnngẫu nhiêngố X, phương sai điều hỉnh mẫu S

′2

ó kì vọng tốn phương sai biến ngẫu nhiêngốX.

3.3.5 Độ lệh tiêu huẩn mẫu vàđộ lệh tiêu huẩnđiều hỉnh mẫu

Định nghĩa 3.3.7 Độlệh tiêu huẩn mẫu (sample error) độ lệh tiêu huẩn điều hỉnh mẫu (sample standard error) đượ kí hiệu S S

, đượ tính S =

S2 vµ S′ =√S′2

.

Khiómẫu thểthìđộ lệhtiêuhuẩn mẫuvà độlệhtiêuhuẩn điềuhỉnhmẫu ũng làá giátrịxáđịnh,kíhiệus, s

(12)

3.3.6 Sai số tiêu huẩn

Nếutahọnmẫumlần,mỗilầnnphầntửthìtasẽómtrungbìnhmẫuX.Điềunàydẫn tới kháiniệmsau:

Định nghĩa3.3.8 Sai số tiêuhuẩn (standarderror), kýhiệu làSE, làđộ lệh huẩnủam trungbình mẫuvàđượxá địnhbởi

SE =σ(X) = σ√(X) n .

Chú ý3.3.9 (i)Trongtrườnghợpnếuhưabiết độlệhhuẩnủatổngthểthìSE = S′ √

n (ii)Saisốtiêuhuẩnphảnánhđộdaođộnghaybiếnthiênủấsốtrungbìnhmẫu.Cá tham sốđộlệhtiêuhuẩnđiều hỉnhmẫuvàsai sốtiêuhuẩnđóngvai trịquantrọngtrong tốnvề ướ lượng khoảng tin ậy kiểm định giả thuyết xá suất (sẽ đề ập đến Chương 4và Chương5ủauốngiáo trìnhnày)

3.3.7 Cáh tính đặ trưngmẫu

Quanộidungtrênbạnđọdễnhậnthấykhiómẫuthểtasẽtínhđượtrungbìnhmẫu, phươngsaimẫulàágiátrịthể.Tínhđượtrungbìnhmẫu,phươngsaimẫutasẽtínhđượ đặtrưng ịnlạinhư phươngsaiđiềuhỉnh mẫu, độlệhtiêu huẩnmẫuvà độlệh tiêu huẩnđiềuhỉnhmẫubằngáhsửdngáđịnhnghĩaủahúng Dovậyởđâytaquantâm đến áhtínhhaiđặtrưngmẫulàtrung bìnhmẫuvàphươngsaimẫu

-Nếumẫuthểđượhoở dạngliệtkêthìvới mẫukíhthướn t x= 1

n

n

X

i=1

xi, x2 = 1

n

n

X

i=1

x2i (3.8)

s2 =x2−(x)2 = 1 n n X i=1 x2 i − 1 n n X i=1 xi !2 (3.9)

-Nếumẫuthểđượhoở dạngbảngtầnsốthì

x= 1

n

k

X

i=1

nixi, x2 = 1

n

k

X

i=1

nix2i; víi

k

X

i=1

ni =n. (3.10)

s2 =x2−(x)2 = 1 n

k

X

i=1

nix2i − 1

n

k

X

i=1 nixi

!2

(3.11)

(13)

ni xi nixi nix2i

n1 x1 n1x1 n1x2

1 . . . . P 1 = k P i=1

ni P2 =

k

P

i=1

nixi P3 =

k

P

i=1 nix2i

Nhìnvào bảngvàdựavào ôngthứ(3.10) taó:x= P

2 P

1

, x2 = P

3 P

1

,sauúthayvo ụng

thứ(3.11)tatính đượs 2.

Víd 3.3.10 Mứ tănggiánhàủa30thángquahoởbảng sau:

Mứtănggiáxi 2 4 6 8 10 Sèth¸ngni 2 5 12 7 4

Hãytính áđặtrưngmẫux, s

2, s, s2, s.

Giải:Ta lậpbảngtínhsauđây:

ni xi nixi nix2i

2 2 4 8

5 4 20 80

12 6 72 432

7 8 56 448

4 10 40 400

P 1 = 30

P

2 = 192 P

3 = 1368

x= 192

30 = 6,4; x

2 = 1368

30 = 45,6;

s2 =x2−(x)2 = 45,6−6,42 = 4,64; s=√s2 = 2,1541; s′2 = n

n−1s

2 = 30

29.4,64 = 4,8; s

′ =√s′2 = 2,19.

- Nếu mẫu thể đượ ho dạng bảng tần số mà ó giá trị xi áh khoảngh thìđểlàm giảmđộphứtạpủasốliệu tínhtốnta dùngphươngpháp đổibiếnsố Đặt ui =

xi−x0

h , x0 ó thể họn giá trị xi với m đíhlàm giảmsốliệutínhtốnngườitathườnghọnlàgiátrị màtạiđótầnsốđạtgiátrịlớnnhất Khi

x=x0+hu; s2x=h2s2u =h2(u2−(u)2)

(3.12)

trongđó

u= 1

n

k

X

i=1

niui; u2 = 1

n

k

X

i=1

niu2i, víi

k

X

i=1

(14)

ni xi ui niui niu2i

n1 x1 u1 n1u1 n1u2

1 . . . . . P 1 = k P i=1

ni P2 =

k

P

i=1

niui P3 =

k

P

i=1 niu2i

Dựa vào bảng tính ông thứ (3.13) ta tính đượ: u = P

2 P

1

; u2 = P

3 P

1

vµ thay vµo ông thứ(3.12) tathuđượx;s

2

x.

Chỳ ý 3.3.11 (i) Trong trường hợp xi áh khoảng h,đổi biến số hỉ ó ý nghĩa làm giảmđộ phứtạp tính tốnnên khơngđổi biến ta tínhbình thường trườnghợpb)

(ii) Nếumẫu ho dạng bảng ghp lớp(phương pháp phân khoảng), ta họn lớp giátrị đạidiện, thơng thườnglà giátrị hínhgiữa lớp, khiđó tathu đượbảngtần sốvà tính đượáđặtrưngmẫunhưáh tínhởtrên

Víd 3.3.12 ĐiềutraGluozatrongmáuở 100ngườitathuđượkết quảsau(mg%):

xi 65 70 75 80 85 90 95 100 105 110 115 120 125

70 75 80 85 90 95 100 105 110 115 120 125 130

ni 1 0 2 5 8 16 18 17 16 9 5 2 1

Hãy tínháđặtrưngmẫux, s

2, s, s′2, s′

Giải: Chọn xi điểmgiữa lớp, dễ thấy xi áh mộtkhoảng h = 5, đặt ui=

xi−97,5

5 Tẫb¶ngtÝnh sau

Kho¶ngGluoza xi ni ui niui niu 2

i

65−70 67,5 1 −6 −6 36

70−75 72,5 0 −5 0 0

75−80 77,5 2 −4 −8 32

80−85 82,5 5 −3 −15 45

85−90 87,5 8 −2 −16 32

90−95 92,5 16 −1 −16 16

95−100 97,5 18 0 0 0

100−105 102,5 17 1 17 17

105−110 107,5 16 2 32 64

110−115 112,5 9 3 27 81

115−120 117,5 5 4 20 80

120−125 122,5 2 5 10 50

125−130 127,5 1 6 6 36

P

1 = 100

P 2 = 51

P

(15)

u= 51

100 = 0,51; u

2 = 489

100 = 4,89;

x=x0+hu= 97,5 + 5.(0,51)≈100,05 s2u =u2−(u)2 = 4,89

−0,512 ≈4,63;

s2x =h2s2u = 52.(4,63) = 115,75; s=ps2

x = 10,76;

s′2 = n n−1s

2 = 100

99 ·(115,75) = 116,92; s

′ =√s′2 = 10,81.

3.3.8 TÇn st mÉu

Giảsửtừtổngthểkíh thướN trongđóó M phầntửmangdấuhiệunghiên u,ly mtmungu nhiờnkớhthn vtrongúthyú mphntmangduhiunghiờnu

Địnhnghĩa3.3.13 Tầnsuấtmẫu(samplerelativefrequeny),kýhiệulàf = m

n,ltsgia sphntmangdu hiunghiờnutrongmtmuv kớhthmu

Víd3.3.14 Kiểmtrangẫunhiên400sảnphẩmdomộtmáysảnxuấtrathấyó20sảnphẩm làphếphẩm Tínhtầnsuấtxuất hiệnphếphẩmtrongmẫuđượ lấyra

Giải Taótầnsuất xuấthiệnphếphẩmtrongmẫulấyralàf =

20

400 = 0,05

Bitphng3

1 Điềutranăngsuất lúaX (tạ/ha)trên10thửaruộngtathuđượbảng sốliệusau:

Thửasố 1 2 3 4 5 6 7 8 9 10

X 45,5 46 47 45,5 47,5 46 48 48 44 49,5

(a)Lập bảngtầnsốvà tầnsuấtmẫu

(b)Lập hàmphânphốithựnghiệmủamẫu

()Xâydựngđagiá tầnsốvà đagiátầnsuấtủamẫu

2 Trng lượngX (kg)ủa12onlợnkhixuấthuồng là:

108; 112; 108; 120; 112; 114; 115; 112; 115; 118; 116; 110

(a)Lập bảngtầnsốủa mẫu (b)Tính áđặtrưngmẫu:x;s

2;s;s′2;s′.

3 Trọng lượngX (kg)ủa20onlợnxuấthuồnghobởi bảngsau:

X 85 95 105 115 125 135

94 104 114 124 134 144

(16)

(a)Tính trungbìnhmẫuvà phươngsaimẫu (b)Vẽ đagiátầnsố

4 Đo hiều ao X (m) 100 niên từ 18 tuổi đến 22 tuổi tỉnh A ta thu đượ bảngsố liệusau:

X 154 158 162 166 170 174 178

158 162 166 170 174 178 182

ni 10 14 26 28 12 8 2

(a)Lập biểuđồ tầnsốhìnhộtvà đagiátầnsố

(b)Tính trungbìnhmẫuvà phươngsaimẫutheốgiá trịđạidiện

5 Đođộdàiủa30hitiếthọnngẫunhiêntừmộtloạisảnphẩmtathuđượbảngsốliệu sau đây:

X 39 40 41 42 43 44

ni 4 5 9 7 4 1

(a)Xá địnhhàmphânphốithự nghiệmứngvớimẫutrên; (b)Xá địnhbiểuđồđườngtầnsuất;

()Tính trungbìnhmẫu, phươngsaimẫu

6 Đođộlệh ủakíhthướsảnphẩmsovới huẩntathuđượbảngsốliệusau đây:

X 0,02 0,04 0,06 0,08 0,10 0,12 0,14 0,16 0,04 0,06 0,08 0,10 0,12 0,14 0,16 0,18

ni 8 13 14 13 19 8 12 13

(a)HÃy lậpbảngtầnsuấtmẫu;

7 Cho bảngtầnsuấtmẫu:

X 1 2 3 4

fi 0,4 0,1 0,3 0,2

Tìmhàmphânphốithựnghiệmvàvẽ đồthịủanó

8 Điều tradoanh sốX hàngtháng 100hộ kinhdoanh mộtngành nàođó tathu đượ sốliệu sau:

X (triệuđồng) 10,1 10,2 10,4 10,5 10,7 10,8 10,9 11 11,3 11,4

(17)

(a)Xâydựngđa giátầnsuất; (b)Tính x, s

2, s2, s, s.

9 Điềutra365 điểmtrồnglúaủamột huyệntathuđượsốliệusau:

NăngsuấtX (tạ/ha) 25 30 33 34 35 36 37 39 40 Sè®iĨmtrång lóani 6 13 38 74 106 85 30 10 3

(a)Xâydựngđa giátầnsuất;

(18)

Chng

ớ lượng tham số

ớ lượng tham số toán thống kê toán họ Khi nghiên ứu dấu hiệu đặtrưng dạng đặ tính địnhlượng (hẳng hạn hiều ao, ânnặng, độdài, )ủatổngthể thơngquabiếnngẫunhiêngốX,nếuxá địnhđượ quyluậtphânphốixásuấtủaX thìviệđưarấđánhgiáũngnhưádựbáovềsựbiến động tổng thể liênquan đến đặ tính nàysẽ hính xá kháh quan Tuy nhiên lú nàohúng ta ũngxá định đượ quyluật phân phốixá suất ủaX Trong số trường hợp,bằng phươngpháp phântíh lýthuyết tthể biếtđượdạng tốnhọủa hàm phân phốihoặhàmmật độủa biếnđịnh lượngX Tuy nhiêná thamsốđặ trưngủa kỳ vọng, phương sai, mà tagọi tham số lý thuyết θ lại hưa biết nên ta ần phảixá địnhθ.Việtính hínhxá θ làkhóó thểthựhiện đượmàta hỉóthểtính gần đúngthơngquamẫuthựnghiệmđãógọilàướlượng thamsố(estimateforparameters)θ Cóhaiphươngphápthườngđượsửdnglàphươngphápướlượngđiểmvà phươngpháp ướ lượngbằngkhoảng tinậy

4.1 Phương pháp ướ lượng điểm

Phương pháp ướ lượng điểm (point estimation) hủ trương dùng giá trị để thay ho thamsố θ hưa biếtvề tổngthể, thân θ mộtsố xá định Thơng thường giá trị đượhọnlàmộtthốngkêGnàođóủamẫungẫunhiên Cónhiềh họnthốngkêG nhautạonênnhữngphươngphápướ lượngđiểmkhánhau

4.1.1 Phương pháp hàm ướ lượng(phương pháp mơ men)

GiảsửầnướlượngthamsốθủabiếnngẫunhiêngốX.Đốivớiphươngpháphàmướ lượng tthểtiếnhànhtheốbướ nhưsau:

Bướ 1.Từtổngthể lậpmẫungẫunhiênkíhthướn: W = (X1, X2, , Xn)

(19)

họn thốngkêmẫu tươngứngvới thamsố θ ầnướ lượng,hẳng hạn, đểướ lượngkìvọng tốnaủabiếnngẫunhiêngốthìngườitathườnghọnthốngkêlàtrungbìnhmẫuX,đểướ lượngphươngsaiσ

2

thìtahọn thốngkêlàphươngsaimẫuS 2

Bướ3.Lậpmẫuthểvàtínhđượgiátrịg =f(x1, x2, , xn)ủathốngkêGtrênmẫu thểđó.Từ đósuyraướlượngủaθ giátrịg vừa tínhđượ

Chấtlượngủa ướlượngkhơngthể đánhgiá quamộtgiá trịthể ủaGvì nhưvậy hỉ ó áhsosánh trựtiếpg θ màθ lại hưabiết.Do hỉó thểđánhgiá hấtlượng ướ lượng thông qua thân thống kê G = f(X1, X2, , Xn) Rõ ràng ó vơ số áh họnhàm f,tứlàó vơsố thốngkêGó thểdùnglàmướlượng ủaθ nênầnđưara tiêuhuẩnđểđánhgiáhấtlượngthốngkêG,từđólựahọnđượthốngkê"xấp xỉmộtáh tốtnhất" thamsốướlượng.Có3tiêuhuẩnơ bảnđểhọnthốngkênhưsau:

a) lượng không hệnh: Giả sử thống kê G ướ lượng tham số θ biến ngẫu nhiêngố.Vớik mẫuthểrútratừtổngthể,thốngkêGsẽnhậnkgiátrịthểtươngứnglà g1, g2, , gk.NếuthốngkêGlà mộtướlượngódưủaθ thìá giátrịg1, g2, , gk ũng

sẽ lớn θ,do E(G) > θ Ngượlại, thống kê G làmột ướ lượng thiếu θ giátrị g1, g2, , gk ũng sẽnhỏhơn θ nênE(G)< θ.Như vậy,việ sửdngmột thống kêmàkỳvọngtốnủanókhávớithamsốầnướlượngóthểdẫnđếnsaisốhệthống(tất ảágiá trịủaGđềulớn hơnhoặnhỏhơnθ) Đểloạitrừsaisố nàyhiểnnhiênlàầnu ầu E(G) =θ.Dĩnhiên uầutrên khơngloạitrừđượ hồntồnásai số,songnhưvậy ásai sốkhádấusẽxuấthiệntươngđối đềunhau,dođóá giátrịủaGsẽkhơng bịlệh hẳnvề mộtphíasovớiθ

Địnhnghĩa4.1.1 ThốngkêGủamẫuđượgọilàướlượngkhơnghệhủathamsốθ biếnngẫunhiên gốX nếuE(G) =θ.Ngượlại,nếuE(G)6=θthì Gđượgọilàướlượng hệhủaθ

Chúý4.1.2 (i)Glàướlượngkhơnghệhủathamsốθ khơngónghĩalàmọigiá trịủa Gđều trùngkhítvới θmà hỉónghĩalàtrung bìnhágiátrị ủathốngkêGbằng θ.Từng

giátrị ủaGóthểsailệhrất lớnsovới

(ii) Trung bỡnh mu X ướ lượng không hệh kỳ vọng biến ngẫu nhiên gố, nghĩalàE(X) = E(X)

(iii) Tần suất mẫu f ướlượng không hệh xá suấtP biến ngẫu nhiên gố, nghĩalàE(f) =P

(iv) Phươngsai điều hỉnh mẫu S ′2

là ướ lượng khônghệh phương sai V(X) biếnngẫunhiêngố, tứlàE(S

′2) =V(X)

(20)

Sốphếphẩmtrongthùngk 0 1 2 3 4 5 6 8 9 10 Sốthùngók phếphẩm 0 2 3 7 20 6 4 2 1 1 (i)Hãyướlượnghosốphếphẩmtrungbìnhtrongmỗithùng

(ii)Hãyướlượnghotỷlệ phếphẩmủalơ hàngđó

(iii)Tìmướlượngkhơnghệhhophươngsaiủasốphếphẩmởmỗithùng

Giải (i)GọiX sốphếphẩmởmỗithùng.Đâylàbàitoánướlượngđiểmhokỳ vọngủa tổng thể

ni xi nixi nix2i

0 0 0 0

2 1 2 2

3 2 6 12

7 3 21 63

20 4 80 320

6 5 30 150

4 6 24 144

7 7 49 343

2 8 16 128

1 9 9 81

1 10 10 100

P

50 247 1343 Nhìnvào bảngtrêntathấy:

x= 247

50 = 4,94.

Vậy sốphếphẩmtrung bìnhởmỗithùnghànglàkhoảng5sảnphẩm

(ii) õy l bi toỏn lượng tỷ lệ tổng thể Tổng số sản phẩm ần điều tra n = 50ì50 = 2500.Sốphếphẩmpháthiệnlà247.Do đó,tỷlệ phếphẩmtrongmẫulà

f = 247

2500 = 0,0908.

Vậy tỷlệphếphẩmủalôhànglàvàokhoảng9,88%

(iii)lngkhụnghhhophngsaiasphphmmithựnghớnhlphng sai iuhnhmuS

2

.Ta ã: s2 = 1343

50 −(4,94)

2= 2,4564⇒s′2

= 50

49×2,4564 = 2,507.

Vậy phươngsai ủasốsảnphẩmhỏnggiữaáthùnglà vàokhoảng2,507

Ngày đăng: 08/03/2021, 17:32

Tài liệu cùng người dùng

  • Đang cập nhật ...

Tài liệu liên quan