xử lý số liệu và quy hoạch háo thực nghiệm
Lê Đức Ngọc Xử lý số liệu và Kế hoạch hoá thực nghiệm- Khoa hoá,ĐHQGHN. 200127Ch-ơng 3so sánh cặp tham số đặc tr-ngcủa hai tập số liệu kết quả nghiên cứu3.1. Giả thiết thống kê và kết luận thống kê:3.1.1.Giả thiết thống kê:Giả sử ta có Xivà Xklà 2 tham số đặc tr-ng của 2 tập số liệu kết quả nghiên cứu. Xuấthiện 2 giả thiết thống kê, trình bầy ở bảng sau:Giả thiết thống kê Ký hiệu ý nghĩa Biểu diễnGiả thiết không(giả thiết không liên quan) H0XiXkXi- Xk0Giả thiết khác không(giả thiết liên quan)Ha(H1)XiXkXi>Xk;Xi<XkXi- Xk0Trong đó : Xivà Xkcó thể là hai sự kiện, hai biến cố, hoặc hai đại l-ợng ngẫu nhiên cócùng thứ nguyên.3.1.2. Kết luận thống kê:Có hai loại kết luận thống kê :Bảng phân loại các kết luận thống kê:Thật GiảKết luận thống kêloại 1:Bác bỏ H0;Chấp nhận HaKết luận thống kêloại 2:Chấp nhận H0;Bác bỏ HaH0(XiXk)Ha(XiXk)Sai(Sai lầm loại 1)ĐúngHa(XiXk)H0(XiXk)Đúng Sai( Sai lầm loại 2)+ Kết luận thống kê loại 1: Phủ định H0(bác bỏ H0) và Khẳng định Ha(chấp nhận Ha).Kết luận thống kê loại 1 dẫn đến sai lầm loại 1, đó là Đúng là H0( xixk) lại kếtluận là Ha(xixk). Nói một cách khác: đúng là chúng giống nhau lại bảo chúng khácnhau.+ Kết luận thống kê loại 2: Phủ định Ha(bác bỏ Ha).Khẳng định H0(chấp nhận H0).Kết luận thống kê loại 2 dẫn đến sai lầm loại 2, đó là Đúng là Ha(XiXk) lại kếtluận là H0(XiXk). Nói một cách khác : đúng là chúng khác nhau lại kết luận chúnggiống nhau .Cần nhớ rằng : Kết luận thống kê là khẳng định ( hay chấp nhận ) một giả thiết thốngkê này và phủ nhận ( hay bác bỏ ) giả thiết thống kê kia, chứ không có nghĩa là cho rằng giảthiết thống kê này đúng còn giả thiết thống kê kia sai.Trong tr-ờng hợp buộc phải kết luận thống kê thì phải giữ nguyên tắc: thà mắc sai lầmloại 1 còn hơn mắc sai lầm loại 2. Nói cách khác: nếu không đủ bằng chứng để khẳng định giảthiết H0, thì thà phủ nhận giả thiết H0, còn hơn khẳng định giả thiết H0. Lê Đức Ngọc Xử lý số liệu và Kế hoạch hoá thực nghiệm- Khoa hoá,ĐHQGHN. 2001283.2. Quan hệ giữa chuẩn phân phối và kết luận thống kê.Các chuẩn phân phối có thể tính đ-ợc từ các số liệu của tập số liệu kết quả nghiên cứu:Xufi)f,P(SXXt hoặcxSX 2221)f,f,P(SSF212fiN1i)f,P(2)SXX(Sơ đồ quan hệ giữa chuẩn phân phối và kết luận thống kê:- Nếu ttính< tbảngnghĩa là độ tin cậy thống kê của ttínhnhỏ hơn độ tin cậy thống kêcủa tbảngvậy thì ttínhkhông đáng tin cậy bằng tbảng.Do ttínhkhông đáng tin cậy bằng tbảngnên hiệu số X - không đáng tin cậy, điều đócó nghĩa sự khác nhau giữa giá trị trung bình và giá trị thật là không đáng tin cậy . Vì chúngkhác nhau không đáng tin cậy cho nên có thể coi nh- chúng giống nhau (chấp nhận H0, phủnhận Ha).- Nếu ttính> tbảng, thì ttínhcó độ tin cậy thống kê lớn hơn độ tin cậy thống kê của tbảng.Vì vậy ttínhđáng tin cậy và do đó hiệu số X - chỉ sự sai khác giữa X và là đáng tin cậy(phủ nhận H0, chấp nhận Ha).Ptt> PtbPttPtbPtt> Ptbf(x)tt< tbf(x)tt= tbf(x)tb< tt Lê Đức Ngọc Xử lý số liệu và Kế hoạch hoá thực nghiệm- Khoa hoá,ĐHQGHN. 200129- Nếu ttính= tbảngthì độ tin cậy bằng nhau cho nên X - thoả mãn độ tin cậy thống kêcho tr-ớc. Nói cách khác độ chính xác tin cậy của tập số liệu kết quả nghiên cứu thoả mãn độtin cậy thống kê cho tr-ớc. Trong tr-ờng hợp này, chúng ta chọn thà mắc sai lầm loại 1 cònhơn mắc sai lầm loại 2 để kết luận thống kê. Nghĩa là thà kết luận X khác hơn là kết luậnX giống để chọn quyết định cho phù hợp.Do tbảngphụ thuộc độ tin cậy thống kê ( P ) cho tr-ớc, nên một kết luận thống kê rút rađ-ợc chỉ ứng với một độ tin cậy thống kê cho tr-ớc mà thôi. Khi độ tin cậy thống kê thay đổithì kết luận thống kê cũng có thể thay đổi theo.Lập luận về quan hệ giữa chuẩn phân phối t và kết luận thống kê cũng áp dụng cho cácchuẩn phân phối khác. Và việc sử dụng các chuẩn phân phối của các hàm phân phối để kếtluận thống kê cho đúng - gọi là kiểm định thống kê.3.3. So sánh cặp tham số đặc trựng của hai tập số liệu kết quả nghiên cứu:Có hai cặp tham số đặc tr-ng quan trọng nhất th-ờng phân tích so sánh đó là:* So sánh độ chính xác: Đặc tr-ng bởi X , khi đó có hai tr-ờng hợp chính:1. So sánh X với 2. So sánh XAvà XB* So sánh độ sai biệt: đặc tr-ng bởi S2.Tuỳ theo NAvà NBnhỏ hay lớn, giống nhau hay khác nhau, tiến hành so sánh theocách khác nhau.3.3.1. So sánh độ chính xác:Nguyên tắc so sánh là dùng chuẩn u hoặc chuẩn t để so sánh, vì:XufiSXXt hoặcxBASXXtVới N > 30 dùng chuẩn u , còn N < 30 dùng chuẩn t.Cánh tính toán chuẩn u hoặc t và so sánh với các giá trị tra bảng đ-ợc phân thành cáctr-ờng hợp sau:3 3.1.1. Nếu NAvà NB> 30. Dùng chuẩn u để so sánh.utính= N.dNddffx3.1Trong đó:BAXXd 3.2SBBAAdfNN22 3.3BABAN.NNNN 3.4 Lê Đức Ngọc Xử lý số liệu và Kế hoạch hoá thực nghiệm- Khoa hoá,ĐHQGHN. 2001303 3.1.2. Nếu NAvà NB< 30, dùng chuẩn t để so sánh chia làm hai tr-ờng hợp chính:1/. Nếu NANB<30. (giống tr-ờng hợp 3.1.1)N.SfdSxd)f,p(t 3.5Trong đó:BAXXd 3.6)1N()1N()1N(S)1N(SSdBAB2BA2A 3.7BABAN.NNNN 3.8f = (NA- 1) + (NB- 1) = NA+ NB- 2 3.92./ Nếu NA= NB= N'<30.Chia làm 2 tr-ờng hợp.a. Không liên quan với nhau từng đôi một:N.SdSd)f,p(tfx 3.10Trong đó:BAXXd 3.112SSSd2B2A 3.12'N2N2N2NBA 3.13f = NA+ NB- 2 3.14b. Có liên quan từng đôi một:'NS'NduSd)f,p(tfx 3.15Trong đó:BuAuXXd 3.16'NdudN1u 3.17 Lê Đức Ngọc Xử lý số liệu và Kế hoạch hoá thực nghiệm- Khoa hoá,ĐHQGHN. 2001311'N)dd(SdN1u2i3.18'N2N2N2NBA 3.19f = NA- 1 = NB- 1 = N'- 1 3.20Ví dụ 3.1 :Sử dụng 4 nghiên cứu A,B,C và D. Kết quả làm lặp lại theo mỗi nghiên cứu 6 lần thuđ-ợc trình bày trong bảng sau :N ph2A ph2B ph3C ph2D1 18,00 18,55 17,65 19,102 18,05 17,60 17,70 18,403 17,95 18,00 17,90 18,104 18,15 18,30 17,65 18,705 17,95 18,25 17,85 18,806 18,20 17,90 17,75 18,50a/ Tính giá trị Trung bình và Ph-ơng sai của mỗi nghiên cứu và nhận xét.b/ Biết giá trị thật là 18,1. Phân tích đánh giá sai số của mỗi nghiên cứu.Giải :ph2A ph2B ph3C ph2DX = 18,050 18,100 17,750 18,600S2= 0,012 0,112 0,018 0,120ph2Aph2Bph2Cph2D17,000 18,000 19,0006012,01,1805,18tA = 0,354 tB ( 95,5 )= 2,57Kết luận : H0: x sai số ngẫu nhiênph2C :6018,01,1875,17tC = 6,48 tB ( 95,5 )= 2,57Kết luận : Ha: x sai số hệ thống. Lê Đức Ngọc Xử lý số liệu và Kế hoạch hoá thực nghiệm- Khoa hoá,ĐHQGHN. 200132Ví dụ 3.2 :Cho kết quả nghiên cứu của A và B :1 2 3 4 5 6 7A 33,5 33,9 33,5 34,9 34,1 33,2 33,2B 31,1 32,9 32,8 31,9 33,0 31,6 32,18 9 10A 31,1 31,1 31,7B 31,5 31,0 31,0Phân tích đánh giá và phân tích so sánh 2 kết quả nghiên cứu trênGiải:Ax = 32,72Bx = 31,89S2B= 1,327 S2B= 0,619* Không liên quan từng đôi một: H0= 2 kết quả nghiên cứu không khác nhau.Ha= 2 kết quả khác nhau.d = 32,72 - 31,89 = 0,832SSSd2B2A9,110101010973,083,0n.nnnSdt2121dttb ( 0,95 ; 18 )= 2,101 Kết luận tttb chấp nhận H0* Liên quan từng đôi một : H0= 2 kết quả nghiên cứu không khác nhau.Ha= 2 kết quả khác nhau.83,0103,8ndd 667,0110103,889,121nn)d(dS2222d2,310667.083,0NSdtdttb( 0,95 ; 9 ) = 2,26 ttínhtb chấp nhận Hatb( 0,99 ; 9 ) = 3,25 ttínhtb bác bỏ HaNhân xét : - Khảo sát liên quan từng đôi một cho thấy có sự sai khác, trong khi khảo sátkhông liên quan từng đôi một thì không thấy sự khác nhau. Lê Đức Ngọc Xử lý số liệu và Kế hoạch hoá thực nghiệm- Khoa hoá,ĐHQGHN. 200133- Khi thay đổi độ tin cậy thông kê thì có thể dẫn đến thay đổi kết luận thống kê.Ví dụ 3.3:Để xác định l-ợng urê trong máu ng-ời, ta xây dựng một ph-ơng pháp mới. Ta muốnkiểm tra xem ph-ơng pháp mới này có gì khác đáng kể so với ph-ơng pháp đã đ-ợc chấp nhậntrong phòng thí nghiệm. Ta thực hiện hai ph-ơng pháp trên 6 mẫu khác nhau và thu đ-ợc kếtquả ghi trong bảng sau:Mẫu Ph-ơng phápmớiPh-ơng phápso sánhdidi-dtb(di-dtb)2ABCDEF10,2 mg/dl12,78,617,511,211,510,511,98,716,910,911,1-0,30,8-0,10,60,30,4dtb=0,28-0,60,5-0,40,30,00,10,360,250,160,090,000,01Tổng 0,87Khi đó, ta có sd=587,0= 0,42 t =642,028,0= 1,63Giá trị t t-ơng ứng trong bảng ứng với độ tin cậy 95% là 2,571, lớn hơn giá trị t tínhđ-ợc. Do đó, hai ph-ơng pháp không khác nhau đáng kể.Ví dụ 3.4:Một ph-ơng pháp mới đ-ợc xây dựng để xác định hàm l-ợng sắt trong chất kết tinh vớicơ bo. Độ chính xác của ph-ơng pháp đ-ợc phân tích bằng cách so sánh kết quả thu đ-ợc vớikết quả thu đ-ợc khi dùng ph-ơng pháp amoniac. Ta có bảng sau:Ph-ơng pháp mới Ph-ơng pháp so sánh20,01% 18,89%20,05 19,2018,65 19,0019,25 19,7019,40 19,4019,9919,65% 19,24%Hỏi có sự khác nhau nào đáng kể giữa hai ph-ơng pháp trên không?Ta có bảng sau (tr-ớc hết dùng chuẩn F để xem có thể so sánh hai ph-ơng pháp này với nhaukhông)xi1xi1-xtb1(xi1-xtb1)2xi2xi2-xtb2(xi2-xtb2)220,0120,0518,6519,2519,4019,9919,650,450,851,000,400,250,240,2020,7221,0000,1600,0620,1162,26218,8919,2019,0019,7019,4019,240,350,040,240,460,160,1220,0020,0580,2120,0260,420Do đó, ta có F =4/420,05/262,2= 4,31 Lê Đức Ngọc Xử lý số liệu và Kế hoạch hoá thực nghiệm- Khoa hoá,ĐHQGHN. 200134Xem trong bảng, giá trị F t-ơng ứng lớn hơn. Do đó, có thể so sánh hai ph-ơng phápnày với nhau. Lúc này, ta tính spSp=211420,0262,2= 0,546Do đó, ta tính đ-ợc t là:t =5656546,024,1965,19= 1,23Giá trị này nhỏ hơn giá trị trong bảng ứng với độ tin cậy 95%, do đó không có sự khác nhauđáng kể nào giữa hai ph-ơng pháp.3.3.2. So sánh độ sai biệt:Vì Ph-ơng sai đặc tr-ng cho độ sai biệt, nên so sánh độ sai biệt , chính là so sánhph-ơng sai. Ng-ời ta sử dụng chuẩn Fisher để so sánh:Chuẩn Fisher:222121SS)f,f,p(F )SS(2221 3.21Khi đó:Giả thiết H0: S12= S22đ-ợc chấp nhận khi và chỉ khi F không đáng tin cậy.( Ftính< Fbảng( p,f1,f2) ).Giả thiết Ha: S12S22đ-ợc chấp nhận khi và chỉ khi F đáng tin cậy .( Ftính> Fbảng( p,f1,f2) ).Vì :SS1222> 1 nên : S12> S22Việc so sánh Ftínhvà Fbảngluôn phụ thuộc vào độ tin cậy thống kê cho tr-ớc.Ví dụ 3.5 :Hai nghiên cứu A và B thu đ-ợc kết quả nh- sau :1 2 3 4 5 6 7 8A 4,40 4,56 4,42 4,59 4,55 4,45 4,55 4,39B 4,42 4,47 4,70 4,72 4,53 4,55 4,60 4,649 10 11 12 13 14 15 16A 4,75 4,72 4,53 4,66 4,90 4,50 4,45 4,66B 4,29 4,52 4,57 4,56 4,66 - - -17 18 19 20A 4,80 4,36 4,75 4,22B - - - -a/ Tính các đại l-ợng đặc tr-ng của tập hai kết quả nghiên cứu trên.b/ So sánh giá trị trung bình và giá trị ph-ơng sai của 2 nghiên cứu A và B.Giải : 75,4x201xinAvà 0295,0S2A H02B2ASS Lê Đức Ngọc Xử lý số liệu và Kế hoạch hoá thực nghiệm- Khoa hoá,ĐHQGHN. 200135 56,4x131xjinBvà 0139,0S2B Ha2B2ASS 54,2F12,20139,00259,0SSF)12,19,95(b2B2AKết luận : chấp nhận H0, bác bỏ HaVí dụ 3.6:Ta xây dựng một ph-ơng pháp sắc ký xác định l-ợng đ-ờng trong huyết thanh. Sửdụng chuẩn F để so sánh kết quả. Cho biết có sự khác nhau đáng kể nào giữa hai ph-ơng phápkhông?Ph-ơng pháp của ta Ph-ơng pháp Folin-Wumg/ml mg/ml127 130125 128123 131130 129131 127126 125129Trung bình 127 Trung bình 128S28,3 S24,8Do đó , F = 1,73. Từ bảng ta có Fb= 4,95. Từ đó suy ra không có sự khác biệt đáng kểnào giữa hai ph-ơng pháp.3 3.3.Bài toán so sánh 2 tỷ số :- Để so sánh 2 tỷ số :AAANXp vàBBBNXp , ta dùng chuẩn t :ttính=BABANpqNpqppTrong đó :BABANNXXp và p1q 3.22- Có hai điều kiện để áp dụng công thức trên :1/ Mẫu phải đủ lớn, ít nhất phải có :NAp , NBp 5 và NAq , NBq 52/ p và q phải gần 0,5 , nghĩa là xa 1 và 0 , cụ thể ta phải có :p > 0,1 và q < 0,9 hoặc p < 0,9 và q > 0,1- Bài toán khi đó với giả thiết thống kê và kết luận thông kê nh- sau:* Giả thiết thống kê : H0pApB; HapA pB Lê Đức Ngọc Xử lý số liệu và Kế hoạch hoá thực nghiệm- Khoa hoá,ĐHQGHN. 200136* Kết luận thống kê :t < 1,96 : chấp nhận H0, bác bỏ Ha( = 0,05 )t > 1,96 : chấp nhận Ha, bác bỏ H0( = 0,05 )Ví dụ 3.7:Tiến hành hai lô nghiên cứu, Lô 1 có 300 X1trong đó có 250 Y1, lô 2 có 400 X2trongđó có 240 Y2.Với = 0,05 hãy đánh giá xem tỷ lệ của hai lô có giống nhau hay khác nhau?Giải:-Tính tỷ lệ :833,0300250p1 và 6,0400240p2-áp dung công thức7,0400300240250p và q =1-0,7=0,3- tính ttinh:ttính= 96,1)6982700f;95,0(t65,64003,07,03003,07,06,0833,0Kết luận : Tỷ lệ của hai lô là khác nhau đáng tin cậy ở ng-ỡng 95%. . Lê Đức Ngọc Xử lý số liệu và Kế hoạch hoá thực nghiệm- Khoa hoá,ĐHQGHN. 200127Ch-ơng 3so sánh cặp tham số đặc tr-ngcủa hai tập số liệu kết quả nghiên. trung bình và giá trị ph-ơng sai của 2 nghiên cứu A và B.Giải : 75,4x201xinAvà 0295,0S2A H02B2ASS Lê Đức Ngọc Xử lý số liệu và Kế hoạch hoá thực nghiệm-