(Đề Tài Nckh) Một Số Ứng Dụng Của Phương Pháp Bootstrap Trong Xử Lý Số Liệu Thống Kê.pdf

55 1 0
(Đề Tài Nckh) Một Số Ứng Dụng Của Phương Pháp Bootstrap Trong Xử Lý Số Liệu Thống Kê.pdf

Đang tải... (xem toàn văn)

Tài liệu hạn chế xem trước, để xem đầy đủ mời bạn chọn Tải xuống

Thông tin tài liệu

Untitled BỘ GIÁO DỤC VÀ ĐÀO TẠO TRƯỜNG ĐẠI HỌC SƯ PHẠM KỸ THUẬT THÀNH PHỐ HỒ CHÍ MINH BÁO CÁO TỔNG KẾT ÐỀ TÀI KH&CN CẤP TRƯỜNG TRỌNG ÐIỂM MỘT SỐ ỨNG DỤNG CỦA PHƯƠNG PHÁP BOOTSTRAP TRONG XỬ LÝ SỐ LIỆU[.]

BỘ GIÁO DỤC VÀ ĐÀO TẠO TRƯỜNG ĐẠI HỌC SƯ PHẠM KỸ THUẬT THÀNH PHỐ HỒ CHÍ MINH BÁO CÁO TỔNG KẾT ÐỀ TÀI KH&CN CẤP TRƯỜNG TRỌNG ÐIỂM MỘT SỐ ỨNG DỤNG CỦA PHƯƠNG PHÁP BOOTSTRAP TRONG XỬ LÝ SỐ LIỆU THỐNG KÊ Mã số: T2013-156 Chủ nhiệm đề tài: Th.S Nguyễn Hồng Nhung S K C0 Tp Hồ Chí Minh, tháng 11/2013 BỘ GIÁO DỤC VÀ ĐÀO TẠO TRƯỜNG ĐẠI HỌC SƯ PHẠM KỸ THUẬT THÀNH PHỐ HỒ CHÍ MINH BÁO CÁO TỔNG KẾT ĐỀ TÀI KH&CN CẤP TRƯỜNG MỘT SỐ ỨNG DỤNG CỦA PHƯƠNG PHÁP BOOTSTRAP TRONG XỬ LÝ SỐ LIỆU THỐNG KÊ Mã số: T2013-156 Chủ nhiệm đề tài: Th.S NGUYỄN HỒNG NHUNG TP HCM, 11/2013 TRƯỜNG ĐẠI HỌC SƯ PHẠM KỸ THUẬT THÀNH PHỐ HỒ CHÍ MINH KHOA KHOA HỌC CƠ BẢN BÁO CÁO TỔNG KẾT ĐỀ TÀI KH&CN CẤP TRƯỜNG MỘT SỐ ỨNG DỤNG CỦA PHƯƠNG PHÁP BOOTSTRAP TRONG XỬ LÝ SỐ LIỆU THỐNG KÊ Mã số: T2013-156 Chủ nhiệm đề tài: Th.S Nguyễn Hồng Nhung TP HCM, 11/2013 MỤC LỤC MỤC LỤC THÔNG TIN KẾT QUẢ NGHIÊN CỨU MỞ ĐẦU CHƢƠNG 1: PHƢƠNG PHÁP BOOTSTRAP Đặt vấn đề Nội dung phương pháp Bootstrap Sai số tiêu chuẩn Bootstrap 13 3.1 Ước lượng Bootstrap cho sai số tiêu chuẩn giá trị trung bình μ 14 3.2 Ước lượng Bootstrap cho sai số tiêu chuẩn giá trị hệ số tương quan 15 3.3 Ước lượng Bootstrap cho sai số tiêu chuẩn giá trị độ lệch 19 Ước lượng Bootstrap cho độ chệch 22 CHƢƠNG 2: KHOảNG ƢớC LƢợNG BOOTSTRAP 25 Khoảng ước lượng Bootstrap-t 25 1.1 Khoảng ước lượng Bootstrap-t cho trung bình 27 1.2 Khoảng ước lượng Bootstrap-t cho trung bình thu gọn 29 1.3 Khoảng ước lượng Bootstrap-t cho tỷ lệ p 31 Khoảng ước lượng Bootstrap phần trăm 32 2.1 Khoảng ước lượng Bootstrap 95% cho trung vị (median) 33 2.2 Khoảng ước lượng Bootstrap 95% cho độ lệch 35 2.3 Khoảng ước lượng Bootstrap 95% cho hệ số tương quan 35 Khoảng ước lượng Bootstrap BCa 36 CHƢƠNG 3: KIểM ĐịNH BOOTSTRAP 40 Kiểm định Bootstrap toán hai mẫu 40 1.1 Kiểm định Bootstrap so sánh hai trung bình 40 1.2 Kiểm định Bootstrap so sánh hai t ỷ lệ 43 Kiểm định Bootstrap toán mẫu 45 2.1 Kiểm định Bootstrap so sánh trung bình với µ0 cho trước 45 2.2 Kiểm định Bootstrap so sánh tỷ lệ với P cho trước 48 KẾT LUẬN VÀ KIẾN NGHỊ 50 TÀI LIỆU THAM KHẢO 51 TRƯỜNG ĐẠI HỌC SƯ PHẠM KỸ THUẬT CỘNG HOÀ XÃ HỘI CHỦ NGHĨA VIỆT NAM THÀNH PHỐ HỒ CHÍ MINH Độc lập - Tự - Hạnh phúc KHOA KHOA HỌC CƠ BẢN Tp HCM, Ngày 25 tháng 11 năm 2013 THÔNG TIN KẾT QUẢ NGHIÊN CỨU Thông tin chung: - Tên đề tài: MỘT SỐ ỨNG DỤNG CỦA PHƢƠNG PHÁP BOOTSTRAP TRONG XỬ LÝ SỐ LIỆU THỐNG KÊ - Mã số: T2013-156 - Chủ nhiệm: Th.S NGUYỄN HỒNG NHUNG - Cơ quan chủ trì: Đại học Sư phạm Kỹ thuật Thành phố Hồ Chí Minh - Thời gian thực hiện: 2/2013 đến 11/2013 Mục tiêu Đề tài nghiên cứu ứng dụng phương pháp Bootstrap toán ước lượng kiểm định Tính sáng tạo Trình bày toán ước lượng bootstrap, kiểm định bootstrap cho tham số thống kê cụ thể trung bình, tỷ lệ, hệ số tương quan,… Xây dựng thủ tục giải toán kiểm định Bootstrap phần mềm Matlab Kết nghiên cứu Trình bày tốn ước lượng kiểm định Bootstrap Sử dụng phần mềm Matlab xây dựng thủ tục tính khoảng ước lượng Bootstrap giải toán kiểm định Bootstrap Hiệu quả, phƣơng thức chuyển giao kết nghiên cứu khả áp dụng Tài liệu tham khảo cho sinh, học viên cao học chuyên ngành Xác suất Thống kê đối tượng sử dụng phương pháp Bootstrap nghiên cứu Trƣởng Đơn vị Chủ nhiệm đề tài (ký, họ tên) (ký, họ tên) INFORMATION ON RESEARCH RESULTS General information: Project title: Some applications of Bootstrap method Code number: T2013-156 Coordinator: ME Nguyễn Hồng Nhung –HCMC University of Technical Education Implementing institution: HCMC University of Technical Education Duration: from 2/2013 to 11/2013 Objective(s): Study the applications of Bootstrap with confidence intervals and hypothesis test Creativeness and innovativeness: It is shown that the Bootstrap intervals and hypothesis testing with the Bootstrap for average, percentage, correlation,… Developprocedures tosolve the hypothesis testing with the Bootstrap by Matlab software Research results: It is shown that the Bootstrap confidence intervals and hypothesis testing with the Bootstrap UsingMatlabsoftwareto developprocedures in finding the confidence intervals Bootstrap and solving the hypothesis testing with the Bootstrap Effects, transfer alternatives of reserach results and applicability: Referencesto students, post-graduate studentsmajoring inStatisticsandProbability and who using Bootstrapmethodsinthe study MỞ ĐẦU Tổng quan tình hình nghiên cứu thuộc lĩnh vực đề tài nƣớc Phương pháp Bootstrap phương pháp coi mẫu gốc ban đầu đóng vai trị tổng thể mà từ rút Từ mẫu ban đầu lấy lại mẫu ngẫu nhiên cỡ với mẫu gốc phương pháp lấy mẫu có hồn lại, gọi mẫu bootstrap Phương pháp Bootstrap B.Efron đề xuất vào năm 1970 phương pháp lấy mẫu khác so với phương pháp truyền thống chỗ cho phép xử lý nhiều lần với mẫu gốc ban đầu Hiện phổ biến phát triển máy tính khắc nhược điểm phương pháp có khối lượng tính tốn lớn Chính phương pháp Bootstrap ngày phát triển phổ biến rộng rãi Tính cấp thiết Trong thống kê, Bootstrap xem phương pháp giải bất định toán thống kê cỡ mẫu nhỏ mà không cần giả thuyết phân phối xác suất tham số thống kê cần nghiên cứu Việc nghiên cứu phát triển phương pháp Bootstrap thu hút quan tâm nhiều nhà khoa học giới Phương pháp phổ biến rộng rãi nhiều trường đại học giới giảng dạy cho sinh viên cách s dụng.Vì việc tìm hiểu, nghiên cứu phổ biến ứng dụng phương pháp Bootstrap việc làm cấp thiết Mục tiêu Mục tiêu đề tài tìm hiểu ứng dụng phương pháp Bootstrap toán ước lượng kiểm định giả thuyết thống kê Trình bày bước tìm khoảng lượng Bootstrap tham số thống kê cụ thể Xây dựng thủ tục kiểm định Bootstrap cho toán kiểm định mẫu toán kiểm định hai mẫu Cách tiếp cận Để giải quết vấn đề trên, đề tài sử dụng kết lý thuyết thống kê cổ điển toán ước lượng kiểm định, từ xây dựng toán ước lượng kiểm định Bootstrap Phƣơng pháp đối tƣợng phạm vi nghiên cứu Tìm hiểu sở phương pháp Bootstrap ứng dụng phương pháp Nghiên cứu sử dụng phần mềm Matlab giải tốn tìm khoảng ước lượng Bootstrap kiểm định Bootstrap cụ thể Nội dung nghiên cứu Bản báo cáo đề tài gồm phần mở đầu, ba chương nội dung phần kết luận Chương trình bày xuất xứ ý nghĩa đề tài tìm hiểu ứng dụng phương pháp Bootstrap, nội dung phương pháp Bootstrap ước lượng sai số tiêu chuẩn cho tham số trung bình, tương quan, độ lệch Sử dụng phần mềm Matlab lấy mẫu Bootstrap từ tính giá trị tham số mẫu Bootstrap Chương trình bày cách tìm khoảng ước lượng Bootstrap-t, khoảng ước lượng Bootstrap phần trăm khoảng ước lượng Bootstrap BCa Sử dụng phần mềm Matlab lập chương trình tìm số khoảng lượng Bootstrap mẫu cụ thể Chương trình bước kiểm định giả thuyết Bootstrap mẫu hai mẫu cho tham số trung bình tỷ lệ Sử dụng phần mềm Matlab lập chương trình kiểm định giả thuyết Bootstrap mẫu hai mẫu cho tham số trung bình tỷ lệ >>bvals = zeros(b,1); >>for i = 1:b xstar=hightclc1(bootsam(:,i)); bvals(i) = mean(xstar); end >>numless = length(find(bvals> z0 = norminv(numless/b,0,1); %giá trị z0 >>jvals = zeros(n,1);%thiết lập giá trị θ −i >>for i = 1:n jvals(i) = mean([hightclc1(1:(i-1));hightclc1((i+1):n)],1); end >>num = (mean(jvals)-jvals).^3; >>den = (mean(jvals)-jvals).^2; >>ahat = sum(num)/(6*sum(den)^(3/2)); >>gamma=0.95;%độ tin cậy khoảng ước lượng >>alpha=1-gamma; >>zlo = norminv(alpha/2,0,1); % this is the z^(a/2) >>zup = norminv(1-alpha/2,0,1); % this is the z^(1-a/2) >> arg1 = z0 + (z0 + zlo)/(1-ahat*(z0+zlo)); >> alpha1 = normcdf(arg1,0,1); >> arg2 = z0 + (z0 + zup)/(1-ahat*(z0+zup)); >> alpha2 = normcdf(arg2,0,1); >> k1 = floor(((b+1)*alpha1)); >> k2 = ceil(((b+1)*alpha2)); >>sbval = sort(bvals); %s ắp xếp giá trị bvals >>blo = sbval(round(k1)) %c ận khoảng ước lượng blo = 1.6676 38 >>bhi = sbval(round(k2)) %c ận khoảng ước lượng bhi = 1.6950 Vậy khoảng ước lượng bootstrap BCa cho chiều cao trung bình sinh viên nam năm khoa chất lượng cao với độ tin cậy 95% (1.6676; 1.695)m 39 Chƣơng 3: Kiểm định Bootstrap Kiểm đị nh Bootstrap toán hai mẫu Cho X = X , X ,… , X n Y = Y1 , Y2 , … , Ym hai mẫu ngẫu nhiên có phân phối chưa biết F G Giả sử ta có tốn kiểm định giả thuyết: Giả thuyết H0: F=G Đối thuyết H1: F≠G Giả sử T tiêu chuẩn kiểm định tốn Ta có P-giá trị P T ≥ t điều kiện giả thuyết H0 Ta bác bỏ giả thuyết H0 với mức ý nghĩa α P T ≥ t ≤ 𝛼 Từ hai mẫu gốc ban đầu x = x1 , x2 , … , xn y = y1 , y2 ,… , ym ta có mẫu chung (x, y) Rút ngẫu nhiên có hồn lại từ mẫu chung (x, y) ta có b cặp mẫu bootstrap độc lập cỡ với mẫu gốc xk∗ = xk∗1 , xk∗2 , … , x ∗k n yk∗ = yk∗1 , yk∗2 , … , yk∗m , k=1, 2, …, b Áp dụng tiêu chuẩn thống kê T lên b cặp mẫu bootstrap ta thu b giá trị kiểm định Tk∗ = s xk∗ , yk∗ , k=1, 2, …, b Khi ta có giá trị bootstrap ước lượng cho P-giá trị bootstrap 1.1 ⋕ T ∗k ≥ t ) với B t = s x, y Ki ểm đị nh Bootstrap so sánh hai trung bì nh Cho X = X , X ,… , X n Y = Y1 , Y2 , … , Ym hai mẫu ngẫu nhiên có phân phối chưa biết F G có trung bình µ X µ Y Ta có tốn kiểm định giả thuyết Giả thuyết H0: µ X = µ Y Đối thuyết H1: µ X ≠ µY Với điều kiện µ X = µ Y ta đặt X i = X i − X + ZvàYi = Yi − Y + Z với X = n n i=1 X i ;Y= m m i=1 Yi Z = n +m n i=1 X i + m i=1 Yi 40 Ta có hai mẫu gốc X = X1 , X , … , X n Y = Y1 , Y2 ,… , Ym có trung bình mẫu trung bình mẫu chung Từ hai mẫu gốc x = x1 , x2 , … , xn y = y1 , y2 , … , ym ta có mẫu chung x , y Rút ngẫu nhiên có hồn lại từ mẫu chung x , y ta có b cặp mẫu bootstrap độc lập cỡ với mẫu gốc xk∗ = xk∗1 , xk∗2 , … , x ∗k n yk∗ = yk∗1 , yk∗2 , … , yk∗m , k=1, 2, …, b Áp dụng tiêu chuẩn thống kê T lên b c ặp mẫu bootstrap ta thu b giá trị kiểm định Tk∗ xk∗ − yk∗ = σ ∗2 X + n vớix∗k = n σ∗2 X = n −1 n ∗ i=1 x ki ; n i=1 y∗k = n xk∗i − xk∗ m ∗ i=1 y ki ; ; σ∗2 Y = σ ∗2 Y m m i =1 m−1 yk∗i − yk∗ ,k=1, 2, …, b Khi ta có giá trị bootstrap ước lượng cho P-giá trị ⋕ với n t= n −1 n i =1 x i −n Tk∗ ≥ t ) B n i=1 xi n i=1x i n − m + m i=1 y i m −1 m i =1 y i −m m i=1 y i m Ta bác bỏ giả thuyết H0 với mức ý nghĩa α P-giá trị bootstrap ⋕ Tk∗ ≥ t ) B ≤𝛼 Sử dụng phần mềm matlab ta xây dựng thủ tục tính P-giá trị bootstrap toán kiểm định giả thuyết so sánh hai tỷ lệ >> load data1.m; 41 >> load data2.m; >> xbar1=mean(data1); %trung bình mẫu gốc >> xbar2=mean(data2); %trung bình mẫu gốc >>n1=length(data1);% cỡ mẫu >>n2=length(data2);% cỡ mẫu >>zbar=(1/(n1+n2))*(sum(data1)+sum(data2)); >> nsam1=data1-xbar1+zbar; % tạo mẫu gốc >> nsam2=data2-xbar2+zbar; % tạo mẫu gốc >> b=1000; % số lượng mẫu bootstrap >> inds1= unidrnd(n1,n1,b); >> xboot1 = nsam1(inds1); >> inds2= unidrnd(n2,n2,b); >> xboot1 = nsam2(inds2); >> Tstar=zeros(b,1);%tạo biến chứa T* giá trị >> for i=1:b xstar1=mean(xboot1(:,i)); xstar2=mean(xboot2(:,i)); sigmastar1=std(xboot1(:,i)); sigmastar2=std(xboot2(:,i)); Tstar(i)=(xstar1-xstar2)/sqrt(sigmastar1^2/n1+sigmastar^2/n2); end >>tval=(xbar1-xbar2)/ sqrt(std(data1)^2/n1+std(data2)^2/n2); >> for i=1:b if abs(Tstar(i))>=abs(tval),d=d+1;end end >> Pval=d/b % P giá trị 42 1.2 Ki ểm đị nh Bootstrap so sánh hai t ỷ l ệ Cho X = X , X ,… , X n Y = Y1 , Y2 , … , Ym hai mẫu ngẫu nhiên rút từ hai tổng thể có tỷ lệ tính chất A P X P Y với Xi = cá thể thứ i mẫu X có tính chất A cá thể thứ i mẫu X khơng có tính chất A Yi = cá thể thứ i mẫu Y có tính chất A cá thể thứ i mẫu Y khơng có tính chất A Ta có tốn kiểm định giả thuyết Giả thuyết H0: P X = P Y Đối thuyết H1: P X ≠ P Y Với điều kiện P X = P Y ta đặt X i = X i − FX + FvàYi = Yi − FY + F với FX = n i=1 X i n ; FY = m m i=1 Yi F = n i =1 X i n +m + m i=1 Yi Ta có hai mẫu gốc X = X1 , X , … , X n Y = Y1 , Y2 ,… , Ym có tỷ lệ mẫu tỷ lệ mẫu chung Từ hai mẫu gốc x = x1 , x2 , … , xn y = y1 , y2 , … , ym ta có mẫu chung x , y ta có b cặp mẫu x , y Rút ngẫu nhiên có hồn lại từ mẫu chung bootstrap độc lập cỡ với mẫu gốc xk∗ = xk∗1 , xk∗2 , … , x ∗k n yk∗ = yk∗1 , yk∗2 , … , yk∗m , k=1, 2, …, b Áp dụng tiêu chuẩn thống kê T lên b c ặp mẫu bootstrap ta thu b giá trị kiểm định Tk∗ ∗ vớifx k = n n ∗ i=1 xki ∗ ; f yk = n f x∗k − fy∗k = fk∗ − fk∗ ∗ n m ∗ i=1 y ki ; fk = n+m ⋕ Tk∗ ≥ t ) + m n x∗ i=1 ki + Khi ta có giá trị bootstrap ước lượng cho P-giá trị m y∗ i=1 ki k=1, 2, …, b B 43 với fx − fy t= fx = n n xi ; fy = i=1 f 1−f m n m yi ; f = i=1 + m n+m n m xi + i=1 yi i=1 Ta bác bỏ giả thuyết H0 với mức ý nghĩa α P-giá trị bootstrap ⋕ Tk∗ ≥ t ) B ≤𝛼 Sử dụng phần mềm matlab ta xây dựng thủ tục tính P-giá trị bootstrap tốn kiểm định giả thuyết so sánh hai tỷ lệ >> load data1.m; >> load data2.m; >> fbar1=mean(data1); %tỷ lệ mẫu gốc >> fbar2=mean(data2); %tỷ lệ mẫu gốc >>n1=length(data1);% cỡ mẫu >>n2=length(data2);% cỡ mẫu >>fbar=(1/(n1+n2))*(sum(data1)+sum(data2)); >> nsam1=data1-fbar1+fbar; % tạo mẫu gốc >> nsam2=data2-fbar2+fbar; % tạo mẫu gốc >> b=1000; % số lượng mẫu bootstrap >> inds1= unidrnd(n1,n1,b); >> xboot1 = nsam1(inds1); >> inds2= unidrnd(n2,n2,b); >> xboot1 = nsam2(inds2); >> Tstar=zeros(b,1);%tạo biến chứa T* giá trị 44 >> for i=1:b fstar1=mean(xboot1(:,i)); fstar2=mean(xboot2(:,i)); fbarstar=(1/(n1+n2))*(sum(xboot1(:,i))+sum(xboot2(:,i))); Tstar(i)=(fstar1-fstar2)/sqrt((fstar*(1-fstar))*(1/n1+1/n2)); end >>tval=(fbar1-fbar2)/ sqrt((fbar*(1-fbar))*( 1/n1+1/n2)); >> for i=1:b if abs(Tstar(i))>=abs(tval),d=d+1;end end >> Pval=d/b % P giá trị Kiểm đị nh Bootstrap toán mẫu Cho X = X , X ,… , X n mẫu ngẫu nhiên có phân phối F chưa biết Giả sử ta có toán kiểm định giả thuyết: Giả thuyết H0: F=F0 Đối thuyết H1: F≠F0 Giả sử T tiêu chuẩn kiểm định tốn Ta có P-giá trị P T ≥ t điều kiện giả thuyết H0 Ta bác bỏ giả thuyết H0 với mức ý nghĩa α P T ≥ t ≤ 𝛼 Rút ngẫu nhiên có hồn lại từ mẫu gốc ban đầu x = x1 , x2 , … , xn ta có b mẫu bootstrap độc lập cỡ với mẫu gốc xk∗ = xk∗1 , x ∗k , … , xk∗n , k=1, 2, …, b Áp dụng tiêu chuẩn thống kê T lên b mẫu bootstrap ta thu b giá trị kiểm định Tk∗ = T xk∗ , k=1, 2, …, b Khi ta có giá trị bootstrap ước lượng cho P-giá trị ⋕ T ∗k ≥ t ) B 2.1 với t = T x Ki ểm đị nh Bootstrap so sánh trung bì nh với µ cho trƣớc 45 Cho X = X , X ,… , X n mẫu ngẫu nhiên có phân phối F chưa biết có trung bình µ X Ta có tốn kiểm định giả thuyết Giả thuyết H0: µ X = µ Đối thuyết H1: µ X ≠ µ0 Với điều kiện µ X = µ ta đặt X i = X i − X + μ0 vớiX = n n i=1 X i Ta có mẫu gốc X = X , X ,… , X n có trung bình mẫu µ Rút ngẫu nhiên có hồn lại từ mẫu gốc x = x1 , x2 , … , x n ta có b mẫu bootstrap độc lập cỡ với mẫu gốc xk∗ = xk∗1 , xk∗2 , … , x ∗k n , k=1, 2, …, b Áp dụng tiêu chuẩn thống kê T lên b mẫu bootstrap ta thu b giá trị kiểm định Tk∗ = xk∗ − μ0 σ ∗2 X n với x∗k = n n ∗ i=1 xki ∗2 ; σX = n−1 x∗ki − x∗k , k=1, 2, …, b n i=1 Khi ta có giá trị bootstrap ước lượng cho P-giá trị Tk∗ ≥ t ) ⋕ với B n t= n −1 n i=1 xi n i =1 − μ0 x i −n n i=1x i n Ta bác bỏ giả thuyết H0 với mức ý nghĩa α P-giá trị bootstrap ⋕ Tk∗ ≥ t ) B ≤𝛼 46 Sử dụng matlab giải toán kiểm định giả thuyết chiều cao trung bình nam sinh viên năm khoa chất lượng cao 1.7m >> load hightclc1.m >>xbar=mean(hightclc1); % trung bình mẫu gốc >>muy0=1.7; >>nsam=hightclc1-xbar+muy0; % tạo mẫu gốc >> n=length(nsam); >> b=1000; % số lượng mẫu bootstrap >>inds= unidrnd(n,n,b); >>xboot = nsam(inds); >> Tstar=zeros(b,1);%tạo biến chứa T* giá trị >> for i=1:b xstarbar=mean(xboot(:,i)); sigmastar=std(xboot(:,i)); Tstar(i)=((xstarbar-muy0)*sqrt(n))/sigmastar; end >>tval=((xbar-muy0)*sqrt(n))/std(hightclc1); >> for i=1:b if abs(Tstar(i))>=abs(tval),d=d+1;end end >> Pval=d/b % P giá trị Pval = 0.0080 P giá trị nhỏ ta kết luận giả thuyết chiều cao trung bình nam sinh viên năm khoa chất lượng cao 1.7m sai 47 2.2 Ki ểm đị nh Bootstrap so sánh t ỷ l ệ với P cho trƣớc Cho X = X , X ,… , X n mẫu ngẫu nhiên rút từ tổng thể có tỷ lệ tính chất A P X với Xi = cá thể thứ i mẫu X có tính chất A cá thể thứ i mẫu X khơng có tính chất A Ta có toán kiểm định giả thuyết Giả thuyết H0: P X = P Đối thuyết H1: P X ≠ P Với điều kiện P X = P ta đặt: X i = X i − F X + P0vớiF X = n n i=1 X i Ta có mẫu gốc X = X , X ,… , X n có tỷ lệ mẫu P Rút ngẫu nhiên có hồn lại từ mẫu mẫu gốc x = x1 , x , … , x n ta có b mẫu bootstrap độc lập cỡ với mẫu gốc xk∗ = xk∗1 , x ∗k , … , xk∗n , k=1, 2, …, b Áp dụng tiêu chuẩn thống kê T lên b mẫu bootstrap ta thu b giá trị kiểm định Tk∗ = fx∗k − P0 f ∗xk −f ∗xk n ∗ vớifx k = n n ∗ i=1 xki ; k=1, 2, …, b Khi ta có giá trị bootstrap ước lượng cho P-giá trị ⋕ với t= fx − P0 f x 1−f x Tk∗ ≥ t ) B ; vớifx = n n xi i=1 n Ta bác bỏ giả thuyết H0 với mức ý nghĩa α P-giá trị bootstrap 48 ⋕ Tk∗ ≥ t ) B ≤𝛼 Sử dụng phần mềm matlab ta xây dựng thủ tục tính P-giá trị bootstrap toán kiểm định giả thuyết so sánh tỷ lệ p với p0 cho trước >> load data.m >>fbar=mean(data); %tỷ lệ mẫu gốc >>P0=input('nhap P0'); >>nsam=data-fbar+p0; % tạo mẫu gốc >> n=length(nsam); >> b=1000; % số lượng mẫu bootstrap >>inds= unidrnd(n,n,b); >>xboot = nsam(inds); >> Tstar=zeros(b,1);%tạo biến chứa T* giá trị >> for i=1:b fstar=mean(xboot(:,i)); Tstar(i)=((fstarbar-P0)*sqrt(n))/sqrt(fstar*(1-fstar)); end >>tval=((fbar-P0)*sqrt(n))/ sqrt(fbar*(1-fbar)); >> for i=1:b if abs(Tstar(i))>=abs(tval),d=d+1;end end >> Pval=d/b % P giá trị 49 KẾT LUẬN VÀ KIẾN NGHỊ Đề tài hoàn thành mục tiêu đặt trình bày c ụ thể cách tìm khoảng ước lượng Bootstrap bước tiến hành kiểm định giả thuyết Bootstrap Đề tài trình bày cách tìm kho ảng ước lượng Bootstrap kiểm định giả thuyết Bootstrap phần mềm Matlab Nội dung báo cáo phù hợp cho đối tượng cần tìm hiểu cách sử dụng phương pháp Bootstrap trình nghiên cứu, học tập họ Đề tài tiếp tục mở rộng tiếp tục tìm hiểu ứng dụng khác phương pháp Bootstrap toán thống kê khác tương quan, hồi quy,… Mặc dù tác giả có cố gắng việc thực báo cáo, song khơng tránh khỏi sai sót.Rất mong đóng góp ý kiến quý thầy cô bạn đọc quan tâm Tp.HCM, ngày 25 tháng 11 năm 2013 Tác giả Nguyễn Hồng Nhung 50 TÀI LIỆU THAM KHẢO [1] A.C Davidson and D.V.Hinkley Bootstrap methods and their Application.Cambridge Series in Statistical and Probabilistic Mathematics (1997) [2] Bradley Efron (1994) An Introduction to the Bootstrap Chapman & Hall/CRC, Inc., Publication [3] Micheal R.Chernick Bootstrap Methods A Guide for Practitionners and Researcher Wiley series in Probability and Statistics.(2008) [4] Jaan Kiusalaas (2005) Numerical MATLAB.Cambridge university press Methods in Engineering with [5]Phan Thanh Tao Giáo Trình Matlab cho sinh viên ngành kĩ thuật.Trường Đại học Bách Khoa, Đại học Đà Nẵng (2004) [6] Wendy L Martinez and Angel R Martinez.Computational Statistics Handbook with MATLA.CHAPMAN & HALL/CRC.Boca Raton London New York Washington,D.C (2002) 51

Ngày đăng: 17/04/2023, 11:22

Tài liệu cùng người dùng

Tài liệu liên quan