Tài liệu hạn chế xem trước, để xem đầy đủ mời bạn chọn Tải xuống
1
/ 46 trang
THÔNG TIN TÀI LIỆU
Thông tin cơ bản
Định dạng
Số trang
46
Dung lượng
3,4 MB
Nội dung
Tài liệu hướng dẫn thống kê y học sử dụng SPSS SPSS ANOVA đơn biến cho phép đo lặp lại BS Lê Đông Nhật Nam Lời nói đầu Mùa hè năm 1994 theo học trung tâm văn hóa đường Lý Tự Trọng quận TP Hồ Chí Minh Lúc môn toán (gần toàn chương trình toán cấp 2), kết tất yếu kì thi xếp lớp lãnh điểm zéro tròn vo Người ta tập hợp tất học sinh « siêu cấp » vào chung lớp thầy Vũ Cao Thắng quản nhiệm (đây thầy giáo tuyệt vời mà gặp) Chỉ sau tháng lớp thầy không lấy lại mà xuất sắc vượt qua kì thi cuối khóa, tháng sau 100% học sinh lớp trở thành học sinh giỏi toán hầu hết thi đậu vào lớp 10 với điểm số cao Nhiều bạn bè thi đậu vào khối A trường chuyên Câu chuyện học đời ý nghĩa thực điểm số kì thi, từ hiểu vật đời thay đổi theo thời gian tự thân hay tác động yếu tố bên Trong nghiên cứu y học, khảo sát cắt ngang thời điểm ta có nguy đưa kết luận sai lầm chất tượng Để nhìn thấy quy luật diễn tiến bệnh lý, đánh giá hiệu phương pháp điểu trị, ta thường theo dõi bệnh nhân nhiều thời điểm khác nhau, khảo sát yếu tố điều kiện khác Từ đặt vấn đề so sánh giá trị để tìm khác biệt Phương pháp thống kê cho phép giải toán phân tích phương sai cho phép đo lặp lại (ANOVA for repeated measure) hay gọi ANOVA đối tượng (within subject) Tài liệu hướng dẫn chi tiết cách thực ANOVA cho phép đo lặp lại phần mềm IBMSPSS Nội dung tài liệu có lẽ nhiều bạn biết, lần chúng trình bày hình thức hoàn toàn Mục đích viết tài liệu thống kê để người đọc cảm thấy « dễ chịu thú vị» theo dõi thay cho cảm giác bất an khó chịu khô khan môn học Quy ước trình bày Trong tài liệu làm quen với nhân vật Bác sĩ Nguyễn Văn Thái Bác sĩ Thái cao thủ thống kê y học giang hồ Anh ta xuất trước vấn đề khó khăn, nhằm đưa câu trả lời xác ôn lại cho bạn kiến thức chuyên sâu lý thuyết thống kê Tuy nhiên BS Thái lại bận rộn nên không đủ thời gian vào cách thực chi tiết Anh ta hay trình bày lý thuyết túy sử dụng nhiều công thức toán học nên không gần gũi với sinh viên gây không trở ngại cho bạn vốn dị ứng với thống kê … Bác sĩ Lê Ngọc Khả Nhi Khả Nhi nữ bác sĩ trẻ dễ thương sử dụng thành thạo SPSS Như tên gọi mình, BS Nhi có tính cách hồn nhiên sống ngây thơ trẻ con, cô có khuynh hướng đơn giản hóa tối đa vấn đề Cô hướng dẫn bạn sử dụng SPSS bước cụ thể, chia sẻ mẹo vặt, thủ thuật để giúp bạn đến kết nhanh dễ dàng Sinh viên Trần Quốc Bảo Bảo sinh viên y khoa năm thứ sáu bắt đầu làm quen với nghiên cứu khoa học Đây cậu sinh viên tò mò đặt nhiều câu hỏi liên quan đến thống kê Mặc dù đế tài Bảo thực đơn giản, đồng hành với cậu ta, bạn có hội tích lũy cho nhiều kinh nghiệm công việc phân tích số liệu thiết kế nghiên cứu 1.1 Tình thí dụ Rối loạn chuyển hóa phosphat yếu tố nguy tử vong bệnh nhân bỏng nặng Một bác sĩ khoa Bỏng thực đề tài khảo sát thay đổi nồng độ Phosphat huyết bệnh nhân bỏng Nghiên cứu thực 20 bệnh nhân người lớn bị bỏng độ 30% tổng diện tích thể độ 15% tổng diện tích thể Biến số cần khảo sát nồng độ phosphat huyết (đơn vị mg/dl) Bệnh nhân lấy mL máu tĩnh mạch vào buổi sáng thời điểm 3-6-9 ngày sau nhập viện Mẫu máu sau quay ly tâm để tách huyết định lượng nồng độ phosphate máy phân tích sinh hóa tự động Hitachi-Boehringer-Mannheim Câu hỏi nghiên cứu Bảo tìm quy luật biến đổi nồng độ serum phosphat thời gian nằm viện, liệu tiếp tục giảm, dao động ngẫu nhiên hay cải thiện ? Phương pháp thống kê thích hợp trường hợp «Phân tích phương sai (ANOVA) đơn biến cho thí nghiệm lặp lại (còn gọi ANOVA yếu tố cho nhóm phụ thuộc hay ANOVA yếu tố đối tượng) » Phương pháp cho phép bạn phân tích biến đổi giá trị biến số định lượng qua nhiều lần khảo sát (≥3 lần đo) đối tượng Giả thuyết 0: giá trị trung bình lần đo: H0: µ1= µ2=…= µk (k ≥3) Và giả thuyết thay thế: Có lần đo cho giá trị trung bình khác biệt so với lần đo lại Để kiểm tra giả thuyết này, ta tính hệ số F = tỉ lệ biến thiên gây điều kiện khảo sát (ví dụ yếu tố thời gian, can thiệp, phương pháp đo) biến thiên gây yếu tố ngẫu nhiên nội 1.2 Giới thiệu Biến thiên khảo sát Sum of square (SS), gồm nhiều loại: SST : total variability : Thay đổi chung SSB: khác biệt đối tượng so với với đối tượng khác (between subject) SSw: Thay đổi lần đo khác đối tượng (within subject) SSw lại chia thành loại: SSM: Model, thay đổi gây điều kiện thí nghiệm (hiệu ứng nhân tố can thiệp) SSR: residual: Thay đổi sai sót trình đo, hoàn toàn ngẫu nhiên SST = S2*(N-1); với S= phương sai tổng quát tất giá trị xét chung, không phân biệt lần đo, có độ tự df = (N-1) 𝑆𝑆𝑅 = 𝑛 𝑖=1 𝑥𝑖 − 𝑥𝑖 = 𝑠2 𝑛 − với s = phương sai tính cho lần đo (n cho lần đo) 𝑆𝑆𝑤 = 𝑆12 ∗ 𝑛1 − + ⋯ + 𝑆12 ∗ 𝑛𝑘 − = biến thiên giá trị cá thể, cộng tất lại; số lần đo = k Mỗi cá thể có độ tự dFi=(n-1) nên dF tổng cộng = tổng dFi 𝑆𝑆𝑀 = 𝑘 𝑘=1 𝑛𝑘 𝑥𝑘 − 𝑥𝑔𝑟𝑎𝑛𝑑 có độ tự dFM = (k-1) SSR = (SSW-SSM) = residual sum of square có độ tự dfR = dfW – dfM Sau ta ước tính Mean square, để trung hòa ảnh hưởng sai lầm gây số lần đo; gồm loại: Mean square hay « mô hình »: MSM = SSM/dfM Mean square sai số: Residual (error) mean square: MSR=SSR/dFR Từ đó, ta tính hệ số F: F = MSM/MSR Nếu F>1: hiệu ứng yếu tố khảo sát lớn sai biệt ngẫu nhiên 1.2 Giới thiệu Nguồn gốc biến thiên Do điều kiện thí nghiệm (mô hình) Do địa đối tượng Do sai số ngẫu nhiên Tổng hợp yếu tố Sum of square (SS) SSM Độ tự (dF) k-1 Mean of square (MS) MSM MSM/MSR SSB n-1 MSB MSB/MSR SSR SST (k-1)*(n-1) N-1 MSR Kiểm tra giả định Thực phân tích ANOVA cho phép đo lặp lại Tỉ số F Sử dụng chức Explore SPSS Sử dụng chức GLM SPSS Có giả thuyết rõ ràng Phân tích khuynh hướng Phân tích tương phản Phân tích sâu Chưa có giả thuyết rõ ràng Post hoc test Tính hệ số ảnh hưởng/tương phản Qui trình phân tích phương sai đơn biến cho phép đo lặp lại Bước 1: Thăm dò liệu : Kiểm tra điểm ngoại lai (giá trị cá biệt) Kiểm tra giả định phân phối bình thường (chuẩn) giá trị lần đo Bằng công cụ: Boxplots, QQ plot, thống kê mô tả, kiểm định Sapiro-Wilk… Sau đó: Nếu có Outliers: Ta phải xử trí Nếu Phân phối không chuẩn: xứ trí bỏ qua Bước 2: Tiến hành phân tích ANOVA yếu tố cho phép đo lặp lại 2-1) Kiểm tra giả định sphericity (đồng phương sai) test Mauchly 2-2) Thực F-test, có hiệu chỉnh tùy theo kết Mauchly test Bước 3: Phân tích sâu 3A) Không có giả thuyết: Post-hoc (multivariate test) 3B) Có giả thuyết: phân tích tương phản (contrast ) Bước 4: Tính Effect size 1.2 Giới thiệu Phân tích phương sai (ANOVA) đơn biến cho thí nghiệm lặp lại ứng dụng cho nhiều thiết kế nghiên cứu Khảo sát biến thiên đại lượng theo thời gian : - Diễn tiến bệnh lý khoảng thời gian nằm viện - Đánh giá hiệu trị liệu: So sánh thay đổi triệu chứng (định lượng) trước sau điều trị - Nghiên cứu dược động học, sinh hóa học: khảo sát nổng độ chất thể theo thời gian So sánh giá trị đại lượng điều kiện khảo sát khác nhau: - Nghiên cứu dao động giá trị đại lượng thời điểm khác ngày - Ảnh hưởng môi trường (nhiệt độ, độ cao…), chế độ ăn, tư thế… lên kết xét nghiệm - So sánh phương pháp đo, thiết bị đo khác Bạn cần có: biến số định lượng liên tục biểu thị cho đại lượng cần nghiên cứu ; ví dụ: nồng độ chất máu biến số định tính để phân loại điều kiện đo (≥3 giá trị) Ví dụ: Thời gian Biến số định lượng ANOVA hiểu mô hình hồi quy khảo sát biến thiên biến số định lượng theo thời gian (ở lần đo khác nhau) Lần đo So sánh ? 2.1 Lập bảng số liệu Trong cửa sổ Variable view: Trước hết ta tạo biến số định lượng kiểu liên tục ( ) nồng độ phosphate huyết đo ngày thứ 3,thứ thứ (SP3,SP6,SP9), đơn vị mg/dl Cột cho phép bạn mô tả ý nghĩa biến số, điều có ích sau bạn muốn chuyển số liệu cho đồng nghiệp khác sử dụng Số thứ tự … n Lần đo X11 X21 X31 … Xn1 Lần đo X12 X22 X32 … Xn2 … Lần đo k … … … … … X1k X2k X3k … XnK Với ANOVA cho phép đo lặp lại, bạn không cần tạo biến số định tính để phân nhóm mà cần tạo biến số định lượng riêng biệt tương ứng cho lần đo Khi tạo bảng số liệu SPSS, bạn nên xếp biến số (lần đo) theo thứ tự thời gian, thứ tự giúp tránh nhầm lẫn thiết kế cấu hình phân tích ANOVA 2.2 Thăm dò số liệu kiểm tra giả định Kích hoạt chức thăm dò số liệu Trong hộp thoại Explore, bạn kéo tất biến số định lượng vào ô Dependent list, sau nhấn để mở hộp thoại vẽ biểu đồ 2.2 Thăm dò số liệu kiểm tra giả định Vẽ biểu đồ Boxplot chung cho biến định lượng Thực kiểm định phân phối bình thường Sau chọn xong cấu hình, bạn nhấn để trở hộp thoại (Explore) Nhấn OK để chạy thăm dò 10 4.2 Phân tích tương phản (contrast) Với loại tương phản đơn giản (Simple), ta phân tích tương phản theo cặp lần đo chọn làm nhóm « chứng » lần đo lại Nếu muốn chứng minh giả thuyết đại lượng thay đổi theo thời gian so với ban đầu, tương phản « trước/sau », ta chọn « First » Nếu muốn chứng minh giả thuyết đại lượng đạt cực đại/cực tiểu lần đo sau cùng, ta chọn « Last » First Biến số định lượng Kiểu contrast đơn giản hình dung giả thuyết biến thiên tuyến tính (tăng dần đều, giảm dần đêu đại lượng cần khảo sát theo thời gian… Last Tăng tuyến tính Giảm tuyến tính Lần đo Lần đo Chọn lần đo cuối làm nhóm chứng Chọn Last = ta so sánh sv 5, sv 5, sv 5, sv Lần đo Chọn lần đo làm nhóm chứng First Last Chọn « First »= ta so sánh : sv 1, sv 1, sv 1, sv Lần đo Sau chọn xong, ta nhấn nút Change để xác lập lựa chọn Sau nhấn để trở hộp thoại ANOVA 32 4.2 Phân tích tương phản (contrast) Lệnh phân tích tương phản đơn giản GLM SP3 SP6 SP9 /WSFACTOR=Thoigian Simple(1) /MEASURE=SerumP /METHOD=SSTYPE(3) /PLOT=PROFILE(Thoigian) /EMMEANS=TABLES(Thoigian) COMPARE ADJ(BONFERRONI) /PRINT=DESCRIPTIVE ETASQ HOMOGENEITY /CRITERIA=ALPHA(.05) /WSDESIGN=Thoigian Tests of Within-Subjects Contrasts Measure: SerumP Type III Sum Source Thoigian Thoigian Level vs Level Level vs Level Error(Thoigian) Level vs Level Level vs Level Mean Partial Eta of Squares df Square F Sig Squared 14,815 14,815 126,419 ,000 ,869 35,571 35,571 277,722 ,000 ,936 2,227 19 ,117 2,434 19 ,128 Trong phần kết quả, ta có Bảng Test of within subjects contrast trình bày kết phân tích tương phản đơn giản (so sánh bắt cặp lần đo sau với lần đo đầu tiên) Cách diễn giải gần giống test F ANOVA, với giá trị tỉ số F, độ tự Intercept, error ý nghĩa thống kê (giá trị p) Giá trị p3) quan hệ tuyến tính bị yếu đi, kiểm tra Lần đo Biến số định lượng Biến số định lượng Lần đo Bậc nghịch Lần đo Biến số định lượng Biến số định lượng Bậc Bậc Lần đo Các loại biến thiên khác (theo hàm số bậc 2,3,4,5) quan tâm chúng khó diễn giải Trong trường hợp chúng thực hữu dụng, ví dụ hàm bậc dùng để chứng minh có giá trị cực đại, cực tiểu trình diễn tiến giả thuyết hồi phục sau can thiệp Hàm bậc dùng để xác định giai đoạn « ổn định » giá trị trước tiếp tục tăng/giảm Hàm số bậc trở lên ý nghĩa khảo sát theo thời gian (chỉ dao động ngẫu nhiên) Trong số trường hợp đặc biệt hàm số bậc > hữu ích, có can thiệp đặc biệt thay đổi phương pháp đo lần đo thứ trở Lúc ta chứng minh có thay đổi giá trị đáp ứng lại can thiệp/phương pháp 34 4.2 Phân tích tương phản (contrast) Lệnh phân tích tương phản bậc cao GLM SP3 SP6 SP9 /WSFACTOR=Thoigian Polynomial /MEASURE=SerumP /METHOD=SSTYPE(3) /PLOT=PROFILE(Thoigian) /EMMEANS=TABLES(Thoigian) COMPARE ADJ(BONFERRONI) /PRINT=DESCRIPTIVE ETASQ HOMOGENEITY /CRITERIA=ALPHA(.05) /WSDESIGN=Thoigian Tests of Within-Subjects Contrasts Measure: SerumP Type III Sum Mean Partial Eta Source Thoigian of Squares df Square F Sig Squared Thoigian Linear 17,786 17,786 277,722 ,000 ,936 Quadratic ,501 ,501 12,608 ,002 ,399 Error(Thoigian Linear 1,217 19 ,064 ) Quadratic ,755 19 ,040 Bảng Test of within subjects contrasts : mô hình tuyến tính khảo sát biến thiên đại lượng ta muốn nghiên cứu theo thời gian, cách diễn giải gần giống test F ANOVA, với giá trị tỉ số F, độ tự Intercept, error ý nghĩa thống kê (giá trị p) Giá trị p 0,01 > 0,06 > 0,14 < 0,5 > 0,5 < 0,5 > 0,5 mức độ ảnh hưởng nhỏ mức độ ảnh hưởng Trung bình mức độ ảnh hưởng lớn mức độ ảnh hưởng nhỏ mức độ ảnh hưởng lớn tương phản thấp tương phản cao 42 4.4 Vẽ biểu đồ biến thiên dạng điểm Mặc dù SPSS cung cấp biểu đồ Box-plot (trong thăm dò số liệu) Mean estimate (trong làm ANOVA), ta vẽ loại thứ biểu đồ cột thể giá trị trung bình kèm error bar Chọn Graphs > Chart builder … Trong hộp thoại chart builder, chọn loại biểu đồ hình Chọn tất biến số định lượng mà bạn có, kéo vào phần trục tung (Y) 43 4.4 Vẽ biểu đồ biến thiên dạng điểm SPSS hiểu bạn muốn gộp biến số vào biểu đồ Một hộp thoại yêu cầu xác nhận điều Nếu bạn dán nhãn ý nghĩa cho biến số, nội dung nhãn lên Nhấn OK biểu đồ vẽ phần kết Nhấn lần vào hình vẽ, cửa sổ điều chỉnh hiệu ứng đồ họa ra, cho phép bạn thay đổi màu nền, điều chỉnh nét, thang đo, thêm đường thẳng biểu thị khuynh hướng… biểu đồ sau có dạng sau: 44 Diễn đạt văn khoa học Phương pháp thống kê: Dữ liệu phân tích phần mềm IBM-SPSS 22 Chúng sử dụng phân tích phương sai yếu tố cho phép đo lặp lại với F-test kết hợp với phân tích tương phản hậu kiểm phương pháp Bonferroni để khảo sát thay đổi nồng độ Phosphat/serum ngày thứ 3, thứ thứ (k=3,n=20) Kết trình bày dạng Trung bình ± Độ lệch chuẩn Ngưỡng ý nghĩa p 0.05 Kết Giá trị Serum phosphat có phân phối chuẩn tất lần đo (kiểm tra Shapiro-Wilk test) điểm giá trị cá biệt Test Mauchly cho thấy có đồng phương sai khác biệt lần đo (thỏa giả định sphericity) với χ2(2) = 2.623 (p=0.269), kết cho phép diễn giải trực tiếp test F không cần hiệu chỉnh Kết cho thấy có khác biệt ý nghĩa giá trị serum phosphate ngày khảo sát khác nhau; F(2,38)= 176.19 ; p[...]... nhiều lựa chọn 1) Chuyển dạng biến số (ví dụ thang đo Logarit), với hy vọng sẽ có phân phối chuẩn 2) Sử dụng phương pháp phi tham số (kiểm định Friedman, là giải pháp thay thế cho ANOVA trong phép đo lặp lại) 3) Bỏ qua vi phạm và vẫn làm phân tích ANOVA (Thực ra điều kiện phân phối không phải là tuyệt đối bắt buộc) 4) Làm ANOVA song song cho 2 mẫu số liệu: nguyên th y và đã chuyển dạng (logarit hóa),... gian lận và ng y tạo số liệu, nhất là khi kết quả của bạn quá hoàn hảo Người đọc sẽ nghĩ: Tác giả là một người thành thật và nắm vững phương pháp thống kê 16 3 3.1 Thực hiện phân tích ANOVA ANOVA cho phép đo lặp lại nằm trong mục GLM repeated measure (Mô hình tuyến tính tổng quát cho phép đo lặp lại) 1 2 3 Tên của biến số định tính phân nhóm điều kiện (thường là thời gian) Số lần đo Tên của biến số định... (linear), nó cho phép kiểm tra giả thuyết khuynh hướng tăng/giảm liên tục theo thời gian Tuy nhiên, khi có quá nhiều lần đo (k>3) thì quan hệ tuyến tính bị y u đi, đôi khi không thể kiểm tra được Lần đo 1 2 3 4 Biến số định lượng Biến số định lượng Lần đo 1 2 3 4 Bậc 3 nghịch Lần đo 1 2 Biến số định lượng Biến số định lượng Bậc 2 3 4 Bậc 5 Lần đo 1 2 3 4 5 Các loại biến thiên khác (theo hàm số bậc 2,3,4,5)... 3.1 Thực hiện phân tích ANOVA Với phép đo lặp lại, SPSS sẽ tạo 1 biến số ảo để chỉ điều kiện, trong đa số trường hợp biến số n y được xem là “Thời gian”, bạn có thể đặt tên cho nó t y ý, ví dụ: Lần đo, Điều kiện, can thiệp, thiết bị… 4 sau đó nhập giá trị cho thứ bậc “level” (số lần đo= k), ví dụ bạn khảo sát 3 lần thì nhập vào số 3 Sau khi làm xong, bạn nhấn nút để xác nhận Biến số phân nhóm « Thoigian(3)... lần đo: 1,2,3…), bạn chỉ cần chọn tất cả rồi nhấn nút hay kéo vào ô bên phải 7 8 Nhấn nút để mở hộp thoại vẽ biểu đồ 19 3 3.1 Thực hiện phân tích ANOVA Kéo biến số phân nhóm « Thoigian » vào ô « Horizontal axis » Lựa chọn n y cho phép vẽ 1 biểu đồ duy nhất khảo sát sự biến thiên của serum Phosphat (trục tung) theo thời gian ở « Trục hoành 9 Biểu đồ n y rất hữu ích vì cho ta th y khuynh hướng thay đổi,... luật biến thiên có thể x y ra khi ta có nhiều điểm khảo sát Số bậc cao nhất có thể khảo sát = (k-1) với k là số lần đo Ví dụ trong trường hợp n y ta có k=3 thì Polynomial cho phép khảo sát : Bậc 1 (Linear) và Bậc 2 (Quadratic) Biến số định lượng Bậc 3 thuận Biến số định lượng Lần đo 1 2 3 4 Bậc 4 Lần đo 1 2 3 4 5 Bậc 2 Trên thực tế ta thường quan tâm nhiều đến kiểu quan hệ tuyến tính (linear), nó cho phép. .. Kurtosis -, 625 ,992 Thông tin cần quan tâm: Giá trị trung bình và độ lệch chuẩn 12 2 2.2 Thăm dò số liệu và kiểm tra giả định Có 2 cách kiểm tra giả định phân phối chuẩn: 1) Phương pháp toán học - Sử dụng kiểm định Shapiro-Wilk hoặc Kolmogorov-Smirnov : tối ưu cho trường hợp cỡ mẫu không quá lớn (0.05 cho test Mauchly - Kết quả test Mauchly phụ thuộc vào cỡ mẫu: Cỡ mẫu lớn thì sai lệch dù nhỏ cũng trở thành có ý nghĩa; cỡ mẫu nhỏ thì có nguy cơ bỏ sót vi phạm - Thực ra giả định Sphericity bị vi phạm không ảnh hưởng đến phân phối của F, chỉ giảm sức mạnh thống kê của test post-hoc - Sphericity thỏa: có thể dùng test Tukey, tuy nhiên trong bất cứ trường hợp nào,... trong phân tích ANOVA 1 y u tố cho nhiều phân nhóm độc lập, nó sẽ cho ta biết giá trị của hệ số F, độ tự do của F và ý nghĩa thống kê Nếu giả định Sphericity không bị vi phạm, bạn có thể đọc kết quả trực tiếp ở hàng thứ 1: “Sphericity assumed”, tức không cần hiệu chỉnh Giá trị p (Sig) cho phép kết luận hay phủ định về sự khác biệt có ý nghĩa giữa các lần đo khác nhau P< 0.05 cho th y có sự khác biệt ... phân tích phương sai cho phép đo lặp lại (ANOVA for repeated measure) hay gọi ANOVA đối tượng (within subject) Tài liệu hướng dẫn chi tiết cách thực ANOVA cho phép đo lặp lại phần mềm IBMSPSS... thống kê thích hợp trường hợp «Phân tích phương sai (ANOVA) đơn biến cho thí nghiệm lặp lại (còn gọi ANOVA yếu tố cho nhóm phụ thuộc hay ANOVA yếu tố đối tượng) » Phương pháp cho phép bạn phân... tiến hành làm ANOVA song song cho trường hợp: Có điểm giá trị ngoại lai, kết tương tự nhau, ta giữ, ngược lại ta bỏ Loại bỏ giá trị lựa chọn cuối cùng: Nếu ta định bỏ điểm ngoại lai này, cỡ mẫu