Bài giảng 6sigma: Kiểm định biến thiên bằng nhau được biên soạn nhằm cung cấp cho bạn những kiến thức về cách so sánh các biến thiên của hai tập hợp; việc xác định nên chấp nhận hay từ chối một giả thuyết được ứng dụng cho hai biến thiên và phân tích các ví dụ khác nhau thông qua bài tập Minitab. Mời các bạn tham khảo!
Test for Equal Variances Kiêm đinh bi ̉ ̣ ến thiên bằ ng nhau Mục tiêu học tập Hiểu được làm thế nào để so sánh các biến thiên của hai tâp h ̣ ợp Hiểu được trình tự của việc xác định nên chấp nhận hay từ chối một giả thuyết được ứng dụng cho hai biến thiên Phân tích các ví dụ khác nhau thơng qua bài tập Minitab Sơ đồ thử nghiệm giả thiết One population Hypothesis Testing When significance level = 0.05: If P-value>0.05, cannot reject Ho If P-value ANOVA > Test for Equal Variances or Stat > Basic Statistics > 2 Variances Xác nhân gia ̣ ́ tri PValue ̣ Bướ c 5: Rút ra kết luận Rút ra kết luận thống kê và kết luân theo th ̣ ực tế Nếu PValue nho h ̉ ơn mức có nghĩa (α), loai bo Ho ̣ ̉ Test for Equal Variances 6 Rev 7.0 Ví dụ Chúng tơi muốn điều tra xem liệu có bất kỳ khác biệt nào trong việc sử dụng giấy A4, một trong những mặt hàng cung cấp cho văn phịng. Vì mục đích này, hai phịng được lựa chọn để phân tích biến thiên của họ trong việc sử dụng giấy trong 15 tuần. Bảng dưới đây thể hiện các số đo. Kiểm định để xác định liệu các biến thiên có giống nhau khơng ( Tên file: 2 Variances.mtw ) Phò ng A 8.5 9.2 8.9 9.9 7.8 7.5 9.9 9.7 8.4 9.1 8.2 8.6 8.6 8.2 9.0 Phò ng B 8.4 8.5 8.2 8.4 8.4 8.9 8.2 9.1 8.7 8.7 8.5 7.9 8.7 8.0 8.2 Loai gia thuyê ̣ ̉ ́t Câu lệnh tường thuật Gia thuyê ̉ ́ t khơng Khơng có sự khác biệt về độ phân tán giữa phịng A và khác biệt (H0) phịng B liên quan đến lượng giấy A4 được sử dụng Gia thu ̉ ́ t thay thế (H1) Độ phân tán của phịng A và của phịng B là khác nhau Độ phân tán của phịng A lớn hơn của phịng B Độ phân tán của phịng A nhỏ hơn của phịng B Proprietary to Samsung Electronics Company Test for Equal Variances 7 Biểu thức tốn học H0: σ A = σ B H1: σ A ≠ σ B σ A > σ B σ A Basic Statistics > Normality Test L Lự ựa ch a chọ ọn ph n phươ ương pháp ki ng pháp kiể ểm tra m tra phu ̀ h ợ p phù hợp •• AD: M AD: Mặ ặc đ c địịnh. D nh. Dự ựa vào ch a vào chứ ức năng c năng phân bô phân bớ́ tích lũy kinh nghi tích lũy kinh nghiệ ệm m •• RJ: D RJ: Dự ựa vào h a vào hệ ệ s số ố c củ ủa s a sư ữ̃ t tươ ương ng quan quan •• KS: D KS: Dự ựa vào ChiSquare a vào ChiSquare Proprietary to Samsung Electronics Company Test for Equal Variances 8 Rev 7.0 Kế t qua th ̉ ực hiên t ̣ ừ Minitab P ro ba bility P lo t o f De pt A No rma l P ro ba bility P lo t o f De pt B 99 No rma l 95 99 90 95 90 70 20 10 8.767 7198 15 Me a n 0.209 StDe v 0.831 N AD P Va lue 8.453 0.3292 15 0.233 0.756 80 P e rc e n t P e rc e n t 80 60 50 40 30 Me a n StDe v N AD P Va lue 70 60 50 40 30 20 10 7.0 7.5 8.0 8.5 9.0 De p t A 7.50 7.75 8.00 9.5 8.25 8.50 De p t B 10.0 8.75 10.5 9.00 9.25 Bởi vì cả hai giá trị Pvalues đều lớn hơn 0.05, ca hai d ̉ ữ liêu đê ̣ ̀ u hợp chuân ̉ Proprietary to Samsung Electronics Company Test for Equal Variances 9 Rev 7.0 Bướ c 3: Phân tí ch đồ thị Sử dụng đồ thị, xem lại sơ qua sự khác biệt về các biến thiên. Minitab : Graph > Box Plot > Multiple Y’s, Simple Bo x plo t o f De pt A, De pt B 10.0 9.5 Da ta 9.0 8.5 8.0 7.5 De p t A De p t B Bạn có thể rút ra phán đốn trực quan gì từ phân tích đồ thị? Proprietary to Samsung Electronics Company Test for Equal Variances 10 Rev 7.0 Bướ c 4: Phân tí ch thớ ng kê (tt) Ki ểm định dành cho các biến thiên như nhau Xếp thành chồng dữ liệu Cài đặt các cột với dữ liệu xếp chồng. Có thể so sánh các biến thiên của hai nhóm hoặc hơn Đăt m ̣ ức đơ tin cây ̣ ̣ Proprietary to Samsung Electronics Company Test for Equal Variances 11 Rev 7.0 Bướ c 4: Phân tí ch thố ng kê (tt) Kế t qua th ̉ ực hiên t ̣ ừ Minitab Te s t fo r Equal Varia nc e s fo r De pt A, De pt B F Te st Te s t Sta tis tic P Va lu e De pt A 00 Le ve n e ' s Te s t Te s t Sta tis tic P Va lu e De p t B 0.6 1.0 % B o n fe rro n i Co n fid e n c e In te rv a ls fo r S tDe v s 02 1.2 Xa ̣̣ ươ ̉̉ ̣̣ Xá́c đinh ph c đinh ph ương pha ng phá́p kiêm đinh p kiêm đinh De pt A De p t B 7.5 8.0 8.5 9 0 Da ta N Nế ếu d u dữ ữ li liệ ệu đ u đượ ược tách ra t c tách ra từ ừ s sự ự phân bô phân bố́ chu ̣̣ ̣̣ chuẩ ẩn, s n, sử ử dung FTest hoăc BartlettTest (3 dung FTest hoăc BartlettTest (3 tâp h ̣ ợ p hoăc nhiê ̣ ̀ u h n) tâp h ̣ ợp hoăc nhiê ̣ ̀u hơn) Th Thậ ậm chí n m chí nế ếu d u dữ ữ li liệ ệu không t u không từ ừ s sự ự phân phân bô ́ chu ẩ n, n ế u nó đ ượ c tách ra t s bớ chuẩn, nếu nó được tách ra từ sự ự phân phân bô bố́ liên t liên tụ ục, s c, sử ử d dụ ụng ng Levene’s test Levene’s test Bướ c 5: Rú t ra kế t luân ̣ Từ giá tri PValue la ̣ ̀ 0.006, nhỏ hơn 0.05, loai bo Ho ̣ ̉ Vì vây, s ̣ ự phân bố của việc sử dụng giấy A4 tại phòng A và B là khác nhau Proprietary to Samsung Electronics Company Test for Equal Variances 12 Rev 7.0 Tó m tắ t và ứ ng dung ̣ Tó m tắ t kiểm tra biến thiên bằ ng nhau kiểm tra biến thiên bằng nhau là phương pháp kiêm tra nhă ̉ ̀m xác đinh ̣ xem liệu có bất kỳ sự khác biệt thống kê đáng kể nào về các biến thiên của hai mẫu hoặc hơn khơng. Trình tự kiểm tra dành cho các biến thiên như nhau được thể hiện như sau: Thiết lập giả thiết Kiêm tra ti ̉ ́ nh bình thường Phân tích đồ thị Phân tích thống kê Rút ra kết luận Sẽ quan trọng khi đạt được sự giai thi ̉ ́ch thực tế một cách đúng đắn hơn là kết luận thống kê Ứng dụng của kiểm tra dành cho các biến thiên như nhau Trong việc ứng dụng kiểm tra 2 samples nếu các biến thiên của hai tâp h ̣ ợp giống nhau, lựa chọn “Giả thiết các biến thiên như nhau”. Bằng cách làm như vậy, bạn có thể nâng cao độ chính xác của kiểm tra Sẽ là giả thuyết cơ bản dành cho phân tích ANOVA như là Oneway ANOVA và Twoway ANOVA, v.v Nếu giả thuyết cơ bản này khơng được thiết lập, phân tích là vơ nghĩa. Đó là một giả thuyết cơ bản dành cho phân tích DOE Proprietary to Samsung Electronics Company Test for Equal Variances 13 Rev 7.0 Bà i tâp ̣ 1 Dữ liệu được thu thập về số giờ làm việc của nhân viên phịng A và phịng B trong 10 ngày. Trong khi các cơng nhân của phịng A làm thêm giờ rất nhiều, thì các cơng nhân của phịng B có xu hướng ra về tương đối đúng giờ. Tiến hành kiểm định dành cho các biến thiên như nhau tại mức có nghĩa 5% (Tên file: Test for equal variances _exercise 1.mtw) Phòng A: 10.6, 11.3, 13.7, 10.6, 12.5, 9.8, 10.8, 13.9, 13.8, 10.0 (giờ) Phòng B: 9.0, 8.5, 10.0, 10.5, 9.6, 8.9, 10.1, 10.5, 9.1, 9.9 (giờ) 2. Linh kiện A có độ chính xác cao nhưng rất đắt. Ngược lại, linh kiện B rẻ hơn linh kiện A nhưng có độ chính xác thấp hơn. Dữ liệu sau đây đạt được bằng cách lấy 15 mẫu từ các sản phẩm được sản xuất với lần lượt các linh kiện. Tiến hành kiểm định dành cho các biến thiên như nhau tại mức có nghĩa 5%. (Tên file: Test for equal variances _exercise 2.mtw) Part A: 53, 52, 56, 54, 58, 51, 50, 49, 48, 53, 58, 53, 55, 52, 55 (kg) Part B: 48, 47, 49, 57, 55, 51, 57, 46, 55, 63, 52, 48, 51, 56, 50 (kg) Proprietary to Samsung Electronics Company Test for Equal Variances 14 Rev 7.0 Dữ liệu dưới đây thể hiện sự sử dụng internet từng tuần của 5 nhân viên trong 15 tuần. Kiểm định để xác nhận xem liệu các biến thiên dành cho các lần sử dụng internet trên mỗi nhân viên có giống nhau hay khơng (Tên file: Test for Equal Variances_Ex3.mtw ) (Đơn vi ti ̣ ́nh: giờ) Tuầ n Nhân viên A Nhân viên B Nhân viên C Nhân viên D Nhân viên E 5.02 4.92 4.99 4.83 5.03 4.9 5.02 4.69 4.92 4.9 4.84 5.01 5.32 4.99 4.89 4.93 4.93 5.09 5.03 5.07 4.9 4.97 5.12 4.9 4.91 4.85 5.16 5.18 4.91 5.07 4.9 4.94 4.85 5.03 5.03 4.95 5.03 4.91 5.01 4.93 4.89 5.05 10 4.99 5.06 4.91 4.97 5.06 11 5.01 5.08 4.93 4.94 12 5.01 4.86 5.11 5.03 13 5.04 5.13 4.93 4.99 5.09 14 4.99 5.12 4.94 5.05 15 5.06 4.94 4.94 4.99 5.14 Proprietary to Samsung Electronics Company Test for Equal Variances 15 Rev 7.0 Tra l ̉ ờ i Từ giá tri PValue = 0.020 (0.05) khơng thê ̣ ̉ loai bo Ho ̣ ̉ ⇒ Khơng thể nói rằng các biến thiên của trọng lượng sản phẩm dành cho hai linh kiện là khác nhau Từ Levene’s Test, giá tri PValue=0.001, (