BTL nhóm 6 Xác suất thống kê Nguyễn Bá Thi đại học Bách Khoa TPHCM gồm 4 Bài tập lớn gồm các tiêu đề và cách giải cụ thể chi tiết từng mục trên file Excel có hướng dẫnGồm các dạng So sánh tỷ lệ, Ứoc lượng trung bình , so sánh trung bình với từng cặp dữ liệu , phân tích tương quan và hồi quy tuyến tính và phương pháp phân tích phương sai 2 nhân tố không lặp
ĐẠI HỌC QUỐC GIA THÀNH PHỐ HỒ CHÍ MINH TRƯỜNG ĐẠI HỌC BÁCH KHOA TPHCM BÀI TẬP LỚN XÁC SUẤT THỐNG KÊ Giáo viên hướng dẫn: Nguyễn Bá Thi Sinh viên: Trần Đức Thắng MSSV: 1413677 Nhóm: NHÓM CÂU I.ĐỀ BÀI Bảng sau cho ta phân bố thu nhập hai nhóm tuổi : Nhóm từ 40-50 tuổi nhóm từ 50-60 tuổi số công nhân lành nghề Thụy Điển năm 1930 Nhóm tuổi Thu nhập 0-1 1-2 2-3 3- 4-6 >=6 40-50 71 430 1072 1609 1178 158 50-60 54 324 894 1202 903 112 Có khác tỷ lệ thu nhập hai nhóm tuổi số công nhân lành nghề hay không? Mức ý nghĩa a = 5% II.Dạng - So sánh tỷ số ( Kiểm định tỷ lệ ) III.Phương pháp giải Giả thiết H0 : P1 = P1,0 ,… ,Pk,0 ⇔" Các cặp Pi Pi,0 giống nhau" H1:"Ít có cặp Pi Pi,0 khác nhau" Giá trị thống kê Oi - Các tần sô thực nghiệm (Observed Frequency) Ei - Các tần số lý thuyết (Expacted Frequency) Biện luận Nếu χ2> χα2 => Bác bỏ giả thiết H0 (DF = k-1) - Giá trị χ2 theo hàm CHITEST qua biểu thức : Oij - tần số thực nghiệm ô thuộc hàng i cột j Eij - tần số lý thuyết ô thuộc hàng i cột j , r- số hàng c- số cột - Xác suất P ( X > χ2 ) với bậc tự DF = ( r-1)(c-1) *Trong r - số hàng , c - số cột bảng ngẫu nhiên(contingency table) Nếu P ( X > χ2 ) > α => chấp nhận giả thiết H0 ngược lại IV.CÔNG CỤ GIẢI Áp dụng MS -EXCEL + sử dụng hàm tính tổng Sum CHITEST V.KẾT QUẢ VÀ CÁCH TÍNH Giả thiết tỉ lệ hai nhóm tuổi a = 5% - Số liệu nhập vào Tính tổng số: + Tổng hàng : chọn H14 nhập =SUM(B14:G14) Dùng trỏ kéo nút tự điền từ H14 đến H15 + Tổng cột : chọn B16 nhập =SUM(B14:B15) Dùng trỏ keos nút tự điền từ B16 đến G16 + Tổng cộng : chọn H16 nhập =SUM(H14:H15) Số liệu xuất : Ta có bảng tần số thực nghiệm Tính tần số lý thuyết: Tần số lý thuyết = ( tổng hàng*tổng cột )/tổng cộng Nhóm 40 – 50 : chọn B19 nhập =H14*B16/H16 Chọn C19 nhập = H14*C16/H16 Chọn D19 nhập =H14*D16/H16 Chọn E19 nhập =H14*E16/H16 Chọn F19 nhập =H14*F16/H16 Chọn G19 nhập =H14*G16/H16 Nhóm 50 – 60 : chọn B20 nhập =H15*B16/H16 Chọn C20 nhập = H15*C16/H16 Chọn D20 nhập =H15*D16/H16 Chọn E20 nhập =H15*E16/H16 Chọn F20 nhập =H15*F16/H16 Chọn G20 nhập =H15*G16/H16 Ta bảng tần số lý thuyết: Áp dụng hàm số CHITEST Chọn B22 nhập = CHITEST(B14:G15,B19:G20) Ta kết P(X > X ) Biện luận : P(X> X )= 0.511582 > 0.05 = a Chấp nhận H0 VI.KẾT LUẬN Không có khác tỷ lệ thu nhập hai nhóm tuổi số công nhân lành nghề CÂU I.ĐỀ BÀI Trước chiến dịch quảng cáo, tỷ lệ phòng có khách khách sạn theo dõi ngẫu nhiên 15 ngày thu kết 86 92 83 88 79 81 90 76 80 91 85 89 77 91 83 phần trăm.Sau kết thúc chiến dịch quảng cáo người ta theo dõi tỷ lệ 15 ngày thu kết 88 94 97 99 89 93 92 98 89 90 97 91 87 80 96 phần trăm Giả sử tỷ lệ phòng có khách phân phối chuẩn Hãy ước lượng với độ tin cậy 95% tỷ lệ phòng có khách trước sau chiến dịch quảng cáo Với mức ý nghĩa 5% cho ý kiến chiến dịch quảng cáo có thành công hay không ? II.DẠNG BÀI + Ước lượng trung bình + So sánh trung bình với cặp liệu III.PHƯƠNG PHÁP GIẢI Ước lượng trung bình: Giá trị trung bình: x ̅ = ∑n i=1 xi n Giới hạn tin cậy: 𝑡𝛼 𝑆𝑥̅ So sánh trung bình với liệu cặp: Trong trường hợp hai mẫu nhỏ ( N < 30 ) phụ thuộc ( ví dụ : kết nhóm chuột xét nghiệm máu hai lần – trước sau uống thuốc – hay nhóm bệnh nhân trải qua hai thí nghiệm – thử thuốc tay thử thuốc tay ) không giả định phương sai hai mẫu nhau, bạn áp dụng trắc nghiệm t để so sánh giá trị trung bình hai mẫu liệu tương ứng cặp Giả thiết Tương tự trường hợp “hai mẫu với phương sai biết trước” Giá trị thống kê Di = Xi − Yi ( i = 1,2, … N ) ̅= D ∑N i=1 Di N ̅ )2 ∑N (Di − D SD = √ i=1 (N − 1) t= ̅ − μD D SD /√N = ̅ D SD /√N có phân phối student với γ = N − Biện luận Nếu |t| < t α hay t α ( γ = N − 1) ⇒ Chấp nhận giả thiết H0 IV.CÔNG CỤ GIẢI Sử dụng MS-EXCEL + Ước lượng trung bình: Dùng chương trình Descriptive Statistics để tìm trung bình (mean) giới hạn tin cậy (Confidence Level) + So sánh trung bình với liệu cặp: Dùng chương trình “t-TEST: PAIRED TWO SAMPLE FOR MEANS” để tìm tiêu chuẩn kiểm định (t Stat) phân vị hai phía (t Critical two-tail) VI.KẾT QUẢ VÀ CÁCH TÍNH 1.Ước lượng trung bình: Nhập vào bảng số liệu : Thiết lập bảng Descriptive Statistics + Data Data Analysis Descriptive Statistics + Input range ( phạm vi đầu vào ) :$A$9:$B$24 + Grouped By : columns + Confidence Level for Mean : 95% Ta có bảng số liệu xuất ra: Khoảng ước lượng: Trước QC Cách tính Kết Sau QC E11E11+E26 G11-G26 G11+G26 E26 81.7698 87.69687 89.17626 94.82374 So sánh trung bình với liệu cặp Thiết lập bảng t-Test:Paired Two Sample for Means + Data Data Analysis t-Test:Paired Two Sample for Means Ta nhập liệu đầu vào bảng với α = 0.05 10 CÂU I.ĐỀ BÀI Tuổi X huyết áp Y bệnh nhân trẻ em (dưới 14 tuổi), chọn ngẫu nhiên cho bảng sau đây: X 14 9 12 14 9 12 Y 100 83 112 152 104 90 92 85 110 73 132 122 134 98 82 65 Tính tỷ số tương quan,hệ số tương quan hệ số xác định Y X Với mức ý nghĩa α =5%, có kết luận mối tương quan X Y (Có phi tuyến không ? Có tuyến tính không ?)? Tìm đường hồi quy tuyến tính Y X Tính sai số tiêu chuẩn đường hồi quy II.DẠNG BÀI Phân tích tương quan Hồi quy tuyến tính III.PHƯƠNG PHÁP GIẢI Phân tích tương quan Hệ số tương quan dùng để đo mức độ phụ thuộc tuyến tính hai ĐLNN , nhiên chưa có tiêu để đo mức độ phụ thuộc nói chung Hệ số tương quan X Y bé chí không X Y có mối quan hệ phi tuyến tính chặt chẽ Vậy để đo mức độ phụ thuộc đại lượng ngẫu nhiên Y đại lương ngẫu nhiên X người ta đưa khái niệm tỷ số tương quan Hệ số tương quan : R = SXY √SXX SYY = ̅ ̅ ∑n i=1(Xi −X)(Yi −Y) ̅ )2 ∑n (Y −Y ̅ )2 √∑n (Xi −X i=1 i=1 i 12 Hệ số tương quan dùng việc đánh giá mức độ liên quan +Nếu R < 0.7 mức độ liên quan nghèo nàn +Nếu |R|nằm khoảng 0.7 – 0.8 mức độ liên quan +Nếu |R| nằm khoảng 0.8 – 0.9 mức độ liên quan tốt +Nếu |R|< 0.9 mức độ liên quan xuất sắc Hệ số xác định : R2 Tỷ số tương quan lý giải tỷ lệ biến động Y có phụ thuộc Y X Hồi quy đơn tuyến tính ̂X = B0 + BX Phương trình tổng quát: Y 𝐵0 = 𝑌̅ − 𝐵𝑋̅ 𝐵= ∑ 𝑋𝑖 𝑌𝑖 − ∑ 𝑋𝑖 𝑌𝑖 /𝑁 ∑ 𝑋𝑖2 − 𝑁(𝑋̅)2 Với Y- Biến số phụ thuộc ( dependent/reponse variable ) X-biến cố độc lập ( independent/ predictor variable ) 𝐵0 B – hệ số hồi quy ( regression coeficents ) Độ lệch chuẩn ( Standard Error ): 𝑆=√ ∑(𝑌𝑖 − 𝑌′𝑖 )2 𝑁−2 Kiểm định hệ số phương trình hồi quy tuyến tính: Giả thiết: H0 : βi = hệ số hồi quy ý nghĩa H1 : βi ≠ hệ số hồi quy có ý nghĩa + Sử dụng kiểm định t ( phân phối Student) ti = |Bi −βi | √S2n S2 với Sn2 = ∑(X ̅) i −X 13 Phân phối Student : γ = N − Nếu ti < tα (N-2) chấp nhận H0 ngược lại + Sử dụng kiểm định F ( phân phối Fischer) Giả thiết: H0 : βi=0 phương trình hồi quy không thích hợp H1 : βi ≠ phương trình hồi quy thích hợp ̅ )2 ∑(Y′i − Y′ F= ∑(Yi − Y′i )2 ⁄(N − 2) Phân phối fischer : v1=1 v2 = N-2 Nếu F < Fα(1,N-2) chấp nhận H0 ngược lại IV.CÔNG CỤ GIẢI + Phân tích tương quan : sử dụng chương trình Correlation để tìm hệ số tương quan + Hồi quy đơn tuyến tính : sử dụng chương trình Regression V.KẾT QUẢ VÀ CÁCH TÍNH 1.PHÂN TÍCH TƯƠNG QUAN TUYẾN TÍNH Số liệu nhập vào : 14 Thiết lập bảng Correlation Data Analysis Correlation Input range: phạm vi đầu vào ($A$9:$B$25) Grouped by: nhóm liệu theo hàng cột ( chọn Column – cột ) Labels in Firt Row : gắn nhãn hàng ( chọn ) Chọn New worksheet Ply ( bảng tính ) 15 Dữ liệu đầu Hệ số tương quan R=0,466627 Hệ số xác định R2 = 0.218 Giả thiết : X Y không tương quan tuyến tính Tính toán: n =16 T= R√n − √1 − R2 Suy T = 1.973631647 Phân phối Student với α =0.05 bạc tự n-2=14 Tra bảng ta có c=2.145 (=TINV(0.05,14) ) |𝑇| < c nên chưa có sở để bác bỏ H0 -> chấp nhận H0 Vậy X Y tương quan tuyến tính 2.PHÂN TÍCH TƯƠNG QUAN PHI TUYẾN Sắp xếp lại bảng số liệu X Y 73 82 83 92 65 85 122 152 104 112 132 134 12 90 98 14 100 110 Mở data analysis -> Anova :single Facter 16 + Input Range ( Phạm vi đầu vào ) : $K$34$F$54 + Grouped by ( Nhóm liệu theo hàng cột ) : Column + Labels in Firt Row ( gắn nhãn hàng ) : chọn Ouput Range ( phạm vi đầu ) : $B$44 Ta có bảng đầu : 17 Biện luận n =16 , k = Tổng bình phương nhóm SSF = 6943.75 Tổng bình phương nhân tố SST = 8515.75 SSF 6943.75 η2Y/X = SST = 8515.75 = 0.815401 = > Tỷ số tương quan 𝜂𝑌/𝑋 = 0.903 η2Y/X − r = 0.685 (η2Y −r2 )(n−k) =>F= X (1−η2Y )(k−2) =8.094031 X 18 Ta có : phân bố Fischer với 𝛼 = 0.05 (k-2,n-k) = ( 4,10 ) Tra bảng c =FINV(𝜶,k-2,n-k) =FINV(0.05,4,10) = 3.47805 Giả thiết : H1 : X Y tương quan phi tuyến Ta có : F = 8.094031 > c = 3.47805 Bác bỏ giả thiết H1 Vậy X với Y có tương quan phi tuyến 3.TÌM ĐƯỜNG HỒI QUY CỦA Y ĐỐI VỚI X Nhập lại bảng tính Thiết lập bảng Regression : + Data Data Analysis regression + Input Y Range ( phạm vi đầu vào Y ) : $B$70:$B$85 + Input X Range ( phạm vi đầu vào X ) : $A$70:$A$85 + Labels (thêm nhãn liệu ) 19 +Output Range ( Phạm vi đầu ) : $A$87 + Line Fit Plots (Vẽ đồ thị ) Dữ liệu xuất : 20 + Hệ số góc : 2.335294 + Hệ số tự : 85.77794 Vậy Y = 2.335294.X + 85.77794 Độ lệch chuẩn ( Standard Error ) : S = 21.81337478 Sai số tiểu chuẩn đường hồi quy tuyến tính : S = 475.82332 Giả thiết : Ho : Hệ số hồi quy ý nghĩa + t o = 8.6510546 > t 0.05 (14) = 2.145 Hay : giá trị P hệ số tự (p-value) : 5.45E-7 < = 0.05 bác bỏ giả thiết Ho Hệ số tự có ý nghĩa thống kê + t1 = 1.9740502 < t 0.05 (14) = 2.145 Hay Giá trị P hệ số góc (p-value): 0.068444 > = 0.05 chấp nhận giả thiết Ho hệ số góc ý nghĩa thống kê 21 Giả thiết : H1 : phương trình hồi quy không thích hợp Significance F = 0.068444 > = 0.05 ⟹ Chấp nhận giả thiết H1 Vậy hệ số góc 2.335294 phương trình hồi quy Y = 2.335294.X + 85.77794 ý nghĩa thống kê ,nói cách khác phương trình không thích hợp VI.KẾT QUẢ + Tỷ số tương quan : Y / X = 0.903 + Hệ số tương quan : r = 0,466627 + Hệ số xác định : r2 = 0,217741 + X Y tương quan tuyến tính với mức ý nghĩa 5% + Phương trình đường hồi quy tuyến tính Y = 2.335294X + 85.77794 không thích hợp 22 CÂU I.ĐỀ BÀI Hãy phân tích tình hình kinh doanh số ngành nghề quận nội thành sở số liệu vè doanh thu trung bình sau : Ngành nghề kinh doanh Khu vực kinh doanh Q1 Q2 Q3 Q4 Điện lạnh 5.7 3.1 4.4 5.0 Vật liệu xây dựng 5.0 15.0 9.5 17.5 Dịch vụ tin học 3.8 1.8 1.3 4.8 Mức ý nghĩa 10% II.DẠNG BÀI Phân tích phương sai hai nhân tố ( không lặp ) III.PHƯƠNG PHÁP GIẢI Sự phân tích nhằm đánh giá ảnh hưởng hai yếu tố giá trị quan sát Yij ( i =1.2…r : yếu tố A ; j = 1.2…c : yếu tố B ) Mô hình Yếu tố A Tổng cộng trung bình Yếu tố B Y11 Y21 … Yr1 Y12 Y22 … Yr2 … … … … … c Y1c Y2c … Yr Tổng cộng Y1 Y2 … Yr T.1 ̅Y̅̅.1̅ T.2 ̅Y̅̅.2̅ … … T.c ̅̅̅ Y c T Y̅ Trung bình Y̅1 ̅̅̅ Y2 … Y̅r 23 Bảng ANOVA Nguồn sai số Bậc tự Yếu tố A ( hàng ) (r-1) Tổng số bình phương r Ti T SSB = ∑ − c rc Bình phương Giá trị thống kê trung bình SSB MSB MSB= FR = (r−1) MSE i=1 Yếu tố B ( cột ) Sai số (c-1) (r-1) (c-1) r Tj T SSB = ∑ − r rc j=1 SSF MSF = MSB= (c−1) SSB FC = (r−1) SSE = SST-(SSF+SSB) Tổng cộng (rc-1) r c SST = ∑ ∑ Yij i=1 j=1 T .2 − r Trắc nghiệm Giả thiết : H0 : μ1 = μ2 =… μk “các giá trị trung bình nhau” H1 : μ1 ≠ μ2 “ Ít hai giá trị trung bình khác nhau” Giá trị thống kê : FR = MSB MSE MSF MSE Biện luận : FC = 24 MSF MSE + Nếu FR < Fa [r-1,(r-1)(c-1)] chấp nhận giả thiết H0 ( yếu tố A ) + Nếu FC < Fa [c-1,(r-1)(c-1)] chấp nhận giả thiết H0 ( yếu tố B ) IV.CÔNG CỤ GIẢI Sử dụng MS-EXCEL Dùng lệnh ‘’Anova : Two-Factor Whithout Replication ‘’ VI.KẾT QUẢ VÀ CÁCH TÍNH Giả thiết Ho : Các giá trị doanh thu trung bình Nhập vào bảng số liệu : Thiết lập bảng : Anova Two Factor Without Replication DataData Analysis Anova Two Factor Without Replication + phạm vi đầu vào ( Input Range) : $A$9:$E$12 + nhãn liệu ( Labels in First Row/Column) + Alpha:0.1 + phạm vi đầu ( Ouput range ) : $A$14 25 Số liệu xuất Kết biện luận + FR = 7.419526 > F0.1 = 3.4633 > bác bỏ giả thiết Ho doanh thu cửa hàng phụ thuộc vào ngành nghề + FC = 0.973374 < F0.1 = 3.288762 chấp nhận giả thiết Ho doanh thu cửa hàng không phụ thuộc vào khu vực kinh doanh VI.KẾT LUẬN Doanh thu cửa hàng phụ thuộc vào ngành nghề Doanh thu cửa hàng không phụ thuộc vào khu vực kinh doanh 26 [...]... = 475.82332 Giả thi t : Ho : Hệ số hồi quy không có ý nghĩa + t o = 8.6510546 > t 0.05 (14) = 2.145 Hay : giá trị P của hệ số tự do (p-value) : 5.45E-7 < = 0.05 bác bỏ giả thi t Ho Hệ số tự do có ý nghĩa thống kê + t1 = 1.9740502 < t 0.05 (14) = 2.145 Hay Giá trị P của hệ số góc (p-value): 0.068444 > = 0.05 chấp nhận giả thi t Ho hệ số góc không có ý nghĩa thống kê 21 Giả thi t : H1 : phương...Ta có bảng số liệu xuất ra Giả thi t : H0 : μ1 = μ2 Chiến dịch quảng cáo không thành công Vì |t|=3,5399 > tα/2=2,1448 nên bác bỏ giả thi t H0 VI.KẾT QUẢ Chiến dịch quảng cáo thành công 11 CÂU 3 I.ĐỀ BÀI Tuổi X và huyết áp Y của bệnh nhân trẻ em (dưới 14 tuổi), chọn ngẫu nhiên được cho trong bảng sau đây: X 14 1 9 7... Giá trị thống kê trung bình SSB MSB MSB= FR = (r−1) MSE i=1 Yếu tố B ( cột ) Sai số (c-1) (r-1) (c-1) r Tj 2 T 2 SSB = ∑ − r rc j=1 SSF MSF = MSB= (c−1) SSB FC = (r−1) SSE = SST-(SSF+SSB) Tổng cộng (rc-1) r c SST = ∑ ∑ Yij i=1 j=1 2 T .2 − r Trắc nghiệm Giả thi t : H0 : μ1 = μ2 =… μk “các giá trị trung bình bằng nhau” H1 : μ1 ≠ μ2 “ Ít nhất hai giá trị trung bình khác nhau” Giá trị thống kê : FR... hồi quy không thích hợp Significance F = 0.068444 > = 0.05 ⟹ Chấp nhận giả thi t H1 Vậy hệ số góc 2.335294 của phương trình hồi quy Y = 2.335294.X + 85.77794 không có ý nghĩa thống kê ,nói cách khác phương trình này không thích hợp VI.KẾT QUẢ + Tỷ số tương quan : Y / X = 0.903 + Hệ số tương quan : r = 0,466627 + Hệ số xác định : r2 = 0,217741 + X và Y không có tương quan tuyến tính với mức ý nghĩa... TÍNH Số liệu nhập vào : 14 Thi t lập bảng Correlation Data Analysis Correlation Input range: phạm vi đầu vào ($A$9:$B$25) Grouped by: nhóm dữ liệu theo hàng hoặc cột ( chọn Column – cột ) Labels in Firt Row : gắn nhãn ở hàng đầu tiên ( chọn ) Chọn New worksheet Ply ( hiện trong bảng tính mới ) 15 Dữ liệu đầu ra Hệ số tương quan R=0,466627 Hệ số xác định R2 = 0.218 Giả thi t : X và Y không tương... 24 MSF MSE + Nếu FR < Fa [r-1,(r-1)(c-1)] chấp nhận giả thi t H0 ( yếu tố A ) + Nếu FC < Fa [c-1,(r-1)(c-1)] chấp nhận giả thi t H0 ( yếu tố B ) IV.CÔNG CỤ GIẢI Sử dụng MS-EXCEL Dùng lệnh ‘’Anova : Two-Factor Whithout Replication ‘’ VI.KẾT QUẢ VÀ CÁCH TÍNH Giả thi t Ho : Các giá trị doanh thu trung bình bằng nhau Nhập vào bảng số liệu : Thi t lập bảng : Anova Two Factor Without Replication DataData... ) Tra bảng c =FINV(𝜶,k-2,n-k) =FINV(0.05,4,10) = 3.47805 Giả thi t : H1 : X Y không có tương quan phi tuyến Ta có : F = 8.094031 > c = 3.47805 Bác bỏ giả thi t H1 Vậy X với Y có tương quan phi tuyến 3.TÌM ĐƯỜNG HỒI QUY CỦA Y ĐỐI VỚI X Nhập lại bảng tính Thi t lập bảng Regression : + Data Data Analysis regression + Input Y Range ( phạm vi đầu vào Y ) : $B$70:$B$85 + Input X Range ( phạm vi đầu... 2.335294X + 85.77794 là không thích hợp 22 CÂU 4 I.ĐỀ BÀI Hãy phân tích tình hình kinh doanh của một số ngành nghề ở 4 quận nội thành trên cơ sở số liệu vè doanh thu trung bình như sau : Ngành nghề kinh doanh Khu vực kinh doanh Q1 Q2 Q3 Q4 Điện lạnh 5.7 3.1 4.4 5.0 Vật liệu xây dựng 5.0 15.0 9.5 17.5 Dịch vụ tin học 3.8 1.8 1.3 4.8 Mức ý nghĩa 10% II.DẠNG BÀI Phân tích phương sai hai nhân tố ( không lặp... First Row/Column) + Alpha:0.1 + phạm vi đầu ra ( Ouput range ) : $A$14 25 Số liệu xuất ra Kết quả biện luận + FR = 7.419526 > F0.1 = 3.4633 > bác bỏ giả thi t Ho doanh thu của cửa hàng phụ thuộc vào ngành nghề + FC = 0.973374 < F0.1 = 3.288762 chấp nhận giả thi t Ho doanh thu của các cửa hàng không phụ thuộc vào khu vực kinh doanh VI.KẾT LUẬN Doanh thu của cửa hàng phụ thuộc vào ngành nghề ... luận n =16 , k = 6 Tổng bình phương các nhóm SSF = 6943.75 Tổng bình phương nhân tố SST = 8515.75 SSF 6943.75 η2Y/X = SST = 8515.75 = 0.815401 = > Tỷ số tương quan 𝜂𝑌/𝑋 = 0.903 η2Y/X − r 2 = 0.685 (η2Y −r2 )(n−k) =>F= X (1−η2Y )(k−2) =8.094031 X 18 Ta có : phân bố Fischer với 𝛼 = 0.05 và (k-2,n-k) = ( 4,10 ) Tra bảng c =FINV(𝜶,k-2,n-k) =FINV(0.05,4,10) = 3.47805 Giả thi t : H1 : X Y không có tương quan