Hướng dẫn sử dụng microsoft Excel thực hành lý thuyết xác suất và thống kê kinh tế quốc dân

84 1.1K 2
Hướng dẫn sử dụng microsoft Excel thực hành lý thuyết xác suất và thống kê kinh tế quốc dân

Đang tải... (xem toàn văn)

Tài liệu hạn chế xem trước, để xem đầy đủ mời bạn chọn Tải xuống

Thông tin tài liệu

Hướng dẫn thực hành Microsoft Excel – bổ trợ học phần thuyết xác suất Thống toán TRƯỜNG ĐẠI HỌC KINH TẾ QUỐC DÂN KHOA TOÁN KINH TẾ BỘ MÔN TOÁN KINH TẾ HƯỚNG DẪN SỬ DỤNG MICROSOFT EXCEL THỰC HÀNH THUYẾT XÁC SUẤT THỐNG TOÁN TÀI LIỆU LƯU HÀNH NỘI BỘ Tác giả: Bùi Dương Hải Hà Nội, / 2016 www.mfe.edu.vn/buiduonghai - Bùi Dương Hải - Khoa Toán kinh tế - ĐHKTQD Hướng dẫn thực hành Microsoft Excel – bổ trợ học phần thuyết xác suất Thống toán Mở đầu Tính số xác suất Minh họa số quy luật phân phối xác suất thông dụng Thống mô tả Bảng thống nhiều chiều Mô tả số liệu đồ thị Ước lượng tham số Kiểm định tham số Kiểm định phi tham số Phân tích phương sai 10 Hồi quy tương quan www.mfe.edu.vn/buiduonghai - Bùi Dương Hải - Khoa Toán kinh tế - ĐHKTQD Hướng dẫn thực hành Microsoft Excel – bổ trợ học phần thuyết xác suất Thống toán MỞ ĐẦU Phân loại Thống Thống mô tả Bảng biểu Đồ thị Thống tổng hợp Tr.bình, tr.vị, mốt Phương sai, độ lệch chuẩn, Phân vị, Hệ số nhọn, bất đối xứng, hệ số tương quan… Thống suy diễn Ước lượng tham số Ước lượng điểm: 𝑥, 𝑠 , 𝑓 Khoảng tin cậy: µ, σ2, p Kiểm định giả thuyết Tham số : µ = µ0 ; σ2 = σ02 p = p0 µX = µY ; σX2 = σY2 pX = pY Phi tham số Phân loại biến dùng thống Biến định tính - Qualitative Biến định lượng - Quantitative Biến định danh Nominal Biến thứ bậc Ordinal Biến đo lường – Cardinal (rời rạc, liên tục / khoảng, tỉ lệ) Liệt kê, nhóm đếm số lượng, tỉ lệ Liệt kê, nhóm đếm số lượng, tỉ lệ So sánh, xếp thứ tự Có thể  Liệt kê, nhóm, đếm số lượng, tỉ lệ So sánh, xếp thứ tự Các phép toán học Các loại thống Các phân tích chéo, theo thời gian… Mã hóa thành số, đơn vị Đồ thị tròn, cột Không thể chuyển thành định lượng Là số có có đơn vị Tất loại đồ thị Có thể chuyển thành định tính www.mfe.edu.vn/buiduonghai - Bùi Dương Hải - Khoa Toán kinh tế - ĐHKTQD Hướng dẫn thực hành Microsoft Excel – bổ trợ học phần thuyết xác suất Thống toán Excel công cụ Data Analysis Toàn tài liệu viết dựa Microsoft Excel 2013 Để thực thao tác thống bản, cần có Add-in “Data Analysis” công cụ Trước hết cần kiểm tra xem Excel cài công cụ Data Analysis hay chưa:  Nhấn vào DATA để xem có Data Analysis Hình Nếu chưa có, thực cài Data Analysis sau: Bước File  Options  Hộp thoại Excel Options Bước Tại hộp thoại Excel Options  Add-Ins  Manage: Excel Add-ins  Go  Hộp thoại Add-Ins Bước Tại hộp thoại Add-Ins: Đánh dấu vào lựa chọn:  Analysis TookPak,  Analysis ToolPak-VBA  OK *Lưu ý: Excel sử dụng tài liệu theo hệ Anh, dấu thập phân dấu chấm “.” ngăn cách đối tượng dấu phảy “,” Nếu Excel sử dụng hệ Pháp dấu thập phân dấu “,” ngăn cách đối tượng dấu chấm phảy “;” www.mfe.edu.vn/buiduonghai - Bùi Dương Hải - Khoa Toán kinh tế - ĐHKTQD Hướng dẫn thực hành Microsoft Excel – bổ trợ học phần thuyết xác suất Thống toán TẠO MỘT SỐ CHUỖI NGẪU NHIÊN Để thực mô tượng ngẫu nhiên kinh tế xã hội, thực việc tạo số chuỗi giá trị ngẫu nhiên giả định Excel cho phép tạo số chuỗi ngẫu nhiên tuân theo quy luật phân phối xác suất bản, với số lượng chuỗi số số lượng số chuỗi tùy ý 1.1 Chọn số ngẫu nhiên Trong nhiều trường hợp, để đảm bảo tính ngẫu nhiên khách quan, cần tìm số hoàn toàn ngẫu nhiên khoảng cho trước, chẳng hạn chọn ngẫu nhiên sinh viên danh sách lớp gồm 60 sinh viên Hàm chọn ngẫu nhiên giá trị nguyên đoạn [a, b] là: = RANDBETWEEN(a , b) Trong a, b số thực bất kỳ, kết số âm (nếu a < 0) dương (nếu b > 0) Ví dụ 1.1: Để chọn ngẫu nhiên sinh viên từ danh sách lớp gồm 60 sinh viên, dùng hàm: = RANDBETWEEN(0,60) Xác suất để số nguyên đoạn [a ,b] chọn Lệnh chọn lấy số thực ngẫu nhiên đoạn [0,1] : = RAND( ) 1.2 Tạo chuỗi số phân phối Không-một: A(p) Biến X phân phối Không-Một, hay phân phối Bernoulli: X ~ A(p)  X = {0 , 1} với P(X = 1) = p P(X = 0) = – p  E(X) = p V(X) = p(1 – p) ; Ví dụ 1.2: Tạo chuỗi gồm 20 số rút từ biến phân phối A(p = 0.4), đặt vào cột bảng tính, ô A2, làm sau:  DATA  Data Analysis  Hộp thoại [Data Analysis]  Random Number Generation [Random Number Generation]  Number of Variables:  Number of Random Numbers: 20  Distribution: Bernoulli  Parameters p Value = 0.4 Random Seed (để trống)*  Output options  OK  Output Range: A2 www.mfe.edu.vn/buiduonghai - Bùi Dương Hải - Khoa Toán kinh tế - ĐHKTQD Hướng dẫn thực hành Microsoft Excel – bổ trợ học phần thuyết xác suất Thống toán Hình 1.1 Kết hiển thị theo cột, gồm 20 số ngẫu nhiên Kết khác với lần thực hiện, tài liệu không đưa kết thủ tục tạo chuỗi số ngẫu nhiên *Random seed: Nếu muốn tạo chuỗi giống hệt chuỗi tạo trước gõ số lần vào ô Ví dụ gõ lặp lại lần tiếp theo, chuỗi giống cũ Nếu để trống chuỗi tạo khác 1.3 Tạo chuỗi phân phối Nhị thức: B(n, p) Biến X rời rạc, phân phối Nhị thức (Binary): X ~ B(n, p)  X = {0, 1,…, n} với  E(X) = np V(X) = np(1 – p) ; Ví dụ 1.3: Tạo chuỗi, chuỗi gồm 15 số rút từ biến ngẫu nhiên gốc phân phối Nhị thức B(n = 10, p = 0,4), ô B2 Cách làm tương tự chuỗi A(p), khác mục Distribution [Random Number Generation] www.mfe.edu.vn/buiduonghai - Bùi Dương Hải - Khoa Toán kinh tế - ĐHKTQD Hướng dẫn thực hành Microsoft Excel – bổ trợ học phần thuyết xác suất Thống toán  Number of Variables:  Number of Random Numbers: 15  Distribution: Binomial  Parameters  Output options p Value = 0.4 Number of trials = 10  Output Range: B2 1.4 Tạo chuỗi phân phối Poisson: P() Biến X rời rạc, phân phối Poisson: X ~ P()  X= {0, 1, 2, ….} với  E(X) =  V(X) =  Ví dụ 1.4: Tạo chuỗi gồm 20 số rút từ biến ngẫu nhiên gốc phân phối P( = 5), ô D2 [Random Number Generation]  Number of Variables:  Number of Random Numbers: 20  Distribution: Poisson  Parameters Lambda =  Output options  Output Range: D2 1.5 Tạo chuỗi phân phối Đều: U(a, b) Biến X liên tục, phân phối Đều (Uniform): X ~ U(a, b)  X (a, b) với  E(X) = (a + b)/2 V(X) = (b – a)2/12 1/(b – a) a b Ví dụ 1.5: Tạo chuỗi, chuỗi 20 số rút từ biến ngẫu nhiên gốc U(a = 0, b = 5), ô F2 www.mfe.edu.vn/buiduonghai - Bùi Dương Hải - Khoa Toán kinh tế - ĐHKTQD Hướng dẫn thực hành Microsoft Excel – bổ trợ học phần thuyết xác suất Thống toán [Random Number Generation]  Number of Variables:  Number of Random Numbers: 20  Distribution: Uniform  Parameters Between and  Output options  Output Range: F2 1.6 Tạo chuỗi phân phối Chuẩn: N(, σ2) Biến X liên tục, phân phối Chuẩn (Normal): X ~ N(, σ2)  X (–, +) với  E(X) =  V(X) = σ2  P( – 3σ < X <  + 3σ) = 0.9975   –3σ P( – 4σ < X <  + 4σ)    + 3σ Ví dụ 1.6: Tạo chuỗi, chuỗi 10 số rút từ biến ngẫu nhiên gốc N( = 15, σ2 = 42), ô G2 [Random Number Generation]  Number of Variables:  Number of Random Numbers: 10  Distribution: Normal  Parameters Mean = 15 Standard deviation =  Output options  Output Range: G2 Bài tập Bài 1.1 (a) Tạo chuỗi chứa 10 phần tử phân phối Không-một với p = 0.5 Trong chuỗi có phần tử 1? www.mfe.edu.vn/buiduonghai - Bùi Dương Hải - Khoa Toán kinh tế - ĐHKTQD Hướng dẫn thực hành Microsoft Excel – bổ trợ học phần thuyết xác suất Thống toán (b) Tạo 10 chuỗi, chuỗi 10 phần tử, phân phối Không-một với p = 0.5 Dùng hàm SUM để tính tổng giá trị, tổng số phần tử Tỉ lệ phần tử so với tổng số bao nhiêu? (c) Khi tăng số chuỗi số phần tử câu (b), tỉ lệ phần tử gần với giá trị nào? Bài 1.2 Tạo hai chuỗi, chuỗi 10 phần tử, phân phối Nhị thức với n = p = 0.5 (a) Số lượng phần tử nhận giá trị 0, 1, 2, 3, 4, hai chuỗi có không? (b) Dùng hàm AVERAGE để tính trung bình giá trị chuỗi Trung bình hai chuỗi có giống không? (c) Tăng số lượng phần tử chuỗi lên thành 100, trung bình chuỗi xấp xỉ bao nhiêu? Bài 1.3 Tạo chuỗi, chuỗi 20 phần tử phân phối khoàng từ đến 10 (a) Giá trị phần tử số nguyên hay số thập phân (b) Dùng hàm AVERAGE tính trung bình cộng hai chuỗi so sánh với www.mfe.edu.vn/buiduonghai - Bùi Dương Hải - Khoa Toán kinh tế - ĐHKTQD Hướng dẫn thực hành Microsoft Excel – bổ trợ học phần thuyết xác suất Thống toán BÀI MỘT SỐ HÀM TÍNH XÁC SUẤT THÔNG DỤNG Excel tự động tính số giá trị hàm xác suất thông dụng Tại ô bảng tính Excel, gõ hàm giá trị đối số, cho kết (làm tròn đến số thập phân) 2.1 Biến ngẫu nhiên phân phối Nhị thức: B(n, p) Xác suất giá trị x: P( X  x | n, p) , hàm : = BINOMDIST(x, n, p, 0) Hàm phân phối (tích lũy) xác suất x: P( X  x | n, p) , hàm : = BINOMDIST(x, n, p, 1) 2.2 Biến ngẫu nhiên phân phối Poisson: P() Xác suất giá trị x: P( X  x |  ) , hàm : = POISSON(x, , 0) Hàm phân phối (tích lũy) xác suất x: P( X  x |  ) , hàm : = POISSON(x, , 1) 2.3 Biến ngẫu nhiên phân phối Chuẩn: N(, σ2) Hàm mật độ giá trị x: f ( x) , hàm: = NORMDIST(x, , σ, 0) Hàm phân phối giá trị x: F ( x)  P( X  x) , hàm: = NORMDIST(x, , σ, 1) Giá trị phân vị mức , kí hiệu x* : P(X < x* ) =  , hàm: = NORMINV(, , σ ) Giá trị tới hạn mức , kí hiệu x : P(X > x ) = , hàm: = NORMINV(1 –  , , σ ) Phân phối Chuẩn hóa: N(0,1) Giá trị tới hạn chuẩn hóa mức , kí hiệu u : hàm: = NORMINV(1 –  , 0, 1) Do tính chất đối xứng nên giá trị u tính theo hàm: = – NORMINV( , 0, 1) 2.4 Biến ngẫu nhiên phân phối Khi-bình phương: 2(n) Giá trị xác suất P(  (n)  x) , hàm: = CHIDIST(x , n) Hàm phân phối (tích lũy) xác suất: F ( x)  P(  (n)  x) , hàm: = – CHIINV( , n) Giá trị tới hạn mức : 2 (n) , hàm: = CHIINV( , n) 2.5 Biến ngẫu nhiên phân phối Student: T(n) Giá trị xác suất P(T (n)  x) , hàm: = TDIST(x, n, 1) Hàm phân phối (tích lũy) xác suất FT ( x)  P(T (n)  x) , hàm: =1 – TDIST(x, n, 1) Giá trị xác suất P(T (n)  x T (n)   x) , hàm: = TDIST(x, n, 2) Cũng 2P(T (n) > x) www.mfe.edu.vn/buiduonghai - Bùi Dương Hải - Khoa Toán kinh tế - ĐHKTQD 10 Hướng dẫn thực hành Microsoft Excel – bổ trợ học phần thuyết xác suất Thống toán Bảng 8.2 Với bảng tần số thực nghiệm Oi tần số thuyết Ei, lập bảng tính giá trị (nij  Eij )2 / Ei tính tổng hàm SUM Có thể tính giá trị tới hạn mức 5% hàm CHIINV(0.05, 2) Bậc tự số hàng 2, số cột 3, nên bậc tự = (2 – 1)(3 – 1) = tính P-value hàm CHIDIST Bảng 8.3 2(2) Theo kết này,  qs2 = 2.955;  0,05 = 5.99 nên mức ý nghĩa 5% chưa bác bỏ H0 Có thể cho hai yếu tố độc lập Với giá trị P-value 0.228 lớn 5%, cho kết luận tương tự Hàm CHITEST Hàm CHITEST tính P-value kiểm định so sánh tần số thực nghiệm thuyết, để kiểm định xem hai yếu tố độc lập không: CHITEST(mảng thực nghiệm, mảng thuyết) Bảng 8.4 www.mfe.edu.vn/buiduonghai - Bùi Dương Hải - Khoa Toán kinh tế - ĐHKTQD 70 Hướng dẫn thực hành Microsoft Excel – bổ trợ học phần thuyết xác suất Thống toán Kết 0.228 Kết tương tự Với mức ý nghĩa 5% chưa bác bỏ H0, Số người Khu vực độc lập với 8.2 Kiểm định quy luật thuyết Kiểm định H0: Biến tuân theo quy luật Q H1: Biến không tuân theo quy luật Q Các quan sát chia thành k nhóm giá trị khác với tần số thực nghiệm Oi Nếu theo quy luật Q, tần số thuyết Ei , bác bỏ H0; P-value = Về thuyết, kiểm định hoàn toàn tương tự kiểm định bảng tiếp liên Hay bảng tiếp liên trường hợp kiểm định tổng quát Ví dụ 8.2: Kiểm định xem Số người hộ gia đình có phân phối theo quy luật Poisson hay không Có bảng tần số thực nghiệm số người hộ gia đình, với 420 hộ sau: Bảng 8.5 Số người Frequency 22 54 78 139 74 33 12 Grand Total 420 Với giả thuyết www.mfe.edu.vn/buiduonghai - Bùi Dương Hải - Khoa Toán kinh tế - ĐHKTQD 71 Hướng dẫn thực hành Microsoft Excel – bổ trợ học phần thuyết xác suất Thống toán H0: Biến Số người phân phối Poisson H1: Biến Số người không phân phối Poisson Nếu giả thuyết H0 đúng, cần tính xác suất tương ứng tần số thuyết tương ứng Số liệu thực nghiệm cho giá trị từ đến 9, hay tần số với X = X > Tuy nhiên thuyết, phân phối Poisson nhận giá trị giá trị lớn Phân phối Poisson cần có tham số  trung bình Sử dụng trung bình mẫu số người trung bình mẫu để tính:  = 3.938 (dùng hàm AVERAGE) Ví số người trung bình 3.938 (có thể dùng hàm: = AVERAGE để tính), tính xác suất số người giá trị 1, 2,…, (tương ứng với ô I1, I2,…, I8) theo hàm: =POISSON(x, 2.938, 0) Riêng ô tương ứng số người dùng hàm = – (tổng ô trước đó) để đảm bảo tổng xác suất Tiếp tính tần số thuyết = xác suất  420 Bảng 8.6 Sử dụng hàm: = CHITEST để tính P-value kiểm định Bảng 8.7 P-value kiểm định 2 310-11, bác bỏ H0, biến Số người không phân phối Poisson www.mfe.edu.vn/buiduonghai - Bùi Dương Hải - Khoa Toán kinh tế - ĐHKTQD 72 Hướng dẫn thực hành Microsoft Excel – bổ trợ học phần thuyết xác suất Thống toán 8.3 Kiểm định tính phân phối chuẩn (Normality test) Kiểm định Jacques-Berra Kiểm định H0: Biến tuân theo quy luật chuẩn H1: Biến không tuân theo quy luật chuẩn bác bỏ H0; P-value = Sử dụng hàm: = SKEW hàm: =KURT để tính giá trị Sk K, sau thay vào công thức để tính JB từ kết luận Ví dụ 8.3: Kiểm định tính phân phối chuẩn biến Chi tiêu Xét riêng số liệu Chi tiêu đặt cột A, từ A1 đến A421 Bảng 8.7 2(2)  5.99 ; P-value = 4.5810-169 nên bác bỏ H0, biến Chi tiêu JB = 775.2 > 2(2)  0.05 không phân phối chuẩn Với số liệu có chia khoảng (như phần vẽ đồ thị), dùng kiểm định 2 mục 8.2 để đánh giá Cách kiểm định phức tạp hơn, không trình bày Bài tập Bài 8.1 Kiểm định tính phân phối chuẩn biến: Thu nhập bình quân, Chi tiêu bình quân, Tỉ lệ Chi tiêu / Thu nhập Bài 8.2 Kiểm định tính độc lập hai dấu hiệu Thu nhập Chi tiêu, chia hai biến thành nhóm coi dấu hiệu định tính www.mfe.edu.vn/buiduonghai - Bùi Dương Hải - Khoa Toán kinh tế - ĐHKTQD 73 Hướng dẫn thực hành Microsoft Excel – bổ trợ học phần thuyết xác suất Thống toán PHÂN TÍCH PHƯƠNG SAI Phân tích phương sai (Analysis of Variance: ANOVA) kỹ thuật kiểm định trung bình biến định lượng nhóm phân chia hai biến định tính 9.1 Phân tích phương sai nhân tố (One-way ANOVA) Bảng số liệu có nhân tố B (gồm k nhóm B1,…, Bk) n quan sát X nằm nhóm Giả thiết: nhóm phân phối chuẩn phương sai B1 B2 x11 … x21 … … Bk … xk1 … Bảng ANOVA nhân tố Nguồn biến động Nhân tố B (Giữa nhóm) SS df SSB k–1 MS = SS / df F Yếu tố khác SSR n–k (Phần dư, sai số) Tổng SST n–1 H0: Trung bình k nhóm (nhân tố B không tác động đến trung bình) H1: Ít cặp trung bình khác (nhân tố B có tác động đến trung bình) Nếu bác bỏ H0, P-value = Ví dụ 9.1: Phân tích phương sai Thu nhập/người (TNBQ) sử dụng số liệu 40 hộ gia đình số liệu VHLSS2012 Với 40 hộ Số người từ đến 6, chia thành nhóm Nhóm 2-3 người, nhóm người, nhóm 5-6 người Có số liệu sau, nằm mảng từ A1 đến C16 Lưu ý số quan sát nhóm không cần Bảng 9.1 A B C  Size 2-3 Size Size 5-6 35.45 48.48 68.60 62.40 50.35 22.52 74.55 52.38 54.62 43.60 48.30 32.50 49.33 42.90 19.80 72.20 43.25 47.06 71.17 59.05 37.94 59.27 43.63 41.78 10 83.73 23.25 24.46 www.mfe.edu.vn/buiduonghai - Bùi Dương Hải - Khoa Toán kinh tế - ĐHKTQD 74 Hướng dẫn thực hành Microsoft Excel – bổ trợ học phần thuyết xác suất Thống toán 11 12 13 14 15 85.27 40.77 61.90 16 22.50 61.63 44.65 56.95 51.15 54.48 59.72 50.00 35.97 76.52  DATA  Data Analysis  Anova: Single Factor [Anova: Single Factor]  Input Range: A1:C16  Group by:  Columns   Label in first row  Alpha: 0.05   Output Range: E1 Bảng 9.2 Anova: Single Factor SUMMARY Groups Size 2-3 Size Size 5-6 Count 12 15 13 ANOVA Source of Variation Between Groups Within Groups Total SS 2241.817 8542.061 10783.878 Sum 739.633 702.925 571.483 df Average Variance 61.636 274.551 46.862 127.642 43.960 311.251 MS 1120.909 37 230.867 39 F 4.855 P-value 0.013 F crit 3.252 Với giả thiết phân phối chuẩn phương sai nhau, kiểm định giả thuyết tác động nhân tố Số người (ở gồm ba nhóm) đến Trung bình Thu nhập/người: H0: Nhân tố Số người không tác động đến Trung bình Thu nhập/người H1: Nhân tố Số người có tác động đến Trung bình Thu nhập/người Fqs = 4.855 > f = 3.252; P-value = 0.013 nên với mức ý nghĩa 5% bác bỏ H0, nhân tố Số người tác động đến trung bình Thu nhập/người www.mfe.edu.vn/buiduonghai - Bùi Dương Hải - Khoa Toán kinh tế - ĐHKTQD 75 Hướng dẫn thực hành Microsoft Excel – bổ trợ học phần thuyết xác suất Thống toán 9.2 Phân tích phương sai hai nhân tố tương tác (Two-way ANOVA without interaction) Hai nhân tố hàng A (gồm h nhóm A1,…, Ah) nhân tố cột B (gồm k nhóm B1,…, Bk) Tại ô có giá trị xij, có nhiều lấy trung bình cộng làm đại diện Tổng cộng n = hk quan sát B1 B2 … Bk A1 x11 x12 … x1k A2 … Ah x21 … xh1 x22 … xh2 … … … x2k … xhk Bảng ANOVA hai nhân tố tương tác Nguồn SS df Nhân tố hàng (A) SSA h–1 Nhân tố cột (B) SSB k–1 Yếu tố khác SSR (h – 1)(h – 1) MS = SS / df F Tổng SST n – = hk – Với giả thiết phân phối chuẩn phương sai nhóm H0: Nhân tố hàng (A) không tác động đến trung bình H1: Nhân tố hàng (A) có tác động đến trung bình Nếu bác bỏ H0 H0: Nhân tố cột (B) không tác động đến trung bình H1: Nhân tố cột (B) có tác động đến trung bình Nếu bác bỏ H0 Ví dụ 9.2: Sử dụng Pivot table có bảng thống Thu nhập/người bảng 9.3, thực phân tích phương sai để đánh giá xem nhân tố Khu vực Số người có tác động đến trung bình Thu nhập/người hay không Bảng 9.3  A Average of TNBQ Khu vực Nông thôn Thành thị Grand Total B C D E Số người 1-3 4-6 7-9 Grand Total 25.375 24.964 27.532 25.274 60.326 48.847 37.177 52.856 41.035 35.546 29.943 37.292 www.mfe.edu.vn/buiduonghai - Bùi Dương Hải - Khoa Toán kinh tế - ĐHKTQD 76 Hướng dẫn thực hành Microsoft Excel – bổ trợ học phần thuyết xác suất Thống toán  DATA  Data Analysis  Anova: Two-Factor Without Replication [Anova: Two-Factor Without Replication]  Input Range: A2:D4   Labels  Alpha: 0.05   Output Range: G1 Bảng 9.4 Anova: Two-Factor Without Replication SUMMARY Count Sum Average Variance Nông thôn 77.870 25.957 1.903 Thành thị 146.349 48.783 133.972 1-3 4-6 7-9 2 ANOVA Source of Variation Rows Columns Error Total SS 781.552 110.818 160.932 1053.302 85.701 73.810 64.708 42.850 36.905 32.354 610.769 285.204 46.512 df MS 781.552 55.409 80.466 F 9.713 0.689 2 P-value 0.089 0.592 F crit 18.513 19.000 Với giả thiết phân phối chuẩn phương sai nhau, kiểm định tác động nhân tố Khu vực: H0: Nhân tố Khu vực không tác động đến trung bình Thu nhập/người H1: Nhân tố Khu vực có tác động Fqs = 9.713 < f = f0.05 = 18.513; P-value = 0.089 nên với mức ý nghĩa 5% chưa có sở bác bỏ H0, nhân tố Khu vực không tác động đến trung bình Thu nhập/người Kiểm định tác động nhân tố Số người: H0: Nhân tố Số người không tác động đến trung bình Thu nhập/người H1: Nhân tố Số người có tác động Fqs = 0.689 < f = f0.05 = 19.0; P-value = 0.592 nên với mức ý nghĩa 5% chưa có sở bác bỏ H0, nhân tố Số người không tác động đến trung bình Thu nhập/người www.mfe.edu.vn/buiduonghai - Bùi Dương Hải - Khoa Toán kinh tế - ĐHKTQD 77 Hướng dẫn thực hành Microsoft Excel – bổ trợ học phần thuyết xác suất Thống toán 9.3 Phân tích phương sai hai nhân tố có tương tác (Two-way ANOVA with interaction) Hai nhân tố hàng A (gồm h nhóm A1,…, Ah) nhân tố cột B (gồm k nhóm B1,…, Bk) Tại ô có giá trị xijs, số lượng giá trị A1 ô m … Tổng cộng n = h  k  m quan sát Ah … B1 B2 Bk x111 … x11m … xh11 … xh1m x121 x1k1 … … … x12m x1km … … … xh21 xhk1 … … … xh2m xhkm Bảng ANOVA hai nhân tố có tương tác Nguồn SS df Nhân tố hàng (A) SSA h–1 Nhân tố cột (B) SSB k–1 Tương tác A B SSI (h – 1)(h – 1) Yếu tố khác SSR n – hk MS = SS / df F Tổng SST n – = hk – Với giả thiết phân phối chuẩn phương sai nhóm H0: Nhân tố hàng (A) không tác động đến trung bình Nếu bác bỏ H0 H0: Nhân tố cột (B) không tác động đến trung bình Nếu bác bỏ H0 H0: Tương tác A B không tác động đến trung bình Nếu bác bỏ H0 Ví dụ 9.3: Với số liệu bảng 9.5 sau, tổng hợp nhờ Pivot table, nhóm lấy ba giá trị Nhỏ (min), Trung bình (average) Lớn (max) làm đại diện Phân tích ANOVA hai nhân tố Khu vực Số người có xét tương tác hai nhân tố www.mfe.edu.vn/buiduonghai - Bùi Dương Hải - Khoa Toán kinh tế - ĐHKTQD 78 Hướng dẫn thực hành Microsoft Excel – bổ trợ học phần thuyết xác suất Thống toán Bảng 9.5  A TNBQ Khu vực Nông thôn Thành thị B C D Số người 1-3 4-6 7-9 5.50 6.10 13.61 25.38 24.96 27.53 70.10 105.05 64.07 10.30 7.58 26.57 60.33 48.85 37.18 260.83 109.13 52.28 Thực sau  DATA  Data Analysis  Anova: Two-Factor With Replication [Anova: Two-Factor With Replication]  Input Range: A2:D8  Row per sample:  Alpha: 0.05   Output Range: G1 Bảng 9.6 Anova: Two-Factor With Replication SUMMARY 1-3 4-6 7-9 Total Nông thôn Count Sum Average Variance 3 100.975 136.114 33.658 45.371 1094.749 2760.129 105.217 342.306 35.072 38.034 679.128 1164.158 3 331.459 165.547 110.486 55.182 17578.810 2608.204 116.023 613.029 38.674 68.114 166.851 6149.468 Thành thị Count Sum Average Variance Total Count Sum Average Variance ANOVA Source of Variation Sample Columns Interaction Within Total 6 432.434 301.660 72.072 50.277 9240.184 2176.210 SS 4071.708 3787.325 4945.938 49775.744 62580.714 df 2 12 17 221.240 36.873 342.284 MS 4071.708 1893.662 2472.969 4147.979 F 0.982 0.457 0.596 P-value 0.341 0.644 0.566 www.mfe.edu.vn/buiduonghai - Bùi Dương Hải - Khoa Toán kinh tế - ĐHKTQD F crit 4.747 3.885 3.885 79 Hướng dẫn thực hành Microsoft Excel – bổ trợ học phần thuyết xác suất Thống toán Với ba cặp giả thuyết H0: Nhân tố Khu vực không tác động đến Trung bình Thu nhập/người P-value kiểm định F 0.341, chưa bác bỏ H0 H0: Nhân tố Số người không tác động đến Trung bình Thu nhập/người P-value kiểm định F 0.644, chưa bác bỏ H0 H0: Tương tác Khu vực Số người không tác động đến Trung bình Thu nhập/người P-value kiểm định F 0.566, chưa bác bỏ H0 Do nói việc phân chia Thu nhập/người theo khu vực Số người không mang ý nghĩa mặt thống *Lưu ý cách phân chia nhóm Số người phân tích hai nhân tố mục 10.2 10.3 không giống cách phân chia số người phân tích nhân tố làm mục 10.1, số quan sát khác, kết luận không giống điều xảy Bài tập Bài 9.1 Với 40 quan sát đầu tiên, xét biến Thu nhập (a) Chia Số người thành ba nhóm tương tự ví dụ 9.1: nhóm 2-3, nhóm 4, nhóm 5-6 người, xét mức Thu nhập hộ theo ba nhóm (b) Thực phân tích phương sai nhân tố với số liệu câu (a) (c) Chia Số người thành năm nhóm: 2, 3, 4, 5, người, xét mức Thu nhập theo năm nhóm (d) Phân tích phương sai nhân tố với số liệu câu (c) www.mfe.edu.vn/buiduonghai - Bùi Dương Hải - Khoa Toán kinh tế - ĐHKTQD 80 Hướng dẫn thực hành Microsoft Excel – bổ trợ học phần thuyết xác suất Thống toán 10 PHÂN TÍCH HỒI QUY Hồi quy tương quan kỹ thuật phân tích mối liên hệ biến Trong tương quan cho biết mức độ liên quan, chiều liên quan, mà không cho nguyên nhân, đâu kết quả, không phân tích mối quan hệ nhiều biến, hồi quy cần xác định rõ mối liên hệ phụ thuộc, có nhiều biến nguyên nhân xét lúc Phân tích hồi quy kỹ thuật Kinh tế lượng 10.1 Hồi quy đơn (single regression) Mối quan hệ hồi quy Y theo X có dạng: Y = 1 + 2X + u Trong mẫu có dạng : Y = b1 + b2X + e hay Ŷ = b1 + b2X Với , Đo độ xác qua Se(b1), Se(b2), hệ số xác định R2, Sai số chuẩn bình phương phần dư RSS , Tổng Có toán kiểm định T ước lượng hệ số 1 + 2 Kiểm định F phù hợp hàm hồi quy Ví dụ: Xét mối quan hệ hồi quy Chi tiêu (CT) Thu nhập (TN), Chi tiêu phụ thuộc vào thu nhập Biến Chi tiêu ô E1:E421, biến Thu nhập ô D1:D421 Mô hình hồi quy có dạng CT = 1 + 2TN + u Ước lượng mẫu CT = b1 + b2TN + e (Hay: CT  ˆ1  ˆ2TN  e )  DATA  Data Analysis  Regression  [Regression]  Input Y Range: E1:E421  Input X Range: D1:D421   Label  Constant is Zero (không đánh dấu ô này, mô hình có hệ số chặn)   Confidence Level (không cần đánh ô máy tự động có sẵn)   Output Range: J1 www.mfe.edu.vn/buiduonghai - Bùi Dương Hải - Khoa Toán kinh tế - ĐHKTQD 81 Hướng dẫn thực hành Microsoft Excel – bổ trợ học phần thuyết xác suất Thống toán Bảng 10.1 SUMMARY OUTPUT Regression Statistics Multiple R 0.816 R Square 0.667 Adjusted R Square 0.665 Standard Error 51.389 Observations 240 ANOVA df 238 239 SS 1257041.9 628506.8 1885548.7 MS 1257042 2640.8 F 476.011 Significance F 1.05E-58 Coefficients 24.904 0.605 Standard Error 5.985 0.028 t Stat 4.161 21.818 P-value 0.000 0.000 Lower 95% 13.115 0.551 Regression Residual Total Intercept Thu nhập Upper 95% 36.694 0.660 Theo kết viết hàm hồi quy mẫu CTi = 24.904 + 0.605 TNi + ei Về trung bình, Thu nhập Chi tiêu 24.9 hay tiêu dùng tự định 24.9; Thu nhập tăng đơn vị Chi tiêu tăng 0,6 đơn vị, hay khuynh hướng tiêu dùng cận biên 0.6, khuynh hướng tiết kiệm cận biên 0.4 Mô hình giải thích 67% biến động Chi tiêu Với mức ý nghĩa 5%, kiểm định cho kết luận sau: - Hàm hồi quy phù hợp Hệ số chặn có ý nghĩa thống Hệ số góc có ý nghĩa thống Với độ tin cậy 95%, khoảng tin cậy đối xứng hệ số chặn từ 13.1 đến 36.7; hay tiêu dùng tự định nằm khoảng (13.1 ; 36.7) Khoảng tin cậy hệ số góc hay Khuynh hướng tiêu dùng cận biên nằm khoảng (0.55 ; 0.66) 10.2 Hồi quy bội (multiple regression) Xét mô hình hồi quy bội với Chi tiêu biến phụ thuộc, biến độc lập Thu nhập Số người, thực ước lượng sau:  DATA  Data Analysis  Regression  [Regression]  Input Y Range: E1:E421  Input X Range: C1:D421   Label  Constant is Zero (không đánh dấu ô này, mô hình có hệ số chặn) www.mfe.edu.vn/buiduonghai - Bùi Dương Hải - Khoa Toán kinh tế - ĐHKTQD 82 Hướng dẫn thực hành Microsoft Excel – bổ trợ học phần thuyết xác suất Thống toán   Confidence Level (không cần đánh ô máy tự động có sẵn)   Output Range: J20 Bảng 10.2 SUMMARY OUTPUT Regression Statistics Multiple R 0.819 R Square 0.670 Adjusted R Square 0.667 Standard Error 51.228 Observations 240 ANOVA df Regression Residual 237 Total 239 SS 1263580.2 621968.5 1885548.7 Coefficients 13.322 3.766 0.587 Standard Error 9.457 2.386 0.030 Intercept Số người Thu nhập MS F 631790.1 240.743 2624.3 t Stat 1.409 1.578 19.616 P-value 0.160 0.116 0.000 Sig F 8.36E-58 Lower 95% -5.309 -0.934 0.528 Upper 95% 31.953 8.467 0.646 Kết ước lượng: CTi = 13.322 + 3.766 SNi + 0.587 TNi + ei Theo kết này, xét trung bình, số người tăng thêm chi tiêu tăng 3.766 đơn vị ; Thu nhập tăng đơn vị Chi tiêu tăng 0.587 Với mức ý nghĩa 5%, biến Số người ý nghĩa thống kê, biến Thu nhập có ý nghĩa thống Với biến ý nghĩa thống kê, ước lượng khoảng vô nghĩa 10.3 Xem phần dư, giá trị ước lượng biến phụ thuộc Khi muốn xem phần dư giá trị ước lượng biến phụ thuộc, thực hoàn toàn tương tự, thêm hai đánh dấu lựa chọn Residual Residual Plots  DATA  Data Analysis  Regression  [Regression]  Input Y Range: E1:E421  Input X Range: C1:D421   Label  Constant is Zero (không đánh dấu ô này, mô hình có hệ số chặn)   Confidence Level (không cần đánh ô máy tự động có sẵn) www.mfe.edu.vn/buiduonghai - Bùi Dương Hải - Khoa Toán kinh tế - ĐHKTQD 83 Hướng dẫn thực hành Microsoft Excel – bổ trợ học phần thuyết xác suất Thống toán   Output Range: J40   Residual  Residual Plots Bảng 10.3 RESIDUAL OUTPUT Observation 10 … Predicted Chi tiêu 96.062 224.193 87.890 106.237 134.689 59.328 139.126 143.918 182.840 200.052 … Residuals 64.038 76.807 228.410 31.063 42.211 44.972 -10.126 34.382 56.960 -30.952 … Bảng kết phần dư cho thấy chênh lệch giá trị thực tế số liệu với giá trị ước lượng đường hồi quy Với hộ gia đình thứ nhất, mức chi tiêu thực cao mức trung bình tính toán mô hình Hộ gia đình thứ có mức chi tiêu thực thấp mức trung bình www.mfe.edu.vn/buiduonghai - Bùi Dương Hải - Khoa Toán kinh tế - ĐHKTQD 84 .. .Hướng dẫn thực hành Microsoft Excel – bổ trợ học phần Lý thuyết xác suất Thống kê toán Mở đầu Tính số xác suất Minh họa số quy luật phân phối xác suất thông dụng Thống kê mô tả Bảng thống kê. .. - Khoa Toán kinh tế - ĐHKTQD Hướng dẫn thực hành Microsoft Excel – bổ trợ học phần Lý thuyết xác suất Thống kê toán MỞ ĐẦU Phân loại Thống kê Thống kê mô tả Bảng biểu Đồ thị Thống kê tổng hợp... Toán kinh tế - ĐHKTQD Hướng dẫn thực hành Microsoft Excel – bổ trợ học phần Lý thuyết xác suất Thống kê toán BÀI MỘT SỐ HÀM TÍNH XÁC SUẤT THÔNG DỤNG Excel tự động tính số giá trị hàm xác suất

Ngày đăng: 01/09/2017, 20:23

Từ khóa liên quan

Tài liệu cùng người dùng

Tài liệu liên quan