1. Trang chủ
  2. » Luận Văn - Báo Cáo

Báo cáo bài tập lớn môn xác suất thống kê

76 2 0

Đang tải... (xem toàn văn)

Tài liệu hạn chế xem trước, để xem đầy đủ mời bạn chọn Tải xuống

THÔNG TIN TÀI LIỆU

ĐẠI HỌC QUỐC GIA TP HỒ CHÍ MINH TRƯỜNG ĐẠI HỌC BÁCH KHOA KHOA KHOA HỌC VÀ KỸ THUẬT MÁY TÍNH - ⸛⸙⸛ - BÁO CÁO BÀI TẬP LỚN MÔN XÁC SUẤT THỐNG KÊ MSMH: MT2013 GVHD: Nguyễn Bá Thi LỚP: L14 NHÓM: 19 HỌ TÊN: Lê Đình Huy MSSV: 2113481 TP.HCM, tháng 11 năm 2022 Bài tập lớn Xác suất Thống kê nhóm 19 – lớp L14 Lời cảm ơn Lời đầu tiên, nhóm chúng em xin gửi lời cám ơn sâu sắc đến thầy Nguyễn Bá Thi, giảng viên hướng dẫn nhóm hồn thành đề tài Nhờ giảng tâm huyết thầy mà nhóm chúng em nắm sở lý thuyết để hoàn thành báo cáo theo thời hạn giao Nhóm chúng em xin gửi lời cám ơn đến ý kiến đóng góp, giúp đỡ thầy cô, bạn bè để báo cáo hồn thiện Nhóm xin chân thành cám ơn đến hợp tác làm việc, tương trợ để hoàn thành báo cáo kịp thời hạn hồn thiện thành viên nhóm Do chưa có nhiều kinh nghiệm làm việc phần mềm RStudio, hạn chế mặt kiến thức chắn khơng tránh khỏi thiếu sót Rất mong nhận nhận xét, ý kiến đóng góp, phê bình từ phía thầy để báo cáo hồn thiện Lời cuối cùng, nhóm xin gửi lời cám ơn đến người hỗ trợ nhóm trình làm báo cáo 2|Page Giảng viên hướng dẫn: Nguyễn Bá Thi Bài tập lớn Xác suất Thống kê nhóm 19 – lớp L14 MỤC LỤC Lời cảm ơn I PHẦN CHUNG 1 Hồi quy tuyến tính bội 1.1 Đề 1.2 Cơ sở lý thuyết 1.2.1 Tổng quan mơ hình hồi quy tuyến tính bội 1.2.2 Một số hàm hồi quy tuyến tính 1.2.2.1 Hàm hồi quy tổng thể (PRF – Population Regression Function) 1.2.2.2 Hàm hồi quy mẫu (SRF - Sample Regression Function) 1.2.3 Các giả thiết phương pháp bình phương nhỏ cho mơ hình hồi quy tuyến tính bội 1.2.4 Độ phù hợp mơ hình 1.2.5 Ước lượng khoảng tin cậy kiểm định hệ số hồi quy 1.2.5.1 Ước lượng khoảng giá trị ước lượng khoảng 1.2.5.2 Kiểm định giả thiết 𝜷𝒋 1.2.6 Kiểm định mức độ ý nghĩa chung mơ hình (trường hợp đặc biệt kiểm định WALD) 1.2.6.1 Khái quát kiểm định WALD 1.2.6.2 Kiểm định ý nghĩa mơ hình 1.3 Thực 1.3.1 Đọc liệu (Import Data) 1.3.2 Làm liệu 1.3.3 Làm rõ liệu (Data visualization) 1.3.4 Xây dựng mơ hình hồi quy tuyến tính 17 1.3.5 Dự báo (Predictions) 22 ANOVA 23 3|Page Giảng viên hướng dẫn: Nguyễn Bá Thi Bài tập lớn Xác suất Thống kê nhóm 19 – lớp L14 2.1 Đề 23 2.2 Cơ sở lý thuyết 23 2.2.1 Phân tích phương sai yếu tố 23 2.2.2 Phân tích phương sai hai yếu tố 28 2.3 Thực 34 2.3.1 Đọc file liệu, thực thống kê mô tả kiểm định 34 2.3.2 Phân tích phương sai nhân tố (one way ANOVA) 42 2.3.2 Phân tích phương sai hai nhân tố (two way ANOVA) 50 II PHẦN RIÊNG 55 Giới thiệu đề tài 55 Cơ sở lý thuyết 56 2.1 Trung bình cộng 56 2.1.2 Trung vị 56 2.1.3 Độ lệch chuẩn 56 2.1.4 Giá trị nhỏ 56 2.1.5 Giá trị lớn 56 2.1.6 Biểu đồ hist 56 2.1.7 Biểu đồ boxplot 56 2.1.8 Biểu đồ paris 56 2.1.9 Hồi quy tuyến tính 56 2.2 Thống kê mô tả 56 2.1.1 Các lệnh dùng Rstudio 56 Thực 57 3.1 Làm rõ liệu 57 3.1.1 Đọc liệu 57 3.1.2 Làm liệu 57 3.1.3 Làm rõ liệu 58 3.2 Mơ hình liệu 64 4|Page Giảng viên hướng dẫn: Nguyễn Bá Thi Bài tập lớn Xác suất Thống kê nhóm 19 – lớp L14 3.2.1 Xây dựng mơ hình hồi quy tuyến tính 65 3.2.2 Dự đốn so sánh khoảng tin cậy 69 TÀI LIỆU THAM KHẢO 71 5|Page Giảng viên hướng dẫn: Nguyễn Bá Thi Bài tập lớn Xác suất Thống kê nhóm 19 – lớp L14 I PHẦN CHUNG Hồi quy tuyến tính bội 1.1 Đề Bài tập Tập tin "gia_nha.csv" chứa thông tin giá bán thị trường (đơn vị đôla) 21613 nhà quận King nước Mỹ khoảng thời gian từ tháng 5/2014 đến 5/2015 Bên cạnh giá nhà, liệu cịn bao gồm thuộc tính mơ tả chất lượng nhà Dữ liệu gốc cung cấp tại: https://www.kaggle.com/harlfoxem/housesalesprediction Các biến liệu:  price: Giá nhà bán  sqft_living15: Diện tích trung bình 15 ngơi nhà gần khu dân cư  floors: Số tầng nhà phân loại từ - 3.5  condition: Điều kiện kiến trúc nhà từ - 5, 1: tệ 5: tốt  sqft_above: Diện tích ngơi nhà  sqft_living: Diện tích khn viên nhà 1.2 Cơ sở lý thuyết 1.2.1 Tổng quan mơ hình hồi quy tuyến tính bội “Hồi quy tuyến tính bội” mơ hình với biến phụ thuộc với hai nhiều biến độc lập: 𝑌 = 𝛽0 + 𝛽1 𝑋1𝑖 + 𝛽2 𝑋2𝑖 + ⋯ + 𝛽𝑘 𝑋𝑘𝑖 + 𝜀𝑖 Trong đó: + 𝑌: Biến phụ thuộc + 𝑋𝑘𝑖 : Biến độc lập + 𝛽1 : Hệ số tự (Hệ số chặn) + 𝛽𝑘 : Hệ số hồi quy riêng 1|Page Giảng viên hướng dẫn: Nguyễn Bá Thi Bài tập lớn Xác suất Thống kê nhóm 19 – lớp L14 1.2.2 Một số hàm hồi quy tuyến tính 1.2.2.1 Hàm hồi quy tổng thể (PRF – Population Regression Function) Hàm hồi quy tổng thể hàm số thể mối quan hệ trung bình biến phụ thuộc biến độc lập, xác định toàn tổng thể Giả thiết: + 𝑋2 , 𝑋3 , … , 𝑋𝑘 biến độc lập + Y biến phụ thuộc vào X + Y biến ngẫu nhiên có phân phối xác suất cụ thể ⇒ Tồn 𝐸(𝑌|𝑋2 , 𝑋3 , … , 𝑋𝑘 ) = giá trị xác định ⇒ Do vậy, 𝐹(𝑋2 , 𝑋3 , … , 𝑋𝑘 ) = 𝐸(𝑌|𝑋2 , 𝑋3 , … , 𝑋𝑘 ) hàm hồi quy tổng thể Y theo 𝑋2 , 𝑋3 , … , 𝑋𝑘 Với cá thể I, tồn (𝑋2,𝑖 , 𝑋3,𝑖 , … , 𝑋𝑘,𝑖 , 𝑌𝑖 ) Ta có: 𝑌𝑖 = 𝐹 (𝑋2 , 𝑋3 , … , 𝑋𝑘 ) ⇒ 𝑢𝑖 = 𝑌𝑖 − 𝐹 ⇒ 𝑌𝑖 = 𝐸 (𝑌|𝑋2 , 𝑋3 , … , 𝑋𝑘 ) + 𝑢𝑖 Vậy hàm hồi quy tơng thể PRF có dạng: Y = E(Y|X) + U E(Y|X) = F(X) 1.2.2.2 Hàm hồi quy mẫu (SRF - Sample Regression Function) Hàm hồi quy mẫu hàm số thể mối quan hệ trung bình biến phụ thuộc biến độc lập, xác định toàn mẫu Ta xét mẫu có n cá thể, gọi 𝑌 = 𝐹(𝑋2 , 𝑋3 , … , 𝑋𝑘 ) hồi quy mẫu Với cá thể mẫu 𝑌𝑖 ≠ 𝐹(𝑋2,𝑖 , 𝑋3,𝑖 , … , 𝑋𝑘,𝑖 , 𝑌𝑖 ) sinh 𝑒𝑖 − 𝑌𝑖 − 𝐹 (𝑋2 , 𝑋3 , … , 𝑋𝑘 ); 𝑒𝑖 gọi phần dư SRF Ta có hàm hồi quy mẫu tổng quát viết dạng sau: 𝑖 = 𝛽     𝑌 + 𝛽2 𝑥2,𝑖 + 𝛽3 𝑥3,𝑖 + ⋯ + 𝛽𝑘 𝑥𝑘,𝑖 Với 𝛽 𝑚 ước lượng 𝛽𝑚 , phần dư 𝑒𝑖 = 𝑦𝑖 − 𝑦 𝑖 2|Page Giảng viên hướng dẫn: Nguyễn Bá Thi Bài tập lớn Xác suất Thống kê nhóm 19 – lớp L14 Giả thiết 𝛽 𝑚 ước lượng không chệch 𝛽𝑚 , phải ước lượng hiệu Ước lượng SRF: chọn phương pháp để ước lượng tham số F qua việc tìm tham số F lấy giá trị quan sát tham số làm giá trị xấp xỉ cho tham số F 1.2.3 Các giả thiết phương pháp bình phương nhỏ cho mơ hình hồi quy tuyến tính bội Thứ nhất, hàm hồi quy tuyến tính theo tham số Hồi quy thực tế miêu tả dạng: 𝑌 = 𝛽0 + 𝛽1 𝑋1𝑖 + 𝛽2 𝑋2𝑖 + ⋯ + 𝛽𝑘 𝑋𝑘𝑖 + 𝜀𝑖 mối quan hệ thực tế viết lại ví dụ dạng lấy loga hai vế Thứ hai, kỳ vọng yếu tố ngẫu nhiên Trung bình tổng thể sai số Điều có nghĩa có số giá trị sai số mang dấu dương số sai số mang dấu âm Do hàm xem đường trung bình nên giả định sai số ngẫu nhiên bị loại trừ nhau, mức trung bình, tổng thể Thứ ba, sai số độc lập với Thứ tư, sai số có phương sai nhau: tất giá trị u phân phối giống với phương sai 𝜎 , cho 𝑉𝑎𝑟(𝑢𝑖 ) = 𝐸(𝑢𝑖2 ) = 𝜎 Thứ năm, sai số có phân phối chuẩn: điều quan trọng phát sinh khoảng tin cậy thực kiểm định giả thuyết phạm vi mẫu nhỏ Nhưng phạm vi mẫu lớn hơn, điều trở nên không quan trọng 1.2.4 Độ phù hợp mơ hình 3|Page Giảng viên hướng dẫn: Nguyễn Bá Thi Bài tập lớn Xác suất Thống kê nhóm 19 – lớp L14 Để biết mơ hình giải thích hay % biến động biến phụ thuộc, người ta sử dụng 𝑅2 , 𝑅2 đo tỷ lệ hay số % toàn sai lệch Y với giá trị trung bình giải thích mơ hình Khi người ta sử dụng 𝑅2 để đo phù hợp hàm hồi quy Đặt: ∑(𝑦𝑖 − 𝑦)2 : TSS – Tổng số bình phương (Total Sum of Squares) ∑(𝑦𝑖 − 𝑦)2 : ESS – Giải thích tổng bình phương (Explained Sum of Squares) ∑ 𝑒𝑖2 : RSS – Tổng bình phương cịn lại (Residual Sum of Squares) Từ ∑ 𝑒𝑖 𝑦𝑖 = 0, 𝑒𝑖 𝑦 = ⇒ ∑ 𝑒𝑖 (𝑦𝑖 − 𝑦) = Từ TSS = ESS + RSS ta chia hai vế cho TSS 𝑅2 = ∑ 𝑒𝑖2 𝐸𝑆𝑆 𝑅𝑆𝑆 ∑(𝑦𝑖 − 𝑦)2 + = + ∑(𝑦𝑖 − 𝑦)2 ∑(𝑦𝑖 − 𝑦)2 𝑇𝑆𝑆 𝑇𝑆𝑆 Ý nghĩa thành phần: + TSS tổng bình phương tất sai lệch giá trị quan sát Yi giá trị trung bình + ESS tổng bình phương tất sai lệch giá trị biến phụ thuộc Y nhận từ hàm hồi quy mẫu giá trị trung bình chúng Phần đo độ xác hàm hồi quy + RSS tổng bình phương tất sai lệch giá trị quan sát Y giá trị nhận từ hàm hồi quy + TSS chia thành phần: phần ESS phần RSS gây + ≤ 𝑅2 ≤ + 𝑅2 cao nghĩa mơ hình ước lượng giải thích mức độ cao biến động biến phụ thuộc 4|Page Giảng viên hướng dẫn: Nguyễn Bá Thi Bài tập lớn Xác suất Thống kê nhóm 19 – lớp L14 + Nếu 𝑅2 = 1, nghĩa đường hồi quy giải thích 100% thay đổi y + Nếu 𝑅2 = 0, nghĩa mơ hình khơng đưa thông tin thay đổi biến phụ thuộc y 1.2.5 Ước lượng khoảng tin cậy kiểm định hệ số hồi quy 1.2.5.1 Ước lượng khoảng giá trị ước lượng khoảng Ước lượng phương sai sai số dựa vào phần dư bình phương tối thiểu Trong k số hệ số có phương trình hồi quy đa biến: 𝜎2 = ∑ 𝑒𝑖2 𝑛−𝑘 + Ước lượng phía ta tìm 𝑡𝛼 (𝑛 − 𝑘) thỏa mãn: 𝑃(−𝑡𝛼 (𝑛 − 𝑘)) ≤ + Khoảng tin cậy − 𝛼 𝛽𝑗 là: 𝑗 − 𝛽𝑗 𝛽 ≤ 𝑃(𝑡𝛼 (𝑛 − 𝑘 )) 𝑆𝑒(𝛽𝑗 ) [𝛽𝑗 − 𝑡𝛼 (𝑛 − 𝑘 )𝑆𝑒(𝛽𝑗 ); 𝛽𝑗 + 𝑡𝛼 (𝑛 − 𝑘 )𝑆𝑒(𝛽𝑗 )] 2 1.2.5.2 Kiểm định giả thiết 𝜷𝒋 Kiểm định biến giải thích có thực ảnh hưởng đến biến phụ thuộc hay không Nói cách khác hệ số hồi quy có ý nghĩa thống kê hay khơng Có thể đưa giả thiết 𝛽𝑗 , chẳng hạn = 𝛽𝑗∗ Nếu giả thiết thì: 𝑇= 𝑗 − 𝛽𝑗 𝛽 ~𝑇(𝑛 − 𝑘) 𝑆𝑒(𝛽𝑗 ) 5|Page Giảng viên hướng dẫn: Nguyễn Bá Thi Bài tập lớn Xác suất Thống kê nhóm 19 – lớp L14 - median(): tính trung vị mẫu - mean(): tính trung bình mẫu - max(): tính GTLN mẫu - min(): tính GTNN mẫu - sd(): tính độ lệch chuẩn mẫu - table(): tạo bảng thống kê biến phân loại - hist(): vẽ biểu đồ tần số biến - boxplot(): vẽ biểu đồ hộp - pairs(): vẽ biểu đồ liên hệ biến - view(): hiển thị giá trị biến - lm(): tính tốn giá trị hệ số hồi quy - summary(): liệt kê giá trị tính tốn mơ hình - anova(): ước tính xem biến phụ thuộc định lượng thay đổi theo - predict(): sử dụng mơ hình phù hợp để báo giá trị phản hồi cho tập mức nhiều biến độc lập phân loại liệu Thực 3.1 Làm rõ liệu 3.1.1 Đọc liệu dataset_Facebook Tong_luot_thich_trang Type => Kieu Category => The_loai Post_Month => Thang_dang Post_Weekday => Ngay_trong_tuan_dang Post_Hour => Gio_dang Paid => Co_phi Lifetime_Post_Total_Reach => Tong_luot_tiep_can Lifetime_Post_Total_Impressions => Tong_lan_hien_thi Lifetime_Engaged_Users => So_nguoi_tuong_tac Lifetime_Post_Consumers => So_nguoi_click Lifetime_Post_Consumptions => So_lan_click Lifetime_Post_Impressions_by_people_who_have_liked_your_Page ⇒ So_luot_tiep_can_voi_nguoi_thich_trang - Lifetime_People_who_have_liked_your_Page_and_engaged_with_yo ur_post ⇒ So_nguoi_thich_trang_tuong_tac_bai_dang - comment => Binh_luan - like => Thich - share => Chia_se - Total_Interactions => Tong_luong_tuong_tac 3.1.3 Làm rõ liệu a) Trung bình, trung vị, độ lệch chuẩn, giá trị nhỏ nhất, giá trị lớn nhất, theo thứ tự 1, 2, 3, 4, - Các biến liên tục là:"Tong_luot_tiep_can", "Tong_lan_hien_thi", "So_nguoi_tuong_tac", "So_nguoi_click", "So_lan_click", "So_lan_hien_thi_voi_nguoi_thich_trang", "So_luot_tiep_can_voi_nguoi_thich_ trang", "So_nguoi_thich_trang_tuong_tac_bai_dang" ,"Binh_luan", "Thich", "Chia_se", "Tong_luong_tuong_tac" 58 | P a g e Giảng viên hướng dẫn: Nguyễn Bá Thi Bài tập lớn Xác suất Thống kê nhóm 19 – lớp L14 - Kết quả: b) Các biến phân loại Kieu, The_loai, Co_phi - Input: - Output: 59 | P a g e Giảng viên hướng dẫn: Nguyễn Bá Thi Bài tập lớn Xác suất Thống kê nhóm 19 – lớp L14 c) Dùng hàm hist() vẽ đồ thị phân phối Tong_luot_tiep_can - Input: - Output: - Nhận xét: Từ đồ thị phân phối biến Tong_luot_tiep_can ta có nhận xét lượt tiếp cận đăng chủ yếu 25000 lượt 60 | P a g e Giảng viên hướng dẫn: Nguyễn Bá Thi Bài tập lớn Xác suất Thống kê nhóm 19 – lớp L14 d) Dùng hàm boxplot() vẽ phân phối biến Tong_luot_tiep_can cho nhóm phân loại - Input: - Output: + Phân phối biến Tong_luot_tiep_can theo biến Kieu: Nhận xét: dựa biểu đồ, tổng lượt tiếp cận ứng với kiểu đăng khác khác nhau, biểu đồ thay đổi theo giá trị biến Kieu, suy ra, Kieu có ảnh hưởng tới Tong_luot_tiep_can + Phân phối biến Tong_luot_tiep_can theo biến The_loai: 61 | P a g e Giảng viên hướng dẫn: Nguyễn Bá Thi Bài tập lớn Xác suất Thống kê nhóm 19 – lớp L14 Nhận xét: dựa biểu đồ, tổng lượt tiếp cận đăng ứng với thể loại khác khác nhau, biểu đồ thay đổi theo giá trị biến The_loai, suy ra, The_loai có ảnh hưởng tới Tong_luot_tiep_can + Phân phối biến Tong_luot_tiep_can theo biến Co_phi: 62 | P a g e Giảng viên hướng dẫn: Nguyễn Bá Thi Bài tập lớn Xác suất Thống kê nhóm 19 – lớp L14 Nhận xét: dựa biểu đồ, tổng lượt tiếp cận đăng có trả phí khơng trả phí khác nhau, biểu đồ thay đổi theo giá trị biến Co_phi, suy ra, Co_phi có ảnh hưởng tới Tong_luot_tiep_can e) Dùng lệnh pairs() vẽ phân phối biến Tong_luot_tiep_can theo biến Thang_dang, Ngay_trong_tuan_dang, Gio_dang: - Input: - Output: + Phân phối biến Tong_luot_tiep_can theo biến Thang_dang: Nhận xét: Phần lớn đăng tháng có số lượt tiếp cận tương đương nhau, khơng có thay đổi nhiều tháng + Phân phối biến Tong_luot_tiep_can theo biến Ngay_trong_tuan_dang: 63 | P a g e Giảng viên hướng dẫn: Nguyễn Bá Thi Bài tập lớn Xác suất Thống kê nhóm 19 – lớp L14 Nhận xét: Gần khơng có thay đổi số lượt tiếp cận đăng ngày khác tuần + Phân phối biến Tong_luot_tiep_can theo biến Gio_dang: Nhận xét: Số lượt tiếp cận cao chủ yếu vào 2-3h 10-14h 3.2 Mơ hình liệu 64 | P a g e Giảng viên hướng dẫn: Nguyễn Bá Thi Bài tập lớn Xác suất Thống kê nhóm 19 – lớp L14 3.2.1 Xây dựng mơ hình hồi quy tuyến tính a) Xét mơ hình hồi quy tuyến tính gồm biến Tong_luot_tiep_can biến phụ thuộc tất biến lại biến độc lập: - Input: - Output: Tong_luot_tiep_can= -6607.5144+0.325*Tong_lan_hien_thi – 1515.3414*Kieu + 30.0568*So_nguoi_tuong_tac22.8444*So_nguoi_click 9.1263*So_nguoi_thich_trang_tuong_tac_bai_dang 8.1681*Binh_luan -17.8887*Thich + 12.0575*Chia_se +0.1232* Tong_luot_thich_trang 0.3511*So_lan_hien_thi_voi_nguoi_thich_trang 0.1413*So_lan_click + 1.5707*So_luot_tiep_can_voi_nguoi_thich_trang – 564.7033*Thang_dang -19.5202*Ngay_trong_tuan_dang +31.7427*Gio_dang -257.6671*Co_phi- 572.7431*The_loai b) Loại bỏ liệu có mức tin cậy dưới: - Input: summary(M) - Output: 65 | P a g e Giảng viên hướng dẫn: Nguyễn Bá Thi Bài tập lớn Xác suất Thống kê nhóm 19 – lớp L14 + Ta loại bỏ biến khơng có ý nghĩa với mức tin cậy 0.05 là: Binh_luan, Chia_se, So_lan_click, Ngay_trong_tuan_dang, Gio_dang, Co_phi, The_loai + Ta loại thêm biến khơng có ý nghĩa với mức tin cậy 0.01 là: Thang_dang, Tong_luot_thich_trang, Thich, Tong_lan_hien_thi c) Xét mơ hình tuyến tính với biến Tong_luot_tiep_can với mơ hình: M1: Có tất biến độc lập M2: Mơ hình khơng có biến Binh_luan, Chia_se, So_lan_click, Ngay_trong_tuan_dang, Gio_dang, Co_phi, The_loai M3: Tương tự M2 khơng có biến Thang_dang, Tong_luot_thich_trang, Thich, Tong_lan_hien_thi - Input: - Output: 66 | P a g e Giảng viên hướng dẫn: Nguyễn Bá Thi Bài tập lớn Xác suất Thống kê nhóm 19 – lớp L14 So sánh tính hợp lí ba mơ hình phân tích ANOVA, từ kết ta chọn mơ hình mơ hình hợp lí với độ tin cậy 99% - M3:  Từ ta có: Tong_luot_tiep_can =4120+14.58*So_nguoi_tuong_tac - 1707*Kieu 1.049*So_nguoi_click 21.50*So_nguoi_thich_trang_tuong_tac_bai_dang 0.05424*So_lan_hien_thi_voi_nguoi_thich_trang + 2.480*So_luot_tiep_can_voi_nguoi_thich_trang - summary(M3) 67 | P a g e Giảng viên hướng dẫn: Nguyễn Bá Thi Bài tập lớn Xác suất Thống kê nhóm 19 – lớp L14 d) Đồ thị biểu diễn sai số hồi quy giá trị dự báo: - Input: plot(M3) - Output: - Ý nghĩa: + Fitted values giá trị dự báo số lượt tiếp cận đăng (Tong_luot_tiep_can) phụ thuộc vào biến cịn lại theo phương trình câu b + Residuals sai số hồi quy tức giá trị chênh lệch thực tế dự báo 68 | P a g e Giảng viên hướng dẫn: Nguyễn Bá Thi Bài tập lớn Xác suất Thống kê nhóm 19 – lớp L14 - Nhận xét: Vùng phổ biến số lượt tiếp cận đăng khoảng từ 0-2500 Trong vùng này, số lượt tiếp cận đăng nằm xung quanh đường hồi quy tuyến tính, nhiên, giá trị Residuals tương đối đáng kể, khoảng -25000 đến gần 50000, cho thấy dự đoán theo mơ hình M3 chưa ổn định 3.2.2 Dự đốn so sánh khoảng tin cậy a) Dự đoán số lượt tiếp cận đăng với (trung bình biến, Kieu =2) (max biến, Kieu=4): - Input: - Output: b) So sánh khoảng tin cậy: - Input: - Output: - Nhận xét: + Khoảng tin cậy dự đoán độ khơng đảm bảo xung quanh giá trị trung bình + Xét khoảng tin cậy 99% số lượt tiếp cận đăng thuộc tính mean nằm khoảng 12917.72 đến 18262.13 69 | P a g e Giảng viên hướng dẫn: Nguyễn Bá Thi Bài tập lớn Xác suất Thống kê nhóm 19 – lớp L14 + Xét khoảng tin cậy 99% số lượt tiếp cận đăng thuộc tính max nằm khoảng 99293.17 đến 152227.81 + Vậy giao động thuộc tính mean nhỏ thuộc tính max (5344.407

Ngày đăng: 20/09/2023, 15:39

Xem thêm:

w