Tập tin gia_nha.csv chứa thông tin về giá bán ra thị trường (đơn vị đô la) của 21613 ngôi nhà ở quận King nước Mỹ trong khoảng thời gian từ tháng 52014 đến 52015. Bên cạnh giá nhà, dữ liệu còn bao gồm các thuộc tính mô tả chất lượng ngôi nhà. Dữ liệu gốc được cung cấp tại
ĐẠI HỌC QUỐC GIA THÀNH PHỐ HỒ CHÍ MINH TRƯỜNG ĐẠI HỌC BÁCH KHOA BÁO CÁO BÀI TẬP LỚN MÔN HỌC XÁC SUẤT THỐNG KÊ HỌC KỲ 211 NHÓM: 10 - ĐỀ TÀI: 05 GIẢNG VIÊN HƯỚNG DẪN: Nguyễn Đình Huy DANH SÁCH NHÓM: STT Họ tên Phạm Văn Lâm Trần Hoàng lâm MSSV Lớp Ngành học 2013604 L08 Kỹ thuật xây dựng 2013605 L08 Bảo dưỡng công nghiệp Họ tên Nội dung Phạm Văn BÀI LâmTẬP LỚN XÁC SUẤT 3-5,THỐNG 19 KÊ Nhiệm vụ - PHÂN CÔNG LÀM VIỆC Trần Hoàng lâm Dương Tuấn Kiệt Trần Huỳnh Nhật Minh Nhóm 10 Tính thớng kê mơ tả cho các biến X1, X2, X3, X4 ,Y1, Y - Lập bảng thống kê số lượng X5, X6, X7, X8 - Vẽ biểu đồ histogram thể phân phối cho biến Y1 Y2 - Thực kiểm định so sánh trung bình mức thu nhiệt toả nhiệt của các nhà - Vẽ biểu đồ boxplot thể phân phối của Y1, Y2 theo phân loại của biến X5 - Vẽ biểu đồ boxplot thể phân phối của Y1, Y2 theo phân loại của biến X6 - Vẽ biểu đồ boxplot thể phân phối của Y1, Y2 theo phân loại của biến X7 - Vẽ biểu đồ boxplot thể phân phối của Y1, Y2 theo phân loại của biến X8 - Vẽ biểu đồ phân tán thể phân phối của Y1, Y2 theo biến X1 - Vẽ biểu đồ phân tán thể phân phối của Y1, Y2 theo biến X2 - Vẽ biểu đồ phân tán thể phân phối của Y1, Y2 theo biến X3 - Vẽ biểu đồ phân tán thể phân phối của Y1, Y2 theo biến X4 - Xây dựng mơ hình hời quy tún tính model_1 - Xây dựng mơ hình hời quy tún tính model_2 - Vẽ đồ thị phân tích thặng dư để kiểm tra các giả định của mơ hình - Tính trung bình Y1 Y2 6-9 10-13 14-18 - Vẽ biểu đồ boxplot so sánh phân phối Y1 Y2 BÀI TẬP LỚN XÁC SUẤT THỐNG KÊ Nhóm 10 Mục lục HOẠT ĐỘNG 1: 1.1 Đề 1.2 Thực liệu (Import data) 1.2.1 Đọc 1.2.2 Làm liệu (Data cleaning) 1.2.3 Làm rõ liệu: (Data visualization) 1.2.4 Mơ hình hời quy tún tính: Sử dụng mơ hình hổi quy tún tính phù hợp để đánh giá các nhân tố tác động đến mức độ thu nhiệt của các nhà 14 1.2.5 So sánh trung bình mức thu nhiệt toả nhiệt của các nhà 18 Hoạt động 2.1 Đề Giảng viên hướng dẫn: Nguyễn Đình Huy 5 6 6 20 20 Trang BÀI TẬP LỚN XÁC SUẤT THỐNG KÊ Nhóm 10 Danh sách hình vẽ 10 11 12 13 14 15 16 17 18 19 code R kết đọc liệu xem dòng của liệu code R kết kiểm tra liệu khuyết code R kết tính thống kê mô tả cho các biến X1, X2, X3, X4, Y1, Y code R kết lập bảng thống kê số lượng cho phân loại X5, X6, X7, X8 code R kết vẽ biểu đồ histogram thể phân phối cho biến Y1 Y2 code R kết vẽ biểu đồ boxplot thể phân phối của Y1, Y2 theo phân loại của biến X5 code R kết vẽ biểu đồ boxplot thể phân phối của Y1, Y2 theo phân loại của biến X6 code R kết vẽ biểu đồ boxplot thể phân phối của Y1, Y2 theo phân loại của biến X7 code R kết vẽ biểu đồ boxplot thể phân phối của Y1, Y2 theo phân loại của biến X8 code R kết vẽ biểu đồ phân tán thể phân phối của Y1, Y2 theo biến X1 code R kết vẽ biểu đồ phân tán thể phân phối của Y1, Y2 theo biến X2 code R kết vẽ biểu đồ phân tán thể phân phối của Y1, Y2 theo biến X3 code R kết vẽ biểu đồ phân tán thể phân phối của Y1, Y2 theo biến X4 code R kết xây dựng mơ hình hời quy tún tính model_1 code R kết xây dựng mơ hình hời quy tún tính model_2 code R kết vẽ đồ thị phân tích thặng dư để kiểm tra các giả định của mơ hình code R kết thực tính trung bình Y1 Y2 code R kết vẽ biểu đồ boxplot so sánh phân phối Y1 Y2 code R kết thực kiểm định so sánh trung bình mức thu nhiệt toả nhiệt của các ngơi nhà Giảng viên hướng dẫn: Nguyễn Đình Huy 10 11 12 12 13 13 14 15 16 18 18 19 Trang BÀI TẬP LỚN XÁC SUẤT THỐNG KÊ 1.3 1.3.1 Thực Nhóm 10 ĐỀ TÀI 05 Đọc liệu (Import data) 1Đọc H liệu OẠT ĐỘNG 1: "heat_data.xlsx" 1.1 Đề Hình 1: codeđược R vàthu kếtthập với mục đọc tiêu liệu vàgiá xem dịng tớ của Tập tin "heat_data.xlsx" đánh các3 nhân ảnh hưởng đếnliệu mức độ thu nhiệt toả nhiệt của các nhà Các biến chính liệu: • X1: Độ nhỏ gọn • X2: Diện tích bề mặt • X3: Diện tích tường • X4: Khu vực mái nhà • X5: Chiều cao tổng thể • X6: Định hướng • X7: Khu vực dán kính • X8: Phân bớ khu vực dán kính Thơng tin các có Mứcbiến độ thu nhiệt liệu: • Y1: X1:•Độ nhỏ gọnđộtương đới Y2: Mức toả nhiệt X2: Diện tích bề mặt (m ) Các bước thực hiện: X3: Diện tích tường (m ) Đọc liệu (Import data): "heat_data.xlsx" X4: Diện tíchdữmái (m2 )cleaning): NA (dữ liệu khuyết) Làm liệunhà (Data X5: Chiều caoliệu: tổng(Data thể (m) Làm rõ visualization) X6: (a) Định hướngđổi (2: biến Bắc,(nếu 3: Đông, 4: Nam, 5: Tây) Chuyển cần thiết) X7: (b) DiệnThống tích kính (0%, 10%, 25%, so với diện tích sàn) kê mô tả: dùng thống40% kê mẫu dùng đồ thị X8: Phân bố khu vực dán kính (1: Đồng nhất, 2: Bắc, 3: Đông, Nam, 5: phù Tây)hợp để đánh giá các Mơ hình hời quy tún tính: Sử dụng mơ hình hổi quy 4: tuyến tính Y1: thu nhiệt (kWđộ h) thu nhiệt của các nhà nhânMức tố tácđộđộng đến mức Y2: Mức độ toả nhiệt (kW h) t.test: Đề xuất kiểm định phù hợp để so sánh trung bình mức thu nhiệt toả nhiệt của các ngơi nhà 1.3.2 Làm liệu (Data cleaning) Kiểm tra liệu khuyết Hình 2: code R kết kiểm tra liệu khuyết Nhận xét: Dựa kết quả, khơng có liệu khút cần xử lý 3.3 Làm rõ liệu: (Data visualization) Tính các giá trị thớng kê mơ tả (trung bình, độ lệch chuẩn, min, max, trung vị, các phân vị) cho các biến X1, X2, X3, X4, Y1, Y2 Xuất kết dạng bảng Giảng viên hướng dẫn: Nguyễn Đình Huy Trang 65 BÀI TẬP LỚN XÁC SUẤT THỐNG KÊ 1.3 Nhóm 10 Thực Hình 3: code R kết tính thống kê mô tả cho các biến X1, X2, X3, X4, Y1, Y 1.3.1 Đọc liệu (Import data) Đọc liệu "heat_data.xlsx" Hình 1: code R kết đọc liệu xem dịng của liệu Thơng tin các biến có liệu: Lập bảng thớng kê sớ lượng cho phân loại X5, X6, X7, X8 X1: Độ nhỏ gọn tương đối X2: Diện tích bề mặt (m2 ) codetường R và(m kết2 ) lập bảng thống kê số lượng cho phân loại X5, X6, X7, X8 X3:Hình Diện4:tích X4: Diện tích mái nhà (m2 ) X5: Chiều cao tổng thể (m) X6: Định hướng (2: Bắc, 3: Đông, 4: Nam, 5: Tây) X7: Diện tích kính (0%, 10%, 25%, 40% so với diện tích sàn) X8: Phân bố khu vực dán kính (1: Đồng nhất, 2: Bắc, 3: Đông, 4: Nam, 5: Tây) Y1: Mức độ thu nhiệt (kW h) Y2: Mức độ toả nhiệt (kW h) 1.3.2 Làm liệu (Data cleaning) Kiểm tra liệu khuyết Hình 2: code R kết kiểm tra liệu khuyết Nhận xét: Dựa kết quả, khơng có liệu khút cần xử lý Vẽ biểuLàm đồ histogram thể(Data visualization) phân phối cho biến Y1 Y2 3.3 rõ liệu: Tính các giá trị thống kê mô tả (trung bình, độ lệch chuẩn, min, max, trung vị, các phân vị) cho các biến X1, X2, X3, X4, Y1, Y2 Xuất kết dạng bảng Giảng viên hướng dẫn: Nguyễn Đình Huy Trang 76 BÀI TẬP LỚN XÁC SUẤT THỐNG KÊ Nhóm 10 Hình 5: 3: code R kết vẽ tínhbiểu thống đồ kê histogram mô tả cho thể các hiệnbiến phân X1, phối X2,cho X3,biến X4,Y1 Y1, YY2 Lập bảng thống kê số lượng cho phân loại X5, X6, X7, X8 Hình 4: code R kết lập bảng thống kê số lượng cho phân loại X5, X6, X7, X8 Vẽ biểu đồ boxplot thể phân phối của Y1, Y2 theo phân loại của biến X5 Hình 6: code R kết vẽ biểu đồ boxplot thể phân phối của Y1, Y2 theo phân loại của biến X5 Vẽ biểu đồ histogram thể phân phối cho biến Y1 Y2 Giảng viên hướng dẫn: Nguyễn Đình Huy Trang 87 BÀI TẬP LỚN XÁC SUẤT THỐNG KÊ Nhóm 10 Nhận xét: Dựa biểu đờ, ta có thể thấy mức độ thu nhiệt toả nhiệt của các ngơi nhà có chiều Hình codesoRvới kết biểu ta đờ có histogram thể phân Y1 nhân Y2tớ ảnh cao 7m cao5: có chiều caovẽ3.5m thể dự đoán chiều caophối tổngcho thể biến hưởng đến mức độ thu nhiệt hay toả nhiệt Vẽ biểu đồ boxplot thể phân phối của Y1, Y2 theo phân loại của biến X6 Hình 7: code R kết vẽ biểu đồ boxplot thể phân phối của Y1, Y2 theo phân loại của biến X6 Vẽ biểu đồ boxplot thể phân phối của Y1, Y2 theo phân loại của biến X5 Hình 6: code R kết vẽ biểu đồ boxplot thể phân phối của Y1, Y2 theo phân loại của biến X5 Nhận xét: Dựa biểu đờ, ta có thể thấy các ngơi nhà có định hướng khác mức độ thu nhiệt toả nhiệt tương đới Ta có thể dự đoán định hướng nhân tố không ảnh hưởng đến mức độ thu nhiệt hay toả nhiệt Vẽ biểu đồ boxplot thể phân phối của Y1, Y2 theo phân loại của biến X7 Giảng viên hướng dẫn: Nguyễn Đình Huy Trang 98 BÀI TẬP LỚN XÁC SUẤT THỐNG KÊ Nhóm 10 Nhận xét: Dựa biểu đờ, ta có thể thấy mức độ thu nhiệt toả nhiệt của các ngơi nhà có chiều Hình 8: cao codehơn R vàsokết vẽ cao biểu3.5m đồ boxplot thể dự hiệnđoán phânchiều phối cao của tổng Y1, Y2 phân loạitốcủa cao 7m vớiquả có chiều ta có thể thể theo nhân ảnh biến X7 hưởng đến mức độ thu nhiệt hay toả nhiệt Vẽ biểu đồ boxplot thể phân phối của Y1, Y2 theo phân loại của biến X6 Hình 7: code R kết vẽ biểu đồ boxplot thể phân phối của Y1, Y2 theo phân loại của biến X6 Nhận xét: Dựa biểu đờ, ta có thể thấy các ngơi nhà có diện tích kính cao (so với diện tích sàn) phân bớ mức độ thu nhiệt toả nhiệt cao Ta có thể dự đoán diện tích kính nhân tố ảnh hưởng đến mức độ thu nhiệt hay toả nhiệt Vẽ biểu đồ boxplot thể phân phối của Y1, Y2 theo phân loại của biến X8 Nhận xét: Dựa biểu đờ, ta có thể thấy các ngơi nhà có định hướng khác mức độ thu nhiệt toả nhiệt tương đối Ta có thể dự đoán định hướng nhân tố không ảnh hưởng đến mức độ thu nhiệt hay toả nhiệt Vẽ biểu đồ boxplot thể phân phối của Y1, Y2 theo phân loại của biến X7 Giảng viên hướng dẫn: Nguyễn Đình Huy Trang Trang10 BÀI TẬP LỚN XÁC ŚT THỐNG KÊ Nhóm 10 Hình 9: 8: code R kết vẽ biểu đồ boxplot thể phân phối của Y1, Y2 theo phân loại của biến X8 X7 Nhận xét: Dựa biểu đờ, các khucóvực có cao phân(so bớvới mức độ tích thu ta cóngơi thể nhà thấycó cácphân ngơibớnhà diệndán tíchkính kínhđều diện nhiệt phân toả nhiệt tương riêng trường nhàđoán khơng sàn) bớ mức độ đới thu nhiệtnhau, toả nhiệt hợp cao Ta có ngơi thể dự diệndán tíchkính kínhthìlàphân bớ mức độ thu nhiệtđến mức toả nhiệt thấp hơn.hay Ta toả có nhiệt thể đoán việc dán kính hay khơng có thể ảnh nhân tớ ảnh hưởng độ thu nhiệt hưởng đến phân bố mức độ thu nhiệt toả nhiệt, nhiên việc phân bố khu vực dán kính có thể khơng mức độ của thu nhiệt theo toả nhiệt Vẽ biểuảnh đồ hưởng boxplotđến thểphân hiệnbố phân phối Y1, Y2 phân loại của biến X8 Vẽ biểu đồ phân tán thể phân phối của Y1, Y2 theo biến X1 Giảng viên hướng dẫn: Nguyễn Đình Huy Trang 11 10 BÀI TẬP LỚN XÁC SUẤT THỐNG KÊ Nhóm 10 Hình Hình9:10: code code RR và kếtkết quảquả khikhi vẽ vẽ biểu biểu đồ đồ boxplot phân tán thể thể hiệnhiện phânphân phốiphối của của Y1, Y1, Y2 theo Y2 theo phânbiến loạiX1 của biến X8 Vẽ biểu đồ phân tán thể phân phối của Y1, Y2 theo biến X2 Nhận xét: Dựa biểu đờ, các ngơi nhà có phân bớ khu vực dán kính có phân bớ mức độ thu Hìnhvà 11:toả code R kết vẽ biểuriêng đồ phân tán hợp thể phân phối Y1, Y2 X2 nhiệt nhiệt tương đối nhau, trường nhàcủa khơng dán theo kínhbiến phân bớ mức độ thu nhiệt toả nhiệt thấp Ta có thể đoán việc dán kính hay khơng có thể ảnh hưởng đến phân bố mức độ thu nhiệt toả nhiệt, nhiên việc phân bớ khu vực dán kính có thể không ảnh hưởng đến phân bố mức độ thu nhiệt toả nhiệt Vẽ biểu đồ phân tán thể phân phối của Y1, Y2 theo biến X1 Giảng viên hướng dẫn: Nguyễn Đình Huy Trang 12 11 BÀI TẬP LỚN XÁC SUẤT THỐNG KÊ Nhóm 10 Vẽ biểu đồ phân tán thể phân phối của Y1, Y2 theo biến X3 Hình 10: code R kết vẽ biểu đồ phân tán thể phân phối của Y1, Y2 theo biến X1 Hình 12: code R kết vẽ biểu đồ phân tán thể phân phối của Y1, Y2 theo biến X3 Vẽ biểu đồ phân tán thể phân phối của Y1, Y2 theo biến X2 Vẽ biểu đồ phân tán thể phân phới của Y1, Y2 theo biến X4 Hình 11: code R kết vẽ biểu đồ phân tán thể phân phối của Y1, Y2 theo biến X2 Hình 13: code R kết vẽ biểu đồ phân tán thể phân phối của Y1, Y2 theo biến X4 Giảng viên hướng dẫn: Nguyễn Đình Huy Trang 13 12 BÀI TẬP LỚN XÁC SUẤT THỐNG KÊ Nhóm 10 Nhận Vẽ biểu xét:đờTừ phân các tán đờ thể thị phân phân tán, taphới có thể củanhận Y1, xét Y2 các theobiến biếnX1, X3 X2, X3, X4 ta nhận thấy chưa thực rõ mối quan hệ tuyến tính với biến Y1 (hay Y2) Do đó, ta cần xây dựng mơ hình hời quy để đánh giá rõ mối quan hệ các biến lên Y1 (hay Y2) Hình 12: code R kết vẽ biểu đồ phân tán thể phân phối của Y1, Y2 theo biến X3 1.3.4 Mô hình hời quy tún tính: Sử dụng mơ hình hổi quy tuyến tính phù hợp để đánh giá các nhân tố tác động đến mức độ thu nhiệt của các ngơi nhà Ta xây dựng mơ hình hời quy tuyến tính để đánh giá các nhân tố tác động đến mức độ thu nhiệt của các nhà Mơ hình hời quy với với biến phụ thuộc Y1, giả sử các biến độc lập là: X1, X2, X3, X4, X5, X6, X7, X8 Mơ=β0 +β1 ×X1+β2 ×X2+β3 ×X3+β4 ×X4+β5 ×X5+β6 ×X6+β7 ×X7+β8 ×X8hình được sau: Y1 β0 +β1 ×X1+β2 ×X2+β3 ×X3+β4 ×X4+β5 ×X5+β6 ×X6+β7 ×X7+β8 ×X8Xbiểu 1+β2diễn ×X1+β2 ×X2+β3 ×X3+β4 ×X4+β5 ×X5+β6 ×X6+β7 ×X7+β8 ×X8X2+β3 ×X1+β2 ×X2+β3 ×X3+β4 ×X4+β5 ×X5+β6 ×X6+β7 ×X7+β8 ×X8X3+β4 ×X1+β2 ×X2+β3 ×X3+β4 ×X4+β5 ×X5+β6 ×X6+β7 ×X7+β8 ×X8X4+β5 ×X1+β2 ×X2+β3 ×X3+β4 ×X4+β5 ×X5+β6 ×X6+β7 ×X7+β8 ×X8X5+β6 ×X1+β2 ×X2+β3 ×X3+β4 ×X4+β5 ×X5+β6 ×X6+β7 ×X7+β8 ×X8X6+β7 ×X1+β2 ×X2+β3 ×X3+β4 ×X4+β5 ×X5+β6 ×X6+β7 ×X7+β8 ×X8X7+β8 ×X1+β2 ×X2+β3 ×X3+β4 ×X4+β5 ×X5+β6 ×X6+β7 ×X7+β8 ×X8X8 Ta thực ước lượng các hệ số βi , i =β0 +β1 ×X1+β2 ×X2+β3 ×X3+β4 ×X4+β5 ×X5+β6 ×X6+β7 ×X7+β8 ×X8 0, , Hình 14: code R kết xây dựng mơ hình hời quy tún tính model_1 Vẽ biểu đồ phân tán thể phân phối của Y1, Y2 theo biến X4 Hình 13: code R kết vẽ biểu đồ phân tán thể phân phối của Y1, Y2 theo biến X4 Nhận xét: Từ kếtβ1quả phân tích, ta β2 thu=β0 +β1 ×X1+β2 ×X2+β3 ×X3+β4 ×X4+β5 ×X5+β6 ×X6+β7 ×X7+β8 ×X8được: β0 =β0 +β1 ×X1+β2 ×X2+β3 ×X3+β4 ×X4+β5 ×X5+β6 ×X6+β7 ×X7+β8 ×X8 84.013418; =β0 +β1 ×X1+β2 ×X2+β3 ×X3+β4 ×X4+β5 ×X5+β6 ×X6+β7 ×X7+β8 ×X8 −64.773432; −0.087289; β3 =β0 +β1 ×X1+β2 ×X2+β3 ×X3+β4 ×X4+β5 ×X5+β6 ×X6+β7 ×X7+β8 ×X8 0.060813; β4 =β0 +β1 ×X1+β2 ×X2+β3 ×X3+β4 ×X4+β5 ×X5+β6 ×X6+β7 ×X7+β8 ×X8 N A β5 =β0 +β1 ×X1+β2 ×X2+β3 ×X3+β4 ×X4+β5 ×X5+β6 ×X6+β7 ×X7+β8 ×X8 4.169954; β6 =β0 +β1 ×X1+β2 ×X2+β3 ×X3+β4 ×X4+β5 ×X5+β6 ×X6+β7 ×X7+β8 ×X8 −0.023330; β7 =β0 +β1 ×X1+β2 ×X2+β3 ×X3+β4 ×X4+β5 ×X5+β6 ×X6+β7 ×X7+β8 ×X8 19.932736; β8 =β0 +β1 ×X1+β2 ×X2+β3 ×X3+β4 ×X4+β5 ×X5+β6 ×X6+β7 ×X7+β8 ×X8 0.203777 sớ liên quan, có thể giải thích X4 biến phụ thuộc theo các biến lại (diện tích mái nhà có thể phụ thuộc vào diện tích tường hoặc diện tích bề mặt, ) Do ta sẽ loại bỏ X4 khỏi mô hình hời quy Như vậy, đường thẳng hời quy ước lượng cho phương trình sau: Y1 =β0 +β1 ×X1+β2 ×X2+β3 ×X3+β4 ×X4+β5 ×X5+β6 ×X6+β7 ×X7+β8 ×X8 84.013418 − 64.773432 ×X1+β2 ×X2+β3 ×X3+β4 ×X4+β5 ×X5+β6 ×X6+β7 ×X7+β8 ×X8 X1 − 0.087289 ×X1+β2 ×X2+β3 ×X3+β4 ×X4+β5 ×X5+β6 ×X6+β7 ×X7+β8 ×X8 X2 + 0.060813 ×X1+β2 ×X2+β3 ×X3+β4 ×X4+β5 ×X5+β6 ×X6+β7 ×X7+β8 ×X8 X3 + 4.169954 ×X1+β2 ×X2+β3 ×X3+β4 ×X4+β5 ×X5+β6 ×X6+β7 ×X7+β8 ×X8 X5 − 0.023330 ×X1+β2 ×X2+β3 ×X3+β4 ×X4+β5 ×X5+β6 ×X6+β7 ×X7+β8 ×X8 X6 + 19.932736 ×X1+β2 ×X2+β3 ×X3+β4 ×X4+β5 ×X5+β6 ×X6+β7 ×X7+β8 ×X8 X7 + 0.203777 ×X1+β2 ×X2+β3 ×X3+β4 ×X4+β5 ×X5+β6 ×X6+β7 ×X7+β8 ×X8 X8 Ta thấy p-value tương ứng với thống kê F bé 2.2e − 16, có ý nghĩa cao Điều rằng, ít biến dự báo mơ hình có ý nghĩa giải thích cao cho biến mức độ thu nhiệt Y1 Giảng viên hướng dẫn: Nguyễn Đình Huy Trang 14 13 BÀI TẬP LỚN XÁC SUẤT THỐNG KÊ Nhóm 10 Ta Nhận xét:nhận Từ các thấyđờrằng thị p-value phân tán, của ta có thể toánnhận kiểmxétđịnh cácgiả biến thuyết X1, X2, H0 : Hệ X3, số X4ứng ta nhận với X6 thấy khơng chưacó ý nghĩa (β6quan =β0 +β1 ×X1+β2 ×X2+β3 ×X3+β4 ×X4+β5 ×X5+β6 ×X6+β7 ×X7+β8 ×X8 0) hệ 0.80548 chobiến thấyY1 X6Donày ý nghĩa đới hình với mơ thực sựthớng rõ vềkêmới tún tính với (haybiến Y2) đó,khơng ta cầncó xây dựng mơ hời hình quy hời quy ta xây dựng, có các thể loại khỏi mơ hình hời quy để đánh giávừa rõ mối quan hệ tagiữa biếnbỏ lênbiến Y1 X6 (hayraY2) Ta dựnghình lại hời mơ quy hìnhtún hời quy tính với mơ biếnhình phụ hổi thuộc Y1, 1.3.4xây Mô tính:tuyến Sử dụng quylàtuyến tínhcác phùbiến hợpđộc lập lúc là: X1, X2, X3, X7, X8 để đánh giá X5, các nhân tố tác động đến mức độ thu nhiệt của các nhà Ta xây dựng mơ hình hời quy tún tính để đánh giá các nhân tố tác động đến mức độ thu Hình 15:nhà code R kết xây dựng mơ hình hời quy tún tính model_2 nhiệt của các ngơi Mơ hình hời quy với với biến phụ thuộc Y1, giả sử các biến độc lập là: X1, X2, X3, X4, X5, X6, X7, X8 Mô=β0 +β1 ×X1+β2 ×X2+β3 ×X3+β4 ×X4+β5 ×X5+β6 ×X6+β7 ×X7+β8 ×X8hình được sau: Y1 β0 +β1 ×X1+β2 ×X2+β3 ×X3+β4 ×X4+β5 ×X5+β6 ×X6+β7 ×X7+β8 ×X8Xbiểu 1+β2diễn ×X1+β2 ×X2+β3 ×X3+β4 ×X4+β5 ×X5+β6 ×X6+β7 ×X7+β8 ×X8X2+β3 ×X1+β2 ×X2+β3 ×X3+β4 ×X4+β5 ×X5+β6 ×X6+β7 ×X7+β8 ×X8X3+β4 ×X1+β2 ×X2+β3 ×X3+β4 ×X4+β5 ×X5+β6 ×X6+β7 ×X7+β8 ×X8X4+β5 ×X1+β2 ×X2+β3 ×X3+β4 ×X4+β5 ×X5+β6 ×X6+β7 ×X7+β8 ×X8X5+β6 ×X1+β2 ×X2+β3 ×X3+β4 ×X4+β5 ×X5+β6 ×X6+β7 ×X7+β8 ×X8X6+β7 ×X1+β2 ×X2+β3 ×X3+β4 ×X4+β5 ×X5+β6 ×X6+β7 ×X7+β8 ×X8X7+β8 ×X1+β2 ×X2+β3 ×X3+β4 ×X4+β5 ×X5+β6 ×X6+β7 ×X7+β8 ×X8X8 Ta thực ước lượng các hệ số βi , i =β0 +β1 ×X1+β2 ×X2+β3 ×X3+β4 ×X4+β5 ×X5+β6 ×X6+β7 ×X7+β8 ×X8 0, , Hình 14: code R kết xây dựng mơ hình hời quy tún tính model_1 Nhận xét: Như mơ hình hời quy tún tính ảnh hưởng của các nhân tố lên mức độ thu nhiệt được cho bởi: Y =β0 +β1 ×X1+β2 ×X2+β3 ×X3+β4 ×X4+β5 ×X5+β6 ×X6+β7 ×X7+β8 ×X8 83.931762 − 64.773432 ×X1+β2 ×X2+β3 ×X3+β4 ×X4+β5 ×X5+β6 ×X6+β7 ×X7+β8 ×X8 X1 − 0.087289 ×X1+β2 ×X2+β3 ×X3+β4 ×X4+β5 ×X5+β6 ×X6+β7 ×X7+β8 ×X8 X2 + 0.060813 ×X1+β2 ×X2+β3 ×X3+β4 ×X4+β5 ×X5+β6 ×X6+β7 ×X7+β8 ×X8 X3 + 4.169954 ×X1+β2 ×X2+β3 ×X3+β4 ×X4+β5 ×X5+β6 ×X6+β7 ×X7+β8 ×X8 X5 + 19.932736 ×X1+β2 ×X2+β3 ×X3+β4 ×X4+β5 ×X5+β6 ×X6+β7 ×X7+β8 ×X8 X7 + 0.203777 ×X1+β2 ×X2+β3 ×X3+β4 ×X4+β5 ×X5+β6 ×X6+β7 ×X7+β8 ×X8 X8 Hệ số xác định hiệu chỉnh (Adjusted R-squared): R2 hiệu chỉnh =β0 +β1 ×X1+β2 ×X2+β3 ×X3+β4 ×X4+β5 ×X5+β6 ×X6+β7 ×X7+β8 ×X8 0.9155 nghĩa 91.55% biến thiên mức độ thu nhiệt Y1 được giải thích các biến độc lập (X1, X2, X3, X5, X7, X8) Để xét ảnh hưởng cụ thể của biến độc lập, ta xét các hệ số hồi quy (βi ) p-value tương ứng Ta thấy p-value tương ứng với các biến X3, X5, X7 bé 2e − 16, điều nói lên ảnh biếntích, có ýtanghĩa cao lên biến độ thuβ4nhiệt Nhận xét:hưởng Từ kếtcủa phân thu=β0 +β1 ×X1+β2 ×X2+β3 ×X3+β4 ×X4+β5 ×X5+β6 ×X6+β7 ×X7+β8 ×X8được: β0 =β0 +β1 ×X1+β2 ×X2+β3 ×X3+β4 ×X4+β5 ×X5+β6 ×X6+β7 ×X7+β8 ×X8 84.013418; β1quả =β0 +β1 ×X1+β2 ×X2+β3 ×X3+β4 ×X4+β5 ×X5+β6 ×X6+β7 ×X7+β8 ×X8ba−64.773432; β2 −0.087289; β3 =β0 +β1 ×X1+β2 ×X2+β3 ×X3+β4 ×X4+β5 ×X5+β6 ×X6+β7 ×X7+β8 ×X8 mức 0.060813; =β0 +β1 ×X1+β2 ×X2+β3 ×X3+β4 ×X4+β5 ×X5+β6 ×X6+β7 ×X7+β8 ×X8 N Y1 A β5 =β0 +β1 ×X1+β2 ×X2+β3 ×X3+β4 ×X4+β5 ×X5+β6 ×X6+β7 ×X7+β8 ×X8 4.169954; β6 =β0 +β1 ×X1+β2 ×X2+β3 ×X3+β4 ×X4+β5 ×X5+β6 ×X6+β7 ×X7+β8 ×X8 −0.023330; β7 =β0 +β1 ×X1+β2 ×X2+β3 ×X3+β4 ×X4+β5 ×X5+β6 ×X6+β7 ×X7+β8 ×X8 19.932736; β8 =β0 +β1 ×X1+β2 ×X2+β3 ×X3+β4 ×X4+β5 ×X5+β6 ×X6+β7 ×X7+β8 ×X8 0.203777 Mặt khác, hệ số hồi quy của biến độc lập có thể được xem ảnh hưởng trung bình lên biến phụ thuộc Y1 tăng đơn vị của biến dự báo đó, giả sử các biến dự báo khác khơng Cụcó thể,thểhệgiải số hồi quy ứng với biến X1 β1 =β0 +β1 ×X1+β2 ×X2+β3 ×X3+β4 ×X4+β5 ×X5+β6 ×X6+β7 ×X7+β8 ×X8 −64.773432 với độ nhỏ gọn tăng số liênđổi quan, đơn vị, ta có thể kỳ vọng mức độ thu nhiệt của ngồi nhà sẽ giảm 64.773432 đơn vị mặt trung bình thích X4 biến phụ thuộc theo các biến lại (diện tích mái nhà có thể phụ thuộc vào diện (giả sử các diện biến độc lập khác thay Hệ số hồi quy ứngthu vớinhiệt biếnsẽ X2 β2 đi=β0 +β1 ×X1+β2 ×X2+β3 ×X3+β4 ×X4+β5 ×X5+β6 ×X6+β7 ×X7+β8 ×X8 0.087289 - 0.087289 tích tường mặt, .không ) Do vậythể tađổi) sẽ vọng loại bỏ X4mức khỏi mơ hình hời quy khihoặc tăng m2tích diệnbề tích bề mặt, ta có kỳ độ giảm đơn vị mặt trung bình (giả sử các biến độc lập khác không thay đổi) Tương tự đới với các Như cịn vậy, lại đường thẳng hời quy ước lượng cho phương trình sau: biến Y1 =β0 +β1 ×X1+β2 ×X2+β3 ×X3+β4 ×X4+β5 ×X5+β6 ×X6+β7 ×X7+β8 ×X8 84.013418 − 64.773432 ×X1+β2 ×X2+β3 ×X3+β4 ×X4+β5 ×X5+β6 ×X6+β7 ×X7+β8 ×X8 X1 − 0.087289 ×X1+β2 ×X2+β3 ×X3+β4 ×X4+β5 ×X5+β6 ×X6+β7 ×X7+β8 ×X8 X2 + 0.060813 ×X1+β2 ×X2+β3 ×X3+β4 ×X4+β5 ×X5+β6 ×X6+β7 ×X7+β8 ×X8 X3 + 4.169954 ×X1+β2 ×X2+β3 ×X3+β4 ×X4+β5 ×X5+β6 ×X6+β7 ×X7+β8 ×X8 X5 − 0.023330 ×X1+β2 ×X2+β3 ×X3+β4 ×X4+β5 ×X5+β6 ×X6+β7 ×X7+β8 ×X8 X6 + 19.932736 ×X1+β2 ×X2+β3 ×X3+β4 ×X4+β5 ×X5+β6 ×X6+β7 ×X7+β8 ×X8 X7 + 0.203777 ×X1+β2 ×X2+β3 ×X3+β4 ×X4+β5 ×X5+β6 ×X6+β7 ×X7+β8 ×X8 X8 Ta thấy p-value tương ứng với thống kê F bé 2.2e − 16, có ý nghĩa cao Điều rằng, ít biến dự báo mơ hình có ý nghĩa giải thích cao cho biến mức độ thu nhiệt Y1 Giảng viên hướng dẫn: Nguyễn Đình Huy Trang 15 14 BÀI TẬP LỚN XÁC SUẤT THỐNG KÊ Nhóm 10 Ta Kiểm tranhận các giả giả thấy định của p-value mơhình hình củahời bàiquy: toánYkiểm ứng với X6 khơng có ý Nhắc lại các định của mô +β1giả XX1thuyết +.X.X.XβHi.XX : Hệ i =β0định i+εsố i,i=1,.X.X.Xn nghĩa thống kê (β6 =β0 +β1 ×X1+β2 ×X2+β3 ×X3+β4 ×X4+β5 ×X5+β6 ×X6+β7 ×X7+β8 ×X8 0) 0.80548 cho thấy biến X6 khơng có ý nghĩa đới với mơ hình hờiTính quy tún ta vừatính xây của dựng, đómới ta cóquan thể loại bỏ biến mơbiến hìnhphụ hờithuộc quy Y được giả sử + liệu: hệ biến X6 dự báokhỏi X tuyến tính của mô các hình sai sớhời sớ: εi i tính ∼ N(0,σ2) Ta Phương + Sai xâysớdựng cósaiphân lại phới chuẩn quy tuyến với biến phụ thuộc Y1, các biến độc lập lúc là: X1, X2, X3, X5, X7, X8 + + Các sai số εi 1, , εi n độc lập với Hình 15: code R kết xây dựng mơ hình hời quy tún tính model_2 Nhận xét: Như mơ hình hồi quy tuyến tính ảnh hưởng của các nhân tố lên mức độ thu nhiệt được cho bởi: Y =β0 +β1 ×X1+β2 ×X2+β3 ×X3+β4 ×X4+β5 ×X5+β6 ×X6+β7 ×X7+β8 ×X8 83.931762 − 64.773432 ×X1+β2 ×X2+β3 ×X3+β4 ×X4+β5 ×X5+β6 ×X6+β7 ×X7+β8 ×X8 X1 − 0.087289 ×X1+β2 ×X2+β3 ×X3+β4 ×X4+β5 ×X5+β6 ×X6+β7 ×X7+β8 ×X8 X2 + 0.060813 ×X1+β2 ×X2+β3 ×X3+β4 ×X4+β5 ×X5+β6 ×X6+β7 ×X7+β8 ×X8 X3 + 4.169954 ×X1+β2 ×X2+β3 ×X3+β4 ×X4+β5 ×X5+β6 ×X6+β7 ×X7+β8 ×X8 X5 + 19.932736 ×X1+β2 ×X2+β3 ×X3+β4 ×X4+β5 ×X5+β6 ×X6+β7 ×X7+β8 ×X8 X7 + 0.203777 ×X1+β2 ×X2+β3 ×X3+β4 ×X4+β5 ×X5+β6 ×X6+β7 ×X7+β8 ×X8 X8 Hệ số xác định hiệu chỉnh (Adjusted R-squared): R2 hiệu chỉnh =β0 +β1 ×X1+β2 ×X2+β3 ×X3+β4 ×X4+β5 ×X5+β6 ×X6+β7 ×X7+β8 ×X8 0.9155 nghĩa 91.55% biến thiên mức độ thu nhiệt Y1 được giải thích các biến độc lập (X1, X2, X3, X5, X7, X8) Để xét ảnh hưởng cụ thể của biến độc lập, ta xét các hệ số hồi quy (βi ) p-value tương ứng Ta thấy p-value tương ứng với các biến X3, X5, X7 bé 2e − 16, điều nói lên ảnh hưởng của ba biến có ý nghĩa cao lên biến mức độ thu nhiệt Y1 Mặt khác, hệ số hồi quy của biến độc lập có thể được xem ảnh hưởng trung bình lên biến phụ thuộc Y1 tăng đơn vị của biến dự báo đó, giả sử các biến dự báo khác không đổi Cụ thể, hệ số hời quy ứng với biến X1 β1 =β0 +β1 ×X1+β2 ×X2+β3 ×X3+β4 ×X4+β5 ×X5+β6 ×X6+β7 ×X7+β8 ×X8 −64.773432 với độ nhỏ gọn tăng đơn vị, ta có thể kỳ vọng mức độ thu nhiệt của ngời nhà sẽ giảm 64.773432 đơn vị mặt trung bình (giả sử các biến khơng thay Hệ sớrằng hồi mức quy độ ứngthu vớinhiệt biếnsẽX2 β2 đi=β0 +β1 ×X1+β2 ×X2+β3 ×X3+β4 ×X4+β5 ×X5+β6 ×X6+β7 ×X7+β8 ×X8 0.087289 - 0.087289 tăng m2 độc diệnlập tíchkhác bề mặt, ta có thểđổi) kỳ vọng giảm đơn vị mặt trung bình (giả sử các biến độc lập khác không thay đổi) Tương tự đối với các biến cịn lại Giảng viên hướng dẫn: Nguyễn Đình Huy Trang 16 15 BÀI TẬP LỚN XÁC SUẤT THỐNG KÊ Nhóm 10 Kiểm lại tra các các giả giảđịnh địnhcủa củamơ mơhình hìnhhời quy: Yi =β0+β1.XX1+.X.X.Xβi.XXi+εi,i=1,.X.X.Xn Nhắc + Tính tún tính của liệu: mối quan hệ biến dự báo X biến phụ thuộc Y được giả sử tuyến tính của phối các sai số sớ: εi i ∼ N(0,σ2) + Phương Sai sớ cósaiphân chuẩn + + Các sai số εi 1, , εi n độc lập với Ta thực phân tích thặng dư để kiểm tra các giả định của mơ hình: Hình 16: code R kết vẽ đồ thị phân tích thặng dư để kiểm tra các giả định của mơ hình Đờ thị thứ (Residuals vs Fitted) vẽ các giá trị dự báo với các giá trị thặng dư (sai số) tương ứng, dùng để kiểm tra tính tuyến tính của liệu (giả định 1) tính đồng của các phương sai sai số (giả định 3) Nếu giả định tính tuyến tính của liệu không thỏa, ta sẽ quan sát thấy các điểm thặng dư (residuals) đờ thị sẽ phân bớ theo hình mẫu (pattern) đặc trưng (ví dụ parabol) Nếu đường màu đỏ đồ thị phân tán đường thẳng nằm ngang mà khơng phải đường cong, giả định tính tuyến tính của liệu được thỏa mãn Để kiểm tra giả định thứ (phương sai đồng nhất) các điểm thặng dự phải phân tán xung quanh đường thẳng y =β0 +β1 ×X1+β2 ×X2+β3 ×X3+β4 ×X4+β5 ×X5+β6 ×X6+β7 ×X7+β8 ×X8 Đồ thị thứ (Normal Q-Q) cho phép kiểm tra giả định phân phối chuẩn của các sai số Nếu các điểm thặng dư nằm đường thẳng điều kiện phân phối chuẩn được thỏa Đồ thị thứ (Scale - Location) vẽ bậc hai của các giá trị thặng dư được chuẩn hóa với các giá trị dự báo, được dùng để kiểm tra giả định thứ (phương sai của các sai số số) Nếu đường màu đỏ đồ thị đường thẳng nằm ngang các điểm thặng dư phân tán xung quanh đường thẳng giả định thứ được thỏa Nếu đường màu đỏ có độ dốc (hoặc cong) hoặc các điểm thặng dư phân tán khơng xung quanh đường thẳng này, giả định thứ bị vi phạm Đồ thị thứ (Residuals vs Leverage) cho phép xác định điểm có ảnh hưởng cao (influenGiảng viên hướng dẫn: Nguyễn Đình Huy Trang 17 16 BÀI TẬP LỚN XÁC SUẤT THỐNG KÊ Nhóm 10 tial observations), nếu chúng có diện liệu Những điểm có ảnh hưởng cao có thể các điểm outliers, điểm có thể gây nhiều ảnh hưởng phân tích liệu Nếu ta quan sát thấy đường thẳng màu đỏ đứt nét (Cook’s distance), có sớ điểm vượt qua đường thẳng khoảng cách này, nghĩa các điểm các điểm có ảnh hưởng cao Nếu ta quan sát thấy đường thẳng khoảng cách Cook góc của đờ thị khơng có điểm vượt qua nó, nghĩa khơng có điểm thực có ảnh hưởng cao Nhận xét: + Đờ thị Normal Q-Q cho thấy giả định sai sớ có phân phối chuẩn chưa thực thỏa mãn + Đồ thị thứ (Residuals vs Fitted) cho thấy giả định tính tuyến tính của liệu bị vi phạm, ta có thể thấy vi phạm mới quan hệ Y1 các biến cịn lại phi tuyến tính + Đồ thị thứ thứ (Scale - Location) cho ta thấy giả định tính đồng của phương sai bị vi phạm Tuy nhiên, ta thấy vi phạm tương đới nhỏ có thể chấp nhận được + Đồ thị thứ tư có các quan trắc thứ 16, 22 24 có thể các điểm có ảnh hưởng cao liệu Tuy nhiên ta quan sát thấy các điểm chưa vượt qua đường thẳng khoảng cách Cook (đường thẳng đứt nét màu đỏ Cook’s distance) Do vậy, các điểm chưa thực các điểm có ảnh hưởng cao liệu Do ta không cần phải loại bỏ chúng phân tích 1.3.5 So sánh trung bình mức thu nhiệt toả nhiệt của các ngơi nhà Ta tính trung bình Y1 Y2 Hình 17: code R kết thực tính trung bình Y1 Y2 Vẽ biểu đồ boxplot so sánh phân phối của Y1 Y2 Hình 18: code R kết vẽ biểu đồ boxplot so sánh phân phối Y1 Y2 Đồ thị thứ (Residuals vs Fitted) vẽ các giá trị dự báo với các giá trị thặng dư (sai số) tương ứng, dùng để kiểm tra tính tuyến tính của liệu (giả định 1) tính đồng của các phương sai sai số (giả định 3) Nếu giả định tính tuyến tính của liệu không thỏa, ta sẽ quan sát thấy các điểm thặng dư (residuals) đồ thị sẽ phân bố theo hình mẫu (pattern) đặc trưng (ví dụ parabol) Nếu đường màu đỏ đồ thị phân tán đường thẳng nằm ngang mà đường cong, giả định tính tuyến tính của liệu được thỏa mãn Để kiểm tra giả định thứ (phương sai đờng nhất) các điểm thặng dự phải phân tán xung quanh đường thẳng y =β0 +β1 ×X1+β2 ×X2+β3 ×X3+β4 ×X4+β5 ×X5+β6 ×X6+β7 ×X7+β8 ×X8 Đồ thị thứ (Normal Q-Q) cho phép kiểm tra giả định phân phối chuẩn của các sai số Nếu các điểm thặng dư nằm đường thẳng điều kiện phân phới chuẩn được thỏa Đờ thị thứ (Scale - Location) vẽ bậc hai của các giá trị thặng dư được chuẩn hóa với các giá trị dự báo, được dùng để kiểm tra giả định thứ (phương sai của các sai số số) Nếu đường màu đỏ đồ thị đường thẳng nằm ngang các điểm thặng dư phân tán xung quanh đường thẳng giả định thứ được thỏa Nếu đường màu đỏ có độ dớc (hoặc cong) hoặc các điểm thặng dư phân tán không xung quanh đường thẳng này, giả định thứ bị vi phạm Đờ thị thứ (Residuals vs Leverage) cho phép xác định điểm có ảnh hưởng cao (influenGiảng viên hướng dẫn: Nguyễn Đình Huy Trang 18 17 BÀI TẬP LỚN XÁC SUẤT THỐNG KÊ Nhóm 10 Nhận tial observations), xét: Dựa nếu trung chúng bình cómẫu hiệnvà diện biểu đờ boxplot, liệu ta nhận Những thấy điểm mứccóđộ ảnh thuhưởng nhiệt cao trung bình có thể các có xu hướng điểm outliers, thấp hơnlà mức độđiểm toả nhiệt có thể trung gây bình, nhiềutuy ảnhnhiên hưởng đểnhất đánhkhi giáphân lại điều tích liệu ngẫu Nếu nhiên ta quan hay thực sát thấy mức độ đường thu nhiệt thẳngtrung màu bình đỏ đứt có nét xu hướng (Cook’s thấp distance), toảvà nhiệt, có ta cần sớ thực điểmhiện vượtkiểm qua đườngtrung định thẳng bình khoảng so sánh cách mức này, độnghĩa thu nhiệt các điểm toả nhiệt làgiữa cáccác điểm ngơi cónhà ảnh hưởng cao Nếu ta quan sát thấy đường thẳng khoảng cách Cook góc của đờ thị khơng có điểm vượt qua nó, nghĩa Thực khơng kiểm có điểm định để nàosothực sánhsựtrung có ảnh bình hưởng mức cao thu nhiệt toả nhiệt của các ngơi nhà Giả thút H0: μ1 =β0 +β1 ×X1+β2 ×X2+β3 ×X3+β4 ×X4+β5 ×X5+β6 ×X6+β7 ×X7+β8 ×X8 μ2 hay μD =β0 +β1 ×X1+β2 ×X2+β3 ×X3+β4 ×X4+β5 ×X5+β6 ×X6+β7 ×X7+β8 ×X8 0: Mức độ thu nhiệt trung bình mức độ toả nhiệt trung bình Nhận xét: (khơng có khác biệt mức độ thu nhiệt trung bình toả nhiệt trung bình của các + Đờnhà) ngơi thị Normal Q-Q cho thấy giả định sai sớ có phân phối chuẩn chưa thực thỏa mãn + Đồthuyết Đối thị thứ H1:1 μ1 (Residuals μ2 hayvs μDFitted) 0: Mức cho thấy độ thu giảnhiệt định trung tính bình tuyến tính mứccủa độ toả liệu nhiệthơitrung bị vibình phạm, ta có khác thể thấy (Córằng khác vibiệt phạm nàymức độ mới thu nhiệt quan trung hệ bình Y1vàvàtoả cácnhiệt biến trung cịn lạibình phi củatún các ngơi tính + Đồ thị thứ thứ (Scale - Location) cho ta thấy giả định tính đồng của phương nhà) sai bị vi phạm Tuy nhiên, ta thấy vi phạm tương đới nhỏ có thể chấp nhận được Hình 19: code R kết thực kiểm định so sánh trung bình mức thu nhiệt toả nhiệt + Đờ thị thứ tư có các quan trắc thứ 16, 22 24 có thể các điểm có ảnh hưởng cao của các nhà liệu Tuy nhiên ta quan sát thấy các điểm chưa vượt qua đường thẳng khoảng cách Cook (đường thẳng đứt nét màu đỏ Cook’s distance) Do vậy, các điểm chưa thực các điểm có ảnh hưởng cao liệu Do ta khơng cần phải loại bỏ chúng phân tích 1.3.5 So sánh trung bình mức thu nhiệt toả nhiệt của các nhà Ta tính trung bình Y1 Y2 Hình 17: code R kết thực tính trung bình Y1 Y2 Nhận xét: Dựa kết quả, ta nhận đọc được các kết quả: Thống kê kiểm định: t =β0 +β1 ×X1+β2 ×X2+β3 ×X3+β4 ×X4+β5 ×X5+β6 ×X6+β7 ×X7+β8 ×X8 -28.358, bậc tự 767 p-value < 2.2e-16, bé nên ta có đủ chứng mạnh để bác bỏ H0 Ta kết luận có khác biệt mức độ thu nhiệt trung bình toả nhiệt Vẽ biểu đờcủa boxplot so sánh phới của trung bình các ngơi nhà.phân Mặt khác, mứcY1 độvàthuY2 nhiệt trung bình mẫu thấp so với mức độ toả nhiệt trung bình mẫu Do đó, ta có thể kết luận mức độ thu nhiệt trung bình của các ngơi nhà thấp với R mức Hìnhhơn 18:socode độ kếttoả quảnhiệt vẽ biểu đồ boxplot so sánh phân phối Y1 Y2 Sự khác biệt trung bình mức độ thu nhiệt mức độ tỏa nhiệt -2.280565 khoảng tin cậy 95% cho khác biệt trung bình mức độ thu nhiệt mức độ tỏa nhiệt: (-2.438434; -2.122696) Giảng viên hướng dẫn: Nguyễn Đình Huy Trang 19 18 BÀI TẬP LỚN XÁC SUẤT THỐNG KÊ Nhóm 10 xét: Dựa trung 2Nhận Hoạt động bình mẫu biểu đờ boxplot, ta nhận thấy mức độ thu nhiệt trung bình có xu hướng thấp mức độ toả nhiệt trung bình, nhiên để đánh giá lại điều ngẫu nhiên hay thực 2.1 nóĐề bàisự mức độ thu nhiệt trung bình có xu hướng thấp toả nhiệt, ta cần thực kiểm định trung bình so sánh mức độ thu nhiệt toả nhiệt các ngơi nhà Sinh viên tự tìm liệu thuộc chuyên ngành của Khuyến khích sinh viên sử dụng liệu thực tế sẵn có từ các thí nghiệm, khảo sát, dự án, chun ngành của Ngồi Thực kiểm định để so sánh trung bình mức thu nhiệt toả nhiệt của các ngơi nhà sinh viên có thể tự tìm kiếm liệu từ ng̀n khác hoặc tham khảo kho liệu cung Giả thuyết H0: μ1 =β0 +β1 ×X1+β2 ×X2+β3 ×X3+β4 ×X4+β5 ×X5+β6 ×X6+β7 ×X7+β8 ×X8 μ2 hay μD =β0 +β1 ×X1+β2 ×X2+β3 ×X3+β4 ×X4+β5 ×X5+β6 ×X6+β7 ×X7+β8 ×X8 0: Mức độ thu nhiệt trung bình mức độ toả nhiệt trung bình cấp tập tin "kho_du_lieu_BTL_xstk.xlsx" (khơng có khác biệt mức độ thu nhiệt trung bình toả nhiệt trung bình của các Sinh viên được tự chọn phương pháp lý thuyết phù hợp để áp dụng phân tích liệu của mình, ngơi nhà) phải đảm bảo phần: Làm rõ liệu (data visualization) mơ hình liệu (model fitting) Đới thút H1: μ1 μ2 hay μD 0: Mức độ thu nhiệt trung bình mức độ toả nhiệt trung bình khác (Có khác biệt mức độ thu nhiệt trung bình toả nhiệt trung bình của các ngơi nhà) Hình 19: code R kết thực kiểm định so sánh trung bình mức thu nhiệt toả nhiệt của các nhà Nhận xét: Dựa kết quả, ta nhận đọc được các kết quả: Thớng kê kiểm định: t =β0 +β1 ×X1+β2 ×X2+β3 ×X3+β4 ×X4+β5 ×X5+β6 ×X6+β7 ×X7+β8 ×X8 -28.358, bậc tự 767 p-value < 2.2e-16, bé nên ta có đủ chứng mạnh để bác bỏ H0 Ta kết luận có khác biệt mức độ thu nhiệt trung bình toả nhiệt trung bình của các nhà Mặt khác, mức độ thu nhiệt trung bình mẫu thấp so với mức độ toả nhiệt trung bình mẫu Do đó, ta có thể kết luận mức độ thu nhiệt trung bình của các nhà thấp so với mức độ toả nhiệt Sự khác biệt trung bình mức độ thu nhiệt mức độ tỏa nhiệt -2.280565 khoảng tin cậy 95% cho khác biệt trung bình mức độ thu nhiệt mức độ tỏa nhiệt: (-2.438434; -2.122696) Giảng viên hướng dẫn: Nguyễn Đình Huy Trang 20 19