Ý nghĩa của mô hình đã chọn...2 S22 222 22H ư HH xd HH2 rung 45 Ý tưởng chung như sau: giả sử ta có một biến ngẫu nhiên Y , mà ta muốn ước lượng xáp xỉ đưới dạng một hàm số của các biến
Trang 1DAI HOC QUOC GIA TP HO CHi MINH TRUONG DAI HOC BACH KHOA
BO MON TOAN UNG DUNG
BAO CÁO BÀI TẬP LỚN
XAC SUAT - THONG KE NHÓM 5 - ĐỀ TÀI 5
TP HO CHI MINH - NAM 2022
Trang 2NHOM TRUONG
(ghi rõ họ tên, ký tên)
BAO CAO PHAN CONG NHIEM VU VA KET QUA THUC HIEN DE TAI CUA TUNG THÀNH
I Phim tich Wi Quy 0 00 c0cccccccescscssscsssecssessvessseesessesesevsresevesesvssretereveressistesetersvsneesivssissusteviesetersees 3
2 Bản chất: i22 2222211110122 1 211002222112 re 3
3 Ý nghĩa của hồi quy tuyến tính: 2-22 2227 2H HH tt ghe rrre 4
TE Mô hình hỗi quy bội: 2 5 S220 TH Hư HH 2H TH HH gu re re 4 I?)))i0 ).)/.Eaadđaiađii ẢẢ 4
3 Phương pháp ước lượng mô hình hồi quy bội - Phương pháp bình phương nhỏ nhất (OLS).5
4 Đánh giá mức độ phù hợp của mô hình hồi quy bội 2 222tr rung 7
Trang 3
Câu4: Xây dung mé hinh héi quy tuyén tims occ cccccceecceecceeeeeeeeeeseeeveeseesesesesvenseeveneveces 19 Câu§ :Kiểm tra các gia định của mô hình hồi quy Nhắc lại các giã định của mô hình hồi quy: 30
Các lệnh R sử dụng trong bài 0 0 n2 2H12 222011121251 10112 5111 11551011 11201 01K kg xxx kiệt 33
2 Làm sạch dữ liệu - 202221211 121121151 1101211221111 211 1011011211112 115111011 11211011 11g 1111 H1 1g kg yxg 34
4 Xây dựng mô hình hỗi quy đa biến: 0 2n Hư uy ra xte 37
5 Kiểm tra các giá định của mô hình hồi quy Nhắc lại các giá định của mô hình hỗi quy: 44
6 Ý nghĩa của mô hình đã chọn 2 S22 222 22H ư HH xd HH2 rung 45
Ý tưởng chung như sau: giả sử ta có một biến ngẫu nhiên Y , mà ta muốn ước lượng xáp xỉ đưới dạng một hàm số ) của các biến ngẫu nhiên khác (control variables), hay con goi la biến tự do, trong khi Y được gọi là biến phu thuộc, tức là khi ta có các giá trị cua , thi ta muốn từ đó ước lượng được giá trị của Y Hàm số F nay có thể phụ thuộc vào một số tham số nào đó Ta có thể viết Y như sau:
trong đó là phan sai số (cũng là một biến ngẫu nhiên) Ta muốn chọn hàm F một cách thích hợp nhất có thể, và các tham số , sao cho sai số là nhỏ nhất có thể
Đại lượng được gọi là sai số chuẩn (standard error) của mô hình hồi qui Mô hình nào mà có sai
số chuẩn càng thấp thì được coi là càng chính xác
Trang 42 Ban chat:
* Bản chất của biến phụ thuộc Y
Y nói chung được giả định là một biến ngẫu nhiên, và có thê được đo lường bằng một trong bến thước đo sau đây: thang đo tỷ lệ, thang đo khoảng, thang đo thứ bậc, và thang đo danh nghĩa Thang đo tỷ lệ (ratio scale): Mét thang đo tỷ lệ có 3 tính chất: (1) tỷ số của hai biến, (2) khoảng cách giữa hai biến, và (3) xếp hạng các biến Với thang đo tỷ lệ, ví dụ Y có hai giá trị, và thì tỷ
số / và khoảng cách ( - ) là các đại lượng có ý nghĩa; và có thể so sánh hoặc xếp thứ tự Thang do khoang (interval scale): Thang đo khoảng không thỏa mãn tính chất đầu tiên của các biến có thang đo tỷ lệ
Thang do thir bac (ordinal scale): Cac biến chỉ thỏa mãn tính chất xếp hạng của thang đo tỷ lệ, chứ việc lập tỷ số hay tính khoảng cách giữa hai giả trị không có ý nghĩa
Thang đo danh nghĩa (nominal scale): Các biến thuộc nhóm này không thỏa mãn bất
kỳ tính chất nào của các biến theo thang đo tỷ lệ (như giới tính, tôn giáo, )
* Bán chất của biển ngẫu nhiên X
Các biến ngẫu nhiên có thể được đo theo bất kỳ một trong bốn thang đo vừa nêu trên, mặc đù trong nhiều ứng dụng thực tế thì các biến giải thích được đo theo thang đo tỷ số và thang đo khoảng
* Bán chất của sai số ngẫu nhiên (nhiễu)
Sai số ngẫu nhiên đại diện cho tất cả các biến không được đưa vào mô hình vì những lý do như không có sẵn dữ liệu, các lỗi đo lường trong dữ liệu Và cho dù nguồn tạo nhiễu là gì đi nữa, thì người ta giả định răng ảnh hưởng trung bình của sai số ngầu nhiên lên Y là không dang ke
Ta cũng giả định là hạng nhiễu có phân phối chuẩn với trung bình bằng 0 và phương sai không
đối
* Bán chất của tham số hồi quy
Tham số hồi quy (tổng thể), là những con số có định (ñxed numbers) và không ngẫu nhiên (not random), mac du minh khéng thé biét gia tri thực của các Bs là bao nhiêu
3.Ý nghĩa của hồi quy tuyến tính:
Thuật ngữ tuyến tính (linear) trong mô hình hồi quy tuyến tính nghĩa là tuyến tính ở các hệ số hồi quy (linearity in the regression coefficients), va khéng phai tuyén tinh ở các biến Y và X
IH Mô hình hồi quy bội:
Trang 5Mô hình hồi quy tổng thể: Y =B1 + B2 X2 + B3 X3 + + BkXk+
Trong đó:
[ là sai số ngẫu nhiên
ñ B1 là hệ số tự do (hệ số chặn), bằng giá trị trung bình của Y khi Xj=0
I Bị là hệ số hồi quy riêng (hay hệ số góc), thể hiện ánh hưởng của riêng từng
biến độc lập Xị lên trung bình của Y khi các biến khác được giữ không đôi
Cụ thể, khi Xj tăng hoặc giảm 1 đơn vị, trong điều kiện các biến độc lập
khác không đổi, thì Y trung bình sẽ thay đổi Bị đơn vị Có thê nhận thấy ba
khả năng có thê xảy ra đối với các hệ số góc:
$ Hệ số Bị >0: khi đó mối quan hệ giữa Y và Xị là thuận chiều, nghĩa là khi Xj tăng (hoặc giảm) trong điều kiện các biến độc lập khác không đổi thì Y cũng sẽ tăng (hoặc giảm)
Hệ số Bị <0: khi đó mối quan hệ giữa Y và Xị là ngược chiều, nghĩa là
khi Xj tăng (hoặc giảm) trong điều kiện các biến độc lập khác không đổi thì Y sẽ giám (hoặc tăng)
Hệ số Bị =0: có thê cho rằng giữa Y và Xj không có tương quan với nhau, cụ thê là Y có thể không phụ thuộc vào Xj hay là Xj không thực sự ánh hưởng tới Y
Dựa vào kết quả ước lượng với một mẫu cụ thể, ta có thể đánh giá được mối quan hệ giữa biến phụ thuộc và các biến độc lập trong mô hình một cách tương đối.Dù mô hình có nhiều biến độc lập nhưng vẫn tổn tại những yếu tổ tác động đến biến phụ thuộc nhưng không đưa vào mô hình
vì nhiều lý đo (không có số liệu hoặc không muốn đưa vào) Do đó trong mô hình vẫn tổn tại sai
số ngẫu nhiên đại diện cho các yếu tổ khác ngoài các biến Xj (j = 2,3, , k) có tác động đến Y nhưng không đưa vào mô hình như là biến số
2 Các giả thiết của mô hình hồi quy bội S
Giả thiết 1: Việc ước lượng được dựa trên cơ sở mầu ngấu nhiên
Giá thiết 2: Kỳ vọng của sai số ngẫu nhiên tại mỗi giá trị (X2¡,Xa¡,, Xki) bằng 0:
E( X2i,Xãi , Xki) = 0
Giả thiết 3: Phương sai của sai số ngẫu nhiên tại các giá trị (X2¡,Xa¡ , Xk¡) đều bằng nhau
> Từ giả thiết 2 và 3 ta có thê nói sai số ngẫu nhiên (u) tuân theo phân phối chuẩn Giả thiết 4: Giữa các biến độc lập Xj không có quan hệ cộng tuyến hoàn hảo, nghĩa là không tổn tại hằng số À2, À4 Àk không đồng thời bằng 0 sao cho:
Trang 6> Co thé nhận thấy nếu giữa các biến Xi =2.3, ,k) có quan hệ cộng tuyến
hoàn hảo thì sẽ có ít nhất một trong các biến này sẽ suy ra được từ các biến còn lại Do đó, giả thiệt 4 được đưa ra đề loại trừ tình huông này
3 Phương pháp ước lượng mô hình hồi quy bội — Phương pháp bình phương nhỏ nhất (OLS)
Sau khi xây dựng và tìm hiểu ý nghĩa của các hệ số hồi quy trong mô hình, vấn dé tiếp theo ta quan tâm là làm sao để có được các ước lượng đáng tin cay cho các hệ số Bị này Cũng như với
mô hình hồi quy hai biến, ta sẽ sử dụng phương pháp bình phương nhỏ nhất (OLS) để ước lượng các hệ sô trong mô hình hồi quy k biến
Xét mô hình k biến: Y =BI+P2X2a+3X3+ +kXk+
Giả sử có một mẫu quan sát với giá trị thực tế là (Y¡, X2i, , XkÙ với (1= l, 2, , n)
Ta sẽ sử dụng thông tin từ mẫu để xây dựng các ước lượng cho các hệ số Bj G= 1, 2, , k), ky hiệu la j G = 1, 2, ., k) Từ các giá trị ước lượng này có thể viết thành hàm hồi quy mẫu như
Sau:
=1+2X2+3X3+ +kXk Tại mỗi quan sát ¡, hàm hồi quy mẫu được viết thành:
, k} sao cho tổng bình phương các phân dư là bé nhất:
Trang 7FCB» Bas _— ễ.) _ Pa) 3 (Y, - ổi - 8,X;,= — B,X,,) = 0
Với mô hình hồi quy bội (hồi quy k biến với k > 2), việc giải hệ phương trình đề tìm các ước lượng hệ số j Ú= = 1, 2, 3 k) sẽ trở nên khó khăn hơn so với mô hình hồi quy 2 biến do đó ta sẽ
có được các kết quá này với sự giúp của các phần mềm thống kê
Từ kết quá ước lượng từ phương phap OLS, ta cé thé khai thác các thông tin để đánh giá tác động của biến độc lập đối với sự thay đổi của biến phụ thuộc thông qua ý nghĩa các hệ số hồi
ư
Khí Các giả thiết từ 1 đến 4 thỏa mãn thì các ước lượng thu được từ phương pháp OLS là ước lượng tuyến tính, không chệch và có phương sai nhỏ nhất trong lớp các ước lượng tuyến tính không chệch Hay nói một cách khác, nêu giả thiết từ 1 đến 4 được thỏa mãn thì ước lượng OLS
là ước lượng tốt nhất trong lớp các ước lượng tuyến tính không chệch
4 Đánh giá mức độ phù hợp của mô hình hồi quy bội
Khi đánh giá một mô hình dựa trên số liệu mẫu, nếu chỉ quan tâm đến các ước lượng hệ số và độ lệch chuẩn của nó thì chưa đây đủ Có một con số cũng góp phân không nhỏ khi đánh giá chât lượng mô hình đó là hệ sô xác định
Sau khi ước lượng được mô hình hổi quy trong một khoảng tin cậy, ta muốn biết hàm hổi quy mâu phù hợp với sô liệu mẫu đến mức nào Có thê đánh giá điêu đó qua hệ sô xác định bội Ký hiệu
11
Cách xác định hệ số xác định bội:
Trang 8TSS = ` y; = y (Y, -
RSS = e e? => (y,-¥,)
I TSS (total sum of square): Tổng bình phương độ lệch toàn phan
ESS (Explained sum of square): Tong bình phương độ lệch phần hồi quy
RSS (Residual sum of square): Téng binh phuong phan dw
TSS =ESS + RSS Khi đó hệ sô xác định bội của mô hình được xác định bởi công thức sau:
Y nghia cua hé số xác định bội
Với mô hình hồi quy k biến, R”có ý nghĩa như sau:
Rlà tỷ lệ (hay tỷ lệ phần trăm) sự thay đổi của biến phụ thuộc được giải thích bởi các biến độc lập trong mô hình
Với điều kiện 0 < Rˆ < l, ta có hai trường hợp đặc biệt đó là:
> R=1 nghĩa là 100% sự thay đổi của biến phụ thuộc được giải thích bởi các biến độc lập trong mô hình
> Rˆ=0 nghĩa là các biến độc lập không giải thích được một chút nào đối với sự thayđôi của biến phu thuộc
Rõ ràng, trong thực tế, khi xem xét các mối quan hệ giữa các biến thông qua các môhình hồi quy thi R thường năm trong khoáng (0,1) nhiều hơn
Một tính chat quan trọng của RỶ là nó sẽ tăng khi ta đưa thêm biến độc lập vào mô hình Dễ dàng thấy rằng TSS không phụ thuộc vào số biến giải thích trong mô hình nhưng RSS lại giảm Do đó, nêu tăng số biến biến độc lập trong mô hình thì R? cũng tăng Như vậy, việc đưa thêm một biến
số bất kỳ vào mô hình nói chung sẽ làm gia tăng R?, không kể nó có giúp giải thích thêm cho biến phụ thuộc hay không Điều này ngụ ý rằng RỶ chưa phải là thước đo tốt khi muốn so sánh các mô hình với số biến khác nhau
Trang 9Đề giải quyết vấn đề thiếu sót nay, ta xem xét khái niệm R? hiệu chỉnh, ký hiệu là I và được định nghĩa như sau:
1 I=1-(1-R2)
Ta thấy răng khi số biến độc lập (k — 1) tăng lên thì I cũng tăng lên nhưng tăng chậm hơn so với
độ phù hợp của mô hình hồi quy một cách chính xác nhất mà phải dựa vào đặc trưng của từng bài toán cy thé mà thực hiện tính toán sao cho phù hợp
CHƯƠNG II: HOẠT ĐỘNG 1
Câu l: Đọc dữ liệu:
@ Dau tién ching ta tai dữ liệu về đưới dang csv
@ Su dung lénh: read.csv để đọc dữ liệu từ đường dẫn mà chúng ta đã dùng để chứa dữ liệu tải về
#import data
heat_data<-read.csv("F:\\Screen\\heat_data csv"
Dữ liệu được đọc về được hiển thị như bảng trong hình ảnh dưới đây
Trang 10
Lấy các dữ liệu chính trong bộ dữ liệu sử dụng bao gồm XI X2 X3 X4 X5 X6 X7 X§ Y1 Y2, ta
lọc đưa vào dưới dạng một bộ dữ liệu mới có tên là new_ heat_ data
Ta thay các dữ liệu không cần thiết đã được loại bỏ, chỉ còn lại các dữ liệu cần sử dụng cho việc phân tích
Trang 11Cau 2: Cleaning data
Dau tién chung ta sé kiểm tra xem bộ dữ liệu có các giá trị bị khuyết như thê nào
Sử dụng lệnh summary() để thực hiện kiểm tra các dữ liệu khuyết của bộ dữ liệu, ngoài ra lệnh summary còn được dùng dé théng kê một số đữ liệu
3rd Qu.:0.8300 3rd Qu.:741.1 3rd Qu.:343.0 3rd Qu.:220.5 3rd Qu.:7.00 3rd Qu.:0.4000 4
Ta có thể thay số lượng đữ liệu khuyết của mỗi column đữ liệu là 528
Ta tiến hành xem xét bảng đữ liệu và có thể nhận thấy rằng các dữ liệu chưa được thêm vào, ta tiên hành xóa các dữ liệu khuyết đó đó để làm sạch đữ liệu cho các tính toán vẻ sau
new_heat_data <- new_heat_data[complete cases (new_heat_data), |
Sử dụng lénh complete.cases() để thực hiện xác định tìm kiếm những giá trị bị khuyết và cập nhật lại dữ liệu vào new_ heat_ data sau khi loại bỏ các dữ liệu bị khuyết
Sau khi thực hiện xóa các dữ liệu khuyết xong ta thử kiểm tra lại giá trị khuyết có còn hay không
Sử dụng lệnh:
apply(is.na(new_heat_data) ,2,which
Két qua cua viéc kiểm tra: dữ liệu khuyết đã được loại bỏ hết
> applyCis.na(new_heat_data) ,2,which) integer (0)
Cau 3: Data visualization
a, Chuyén déi bién
Ta nhận thấy răng các mặc dù đã đề tài đữ liệu về các biến cần sử dụng đề nghiên cứu nhưng nếu
để các dữ liệu với column name là XI X2 thì người đọc dữ liệu sẽ khá khó khăn trong việc nghiên cứu Chính vì thê đầu tiên chúng ta sẽ đôi tên các biên column name này dé dé dàng cho việc sử dụng dữ liệu
Đầu tiên copy bộ đữ liệu new_heat_đata vào bộ dữ liệu khác tên là clear_data
10
Trang 12clear_data <- rename(clear_data,Endothermic_level = Y1)
clear_data <- rename(clear_data,Exothermal_level = Y2)
Bộ dữ liệu sau khi các columne name được đối tên hiển thị như sau:
ptt
« ue ©
ben c
11
Trang 13b, Thống kê mô tả: dùng thống kê mẫu và đồ thị
Đối với những biến được coi là biến liên tục gồm 2 biến Y1(Mức độ thu nhiệt) và biến Y2(Mức
độ tỏa nhiệt) ta sẽ thực hiện tính toán và thông kê một số các mô tả như: giá trị trung bình, giá trị lớn nhắt, giá trị nhỏ nhất, trung vị, độ lệch chuẩn, tứ phân vị, phương sai và độ trải giữa
statistic_table <- apply(clear_data[var],2,function(x){c(summary(x) ,sd(x),var(x),IQR(x))})
rownames(statistic_table) <- c("Min","1st Qu”","Median"”", "Mean”,"3rd 0u”, "Max”,"sd”, "var","10R”)
print(statistic_table)
Bang statistic_table sé hién thi lên trên màn hình Console như sau:
> #Variable khong lien tuc
> statistic Surface_Area <- data.frame(Ctable(Clear_data$Surface_area))
> statistic_Orientation <- data frame(table(clear_data$0rientation) )
> colnames (statistic_Compactness) <- c("Value", Frequency")
#Variable khong lien tuc
statistic_Compactness <- data frame(table(clear_data$Compactness) )
statistic_Surface_Area <- data frame(table(clear_data$surface_area))
statistic_wall_Area <- data frame(table(clear_data$wal]_area))
statistic_Roof_Area <- data frame(table(clear_data$Roof_area) )
statistic_Orientation <- data frame(table(clear_data$Orientation) )
statistic_GlassPaste_Area <- data frame(table(clear_data$GlassPaste_area))
statistic_Distribution_Glassez_Area <- data frame(table(clear_data$Distribution_glassez_area) ) colnames (statistic_Compactness) <- c("Value", "Frequency”™)
Trang 14Bảng tần số của biến Compactness Bảng tần số cho biến Surface_ Area
Bang tan số cho biến Wall_Area Bang tan số cho biến Roof_ Area
* Value Frequency * Value Frequency
Bang tan sé cho bién Orientation Bảng tần số cho biến GlassPaste_Area
* Value Frequency Value Frequency
Trang 15*Dung đề thị cho các biến:
O phan này, ta chọn sử dụng ham hist() để vẽ đề thị cho biến exothermal_level(Mức độ tỏa nhiệt
hist(clear_data$Exothermal_level ,col="blue",xlab="Exothermal_level",main="Histogram of Exothermal_level"
14
Trang 16Tiếp theo ta tiến hành thể hiện phân phối của Exothermal_level(Mức độ tỏa nhiệt) với một số biên rời rạc trong bộ dữ liệu thơng qua biêu đồ hộp, sử dụng lệnh boxplot() trong R đề thực hiện điều này
#Do thi do hop boxplot
boxplot(clear_datasexothermal_level~clear_data$GlassPaste_area,xlab="Glass Paste Area" ylab="Exothermal_level" ,col="lightblue") boxplot(clear_dataSexothermal_level~clear_data$Distribution_glassez_area,xlab="Distribution of Glassez Area" ,ylab= "Exotherna]”,co]="Tightb]ue")
(
boxplot(clear_dataSexothermal_level~clear_data$Compactness ,x]ab="Compactness” ylab="Exothermal_level" ,col="Tightl blue ")
boxplot (clear_dataS€xothermal_level~clear_dataSOveral ]_height,xlab="Overal] Height" ylab="Exothermal_ level" scoÏ= "lightblue")
Đồ thị đồ hộp của biến Exothermal_level theo biến Glass Paste Area(Khu vực dán kính)
Glass Paste Area
Đồ thị đồ hộp của biến Exothermal_level theo bién Distribution_Glassez_Area(Phan bé khu vuc đán kính)
15
Trang 17Distribution of Glassez Area
Đồ thị đồ hộp của biến Exothermal_level theo biến Compactness(Độ nhỏ gọn)
1ó
Trang 19rac Qua đó thê hiện rõ phân phối của Mức độ tỏa nhiệt theo từng tiêu chí cụ thể Từ biểu đồ còn
có thể biết được gia tri trung vị, rỗi giá trị lớn nhất nhỏ nhất cũng như các bách phân vị, những điểm ngoại lai của Mức độ tỏa nhiệt
*Tiép theo ta dùng lệnh pairs() để vẽ phân phối của biến Exothermal_ level với I biến liên tục khác là biến Endothermic_ level
#do thi phan phoj bjen p pair
pairs (~Endothermic_level+Exothermal_level ,data=clear_data,col="darkgreen", labels=c(""Endothermic_level”,"Exothermal_level"),main="pairs plot 1n R”
Nhận xét đỗ thị: Với mỗi chấm tròn nhỏ sẽ đại diện cho một đếi tượng ở đây chính là ngôi nhà
Và đồ thị sẽ thể hiện cho phân phối mức độ tỏa nhiệt theo biến mức độ thu nhiệt tương ứng Trong đồ thị có một số chỗ màu xanh lá đậm và dày cho thấy mức độ phân bó đối tượng ở khu vực đó rất nhiều Và từ đề thị cũng có thể dự đoán thấy mức độ tỏa nhiệt và mức độ thu nhiệt có một mối quan hệ tuyến tính sắp sỉ theo hàm số bậc nhất
18
Trang 20Ở đây, tác giả cần chúng ta xây đựng mô hình hồi quy tuyến tính để đánh giá các nhân tổ tác động lên Mức độ thu nhiệt của ngôi nhà(tức là biến Endothermic_level) chúng ta đã sử dụng để thống kê mô tá 6 phan thứ 3
Để sử dụng một dữ liệu mới để tránh ảnh hưởng sự thay đối đến bộ dữ liệu cũ, ta chuyển bộ đữ liệu ban đầu vào bộ đữ liệu mới có tên là compare_data để thực hiện các việc so sánh cần thiết
Chúng ta sẽ sử dụng lệnh plot() dé thực hiện các đỏ thị so sánh giữa biến cần nghiên cứu(tức là Endothermie_ level — Mức độ tỏa nhiệt) đến các biên còn lại Đồng thời thực hiện dự đoán sự ảnh hưởng của các biến này lên biến Endothermic_level sau đó kiếm chứng lại
#compare Y1 + XI
plot(Y1 ~ X1, data = compare_data,
xlab = "Compactness”,
ylab = "Edothermic level",
main = "Evaluate compactness effect on Edothermic",
pch = 20,
cex = 1,
col = "black")
#compare Y1 + X2
plot(Y1 ~ X2, data = compare_data,
xlab = “Surface Area",
ylab = "Edothermic level",
main “Evaluate Surface_area effect on Edothermic",
pch = 20,
cex = ip
col = “blue")
#compare Y1 + X3
plot(Y1 ~ X3, data = compare_data,
xlab = "Wall Area",
ylab = "Edothermic level",
main = "Evaluate Wall Area effect on Edothermic”,
pch = 20,
cex = 1,
col = "red")
#compare Y1 + X4
plot(Y1 ~ X4, data = compare_data,
xlab = “Roof Area",
ylab = "Edothermic level",
main = "Evaluate Roof Area effect on Edothermic”,
pch = 20,
cex = 1,
col = "yellow")
#compare Y1 + X5
plot(Y1 ~ X5, data = compare_data,
xlab = “Overall Height",
ylab = "Edothermic level",
main = "Evaluate Overall Height effect on Edothermic”,
pch = 20,
cex = 1,
col = "gray")
19
Trang 21plot(Y1 ~ X6, data = compare_data,
xlab = "Orientation",
ylab = "Edothermic level",
main = “Evaluate Orientation effect on Edothermic”,
pch = 20,
cex = 1,
col = "orange”)
#compare Y1 + X7
plot(Y1 ~ X7, data = compare_data,
xlab = "Glass Paste Area”,
= “Evaluate Glass Paste Area effect on Edothermic”,
plot(Y1 ~ X8, data = compare_data,
xlab = "Distribution of Glassez Area",
ylab = "Edothermic level",
main “Evaluate Distribution of Glassez Area effect on Edothermic",
ylab = “Edothermic level",
main = "Evaluate Exothermal Area effect on Edothermic",
pch = 20,
cex = 1,
col = "blue") _
D6 thi phân phối biến Endothemic_ level theo biến Compactness
Nhận xét: Ta thấy trong khoảng (0,6-0,75) mức độ tỏa nhiệt thấp hơn trong khoảng (0,75-0,9), ta
dự đoán rằng biến Độ nhỏ gọn có ảnh hưởng đến mức độ thu nhiệt của ngôi nhà
20
Trang 22Đồ thị phân phối biến Endothermic_level theo biến Surface_ Area
Nhận xét: Mức độ tỏa nhiệt trong khoảng (550-650) cao hơn trong khoảng (680-800), ta dự đoán diện tích bề mặt có ảnh hướng đến mức độ thu nhiệt của ngôi nhà
21
Trang 23Đồ thị phân phối bién Endothermic_level theo bién Wall_Area
Nhận xét: Ta thấy mưc độ thu nhiệt trong khoáng (300-350) là cao nhất, các khoảng còn lại thấp, nên ta đự đoán Diện tích tường có tham gia ảnh hưởng đến mức độ thu nhiệt của ngôi nhà
22
Trang 24Đồ thị phân phối biến Endothermic_level theo bién Roof_Area
Nhận xét: Ta thấy mức độ thu nhiệt của ngôi nhà theo diện tích mái có sự biến thiên nhưng có vẻ không đủ số lượng của các diện tích để ta có thê kết luận diện tích mái nhà có ảnh hưởng đến mức độ thu nhiệt của ngôi nhà được