Vẽ biểu dồ boxplot biểu đồ hộp của biến phản hồi so với biến phân loại .22 5.1 Vẽ biểu đồ boxplot thể hiện phân phổi của của biến roughness...22 5.2 Vẽ biểu đồ boxplot thể hiện phân phối
Trang 1ĐẠI HỌC QUỐC GIA THÀNH PHỐ HỒ CHÍ MINH
TRƯỜNG ĐẠI HỌC BÁCH KHOA
Thành phố Hồ Chí Minh – 2024
Trang 2MỤC LỤC
MỤC LỤC 2
PHỤ LỤC HÌNH ẢNH 4
LỜI NÓI ĐẦU 5
NỘI DUNG 6
I TỔNG QUAN DỮ LIỆU 6
1 Mô tả về bộ dữ liệu 6
2 Mô tả về biến 6
II KIẾN THỨC NỀN 7
1 Tổng quát về mô hình hồi quy tuyến tính bội 7
2 Hàm hồi quy tổng thể (PRF - Population Regression Function) 7
3 Hàm hồi quy mẫu (SRF – Sample Regression Function): 8
4 Các giả thuyết của phương pháp bình phương nhỏ nhất cho mô hình hồi quy tuyến tính bội 9
5 Phân tích phương sai 9
6 Khoảng tin cậy và kiểm định các hệ số hồi quy 11
6.1 Ước lượng khoảng tin cậy đối với các hệ số hồi quy 11
6.2. Kiểm định giả thiết đối với 𝛃 𝐣̇ 12
7 Kiểm định mức độ ý nghĩa chung của mô hình (trường hợp đặc biệt của kiểm định WALD) 13
7.1 Khái quát về kiểm định WALD 13
7.2 Kiểm định ý nghĩa của mô hình 14
8 Đa cộng tuyến (Multicollinearity) 15
III TIỀN XỬ LÝ SỐ LIỆU 16
1 Đọc dữ liệu (Import data): 16
2 Làm sạch dữ liệu 16
2.1 Kiểm tra dữ liệu khuyết 16
2.2 Kiểm tra định dạng của biến 17
2.3 Xử lý định dạng của biến 18
IV THỐNG KÊ MÔ TẢ 19
1 Thực hiện thống kê tổng thể cho các biến 19
2 Tính toán giá trị thống kê của các biến liên tục 20
Trang 33 Thống kê số lượng cho các biến định tính 20
4 Vẽ đồ thị histogram (biểu đồ cột) thể hiện phân phối của biến phản hồi 21
5 Vẽ biểu dồ boxplot (biểu đồ hộp của biến phản hồi so với biến phân loại 22 5.1 Vẽ biểu đồ boxplot thể hiện phân phổi của của biến roughness 22
5.2 Vẽ biểu đồ boxplot thể hiện phân phối của biến tension_strenght 22
5.3 Vẽ biểu đồ boxplot thể hiện phân phối của biến elongation 23
6 Vẽ ma trận tương quan giữa các biến 24
7 Vẽ biểu đồ scatter plot (biểu đồ tán xạ) thể hiện phân phối 25
V THỐNG KÊ SUY DIỄN 28
1 Xây dựng mô hình hồi quy tuyến tính 28
1.1 Các mô hình hồi quy 28
1.2 Kiểm định để tìm mô hình hồi quy phù hợp 33
NHẬN XÉT CHUNG 35
2 Vẽ đồ thị kiểm tra các giả định của mô hình 36
3 Kiểm định trung bình hai mẫu 38
3.1 Tạo bảng dữ liệu 38
3.2 Kiểm tra tính chuẩn của biến roughness của các nhóm 39
3.3 Kiểm định phương sai 2 mẫu 40
3.4 Bài toán kiểm định trung bình mẫu 41
3.5 Sự khác biệt về kết luận ở hai bài toán 42
4 Bài toán anova một yếu tố 43
4.1 Kiểm tra các điều kiện 44
4.2 Phân tích phương sai (anova) 46
KÊT LUẬN 48
TÀI LIỆU THAM KHẢO 49
Trang 4PHỤ LỤC HÌNH ẢNH
Hình 1 – Bảng công thức Anova 11
Hình 2 Trường hợp đa cộng tuyến 15
Hình 3 – Đồ thị histogram thể hiện phân phối của các biến phản hồi roughness, tension_strength, elongation 22
Hình 4 - Biểu đồ boxplot của biến roughness với biến phân loại infill_pattern và material 22
Hình 5 - Biểu đồ boxplot của biến tension_strengh với biến phân loại infill_pattern và material 23
Hình 6 - Biểu đồ boxplot của biến elongation với biến phân loại infill_pattern và material 23
Hình 7 - Biểu đồ hệ số tương quan giữa các biến liên tục 24
Hình 8 - Biểu đồ scatter plot thể hiện phân phổi của của biến roughness 26
Hình 9 - Biểu đồ scatter plot thể hiện phân phối của biến tension_strenght 27
Hình 10- Biểu đồ scatter plot thể hiện phân phối của biến elongation 28
Hình 11 – Đồ thị kiểm tra giả định của mô hình 37
Trang 5LỜI NÓI ĐẦU
Lời đầu tiên, nhóm CK24 gửi đến cô Nguyễn Kiều Dung, giảng viên đã hướngdẫn cho nhóm hoàn thành đề tài này, một lời tri ân sâu sắc Nhờ có những bài giảngcùng sự tâm huyết của cô trên lớp mà tụi em nắm được cơ sở lí thuyết một cách khoahọc, cụ thể nhất để giải quyết bài báo cáo trên theo đúng thời hạn đã giao Bên cạnh
đó, nhóm cũng xin trân trọng cám ơn những ý kiến đóng góp, giúp đỡ và chỉ bảo tậntình của thầy cô, bạn bè, đã giúp cho bài báo cáo trở nên hoàn thiện hơn
Nhóm CK24 xin chân thành cám ơn sự hỗ trợ, tương tác lẫn nhau của từng cánhân trong nhóm Qua quá trình làm việc nhóm đã dần hiểu rõ nhau hơn, đoàn kết hếttrong học tập lẫn công việc Do chưa có nhiều kinh nghiệm làm việc bằng phần mềmRStudio, cũng như những hạn chế về mặt kiến thức chắc chắn sẽ không tránh khỏinhững thiếu sót Rất mong nhận được sự nhận xét, ý kiến đóng góp, phê bình từ phía
cô để bài báo cáo được hoàn thiện hơn
Lời cuối cùng, nhóm chúng em xin gửi lời cám ơn chân thành nhất tới nhữngngười đã hỗ trợ nhóm trong quá trình làm bài báo cáo
Trang 6NỘI DUNG
I TỔNG QUAN DỮ LIỆU
1 Mô tả về bộ dữ liệu
Tập tin “data.csv” chứa bộ dữ Liệu của nhóm nghiên cứu khoa học của khoa Cơ
khí Đại học TR/Selcuk Dữ liệu gốc được cung cấp tại:
https://www.kaggle.com/datasets/afumetto/3dprinter
Nghiên cứu tập trung vào việc xác định tác động của các tham số cài đặt trên chấtlượng, độ chính xác và độ bền của sản phẩm in Bộ dữ liệu bao gồm 50 quan sát với 9tham số cài đặt và 3 thông số đầu ra được đo lường
Để đạt được mục tiêu này, các thử nghiệm về chất liệu và độ bền đã được thựchiện trên máy thử nghiệm Sincotec GMBH có khả năng kéo 20 kN
2 Mô tả về biến
Các thông số đầu vào (được cài đặt)
Các thông số đầu ra (được đo)
Trang 72 Tension Strenght (Sức căng) Liên tục MPa
Trong bảng trên, có 9 biến cài đặt, 3 biến đầu ra xác định chất lượng của bản in Vìvậy ta sẽ dự đoán về 3 biến chất lượng bản in dựa trên 9 biến cài đặt Ở đây có 2 biến
phân loại là Infill Pattern, Material
II KIẾN THỨC NỀN
1 Tổng quát về mô hình hồi quy tuyến tính bội
Hồi quy tuyến tính bội là mô hình với một biến phụ thuộc với hai hoặc nhiều biến độc lập:
Y i = β0 + β1X1i +β2X2i +β3X3i .β k X ki +ϵ i
Trong đó:
β0: là hệ số tung độ góc
β1: là hệ dốc của Y theo biến X1 và giữa các biến X2, X3, , X k không đổi
β2: là hệ dốc của Y theo biến X2 và giữa các biến X1, X3, , X k không đổi
β3: là hệ dốc của Y theo biến X3 và giữa các biến X1, X2, , X k không đổi
β k : là hệ dốc của Y theo biến X k và giữa các biến X1, X2, , X k không đổi
ϵ i: là thành phần ngẫu nhiên (yếu tố nhiễu), có kì vọng bằng 0 và phương sai
không đổi σ2
Hồi quy tuyến tính là một phương pháp để dự đoán giá trị biến phụ thuộc (Y)
dựa trên giá trị của biến độc lập (X) Thuật ngữ tuyến tính dùng để chỉ rằng bản chấtcủa các thông số của tổng thể β1 và tổng thể βk là tuyến tính (bậc nhất) Nó có thể được
sử dụng cho các trường hợp chúng ta muốn dự đoán số lượng liên tục Ví dụ: dự đoánthời gian người dùng dừng lại một trang nào đó hoặc số người đã truy cập vào mộtwebsite nào đó Bằng dữ liệu thu thập được, ta đi ước lượng hàm hồi quy của tổngthể, đó là ước lượng các tham số của tổng thể: β1, β2, , βk.
2 Hàm hồi quy tổng thể (PRF - Population Regression Function)
Trang 8Với 𝑌 là biến phụ thuộc, 𝑋1, 𝑋2, … , 𝑋𝑘 là biến độc lập, Y là ngẫu nhiên và cómột phân phối xác suất nào đó Suy ra: Tồn tại E (Y|X1, X2,…, Xk) = giá trị xác định.
Trang 9Do vậy F (X1, X2,…, Xk) = E (Y|X1, X2,…, Xk) là hàm hồi quy tổng thể của Y theo X1,
3 Hàm hồi quy mẫu (SRF – Sample Regression Function):
Do không biết tổng thể, nên chúng ta không biết giá trị trung bình tổng thể của
biến phụ thuộc là đúng ở mức độ nào Do vậy chúng ta phải dựa vào dữ liệu mẫu để
ước lượng
Trên một mẫu có n cá thể, gọi ^Y=^F(X1, X2,… X K)
Với một cá thể mẫu có thể Y ≠ ^ F (X1, X2,… X K) sinh ra ε i =Y − ^F (X 1, X2, X K), với 𝜀𝑖 gọi là phần
dư SRF
Giả sử có một mẫu quan sát với giá trị thực tế là (Xi, X2i, Xki) với (i = 1, 2, 3, k)
Ta sẽ sử dụng thông tin từ mẫu để xây dựng các ước lượng cho các hệ số βm (với m =
1, 2, 3, k) Từ các giá trị ước lượng này có thể viết thành hàm hồi quy
Ta có hàm hồi quy mẫu tổng quát được viết dưới dạng như sau:
^Y T =^β0+^β1× X1+ ^β2× X2+ ^β3× X3+… ^β k × X k
Trong đó, ^β m là ước lượng của β m Chúng ta trông đợi^β mlà ước lượng không chênh lệch của β m, hơn nữa phải là một ước lượng hiệu quả ^Y l là các giá trị ược lượng cho Y i và sai lệch giữa hai giá trị này được gọi là phần dư: ε i= ¿Y i− ¿ ^Y l
Ước lượng SRF: chọn một phương pháp nào đó để ước lượng các tham số của 𝐹
qua việc tìm các tham số của ^Flấy giá trị quan sát của các tham số này làm giá trị xấp
xỉ cho tham số của 𝐹
4 Các giả thuyết của phương pháp bình phương nhỏ nhất cho mô hình hồi quy
Trang 10tuyến tính bội:
Xét mô hình hồi quy bội:
Y i =β0+β1X 1 i +β2X 2 i +β3X 3 i +… β k X ki +∈ i
Giống như mô hình hồi quy đơn, mô hình hồi quy bội này có các tính chất sau:
Đường hồi quy bội đi qua điểm
^β llà các ước lượng tuyến tính không chệch và có phương sai nhỏ nhất cho các β i¿
5 Phân tích phương sai
Để có thể biết mô hình giải thích được như thế nào hay bao nhiêu % biến động của biến phụ thuộc, người ta sử dụng R2
Để có thể biết mô hình giải thích được như thế nào hay bao nhiêu % biến động của biến phụ thuộc, người ta sử dụng R2
5.1 Hệ số xác định
Ta có:
SSE (Sum of Squares Explained) là tổng bình phương của tất cả các sai lệch giữacác giá trị của biến phụ thuộc Y nhận được từ hàm hồi quy mẫu và giá trị trungbình của chúng Phần này đo độ chính xác của hàm hồi quy
Trang 11 0 ≤ R2 ≤ 1.
R2 cao nghĩa là mô hình ước lượng được giải thích được một mức độ cao biến động của biến phụ thuộc
Nếu R2 = 1, nghĩa là đường hồi quy giải thích 100% thay đổi của y
Nếu R2 = 0, nghĩa là mô hình không đưa ra thông tin nào về sự thay đổi của biến phụ thuộc y
Đối với người nghiên cứu thì họ muốn hệ
Trang 125.2 Phân tích ANOVA
Phân tích phương sai (ANOVA) một nhân tố là phân tích ảnh hưởng của mộtnhân tố nguyên nhân (dạng biến định tính) ảnh hưởng đến một nhân tố kết quả (dạngbiến định lượng) đang nghiên cứu
6 Khoảng tin cậy và kiểm định các hệ số hồi quy
6.1 Ước lượng khoảng tin cậy đối với các hệ số hồi quy
Mục đích của phân tích hồi quy không phải chỉ là suy đoán về β1, β2, , βk mà cònphải kiểm tra bản chất của sự phụ thuộc Do vậy cần phải biết phân bố xác suất của β1,β2, , βk Các phân bố này phụ thuộc vào phân bố của các ui
Với các giả thiết OLS, ui có phân phối N (θ, 𝜎2) Các hệ số ước lượng tuân theophân phối chuẩn:
Trang 13Ước lượng phương sai sai số dựa vào các phần dư bình phương tối thiểu Trong đó k là
hệ số có trong phương trình hồi quy đa biến:
Ước lượng 2 phía, ta tìm được thỏa mãn:
Khoảng tin cậy 1 − α của βj̇’ là:
6.2. Kiểm định giả thiết đối với 𝛃 𝐣̇
Kiểm định ý nghĩa thống kê của các hệ số hồi quy có ý nghĩa hay không; kiểmđịnh rằng biến giải thích có thật sự ảnh hưởng đến biến phụ thuộc hay không Nóicách khác là hệ số hồi quy có ý nghĩa thống kê hay không
Có thể đưa ra giả thiết nào đó đối với βj̇’, chẳng hạn βj̇’ = βj̇’ ∗ Nếu giả thiết nàyđúng thì:
Trang 147.1 Khái quát về kiểm định WALD
Giả sử chúng ta có 2 mô hình dưới đây:
Đặt các mô hình giới hạn và không giới hạn là:
• H1 : “Không phải đồng thời các tham số bằng 0”
Lưu ý rằng (U) chứa k hệ số hồi quy chưa biết và (R) chứa m hệ số hồi quychưa biết Do đó, mô hình R có ít hơn (k-m) thông số so với U Câu hỏi chúng ta nêu
ra là (k-m) biến bị loại ra có ảnh hưởng liên kết có ý nghĩa đối với Y hay không
Trị thống kê kiểm định đối với giả thiết này là:
Trang 15Với R2 là số đo độ thích hợp không hiệu chỉnh Với giả thuyết không, Fc có phân phối F với (k-m) bậc tự do đối với tử số và (n-k) bậc tự do đối với mẫu số.
Bác bỏ giả thuyết H0 khi:
Fc > F(α, k − m, n − k)
Hoặc giá trị p-value của thống kê F nhỏ hơn mức ý nghĩa cho trước
7.2 Kiểm định ý nghĩa của mô hình
Trong mô hình hồi quy đa biến, giả thuyết “không” cho rằng mô hình không có
ý nghĩa được hiểu là tất cả các hệ số hồi quy riêng đều bằng 0
Ứng dụng kiểm định Wald (thường được gọi là kiểm định F) được tiến hành cụ thể như sau:
• Bước 1: Giả thuyết “không” là H0: β1 = β 2 = = β k = 0.
Giả thuyết đối là H1: “có ít nhất một trong những giá trị β khác không”
• Bước 2: Trước tiên hồi quy Y theo một số hạng không đổi và X1, X2, , Xk,
sau đó tính tổng bình phương sai số SSRU, SSRR Phân phối F là tỷ số của haibiến ngẫu nhiên phân phối khi bình phương độc lập
Điều này cho ta trị thống kê:
Vì H0: β1 = β 2 = = β k = 0, nhận thấy rằng trị thống kê kiểm định đối với giả thuyết
này sẽ là:
• Bước 3: Tra số liệu trong bảng F tương ứng với bậc tự do (k-1) cho tử số và
(n- k) cho mẫu số, và với mức ý nghĩa α cho trước
Trang 16• Bước 4: Bác bỏ giả thuyết H0 ở mức ý nghĩa α nếu Fc > F(α, k − 1, n − k)
Trang 17Đối với phương pháp giá trị p-value, tính giá trị p = P (F > F c | H 0 ) và bác bỏ giả
thuyết H0 nếu p bé hơn mức ý nghĩa α.
8 Đa cộng tuyến (Multicollinearity)
Một trong những giả định của mô hình hồi quy tuyến tính cổ điển (CLRM) làkhông có mối quan hệ tuyến tính chính xác (exact linear relationship) giữa các biếngiải thích Nếu có một hoặc nhiều mối quan hệ như vậy giữa các biến giải thích thìchúng ta gọi ngắn gọn là đa cộng tuyến hoặc cộng tuyến (multicollinearity hoặccollinearity)
Hình 2 - Trường hợp đa cộng tuyến
Trang 18III TIỀN XỬ LÝ SỐ LIỆU
1 Đọc dữ liệu (Import data):
Ta sử dụng hàm read.csv để đọc dữ liệu:
Code:
Giải thích:
Đọc dữ liệu và lưu với tên data
Trích 10 dòng đầu tiên của dữ liệu data
Trang 192.2 Kiểm tra định dạng của biến
Như đã trình bày ở trên, ở dữ liệu có 2 biến là biến phân loại, ta cần sử dụng hàm
is.numeric() để kiểm tra định dạng của biến
Trang 20Kiểm tra dữ liệu là liên tục (định lượng), nếu đúng trả về TRUE Ngược lại, nếu là biến phân loại (định tính), trả về giá trị TRUE.
Nhận xét:
Các biến liên túc: layer_height, wall_thickness, infill_density,
nozzle_temperature, bed_temperature, print_speed, fan_speed, roughness, tensionstrength, elongation
Các biến phân loại: infill_pattern, material
2.3 Xử lý định dạng của biến
Như đã trình bày ở trên dữ liệu có 2 biến phân loại, ta cần sử dụng hàm as.factor() để
định nghĩa cho 2 biến này:
NHẬN XÉT CHUNG: Tập dữ liệu sẽ gồm 12 cột dữ liệu với 50 quan sát được trình
bày như ở trên, không có dữ liệu khuyết trong tập dữ liệu Đây là một tập dữ liệu nhỏgiữa các quan sát, chúng ta sẽ sử dụng mô hình hồi quy tuyến tính bội để xây dựng mô
hình hồi quy cho roughness theo các biến đầu vào, kiểm định trung bình 2 mẫu để
Trang 21đánh
Trang 22giá sự ảnh hưởng của biến material tác động lên biến roughness, ANOVA 1 yếu tố đánh giá fan_speed lên roughness.
Mean :170.6 Mean :20.08 Mean :1.672
Median :1.550Median :165.5 Median :19.00
## Median : 50
## Mean : 50
## 3rd Qu.: 75
Mean :53.4 3rd Qu.:80.0Max :90.0
Mean : 5.223rd Qu.: 7.00Max :10.00
wall_thickness infill_density infill_pattern Min : 1.00 Min :10.0 Length:501st Qu.: 3.00 1st Qu.:40.0 Class :characterMedian : 5.00 Median :50.0 Mode :character
Trang 232 Tính toán giá trị thống kê của các biến liên tục
Code:
Giải thích:
Thực hiện tính toán giá trị các biến liên tục rồi lần lượt gán vào trung_binh,do_lech_chuan, GTNN, GTLN, trung_vi, Q1, Q3
Xuất kết quả dưới dạng bảng
3 Thống kê số lượng cho các biến định tính
Lập bảng thống kê số lượng cho biến infill_pattern và biến material
Trang 24Kết quả:
Nhận xét:
Từ bảng thống kê ta có thể nhận biết được: có 25 mẫu in dạng grid (lưới
thẳng), 25 mẫu in dạng honeycomb (tổ ong).
Từ bảng thống kê ta có thể nhận biết được: có 25 mẫu sử dụng vật liệu ABS (acrylonitrile butadiene styrene), 25 mẫu sử dụng vật liệu PLA (axit polylactic).
4 Vẽ đồ thị histogram (biểu đồ cột) thể hiện phân phối của biến phản hồi
abs
25
2525
Trang 25Hình 4 – Đồ thị histogram thể hiện phân phối của các biến phản hồi roughness,
tension_strength, elongation Nhận xét: Ta nhận thấy có biểu đồ tần số của biến độ nhám là khá giống với phân
phối chuẩn vì cao ở một điểm và dốc xuống 2 bên Còn lại 2 đồ thị của sức căng và độgiãn dài thì tuân theo phân phối khác vì sức căng có xu hướng dao động chứ không tậptrung còn độ giãn dài đã gần giống chuẩn nhưng lại có các điểm dị biệt ở đoạn cuối
5 Vẽ biểu dồ boxplot (biểu đồ hộp của biến phản hồi so với biến phân loại
5.1 Vẽ biểu đồ boxplot thể hiện phân phổi của của biến
roughness Code:
Kết quả
Hình 5 - Biểu đồ boxplot của biến roughness với biến phân loại infill_pattern và
ttern",xlab="infill pattern", ylab="roughness", col=c(6,4))
b="material", ylab="roughness", col=c(2,3))
Trang 265.2 Vẽ biểu đồ boxplot thể hiện phân phối của biến
tension_strenght Code:
Kết quả:
Hình 6 - Biểu đồ boxplot của biến tension_strengh với biến phân loại infill_pattern và
material
and infill pattern",xlab="infill patern", ylab="tension strenght", col=c(6,4))
material",xlab="material", ylab="tension strenght", col=c(2,3))
Trang 275.3 Vẽ biểu đồ boxplot thể hiện phân phối của biến
elongation Code:
Hình 7 - Biểu đồ boxplot của biến elongation với biến phân loại infill_pattern và
material Nhận xét: Dựa trên kết quả của ba nhóm biểu đồ trên, ta thấy đối với biến phân loại
infill_pattern, ở 3 biến phản hồi dường như không có sự khác biệt, còn đối với biến phân loại material thì ngược lại, có sự thay đổi có thể dễ dàng thấy được.
attern",xlab="infill patern", ylab="elongation", col=c(6,4))
ab="material", ylab="elongation", col=c(2,3))
Trang 286 Vẽ ma trận tương quan giữa các biến
Để thể hiện sự tương quan giữa các biến, giúp hiểu rõ hơn về mối quan hệ tương
quan giữa các biến trong một ma trận tương quan ta sử dụng hàm: corrplot()
Code:
Kết quả:
Hình 8 - Biểu đồ hệ số tương quan giữa các biến liên tục
Qua biểu đồ trên, ta nhận thấy rằng:
roughness tương quan dương cao với layer height (0.80)
bed_temperature tương quan với nozzle_temperature (0.60)
fan_speed tương quan với nozzle_temperature (0.60)
Trang 29 fan_speed và bed_temperature tương quan dương hoàn toàn với nhau (1.00)
Hai biến phản hồi elongation và tension_strength tương quan dương cao với
nhau (0.84)
Ta kết luận được rằng:
Hệ số tương quan giữa roughness và các biến độc lập cho ta dự đoán roughness có quan hệ tuyến tính mạnh với layer_height, và không có quan
hệ tuyến tính mạnh với các biến còn lại
Hệ số tương quan giữa tension_strenght/elongation và các biến độc lập cho
ta dự đoán tension_strenght/elongation không có quan hệ tuyến tính mạnh
với các biến này
Hệ số tương quan giữa biến fan_speed và bed_temperature là 1 nên ở đây
có hiện tượng đa cộng tuyến, do đó, khi xây dựng mô hình ta có thể bỏ mộttrong hai biến
7 Vẽ biểu đồ scatter plot (biểu đồ tán xạ) thể hiện phân phối
Ta có thể vẽ biểu đồ scatter plot (biểu đồ tán xạ) để kiểm tra nhận xét về mối
tương quan giữa các biến phản hồi với các biến đầu vào ở mục 4 Ở đây ta không xét
đến biến fan_speed (vì nó có hiện tượng đa cộng tuyến với biến bed_temperature)
6.1 Vẽ biểu đồ scatter plot thể hiện phân phổi của của biến roughness
plot(data$layer_height,data$roughness, xlab="layer height", ylab="roughness")
plot(data$wall_thickness,data$roughness, xlab="wall thickness", ylab="roughness") plot(data$infill_density,data$roughness, xlab="infill density", ylab="roughness")plot(data$nozzle_temperature,data$roughness, xlab="nozzle_temperature", ylab="rou ghness")
plot(data$bed_temperature,data$roughness, xlab="bed temperature", ylab="roughness
")
plot(data$print_speed,data$roughness, xlab="print speed", ylab="roughness")