Trong thí nghiệm này, chúng ta sẽ thực hiện thuật toán hồi quy để dự đoán cường độ chịu nén của hỗn hợp bê tông dựa trên đặc trưng của nó là tỷ lệ các thành phần riêng lẻ được trộn.. Phư
TỔNG QUAN DỮ LIỆU
Thông tin chung
Bê tông là vật liệu thiết yếu trong xây dựng dân dụng, với cường độ nén phụ thuộc phi tuyến vào tuổi và thành phần Các thành phần chính của bê tông bao gồm xi măng, xỉ lò cao, tro bay, nước, chất siêu dẻo, cốt liệu thô và cốt liệu mịn.
Trong thí nghiệm này, chúng ta sẽ áp dụng thuật toán hồi quy để dự đoán cường độ chịu nén của hỗn hợp bê tông dựa trên tỷ lệ các thành phần riêng lẻ Dữ liệu sử dụng trong nghiên cứu gồm 1030 giá trị quan trắc, được chia thành 9 biến: cement, slag, ash, water, superplastic, coarseagg, fineagg, age và strength.
Nguồn tài liệu: https://www.kaggle.com/datasets/vinayakshanawad/cement- manufacturing-concrete-dataset
Các biến trong tập dữ liệu
Tên của biến Mô tả
Xi măng là chất kết dính thủy dạng bột mịn, thường có màu ghi hoặc trắng, được sản xuất từ Clinker nghiền mịn kết hợp với thạch cao thiên nhiên và các phụ gia như vỏ sò, đất sét để tăng cường độ kết dính Trong ngành công nghiệp nhiệt điện chạy than, xi măng cũng được tính theo kg trong hỗn hợp m3, đồng thời, phế thải từ buồng đốt sẽ được thải ra qua ống khói của nhà máy.
(Tính bằng kg trong hỗn hợp m3)
Nước là thành phần quan trọng giúp xi măng phản ứng và tạo ra các sản phẩm thủy hóa, từ đó tăng cường độ cho bê tông Ngoài ra, nước còn cung cấp tính lưu động cần thiết, giúp quá trình thi công diễn ra thuận lợi hơn.
(Tính bằng kg trong hỗn hợp m3)
Độ dẻo của hỗn hợp bê tông là một tính chất quan trọng, phản ánh tính lưu động của vữa bê tông trong quá trình thi công Độ dẻo được đo bằng độ sụt trong khuôn tiêu chuẩn Việc kiểm tra thường xuyên độ dẻo trong thi công là cần thiết để điều chỉnh lượng nước và xi măng, đảm bảo chất lượng bê tông đạt yêu cầu.
(Tính bằng kg trong hỗn hợp m3)
Cốt liệu thô bao gồm các hạt có kích thước từ 5 mm đến 70 mm, với cốt liệu lớn thường là đá dăm, sỏi, hoặc sỏi dăm (được đập hoặc nghiền từ sỏi) Hỗn hợp này có thể kết hợp giữa đá dăm và sỏi hoặc sỏi dăm.
(Tính bằng kg trong hỗn hợp m3)
7 Fineagg (cốt liệu Cốt liệu nhỏ là hỗn hợp các hạt cốt liệu có kích
KIẾN THỨC NỀN
ANOVA
1.2.1/ Giả định về mô hình hồi quy tuyến tính:
Trong thống kê, việc đánh giá thông tin của tổng thể là mục tiêu chính, nhưng do kích thước lớn của tổng thể, việc thu thập thông tin trực tiếp là không khả thi Do đó, chúng ta sử dụng dữ liệu từ mẫu nghiên cứu để ước lượng và kiểm định thông tin của tổng thể Tương tự, trong hồi quy tuyến tính, các hệ số hồi quy tổng thể như β1, β2 và hằng số hồi quy β0 là những tham số quan trọng nhưng không thể đo lường trực tiếp Vì vậy, chúng ta áp dụng tham số từ mẫu để ước lượng và suy diễn về tổng thể Phương trình hồi quy trên mẫu nghiên cứu sẽ giúp thực hiện điều này.
Cùng với đó, nó phải thỏa mãn 4 giả định dưới đây thì nó mới được cho là một mô hình hồi quy tuyến tính:
- Mỗi giá trị của x và y được quan sát và không có sai sót đo lường
- Phần dư có giá trị trung bình bằng 0
- Phần dư tuân theo quy luật phân phối chuẩn
- Phần dư có phương sai thuần nhất (homoscedasticity), không phụ thuộc vào biến độc lập
1.2.2/ Mô hình hồi quy tuyến tính đơn (simple linear regression model):
1.2.3/ Mô hình hồi quy tuyến tính bội (multiple linear regression model):
Mô hình hồi quy là công cụ phân tích giúp xác định mối quan hệ tuyến tính giữa biến phụ thuộc Y và hai hoặc nhiều biến độc lập Qua đó, chúng ta có thể dự đoán giá trị của biến phụ thuộc Y dựa trên các biến độc lập đã được xác định.
Mô hình hồi quy tuyến tính bội có dạng:
Khoảng tin cậy là một khái niệm quan trọng trong thống kê, thể hiện xác suất mà tham số tổng thể sẽ nằm trong khoảng giữa hai giá trị nhất định Khái niệm này giúp các nhà nghiên cứu ước lượng độ chính xác của các tham số trong một khoảng thời gian cụ thể.
Bước 1: Sử dụng lệnh read_csv (“concrete.csv”) để đọc dữ liệu từ file: library(readxl) concrete_data = 100 & data$cement < 0)) qqline(subset(data$strength, data$cement >= 100 & data$cement = 100 & data$cement 200 & data$cement 200 & data$cement 200 & data$cement