Thống kê không chỉ giúp doanh nghiệp phân tích dữ liệu một cách chính xác, mà còn hỗ trợ trong việc ra quyết định dựa trên cơ sở khoa học, từ đó nâng cao hiệu quả sản xuất, giảm thiểu rủ
Cơ sở lý thuyết
Dữ liệu thực nghiệm là những số liệu thống kê chưa qua xử lý, được thu thập từ đại lượng quan tâm, ký hiệu là X, với N là số liệu thu thập được Dữ liệu thực nghiệm được trình bày dưới dạng một tập hợp.
Các thuộc tính cơ bản của dữ liệu bao gồm:
Giá trị cực tiểu: Xmin = Min (X1, X2, …, XN)
Giá trị cực đại: Xmax = Max (X1, X2, …, XN)
Khoảng dữ liệu: R = Xmax - Xmin b, Phương sai mẫu S 2
Với tập số liệu { X 1 , X 2 , …, X N }, Phương sai mẫu được xác định như sau:
Phương sai mẫu là một công cụ quan trọng trong việc suy diễn phương sai của đám đông Để tính toán phương sai mẫu, người ta thường sử dụng một công thức đơn giản dựa trên dữ liệu thu thập được.
Với số liệu mẫu (X1, …, Xn), độ lệch chuẩn mẫu được xác định từ phương sai mẫu:
Xác định kỳ vọng phương sai, độ lệch chuẩn của từng biến X
Bảng 1: Kỳ vọng, phương sai, độ lệch chuẩn
2, Xác định biến thiên trong các Nhóm (X), giữa các Nhóm (X1, X2, X3) (có thể áp dụng phần mềm R, phân tích Anova),
Lý thuyết Phương pháp phân tích Anova
Quy trình kiểm định theo phương pháp xác suất tới hạn như sau:
Xác định các tổng bình phương
Xác định các trung bình bình phương
Xác định trị thống kê F 0
Chọn xác suất sai lầm α , ra quyết định a > P → bác bỏ H 0 a < P → chấp nhận H 0
Phân tích phương sai ANOVA có hỗ trợ bởi các phần mềm chuyên dụng, với phương tiện là bảng phân tích ANOVA sau:
Giữa các đám đông SS B m-1 MSB MSB/MSE
Trong các đám đông SS E N-m MSE
MS: trung bình bình phương
trường hợp 1 : Vận tốc cắt X 1
Xét 5 lần thử của X 1 ta được bảng sau:
Số liệu 5 lần đo vận tốc cắt X 1
Chênh lệch bình phương giữa các nhóm là:
Chênh lệch bình phương trong từng nhóm là :
Từ bảng trên ta tính được
Trung bình bình phương giữa các tổng thể
Trung bình bình phương do sai số
Giả thuyết bài toán so sánh các kỳ vọng của các đám đông
Nhằm kiểm định giả thiết ta xây dựng hàm thống kê F0 là tỷ số giữa các trung bình bình phương:
Với α = 0,05 xác định trị phân vị theo chuẩn fisher Fα, m-1, n-m = 2,76 ta thấy:
Kết luận: với α= 0,05, ta thấy có sự khác biệt giữa kì vọng của các đám đông,
Lượng chạy dao ngang X 2
Xét 5 lần thử của X 2 ta được bảng sau:
Chênh lệch bình phương giữa các nhóm là:
Chênh lệch bình phương trong từng nhóm là:
Từ bảng trên ta tính được
Trung bình bình phương giữa các tổng thể
Trung bình bình phương do sai số
Giả thuyết bài toán so sánh các kỳ vọng của các đám đông
Nhằm kiểm định giả thiết ta xây dựng hàm thống kê F0 là tỷ số giữa các trung bình bình phương:
Với α = 0,05 xác định trị phân vị theo chuẩn fisher Fα, m-1, n-m = 2,76 ta thấy:
Kết luận: với α= 0,05, ta thấy có sự khác biệt giữa kì vọng của các đám đông.
Chiều sâu cắt X 3
Xét 5 lần thử của X3 ta được bảng sau:
Chênh lệch bình phương giữa các nhóm là:
Chênh lệch bình phương trong từng nhóm là:
Từ bảng trên ta tính được
Trung bình bình phương giữa các tổng thể
Trung bình bình phương do sai số
Giả thuyết bài toán so sánh các kỳ vọng của các đám đông
Giữa các đám đông 0,3125 4 0,078 19,89 2,048]
Nhận xét cho thấy rằng trị thống kê nằm trong vùng bác bỏ giả thuyết, dẫn đến việc H0 bị bác bỏ Điều này chỉ ra rằng độ dốc của mô hình khác 0, và mô hình được coi là phù hợp và được chấp nhận.
Kiểm định X 2 -Y
SE =√ MS E = ( MS E = ( n SS − E 2 ) ) =2,1 [1] tr147 & [1] tr140
SSx = 0,0096 (Theo phần 3 chỉ số tương quan phù hợp)
Trị thống kê được tính như sau: ¿=¿
Vậy vùng bác bỏ giả thiết H0 là: R = [T0 < -2,048 ; T0 >2,048]
Nhận xét: Ta thấy rằng trị thống kê không nằm trong vùng bác bỏ giả thiết,
H0 được chấp nhận, độ dốc mô hình bằng 0, mô hình không được chấp nhận.
Kiểm định mô hình hồi quy đơn biến là kiểm định đô dốc mô hình với giả thuyết:
KIỂM SOÁT TRUNG BÌNH VÀ QUÁ TRÌNH BIẾN THIÊN CỦA CÁC BIẾN X BẰNG KIỂM ĐỒ KHOẢNG RCC
Kiểm soát đặc tính chất lượng thông số đầu vào vận tốc cắt X 1
Ta thu thập số liệu 30 mẫu với cỡ mẫu bằng 5.
Bảng 5.1 Số liệu đo vận tốc cắt X 1
Ta có chỉ số biến thiên: R i = X i ,max − X i , min Để kiểm soát biến thiên, ta dùng kiểm đồ khoảng Từ bảng ta tính được trung bình khoảng: R = 10,3
Với cỡ mẫu n = 5, tra bảng ta được D3 = 0, D4 = 2,115 Giới hạn kiểm soát cho biểu đồ khoảng RCC:
Hình 5.1 Kiểm đồ khoảng RCC của vận tốc cắt X 1
Các mẫu phân bố không đồng đều cho thấy sự tồn tại của một số điểm cách xa đường tâm, điều này cần được nghiên cứu kỹ lưỡng Việc tìm ra các biện pháp cải thiện chất lượng sản phẩm là vô cùng cần thiết để nâng cao hiệu suất và độ đồng nhất trong quy trình sản xuất.
Kiểm soát đặc tính chất lượng thông số đầu vào lượng chạy dao ngang X 2
Ta thu thập số liệu 30 mẫu với cỡ mẫu bằng 5.
Bảng 5.2 Số liệu đo lượng chạy dao ngang X 2
Ta có chỉ số biến thiên: R i = X i ,max − X i , min Để kiểm soát biến thiên, ta dùng kiểm đồ khoảng Từ bảng ta tính được trung bình khoảng: R = 0,0106
Với cỡ mẫu n = 5, tra bảng ta được D3 = 0, D4 = 2,115 Giới hạn kiểm soát cho biểu đồ khoảng RCC:
Bảng 5.2 Kiểm đồ khoảng RCC của lượng chạy dao ngang X 2
Các mẫu phân bố không đồng đều cho thấy sự tồn tại của những điểm cách xa đường tâm, điều này cần được nghiên cứu kỹ lưỡng Việc tìm ra các biện pháp cải thiện chất lượng sản phẩm là rất quan trọng để nâng cao hiệu quả và sự đồng nhất trong quy trình sản xuất.
PHÂN TÍCH, ĐÁNH GIÁ MỨC ĐỘ ẢNH HƯỞNG CỦA CÁC THÔNG SỐ ĐẦU VÀO ĐẾN CÁC THÔNG SỐ ĐẦU RA, CÁCH THIẾT KẾ THỰC NGHIỆM
Phân tích, đánh giá mức độ ảnh hưởng của các thông số đầu vào đến các thông số đầu ra
Biến X1 có mức độ tương quan thấp với sản phẩm gia công Y (-0,7396), cho thấy sự thay đổi của Y khi X1 thay đổi Khi X1 = 140 (8 lần), sự chênh lệch của Y khá lớn với Ymax = 5,66 và Ymin = 1,12 Chỉ số tương quan âm cho thấy khi X1 tăng, Y giảm và ngược lại Ngược lại, khi X1 = 180 (12 lần), chênh lệch của Y giảm với Ymax = 3,94 và Ymin = 1,92.
Vậy mức độ tương quan đã phản ánh đúng giữa thông số đầu vào X1 và thông số đầu ra Y,
Biến X2 có mức độ tương quan phù hợp là 0,37784, cho thấy mối quan hệ dương giữa X2 và Y; tức là khi X2 tăng, Y cũng tăng theo Cụ thể, khi X2 = 0,04, giá trị sản phẩm Y dao động từ Ymin = 1,24 đến Ymax = 2,88 Tương tự, với X2 = 0,06, giá trị Y nằm trong khoảng Ymin = 1,44 và Ymax = 2,84 Đặc biệt, khi X2 = 0,08, sản phẩm gia công Y cho thấy sự chênh lệch lớn hơn với Ymax = 5,66 và Ymin = 2,16.
Biến X3 có mức độ tương quan âm (-0,2828), cho thấy khi X3 tăng, giá trị Y giảm và ngược lại Cụ thể, với X3 = 0,2, có sự chênh lệch lớn giữa các kết quả gia công Y, với Ymax = 5,22 và Ymin = 1,24 Khi X3 = 0,1, giá trị Y nằm trong khoảng từ 2,1 đến 2,8, nhưng vẫn có trường hợp Y = 5,66 vượt qua Ymax của X3 = 0,2, điều này cần kiểm tra để xác định có phải là sai số thô hay không Nếu đúng, các dữ liệu này sẽ được loại bỏ để đảm bảo tính chính xác của số liệu thực nghiệm Đối với X3 = 0,15, các kết quả gia công Y cũng nằm trong khoảng 2,1 – 2,8, nhưng có một số giá trị ngoài như Y = 3,94 và Y = 1,44, cần áp dụng các phương pháp tương tự để xử lý.
Biến X4 có mức độ tương quan dương với chỉ số 0,05372, cho thấy khi X4 tăng, giá trị Y cũng tăng theo Cụ thể, khi X4 = 0,2, giá trị sản phẩm gia công Y đạt Ymax = 3,32 và Ymin = 1,12, cho thấy sự chênh lệch thấp Tương tự, khi X4 = 0,3, kết quả sản phẩm Y nằm trong khoảng 1,9 – 2,3, với một số trường hợp ngoại lệ như Y = 3,94 và Y = 1,44, cần xem xét lại để xác định có phải là sai số thô hay không, nhằm loại bỏ để tránh sai lệch số liệu.
XÂY DỰNG MÔ HÌNH HỒI QUI CỦA CÁC THÔNG SỐ, NHẬN XÉT, KẾT LUẬN KẾT QUẢ THỰC NGHIỆM
- Cách thức thực hiện: (Nộp quyển chấm vấn đáp)
- Hình thức trình bày: Báo cáo gồm 25 –35 trang, đánh máy khổ giấy A4 (theo mẫu),
1, Hoàn thành bài tập lớn theo đúng thời gian quy định (từ ngày 24/04/2024 đến ngày 18/06/2024)
2, Báo cáo sản phẩm nghiên cứu theo chủ đề được giao trước giảng viên và những sinh viên khác,
IV, HỌC LIỆU THỰC HIỆN BÀI TẬP LỚN
[1] Nguyễn Như Phong, Thống kê trong công nghiệp, NXB Đại học quốc gia -
[2] Nguyễn Như Phong, Kiểm soát chất lượng bằng phương pháp thống kê, NXB Đại học quốc gia - TPHCM, 2006,
Hà Nội, ngày 05 tháng 04 năm 2024,
1,Lý thuyết kỳ vọng, phương sai, độ lệch chuẩn
1.1 Cơ sở lý thuyết a, Dữ liệu thực nghiệm
Dữ liệu thực nghiệm là số liệu thống kê chưa qua xử lý, được thu thập từ đại lượng quan tâm, ký hiệu là X Số liệu thu thập được gọi là N, và dữ liệu thực nghiệm được thể hiện thông qua một tập hợp cụ thể.
Các thuộc tính cơ bản của dữ liệu bao gồm:
Giá trị cực tiểu: Xmin = Min (X1, X2, …, XN)
Giá trị cực đại: Xmax = Max (X1, X2, …, XN)
Khoảng dữ liệu: R = Xmax - Xmin b, Phương sai mẫu S 2
Với tập số liệu { X 1 , X 2 , …, X N }, Phương sai mẫu được xác định như sau:
Phương sai mẫu là một công cụ quan trọng trong thống kê, thường được sử dụng để suy diễn phương sai của toàn bộ đám đông Để tính toán phương sai mẫu, người ta thường áp dụng một công thức đơn giản dựa trên dữ liệu đã thu thập.
Với số liệu mẫu (X1, …, Xn), độ lệch chuẩn mẫu được xác định từ phương sai mẫu:
1.2 Xác định kỳ vọng phương sai, độ lệch chuẩn của từng biến X a, Kỳ vọng
Bảng 1: Kỳ vọng, phương sai, độ lệch chuẩn
2, Xác định biến thiên trong các Nhóm (X), giữa các Nhóm (X1, X2, X3) (có thể áp dụng phần mềm R, phân tích Anova),
2.1 Lý thuyết Phương pháp phân tích Anova
Quy trình kiểm định theo phương pháp xác suất tới hạn như sau:
Xác định các tổng bình phương
Xác định các trung bình bình phương
Xác định trị thống kê F 0
Chọn xác suất sai lầm α , ra quyết định a > P → bác bỏ H 0 a < P → chấp nhận H 0
Phân tích phương sai ANOVA có hỗ trợ bởi các phần mềm chuyên dụng, với phương tiện là bảng phân tích ANOVA sau:
Giữa các đám đông SS B m-1 MSB MSB/MSE
Trong các đám đông SS E N-m MSE
MS: trung bình bình phương
2.2 trường hợp 1 : Vận tốc cắt X 1
Xét 5 lần thử của X 1 ta được bảng sau:
Số liệu 5 lần đo vận tốc cắt X 1
Chênh lệch bình phương giữa các nhóm là:
Chênh lệch bình phương trong từng nhóm là :
Từ bảng trên ta tính được
Trung bình bình phương giữa các tổng thể
Trung bình bình phương do sai số
Giả thuyết bài toán so sánh các kỳ vọng của các đám đông
Nhằm kiểm định giả thiết ta xây dựng hàm thống kê F0 là tỷ số giữa các trung bình bình phương:
Với α = 0,05 xác định trị phân vị theo chuẩn fisher Fα, m-1, n-m = 2,76 ta thấy: