Nội dung của giáo trình bao gồm 4 chương: xác định cách tính toán các đại lượng cơ bản của xử lý thống kê; xác định phương pháp so sánh hai tổng thể; phân tích hồi qui và tương quan tuyến tính; ứng dụng các kiểu bố trí thí nghiệm.
Chương PHÂN TÍCH HỒI QUI VÀ TƯƠNG QUAN TUYẾN TÍNH 3.1 PHÂN TÍCH HỒI QUI (Regression analysis) 3.1.1 Mơ hình hồi qui tuyến tính đơn 3.1.2 Kiểm định giả thuyết mối quan hệ tuyến tính (kiểm định t) 3.1.3 Kiểm định mơ hình 3.1.4 Thực hành sử dụng phần mềm Minitab để xác định phương trình hồi qui 3.1.5 Thực hành sử dụng phần mềm Minitab để xác định phương trình hồi qui đa biến 3.2 PHÂN TÍCH TƯƠNG QUAN (Correlation analysis) 3.2.1 Hệ số tương quan (correlation coefficient) 3.2.2 Kiểm định giả thuyết mối tương quan 3.2.3 Hiệp phương sai (covariance) 3.2.4 Thực hành sử dụng phần mềm Minitab để xác định hệ số xác định tương quan BÀI TẬP CỦNG CỐ 38 38 38 39 40 Chương ỨNG DỤNG CÁC KIỂU BỐ TRÍ THÍ NGHIỆM 4.1 XÁC ĐỊNH CÁC THUẬT NGỮ THỐNG KÊ VÀ BỐ TRÍ THÍ NGHIỆM 4.1.1 Một số thuật ngữ thống kê 4.1.2 Một số khái niệm thống kê 4.1.3 Nguyên tắc bố trí thí nghiệm 4.1.4 Các bước cần tuân thủ 4.2 ỨNG DỤNG CÁC KIỂU BỐ TRÍ THÍ NGHIỆM 4.2.1 Thí nghiệm nhân tố 4.2.2 Thí nghiệm nhiều nhân tố BÀI TẬP CỦNG CỐ 52 52 52 52 53 54 56 56 73 81 TÀI LIỆU THAM KHẢO PHỤ LỤC 85 86 ii 41 45 47 47 48 48 49 50 Phân tích mẫu suy đặc tính tổng thể với mức độ tin cậy xác định Biến ngẫu nhiên (random variance) Là đại lượng số mà giá trị tùy thuộc vào lấy mẫu ngẫu nhiên Biến ngẫu nhiên gồm loại biến ngẫu nhiên liên tục biến ngẫu nhiên rời rạc Biến ngẫu nhiên liên tục biến ngẫu nhiên mà giá trị có từ số liên tục Biến liên tục nhận giá trị khoảng số thực Biến ngẫu nhiên rời rạc biến ngẫu nhiên mà giá trị có từ số liệu rời rạc, thường số nguyên dương 1.1.2 Các số đo mô tả Là số dùng để mô tả số liệu, thuật ngữ thường sử dụng cho số đo mô tả tham số (mô tả tập hợp) số thống kê (mô tả mẫu) Đo khoảng cách (range) Là số đo khoảng cách số lớn nhỏ mẫu Đại lượng cho biết thông tin khoảng cách số liệu Ví dụ 2: Một vùng có nhiệt độ từ -20oC đến 50oC => Range = 50(-20) = 70oC Trung bình số học mẫu (mean) Trung bình số mà giá trị mẫu có xu hướng quy tụ n quanh nó, trung bình mẫu có n phần tử tính sau: x = ∑ xi , n i =1 đó: x trung bình mẫu; i có giá trị từ đến n; xi giá trị mẫu phần tử thứ i Trung bình mẫu tính theo tần số tần suất: k k = x = n x ∑ i i ∑ xi fi fi tần suất cá thể có đại n i =i = lượng đo Số trung vị (median) Số trung vị số nằm dãy số dãy số xếp từ nhỏ đến lớn Số trung vị cho kết nhanh ước lượng trung bình mẫu Trong đó: t giá trị tiêu chuẩn Student cho bảng phân phối Student Sai số tính sau: SE = s / n Ví dụ 6: Đo chiều dài heo (45 kg) với số lượng mẫu n = 30, độ tin cậy 95% giá trị t cho bảng phân bố là: t (0,05; 30) = 2,045 Nếu giá trị trung bình 70 cm phương sai 2,5 cm mẫu thí nghiệm giá trị trung bình tổng thể đánh sau: µ = x ± 2,045 (SE) = 70 ± 2,045 (2,5/ 30 ) = 70 ± 0,93 = 69,07-70,93 Hay nói cách khác, thí nghiệm cho số trung bình 70 cm, ta đánh giá chiều dài thực heo nằm khoảng 69,07 cm đến 70,93 cm với độ tin cậy 95% Chú ý: Khi số lượng mẫu n > 30 ta thay t Z (là giá trị xác suất phân phối chuẩn cho sẵn bảng) Hệ số biến động (coefficient of variation) Hệ số biến động dùng để đánh giá biến thiên độ lệch chuẩn so với số trung bình mẫu, giúp ta so sánh biến thiên hai mẫu độc lập với đơn vị đo lường Hệ số biến động tính cơng thức CV ( % )= s ×100 x Ví dụ 7: Có hai máy đóng gói A B, chưa biết máy làm việc ổn định trọng lượng tịnh sản phẩm Lấy máy A số lượng n1 gói, máy B n2 gói đo trọng lượng Kết máy A x A cho = 21 g với SA = 3,2 g tương tự cho máy B 15 g g Nếu nhìn vào độ lệch chuẩn ta nói máy A ổn định máy B máy A có độ lệch chuẩn cao Nếu tính hệ số biến động: CVA = 100 x 3,2/21 = 15,24%; CVB = 100 x 3/15 = 20% Vậy máy A đóng gói ổn định trọng lượng máy B 1.1.3 Ước lượng cỡ mẫu Để ước lượng tham số tập hợp ta dựa vào đặc trưng mẫu, mẫu nhỏ giá trị ước lượng tập hợp bị sai lệch, ngược lại mẫu lớn giá trị ước lượng tham số tập hợp xác Chương PHÂN TÍCH HỒI QUI VÀ TƯƠNG QUAN TUYẾN TÍNH MỤC TIÊU HỌC TẬP Sau học xong này, người học có thể: - Xác định phương trình hồi qui tuyến tính đơn - Xác định hệ số tương quan 3.1 PHÂN TÍCH HỒI QUI (REGRESSION ANALYSIS) 3.1.1 Mơ hình hồi qui tuyến tính đơn Được dùng để xem xét mối liên hệ tuyến tính hai biến X Y, X biến độc lập (ảnh hưởng đến biến Y) Y biến phụ thuộc Biến độc lập biến mà thay đổi khơng lệ thuộc hay ảnh hưởng từ biến khác Biến phụ thuộc biến mà thay đổi bị lệ thuộc hay bị ảnh hưởng từ biến khác Mục tiêu phân tích hồi qui mơ hình hố mối quan hệ biến X Y, nghĩa từ liệu thu thập ta cố gắng xây dựng mơ hình tốn học Giả sử có biến X Y, Y xem phụ thuộc tuyến tính vào X Với giá trị xi X, giá trị tương ứng y ˆ biến Y i thể công thức: yˆ i α + β xi + ε hay (Y = α + βX) Trong = đó: α, β số; β độ dốc đường hồi qui hay hệ số hồi qui; ε sai số ngẫu nhiên Các giả định: E (ε) = ε ~ N (0, σ ε2 ) εi εj độc lập với εi độc lập với xi 38 Để kiểm định α = αo: Kiểm định giả thuyết điểm cắt trục tung α dựa phân phối t tα = tα = a − α0 ( ( ) ∑( X s n+ X i −X )) a − α0 +Χ MS xy n ∑ Χ ( ) ~ tn-2 t b = b MS ∑Χ XY 3.1.3 Kiểm định mơ hình Việc kiểm định giả thuyết hệ số phức tạp, trường hợp ta dùng phương pháp phân tích phương sai Ta có: Hệ số xác định R2 giúp ta biết phần trăm biến thiên Y phụ thuộc vào X R = SSR SSE = 1− SST SST SSR: thể phần biến thiên Y SST: thể toàn biến thiên Y SSE: thể phần biến thiên Y yếu tố không nghiên cứu đến Ta có: ≤ R2 ≤ R2 bình phương hệ số tương quan (r) R2 lớn mơ hình hồi qui xem thích hợp, có ý nghĩa Kiểm định F: Sử dụng nhằm kiểm định giả thuyết tồn mối quan hệ tuyến tính X Y 40 Chuyển biến Y vào hộp response biến X vào hộp predictors chọn resultes 42 Bước 4: Tiếp tục chọn Trong hộp thoại nếu: + Chọn Linear đồ thị hàm bậc + Chọn Quadratic đồ thị hàm bậc hai + Chọn Cubic đồ thị hàm bậc ba 44 Bước 3: đọc kết The regression equation is Y = 1527 - 24.4 X1(tđ) + 11.1 X2(tg) Analysis of Variance Source Regression DF SS MS 46 P 4077.0 2038.5 23.44 0.006 Residual Error 347.8 87.0 Total F 4424.9 3.2.2 Kiểm định giả thuyết mối tương quan Hệ số r để xem xét biến X Y có liên hệ tương quan với không, kiểm định Ho cho hệ số tương quan tổng thể p = Giả thuyết: Ho: p = (X Y không liên hệ) H1: p ≠ (X Y có liên hệ) Giá trị kiểm định: tr = r (1 − r ) ( n − 2) Ở mức ý nghĩa α, ta bác bỏ Ho nếu: −t < t r n − 2; α hay t >t r n − 2; α 3.2.3 Hiệp phương sai (covariance) Thông số dùng để đo lường mối liên hệ đồng biến nghịch biến gọi hiệp phương sai Cho biến X Y có số trung bình µx µy hiệp phương sai định nghĩa sau: σ xy = ∑( X i − µ x ) (Yi − µ y ) N Hiệp phương sai mẫu: sxy = ∑( X i − X )(Yi − Y ) n −1 - X Y đồng biến hiệp phương sai >0 - X Y nghịch biến hiệp phương sai