Vị trí quan trắc Độ pH (mS/cm) Độ dẫn Đập Mỹ Đô7.1

Một phần của tài liệu BTL xác suất thống kê Trường đại học bách khoa TPHCM (Trang 44 - 61)

Đập Cánh Gà 7.13 423 Cống Cốc Thành 7.05 468 Cống sông Chanh 6.88 532 Cống Nhâm Tràng 7.39 380 Cống Kinh Thanh 7.39 395 Cống Cổ Đam 7.31 408 Cống Vĩnh Trị 7.02 441 Quán Chuột 7.22 635 Đập Cầu Ghéo 7.23 487 Cầu Họ, sông Sắt 7.34 412 Đập An Bài 7.46 362 *Cơ sở lý thuyết: Hệ số tương quan

 Phân tích tương quan: Hai biến số ngẫu nhiên X,Y có thể liên quan tuyến tính, có khuynh hướng tuyến tính, hoặc không liên quan đến nhau.

 Hệ số tương quan:

Nếu R > 0 thì X, Y tương quan thuận. Nếu R < 0 thì X, Y tương quan nghịch. Nếu R = 0 thì X, Y không tương quan.

Nếu | R |= 1 thì X, Y có quan hệ hàm bậc nhất.

Nếu | R |→ 1 thì X, Y có tương quan chặt (tương quan mạnh). Nếu | R |→ 0 thì X, Y có tương quan không chặt (tương quan yếu).

Quan hệ giữa X và Y:

Chúng ta muốn kiểm định các giả thiết liên quan đến giả thiết các giá trị khác nhau của hệ số tương quan tổng thể, ký hiệu p, dựa trên phân phối mẫu của hệ số tương quan mẫu R.

Kiểm định giả thiết:

H0: = 0 đối với H1: 0 (hoặc > 0 hoặc < 0)

Người ta chứng minh được rằng với giả thiết H0, phân phối mẫu của R đối xứng; từ đó, thống kê

T = R~ Student (n – 2) Trắc nghiệm t được dụng trong trường hợp này.

Ước lượng đường hồi quy:

Phương trình hồi quy tuyến tính:

Kiểm định hệ số a, b:

Giả thiết H0: Hệ số hồi quy không có ý nghĩa (=0).

Giả thiết H1: Hệ số hồi quy có ý nghĩa (≠0). Trắc nghiệm t < t α,n-2: chấp nhận H0.

Kiểm định phương trình hồi quy:

Giả thiết H0: “Phương trình hồi quy tuyến tính không thích hợp”.

Giả thiết H1: “Phương trình hồi quy tuyến tính thích hợp”. Trắc nghiệm F < F α,1 ,n-2: chấp nhận H0.

*Dạng bài: Phân tích tương quan và hồi quy. *Công cụ giải: Correlation, Regression.

*Giải quyết bài toán trên Excel:

1 Xác định hệ số tương quan:

Bước 1: Nhập bảng số liệu vào Excel.

Bước 2: Sử dụng công cụ “Correlation” trong Data/ Data Analysis

 Input: địa chỉ tuyệt đối chứa dư liệu.  Output Range: vị trí xuất kết quả.  Labels in first row

Kết quả

Kết luận: Dựa vào kết quả trên Excel ta có hệ số tương quan: R = -0.53960898 chứng tỏ giữa độ pH và độ dẫn có quan hệ khá chặt chẽ và có tương quan nghịch.

2 Dự đoán phương trình đường hồi quy tuyến tính:

Bước 2: Sử dụng công cụ “Regression” trong Data/ Data Analysis:

Bước 3: Chọn các mục như hình

 Input: địa chỉ tuyệt đối chứa dữ liệu.  Output Range: vị trí xuất kết quả.  Labels in first row

Bước 4: Biện luận:

*Phương trình hồi quy có dạng: y = –235.0833x – 2148.185

*Kiểm định hệ số a, b có nghĩa thống kê (a là hệ số tự do, b là hệ số góc)  Giả thiết H0: a, b không có ý nghĩa thống kê.

 Giả thiết H1: a, b có ý nghĩa thống kê.

 P- Value = 0.028 < 0.05 → Bác bỏ H0, chấp nhận H1. Vậy hệ số tự do a có ý nghĩa thống kê.

 P – Value = 0.0702 > 0.05 → Chấp nhận H0. Vậy hệ số góc b không có ý nghĩa thống kê.

*Kiểm định đường hồi quy tuyến tính

 Giả thiết H0: Phương trình đường hồi quy không thích hợp.  Giả thiết H1: Phương trình đường hồi quy thích hợp.

 Significance F = 0.0702 > 0.05 → Chấp nhận H0.

 Kết luận: Phương trình đường hồi quy tuyến tính thích hợp. 3 Nhận xét về mối tương quan giữa độ pH và độ dẫn

Bước 1: Nhập bảng số liệu:

Bước 2: Tính giá trị quan sát T

Bước 3: Tính giá trị ngưỡng c

Kết quả

 Giả thiết H0: Độ pH và độ dẫn không có tương quan tuyến tính.  Giả thiết H1: Độ pH và độ dẫn có tương quan tuyến tính.

 |T| < c → Chấp nhận H0.

 Kết luận: Độ pH và độ dẫn (mS/cm) không có tương quan tuyến tính.

Câu 10: Chọn ra k biến (k>=3) và xem xét có thể lập mô hình hồi quy tuyến tính đa biến giữa chúng hay không.

Bảng dưới đây thể hiện kết quả đo các chỉ tiêu bao gồm Nhiệt độ, Độ dẫn điện, Độ đục của 20 điểm đo khác nhau. Hãy kiểm tra xem có thể lập mô hình hồi quy tuyến tính giữa 3 tiêu chí trên hay không?

Nhiệt độ Độ dẫn điện Độ đục Liên Mạc 21,5 536 24 Cầu Diễn 21,6 483 27 Đập Hà Đông 21,9 596 30 Cầu Tó 22,0 582 30 Cầu Xém 21,9 550 31 Đập Đồng Quan 22,0 523 38 Đập Nhật Tựu 23,3 623 23 Cống Lương Cổ 23,7 567 19 Cầu Phù Vân 23,3 453 6 Sông Đăm 21,5 438 64 Sông Cầu Ngà 21,5 461 128 Đập Thanh Liệt 22,3 690 32 Kênh Xuân La 22,4 616 40 Kênh Phú Đô 22,7 843 32

Kênh Trung Văn 22,7 749 63

Cầu Am 21,8 499 35

Kênh Đa Sỹ 22,6 1154 37

Kênh La Khê 21,9 627 45

Kênh Vân Đình 23,0 494 23

Kênh Duy Tiên 22,8 551 42

*Cơ sở lý thuyết:

Hồi quy tuyến tính đa tham số

Trong hồi quy tuyến tính đa tham số, biến số phụ thuộc Y có liên quan đến k biến số độc lập Xi (I = 1, 2, …, k) thay vì chỉ có một như trong hồi quy tuyến tính đơn giản.

Phương trình tổng quát

|X0, X1, …, Xk = B0 + B1X1 + B2X2 + …+ BkXk

Bảng ANOVA

Nguồn sai số Bậc sai số Tổng số bìnhphương Bình phương trungbình Giá trị thốngkê

Sai số N - k -1 SSE MSE = SSE/(N - k -1)

Tổng cộng N - 1 SST = SSR + SSE

Giá trị thống kê

Giá trị R bình phương

Giá trị R2 được hiệu chỉnh (Adjusted R Square) R2 = = Giá trị R2 được hiệu chỉnh (Adjusted R Square)

Rn2 = R2

(Rn2 sẽ trở nên âm hay không xác định nếu R2 hay N nhỏ)

Độ lệch chuẩn

S = (S =< 0.30 là khá tốt)

Trắc nghiệm thống kê

Tương tự hồ quy đơn giản, song bạn cần chú ý:  Trong trắc nghiệm t:

H0: i = 0 “Các hệ số hồi quy không có ý nghĩa” H1: i 0 “Có ít nhất vài hệ số hồi quy có ý nghĩa” Bậc tự do của giá trị t: = N – k – 1

 Trong trắc nghiệm F:

H0: i = 0 “Phương trình hồi quy không thích hợp”.

H1: i 0 “Phương trình hồi quy thích hợp” với nhất nhất vài i. Bậc tự do của giá trị F: v1 = 1; v2 = N – k – 1.

*Dạng bài: Hồi quy tuyến tính đa tham số. *Công cụ giải: Regression.

*Giải quyết bài toán trên Excel:

Bước 1: Nhập bảng dữ liệu

Bước 3: Chọn các mục như hình

 Input: địa chỉ tuyệt đối chứa dữ liệu.  Output Range: vị trí xuất kết quả.  Labels in first row

Kiểm tra sự tác động của “Nhiệt độ” đến “Độ đục”

Biện luận :

 Phương trình hồi quy có dạng: y = -16.7908x + 413.2206

 Kiểm định hệ số a, b có nghĩa thống kê (a là hệ số tự do, b là hệ số góc).  Giả thiết H0: a, b không có ý nghĩa thống kê.

 Giả thiết H1: a, b có ý nghĩa thống kê.

 P – Value = 0.031062 < 0.05 → Bác bỏ H0, chấp nhận H1. Vậy hệ số tự do a có ý nghĩa thống kê.

 P – Value = 0.04794 < 0.05 → Chấp nhận H1. Vậy hệ số góc b có ý nghĩa thống kê.

 Kiểm định đường hồi quy tuyến tính

 Giả thiết H0: Phương trình đường hồi quy tuyến tính không thích hợp.  Giả thiết H1: Phương trình đường hồi quy tuyến tính thích hợp.

 Significance F = 0.04794 < 0.05 → Bác bỏ H0.

 Kết luận: Phương trình đường hồi quy tuyến tính thích hợp.  Ta có thể kết luận rằng Nhiệt độ có tác động đến Độ đục của điểm đo.

Biện luận :

 Phương trình hồi quy có dạng: y = -0.0115x + 45.3858

 Kiểm định hệ số a, b có nghĩa thống kê (a là hệ số tự do, b là hệ số góc).  Giả thiết H0: a, b không có ý nghĩa thống kê.

 Giả thiết H1: a, b có ý nghĩa thống kê.

 P – Value = 0.055821 > 0.05 → Chấp nhận H0. Vậy hệ số tự do a không có ý nghĩa thống kê.

 P – Value = 0.7591 > 0.05 → Chấp nhận H0. Vậy hệ số góc b không có ý nghĩa thống kê.

 Kiểm định đường hồi quy tuyến tính

 Giả thiết H0: Phương trình đường hồi quy tuyến tính không thích hợp.  Giả thiết H1: Phương trình đường hồi quy tuyến tính thích hợp.

 Significance F = 0.7591 > 0.05 → Chấp nhận H0.

 Kết luận: Phương trình đường hồi quy tuyến tính không thích hợp.

 Ta có thể kết luận rằng Độ dẫn điện không tác động đến Độ đục của điểm đo.

Kiểm tra sự tác động của “Nhiệt độ” và “Độ dẫn điện” đến “Độ đục”

Biện luận

 Phương trình hồi quy có dạng: y = 417.6108 + -17.141x1 + 0.0057x2

 Kiểm định hệ sô a, b, c có ý nghĩa thống kê (a là hệ số tự do, b và c là hệ số góc).  Giả thiết H0: a, b, c không có ý nghĩa thống kê.

 Giả thiết H1: a, b, c có ý nghĩa thống kê.

 P – Value = 0.03609 < 0.05 → Bác bỏ H0, chấp nhận H1. Vậy hệ số tự do a có ý nghĩa thống kê.

 P – Value = 0.057074 > 0.05 → Chấp nhận H0. Vậy hệ số góc b không có ý nghĩa thống kê.

 P – Value = 0.868768 > 0.05 → Chấp nhận H0. Vậy hệ số c không có ý nghĩa thống kê.

 Kiểm định đường hồi quy tuyến tính

 Giả thiết H0: Phương trình đường hồi quy tuyến tính không thích hợp.  Giả thiết H1: Phương trình đường hồi quy tuyến tính thích hợp.

 Significance F = 0.147721 > 0.05 → Chấp nhận H0.

 Kết luận: Phương trình đường hồi quy tuyến tính không thích hợp.

 Ta có thể kết luận rằng Nhiệt độ và Độ dẫn điện không tác động đến Độ đục của điểm đo.

Một phần của tài liệu BTL xác suất thống kê Trường đại học bách khoa TPHCM (Trang 44 - 61)