Tài liệu hạn chế xem trước, để xem đầy đủ mời bạn chọn Tải xuống
1
/ 104 trang
THÔNG TIN TÀI LIỆU
Thông tin cơ bản
Định dạng
Số trang
104
Dung lượng
3,69 MB
Nội dung
TRƢỜNG ĐẠI HỌC QUẢNG BÌNH KHOA NƠNG LÂM NGƢ BÀI GIẢNG (Lƣu hành nội bộ) THỐNG KÊ SINH HỌC (Dành cho sinh viên ngành Lâm nghiệp) Nguyễn Thị Quỳnh Phương Năm 2016 LỜI NÓI ĐẦU Thống kê sinh học môn học nhằm cung cấp kiến thức thống kê nói chung thống kê áp dụng sản xuất Lâm nghiệp nói riêng sử dụng cho sinh viên chuyên ngành lâm nghiệp trường Đại học Quảng Bình Thống kê sinh học phận tốn học, mơn học đại, nghiên cứu quan hệ số lượng hình thức khơng gian phải tìm hiểu phương pháp nghiên cứu đối tượng cụ thể Bài giảng Thống kê sinh học nhằm phục vụ cho công việc giảng dạy học tập sinh viên thuộc chuyên ngành Lâm nghiệp Bài giảng biên soạn dựa tham khảo nhiều tài liệu tác giả nước liên quan đến thống kê sinh học, tốn học ứng dụng sinh học nói chung Lâm nghiệp nói riêng Tuy nhiên có nhiều cố gắng, song chắn khơng tránh khỏi thiếu sót Tác giả mong nhận góp ý thầy cô, sinh viên độc giả trường để giảng hoàn thiện Xin chân thành cảm ơn! MỤC LỤC CHƢƠNG I THỐNG KÊ MÔ TẢ 1.1 Dấu hiệu quan sát .5 1.2 Khái niệm tổng thể mẫu 1.3 Mô tả đại lƣợng quan sát bảng tần số 1.4 Mô tả biểu đồ 11 1.5 Các đặc trƣng mẫu 15 CHƢƠNG II PHƢƠNG PHÁP ƢỚC LƢỢNG CÁC THAM SỐ CỦA TỔNG THỂ46 2.1 Đặt vấn đề .46 2.2 Phƣơng pháp ƣớc lƣợng điểm 46 2.3 Phƣơng pháp ƣớc lƣợng khoảng .48 2.3.1 Nguyên tắc chung phƣơng pháp ƣớc lƣợng khoảng .48 2.3.2 Phƣơng pháp cấu tạo khoảng ƣớc lƣợng .49 CHƢƠNG III KIỂM ĐỊNH GIẢ THUYẾT VỂ QUY LUẬT CẤU TRÚC TẦN SỐ TRONG LÂM NGHIỆP .57 3.1 Một số khái niêm kiểm định giả thuyết thống kê 57 3.2 Ý nghĩa việc kiểm định giả thuyết quy luật cấu trúc tần số 59 3.3 Kiểm định giả thuyết luật phân bố .59 3.4 Kiểm định giả thuyết số phân bố lý thuyết thƣờng gặp sinh học 61 3.4.1 Kiểm định giả thuyết phân bố chuẩn 61 3.4.2 Kiểm định giả thuyết phân bố Weibull 65 3.4.3 Phân bố giảm (Phân bố mũ) 68 3.4.4 Phân bố khoảng cách 71 CHƢƠNG IV PHƢƠNG PHÁP SO SÁNH CÁC MẪU QUAN SÁT VÀ THÍ NGHIỆM 75 4.1 Ý nghĩa 75 4.2 Trƣờng hợp mẫu độc lập 75 4.2.1 Tiêu chuẩn t Student .75 4.2.2 So sánh hai mẫu độc lập tiêu chuẩn U Mann-Whitney 81 4.2.3 So sánh nhiều mẫu độc lập tiêu chuẩn Kruskal - Wallis 84 4.3 Trƣờng hợp mẫu liên hệ lƣợng 85 4.3.1 Khái niệm mẫu liên hệ 85 4.3.2 Tiêu chuẩn t Student .85 4.3.3 Tiêu chuẩn tổng hạng theo dấu Wilcoxon 87 4.4 So sánh mẫu độc lập chất - So sánh thành số mẫu .87 4.5 Kiểm định quan hệ biến định tính dựa bảng chéo theo tiêu chuẩn 89 CHƢƠNG V PHÂN TÍCH PHƢƠNG SAI VÀ ỨNG DỤNG MỘT SỐ MƠ HÌNH THÍ NGHIệM TRONG SINH HỌC 92 5.1 Những khái niệm chung 92 5.2 Phân tích phƣơng sai nhân tố .93 5.2.1 Bảng xếp số liệu quan sát 93 5.2.2 Các điều kiện mơ hình phân tích phƣơng sai nhân tố 94 5.2.3 Phân tích phƣơng sai kiểm định ảnh hƣởng nhân tố A 95 5.2.4 So sánh cặp trung bình cấp nhân tố A .96 5.2.5 Thiết kế thí nghiệm ngẫu nhiên hoàn toàn 97 5.3 Phân tích phƣơng sai nhân tố 98 5.3.1 Trƣờng hợp có quan sát 98 5.4 Bàn số liệu .105 5.4.1 Kiểm định điều kiện 105 5.4.2 Đổi biến số 106 CHƢƠNG VI PHÂN TÍCH MỐI LIÊN HỆ GIỮA CÁC ĐẠI LƢỢNG TRONG SINH HỌC 110 6.1 Các mơ hình hồi quy 110 6.2 Các đặc trƣng mức độ liên hệ đại lƣợng 111 6.2.1 Hệ số tƣơng quan mẫu 111 6.2.2 Tỷ tƣơng quan 115 6.2.3 Hệ số xác định 116 6.3 Hồi quy tuyến tính lớp 117 6.3.1 Cách biểu thị hàm hồi quy tuyến tính lớp 117 6.3.2 Xác định tham số mẫu 117 6.3.3 Kiểm định tồn hệ số 118 6.3.4 Quan hệ hệ số hồi quy hệ số tƣơng quan 118 6.3.5 Bảng phân tích phƣơng sai phân tích hồi quy 119 6.3.6 Chuẩn hoá sai số phần dƣ 119 6.3.7 Dự báo trung bình dự báo cá biệt 119 6.3.8 Tính tốn hồi quy tuyến tính trƣờng hợp bảng tƣơng quan .120 6.3.9 So sánh nhiều hệ số hồi quy tuyến tính lớp 123 CHƢƠNG I THỐNG KÊ MÔ TẢ 1.1 Dấu hiệu quan sát Trong Lâm nghiệp nghiên cứu vấn đề mặt định lƣợng ngƣời ta phải quan sát, thu thập số liệu, làm số thí nghiệm có liên quan sau thu thập kết Ví dụ muốn nghiên cứu tốc độ sinh trƣởng trồng biện pháp kỹ thuật ngƣời ta tiến hành hai thí nghiệm: trồng theo biện pháp kỹ thuật đối chứng Sau thời gian cần thu thập kết sinh trƣởng chiều cao đƣờng kính hai thí nghiệm để so sánh đánh giá kết Một ví dụ khác: để nghiên cứu ảnh hƣởng độ ẩm nảy mầm loại hạt giống đó, ngƣời ta đem gieo loại hạt giống lơ đất có độ ẩm khác (những điều kiện khác nhƣ nhau) Tỷ lệ hạt nảy mầm không nảy mầm lơ hạt thí nghiệm giúp ta so sánh kết từ rút kết luận xem độ ẩm cho độ nảy mầm cao Nhƣ qua hai ví dụ cho thấy để đạt mục đích nghiên cứu cần phải tiến hành làm số thí nghiệm sau quan sát đo đếm kết đạt đƣợc Trong ―Thống kế tốn học‖ nói chung ―Phân tích Thống kê sinh học‖ nói riêng ngƣời ta thƣờng gọi chung đại lƣợng tính chất cần phải quan sát đo đếm dấu hiệu quan sát Nhƣ dấu hiệu quan sát ví dụ thứ chiều cao đƣờng kính, ví dụ sau dấu hiệu quan sát chất lƣợng nảy mầm hạt giống Những khác hai loại dấu hiệu quan sát là: ví dụ thứ khác phần tử dựa vào kích thƣớc chiều cao đƣờng kính gọi dấu hiệu lượng biến định lượng Còn ví dụ sau khác biệt phần tử dựa vào tính chất nhƣ hạt nảy mầm khơng nảy mầm, ngƣời ta gọi dấu hiệu chất biến định tính Thƣờng ngƣời ta kí hiệu dấu hiệu quan sát lƣợng đại lƣợng quan sát chữ X (hoặc Y, Z…) Nếu đại lƣợng quan sát X lấy giá trị khoảng xác định X đƣợc gọi đại lượng liên tục Chẳng hạn khu rừng cao có chiều cao 20m thấp có chiều cao 10m Nếu chọn khoảng xác định từ 13m đến 14m ta gặp nhiều nằm khoảng Nếu chọn khoảng bé nữa, chẳng hạn từ 13,50m đến 13,80m ta gặp có chiều cao nằm khoảng Trong trƣờng hợp nhƣ vậy, X đại lượng liên tục Trong Lâm nghiệp thƣờng gặp đại lƣợng liên tục nhƣ chiều cao, đƣờng kính, hình số, hình suất, thể tích cây, trọng lƣợng hạt, Trái lại trị số quan sát X số tròn đếm đƣợc X đại lượng đứt quãng Chẳng hạn nhƣ số có cây, số rừng có diện tích xác định Đặc biệt với dấu hiệu quan sát chất ngƣời ta chuyển thành dấu hiệu quan sát lƣợng Chẳng hạn ta gán cho phần tử mang đặc điểm A giá trị phần tử không mang đặc điểm A giá trị ta đƣợc đại lƣợng đứt quãng Chẳng hạn nhƣ ví dụ trên, ta gán cho hạt nảy mầm giá trị hạt không nảy mầm giá trị 0.Trong trƣờng hợp ngƣời ta gọi biến định tính khơng thứ bậc Trái lại việc lƣợng hố theo chiều tăng hay giảm tính chất biến định tính ta gọi biến có thứ bậc Chẳng hạn theo chiều tăng độ dốc đồi ta gán cho chân đồi =1 sƣờn đồi=2 đỉnh đồi =3 Những biến khơng thứ bậc việc tính đặc trƣng mẫu khơng có ý nghĩa 1.2 Khái niệm tổng thể mẫu Tổng thể theo định nghĩa chung tập hợp hữu hạn vô hạn phần tử có số tính chất chung Chẳng hạn tập hợp tất rừng khu rừng rộng lớn Tính chất chung rừng tre nứa loại động vật Ngƣời ta thƣờng ký hiệu N số phần tử tổngthể Cũng cần nói thêm điều tra trữ lƣợng N = diện tích rừng / diện tích quan sát đặt theo hệ thống ngẫu nhiên Còn mẫu phận đƣợc chọn từ tổngthể theo phƣơng pháp Dung lƣợng mẫu thƣờng ký hiệu n (n10n việc chọn có hồn lại khơng hồn lại nhƣ tính sai số rút mẫu Phƣơng pháp có ƣu điểm khách quan dễ thực hiện, nhƣng phần tử mẫu khơng phân bố tổng thể - Chọn hệ thống : Đây phƣơng pháp thƣờng đƣợc dùng Lâm nghiệp điều tra rừng Ở phƣơng pháp này, diện tích rừng ngƣời ta kẻ nhiều đƣờng thẳng song song cách đặt cách có diện tích nhƣ để tiến hành quan sát đại lƣợng nhƣ đƣờng kính, chiều cao trử lƣợng gỗ vv (Xem hình1.1) Phƣơng pháp có ƣu điểm phần tử mẫu rải tổngthể tính đại diện mẫu cao Nhƣng có nhƣợc điểm tính hệ thống bị vi phạm gặp chƣớng ngại vật mở tuyến đặt quan sát - Chọn mẫu điển hình: Trong khu rừng ngƣời ta chọn hẳn giải rừng mang tính chất điển hình cho đại lƣơng quan sát để thu thập số liệu Phƣơng pháp đơn giản dễ thực hiện, nhƣng khách quan, độ xác phụ thuộc vào kinh nghiệm điều tra viên Phƣơng pháp khơng tính sai số chọn mẫu Ngồi phƣơng pháp có phƣơng pháp chọn mẫu mang tính chât phức hợp nhƣ mẫu phân khối (Stratief Samling ) mẫu phân cấp (Stage Samling) mẫu nhiều giai đoạn (multiphase Samling) đƣợc trình bày kỹ chƣơng10 Hiện Viện ĐTQH rừng áp dụng kiểu mẫu cấp (Ô sơ cấp ô thứ cấp nằm ô sơ cấp ) để tiến hành điều tra đánh giá theo dõi diễn biến tài nguyên rừng toàn quốc theo chu kỳ năm lần 1.3 Mô tả đại lƣợng quan sát bảng tần số Trong nhiều trƣờng hợp nghiên cứu rừng ngƣời ta cần tìm hiểu quy luật phân bố tần số tần suất tồn cách khách quan Chẳng hạn muốn xây dựng đƣợc phƣơng pháp đo tính trữ sản lƣợng cho khu rừng đó, việc tìm hiểu trƣớc hết quy luật kết cấu rừng nhƣ quy luật phân bố số theo chiều cao theo đƣờng kính cần thiết Ở điều kiện xác định quy luật biểu thị dạng tốn học xác đủ phục cho mục đích thực tiễn Những quy luật phân bố tồn cách khách quan tổngthể biểu thị cách gần biểu thức toán học gọi quy luật phân bố lý thuyết Còn thân phân bố giá trị phần tử quan sát đƣợc mẫu thí nghiệm từ ta khái quát đƣợc dạng lý thuyết, ngƣời ta gọi phân bố thực nghiệm Xây dựng đƣợc phân bố thực nghiệm để từ khái qt hố thành phân bố lý thuyết nhiệm vụ ngƣời làm thống kê Song làm để phát đƣợc quy luật khách quan sở tài liệu quan sát? Để giải vấn đề điều số liệu quan sát đƣợc phải đem xếp lại theo quy tắc đó, chẳng hạn ngƣời ta giá trị quan sát theo thứ tự từ nhỏ đến lớn thống kê số phần tử có giá trị (đối với đại lƣợng đứt quãng) thống kê phần tử có giá trị chứa khoảng xác định (đối với đại lƣợng liên tục) Cách làm nhƣ gọi phân tổ tài liệu quan sát Việc phân tổ tài liệu quan sát ý nghĩa giúp cho việc tính tốn đƣợc nhạnh chóng thuận lợi Ví dụ: Đại lƣợng đứt quãng (rời rạc) Số Thông nhựa (Pinus merkusii) tái sinh tự nhiên có 60 quan sát khu vực ng Bí nhƣ bảng (1-1) Bảng 1.1 Số thông tái sinh 60 ô quan sát khu vực ng Bí Thứ Số Thứ Số Thứ Số Thứ Số tự ô 10 11 12 13 14 ô 10 11 12 14 tự ô 16 17 18 19 20 21 22 23 24 25 26 27 28 29 ô 11 13 10 12 14 10 11 tự ô 31 32 33 34 35 36 37 38 39 40 41 42 43 44 ô 13 8 11 15 15 13 10 11 11 tự ô 46 47 48 49 50 51 52 53 54 55 56 57 58 59 ô 12 10 11 10 14 11 13 12 10 15 15 12 30 45 10 60 10 Nhìn vào bảng ta khó thấy đƣợc quy luật phân bố số theo số có tn theo quy luật Để thấy quy luật phân bố dấu hiệu quan sát nói trên, ta đem trị số quan sát (số ô) xếp lại theo thứ tự từ nhỏ đến lớn, trị số ô số đến trị số 15 59 đánh dấu có số theo kiểu phiếu bầu cử ghi số ô cột Nếu gọi số có x số tƣơng ứng f ta có bảng phân bố số theo số nhƣ bảng 1.2 Bảng 1.2 Phân bố số thông tái sinh tự nhiên khu vực ng Bí Xi f P 10 11 12 13 14 15 1 10 3 n = 60 0,017 0,017 0,034 0,050 0,082 0,016 0,134 0,170 0,134 0,182 0,064 0,050 0,050 1,000 Ngƣời ta gọi bảng bảng phân bố tần số thực nghiệm Nhìn vào bảng ta thấy số tăng lên theo số đạt cực đại số có 10, sau số ô lại giảm số tăng lên Trong bảng (1.2) cột ghi số có ơ, cột thứ ghi số có số cây, cột thứ đƣợc xác định cách lấy tần số tổ chia cho tổngsố quan sát (ký hiệu n) gọi tần suất thực nghiệm tần số tương đối thực nghiệm Ví dụ: Đối với đại lƣợng liên tục: Bảng 1.3 Chiêù cao vút Hvn (m) 50 Lim Cầu Hai, Phú Thọ 7,80 8,30 6,80 9,35 8,15 8,65 9,05 8,90 8,45 6,30 9,05 7,45 9,60 8,10 8,35 9,80 8,15 8,30 7,30 8,80 9,15 7,85 8,30 8,65 8,25 9,30 7,80 8,35 8,85 7,85 7,95 8,15 8,35 7,90 7,15 8,45 8,85 8,45 8,55 9,30 8,55 8,95 8,65 7,30 9,06 8,30 7,30 7,90 8,15 8,65 Nhìn vào bảng ta khó tìm thấy đƣợc quy luật biến hố chiều cao 50 lim Để thấy rõ quy luật biến hoá đó, vào khoảng chênh lệch cao (9,8m) thấp (6,25m) Tài liệu đƣợc phân làm tổ có cự ly( khoảng cách) 0,5m ghép thành nhóm nhƣ kiểm phiếu bầu cử Cách làm cụ thể dò theo thứ tự từ trái sang phải từ xuống dƣới trị số bảng trên, trị số nằm tổ gạch tổ gạch, làm nhƣ lần lƣợt cho hết 50 trị số quan sát trên, đếm số gạch ghi thành chữ số cho tổ vào vị trí tƣơng ứng cột tần số quan sát (xem bảng 1.4) Bảng 1.4 Bảng phân tổ tài liệu quan sát 50 lim Phân tổ chiều cao (m) Tần số fi Tần suất P 6,25 — 6,75 6,75 — 7,25 7,25 — 7,75 7,,75 — 8,25 8,25 — 8,75 8,75 — 9,25 9,25 — 9,75 9,75 — 10,25 11 18 n = 50 0,02 0,04 0,10 0,22 0,36 0,18 0,06 0,02 Nhìn vào bảng 1.4 ta thấy phân bố số theo cỡ chiều cao có tăng giảm rõ rêt Số tổ thấp tổ cao tâp trung tổ trung bình Thơng thƣờng đại lƣợng liên tục ngƣời ta dùng trị số tổ làm đại biểu cho tổ Ví dụ tổ 6,25 — 6,75 trị số tổ 6,50, tổ 7,75 — 8,25 trị số tổ 8,00 Trị số tổ giá trị trung bình trị số lớn trị số bé tổ Còn đại lƣợng đứt quãng số phần tử quan sát tâp trung số giá trị giá trị quan sát đƣợc lấy làm đại biểu cho tổ Bảng 1.5 Bảng phân bố tần số tần suất theo trị số tổ Trị số tổ x (m) Tần số f Tần suất P Tần số luỹ tích F 6,50 0,02 7,00 0,04 7,50 0,10 8,00 11 0,22 19 8,50 18 0,36 37 9,00 0,18 46 9,50 0,06 49 10,00 0,02 50 n = 50 1,000 Trong bảng (1.5) thành lập cột cách cộng dồn tần số cột 2: hàng ghi tần số (giống tần số hàng thứ cột 2), hàng thứ tần số hàng thứ cộng dồn với tần số hàng thứ cột 2, tiếp tục làm nhƣ ta đƣợc tần số hàng lại Những tần số gọi tần số luỹ tích Hình 6.2 Trường hợp X Y độc lập tuyến tính Hình 6.3 Quan hệ phi tuyến tính X Y Ví dụ: Quan hệ đƣờng kính tán (Dt) đƣờng kính ngang ngực (D13) nhƣ sau: (Nguồn Ngơ Kim Khơi) Bảng 6.1 Đường kính tán (Dt) D13 10 cho bảng sau X(DU) Y(Dt) X2 Y2 X*Y 7,6 2,5 57,76 6,25 19,00 8,8 2,8 77,44 7,84 24,64 8,9 3,0 79,21 9,00 26,70 9,3 3,4 86,49 11,56 31,62 9,7 3,7 94,09 13,69 35,89 10,6 4,0 112,36 16,00 42,40 11,0 4,5 121,00 20,25 49,50 11,8 4,9 139,24 24,01 57,82 11,9 5,2 141,61 27,04 61,88 12,3 5,7 151,29 32,49 70,11 101,9 39,7 1060,49 168,13 419,56 Để tính Qx, Qy, Qxy ta lập cột (3) (4) (5) tính tổng cột Từ bảng ta tính đƣợc : Qx =1060,49 - (101,92)/10 = 22,129 Qy = 168*(13 - 39,72)/10 = 10,521 Qxy = 419,56 - 101,9*39,7/10 = 16,017 r = 0,98 6.2.1.2 Kiểm định giả thuyết hệ số tương quan Ngƣời ta chứng minh đƣợc hệ số tƣơng quan r ƣớc lƣợng không chệch hệ số tƣơng quan tổng thể = Ta đặt giả thuyết H0: = 0; H1: ≠ Ngƣời ta chứng minh tổng thể = đại lƣợng T r 1 r2 n2 (6.2) Có phân bố t với n - bậc tự Giả thuyết H0 bị bác bỏ giá trị tuyệt đối t tính theo (6.2) lớn ta/2 tra bảng Trong trƣờng hợp r < 0.03 (1- r2) công thức (6.2) gần 1, nên việc kiểm định giả thuyết H0 thực Y theo cơng thức rút gọn: T r n2 Nhƣ ví dụ ta tính đƣợc: t tra bảng với = 0.05 k = 2.45 nhỏ trị số tính tốn nên giả thuyết = khơng bị bác bỏ Ta nói tổng thể có tồn mối quan hệ tuyến tính đƣờng kính tán (Dt) đƣờng kính ngang ngực (D13) 6.2.1.3 Ước lượng khoảng hệ số tương quan Trong trƣờng hợp giả thuyết bị bác bỏ, ta tiến hành ƣớc lƣợng theo phƣơng pháp ƣớc lƣợng khoảng dựa vào hệ số tƣơng quan mẫu Tuy nhiện trƣờng hợp ≠ phân bố xác suất r mẫu phức tạp Nếu dung lƣợng n đủ lớn phân bố r tiệm cận phân bố chuẩn với E(r) = phƣơng sai D(r) = (1-r2)/(n-2) Trong trƣờng hợp này, ta có cơng thức ƣớc lƣợng khoảng nhƣ sau: (6.3) Nếu n < 30 cần phải đổi biến số theo phƣơng pháp Fisher nhƣ sau: Z = 0,5ln [(1+r)/(1-r)] Đại lƣợng có phân bố tiệm cận chuẩn với: E(Z) =1/2ln(1+p)/(1-p) +p/2(n+1) + + D(Z) = 1/(n-3) + + Khi hệ số tƣơng quan tổng thể chứa khoảng : ( z u /2 / ( n 3) ; z u /2 / ( n 3) ) Nhƣ ví dụ ta tính đƣợc r = 0,98, Z = 0,5*ln [(1+0,98)/(1-0,98) = 2,2975 P(0,9149 < < 0,9954) = 0,95 Ngoài phƣơng pháp tính hệ số tƣơng quan nói (gọi hệ số tƣơng quan Pearson), ngƣời ta tính theo phƣơng pháp phi tham số mà thƣờng dùng hệ số tƣơng quan hạng Spearman Cách tính theo phƣơng pháp nhƣ sau: Gọi Ri vị thứ biến X sau xếp hạng từ nhỏ đến lớn Si vị thứ xếp hạng từ nhỏ đến lớn y rs hệ số tƣơng quan hạng của Spearman ta có cơng thức: rs = - 6∑(R1-S1)2/ (n3 —n) (6.4) Việc kiểm định tồn rs đƣợc thực theo công thức (6.2) cần thay r rs cơng thức Nhƣ ví dụ bảng 6.1 ta có: X Ri y Si 7,6 2,5 8,8 2,8 8,9 3,0 9,3 3,4 9,7 3,7 10,6 4,0 11,0 4,5 11,8 4,9 11,9 5,2 12,3 10 5,7 10 (Ri-Si)2 0 0 0 0 0 2(Ri=Si)2 =0 rs = 1- 6∑(Ri=Si)2/n(n2 —1) = - 6*0/(103- 10) = Các hệ số tƣơng quan hạng thƣờng dùng thích hợp cho trƣờng hợp đại lƣợng quan sát không tuân theo luật chuẩn 6.2.1.4 Ma trận hệ số tương quan ma trận hiệp phương sai Trong kỹ thuật nhiều ta cần tính hệ số tƣơng quan cặp biến Xi Xj số biến ngẫu nhiên X1 X2 X3….Xk trình bày chúng dƣói dạng ma trận gọi bảng ma trận hệ số tƣơng quan nhƣ sau: Bảng 6.3 Bảng ma trận hệ số tương quan Xij X1 X2 X3 …… Xk X1 r 11 r 21 r31 X2 r12 r22 r32 X3 r13 r23 r33 rk1 rk2 rk3 …… Xk r1k r2k r3k rkk Các rij hệ số tƣơng quan biến Xi Xj bảng ma trận hệ số tƣơng quan rịj =rji rij=1 Trong đánh giá hiệu mơ hình trổng rừng nhiều cần phải lập ma trận tƣơng quan biến môi trƣờng (lƣợng xói mòn, lƣợng nƣớc thấm vào đất, hàm lƣợng chất dinh dƣỡng hấp phụ ) để từ xác định trọng số so sánh mơ hình với Sau ví dụ mang tính chất minh hoạ Ví dụ: Lập tƣơng quan biến sau Bảng 6.4 Quan hệ biến quan sát X1 X2 X3 X4 X5 12,3 13,5 14,3 15,6 15,6 12,3 13,4 14,3 15,4 15,8 12,3 13,2 14,5 16,2 15,6 14,3 12,8 12,8 16,3 16,3 12,3 12,6 13,4 16,5 17,3 15,3 12,5 13,6 15,0 17,9 Dựa vào cơng thức (6.1) ta tính đƣợc hệ số tƣơng quan biến cho kết vào bảng ma trận sau: Bảng 6.5 Bảng ma trận hệ số tương quan X1 X2 X3 X4 X5 X1 X2 -.674 X3 -.610 748 X4 -.400 -.128 -.330 X5 654 -.918 -.568 -.190 Nếu công thức (6.1) mẫu số đƣợc thay n-1 ta có gọi hiệp phƣơng sai đƣợc tính theo cơng thức: Cov(xy) = Qxy/(n-1) (6.5) Dấu hiêp phƣơng sai dấu với hệ số tƣơng quan Trong trƣờng hợp có nhiều biến ta lập đƣợc bảng ma trận hiệp phƣơng sai có dạng nhƣ bảng ma trận hệ số tƣơng quan 6.2.2 Tỷ tương quan 6.2.2.1 Khái niệm Tỷ tƣơng quan đặc trƣng thống kê mức quan hệ đại lƣợng quan sát trƣờng hợp chung (cho mơ hình I II) ứng với biến X có nhiều giá trị biến Y lặp lại Tỷ tƣơng quan đƣợc định nghĩa cơng thức: (6.6) Trong đó: Qy/x = ∑ (y - y / x)2 Qt = ∑ (y - y )2 y /x: trung bình có điều kiện y (trung bình giá trị y có giá trị x) Khi trung bình y = ∑(y - y / x)2=0 = Nhƣ < < Nó x y khơng có liên hệ x y có quan hệ hàm số 6.2.2.2 Cách tính tỷ tương quan Từ cơng thức triển khai thành cơng thức: (6 7) Ví dụ: D13 = X đƣợc chia thành cỡ 7, 9, 11, 13, 15 cm Hvn = Y có nhiều lặp lại cỡ đƣờng kính nhƣ sau X=D13 11 13 Y=Hvn 8.3 9.2 9.3 10.2 10.6 11.2 fx ∑y (∑y)2/fx ∑y2 22 484 161,33 23,3 542,89 180,96 28,7 823,69 274,56 21,8 475,24 236,62 11 95,8 853,47 0,8491 : tƣơng quan D13 Hvn tƣơng đối chặt 6.2.2.3 Kiểm định tồn tỷ tương quan Ta cho giả thuyết Ho : 02 = Nếu giả thuyết Ho (6.8) Có phân bố F với k1 = m-1 k2 = n-m bậc tự Giả thuyết bị bác bỏ F tính theo cơng thức lớn F05 tra bảng Nhƣ ví dụ ta F = 1.80 < F05 = 3.63, giả thuyết Ho chƣa có sở để bác bỏ Tỷ tƣơng quan Pearson đề từ năm 1905 Cần ý tỷ tƣơng quan thƣờng tăng theo số tổ Nó ổn định số tổ dung lƣợng quan sát tƣơng đối lớn với tỷ lê n = 50m Trong m số tổ chia theo biến X Nếu tƣơng quan tuyến tính hệ số tƣơng quan mẫu nhỏ tỷ tƣơng quan 6.2.3 Hệ số xác định 6.2.3.1 Khái niệm Nếu Y hàm hồi quy mẫu ta phân tích nhƣ sau R2 gọi hệ số xác định Nó tỷ lệ biến động Y đƣợc giải thích phƣơng trình hồi quy so với biến động chung Nhƣ nguyên tắc chung để tính đƣợc hệ số xác định phải lập đƣợc phƣơng trình hồi quy quan hệ Y với biến độc lập X Ngồi cơng thức hệ số xác định tính theo cơng thức: (6.9) Nhƣ so với tỷ tƣơng quan số thống kê không phụ thuộc vào dạng liên hệ, hệ số xác định ln phụ thuộc vào dạng liên hệ Nó có xu hƣớng tăng ta thêm biến độc lập tăng bậc biến X, trƣờng hợp Y X có quan hệ dạng đa thức Nếu Y X có quan hệ tuyến tính hệ số xác định R2 = r2 6.2.3.2 Hệ số xác định có điều chỉnh (Adjusted R 2) Trong trƣờng hợp dung lƣợng mẫu nhỏ mà số tham số phƣơng trình hồi quy nhiều hệ số xác định cần đƣợc điều chỉnh theo cơng thức sau: (6.10) Trong r số tham số phƣơng trình hồi quy 6.2.3.3 Kiểm định tồn hệ số xác định Ta cho giả thuyết Ho : Ro2 = tổng thể Nếu giả thuyết Ho đại lƣợng: (6.11) có phân bố F với k1 = r - k2 = n - r bậc tự Giả thuyết Ho bị bác bỏ F tính theo (6.11) lớn F tra bảng Trong trƣờng hợp phƣơng trình hồi quy có tham số tồn Ta bàn bạc thệm vấn đề đề cập đến vấn đề kiểm định tồn mơ hình hồi quy mục sau 6.3 Hồi quy tuyến tính lớp 6.3.1 Cách biểu thị hàm hồi quy tuyến tính lớp Nếu đại lƣợng X Y tổng thể có quan hệ tuyến tính quan hệ đƣợc viết dƣói dạng kỳ vọng E(Y/X) = Y= A + BX (6.12) Hoặc biểu thị dƣới dạng phƣơng trình mơ hình yi = A + BX + i (6.13) 6.3.2 Xác định tham số mẫu Việc xác định tham số a, b đƣợc tiến hành phƣơng pháp bình phƣơng bé (OLS) đƣợc tính theo công thức sau: (6.14) (6.15) Ngƣời ta gọi b hệ số hồi quy ƣớc lƣợng không chệch tham số b hệ số hồi quy tổng thể Còn a số tự (Intercept) Phƣơng pháp ƣớc lƣợng bình phƣơng tối thiểu có tính chất sau: - Đƣờng thẳng hồi quy qua điểm có toạ độ trung bình Y X - Trung bình trị lý luận trung bình Y quan sát - Z(y- y ) = ∑e = với e sai số dƣ mẫu e = y- y Hệ số hồi quy hàm ƣớc lƣợng không chệch hiêu nghiêm tƣơng ứng tham số A B hàm hồi quy tuyến tính tổng thể 6.3.3 Kiểm định tồn hệ số Ngƣời ta đặt giả thuyết H0 : A = B = kiểm định chúng tiêu chuẩn t theo công thức: W bi 0.5 Sbi2 Gọi sai tiêu chuẩn hồi quy, S y2 phƣơng sai hồi quy (phƣơng sai dƣ) ƣớc lƣợng không chệch Phƣơng sai hồi quy tính theo cơng thức: Nếu giá trị tuyêt đối ta tb tính theo cơng thức > ta/2 ứng với bậc tự k = n - giả thuyết bị bác bỏ, ngƣợc lại ta tạm thời chấp nhận giả thuyết Trong cơng thức Sa Sb sai số hệ số, n dung lƣợng quan sát mức ý nghĩa dùng để kiểm định (mặc định = 0.05) 6.3.4 Quan hệ hệ số hồi quy hệ số tương quan Từ cơng thức tính hệ số tƣơng quan (6.1) cơng thức tính hệ số hồi quy (6.14) ta chứng minh đƣợc quan hệ hệ số hồi quy hệ số tƣơng quan nhƣ sau: (6.16) (6.17) Nhƣ hệ số tƣơng quan không đổi biểu thị X hàm số Y biến số Trái lại thay đổi biến số hệ số hồi quy thay đổi 6.3.5 Bảng phân tích phương sai phân tích hồi quy Để phân tích sâu quan hệ đại lƣợng theo mơ hình I mơ hình II ngồi thơng tin hệ số tƣơng quan hệ số xác định phƣơng sai hồi quy ngƣời ta đƣa bảng phân tích phƣơng sai có dạng sau: Nguồn biến động (Source) Hồi quy Sai số dƣ Tổng Bảng 6.6 Bảng phân tích phương sai B.Đ BTD PS F.tính (SS ) ( DF) (MS) QR MR MR/ME QE n-2 ME Qx n-1 Xác suất F(Sig) Trong bảng ta ký hiệu nhƣ sau: QR = ∑( y - y ) QE = ∑( y - y ) MR = QR/ Bậc tự (trong hồi quy lớp k = 1) ME = QE/(n - 2) = S y2 Tổng biến động ∑( y - y )2= ∑[(y- y ) + ∑( y - y )]2 với bậc tự tƣơng ứng n - Cho nên hàng cuối hàng thứ cộng với hàng thứ tổng biến động nhƣ bậc tự Thực chất bảng phân tích phƣơng sai nói việc kiểm tồn hệ số xác định R2 theo tiêu chuẩn F theo công thức: F = MR/ME (6.18) Với bậc tự k1 = 1, k2 = n - Nếu mức ý nghĩa F (sigF) < 0.05 F tính lớn F tra bảng hệ số xác định tồn phƣơng trình hồi quy có ý nghĩa 6.3.6 Chuẩn hoá sai số phần dư Để đánh giá mức độ phân tán giá trị quan sát y so với giá trị y ngồi việc tính trị phần dƣ (y- y ) ngƣời ta tính giá trị chuẩn hố theo cơng thức: r*=(y- y )/ S y (6.19) S y sai tiêu chuẩn hồi quy 6.3.7 Dự báo trung bình dự báo cá biệt Trong nhiều trƣờng hợp ngƣời ta cần ƣớc lƣợng giá trị E(Y/X) thông qua hàm ƣớc lƣợng y = a + bx cách thay x0 vào phƣơng trình hồi quy mẫu Sai số ƣớc lƣợng trung bình đƣợc tính theo cơng thức: (6.20) Từ ta có cơng thức ƣớc lƣợng khoảng E(Y/X) nhƣ sau: (6.21) ta/2 đƣợc tra bảng theo phân bố t với n-2 bậc tự Ngoài việc ƣớc lƣợng trung bình ngƣời ta đề cập đến vấn đề dự báo giá trị Y cá biệt theo mô hình (6.13) biết đƣợc giá trị cụ thể biến X, tức x Trong trƣờng hợp này, dùng hàm hồi quy mẫu để dự báo ta mắc sai số nhƣ sau: (6.22) Nhƣ độ tin cậy khoảng dự báo dự báo giá trị y cá biệt tính theo mơ hình (6.13) là: (6.23) 6.3.8 Tính tốn hồi quy tuyến tính trường hợp bảng tương quan Trong trƣờng hợp mẫu lớn số liệu biến thƣờng đƣợc chỉnh lý dƣói dạng bảng tƣơng quan với hàng ngang biến X cột biến Y Mỗi ô bảng tần số quan sát tƣơng ứng (Xem bảng 6.7) Ví dụ: Quan hệ D13 Dt 76 rừng tự nhiên đƣợc cho bảng sau: Bảng 6.5 Tương quan D13 DT X 7,4 9,8 8,2 7,4 6,6 5,8 4,2 3,4 fi 16 10,3 13 15,8 18,6 21,4 24,2 27 29,8 32,6 3 2 3 2 1 3 1 1 1 1 1 13 17 16 11 17 13 76 Dự báo trung bình dự báo cá biệt Ta tiến hành dự báo trung bình dự báo cá biệt theo công thức (6.29) (6.31) Biểu đồ tƣơng quan Hình 6.4 Biểu đồ tương quan D13 DT 6.3.9 So sánh nhiều hệ số hồi quy tuyến tính lớp 6.3.9.1 So sánh mẫu độc lập Giả thuyết Ho bị bác bỏ trị tuyệt đối t tính theo (6.35) lớn ta/2 tra bảng 6.3.9.2 So sánh nhiều hệ số hồi quy Trƣờng hợp có m phƣơng trình hồi quy cần so sánh, ta dùng tiêu chuẩn Trong W bi : số bj Giả thuyết Ho bi Sbi2 Ho bị bác bỏ lớn 0.5 tra bảng với bậc tự k = m - Trong trƣờng hợp ngƣợc lại ta xem nhƣ hệ số hồi quy tính hệ số hồi quy chung phƣơng trình gộp theo cơng thức: Sau tính đƣợc hệ số hồi quy trung bình ta tính lại hệ số a cho phƣơng trình theo cơng thức: Cuối ta có phƣơng trình gộp: Câu hỏi ơn tập Thế hệ số tƣong quan? Thế tỷ tƣong quan? Trong tƣong quan tuyến tính lớp hốn vị biến biếnđộc lập biến phụ thuộc hệ số tƣơng quan tỷ tƣơng quan có thay đổi khơng? Vì sao? Thế hệ số xác định? Tại hệ số xác định nhỏ ? Cho biết nội dung bảng phân tích phƣong sai phân tích hồi quy? Nếu mức ý nghĩa F > 0,05 điều xảy ? Trong tƣơng quan tuyến tính lớp cho biết mối quan hệ hệ số hồi quy hệ số tƣơng quan? ý nghĩa mối quan hệ này? Trình tự tốn phân tích hồi quy tƣơng quan tuyến tính lớp trƣờng hợp mẫu lớn ? Bài tập Quan hệ tỷ lê hoa lƣơng tính tỷ lê đâu điều nhƣ sau Tuổi Tỷ lê hoa LT (%) 4,1 3,9 4,2 4,4 4,4 4,6 4,9 Tỷ lê đạu (%) 4,2 4,4 4,0 4,5 4,8 5,0 5,3 a) Lập tƣơng quan tuyến tính tỷ lệ hoa lƣỡng tính tỷ lê đậu với việc tính a, b r ? b) Kiểm định tồn tham số ? c) Vẽ biểu đồ lý thuyết thực tế quan sát theo dạng đƣờng ? Phân tích hồi quy tƣơng quan tuyến tính lớp theo số liệu D13 Hvn: H\D 11 13 15 17 19 21 13 12 11 14 2 12 2 1 1 10 9 11 14 a) Tính r,n kiểm định tồn chúng ? b) Kiểm định tƣơng thích phƣơng trình tuyến tính lớp c) Tính a, b kiểm định tồn chúng ? d) Vẽ biểu đồ tƣơng quan Hvn D1.3 hệ số b tồn tại? TÀI LIỆU THAM KHẢO Nguyễn Hải Tuất, Vũ Tiến Hinh, Ngơ Kim Khơi, 2006 Phân tích Thống kê Lâm nghiệp - NXB Nông nghiệp Phạm Tiến Dũng – 2003: Xử lý kết thí nghiêm máy vi tính IRRISTAT - NXB Nơng nghiệp Đồng Sỹ Hiền 1974: Lập biểu thể tích biểu độ thon đứng rừng Việt Nam NXB Khoa học kỷ thuật Ngô Kim Khôi -1998, Thống kê toán học Lâm nghiệp- NXB NN Ngô Kim Khôi, Nguyễn Hải Tuất, Nguyễn Văn Tuấn 2002 : Tin học ứng dụng Lâm nghiệp NXB Nông nghiệp Nguyễn Văn Liệu, Nguyễn Đình Cử, Nguyễn Quốc Ânh -2000 SPSS ứng dụng phân tích liệu quản trị kinh doanh khoa học tự nhiên xã hội - NXB Giao thông vận tải Nguyễn Hải Tuất 1982: Thống kê toán học lâm nghệp NXB Nơng nghiệp Nguyễn Hải Tuất, Nguyễn Trọng Bình 2005 Khai thác sử dụng SPSS để xử lý số liệu nghiên cứu Lâm nghiệp NXB Nông nghiệp Nguyễn Hải Tuất, Ngô Kim Khôi 1996 Xử lý thống kê kết nghiên cứu thực nghiệm nông lâm nghiệp máy vi tính -NXB Nơng nghiệp ... ĐẦU Thống kê sinh học mơn học nhằm cung cấp kiến thức thống kê nói chung thống kê áp dụng sản xuất Lâm nghiệp nói riêng sử dụng cho sinh viên chuyên ngành lâm nghiệp trường Đại học Quảng Bình Thống. .. công việc giảng dạy học tập sinh viên thuộc chuyên ngành Lâm nghiệp Bài giảng biên soạn dựa tham khảo nhiều tài liệu tác giả nước liên quan đến thống kê sinh học, tốn học ứng dụng sinh học nói... Quảng Bình Thống kê sinh học phận tốn học, mơn học đại, nghiên cứu quan hệ số lượng hình thức khơng gian phải tìm hiểu phương pháp nghiên cứu đối tượng cụ thể Bài giảng Thống kê sinh học nhằm phục