Tài liệu hạn chế xem trước, để xem đầy đủ mời bạn chọn Tải xuống
1
/ 32 trang
THÔNG TIN TÀI LIỆU
Thông tin cơ bản
Định dạng
Số trang
32
Dung lượng
2,49 MB
Nội dung
TRƯỜNG ĐẠI HỌC QUẢNG BÌNH KHOA NÔNG LÂM NGƯ GIÁOTRÌNH (Lưu hành nội bộ) TINHỌCỨNGDỤNGTRONGLÂMNGHIỆP Dành cho Ngành Lâmnghiệp ThS NGUYỄN PHƯƠNG VĂN Năm 2017 MỤC LỤC CHƯƠNG PHÂN BỐ THỰC NGHIỆM VÀ PHƯƠNG PHÁP ƯỚC LƯỢNG CÁC THAM SỐ ĐẶC TRƯNG CỦA TỔNG THỂ 1.1 Tổng quát chức xử lý thống kê excel 1.1.1 Tổng quát phần xử lý thống kê Excel 1.2 Phân phối thực nghiệm biến số 1.2.1 Một số khái niệm .3 1.2.2 Phương pháp biểu thị phân bố thực nghiệm biến số 1.2.3 Các đặc trưng phân bố thực nghiệm 1.3 Tính thoán đặc trung thống kê mẫu quan sát ước lượng 1.3.1 Phương pháp ước lượng điểm 1.3.2 Phương pháp ước lượng khoảng .10 CHƯƠNG II PHÂN TÍCH PHƯƠNG SAI 17 2.1 Những khái niệm định nghĩa .17 2.2 Phân tích phương sai nhân tố với thí nghiệm ngẫu nhiên hoàn toàn 19 2.3 Phân tích phương sai nhân tố 22 CHƯƠNG III PHÂN TÍCH TƯƠNG QUAN - HỒI QUY 23 3.1 Hồi quy tuyến tính lớp 23 3.2 Thiết lập biểu đồ tương quan 28 CHƯƠNG PHÂN BỐ THỰC NGHIỆM VÀ PHƯƠNG PHÁP ƯỚC LƯỢNG CÁC THAM SỐ ĐẶC TRƯNG CỦA TỔNG THỂ 1.1 Tổng quát chức xử lý thống kê excel 1.1.1 Tổng quát phần xử lý thống kê Excel Excel thiết kế sẵn số chương trình để xử lý số liệu phân tích thống kê ứngdụng nhiều lĩnh vực, có chức bản: - Chức xử lý số liệu, tạo bảng tổng hợp liệu: Sắp xếp, tính toán nhanh bảng tổng hợp từ số liệu thô, - Chức hàm: Cung cấp hàng loạt hàm kỹ thuật, thống kê, kinh tế tài chính, hàm tra tiêu thống kê t, F, χ2 - Chức Data Analysis: Dùng để phân tích thống kê phân tích đặc trưng mẫu, tiêu chuẩn t để so sánh sai khác, phân tích phương sai, ước lượng tương quan hồi quy - Phân tích mô hình tưong quan hồi quy để dự báo thay đổi theo thời gian đồ thị Lưu ý: Về việc cài đặt chương trinh phân tích liệu (Data Analysis) Excel: + Khi cài đặt phần mềm Excel phải thực chế độ chọn lựa cài đặt, sau phải chọn mục: Add-Ins Analysis Toolpak + Khi chạy Excel lần đầu cần mở chế độ phân tích liệu cách: Menu Tools/Add-Ins chọn Analysis Toolpak-OK Như thực tế quản lý liệu nông lâmnghiệp nói riêng, việc khai thác hết tiềm ứngdụng Excel mang lại hiệu tốt mà không thiết phải tìm kiếm thêm phần mềm chuyên dụng khác Vấn đề đặt xác định chiến lược ứngdụng khai thác sâu công cụ chức thống kê sẵn có phần mềm phổ biến máy vi tính cá nhân Trước hết cần lưu ý sử dụng hàm, tiêu chuẩn thống kê thông dụng Excel sau: Một số hàm thông dụng thống kê: o Tính tổng: =Sum( ) o Tổng bình phương: =Sumq( ) o Trung bình: =Average( ) o Lấy giá trị tuyệt đối: =Abs( ) o Trị lớn nhất, nhỏ nhất: =Max( ), Min( ) o Các hàm lượng giác: =Cos( ), =Sin( ), =tan( ) o Hàm mũ, log: =Exp( ), =Ln( ), =Log( ) o Căn bậc 2: =Sqrt( ) o Sai tiêu chuẩn mẫu chưa hiệu đính: =Stdevp( ); hiệu đính =Stdev( ) o Phương sai mẫu chưa hiệu đính: =Varp( ); hiệu đính =Var( ) o Giai thừa: =Fact(n) o Số Pi: =Pi() Tra giá trị T, F, χ2: Trong phân tích thống kê, áp dụng tiêu chuẩn đó, cần thiết phải so sánh với giá trị tra bảng mức độ tin cậy định để đánh giá kết luận Trong Excel lập tính sẵn hàm để tra giá trị - Chọn ô lấy giá trị tra - Kích nút fx công cụ chuẩn Trong hộp thoại Function Category, chọn Statistical - Trong mục Function name, chọn hàm: Hàm Tinv: để tra T Hàm Chinv: để tra χ2 Hàm Finv: để tra F Click Next - Trong hộp thoại tiếp theo: Function Wizard chọn: + Probability (fx): Gõ vào mức ý nghĩa α=0.05 ; 0.01 hay 0.001 + Degrees Freedom (fx): Gõ vào bậc tự Đối với tiêu chuẩn F cần đưa vào độ tự + Finish 1.2 Phân phối thực nghiệm biến số 1.2.1 Một số khái niệm a Khái niệm tổng thể mẫu Tổng thể theo định nghĩa chung tập hợp hữu hạn vô hạn phần tử có số tính chất chung Chẳng hạn tập hợp tất rừng khu rừng rộng lớn Tính chất chung rừng tre nứa loại động vật Người ta thường ký hiệu N số phần tử tổng thể Cũng cần nói thêm điều tra trử lượng N = diện tích rừng/diện tích ô quan sát đặt theo hệ thống nhẫu nhiên Còn mẫu phận chọn từ tổng thể theo phương pháp Dung lượng mẫu thường ký hiệu n (n10n việc chọn có hoàn lại không hoàn lại tính sai số rút mẫu Phương pháp có ưu điểm khách quan đễ thực hiện, phần tử mẫu có thẻ không phân bố tổng thể Chọn hệ thống: Đây phương pháp thường dùngLâmnghiệp điều tra rừng Ở phương pháp này, diện tích rừng người ta kẽ nhiều đưống song song cách đo đặt ô cách có diện tích để tiến hành quan sát đại lượng đường kính, chiềucao trử lượng gỗ Phương pháp có ưu điểm phần tư mẫu rải tổng thể tính đại diệ mẫu cao Nhưng có nhược điểm tính hệ thống bị vi phạm gặp chướng ngại vật mở tuyến đặt ô quan sát - Chọn mẫu điển hình: Trong khu rừng người ta chọn hẳn giải rừng mang tính chất điển hình cho đại lương quan sát để thu thập số liệu Phương pháp đơn giản dễ thực hiện, khách quan, độ xác phụ thuộc vào kinh nghiệm điểu tra b Rút mẫu phần mềm Excel (Quy trình 1) Trên Menu/ Tools / Data Analysis/ Samling Ví dụ: Một tổng thể có 100 phần tử, cần tạo mẫu có 10 phần tử cần thực theo bước sau: - Tạo dãy số liệu từ A1-A100 - Sử dụng Quy trình - Trong hộp thoại Samling chọn: + Input Range: A1:A100 + Number of Samples: 10 (Số phần tử cần chọn để tạo mẫu) + Output Range: B1:B10 (Vùng xuất liệu)/ OK 1.2.2 Phương pháp biểu thị phân bố thực nghiệm biến số a Khái niệm Những quy luật phân bố tồn cách khách quan tổng thể biểu thị cách gần biểu thức toán học gọi quy luật phân bố lý thuyết Còn thân phân bố giá trị phần tử quan sát mẫu thí nghiệm từ ta khái quát dạng lý thuyết, người ta gọ phân bố thực nghiệm Xây dựng phân bố thực nghiệm để từ khái quát hoá thành phân bố lý thuyết nhiệm vụ người làm thồng kê Song làm để phát quy luật khách quan sở tài liệu quan sát? Để giải vấn đề điều số liệu quan sát phải đem xếp lại theo quy tắc đó, chẳng hạn người ta giá trị quan sát theo thứ tự từ nhỏ đến lớn thống kê số phần tử có giá trị (đối với đại lượng đứt quãng) thống kê phần tử có giá trị chứa khoảng xác định (đối với đại lượng liên tục) Cách làm gọi chỉnh lý tài liệu quan sát Việc chỉnh lý tài liệu quan sát ý nghĩa giúp cho việc tính toán nhanh chóng thuận lợi b Phương pháp xử lý Excel (Quy trình 2) Bước 1: Nạp số liệu vào bảng tính Bước 2: Chọn Tools/Data Analysis/Histogram/ok Bước 3: Trong hộp thoại Histogram chọn: - Input Range: Khai báo khối liệu - Bin Range: Khai báo khối liệu cự ly tổ - Output Range: Khai báo vùng xuất liệu - Cumulative Percentage: Phần trăm tần số tích luỹ - Chart output: Vẽ biểu đồ phân bố tần số tuyệt đối tích luỹ - OK Ví dụ: Lập phân bố thực nghiệm vẽ biểu đồ phân bố theo đường kính ngang ngực 30 Thông trồng loài, tuổi Đồng Hới (Bảng 1) sau: TT A B C D E 6,2 6,5 9,2 12 12,7 6,6 6,8 8,9 12,3 13,6 7,0 8,7 10 10,6 14 6,4 9,0 10,3 9,5 12,5 7,7 8,3 7,6 6,8 11,8 8,0 7,2 7,9 13,2 9,4 - Thực theo Quy trình ta có kết sau: 1.2.3 Các đặc trưng phân bố thực nghiệm a Đặc trưng vị trí (Quy trình 3) - Bình quân cộng mẫu - Định nghĩa: Giả sử có dãy trị số quan sát x1, x2, x3,…., xn trị số x x1 x2 x3 xn n hay n x xi n i 1 (1-1) Gọi số bình quân cộng giản đơn Số bình quân thường tính với tài liệu quan sát có dung lượng mẫu nhỏ (n 30) chấp nhận giả thuyết phân bố chuẩn - Các phương sai nhân tố nhau: Kiểm tra tiêu chuẩn Cochran (nếu số lần lặp lại nhau), tiêu chuẩn Bartlett (nếu số lần lặp công thức không nhau) 2.2 Phân tích phương sai nhân tố với thí nghiệm ngẫu nhiên hoàn toàn Phân tích có nhân tố xuất xứ trồng, mật độ trồng khác nhau, chế độ chăm sóc khác nhau, Có nghĩa đó có a công thức, công thức lập lại m lần, số lần lặp công thức không Trong trường hợp sử dụng chương trình phân tích phương sai nhân tố để kiểm tra ảnh hưởng công thức đến kết thí nghiệm Trong phân tích phương sai người ta thường trình bày kết hình thức bảng tính gọi bảng phân tích phương sai với ký hiệu bảng (5.2) Bảng 2.1 Bảng phân tích phương sai nhân tố (ANOVA) Nguồn biến Tổng biến Bậc tự động(Source) động(SS) (df) Phương sai (MS) F Xác suất F(Sig) (6) (1) (2) (3) (4 ) (5) Nhân tố A Sai số VA VN a-1 n-a S2a=VA/(a-1) S2N=VN/(n-a) S2a/ S2N VT n-1 S2x-VT/(n-1) Tổng Giải thích: Cột 1: Ghi nguồn biến động Cột 2: Ghi tổng bình phương biến động (SS =Sum of squares) Cột 3: Ghi bậc tự biến động đff= degrees of freedom ) Cột 4: Ghi biến động bình phương trung bình (MS= Mean square) hay phương sai (bằng cột chia cho cột 3) Cột 5: Ghi trị số F tính toán 19 Cột 6: Xác suất F gọi mức ý nghĩa F (Sig) Giá trị D1,3 (cm) bình quân ứng với ô thí nghiệm Xuất xứ theo khối (lần lặp lại) Ví dụ 1: A B C D E Xuất xứ Lặp Lặp Lặp Lặp 10.8 11.2 10.4 9.9 12.3 11.5 9.5 10.0 9.0 10.5 11.0 9.5 9.4 10.8 11.5 8.7 14.2 11,5 12.9 8,6 9,5 12.3 12.4 10.8 12.5 11 14 13 Phân tích phương sai nhân tố: - Vào menu Tools/Data Analysis/Anova: Chọn Single Factor có Hộp thoại: + Input range: Nhập địa khối liệu Vd: A2:E8 (Có cột đầu chứa số hiệu công thúc, bỏ hàng đầu) + Grouped by: Chọn Columns Rows + Đánh dấu vào Label in first colum (row) + Output range: Đưa địa ô trái nơi xuất kết + Kích OK Ví dụ 2: Cho loài Thông có xuất xứ khác theo phương pháp ngẫu nhiên đầy đủ lần lặp: LẦN LẶP A B C D E 15 16 13 11 14 14 14 12 13 12 12 13 11 10 12 13 15 12 12 10 13 14 10 11 11 20 Hãy kiểm tra ảnh hưởng xuất xứ đến sinh trưởng chiều cao? Dùngtrình lệnh: T-D-A ta có bảng sau: Qua kết kiểm tra ta thấy F(tính) > F05, nên kết luận xuất xú ảnh hưởng đến sinh truởng chiều cao - Bảng Anova gồm cột: + Cột 1: Chỉ nguồn biến động + Cột 2: Chỉ tổng biến động + Cột 3: Chỉ bậc tự + Cột 4: Phương sai nhân tố A phương sai ngẫu nhiên + Cột 5: Chỉ giá trị F tính theo công thức FA= S2a/S2N + Cột 6: Cho xác suất FA + Cột 7: F05 với bậc tự k1 = a-1, k2=n-a Đặt giả thuyết HA giả thuyết trung bình tổng thể cấp nhân tố A, trị số quan sat tuân theo luật chuẩn với phương sai thi giả thuyết HA kiểm tra luật chuẩn F với k1 = a-1, k2=n-a bậc tự Trong trường hợp F(tính) > F05 giả thuyết HA bị bác bỏ, nghĩa nhân tố A bị tác động cách khác đến kết thí nghiệm, hay trung bình mẫu không 21 2.3 Phân tích phương sai nhân tố Trong thí nghiệm người ta thường so sánh phân tích tác động đồng thời nhân tố lên kết thí nghiệm như: suất, sinh khối Phân tích phương sai lúc chia trường hợp: - Hai nhân tố với lần lặp Hai nhân tố với nhiều lần lặp lại - Phân tích phương sai nhân tố với lần lặp lại: (Bố trí thí nghiệm theo khối ngẫu nhiên đầy đủ (Randomized Complete Blocks) (RCB): Kiểu bố trí thí nghiệm RCB thường sử dụng, nhân tố A chia làm a cấp nhân tố B chia b cấp (khối), tổ hợp nhân tố có lần lặp (1 ô thí nghiệm) + Bố trí thí nghiệm trường: Nhân tố Nhân tố Nhân tố Nhân tố B1 B2 B3 Bb A1 Aa A2 A2 A2 A4 A3 A3 A3 A3 Aa A1 A4 A2 A4 A4 Aa A1 A1 Aa Ví dụ: Sinh trưởng chiều cao (cm) vườn ươm loài thí nghiệm lặp lại khối cho kết bảng (5.4) Hãy so sánh sinh trưởng loài phân tích phương sai nhân tố Bảng 2.3: Sinh trưởng chiều cao (cm) loài khác bố trí theo kiểu khối ngẫu nhiên (Nguồn: J Berley and P.J Wood) Loài Khối I Si (A) a 18 15 16 14 12 75 b 14 15 15 12 14 70 c 12 16 10 55 d 16 13 15 12 14 70 Sj (B) 60 59 54 48 49 22 CHƯƠNG III PHÂN TÍCH TƯƠNG QUAN - HỒI QUY Trong thực tế người ta cần lập mô hình tương quan hồi quy mục đích: - Để ước lượng nhân tố khó đo đếm (gọi biến phụ thuộc y) thông qua hay nhiều biến dễ quan sát, đo đếm (gọi biến độc lập x) tất nhiên phải có mối liên hệ y x Từ lập biểu điều tra phục vụ cho việc giảm nhẹ quan sát đo đếm số nhân tố phức tạp - Để dự báo nhân tố tương lai (gọi biến dự báo y) với số biến độc lập, đầu vào (gọi là biến độc lập x) - Để nghiên cứu tác động, ảnh hưởng nhiều nhân tố đến yếu tố cần quan tâm sinh trưởng, sản lượng, chất lượng rừng, xói mòn đất, dòng chảy lưu vực Trên sở có giải pháp kỹ thuật thích hợp biện pháp quản lý quy hoạch cấp vĩ mô Mục đích sử dụng chương trình Excel Statgraphics Plus để thiết lập mô hình tươngquan/hồi quy tuyến tính từ nhiều biến số độc lập Trong chương trình này, tham số ước lượng phương pháp bình phương tối thiểu Riêng dạng phi tuyến ứngdụng chương trình cần đổi biến số để quy dạng tuyến tính 3.1 Hồi quy tuyến tính lớp Hồi quy tuyến tính lớp có nghĩa có biến số độc lập x nghiên cứu ảnh hưởng đến biến phụ thuộc y, dạng quan hệ xác định đường thẳng Có nghĩa x tăng giảm y tăng giảm theo dạng thẳng Dạng phương trình tổng quát: Y = A + B.X * Dùng lệnh Tools - Data Analysis - Regression (T-D-R) Để giải toán liên hệ hồi quy tuyến tính lớp nhiều lớp, Excel có thẻ dùng lệnh Tools - Data Analysis - Regression (T-D-R), trình tự thực sau: 23 - Bước 1: Click Tools thực đơn, hộp thoại Tools chọn Data Analysis - Bước 2: Trong hộp thoại Analysis chọn Regression OK - Bước 3: Trong hộp thoại chọn + Input Y Range: Khai báo vùng liệu cho biến Y + Input X Range: Khai báo vùng liệu cho biến X 24 + Output Range: Khai báo vùng xuất liệu - Click OK Ví dụ 1: Lập mô hình tương quan chiều cao cành (Hdc) với chiều cao (H) rừng Tếch dạng đường thẳng: Hdc = A + B.H Vì Hdc tiêu khó đo đếm H, nên dùng quan hệ để xác định Hdc thông qua H TT 20 H(dc) 22 15,7 26 17 14 14 15 H(m) 23 18 30 19 16 15 18 Phương trình hồi quy tương quan: Hdc = 0,6677 + 0,818 H Ước lượng tương quan hồi quy đường thẳng: - Tools/Data Analysis/Regression OK - Hộp thoại: + Input Y range: Nhập địa cột biến Y (Có thể nhập nhãn) + Input X range: Nhập địa cột biến X (Có thể nhập nhãn) 25 + Label: Đánh dấu nhập hàng đầu làm nhãn + Output range: Nhập địa ô trái nơi xuất kết + OK Trong đó: + Regression Statistic: Multiple R: Hệ số tương quan R Square: Hệ số tương quan bình phương Standard Error: Sai tiêu chuẩn đường hồi quy Observations: Dung lượng quan sát (n) + Anova: - Sum square of Regression (SS): Tổng bình phương hiệu sai trị số lý luận phương trình hồi quy với trị số trung bình biến phụ thuộc Y - Mean square of Regression (MS): Trung bình tổng bình phương hiệu sai trị số lý luận phương trình hồi quy với trị số trung bình biến phụ thuộc Y - Coefficients of Intercept: Hệ số tự a - Coefficients of X Variable 1: Hệ số hồi quy b 26 - Standard Error of Intercept: Sai số hệ số tự a (Sa) - Standard Error of X Variable 1: Sai số hệ số hồi quy b (Sb) - t Stat of Intercept: Sai tiêu chuẩn kiểm tra tồn tham số a - t Stat of X Variable: Sai tiêu chuẩn kiểm tra tồn tham số hồi quy b - P- Value: Mức ý nghĩa tiêu chuẩn kiểm tra tồn tham số - Lower 95% Upper 95%: cận cận khoảng ước lượng tham số a, b ứng với độ tin 95% hay mức ý nghĩa 5% Ví dụ 3: Xác đinh phương trình tương quan hồi quy đường kính tán (D t) đường kính 1,3 (D1,3) cho bảng số liệu sau: D1,3 7,6 8,8 8,9 9,3 9,7 10,6 11 11,8 11,9 12,3 Dt 2,5 2,8 3,0 3,4 3,7 4,0 4,5 4,9 5,2 5,7 - Tools/Data Analysis/Regression OK - Hộp thoại: + Input Y range: Nhập địa cột biến Y (Có thể nhập nhãn) + Input X range: Nhập địa cột biến X (Có thể nhập nhãn) + Label: Đánh dấu nhập hàng đầu làm nhãn + Output range: Nhập địa ô trái nơi xuất kết 27 + OK Phương trình tương quan hồi quy có dạng: D1,3 = 4,5234 + 1,427Dt 3.2 Thiết lập biểu đồ tương quan Để toán phân tích tương quan hồi quy hoàn chỉnh, người ta phải thiết lập biểu đồ tương quan để có hình ảnh trực quan mối liên hệ đại lượng Thiết lập đồ thị bước sau (Quy trình 6) - Trên công cụ chọn Chart Wizard - Chọn khối liệu để vẽ đồ thị - Chọn kiểu đồ thị - Finish 28 BÀI TẬP Bài 1: Xác định phương trình hồi quy tương quan đường kính ngang ngực đường kính tán loài Keo tai tượng Quảng Bình với số liệu sau: X ( D1.3) 7.6 8.8 8.9 9.3 9.7 10.6 11.0 11.8 11.9 12.3 Y(Dt) 2.5 2.8 3.0 3.4 3.7 4.0 4.5 4.9 5.2 5.7 Bài 2: Lập Phương trình tương quan tỷ lệ hoa lương tính tỷ lệ đậu điều sau: Tuổi Tỷ lệ hoa lưỡng tính (%) 4.1 3.9 4.2 4.4 4.4 4.6 4.9 Tỷ lệ đậu (%) 4.2 4.4 4.0 4.5 4.8 5.0 5.3 Lập tương quan tuyến tính tỷ lệ hoa lưỡng tính tỷ lệ đậu với việc tính a b r Bài 3: Cho biết chiều cao đường kính khu rừng A D 9.94 9.13 6.72 6.29 7.16 6.53 9.77 10.47 12.11 11.47 10.98 10.03 12.90 10.0 H 14.5 19.2 12.0 20.1 14.2 17.4 15.5 11.7 19.8 17.4 18.0 19.5 17.5 16.9 Lập phương trình tương quan chiều cao đường kính khu rừng Bài 4: Lập phương trinh hồi quy tương quan D1.3 Hdc; Hvn Dt TT 10 11 16 20 21 24 27 30 31 D1.3 (cm) 9,8 10,4 10,9 8,2 10,6 10,8 10,2 9,5 10,9 8,1 10,1 H (m) 10,6 10,5 11 10,6 8,4 9,2 10,4 9,6 10,3 10,4 29 Hdc(m) 1,3 1,6 1,8 1,6 1,8 1,5 1,7 1,3 2,1 1,3 1,4 Dt (m) 4,15 4,75 4,35 3,75 4,4 4,55 4 3,95 4,2 30 ... liệu nông lâm nghiệp nói riêng, việc khai thác hết tiềm ứng dụng Excel mang lại hiệu tốt mà không thiết phải tìm kiếm thêm phần mềm chuyên dụng khác Vấn đề đặt xác định chiến lược ứng dụng khai... lượng quan sát n mức tin cậy = 1- có quan hệ toán học xác định Ta lợi dụng quan hệ toán học để xác định trước dung lượng quan sát sở định trước sai số ước lượng mức tin cậy phù hợp với yêu... tố thí nghiệm - Trong thường hợp đất không đồng việc phân chia chúng thành khối để cho đơn vị nghiên cứu khối có độ đồng cao cần thiết Trong nghiên cứu Lâm sinh vườn ươm đất Lâm nghiệp thường có