Tài liệu hạn chế xem trước, để xem đầy đủ mời bạn chọn Tải xuống
1
/ 75 trang
THÔNG TIN TÀI LIỆU
Thông tin cơ bản
Định dạng
Số trang
75
Dung lượng
2,08 MB
Nội dung
ĐẠI HỌC QUỐC GIA HÀ NỘI TRƯỜNG ĐẠI HỌC KHOA HỌC TỰ NHIÊN - - - - - - - - - o0o - - - - - - - - - VŨ NGỌC TRÌU PHÂN TÍCH THỐNG KÊ CHẤT LƯỢNG GỖ VÀ CÁC VẤN ĐỀ LIÊN QUAN LUẬN VĂN THẠC SĨ KHOA HỌC Hà Nội - 2014 ĐẠI HỌC QUỐC GIA HÀ NỘI TRƯỜNG ĐẠI HỌC KHOA HỌC TỰ NHIÊN - - - - - - - - - o0o - - - - - - - - - VŨ NGỌC TRÌU PHÂN TÍCH THỐNG KÊ CHẤT LƯỢNG GỖ VÀ CÁC VẤN ĐỀ LIÊN QUAN Chuyên ngành: Mã số: Lý thuyết xác suất thống kê toán 60 46 01 06 LUẬN VĂN THẠC SĨ KHOA HỌC NGƯỜI HƯỚNG DẪN KHOA HỌC: PGS.TS HỒ ĐĂNG PHÚC Hà Nội - 2014 Mục lục Mơ hình Logit thứ bậc mơ hình Probit thứ bậc 1.1 Mơ hình biến ẩn biến thứ tự 1.1.1 Giả thiết phân phối sai số 1.1.2 Xác suất giá trị quan sát 1.2 Xác định mơ hình 1.3 Ước lượng 1.4 Giải thích 1.4.1 Hiệu riêng phần biến độc lập y ∗ 1.4.2 Xác suất dự báo 1.4.3 Biến đổi riêng phần biến độc lập xác suất dự báo 1.4.4 Biến đổi gián đoạn 1.4.5 Mơ hình số chênh mơ hình logit thứ bậc 1.5 Giả thuyết hồi quy song song 1.6 Các mơ hình liên kết liệu tính trạng 1.6.1 Mơ hình hồi quy ghép nhóm 1.6.2 Các mơ hình khác liệu tính trạng Mô liên 2.1 2.2 2.3 2.4 2.5 2.6 2.7 hình logit đa thức biến đầu định danh mô quan Giới thiệu mơ hình logit đa thức Mơ hình logit đa thức 2.2.1 Mơ hình MNLM xét mơ hình xác suất 2.2.2 Mô hình MNLM mơ hình tỉ số 2.2.3 Mơ hình logit đa thức mơ hình lựa chọn rời rạc Ước lượng hợp lí cực đại Tính tốn kiểm tra hệ số tương phản khác Hai kiểm định hữu dụng 2.5.1 Kiểm tra biến khơng có ảnh hưởng 2.5.2 Kiểm định hai đầu kết hợp với Giải thích mơ hình 2.6.1 Xác suất dự báo 2.6.2 Biến đổi riêng 2.6.3 Biến đổi rời rạc 2.6.4 Lí giải tỉ số chênh 2.6.5 Vẽ hệ số Mơ hình logit có điều kiện i 9 11 14 15 18 20 24 24 25 hình 26 27 29 30 31 32 33 34 36 36 37 38 39 39 40 42 44 47 Sử dụng mơ hình logit thứ bậc để phân tích chất lượng sinh rừng 3.1 Giới thiệu địa bàn nghiên cứu mục đích nghiên cứu 3.2 Mô tả liệu 3.3 Phân tích chất lượng sinh trưởng 3.3.1 Phân tích số liệu “Rừng nguyên sinh” 3.3.2 Phân tích phẩm chất gỗ liệu từ rừng trồng 3.4 Bàn luận kết mơ hình hồi quy trưởng 51 51 52 56 56 63 66 Kết luận 68 Tài liệu tham khảo 69 ii Lời mở đầu Trong nghành Lâm Nghiệp, công việc quan trọng đánh giá chất lượng sinh trưởng rừng Từ kết thu được, người ta đưa phương pháp bảo tồn, phát triển khai thác rừng cách hiệu Thông thường, chuyên gia đến tận nơi đo đạc, khảo sát dựa vào kinh nghiệm để đưa kết luận xem xét sinh trưởng tốt, sinh trưởng trung bình hay sinh trưởng Một phương pháp tốn khó thực người có trình độ cao, kinh nghiệm dày dặt không nhiều Vấn đề đặt có phương pháp tốn có độ xác cao hay khơng Trong luận văn đưa cách tiếp cập theo phương pháp thống kê xây dựng mơ hình hồi quy với biến phụ thuộc chất lượng sinh trưởng, biến giải thích tiêu chí đo đạc Với mục tiêu vậy, luận văn có tên “ Phân tích chất lượng gỗ vấn đề liên quan” Luận văn chia thành ba chương Chương giới thiệu mơ hình hồi quy thứ bậc với biến phụ thuộc biến tính trạng có thứ tự Trong chương này, ta nghiên cứu mô hình mơ hình Probit, mơ hình Logit mơ hình số chênh Những phương pháp diễn giải kết hữu ích mơ hình như: hiệu riêng, biến đổi gián đoạn giới thiệu chương Chương thứ trình bày mơ hình Logit đa thức Mơ hình áp dụng với biến phụ thuộc biến định danh Các diễn giải kết mơ hình xem mở rộng diễn giải mơ hình Logit thứ bậc, nhiên biến phụ thuộc có nhiều tính trạng có nhiều biến giải thích mơ hình phức tạp có nhiều hệ số Khó khăn giải phương pháp vẽ đồ thị thể mối liên hệ hệ số Chương thứ phần chạy mơ hình từ liệu thực tế diễn giải kết từ mơ hình xây dựng Trong chương này, số kết đạt có ý nghĩa thực tế như: chất lượng sinh trưởng rừng phụ thuộc mạnh vào yếu tố đường kính tán, chiều cao, đường kính 1m3 Các lồi khác có đánh giá khác sinh trưởng, iii mức độ quý khơng có ý nghĩa việc đánh giá Đối với chất lượng gỗ rừng trồng yếu tố định để phân loại chất lượng gỗ đường kính 1m3 Các yếu tố khác có ảnh hưởng khơng đáng kể Bản luận văn hoàn thành với hướng dẫn nghiêm khắc bảo tận tình PGS.TS Hồ Đăng Phúc Thầy dành nhiều thời gian quý báu để hướng dẫn, giải đáp thắc mắc cho tơi suốt q trình bắt đầu tới hoàn thành luận văn Nhân dịp này, tơi xin bày tỏ lịng biết ơn sâu sắc tới thầy Hồ Đăng Phúc Qua đây, xin cảm ơn tới thầy khoa Tốn –Cơ – Tin, trường Đại học Khoa học Tự nhiên, Đại học Quốc gia Hà Nội, đặc biệt thầy tham gia giảng dạy khóa Cao học Tốn 2011-2013 Tơi xin cảm ơn gia đình, bạn người giúp đỡ, cổ vũ để tơi khác phục khó khăn gặp phải suốt q trình học Hà Nội, ngày 11 tháng 12 năm 2014 Học viên Vũ Ngọc Trìu iv Chương Mơ hình Logit thứ bậc mơ hình Probit thứ bậc Đối với mơ hình hồi quy tuyến tính, ta làm việc với biến phụ thuộc giả thiết biến định lượng liên tục Đây mơ hình phổ biến sử dụng rộng rãi Tuy nhiên vấn đề kinh tế- xã hội, bắt gặp nhiều biến phụ thuộc khơng liên tục chí khơng quan sát Các biến dạng gọi chung biến phụ thuộc giới hạn (limited dependent variable, LDV) Trong luận văn trình bày mơ hình phi tuyến biến phụ thuộc biến thứ tự biến định danh Ta định nghĩa biến dạng sau: Biến thứ tự (ordinal variable) biến có tính trạng thứ tự Ví dụ điều tra câu hỏi đưa phương án trả lời lựa chọn: tuyệt đối đồng ý, đồng ý, khơng đồng ý hồn tồn khơng đồng ý Biến định danh (nominal variable) biến có nhiều tính trạng tính trạng khơng có thứ hạng Ví dụ tình trạng nhân tính trạng sau: độc thân, kết hơn, li dị, góa bụa Đối với biến có thứ tự, tính trạng thứ tự từ thấp tới cao, khoảng cách tính trạng gần kề chưa xác định Những tính trạng đánh số mơ hình hồi quy tuyến tính (LRM) áp dụng Tuy nhiên, ta ngầm giả thiết khoảng cách tính trạng Một vấn đề dùng mơ hình hồi quy tuyến tính biến LDV, ước lượng chệch dẫn tới kết sai lầm, chí khơng chấp nhận Cho nên mơ hình phi tuyến đề xuất lí giải phức tạp nhiều Trong chương đầu tiên, ta xét mơ hình logit thứ bậc probit thứ bậc (ordered logit and ordered probit models) Hai mơ hình có quan hệ chặt chẽ với gọi chung mơ hình hồi quy thứ bậc (ordered regression models, ORM) Một số mô hình liên quan với hai mơ hình giới thiệu 1.1 Mơ hình biến ẩn biến thứ tự Mơ hình hồi quy thứ bậc ORM nhận từ mơ hình hồi quy thơng thường với biến phụ thuộc biến liên tục Trong mơ hình ORM, biến phụ thuộc định lượng biến ẩn y ∗ nhận giá trị từ−∞ tới +∞, song bị ẩn biến phụ thuộc quan sát y thông qua ánh xạ xác định sau: yi = m τm−1 ≤ y ∗ < τm , m = 1, , J Các điểm τ gọi điểm cắt Tính trạng cuối tương ứng với m = m = J định nghĩa khoảng mở tương ứng với τ0 = −∞ τJ = +∞ Để hiểu rõ ý tưởng trên, ta xét ví dụ sau điều tra vấn General Social Survey Trong điều tra vấn, người yêu cầu trả lời câu hỏi sau đây: “Một người mẹ làm việc tình cảm quan tâm tới họ có người mẹ khơng làm hay khơng ?” Các lựa chọn trả lời là: Rất khác biệt (strongly disagree) SD Khác biệt (Disagree) D Giống (Agree) A Hồn tồn (Strong agree) SA Biến tính trạng liên kết với biến ẩn liên tục y ∗ , biến y ∗ mức khác biệt câu hỏi “Người mẹ làm việc tình cảm quan tâm mà họ dành cho có người mẹ khơng làm không?” Biến quan sát y xác định thông qua y ∗ ánh xạ sau: τ0 = −∞ ≤ y ∗ < τ1 =⇒ SD, =⇒ D, τ1 ≤ y ∗ < τ2 yi = τ2 ≤ y ∗ < τ3 =⇒ A, =⇒ SA, τ3 ≤ y ∗ < τ4 = +∞ Ánh xạ minh họa hình vẽ sau Đường thẳng nét liền thể biến ẩn y ∗ , điểm cắt xác định đánh dấu τ1 , τ2 τ3 Giá trị biến quan sát y khoảng y ∗ đánh dấu với đường chấm Cấu trúc mơ hình là: yi∗ = xi β + εi Trong đó, xi véc tơ hàng với số cột quan sát thứ i biến độc lập xk xuất cột thứ k + 1, β véc tơ hệ số với hệ số chặn β0 Hình 1.1: Hồi quy với biến ẩn y ∗ Hình 1.2: Hồi quy với biến y Mơ hình chứa biến độc lập có cấu trúc sau: yi∗ = α + βxi + εi Trong Hình 1.1, biến ẩn y ∗ trục tung, giá trị 15, ,-5 phân chia tỷ lệ y ∗ Các điểm cắt τ1 , τ2 τ3 đường ngang chấm chấm Đường chia y ∗ thành miền giá trị biến quan sát y, τ0 = −∞ vị trí τ4 Đường hồi quy E(y ∗ |x) = α + βx với α = 1, β = 0.1 vẽ đường liền Vì y ∗ khơng quan sát nên α, β không ước lượng hồi quy y ∗ theo x Trong Hình 1.2 vẽ biến quan sát y theo x, biến y xác định từ biến ẩn y ∗ cách gán tất trường hợp mà y ∗ lớn τ3 tương ứng với số 4, trường hợp y ∗ nằm τ2 τ3 số Tương tự cho trường hợp y ∗ Uớc lượng bình phương tối thiểu (OLS) hàm hồi quy y theo x, đường đứt với ước lượng độ dốc 0,026 Đường hồi quy y theo x không xấp xỉ đường hồi quy y ∗ theo x, đường có độ dốc lớn lần Đường hồi quy Hình 1.1 Hình 1.2 trơng giống tỷ lệ trục khác Nếu trục y Hình 1.2 vẽ với tỷ lệ Hình 1.1 đường hồi quy y theo x trông đường ngang Một vấn đề khác hồi quy y theo x sai số khơng có phân phối chuẩn phương sai khơng Tổng qt, mơ hình hồi quy tuyến tính (LRM) có kết mơ hình hồi quy thứ bậc (ORM) điểm cắt có khoảng cách Khi khoảng cách điểm khác kết mơ hình hồi quy tuyến tính (LRM) đưa tới kết sai lầm Hình 1.1 cịn tính chất quan trọng mơ hình ORM Trong hình này, bạn thêm bỏ điểm cắt mà khơng làm thay đổi cấu trúc mơ hình Tưởng tượng rằng, ta vẽ đường ngang τ1 τ2 Điều tương ứng thêm tính trạng khác “ không ý kiến” “ khác biệt ” “ giống nhau” Đường hồi quy y ∗ theo x khơng bị ảnh hưởng Trong Hình 1.2, ta thêm tính trạng tương ứng thêm đường ngang biến quan sát y, điều ảnh hưởng tới kết hồi quy y theo x 1.1.1 Giả thiết phân phối sai số Để dùng phương pháp ước lượng hợp lí cực đại, ta phải giả thiết phân phối sai số Ta xét hai phân phối phân phối chuẩn phân phối logistic tương ứng với mơ hình probit thứ bậc logit thứ bậc Đối với mơ hình probit thứ bậc, sai số ε giả thiết có phân phối chuẩn với trung bình phương sai (phân phối chuẩn tắc) Hàm mật độ phân phối ε2 φ(ε) = √ exp(− ) 2π Với hàm phân phối tích lũy ε t2 √ exp(− )dt Φ(ε) = 2π −∞ (1.1) Với mơ hình logit thứ bậc, sai số ε giả sử có phân phối logit với trung bình phương sai π /3 Hàm mật độ λ(ε) = exp(ε) [1 + exp(ε)]2 Với hàm phân phối tích lũy Λ(ε) = exp(ε) + exp(ε) (1.2) Để đơn giản kí hiệu chương này, ta dùng hàm F thay cho hàm phân phối Φ Λ hàm f thay cho hàm mật độ φ λ mức độ bị đe dọa theo tiêu chuẩn Liên minh Bảo tồn Thiên nhiên Quốc tế tiêu chuẩn Việt Nam 2007 Để xem xét ảnh hưởng lớp tới việc đánh giá chất lượng sinh trưởng chuyên gia, ta đưa vào ba biến Nguycap1; Nguycap2 Nguycap3 Số lượng chuyên gia cho nguy cấp không nhiều Phần lớn điều tra không bị đe dọa Thông tin biến thể Bảng 3.4 sau b)Bộ liệu “Rừng trồng” thu thập khu vực rừng qua hoạt động khai thác, trồng lại nên chứa loại Trong liệu này, trồng loài keo tai tượng Đây loại lâm nghiệp phổ biến, trồng chủ yếu để khai thác gỗ làm nguyên liệu cho nghành công nghiệp sản xuất giấy Số liệu điều tra rừng keo tai tượng có độ tuổi 4, vị trí khác chân đồi, sười đồi đỉnh đồi Các tiêu đo đạc đường kính 1m3 theo hướng Đơng –Tây, đường kính 1m3 theo hướng Nam-Bắc, đường kính 1m3 trung bình, đường kính tán theo hướng Đơng – Tây, đường kính tán theo hướng Nam – Bắc, đường kính tán trung bình, chiều cao vút chiều cao trung bình Phẩm chất gỗ phân loại theo cấp Loại I, Loại II, Loại III Loại IV Mô tả số liệu thu thể qua Bảng 3.5 – 3.8 Dữ liệu điều tra thông tin 431 Bảng 3.5 sau tóm tắt chất gỗ lượng chuyên gia xếp hạng Chiều cao đường kính mơ tả khái qt Bảng 3.6.Các điều tra vị trí chân đồi, sườn đồi đỉnh đổi Tỉ lệ thể Bảng 3.7 55 3.3 Phân tích chất lượng sinh trưởng 3.3.1 Phân tích số liệu “Rừng nguyên sinh” Với liệu này, để đánh giá nhân tố có vai trị định mức độ sinh trưởng dự báo mức độ sinh trưởng đó, ta sử dụng mơ hình logit thứ bậc với biến phụ thuộc biến định tính có thứ bậc Masinhtruong (mã lượng sinh trưởng) biến độc lập Docao (độ cao); D13 (đường kính 1m3); Hvn (chiều cao vút ngọn); Dktan (đường kính tán); KieuIIb (kiểu rừng IIb); KieuIIIa1 (kiểu rừng IIIa1); KieuIIIa2 (kiểu rừng IIIa2); KieuNuago (kiểu rừng nửa gỗ); LopCuc (phân lớp Cúc); LopHMoi (phân lớp Hoa Môi); LopNgLan (phân lớp Ngọc Lan); LopSSau (phân lớp Sau Sau); LopThuDu (phân lớp Thù Du); LopHHong (phân lớp Hoa Hồng); LopKhac (nhóm chưa xác định phân lớp) Đồng thời ta cịn xét mơ hình thứ với biến độc lập định lượng thay log biến Kết mơ hình thứ cho Bảng 3.8 3.9 a Mơ hình logit thứ bậc với biến định lượng biến ngun thủy Ta xét mơ hình hồi quy với biến định lượng nguyên thủy Hệ số ước lượng mơ hình cho Bảng 3.8 Trong Bảng 3.8 cột tên biến Cột thứ hai hệ số hồi quy ước lượng từ mơ hình logit tương ứng với biến Cột thứ ba sai số tiêu chuẩn hệ số tương ứng Cột thứ tư lũy thừa số e hệ số cột thứ hai sau nhân hệ số với -1, tỷ số chênh mơ hình Trong cột thứ tư, hai số ứng với ngưỡng phân biệt ngưỡng phân biệt 2, dùng để phân vào nhóm “sinh trưởng kém”; “sinh trưởng trung bình” 56 “ sinh trưởng tốt” Đó khơng phải hệ số mơ hình hồi quy Cột thứ năm giá trị tiêu chuẩn kiểm định Wall hệ số ước lượng Cột thứ sáu xác suất ý nghĩa hệ số Nhìn vào cột P-giá trị, ta thấy ngưỡng phân biệt 1, ước lượng cho hệ số 0.071 với xác suất ý nghĩa 0.723 Xác suất lớn 0.05, mơ hình sử dụng hệ số khơng có ý nghĩa thống kê mức 5% Điều đồng nghĩa với việc hai tính trạng “sinh trưởng kém” “sinh trưởng trung bình” biến chất lượng sinh trưởng chưa phân biệt cách rõ ràng Đối với ngưỡng phân biệt 2, xác suất ý nghĩa hệ số nhỏ 0.05 Như vậy, hệ số có ý nghĩa thống kê Do đó, mơ hình phân biệt tốt nhóm có sinh trưởng “tốt” với nhóm sinh trưởng “trung bình” sinh trưởng “kém” Đối với biến định lượng, tất hệ số hồi quy có ý nghĩa, tức là, tiêu chí tác động đến ý kiến chuyên gia xếp vào hạng “sinh trưởng tốt”, “sinh trưởng trung bình” “sinh trưởng kém” Ở Bảng 3.8, ta thấy hệ số hồi qui biến độ cao -0.003, ứng với tỷ số chênh 1.003 Vì dấu hệ số âm nên mọc độ cao so với mực nước biển lớn có khả chun gia xếp vào nhóm có mức sinh trưởng thấp so với có đặc điểm khác, mọc độ cao thấp Tuy nhiên, ảnh hưởng nhỏ Cụ thể độ cao tăng thêm 1m khả để xếp vào lớp sinh trưởng tốt giảm khoảng 0.3% Trong mơ hình này, đường kính đo độ cao 1m3 tính từ mặt đất có hệ số tương ứng 0.01 (số chênh 0.99) Do đó, đường kính 1m3 57 tăng thêm 1cm khả bị đánh giá sinh trưởng trung bình sinh trưởng giảm khoảng 1%, với điều kiện tiêu chí khác giữ nguyên Hai biến chiều cao vút đường kính tán có ảnh hưởng mạnh tới giá trị hàm hồi quy Hai biến có hệ số ước lượng 0.123 0.482 Các hệ số dương, ứng với tỷ số chênh 0.884 0.617 nhỏ 1, chứng tỏ cao có tán rộng khả đánh giá phát triển tốt lớn Nếu chiều cao vút tăng thêm 1m khả xếp vào mức sinh trưởng trung bình sinh trưởng giảm khoảng 11.6% so với có tiêu chí tương đương có chiều cao thấp Đối với đường kính tán khả giảm 38.3% cho mét tăng đường kính tán Xét biến “KieuIIb”; “KieuIIIa1”; “KieuIIIa2” “Kieunuago”, hệ số hồi qui “KieuIIIa1” có xác suất ý nghĩa 0.867, hệ số khơng có ý nghĩa thống kê Trong mơ hình này, nhóm chưa phân loại kiểu rừng xếp vào kiểu rừng IIIa1 liệu bị mát nên ta không xác định kiểu rừng Hệ số hồi qui biến “KieuIIb” “Kieunuago” dương là: 0.64; 0,956 (số chênh 0.527 0.384), hệ số biến “KieuIIIa2” -0.53 (số chênh 1.698) Điều có nghĩa so sánh với thuộc “Kiểu khác” có tiêu chí, sinh trưởng kiểu rừng “KieuIIb” “Kieunuago” có khả chuyên gia đánh giá sinh trưởng mức tốt cao hơn, cịn khả thuộc kiểu rừng “KieuIIIa2” thấp Trong số biến “LopHHong”; “LopHMoi”; “LopCuc”; “LopThuDu”; “LopKhac”; “LopSauSau” “LopNgLan”, hệ số hồi qui biến “LopNgLan”; “LopThuDu” “LopHMoi” có ý nghĩa thống kê, hệ số biến khác có xác suất ý nghĩa lớn 0.05 Việc thuộc phân lớp Ngọc Lan; Thù Du Hoa Mơi có tác động đáng kể đến việc đánh giá chất lượng sinh trưởng chun gia Cụ thể, mơ hình này, hệ số hồi quy biến 0.264; 0.515 -0.773, tương ứng với số chênh 0.5957; 0.767 2.166 Như vậy, thuộc hai phân lớp Ngọc Lan Thù Du theo mơ hình khả xếp vào lớp sinh trưởng tốt cao so với có tiêu chí tượng tự thuộc phân lớp Sổ Đối với lớp Hoa Môi dường chuyên gia lại đánh giá khắt khe Hệ số hồi qui biến ước lượng -0.773 (tỷ số chênh 2.166) với xác suất ý nghĩa nhỏ phần nghìn Như vậy, thuộc lớp Hoa 58 Mơi có hội xếp vào nhóm sinh trưởng tốt nhỏ nhiều so với thuộc phân lớp Sổ với đặc điểm khác Từ mơ hình trên, ta có Bảng 3.9 chứa xác suất dự báo tính trạng tương ứng với biến chất lượng sinh trưởng Ở Bảng 3.9, ta thấy tỉ lệ xếp đầu sinh trưởng 68%, tỉ xếp nhầm mức sinh trưởng lên mức sinh trưởng trung bình tốt 3.5%; 3.6% Tỉ lệ có mức sinh trưởng trung bình đánh giá sinh trưởng tốt lên tới 18.2% Ở mơ hình này, thực có mức sinh trưởng khả bị xếp nhầm xuống mức thấp nhỏ Tỉ lệ có sinh trưởng tốt bị đánh giá sinh trưởng trung bình chiếm 6.7% Khơng có hạng tốt mà đánh giá Đối với mức sinh trưởng trung bình có 0.1% bị đánh giá Như vậy, mơ hình chun gia có xu hướng đánh giá trội chất lượng sinh trưởng b Mơ hình logit với biến định lượng lấy log Mơ hình hồi quy thứ hai xét mơ hình với biến định lượng thay logarit số mười biến Trong mơ hình này, ta đưa thêm vào biến “Nguycap1”; “Nguycap2” “Nguycap3” Hệ số ước lượng biến giải thích liệt kê Bảng 3.10 Mơ hình hồi quy lấy log biến định lượng đưa thêm vào biến Nguycap1; Nguycap2 Nguycap3 mơ hình có số kết tương tự mơ hình khơng lấy log Tuy nhiên, đưa thêm vào biến Nguycap1; Nguycap2 Nguycap3 hệ số tương ứng với biến có xác suất ý nghĩa lớn 5% Do đó, hệ số khơng có ý nghĩa thống kê, tức là, chuyên gia đánh giá chất lượng sinh trưởng không phụ thuộc vào việc xét có nguy tuyệt chủng hay khơng Vì vậy, để giảm bớt phức tạp mơ hình, ta bỏ biến Nguycap1; Nguycap2 Nguycap3 khỏi mơ hình hồi quy Ta ước lượng lại mơ hình hồi quy mà khơng có biến Nguycap1, Nguycap2 Nguycap3 Kết mô hình hồi quy thể Bảng 3.11 59 Ở mơ hình lấy log này, kết có sau Đầu tiên, hệ số ước lượng “ngưỡng phân biệt 1” 1.053 với xác suất ý nghĩa 0.061 hệ số khơng có ý nghĩa mức 5% Hệ số “ngưỡng phân biệt 2” 3.287 với xác suất ý nghĩa nhỏ 5% Do đó, mơ hình chưa phân biệt hai tính trạng “sinh trưởng trung bình” “sinh trưởng kém” khả sinh trưởng rừng Thứ hai, mơ hình hồi quy này, biến LogD13 khơng có ý nghĩa thống kê với xác suất ý nghĩa 0.198 Mặc dù mơ hình khơng lấy log D13 có ý nghĩa ảnh hưởng D13 yếu Các biến LogHvn; LogDktan LogDocao có ý nghĩa thống kê ảnh hưởng rõ ràng với hệ số hồi quy tương ứng với biến Logdocao; LogHvn; LogDktan là: -0.614; 3.024 3.388 Tỉ số chênh biến Logdocao; LogHvn; LogDktan 1.847; 0.048 60 0.033 Như vậy, theo mơ hình này, LogDocao tăng thêm 1, số chênh tăng lên 1.847 lần Do đó, khả để chuyên gia đánh giá mức sinh trưởng trung bình cao có tiêu chí tương tự độ cao thấp Đối với biến LogHvn biến LogDktan, biến tăng lên đơn vị khả đánh giá sinh trưởng tốt cao có tiêu chí có chiều cao vút đường kính tán nhỏ Với biến kiểu rừng, có biến KieuIIIa1 khơng có ý nghĩa thống kê với xác suất ý nghĩa 0.666 Như vậy, mơ hình khơng đánh giá khác biệt kiểu rừng IIIa1 lớp chưa phân loại kiểu rừng, nhóm chưa phân loại thuộc kiểu rừng IIIa1 Các biến KieuIIb; KieuNuago KieuIIIa2 có hệ số hồi quy 0.57; 1.031; -0.366 với xác suất ý nghĩa nhỏ 5% Tỉ số chênh ứng với biến 0.565; 0.356 1.441 Như vậy, rừng mà thuộc hai kiểu rừng IIb kiểu nửa gỗ khả đánh giá có sinh trưởng tốt cao có đặc điểm khác không thuộc hai kiểu rừng Cịn thuộc kiểu rừng IIIa2 khả chuyên gia đánh giá có sinh trưởng trung bình cao khác có đặc điểm sinh trưởng kiểu rừng khác Đối với biến LopCuc; LopHHong; LopHMoi; LopNgLan; LopSSau; LopThuDu LopKhac, có biến LopHMoi; LopNgLan LopThuDu có ý nghĩa Hệ số hồi quy biến LopHMoi; LopNgLan LopThuDu -0.745; 0.249 0.547 tương ứng với tỉ số chênh 2.106; 0.779 0.578 Xác suất dự báo tính trạng mơ hình cho Bảng 3.12 Đối với mơ hình tỉ lệ xếp hạng tính trạng 68% Tỉ lệ xếp nhầm từ mức sinh trưởng sang hai mức sinh trưởng trung bình sinh trưởng tốt với tỉ lệ 3.3% 3.4% Tỉ lệ xếp 61 nhầm từ mức sinh trưởng trung bình sang mức sinh trưởng tốt 17.9% Tuy nhiên, tỉ lệ xếp nhầm sinh trưởng mức sinh trưởng tốt sang mức sinh trưởng trung bình chiếm 7.1% So sánh mơ hình hồi quy với biến ngun thủy mơ hình lấy Log Đối với hai mơ hình hồi xét trên, kết hai mơ hình có nhiều điểm tương tự có số điểm khác nhau, cụ thể: Thứ nhất, ngưỡng phân biệt hai mơ hình có ngưỡng phân biệt có ý nghĩa thống kê Ngưỡng phân biệt khơng có ý nghĩa thống kê Do đó, hai mơ hình phân biệt tốt mức sinh trưởng tốt với mức sinh trưởng trung bình sinh trưởng kém, mơ hình khơng có phân biệt rõ ràng mức sinh trưởng trung bình Thứ hai, biến định lượng, mơ hình lấy log biến LogD13 khơng có ý nghĩa Tuy nhiên, mơ hình khơng lấy log biến D13 có ý nghĩa ảnh hưởng biến yếu với hệ số hồi quy 0.01 Trong mơ hình khơng lấy log, biến Docao; Hvn; Dktan có hệ số hồi quy tương ứng -0,003; 0.123 0.482 Đối với mơ hình lấy log biến định lượng, hệ số hồi quy ứng với biến LogDocao; LogHvn; LogDKtan -0.614; 3.024 3.388 Như vậy, ảnh hưởng biến hai mô hình có hướng Nhưng mơ hình lấy log tác động biến mạnh nhiều lần Thứ ba, biến định tính kiểu rừng, hai mơ hình cho kết giống hướng cường độ ảnh hưởng biến Các hệ số hồi quy mơ hình khơng lấy log biến KieuIIb; KieuIIIa2; KieuNuago 0.64; -0.53 0.956 Trong mơ hình lấy log, biến có hệ số 0.57; -0.366; 1.031 Thứ tư, biến định tính lồi cây, kết hai mơ hình giống Đối với biến có ý nghĩa thống kê LopHMoi; LopNgLan LopThudu hệ số hồi quy biến hai mô hình khơng lấy log -0.773; 0.264; 0.515 mơ hình có lấy log sau -0.745; 0.249; 0.547 Cuối cùng, dự báo đầu tính trạng, hai mơ hình có tỉ lệ xếp 68%, mơ hình khơng lấy log việc xếp nhầm lên mức sinh trưởng cao chiếm 25.3% cịn mơ hình lấy log tỉ lệ 24.6% Như vậy, hai mơ hình có đánh giá xếp hạng sinh trưởng giống Tuy nhiên mơ hình lấy log cho kết gần với đánh giá chuyên gia hơn, theo nghĩa xếp nhầm nhóm chuyên gia đánh giá mức sinh trưởng thấp lên lớp đánh giá có chất lượng cao hơn, so với mơ hình khơng lấy log 62 Từ hai mơ hình đây, ta thấy kết chúng giống nhiều sai khác Ở mơ hình lấy log ảnh hưởng biến rõ ràng mô hình đánh giá chất lượng sinh trưởng phù hợp với ý kiến chuyên gia 3.3.2 Phân tích phẩm chất gỗ liệu từ rừng trồng Đối với liệu này, ta xét hai mơ hình logit mơ hình với biến ngun thủy mơ hình với biến định lượng lấy log a Mơ hình với biến định lượng ngun thủy Mơ hình xây dựng với biến phụ thuộc Maphchat (mã phẩm chất), biến giải thích D13DT (đường kính 1m3 theo hướng đơng tây); D13NB (đường kính 1m3 theo hướng nam – bắc); D13TB (đường kính 1m3 trung bình), DtanDT (đường kính tán theo hướng đơng - tây); DtanNB (đường kính tán theo hướng nam – bắc); DtanTB (đường kính tán trung bình); Hvn (chiều cao vút ngọn); Vitri (vị trí); Hdc (chiều cao tán); dotanche ( độ tán che) Kết mơ hình cho Bảng 3.13 sau Ở Bảng 3.13, cột tên biến, cột thứ hai hệ số hồi quy biến giải thích Ba hệ số đầu tiền cột ngưỡng để phân chia phẩm chất gỗ vào mức độ Cột thứ ba sai tiêu chuẩn hệ số ước lượng Cột thứ tư lũy thừa số e hệ số hồi quy sau nhân với -1, tỉ số chênh biến tăng lên đơn vị Cột thứ năm giá trị kiểm định Wall cột thứ sáu xác suất ý nghĩa hệ số ước lượng Nhìn vào mức ý nghĩa mơ hình này, ta thấy hầu hết biến giải thích 63 có xác suất ý nghĩa lớn 5% Chỉ có biến D13DT DinhDoi có ý nghĩa Các ngưỡng Maphchat có ý nghĩa Như vậy, mơ hình phân biệt tốt mức phẩm chất Đối với biến định lượng có biến D13DT có ý nghĩa thống kê, hệ số hồi quy biến -2.021, tương ứng với tỉ số chênh 7.5458 Điều có nghĩa mà có đường kính lớn khả chuyên gia đánh giá có phẩm chất gỗ mức thấp tăng Cụ thể, đường kính tăng thêm 1cm khả bị xếp vào mức phẩm chất thấp tăng tới 6.5458 lần Như vậy, đường kính có ảnh hưởng định tới việc đánh giá phẩm chất gỗ Keo tai tượng Đối với biến định tính, có biến DinhDoi có ý nghĩa thống kê Hệ số hồi quy biến -0.572 tỉ số chênh 1.771 Điều có nghĩa có phân biệt chuyên gia đánh giá chất lượng sinh trưởng vị trí khác Sự sai khác đáng kể vị trí đỉnh đổi so với vị trí chân đồi sườn đồi Vì hệ số hồi quy âm nên trồng vị trí đỉnh đồi chuyên gia xếp hạng phẩm chất gỗ mức thấp cao so với có tiêu chí tương đương trồng chân đồi Tức là, vị trí cao có đường kính lớn khả chun gia xếp hạng phẩm chất vào mức thấp tăng lên Xác suất dự báo mức phẩm chất cho Bảng 3.14 Ở Bảng 3.14 này, tỉ lệ xếp mức phẩm chất gỗ 56.7% Tỉ lệ xếp nhầm phẩm chất gỗ mức I lên mức II III 4.9% 3.5% Tỉ lệ xếp nhầm mức II lên mức III 15.5% tỉ lệ mức III lên IV 0.9% Như vây, tỉ lệ đánh giá trội phẩm chất gỗ 24.8% Tỉ lệ bị đánh hạ mức phẩm chất 18.6% Đối với mơ hình chuyên gia đánh giá trội phẩm chất gỗ b Mơ hình với biến định lượng lấy log 64 Đối với mơ hình biến định lượng lấy log biến định tính biến phụ thuộc khơng thay đổi Kết ước lượng mơ hình thể Bảng 3.15 Bảng 3.15 tương tự Bảng 3.12, cột tên biến, cột thứ hai hệ số hồi quy biến giải thích Ba hệ số đầu tiền cột ngưỡng để phân chia phẩm chất gỗ vào mức độ Cột thứ ba sai tiêu chuẩn hệ số ước lượng Cột thứ tư lũy thừa số e hệ số hồi quy sau nhân với -1, tỉ số chênh biến tăng lên đơn vị Cột thứ năm giá trị kiểm định Wall cột thứ sáu xác suất ý nghĩa hệ số ước lượng Trong mơ hình hồi quy với biến định lượng lấy log có hai biến DinhDoi logD13DT có ý nghĩa thống kê Các biến giải thích khác khơng có ý nghĩa Các ngưỡng phân biệt có ý nghĩa cách phân chia mức phẩm chất gỗ theo thang gồm mức chấp nhận Đối với biến định lượng LogD13DT, hệ số hồi quy -32,254 tương ứng với tỉ số chênh 1.020 Hệ số âm nên đường kính tăng lên khả chun gia xếp vào mức phẩm chất thấp cao có tiêu chí khác có đường kính nhỏ Vì biến định lương khác khơng có ý nghĩa nên rừng trồng yếu tố định tới phẩm chất gỗ chuyên gia đánh giá đường kính Đối với biến định tính DinhDoi, hệ số hồi quy -0.732 với tỉ số chênh 2.079 Do đó, trồng đỉnh đồi phẩm chất gỗ chuyên gia xếp vào mức phẩm chất thấp cao gấp 1.079 lần có tiêu chí trồng chân đồi sườn đồi 65 Xác suất dự báo phẩm chất gỗ mơ hình hồi quy với biến định lượng lấy log cho Bảng 3.16 Từ Bảng 3.15 này, ta thấy tỉ lệ chuyên gia đánh giá phẩm chất gỗ 57.3% Tỉ lệ chuyên gia xếp lên mức phẩm chất cao 24.3% Tỉ lệ bị chuyên gia hạ mức phẩm chất 18.3% Như vậy, mơ hình chuyên gia đánh giá trội phẩm chất gỗ So sánh mơ hình với biến định lượng ngun thủy mơ hình lấy log Hai mơ hình có kết giống Các ngưỡng phân biệt mức phẩm chất có ý nghĩa, tức là, việc chia phẩm chất gỗ thành bốn mức hợp lí Cả hai mơ hình đưa kết yếu tố quan trọng việc đánh giá phẩm chất gỗ đường kính Đánh giá hiệu chỉnh dựa vào vị trí trồng Có thể nói hai mơ hình cho kết sai khác khơng nhiều.Tuy nhiên, mơ hình hồi quy có lấy log, tỉ lệ xếp mức phẩm chất cao mô hình với biến định lượng nguyên thủy 0.6% Tỉ lệ bị đánh giá trội mức phẩm chất mô hình lấy log nhỏ mơ hình khơng lấy log 0.5% 3.4 Bàn luận kết mô hình hồi quy Các mơ hình hồi quy trình bày hai phần 3.3.1 3.3.2 thể cách mà chuyên gia đánh giá chất lượng sinh trưởng thông qua biến giải thích xây dựng mơ hình Theo chuyên gia lâm nghiệp chất lượng sinh trưởng đánh giá sở tiêu chí quan trọng chiều cao, đường kính 1m3, đường kính 66 tán, độ cao Điều thể tốt mơ hình Ảnh hưởng độ cao có vai trị quan trọng sinh trưởng độ cao khác có kiểu khí hậu, độ ẩm, nhiệt độ khác nên sinh trưởng nói chung khơng giống Theo chun gia lâm nghiệp có sai khác sinh trưởng mức độ cao 100m, từ 100m-200m, từ 200m-300m Với liệu thu được, tiêu chuẩn có độ cao 200m mơ hình đánh giá ảnh hưởng độ cao ảnh hưởng nhỏ Điều phù hợp với thực tế Về việc đánh giá chất lượng sinh trưởng kiểu rừng nói chung vấn đề phức tạp khó so sánh Tuy nhiên, kết mơ hình lí giải sau: Các kiểu rừng IIb kiểu nửa gỗ chủ yếu loài ưa sáng nên thường sinh trưởng tốt Kiểu rừng IIIa2 có cấu trúc phức tạp Kiểu rừng xuất thêm nhiều mối quan hệ sinh thái quần thể rừng thành phần rừng có nhiều lồi chịu bóng phát triển nên thường bị sâu bệnh mức độ sinh trưởng thường thấp Trong lâm nghiệp, lồi khác có khả sinh trưởng khác phụ thuộc vào đặc điểm sinh học lồi sinh thái rừng Ở mơ hình xét thấy khác biệt việc ghép lồi thành phân lớp – cách phân chia thành nhóm lớn nên chưa thấy rõ ảnh hưởng Một kết mơ hình hồn tồn trí với quan điểm chuyên gia việc đánh giá chất lượng sinh trưởng không phụ thuộc vào nguy tuyệt chủng Như vậy, mơ hình xây dựng chương có ý nghĩa thực tế định xem phương pháp tốt để đánh giá chất lượng sinh trưởng rừng 67 Kết luận Luận văn “Phân tích thống kê chất lượng gỗ vấn đề liên quan” làm nhiệm vụ xây dựng phương pháp toán để đánh giá chất lượng sinh trưởng phẩm chất gỗ rừng Phương pháp tốn mơ hình hồi quy thứ bậc Luận văn đạt kết sau Về mặt lý thuyết, luận văn giới thiệu mơ hình hồi quy thứ bậc với biến phụ thuộc biến tính trạng thứ tự mơ hình hồi quy đa thức với biến phụ thuộc biến định danh Các mô hình đưa gồm có mơ hình logit, mơ hình probit, mơ hình tỉ số chênh mơ hình liên kết với Ảnh hưởng hay hiệu biến giải thích liên tục biến giả tính tốn nhiều cách khác như: hiệu riêng, biến đổi gián đoạn, Ở mô hình khác nhau, kết diễn giải hiệu dạng bảng đồ thị mô tả ảnh hưởng biến giải thích biến phụ thuộc Về mặt thực hành, luận văn xây dựng mơ hình hồi quy thứ bậc với liệu rừng tự nhiên rừng trồng Những kết thu hầu hết có ý nghĩa thực tế như: ảnh hưởng chiều cao, đường kính thân, đường kính tán, độ cao có vai trị quan trọng việc đánh giá chất lượng sinh trưởng Các mơ hình nói lên sai khác sinh trưởng loài kiểu rừng Hướng nghiên cứu tiếp cho luận văn xây dựng mơ hình tốt sở có hiểu biết sâu sắc nghành lâm nghiệp để làm rõ ảnh hưởng kiểu rừng loài tới chất lượng sinh trưởng Mặc dù cố gắng hạn chế trình độ, thời gian kiến thức lâm nghiệp nên luận văn khó tránh khỏi thiếu sót Tác giả luận văn chân thành mong muốn thầy cô, chuyên gia, bạn đóng góp ý kiến để luận văn hoàn thiện 68 Tài liệu tham khảo [1] Đào Hữu Hồ,Xác suất –Thống kê, NXB Đại học Quốc Gia Hà Nội [2] Đào Hữu Hồ, Nguyễn văn Hữu, Nguyễn Hữu Như, Thống kê toán học, NXB Đại học Quốc gia Hà Nội [3] Nguyễn Văn Hữu, Nguyễn Hữu Dư,Phân tích thống kê dự báo, NXB Đại học Quốc gia Hà Nội [4] Nguyễn Duy Tiến, Đặng Hùng Thắng,Các mơ hình xác suất ứng dụng, NXB Đại học Quốc gia Hà Nội [5] Đặng Hùng Thắng,Thống kê ứng dụng, NXB Khoa học kỹ thuật [6] Nguyễn Duy Tiến, Vũ Viết Yên,Lý thuyết Xác suất, NXB Giáo Dục [7] ] J Scott Long,Regression models for Categorical and Limited dependent variables, NXB Cambridge University Press [8] Alan Agresti,An introduction Categorical data analysis, NXB Newyork, John Wiley [9] Alan Agresti,Categorical data analysis, NXB Newyork, John Wiley [10] Adrich, Nelson,Linear probability, logit, and probit models [11] Amemiya, Regression analysis when the dependent variables are truncated normal, NXB Springer, New York [12] Amemiya, Advanced Econometrics, NXB Cambridge, MA: Harvard University [13] Bollen, Structucal equations with latent variables [14] Breen, Regression models: Censored, sample selected, or truncated data [15] Cramer, Econometric application of maximum likelihood methods 69