Phân tích thống kê chất lượng gỗ và các vấn đề liên quan

11 362 0
Phân tích thống kê chất lượng gỗ và các vấn đề liên quan

Đang tải... (xem toàn văn)

Tài liệu hạn chế xem trước, để xem đầy đủ mời bạn chọn Tải xuống

Thông tin tài liệu

ĐẠI HỌC QUỐC GIA HÀ NỘI TRƯỜNG ĐẠI HỌC KHOA HỌC TỰ NHIÊN - - - - - - - - - o0o - - - - - - - - - VŨ NGỌC TRÌU PHÂN TÍCH THỐNG KÊ CHẤT LƯỢNG GỖ VÀ CÁC VẤN ĐỀ LIÊN QUAN LUẬN VĂN THẠC SĨ KHOA HỌC Hà Nội - 2014 ĐẠI HỌC QUỐC GIA HÀ NỘI TRƯỜNG ĐẠI HỌC KHOA HỌC TỰ NHIÊN - - - - - - - - - o0o - - - - - - - - - VŨ NGỌC TRÌU PHÂN TÍCH THỐNG KÊ CHẤT LƯỢNG GỖ VÀ CÁC VẤN ĐỀ LIÊN QUAN Chuyên ngành: Mã số: Lý thuyết xác suất thống kê toán 60 46 01 06 LUẬN VĂN THẠC SĨ KHOA HỌC NGƯỜI HƯỚNG DẪN KHOA HỌC: PGS.TS HỒ ĐĂNG PHÚC Hà Nội - 2014 Mục lục Mô hình Logit thứ bậc mô hình Probit thứ bậc 1.1 Mô hình biến ẩn biến thứ tự 1.1.1 Giả thiết phân phối sai số 1.1.2 Xác suất giá trị quan sát 1.2 Xác định mô hình 1.3 Ước lượng 1.4 Giải thích 1.4.1 Hiệu riêng phần biến độc lập y ∗ 1.4.2 Xác suất dự báo 1.4.3 Biến đổi riêng phần biến độc lập xác suất dự báo 1.4.4 Biến đổi gián đoạn 1.4.5 Mô hình số chênh mô hình logit thứ bậc 1.5 Giả thuyết hồi quy song song 1.6 Các mô hình liên kết liệu tính trạng 1.6.1 Mô hình hồi quy ghép nhóm 1.6.2 Các mô hình khác liệu tính trạng Mô liên 2.1 2.2 2.3 2.4 2.5 2.6 2.7 hình logit đa thức biến đầu định danh mô quan Giới thiệu mô hình logit đa thức Mô hình logit đa thức 2.2.1 Mô hình MNLM xét mô hình xác suất 2.2.2 Mô hình MNLM mô hình tỉ số 2.2.3 Mô hình logit đa thức mô hình lựa chọn rời rạc Ước lượng hợp lí cực đại Tính toán kiểm tra hệ số tương phản khác Hai kiểm định hữu dụng 2.5.1 Kiểm tra biến ảnh hưởng 2.5.2 Kiểm định hai đầu kết hợp với Giải thích mô hình 2.6.1 Xác suất dự báo 2.6.2 Biến đổi riêng 2.6.3 Biến đổi rời rạc 2.6.4 Lí giải tỉ số chênh 2.6.5 Vẽ hệ số Mô hình logit có điều kiện i 9 11 14 15 18 20 24 24 25 hình 26 27 29 30 31 32 33 34 36 36 37 38 39 39 40 42 44 47 Sử dụng mô hình logit thứ bậc để phân tích chất lượng sinh rừng 3.1 Giới thiệu địa bàn nghiên cứu mục đích nghiên cứu 3.2 Mô tả liệu 3.3 Phân tích chất lượng sinh trưởng 3.3.1 Phân tích số liệu “Rừng nguyên sinh” 3.3.2 Phân tích phẩm chất gỗ liệu từ rừng trồng 3.4 Bàn luận kết mô hình hồi quy trưởng 51 51 52 56 56 63 66 Kết luận 68 Tài liệu tham khảo 69 ii Lời mở đầu Trong nghành Lâm Nghiệp, công việc quan trọng đánh giá chất lượng sinh trưởng rừng Từ kết thu được, người ta đưa phương pháp bảo tồn, phát triển khai thác rừng cách hiệu Thông thường, chuyên gia đến tận nơi đo đạc, khảo sát dựa vào kinh nghiệm để đưa kết luận xem xét sinh trưởng tốt, sinh trưởng trung bình hay sinh trưởng Một phương pháp tốn khó thực người có trình độ cao, kinh nghiệm dày dặt không nhiều Vấn đề đặt có phương pháp tốn có độ xác cao hay không Trong luận văn đưa cách tiếp cập theo phương pháp thống kê xây dựng mô hình hồi quy với biến phụ thuộc chất lượng sinh trưởng, biến giải thích tiêu chí đo đạc Với mục tiêu vậy, luận văn có tên “ Phân tích chất lượng gỗ vấn đề liên quan” Luận văn chia thành ba chương Chương giới thiệu mô hình hồi quy thứ bậc với biến phụ thuộc biến tính trạng có thứ tự Trong chương này, ta nghiên cứu mô hình mô hình Probit, mô hình Logit mô hình số chênh Những phương pháp diễn giải kết hữu ích mô hình như: hiệu riêng, biến đổi gián đoạn giới thiệu chương Chương thứ trình bày mô hình Logit đa thức Mô hình áp dụng với biến phụ thuộc biến định danh Các diễn giải kết mô hình xem mở rộng diễn giải mô hình Logit thứ bậc, nhiên biến phụ thuộc có nhiều tính trạng có nhiều biến giải thích mô hình phức tạp có nhiều hệ số Khó khăn giải phương pháp vẽ đồ thị thể mối liên hệ hệ số Chương thứ phần chạy mô hình từ liệu thực tế diễn giải kết từ mô hình xây dựng Trong chương này, số kết đạt có ý nghĩa thực tế như: chất lượng sinh trưởng rừng phụ thuộc mạnh vào yếu tố đường kính tán, chiều cao, đường kính 1m3 Các loài khác có đánh giá khác sinh trưởng, iii mức độ quý ý nghĩa việc đánh giá Đối với chất lượng gỗ rừng trồng yếu tố định để phân loại chất lượng gỗ đường kính 1m3 Các yếu tố khác có ảnh hưởng không đáng kể Bản luận văn hoàn thành với hướng dẫn nghiêm khắc bảo tận tình PGS.TS Hồ Đăng Phúc Thầy dành nhiều thời gian quý báu để hướng dẫn, giải đáp thắc mắc cho suốt trình bắt đầu tới hoàn thành luận văn Nhân dịp này, xin bày tỏ lòng biết ơn sâu sắc tới thầy Hồ Đăng Phúc Qua đây, xin cảm ơn tới thầy cô khoa Toán –Cơ – Tin, trường Đại học Khoa học Tự nhiên, Đại học Quốc gia Hà Nội, đặc biệt thầy tham gia giảng dạy khóa Cao học Toán 2011-2013 Tôi xin cảm ơn gia đình, bạn người giúp đỡ, cổ vũ để khác phục khó khăn gặp phải suốt trình học Hà Nội, ngày 11 tháng 12 năm 2014 Học viên Vũ Ngọc Trìu iv Chương Mô hình Logit thứ bậc mô hình Probit thứ bậc Đối với mô hình hồi quy tuyến tính, ta làm việc với biến phụ thuộc giả thiết biến định lượng liên tục Đây mô hình phổ biến sử dụng rộng rãi Tuy nhiên vấn đề kinh tế- xã hội, bắt gặp nhiều biến phụ thuộc không liên tục chí không quan sát Các biến dạng gọi chung biến phụ thuộc giới hạn (limited dependent variable, LDV) Trong luận văn trình bày mô hình phi tuyến biến phụ thuộc biến thứ tự biến định danh Ta định nghĩa biến dạng sau: Biến thứ tự (ordinal variable) biến có tính trạng thứ tự Ví dụ điều tra câu hỏi đưa phương án trả lời lựa chọn: tuyệt đối đồng ý, đồng ý, không đồng ý hoàn toàn không đồng ý Biến định danh (nominal variable) biến có nhiều tính trạng tính trạng thứ hạng Ví dụ tình trạng hôn nhân tính trạng sau: độc thân, kết hôn, li dị, góa bụa Đối với biến có thứ tự, tính trạng thứ tự từ thấp tới cao, khoảng cách tính trạng gần kề chưa xác định Những tính trạng đánh số mô hình hồi quy tuyến tính (LRM) áp dụng Tuy nhiên, ta ngầm giả thiết khoảng cách tính trạng Một vấn đề dùng mô hình hồi quy tuyến tính biến LDV, ước lượng chệch dẫn tới kết sai lầm, chí không chấp nhận Cho nên mô hình phi tuyến đề xuất lí giải phức tạp nhiều Trong chương đầu tiên, ta xét mô hình logit thứ bậc probit thứ bậc (ordered logit and ordered probit models) Hai mô hình có quan hệ chặt chẽ với gọi chung mô hình hồi quy thứ bậc (ordered regression models, ORM) Một số mô hình liên quan với hai mô hình giới thiệu 1.1 Mô hình biến ẩn biến thứ tự Mô hình hồi quy thứ bậc ORM nhận từ mô hình hồi quy thông thường với biến phụ thuộc biến liên tục Trong mô hình ORM, biến phụ thuộc định lượng biến ẩn y ∗ nhận giá trị từ−∞ tới +∞, song bị ẩn biến phụ thuộc quan sát y thông qua ánh xạ xác định sau: yi = m τm−1 ≤ y ∗ < τm , m = 1, , J Các điểm τ gọi điểm cắt Tính trạng cuối tương ứng với m = m = J định nghĩa khoảng mở tương ứng với τ0 = −∞ τJ = +∞ Để hiểu rõ ý tưởng trên, ta xét ví dụ sau điều tra vấn General Social Survey Trong điều tra vấn, người yêu cầu trả lời câu hỏi sau đây: “Một người mẹ làm việc tình cảm quan tâm tới họ có người mẹ không làm hay không ?” Các lựa chọn trả lời là: Rất khác biệt (strongly disagree) SD Khác biệt (Disagree) D Giống (Agree) A Hoàn toàn (Strong agree) SA Biến tính trạng liên kết với biến ẩn liên tục y ∗ , biến y ∗ mức khác biệt câu hỏi “Người mẹ làm việc tình cảm quan tâm mà họ dành cho có người mẹ không làm không?” Biến quan sát y xác định thông qua y ∗ ánh xạ sau:  τ0 = −∞ ≤ y ∗ < τ1  =⇒ SD, =⇒ D, τ1 ≤ y ∗ < τ2 yi = τ2 ≤ y ∗ < τ3  =⇒ A, =⇒ SA, τ3 ≤ y ∗ < τ4 = +∞ Ánh xạ minh họa hình vẽ sau Đường thẳng nét liền thể biến ẩn y ∗ , điểm cắt xác định đánh dấu τ1 , τ2 τ3 Giá trị biến quan sát y khoảng y ∗ đánh dấu với đường chấm Cấu trúc mô hình là: yi∗ = xi β + εi Trong đó, xi véc tơ hàng với số cột quan sát thứ i biến độc lập xk xuất cột thứ k + 1, β véc tơ hệ số với hệ số chặn β0 Hình 1.1: Hồi quy với biến ẩn y ∗ Hình 1.2: Hồi quy với biến y Mô hình chứa biến độc lập có cấu trúc sau: yi∗ = α + βxi + εi Trong Hình 1.1, biến ẩn y ∗ trục tung, giá trị 15, ,-5 phân chia tỷ lệ y ∗ Các điểm cắt τ1 , τ2 τ3 đường ngang chấm chấm Đường chia y ∗ thành miền giá trị biến quan sát y, τ0 = −∞ vị trí τ4 Đường hồi quy E(y ∗ |x) = α + βx với α = 1, β = 0.1 vẽ đường liền Vì y ∗ không quan sát nên α, β không ước lượng hồi quy y ∗ theo x Trong Hình 1.2 vẽ biến quan sát y theo x, biến y xác định từ biến ẩn y ∗ cách gán tất trường hợp mà y ∗ lớn τ3 tương ứng với số 4, trường hợp y ∗ nằm τ2 τ3 số Tương tự cho trường hợp y ∗ Uớc lượng bình phương tối thiểu (OLS) hàm hồi quy y theo x, đường đứt với ước lượng độ dốc 0,026 Đường hồi quy y theo x không xấp xỉ đường hồi quy y ∗ theo x, đường có độ dốc lớn lần Đường hồi quy Hình 1.1 Hình 1.2 trông giống tỷ lệ trục khác Nếu trục y Hình 1.2 vẽ với tỷ lệ Hình 1.1 đường hồi quy y theo x trông đường ngang Một vấn đề khác hồi quy y theo x sai số phân phối chuẩn phương sai không Tổng quát, mô hình hồi quy tuyến tính (LRM) có kết mô hình hồi quy thứ bậc (ORM) điểm cắt có khoảng cách Khi khoảng cách điểm khác kết mô hình hồi quy tuyến tính (LRM) đưa tới kết sai lầm Hình 1.1 tính chất quan trọng mô hình ORM Trong hình này, bạn thêm bỏ điểm cắt mà không làm thay đổi cấu trúc mô hình Tưởng tượng rằng, ta vẽ đường ngang τ1 τ2 Điều tương ứng thêm tính trạng khác “ không ý kiến” “ khác biệt ” “ giống nhau” Đường hồi quy y ∗ theo x không bị ảnh hưởng Trong Hình 1.2, ta thêm tính trạng tương ứng thêm đường ngang biến quan sát y, điều ảnh hưởng tới kết hồi quy y theo x 1.1.1 Giả thiết phân phối sai số Để dùng phương pháp ước lượng hợp lí cực đại, ta phải giả thiết phân phối sai số Ta xét hai phân phối phân phối chuẩn phân phối logistic tương ứng với mô hình probit thứ bậc logit thứ bậc Đối với mô hình probit thứ bậc, sai số ε giả thiết có phân phối chuẩn với trung bình phương sai (phân phối chuẩn tắc) Hàm mật độ phân phối ε2 φ(ε) = √ exp(− ) 2π Với hàm phân phối tích lũy ε t2 √ exp(− )dt Φ(ε) = 2π −∞ (1.1) Với mô hình logit thứ bậc, sai số ε giả sử có phân phối logit với trung bình phương sai π /3 Hàm mật độ λ(ε) = exp(ε) [1 + exp(ε)]2 Với hàm phân phối tích lũy Λ(ε) = exp(ε) + exp(ε) (1.2) Để đơn giản kí hiệu chương này, ta dùng hàm F thay cho hàm phân phối Φ Λ hàm f thay cho hàm mật độ φ λ Tài liệu tham khảo [1] Đào Hữu Hồ,Xác suất –Thống kê, NXB Đại học Quốc Gia Hà Nội [2] Đào Hữu Hồ, Nguyễn văn Hữu, Nguyễn Hữu Như, Thống kê toán học, NXB Đại học Quốc gia Hà Nội [3] Nguyễn Văn Hữu, Nguyễn Hữu Dư,Phân tích thống kê dự báo, NXB Đại học Quốc gia Hà Nội [4] Nguyễn Duy Tiến, Đặng Hùng Thắng,Các mô hình xác suất ứng dụng, NXB Đại học Quốc gia Hà Nội [5] Đặng Hùng Thắng,Thống kê ứng dụng, NXB Khoa học kỹ thuật [6] Nguyễn Duy Tiến, Vũ Viết Yên,Lý thuyết Xác suất, NXB Giáo Dục [7] ] J Scott Long,Regression models for Categorical and Limited dependent variables, NXB Cambridge University Press [8] Alan Agresti,An introduction Categorical data analysis, NXB Newyork, John Wiley [9] Alan Agresti,Categorical data analysis, NXB Newyork, John Wiley [10] Adrich, Nelson,Linear probability, logit, and probit models [11] Amemiya, Regression analysis when the dependent variables are truncated normal, NXB Springer, New York [12] Amemiya, Advanced Econometrics, NXB Cambridge, MA: Harvard University [13] Bollen, Structucal equations with latent variables [14] Breen, Regression models: Censored, sample selected, or truncated data [15] Cramer, Econometric application of maximum likelihood methods 69 [...]... Hồ,Xác suất Thống kê, NXB Đại học Quốc Gia Hà Nội [2] Đào Hữu Hồ, Nguyễn văn Hữu, Nguyễn Hữu Như, Thống kê toán học, NXB Đại học Quốc gia Hà Nội [3] Nguyễn Văn Hữu, Nguyễn Hữu Dư ,Phân tích thống kê và dự báo, NXB Đại học Quốc gia Hà Nội [4] Nguyễn Duy Tiến, Đặng Hùng Thắng ,Các mô hình xác suất và ứng dụng, NXB Đại học Quốc gia Hà Nội [5] Đặng Hùng Thắng ,Thống kê ứng dụng, NXB Khoa học và kỹ thuật [6]

Ngày đăng: 09/09/2016, 23:15

Từ khóa liên quan

Tài liệu cùng người dùng

Tài liệu liên quan