Phân tích thống kê chất lượng gỗ và các vấn đề liên quan

Mục lục 1 Mô hình Logit thứ bậc và mô hình Probit thứ bậc 1 1.1 Mô hình biến ẩn đối với biến thứ tự . . . . . . . . . . . . . . . . . . . . . . 2 1.1.1 Giả thiết về phân phối của sai số . . . . . . . . . . . . . . . . . . . 4 1.1.2 Xác suất của giá trị quan sát . . . . . . . . . . . . . . . . . . . . . 5 1.2 Xác định mô hình . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 6 1.3 Ước lượng . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 7 1.4 Giải thích . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 9 1.4.1 Hiệu quả riêng phần của các biến độc lập đối với y ∗ . . . . . . . . 9 1.4.2 Xác suất dự báo . . . . . . . . . . . . . . . . . . . . . . . . . . . . 11 1.4.3 Biến đổi riêng phần của biến độc lập đối với xác suất dự báo . . . . 14 1.4.4 Biến đổi gián đoạn . . . . . . . . . . . . . . . . . . . . . . . . . . . 15 1.4.5 Mô hình số chênh trong mô hình logit thứ bậc . . . . . . . . . . . . 18 1.5 Giả thuyết hồi quy song song . . . . . . . . . . . . . . . . . . . . . . . . . 20 1.6 Các mô hình liên kết đối với dữ liệu tính trạng . . . . . . . . . . . . . . . . 24 1.6.1 Mô hình hồi quy ghép nhóm . . . . . . . . . . . . . . . . . . . . . 24 1.6.2 Các mô hình khác về dữ liệu tính trạng . . . . . . . . . . . . . . . . 25 2 Mô hình logit đa thức đối với biến đầu ra định danh và các mô hình liên quan 26 2.1 Giới thiệu về mô hình logit đa thức . . . . . . . . . . . . . . . . . . . . . . 27 2.2 Mô hình logit đa thức . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 29 2.2.1 Mô hình MNLM được xét như mô hình xác suất . . . . . . . . . . . 30 2.2.2 Mô hình MNLM như một mô hình tỉ số . . . . . . . . . . . . . . . 31 2.2.3 Mô hình logit đa thức như mô hình lựa chọn rời rạc . . . . . . . . . 32 2.3 Ước lượng hợp lí cực đại . . . . . . . . . . . . . . . . . . . . . . . . . . . . 33 2.4 Tính toán và kiểm tra các hệ số tương phản khác . . . . . . . . . . . . . . 34 2.5 Hai kiểm định hữu dụng . . . . . . . . . . . . . . . . . . . . . . . . . . . . 36 2.5.1 Kiểm tra biến không có ảnh hưởng . . . . . . . . . . . . . . . . . . 36 2.5.2 Kiểm định về hai đầu ra có thể được kết hợp với nhau . . . . . . . 37 2.6 Giải thích mô hình . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 38 2.6.1 Xác suất dự báo . . . . . . . . . . . . . . . . . . . . . . . . . . . . 39 2.6.2 Biến đổi riêng . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 39 2.6.3 Biến đổi rời rạc . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 40 2.6.4 Lí giải tỉ số chênh . . . . . . . . . . . . . . . . . . . . . . . . . . . . 42 2.6.5 Vẽ các hệ số . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 44 2.7 Mô hình logit có điều kiện . . . . . . . . . . . . . . . . . . . . . . . . . . . 47 i 3 Sử dụng mô hình logit thứ bậc để phân tích chất lượng sinh trưởng của cây rừng 51 3.1 Giới thiệu về địa bàn nghiên cứu và mục đích nghiên cứu . . . . . . . . . . 51 3.2 Mô tả dữ liệu . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 52 3.3 Phân tích chất lượng sinh trưởng của cây . . . . . . . . . . . . . . . . . . 56 3.3.1 Phân tích bộ số liệu “Rừng nguyên sinh” . . . . . . . . . . . . . . . 56 3.3.2 Phân tích phẩm chất gỗ đối với dữ liệu từ rừng trồng . . . . . . . 63 3.4 Bàn luận về các kết quả của mô hình hồi quy . . . . . . . . . . . . . . . . 66 Kết luận 68 Tài liệu tham khảo 69 ii Lời mở đầu Trong nghành Lâm Nghiệp, một trong những công việc rất quan trọng là đánh giá chất lượng sinh trưởng của rừng. Từ kết quả thu được, người ta sẽ đưa ra các phương pháp bảo tồn, phát triển hoặc khai thác rừng một cách hiệu quả nhất. Thông thường, các chuyên gia đến tận nơi đo đạc, khảo sát và dựa vào cả kinh nghiệm của mình để đưa ra kết luận rằng cây được xem xét là sinh trưởng tốt, sinh trưởng trung bình hay sinh trưởng kém. Một phương pháp như vậy là khá tốn kém và khó thực hiện khi những người có trình độ cao, kinh nghiệm dày dặt không nhiều. Vấn đề đặt ra là có phương pháp nào ít tốn kém hơn nhưng cũng có độ chính xác cao hay không. Trong luận văn này đưa ra một cách tiếp cập theo phương pháp thống kê là xây dựng mô hình hồi quy với biến phụ thuộc là chất lượng sinh trưởng, biến giải thích là các tiêu chí đo đạc được của cây. Với mục tiêu như vậy, luận văn này có tên “ Phân tích chất lượng gỗ và các vấn đề liên quan”. Luận văn được chia thành ba chương. Chương 1 giới thiệu về mô hình hồi quy thứ bậc với biến phụ thuộc là biến tính trạng có thứ tự. Trong chương này, ta nghiên cứu các mô hình là mô hình Probit, mô hình Logit và mô hình số chênh. Những phương pháp diễn giải các kết quả rất hữu ích của mô hình như: hiệu quả riêng, biến đổi gián đoạn. . . cũng được giới thiệu trong chương này. Chương thứ 2 trình bày về mô hình Logit đa thức. Mô hình này áp dụng với biến phụ thuộc là biến định danh. Các diễn giải về kết quả mô hình này được xem như là sự mở rộng đối với các diễn giải của mô hình Logit thứ bậc, tuy nhiên khi biến phụ thuộc có nhiều tính trạng hoặc có nhiều biến giải thích thì mô hình khá phức tạp do có nhiều hệ số. Khó khăn này được giải quyết bằng phương pháp vẽ đồ thị thể hiện mối liên hệ giữa các hệ số. Chương thứ 3 là phần chạy các mô hình từ dữ liệu thực tế và diễn giải các kết quả từ mô hình đã xây dựng. Trong chương này, một số các kết quả đạt được có những ý nghĩa thực tế như: chất lượng sinh trưởng của cây rừng phụ thuộc mạnh vào những yếu tố đường kính tán, chiều cao, đường kính 1m3. Các loài cây khác nhau cũng có sự đánh giá khác nhau về sinh trưởng, iii mức độ quý hiếm của cây không có ý nghĩa trong việc đánh giá đó. Đối với chất lượng gỗ của rừng trồng thì yếu tố quyết định để phân loại chất lượng gỗ là đường kính 1m3. Các yếu tố khác có ảnh hưởng không đáng kể. Bản luận văn này được hoàn thành với sự hướng dẫn nghiêm khắc và chỉ bảo tận tình của PGS.TS Hồ Đăng Phúc. Thầy đã dành rất nhiều thời gian quý báu của mình để hướng dẫn, giải đáp thắc mắc cho tôi trong suốt quá trình bắt đầu tới khi hoàn thành luận văn. Nhân dịp này, tôi xin bày tỏ lòng biết ơn sâu sắc nhất tới thầy Hồ Đăng Phúc. Qua đây, tôi xin cảm ơn tới các thầy cô khoa Toán –Cơ – Tin, trường Đại học Khoa học Tự nhiên, Đại học Quốc gia Hà Nội, đặc biệt là các thầy đã tham gia giảng dạy khóa Cao học Toán 2011-2013. Tôi cũng xin cảm ơn gia đình, các bạn và mọi người đã giúp đỡ, cổ vũ để tôi có thể khác phục những khó khăn gặp phải trong suốt quá trình học Hà Nội, ngày 11 tháng 12 năm 2014 Học viên Vũ Ngọc Trìu iv Chương 1 Mô hình Logit thứ bậc và mô hình Probit thứ bậc Đối với mô hình hồi quy tuyến tính, ta làm việc với biến phụ thuộc được giả thiết là biến định lượng liên tục. Đây là mô hình rất phổ biến và được sử dụng rộng rãi. Tuy nhiên trong các vấn đề kinh tế- xã hội, chúng ta bắt gặp nhiều biến phụ thuộc không liên tục và thậm chí không quan sát được. Các biến dạng này được gọi chung là các biến phụ thuộc giới hạn (limited dependent variable, LDV). Trong luận văn này sẽ trình bày các mô hình phi tuyến đối với các biến phụ thuộc là biến thứ tự và biến định danh. Ta định nghĩa các biến dạng này như sau: Biến thứ tự (ordinal variable) là biến có các tính trạng được sắp thứ tự. Ví dụ trong cuộc điều tra các câu hỏi được đưa ra và phương án trả lời có thể là các lựa chọn: tuyệt đối đồng ý, đồng ý, không đồng ý và hoàn toàn không đồng ý. Biến định danh (nominal variable) là biến có nhiều tính trạng và các tính trạng không có thứ hạng. Ví dụ tình trạng hôn nhân có thể là các tính trạng sau: độc thân, đã kết hôn, li dị, góa bụa. Đối với biến có thứ tự, các tính trạng có thể được sắp thứ tự từ thấp tới cao, nhưng khoảng cách giữa các tính trạng gần kề chưa được xác định. Những tính trạng này được đánh số lần lượt và mô hình hồi quy tuyến tính (LRM) có thể được áp dụng. Tuy nhiên, ta ngầm giả thiết rằng khoảng cách giữa các tính trạng là bằng nhau. Một vấn đề là khi dùng mô hình hồi quy tuyến tính đối với biến LDV, ước lượng có thể chệch và vì thế dẫn tới những kết quả sai lầm, thậm chí không chấp nhận được. Cho nên các mô hình phi tuyến được đề xuất mặc dù những lí giải về nó phức tạp hơn nhiều. Trong chương đầu tiên, ta xét các mô hình logit thứ bậc và probit thứ bậc (ordered logit and ordered probit models). Hai mô hình này có quan hệ chặt 1 chẽ với nhau và được gọi chung là mô hình hồi quy thứ bậc (ordered regression models, ORM). Một số mô hình liên quan với hai mô hình trên cũng được giới thiệu. 1.1 Mô hình biến ẩn đối với biến thứ tự Mô hình hồi quy thứ bậc ORM có thể nhận được từ một mô hình hồi quy thông thường với biến phụ thuộc là một biến liên tục. Trong mô hình ORM, biến phụ thuộc định lượng là một biến ẩn y ∗ có thể nhận giá trị từ−∞ tới +∞, song bị ẩn dưới biến phụ thuộc quan sát được y thông qua một ánh xạ được xác định như sau: y i = m khi τ m−1 ≤ y ∗ < τ m , m = 1, , J Các điểm τ được gọi là điểm cắt. Tính trạng đầu tiên và cuối cùng tương ứng với m = 1 và m = J được định nghĩa bởi khoảng mở tương ứng với τ 0 = −∞ và τ J = +∞. Để hiểu rõ hơn về ý tưởng trên, ta xét ví dụ sau đây về cuộc điều tra phỏng vấn do General Social Survey. Trong một cuộc điều tra phỏng vấn, mọi người được yêu cầu trả lời câu hỏi sau đây: “Một người mẹ làm việc thì tình cảm và sự quan tâm tới con cái của họ có như những người mẹ không đi làm hay không ?”. Các lựa chọn trả lời là: Rất khác biệt (strongly disagree) SD Khác biệt (Disagree) D Giống nhau (Agree) A Hoàn toàn như nhau (Strong agree) SA Biến tính trạng này liên kết với biến ẩn liên tục y ∗ , trong đó biến y ∗ chỉ ra các mức khác biệt đối với câu hỏi về “Người mẹ làm việc thì tình cảm và sự quan tâm mà họ dành cho con cái có như người mẹ không đi làm không?”. Biến quan sát được y được xác định thông qua y ∗ bởi ánh xạ sau: y i =    1 =⇒ SD, khi τ 0 = −∞ ≤ y ∗ < τ 1 2 =⇒ D, khi τ 1 ≤ y ∗ < τ 2 3 =⇒ A, khi τ 2 ≤ y ∗ < τ 3 4 =⇒ SA, khi τ 3 ≤ y ∗ < τ 4 = +∞ Ánh xạ này được minh họa bằng hình vẽ sau Đường thẳng nét liền thể hiện biến ẩn y ∗ , các điểm cắt được xác định và được đánh dấu bằng τ 1 , τ 2 và τ 3 . Giá trị của biến quan sát y trên mỗi khoảng của y ∗ được đánh dấu với đường chấm. Cấu trúc của mô hình là: y ∗ i = x i β + ε i 2 Trong đó, x i là véc tơ hàng với các số 1 ở cột đầu tiên và quan sát thứ i đối với biến độc lập x k được xuất hiện ở cột thứ k + 1, β là véc tơ hệ số với hệ số chặn β 0 . Hình 1.1: Hồi quy với biến ẩn y ∗ Hình 1.2: Hồi quy với biến y Mô hình chỉ chứa một biến độc lập có cấu trúc như sau: y ∗ i = α + βx i + ε i Trong Hình 1.1, biến ẩn y ∗ là trục tung, các giá trị 15, 0 ,-5 phân chia tỷ lệ của y ∗ . Các điểm cắt τ 1 , τ 2 và τ 3 được chỉ ra bởi đường ngang chấm chấm. Đường này chia y ∗ thành 4 miền giá trị của biến quan sát y, τ 0 = −∞ ở vị trí dưới cùng và τ 4 ở trên cùng. Đường hồi quy E(y ∗ |x) = α + βx với α = 1, β = 0.1 được vẽ là đường liền. Vì y ∗ không quan sát được nên α, β không ước lượng được bằng hồi quy y ∗ theo x. Trong Hình 1.2 vẽ biến quan sát y theo x, biến y được xác định từ biến ẩn y ∗ bằng cách gán tất cả các trường hợp mà y ∗ lớn hơn τ 3 tương ứng với số 4, trường hợp y ∗ nằm giữa τ 2 và τ 3 là số 3. Tương tự cho các trường hợp tiếp theo của y ∗ . Uớc lượng bình phương tối thiểu (OLS) của hàm hồi quy y theo x, được chỉ ra bởi đường đứt với ước lượng độ dốc là 0,026. Đường hồi quy y theo x không xấp xỉ đường hồi quy y ∗ theo x, vì đường này có độ dốc lớn hơn 4 lần. Đường hồi quy trong Hình 1.1 và Hình 1.2 trông có vẻ giống nhau bởi vì tỷ lệ của các trục là khác nhau. Nếu trục y trong Hình 1.2 được vẽ với cùng tỷ lệ như Hình 1.1 thì đường hồi quy y theo x trông như đường ngang. Một vấn đề khác khi hồi quy y theo x là sai số không có phân phối chuẩn và phương sai không thuần nhất. Tổng quát, mô hình hồi quy tuyến tính (LRM) chỉ có 3 cùng kết quả như mô hình hồi quy thứ bậc (ORM) nếu những điểm cắt có khoảng cách như nhau. Khi khoảng cách giữa các điểm này khác nhau thì kết quả của mô hình hồi quy tuyến tính (LRM) có thể đưa tới những kết quả sai lầm. Hình 1.1 còn chỉ ra một tính chất quan trọng của mô hình ORM. Trong hình này, bạn có thể thêm hoặc bỏ đi những điểm cắt mà không làm thay đổi cấu trúc mô hình. Tưởng tượng rằng, ta vẽ một đường ngang giữa τ 1 và τ 2 . Điều này tương ứng thêm một tính trạng khác như “ không ý kiến” giữa “ khác biệt ” và “ giống nhau”. Đường hồi quy của y ∗ theo x sẽ không bị ảnh hưởng. Trong Hình 1.2, nếu ta thêm một tính trạng mới sẽ tương ứng thêm một đường ngang mới của biến quan sát y, điều này ảnh hưởng tới kết quả của hồi quy y theo x. 1.1.1 Giả thiết về phân phối của sai số Để dùng được phương pháp ước lượng hợp lí cực đại, ta phải giả thiết về phân phối của sai số. Ta xét hai phân phối là phân phối chuẩn và phân phối logistic tương ứng với mô hình probit thứ bậc và logit thứ bậc. Đối với mô hình probit thứ bậc, sai số ε được giả thiết có phân phối chuẩn với trung bình 0 và phương sai 1 (phân phối chuẩn tắc). Hàm mật độ của phân phối đó là φ(ε) = 1 √ 2π exp(− ε 2 2 ) Với hàm phân phối tích lũy Φ(ε) =  ε −∞ 1 √ 2π exp(− t 2 2 )dt (1.1) Với mô hình logit thứ bậc, sai số ε được giả sử có phân phối logit với trung bình 0 và phương sai π 2 /3. Hàm mật độ của nó là λ(ε) = exp(ε) [1 + exp(ε)] 2 Với hàm phân phối tích lũy Λ(ε) = exp(ε) 1 + exp(ε) (1.2) Để đơn giản kí hiệu trong chương này, ta dùng hàm F thay thế cho các hàm phân phối Φ hoặc Λ và hàm f thay cho các hàm mật độ φ hoặc λ. 4 1.1.2 Xác suất của giá trị quan sát Khi phân phối của sai số đã xác định, ta có thể tính được xác suất của giá trị quan sát y với giá trị x biết trước. Hình 1.3 minh họa phân phối của y ∗ đối với 3 giá trị của x. Sai số có phân phối logitic hoặc chuẩn xung quanh đường hồi quy E(y ∗ |x) = α + βx. Xác suất để biến đầu ra nhận giá trị là m tương ứng với điểm cắt τ m−1 và τ m . Xác suất để sai số rơi vào miền mà biến y ∗ nằm trong khoảng [τ m−1 ; τ m ) được tính như sau: Đầu tiên, ta tính xác suất khi y = 1. Với y = 1 khi đó y ∗ nhận các giá trị trong khoảng (−∞, τ 1 ). Điều này chỉ ra rằng: Hình 1.3: Phân phối của y ∗ theo x trong mô hình hồi quy thứ bậc P r(y i = 1 | x i ) = P r(τ 0 ≤ y ∗ < τ 1 | x i ) Thay y ∗ = xβ + ε và phương trình trên, ta có P r(y i = 1 | x i ) = P r(τ 0 ≤ x i β + ε i < τ 1 | x i ) Từ đó suy ra P r(y i = 1 | x i ) = P r(τ 0 − x i β ≤ ε i < τ 1 − x i β | x i ) Vậy, ta có kết quả: P r(y i = 1 | x i ) = F (τ 1 − x i β) − F(τ 0 − x i β) Với cách làm tương tự, khi biến quan sát nhận giá trị y = m, ta có P r(y i = m) | x i = F (τ m − x i β) − F(τ m−1 − x i β) (1.3) Chú ý rằng, trong công thức trên vì F (τ 0 − x i β) = F (−∞) = 0 và F (τ J − x i β) = F (+∞ − x i β) = 1. Do đó, đối với mô hình có 4 biến đầu ra, như ví 5 dụ được xét ở trên, công thức xác suất của mô hình probit thứ bậc là P r(y i = 1 | x i ) = F (τ 1 − x i β), P r(y i = 2 | x i ) = F (τ 2 − x i β) − F(τ 1 − x i β), P r(y i = 3 | x i ) = F (τ 3 − x i β) − F(τ 2 − x i β), P r(y i = 1 | x i ) = 1 − F(τ 3 − x i β). Ví dụ, nếu α = −0.5; β = 0.052; τ 1 = 0.75; τ 2 = 3.5; τ 3 = 5.0 khi x = 15.40 và 80, theo công thức trên các xác suất tính được là Xác suất x = 15 x = 45 x = 80 dự báo P r(y i = 1 | x) 0.68 0.20 0.00 P r(y i = 2 | x) 0.32 0.77 0.44 P r(y i = 3 | x) 0.00 0.03 0.47 P r(y i = 4 | x)) 0.00 0.00 0.09 Phương trình (1.3) có được từ các giả thiết về phân phối của sai số thông qua việc sử dụng khái niệm về biến ẩn. Cách làm này rất hữu ích để phát triển các mô hình. Tuy nhiên, đôi khi ý tưởng về biến ẩn là không hợp lý. Ví dụ, học hàm là có thứ tự, nhưng thật khó tưởng tượng biến ẩn sinh ra các thứ hạng: Trợ giảng (assistant), phó giáo sư (associate), giáo sư (full professor). Trong những trường hợp này, ta có thể xem phương trình (1.3) như mô hình xác suất của mối quan hệ giữa biến độc lập x và xác suất biến đầu ra nhận một giá trị nào đó. 1.2 Xác định mô hình Vì y ∗ là biến ẩn, trung bình và phương sai của nó không ước lượng được. Phương sai được xác định bằng giả thiết V ar(ε | x) = π 2 /3 đối với mô hình logit và V ar(ε | x) = 1 với mô hình probit (ordered probit model). Mặc dù đã giả thiết phương sai xác định nhưng trung bình của biến ẩn y ∗ vẫn chưa được biết. Kết quả của điều này có thể được thấy bằng việc xét mô hình y ∗ = α + βx + ε với điểm cắt τ m . Các tham số α và τ m được coi như tham số “chính xác” theo nghĩa chúng đã được sử dụng để tạo ra dữ liệu được lưu trữ. Ta định nghĩa tập tham số mới: α ∗ = α − δ; τ ∗ = τ −δ (1.4) 6 [...]... vi phạm đối với tất cả các biến độc lập hay chỉ với một vài biến Kiểm định Wald được đề xuất bởi Brant (1990) cho phép kiểm định cả giả thuyết tất cả các βm bằng nhau đối với tất cả các biến và giả thuyết chỉ có một số các hệ số tương ứng với các biến độc lập phân biệt bằng nhau Kiểm định này được xây dựng như sau: ˆ 1 Ước lượng các βm và các V ar(βm ) Chạy J − 1 mô hình nhị phân logit với biến đầu... B và C, thì ta sẽ đưa ra được kết quả của mô hình giữa tính trạng A và C như (2.5) Tuy nhiên, có một vấn đề là đẳng thức (2.5) mô tả mối quan hệ tất yếu giữa các tham số một cách lý thuyết Nó sẽ không thỏa mãn với ước lượng từ mẫu của ba mô hình logit Lí do rất đơn giản: ba mô hình dựa trên ba mẫu khác nhau Mẫu đầu tiên có NA + NB quan sát, mẫu thứ hai có NB + NC quan sát và mẫu thứ ba có NA + NC quan. .. i của nó là wiml Đặt X là ma trận cỡ N × (K + 1) với các số 1 ở cột đầu tiên và các ˆ biến độc lập ở cột còn lại Brant chỉ ra rằng hiệp phương sai giữa các β ˆ ˆ từ các mô hình nhị phân khác nhau và V ar(β m , β l ) được ước lượng bằng việc bỏ đi hàng đầu tiên và cột đầu tiên của ma trận (X Wmm X)−1 (X Wml X)(X Wll X)−1 3 Kết hợp tất cả các ước lượng ˆ ˆ ˆ ˆ Ta định nghĩa β ∗ = (β 1 β 2 β J−1 )... cả các mô hình logit nhị phân được ước lượng đồng thời, điều này làm mạnh 28 mối quan hệ logic giữa các tham số của các mô hình và dữ liệu được sử dụng hiệu quả hơn Tuy nhiên, ý tưởng coi mô hình logit đa thức như sự liên kết của một tập các mô hình logit nhị phân vẫn rất đúng đắn 2.2 Mô hình logit đa thức Mô hình MNLM bắt đầu bằng việc xem xác suất của mỗi biến đầu ra như là một hàm phi tuyến của các. .. với việc dùng các mô hình logit nhị phân, những xác suất và tỉ số liên quan đòi hỏi đưa ra các đồ thị để tóm tắt các kết quả Cụ thể, ta dùng ví dụ về các loại nghề nghiệp Năm 1982, trong cuộc điều tra xã hội, mỗi người được yêu cầu trả lời câu hỏi để xác định nghề nghiệp của họ Những nghề nghiệp được mã hóa tương ứng với những tính trạng về nghề nghiệp và sử dụng mô hình MNLM để phân tích Trong mẫu... các điểm cắt τ để đảm bảo thứ tự các tính trạng và các β khác nhau đối với các tính trạng đầu ra, do đó tránh được giả thuyết hồi quy song song Mô hình này có quan hệ chặt chẽ với mô hình logit đa thức sẽ được thảo luận trong chương tiếp theo 25 Chương 2 Mô hình logit đa thức đối với biến đầu ra định danh và các mô hình liên quan Biến định danh là biến phụ thuộc mà các tính trạng không có thứ tự Biến... xây dựng một cách lí thuyết nhưng những khó khăn trong tính toán làm cho mô hình trở nên phi thực tế 26 2.1 Giới thiệu về mô hình logit đa thức Mô hình logit đa thức (MNLM) có thể được xem như ước lượng đồng thời của nhiều mô hình logit nhị phân Các mô hình logit nhị phân này là mô hình đối với các cặp tính trạng của biến quan sát Thật vậy, ước lượng từ mô hình logit nhị phân cho ta ước lượng vững về... trạng B thay đổi bởi thừa số exp β1,A/B Mô hình đối với các cặp tính trạng còn lại có thể được phân tích một cách tương tự Xét mô hình logit đối với biến đầu ra nhận cặp tính trạng B và C, 27 chọn NB + NC quan sát và ước lượng mô hình logit ln Pr (B/x) = β0,B/C + β1,B/C x Pr (C/x) (2.2) Chọn NA + NC số quan sát đối với mô hình gồm cặp tính trạng A và C, mô hình là Pr (A/x) ln = β0,A/C + β1,A/C x (2.3)... Ở đó, ký hiệu mini và maxi dùng để chỉ việc lấy minimum (maximum) của xác suất dự báo trên tất cả các quan sát Trong bảng Bảng 1.4, xét biến đầu ra SD với xác suất nhỏ nhất là 0.02 và xác suất lớn nhất là 0.47, khoảng biến động 0.45 Tương tự các kết quả được liệt kê đối với tất cả các tính trạng trong ví dụ của chúng ta Khi có những biến động đủ lớn trong mỗi tính trạng những phân tích sâu sắc hơn nên... Giả sử rằng τ1 = 0 Điều này liên quan tới đặt δ = τ1 Đây là giả thiết nhận dạng được dùng với mô hình nhị phân (biến quan sát nhận 2 giá trị 0 hoặc 1) 2 Giả sử rằng α = 0 Điều này liên quan tới đặt δ = α trong phương trình (1.4) Cả hai giả thiết để xác định mô hình đều chứa một ràng buộc đối với tham số của mô hình Những giả thiết khác nhau để xác định mô hình cho ta các cách tham số hóa khác nhau . phụ thuộc là chất lượng sinh trưởng, biến giải thích là các tiêu chí đo đạc được của cây. Với mục tiêu như vậy, luận văn này có tên “ Phân tích chất lượng gỗ và các vấn đề liên quan . Luận văn. 52 3.3 Phân tích chất lượng sinh trưởng của cây . . . . . . . . . . . . . . . . . . 56 3.3.1 Phân tích bộ số liệu “Rừng nguyên sinh” . . . . . . . . . . . . . . . 56 3.3.2 Phân tích phẩm chất gỗ. không có ý nghĩa trong việc đánh giá đó. Đối với chất lượng gỗ của rừng trồng thì yếu tố quyết định để phân loại chất lượng gỗ là đường kính 1m3. Các yếu tố khác có ảnh hưởng không đáng kể. Bản

Định dạng
Số trang	73
Dung lượng	2,1 MB