5. NỘI DUNG NGHIÊN CỨU
3.3 Lựa chọn mơ hình dự báo
3.3.2 Mơ hình logit đa thức trong dự báo phân bổ nhu cầu đi lại cho các phương
phương thức vận tải(dự báo lựa chọn phương thức vận tải)
3.3.2.1 Tổng quan về mơ hình logit đa thức
a. Khái niệm hồi quy logit đa thức
Phân tích hồi quy thiết lập mối quan hệ giữa một đối tượng đang được quan tâm (biến đáp ứng hay biến phụ thuộc) với các đối tượng khác (các biến dự báo hay biến độc lập) để đưa ra những kết luận có ý nghĩa thống kê. Khi biến phụ thuộc là biến rời rạc thì mơ hình hồi quy tuyến tính khơng thể áp dụng được. Trong trường hợp này mơ hình hồi quy logit (logistic) được xây dựng để giải quyết vấn đề nêu trên. Mơ hình hồi quy logit được phát triển bởi David R. Cox từ những năm 1970 và ngày càng được ứng dụng rộng khắp.
Hồi quy logit đa thức (hay đa lựa chọn) là một phương pháp mở rộng hồi quy logit (ở đó biến phụ thuộc là biến nhị phân) thành các bài toán phân lớp. Trong đó, biến phụ thuộc là biến phân loại và có nhiều hơn hai kết quả rời rạc có thể (có nhiều hơn hai danh mục), các biến độc lập có giá trị thực, giá trị nhị phân hoặc có giá trị phân loại.
Có hai cách tiếp cận mơ hình logit đa thức:
- Mơ hình logit đa thức xem như là một tập hợp các hồi quy nhị phân độc lập.
- Mơ hình logit đa thức dạng log – tuyến tính
(1) Mơ hình xem như một tập hợp các hồi quy nhị phân độc lập
giá trị này là rời rạc nên mơ hình hồi quy tuyến tính khơng phù hợp. Để đổi ra biến liên tục người ta tính xác suất khi biến phụ thuộc nhận các giá trị này, tức là
tính P(Yi = 1), P(Yi = 2), …, P(Yi = k) và tiến hành chia lần lượt các xác suất này cho một xác suất nào đó - gọi là xác suất trục. Khi đó ta được k – 1 mơ hình hồi quy logit nhịphân độc lập được hồi quy riêng rẽ theo xác suất trục. Nếu P(Yi
= k) được chọn là xác suất trục, ta có:
(3. 5)
(3. 6)
….
(3. 7) Lấy lũy thừa cả hai vế và giải để tìm xác suất, ta có:
(3. 8)
(3. 9)
….
(3. 10)
Để tính được các xác suất trên ta phải xác định được . Vì tổng tất cả các xác suất bằng 1 nên ta có: ∑ ∑ ∑ Vậy: ∑ (3. 11)
Lần lượt thay (3.11) vào (3.8), (3.9), (3.10) để tìm các xác suất khác. ∑ (3. 12) ∑ (3. 13) ..… ∑ (3. 14)
(2) Mơ hình dạng log –tuyến tính
Cơng thức của hồi quy nhị phân dưới dạng một mơ hình log –tuyến tính có thể được mở rộng trực tiếp thành hồi quy đa thức bằng cách mơ hình hóa logarit của xác suất xảy ra một kết quả nào đó có sử dụng hàm dự báo tuyến tính với cùng một nhân tử chuẩn hóa thêm vào, logarit hàm phân vùng có dạng:
(3. 15) (3. 16) ..… (3. 17) Tiếp tục biến đổi ta có: ….. Và: .…
Lấy lũy thừa 2 vế và biến đổi ta có:
(3. 18)
(3. 19)
..…
(3. 20)
Đại lượng Z được gọi là hàm phân vùng đối với phân phối. Chúng ta có thể tính giá trị của hàm phân vùng bằng cách áp dụng ràng buộc: tổng tất cả các xác suất bằng 1 ∑ ∑ ∑ Suy ra: ∑ (3. 21) Thay (3.21) vào các biểu thức (3.18). (3.19), (3.20) ta có: ∑ (3. 22) ∑ (3. 23) …. ∑ (3. 24) Viết một cách tổng quát ta có: ∑ (3. 25) Hay: ∑ (3. 26)
b. Cấu trúc hàm thỏa dụng
Trong hàm thỏa dụng, mức độ thỏa dụng của mỗi phương án lựa chọn theo nhận thức của người thực hiện chuyến đi được tách thành 2 thành phần. Một thành phần của hàm thỏa dụng biểu diễn phần thỏa dụng có thể quan sát và
ước lượng được bởi nhà phân tích, thường gọi là phần thỏa dụng có thể quan sát hay phần thỏa dụng tất định (hoặc thỏa dụng hệ thống). Thành phần còn lại là sai lệch giữa giá trị thỏa dụng theo đánh giá của người thực hiện chuyến đi mà
chúng ta chưa biết với giá trị thỏa dụng được ước lượng bởi nhà phân tích. Phần sai lệch này được biểu diễn bằng một sai số ngẫu nhiên. Về hình thức, chúng ta có thể biểu diễn:
(3. 27)
Trong đó:
Uit : là thỏa dụng thực của phương án lựa chọn i đối với người thực hiện chuyến đi t.
, : là phần thỏa dụng có thể quan sát (thỏa dụng hệ thống hay thỏa dụng tất định), phần này có thể quan sát và được ước lượng bởi nhà phân tích. có thểđược biểu diễn là một hàm số của Xi và St hay:
(3. 28)
: là sai số hay phần thỏa dụng chưa biết đối với nhà phân tích.
Do đó, mơ hình thỏa dụng có thể biểu diễn:
(3. 29)
* Phần thỏa dụng có thể quan sát
Phần thỏa dụng có thể quan sát của một phương án lựa chọn là một hàm toán học của các thuộc tính của phương án lựa chọn và các đặc điểm của người thực hiện chuyến đi. Phần thỏa dụng có thể quan sát có dạng biểu diễn tốn học bất kì nhưng hàm này thường được thiết lập như là hàm tổng để đơn giản hóa
quá trình ước lượng. Hàm thỏa dụng có thể quan sát chứa các tham số chưa biết, sẽ được ước lượng trong q trình mơ hình hóa. Phần thỏa dụng có thể quan sát của mơ hình thỏa dụng có thểđược phân chia thành các thành phần bao gồm:
- Phần thỏa dụng có liên quan tới các đặc điểm của người thực hiện
chuyến đi ( )
- Phần thỏa dụng có liên quan tới sựtương tác qua lại giữa các thuộc tính của lựa chọn và các đặc điểm của người thực hiện chuyến đi ( ).
Do đó, phần thỏa dụng có thể quan sát có thể được biểu diễn như sau:
(3. 30) Hoặc có thể biểu diễn dưới dạng:
(3. 31)
ởđó : là phần thỏa dụng có thể quan sát (hay phần hệ thống của hàm thỏa dụng) đối với lựa chọn i và cá thể t.
: Phần thỏa dụng có liên quan tới các thuộc tính của lựa chọn i.
: Phần thỏa dụng có liên quan tới các đặc điểm của người thực hiện chuyến đi t.
: Phần thỏa dụng có liên quan tới sự tương tác qua lại
giữa các thuộc tính của lựa chọn i và các đặc điểm của người thực hiện chuyến
đi t.
(1) Phần thỏa dụng có liên quan tới các thuộc tính của lựa chọn
Phần thỏa dụng có liên quan tới các thuộc tính của lựa chọn là một hàm số của các biến mơ tả các thuộc tính của lựa chọn. Những thuộc tính này ảnh
hưởng đến thỏa dụng của mỗi lựa chọn, áp dụng cho tất cả mọi người trong cộng
đồng được xét. Trong dự báo lựa chọn phương thức vận tải, các thuộc tính này
chính là các đặc điểm kinh tế - kỹ thuật của phương thức vận tải, chúng có thể đođược và sẽ có ảnh hưởng đến sở thích/xu hướng lựa chọn của người thực hiện chuyến đi. Các thuộc tính này tương đối đa dạng như: tổng thời gian di chuyển, thời gian di chuyển trên phương tiện, thời gian di chuyển bên ngoài phương tiện, chi phí đi lại …
Giá trị của các thuộc tính này thay đổi theo các phương thức vận tải
đối với cùng một người thực hiện chuyến đi và giữa các người thực hiện chuyến đi khác nhau, do sự khác nhau của địa điểm xuất phát và đích đến của
hành trình mỗi người. Ở dạng tuyến tính, phần thỏa dụng này có thể được
biểu diễn như sau:
(3. 32)
Trong đó:
- : là tham số xác định chiều hướng và tầm quan trọng của tác động (hay mức độ ảnh hưởng) của thuộc tính k đối với thỏa dụng của phương thức vận tải i của người thực hiện chuyến đi
- Xik : là giá trị của thuộc tính k của phương thức vận tải i.
(2) Phần thỏa dụng có liên quan tới các đặc điểm của người thực hiện chuyến đi
Phần thỏa dụng này cũng được xây dựng dưới dạng một hàm của các nhân tố ảnh hưởng là những đặc điểm của người thực hiện chuyến đi. Về mặt toán học phần thỏa dụng này có thểđược biểu diễn như sau:
(3. 33)
Trong đó:
- : Phần thỏa dụng được tạo ra bởi riêng các đặc điểm của người thực hiện chuyến đi t
- : là tham số xác định chiều hướng và tầm quan trọng của tác động (hay mức độ ảnh hưởng) của đặc điểm k đối với thỏa dụng của người thực hiện chuyến đi t khi lựa chọn phương thức vận tải
- : là giá trị của đặc điểm k của người thực hiện chuyến đi t.
Các đặc điểm của người thực hiện chuyến đi thường được sử dụng trong phân tích là: thu nhập của người thực hiện chuyến đi hay thu nhập bình quân hộ gia đình của người thực hiện chuyến đi, giới tính của người thực hiện chuyến đi, sốlượng ơ tơ sở hữu bởi gia đình người thực hiện chuyến đi …
Trong một sốtrường hợp, các biến này được kết hợp lại. Ví dụ, sốlượng ơ tơ có thể được chia cho số người đi làm để xác định cơ hội sử dụng ô tô của mỗi thành viên trong gia đình.
Cần phải chú ý rằng các tham số mô tả mức độ ảnh hưởng của các đặc
trong tập các phương án lựa chọn, trong khi đó các biến là như nhau cho tất cả
các phương án lựa chọn đối với mỗi người thực hiện chuyến đi.
(3) Phần thỏa dụng có liên quan tới sự tương tác qua lại giữa các thuộc tính của lựa chọn và các đặc điểm của người thực hiện chuyến đi
Thành phần cuối cùng của hàm thỏa dụng tính đến những sự khác biệt trong việc đánh giá các thuộc tính của những người thực hiện chuyến đi khác nhau. Về mặt nguyên tắc, phần thỏa dụng này có thể mơ tả bởi một hàm với các biến thể hiện sự ảnh hưởng qua lại lẫn nhau giữa thuộc tính của phương án lựa chọn với đặc điểm của người thực hiện chuyến đi. Chính vì các thuộc tính của
phương án lựa chọn cũng như đặc điểm của người thực hiện chuyến đi rất đa
dạng dẫn tới tác động qua lại giữa các thuộc tính của phương án lựa chọn và các
đặc điểm của người thực hiện chuyến đi rất phức tạp. Chính điều này làm cho việc xác định dạng hàm tổng quát phần hàm thỏa dụng này rất khó khăn. Tuy
nhiên với từng trường hợp cụ thể thì vấn đề này có thể được giải quyết bằng cách sử dụng kỹ thuật biến giả để xây dựng mơ hình. Để làm rõ phần thỏa dụng này chúng ta phân tích một ví dụ cụ thể.
Trên thực tế thu nhập của người thực hiện chuyến đi và chi phí của
phương thức vận tải có ảnh hưởng quan trọng tới quyết định lựa chọn phương
thức vận tải của người thực hiện chuyến đi. Khi xây dựng mơ hình thỏa dụng chúng ta có thể thiết lập như sau:
(3. 34)
Trong đó:
- : Thỏa dụng của phương thức vận tải i đối với người thực hiện chuyến đi t
- : Chi phí của phương thức vận tải i
- : Thu nhập của người thực hiện chuyến đi t - : các tham số của mơ hình
Như vậy, thành phần chính là phần thỏa dụng được tạo ra bởi riêng các thuộc tính của lựa chọn, cụ thể ở đây là là phần thỏa dụng do chi phí gây ra.
Thành phần chính là phần thỏa dụng được tạo ra bởi riêng các đặc
điểm của người thực hiện chuyến đi, do thu nhập tạo nên.
Nếu như các tham số của mơ hình khác khơng, chúng ta có thể coi rằng chi phí và thu nhập có ảnh hưởng tới thỏa dụng của phương thức vận tải i đối với người thực hiện chuyến đi t.
Những quan sát thực tế cho thấy rằng thu nhập của người thực hiện chuyến đi càng tăng thì tầm quan trọng của chi phí lại giảm hay nói cách khác
người thực hiện chuyến đi không quan tâm quá nhiều tới chi phí khi lựa chọn
phương thức vận tải. Như vậy xuất hiện tác động qua lại giữa thu nhập và chi phí, do thu nhập của người thực hiện chuyến đi thay đổi dẫn tới đánh giá về tầm quan trọng của chi phí cũng thay đổi theo. Để đánh giá thực sự có tự tương tác
qua lại hay không giữa thu nhập và chi phí tới thỏa dụng chúng ta tạm chia
người thực hiện chuyến đi thành 2 nhóm: nhóm có thu nhập cao và nhóm có thu nhập thấp. Kỹ thuật biến giả được sử dụng trong mơ hình bằng cách sử dụng biến giả Dtđể mô tả hai nhóm thu nhập, D = 1 nếu là nhóm thu nhập cao và D = 0 nếu là nhóm có thu nhập thấp. Lúc này mơ hình thỏa dụng ở trên được biến
đổi thành:
(3. 35)
: Phần thỏa dụng được tạo ra bởi sự tương tác qua lại giữa các thuộc tính của lựa chọn và các đặc điểm của người thực hiện chuyến đi cụ thể ở đây là tác động qua lại giữa thu nhập và chi phí.
Chúng ta có thể xác định được mức độ ảnh hưởng của chi phí tới thỏa dụng của người có thu nhập cao là còn của người có thu nhập thấp là
.
Nếu thực sự thì chúng ta có thể nói rằng có sự tác động qua lại giữa thu nhập và chi phí, tác động của thu nhập tới chi phí làm thay đổi tầm quan trọng của chi phí với mức thay đổi là .
* Thành phần sai số
Trong mơ hình thỏa dụng, thỏa dụng của mỗi lựa chọn được biểu diễn bởi một thành phần thỏa dụng có thể quan sát, nó được mơ tả trong hàm thỏa
dụng bởi các biến quan sát được và đo lường được, và một thành phần sai số
biểu diễn những thành phần thỏa dụng khơng được đưa vào trong mơ hình.
Thành phần sai số được đưa vào trong hàm thỏa dụng để giải thích cho sự thật là nhà phân tích khơng thể đo lường một cách đầy đủ và chính xác hay chỉ rõ tất cả các thuộc tính cần thiết để xác định rõ hành động đánh giá thỏa dụng của các phương án lựa chọn của người thực hiện chuyến đi hay người thực hiện chuyến đi. Về mặt bản chất, thành phần sai số ngẫu nhiên này đại diện cho phần thỏa dụng do các nhân tố khơng có mặt trong mơ hình tạo nên.
Có ba ngun nhân chính khiến cho thành phần sai số ln tồn tại trong
mơ hình, đó là:
Thứ nhất, bản thân các cá thể có thơng tin khơng đầy đủ hoặc khơng chính xác hoặc có nhận thức sai lầm về các thuộc tính của một số hay tất cả các
phương án lựa chọn. Điều này làm cho những cá thể khác nhau, với những thông tin và nhận thức khác nhau về các lựa chọn giống nhau hầu như đưa ra sự
lựa chọn khác nhau.
Thứ hai, trong quá trình xây dựng mơ hình dự báo người phân tích hoặc
người quan sát khơng có đầy đủ thơng tin hoặc nhận được thông tin sai lệch so với thông tin mà cá thể nhận được về cùng các thuộc tính của các phương án lựa chọn hay lựa chọn sai dạng hàm số để đánh giá thỏa dụng của mỗi phương án
lựa chọn.
Thứ ba, khi xây dựng mơ hình, có rất nhiều nhân tố khác nhau ảnh
hưởng tới quyết định của cá thể mà nhà phân tích có thể khơng biết, khơng tính
đến do đó khơng đưa vào mơ hình.
* Đánh giá và lựa chọn nhân tố ảnh hưởng trong hàm thỏa dụng
Với kết quả ước lượng mơ hình trong mục 3.1.5 ta có thể sắp xếp các nhân tố ảnh hưởng theo thứ tự giảm dần về giá trị tuyệt đối của các tham số tương ứng, để đánh giá tầm quan trọng của các nhân tố ảnh hưởng. Với kết quả trong bảng dưới đây các nhân tố ảnh hưởng có thể được chia làm 2 nhóm theo mức độ ảnh hưởng.
Bảng 3. 32 Thứ tự ảnh hưởng của các nhân tốTT Biến Hệ số TT Biến Hệ số TT Biến Hệ số TT Biến Hệ số 1 TG 0.191 7 NN 0.059 2 CP 0.184 8 T 0.057 3 CT 0.130 9 CS 0.056 4 TN 0.067 10 KC 0.054 5 CH 0.067 11 SHBL 0.050 6 CL 0.064 12 GTI 0.042