CHƯƠNG 3 : PHƯƠNG PHÁP NGHIÊN CỨU
3.2.1. Mơ hình kinh tế lượng đề xuất
3.2.1.1. Mơ hình hồi quy dữ liệu số đếm
Dữ liệu số đếm là những dữ liệu có giá trị số ngun khơng âm hoặc đếm được, quan sát có thể nhận giá trị số đếm là 0. Do vậy, mơ hình hóa các dữ liệu số đếm cần một phân phối xác suất như phân phối xác suất Poisson. Mơ hình hồi quy dựa trên phân phối xác suất Poisson gọi là các mơ hình hồi quy Poisson. (Gujarati, 2011)
Gujarati và Porter (2003) đã mơ tả hàm phân phối xác suất Poisson có dạng tổng quát:
Pr(𝑌𝑖 = 𝑘) = 𝑒−𝜆𝜆𝑘
𝑘! với k = 0, 1, 2, 3…
Trong đó, Pr(𝑌𝑖 = 𝑘)biểu hiện xác suất mà biến ngẫu nhiên rời rạc Yi nhận
giá trị nguyên không âm k, và k! = k(k - 1)(k - 2)…2.1, với 0! = 1. Ngoài ra, là tham số duy nhất của phân phối Poisson, điều này khơng giống phân phối chuẩn có hai tham số là trung bình và phương sai.
Để ước lượng, mơ hình hồi quy Poisson có thể được viết:
Pr(𝑌𝑖 = 𝑘|𝑋) =𝑒−𝑒
𝑋𝑖𝛽(𝑒𝑋𝑖𝛽)𝑘
𝑘! + 𝜀𝑖
Khi đó mơ hình sẽ có dạng phi tuyến tính đối với các tham số nên phải ước lượng mơ hình phi tuyến tính bằng phương pháp hợp lý tối đa (Maximum Likelihood).
Tác động biên của biến giải thích được tính dựa theo cơng thức:
𝜕𝐸(𝑦𝑖|𝑋𝑖)
𝜕𝑋𝑖 = 𝑒𝑋𝑖𝛽𝛽
Hàm phân phối xác suất Poisson có đặc điểm là giá trị trung bình và phương sai giống nhau:
𝐸(𝑦𝑖|𝑋𝑖) = 𝑉𝑎𝑟(𝑦𝑖|𝑋𝑖) = = 𝑒𝑋𝑖𝛽
Đặc điểm này được gọi là phân tán bằng nhau (equidispersion). Tuy nhiên trong thực tế giá trị trung bình và phương sai không bằng nhau. Trường hợp phương sai
gặp trong thực tế khi phương sai lớn hơn giá trị trung bình được gọi là quá phân tán (overdispersion).
Theo Gujarati (2011), đây là một hạn chế trong mơ hình hồi quy Poisson. Vì để sử dụng mơ hình hồi quy Poisson thì giả định điều kiện đầu tiên của mơ hình phải tuân theo phân phối xác suất Poisson là trung bình và phương sai bằng nhau. Trong trường hợp quá phân tán, sai số chuẩn bị lệch thấp xuống (downward biased) dẫn đến các giá trị Z ước lượng bị phóng đại, vì thế ước lượng q mức ý nghĩa thống kê của các hệ số ước lượng.
Do vậy, mơ hình hồi quy nhị thức âm (NBreg - Negative Binomial Regression) dựa trên phân phối xác suất nhị thức âm (NBPD - Negative Binomial Probability Distribution) được sử dụng để khắc phục nhược điểm của mơ hình hồi quy Poisson
Hàm phân phối xác suất NBPD có dạng:
Pr(𝑌𝑖 = 𝑘)=𝑒−(𝛼𝜆)(𝛼𝜆)𝑘
𝑘! , 𝑣ớ𝑖𝑘 = 0, 1, 2, 3 …
Trong đó:
: giá trị trung bình
𝛼 = 1
𝑟 , khi mà trong phân phối xác suất nhị thức âm, số lần thất bại trước thành công thứ r trong n phép thử, ở đó xác suất thành cơng là p.
Khi đó giá trị trung bình thể hiện:
𝐸(𝑦𝑖|𝑋𝑖) = = 𝑒𝑋𝑖𝛽
Phương sai được viết dưới dạng:
𝑉𝑎𝑟(𝑦𝑖|𝑋𝑖) = + α2
Trường hợp ước lượng α = 0 thì giá trị trung bình và phương sai như nhau nên sử dụng mơ hình hồi quy Poisson.
Mơ hình hồi quy Negative Binomial có dạng tổng quát:
𝑌𝑖 = 𝐸(𝑦𝑖|𝑋𝑖) + 𝜀𝑖 =+ 𝜀𝑖
Trung bình cho mỗi quan sát được thể hiện:
Trong đó:
exp(𝛽𝑋) có nghĩa là e lũy thừa biểu thức 𝛽𝑋.
X là các biến số độc lập có thể xác định đến giá trị trung bình của biến phụ thuộc Yi.
Để ước lượng, mơ hình hồi quy NBreg có thể được viết:
Pr(𝑌𝑖 = 𝑘|𝑋) = 𝑒−𝛼𝑒
𝑋𝑖𝛽(𝛼𝑒𝑋𝑖𝛽)𝑘
𝑘! + 𝜀𝑖
Với việc thiết lập biến phụ thuộc là tần suất lựa chọn nơi mua TPTS, tác giả đề xuất sử dụng mơ hình hồi quy Negative Binomial – mơ hình hồi quy tổng qt về dữ liệu số đếm để phân tích dữ liệu trong bài nghiên cứu này.
3.2.1.2. Mơ hình ước lượng Seemingly Unrelated Negative Binomial
Winkelmann (2000) trình bày trong nghiên cứu “Mơ hình hồi quy nhị thức âm dường như không tương quan (Seemingly Unrelated Negative Binomial – SUNB)” các đặc điểm kỹ thuật và ước lượng các mơ hình dữ liệu số đếm đa biến dường như khơng tương quan. Một mơ hình mới với các đường biên nhị thức âm được đề xuất, cho các biến phụ thuộc là số đếm.
Egan và Herriges (2006) mơ tả mơ hình SUNB có dạng:
𝑌𝑗 = 𝑧0+ 𝑧𝑗, 𝑣ớ𝑖𝑗 = 1, … , 𝐽
Trong đó:
J là sản phẩm được lựa chọn. Sản phẩm được chọn có thể là đại diện cho sản phẩm cạnh tranh, các khóa học hành động, địa điểm mua hàng hóa hoặc bất kỳ tùy chọn khác.
𝑌𝑗là số lần cá nhân thực hiện lựa chọn sản phẩm J
Trong đó 𝑧0 và mỗi 𝑧𝑗 là từng hàm phân phối nhị thức âm độc lập I (NBI):
𝑓𝑗(𝑧𝑗) = Γ ( 𝜆𝑗 𝜎 + 𝑧𝑗) Γ (𝜆𝜎 ) Γ(𝑧𝑗 𝑗 + 1) ( 1 1 + 𝜎) 𝜆𝑗 𝜎 ⁄ ( 𝜎 1 + 𝜎) 𝑧𝑗 𝑣ớ𝑖𝑗 = 0, … , 𝐽
Tham số của mơ hình ước lượng bằng phương pháp hợp lý tối đa tương ứng (Maximizing the corresponding log-likelihood)
Khi 𝜎 ≥ 0, 𝜆𝑜 là hằng số và 𝜆𝑗 = 𝑒𝑥𝑝(𝛽𝑗′𝑥𝑗).
Như vậy, hàm phân phối Y tổng quát:
𝑓(𝑦|𝑥) = ∑ 𝑓0 𝑠 𝑘=0 (𝑘) ∏ 𝑓𝑗(𝑦𝑗 − 𝑘) 𝐽 𝑗=1
Khi đó 𝑠 ≡ min(𝑦1, … , 𝑦𝑗). Giá trị trung bình được ghi nhận: 𝐸(𝑦𝑗|𝑥𝑗) = 𝜆0+ 𝜆𝑗
Phương sai được khi đó trở thành:
𝑉𝑎𝑟(𝑦𝑗|𝑥𝑗) = (𝜆0+ 𝜆𝑗)(1 + 𝜎)
Do đó, mức độ quá phân tán làm tăng 𝜎. Hiệp phương sai được xác định:
𝐶𝑜𝑣[𝑦𝑗, 𝑦𝑘] = 𝜆0(1 + 𝜎)
Mơ hình SUNB cho phép ước lượng khi dữ liệu có tương quan và bị phân tán q mức. Như vậy, mơ hình hồi quy SUNB được đề xuất việc chọn nhiều địa điểm mua TPTS từ một người tiêu dùng. Mơ hình này điều chỉnh sai số chuẩn của các ước lượng từ mơ hình Negative Binomial, cho phép số lần mua ở mỗi kênh là có tương quan với nhau và do đó phần dư của các phương trình là có tương quan với nhau.