CHƯƠNG 2 : PHƯƠNG PHÁP THỰC HIỆN NGHIÊN CỨU
2.2. Cách tính các chỉ số
Các chỉ số dùng để mơ tả, phân tích nhằm đạt được mục tiêu nghiên cứu của đề tài được định nghĩa và tính tốn như sau:
2.2.1. Tính tỷ trọng chi tiêu của các nhóm thực phẩm (wk)
2.2.1.1 Mức chi tiêu cho một nhóm hàng (Ek)
Chi tiêu cho một mặt hàng i trong nhóm k (Eki) sẽ bằng tổng chi tiêu của mặt hàng
đó trong dịp lễ tết và chi thông thường.
Eki = Eki_lt + Eki_tt (2.2)
Mức chi tiêu cho một nhóm hàng k (Ek) được tính bằng tổng mức chi tiêu của n mặt hàng trong nhóm. (2.3) n k ki i E =∑E 2.2.1.2 Tỷ trọng chi tiêu
Tỷ trọng chi tiêu cho một mặt hàng i trong nhóm k (wki) được tính bằng chi tiêu cho mặt hàng đó chia cho tổng chi tiêu cho các mặt hàng trong nhóm (hay mức chi tiêu cho nhóm) Ek (2.4) ki ki k E w E =
Tỷ trọng chi tiêu cho một nhóm hàng k (wk) được tính bằng mức chi tiêu cho
nhóm hàng k chia cho tổng mức chi tiêu ăn uống (E)
(2.5) k k E w E =
Tổng mức chi tiêu ăn uống (E) được tính bằng tổng mức chi tiêu ăn uống trong dịp lễ tết (Elt) và chi tiêu ăn uống thông thường (Ett).
E = Elt + Ett (2.6)
Trong đó: Elt, Ett lần lượt là chi tiêu dùng hàng ngày ăn uống trong các dịp lễ tết và chi tiêu dùng hàng ngày ăn uống thơng thường, được tính như sau:
12 _ 1 12 _ 1 (2.7) (2.8) lt k lt k tt k tt k E E E E = = = = ∑ ∑
2.2.2. Số lượng thực phẩm tiêu thụ
Lượng sản phẩm i tiêu dùng trong nhóm k (Qki) được tính bằng tổng số lượng mặt hàng đó được tiêu dùng hàng ngày trong các dịp lễ tết và tiêu dùng hàng ngày thông
thường.
Qki = Qki_lt + Qki_tt (2.9)
Lượng thực phẩm của nhóm hàng k (Ek) tiêu thụ được tính bằng tổng mức tiêu
dùng của n mặt hàng trong nhóm. (2.10) n k ki i Q =∑Q
2.2.3. Chỉ số giá cho một nhóm hàng (kí hiệu Pk)
2.2.3.1 Chỉ số giá cho một mặt hàng
Chỉ số giá cho một mặt hàng cụ thể i trong nhóm k (kí hiệu: Pki) được tính bằng chi tiêu cho mặt hàng đó chia cho số lượng sản phẩm đó được tiêu dùng
(2.12) ki ki ki E P Q = 2.2.3.2 Chỉ số giá của nhóm hàng
Chỉ số giá của nhóm hàng k (Pk) được tính bằng bình qn gia quyền của các chỉ số giá thành phần theo tỷ trọng chi tiêu của từng mặt hàng.
* (2.13)
n
k ki ki
i P =∑P w
Nghĩa là mỗi nhóm thực phẩm k có thể có n thực phẩm khác, mỗi thực phẩm i chiếm một tỷ trọng wki trong nhóm và có một mức giá là Pki. Như vậy, chỉ số giá cho nhóm thực phẩm k sẽ bằng tổng của các tích số Pki*wki. Riêng nhóm ăn uống ngồi gia đình do
khơng có số liệu về lượng tiêu thụ, theo Suharno (2002) và Wen S. Chern et al (2003), chỉ số giá cho nhóm hàng này được thay thế bằng chỉ số giá giá tiêu dùng theo từng vùng (rcpi) có sẵn trong bộ dữ liệu VHLSS 2010.
Cụ thể, trong bộ dữ liệu các chỉ số trên được trích lọc như sau:
Xi: Chi tiêu bình quân của sản phẩm i = Trị giá sản phẩm i tiêu dùng trong dịp lễ tết + Trị giá lượng sản phẩm i tiêu dùng thông thường. Mỗi mức chi tiêu này bao gồm Trị giá mua đổi3 và Trị giá tự túc4
.
3Trị giá mua đổi trong chi ăn, uống, hút bình quân 1 hộ 1 tháng được tính bằng tổng số tiền chi mua hoặc trị
giá đổi lương thực, thực phẩm, chất đốt, uống và hút, ăn uống ngồi gia đình trong tháng trước đó của hộ. [Nguồn:
(m5a1c2b m5a1c3b) (m5a2c2a) (2.14)
i i i
i i
X =∑ + +∑
Qi: Lượng sản phẩm i được tiêu thụ = Lượng tiêu thụ trong dịp lễ, tết + Lượng tiêu thụ thông thường hàng ngày (tính cho mua bán lẫn tự túc)
(m5a1c2a m5a1c3a) (m5a2c2b) (2.15)
i i i
i i
Q =∑ + +∑
Chỉ số giá cho một nhóm thực phẩm k nào đó (bao gồm n sản phẩm) được tính theo cơng thức 2.16 như sau: 1 1 (2.16) n i k i n i i i E P P E = = =∑ ∑
Trong đó: Ei là mức chi tiêu cho sản phẩm i
Ví dụ: Nhóm thực phẩm thịt các loại bao gồm 6 loại nhỏ như thịt lợn, thịt bò, thịt trâu, thịt gà, thịt vịt cùng gia cầm khác và các loại thịt khác (dê, chó, cừu, thú rừng, chim…)5
tương ứng với các mã từ 110 đến 116. Mỗi loại thịt này đều chiếm một tỷ trọng nhất định và mức giá riêng trong nhóm. Từ các số liệu tiêu dùng được khảo sát trong bộ dữ liệu
như mức chi tiêu, số lượng thực phẩm chi tiêu hàng ngày (kể cả lễ tết) của từng loại thịt, theo cơng thức 2.12 đến 2.16 mà tính tốn được tỷ trọng, giá của từng loại thịt, cũng như tỷ trọng và chỉ số giá của nhóm thịt các loại.
(*) Ghi chú:
Kí hiệu m5ac1c2a: chính là kết quả trả lời của câu hỏi 2a trong mục 5a1của bộ dữ liệu. Tương tự như vậy, m5a2c2 chính là kết quả trả lời của câu 2 trong mục 5a2.
2.2.4. Các thơng số khác
Hộ thuộc nhóm giàu - nghèo.
Có nhiều cách phân chia hộ thuộc nhóm giàu nghèo, tuy nhiên, trong nghiên cứu này sử dụng cách phân loại theo ngũ phân vị thu nhập. Theo đó, các hộ gia đình thuộc
nhóm 20% thu nhập cao nhất thì được xếp vào nhóm giàu. Tương tự như vậy, các hộ gia
đình thuộc nhóm 20% thu nhập thấp nhất được xếp vào nhóm nghèo. Kết quả thống kê từ
bộ dữ liệu cho thấy gần 51% hộ thuộc nhóm nghèo và tương ứng 49% thuộc nhóm giàu (theo cách phân loại trên).
4Trị giá tự túc trong chi ăn, uống, hút bình qn 1 hộ 1 tháng được tính bằng tổng số tiền do tự túc lương thực,
thực phẩm, chất đốt, uống và hút và kể cả các khoản chi cho ăn uống ngồi gia đình trong tháng trước đó của hộ.
[Nguồn: “Sổ tay khảo sát mức sống dân cư 2010” Tổng cục Thống kê].
2.3. Xử lý số liệu 2.3.1 Trích dữ liệu
Nguồn dữ liệu sử dụng trong nghiên cứu được trích lọc và xử lý từ bộ dữ liệu
VHLSS 2010 bằng phần mềm thống kê Stata, phiên bản 11 của Stata Corporation. Kết quả mơ hình cũng được thực hiện trên phần mềm này. (xem thêm phụ lục 2.2 về cấu trúc các lệnh của phần mềm Stata được sử dụng trong đề tài này).
Nguồn dữ liệu trong nghiên cứu được tổng hợp lại từ các dataset sau: muc1a.dta,
wt10.dta, ho13.dta, muc5a1.dta, muc5a2.dta.
Bảng 2.2: Thơng tin nguồn dữ liệu được trích lọc Nguồn Tên trường Tên biến Ý nghĩa
m1ac2 hhgender Giới tính của chủ hộ. 1: nam; 0: nữ
m1ac5 Hhage Tuổi của chủ hộ
muc1.dta
matv Hhsize Quy mô hộ
reg10 reg10 6 vùng địa lý
ttnt urban10 Khu vực. 1: Thành thị; 0: Nông thôn
wt10.dta
wt9 wt2010 Trọng số cuộc khảo sát thunhap quint10 Ngũ phân vị theo thu nhập
ho13.dta
thunhap poorrich Biến giàu nghèo. 1: nghèo; 0: giàu m5a1ma, m5a1c2b, m5a1c3b Ei à wi muc5a1.dta m5a1ma, m5a1c2a, m5a1c3a Qi à Pi m5a2ma, m5a2c2b Ei à wi muc5a2.dta m5a1ma, m5a2c2a Qi à Pi
• wi: Tính tốn các chi tiêu cho từng thực phẩm, từ đó tính tỷ
trọng chi tiêu cho từng nhóm. • Pi: Tính tốn lượng chi tiêu cho
từng thực phẩm, cùng với mức chi tiêu từ đó tính các chỉ số giá
Nguồn: Bộ dữ liệu trích từ VHLSS 2010, n = 8.654
2.3.2 Tinh lọc dữ liệu
2.3.2.1 Thiếu hoặc lỗi dữ liệu
Sai sót hoặc thiếu dữ liệu trong các quan sát hộ gia đình là vấn đề thường gặp
trong các nghiên cứu thực nghiệm. Hai vấn đề gặp trong nghiên cứu này là dữ liệu giá và chi tiêu trống, âm hoặc bằng 0. Trong mơ hình nghiên cứu để ước lượng được hệ thống
hàm cầu đầy đủ khách quan cần thiết phải có đầy đủ các giá trị cho tất cả các quan sát hộ. Có nhiều phương pháp để giải quyết vấn đề này như phương pháp thay thế giá trị trung
Để khắc phục các vấn đề trên, trong nghiên cứu này sử dụng phương pháp thay
thế giá trị trung bình. Dữ liệu của quan sát bị thiếu hoặc lỗi được thay thế bởi giá trị trung bình của phân vị thu nhập trong cùng một khu vực địa lý tương ứng.
Nghiên cứu đã loại bỏ 3 quan sát của biến urban10 vì quan sát trống. Ba quan sát này chỉ xuất hiện trong dataset wt10.dta trong bộ dữ liệu VHLSS 2010. Do vậy, sự loại bỏ các quan sát này là cần thiết và không ảnh hưởng đến kết quả nghiên cứu.
2.3.2.2 Loại bỏ các quan sát có giá trị dị biệt (quá lớn hoặc quá nhỏ)
Các biến có các quan sát có giá trị dị biệt được loại bỏ
dựa theo kết quả phân tích các đồ thị box plot. Các giá trị
được loại bỏ là các điểm dị biệt có giá trị nằm ngồi cận
trên (upper outer fence) và cận dưới (lower outer fence) của box. Các giá trị giới hạn này được tính như sau: Upper outer fence (UOF) = Q3 + 3*IQ
Lower outer fence (LOF) = Q1 – 3*IQ Trong đó:
Q1, Q3 lần lượt là các phân vị 25% và 75% IQ = Q3 – Q1 được gọi khoảng bên trong phân vị
v Các quan sát có giá trị nằm ngoài UOF và LOF
được xem là các điểm dị biệt cực mạnh.
v Các quan sát có giá trị nằm ngoài UIF và LIF được gọi là các dị biệt cứng. Trong nghiên cứu này chỉ thực hiện loại bỏ các điểm dị biệt cực mạnh nêu trên. Có tất cả 743 quan sát được loại bỏ theo tiêu chí này, trong đó có 8 quan sát theo quy mô hộ, 443 quan sát theo thông số tỷ trọng chi tiêu của hộ và 292 quan sát theo chỉ số giá các hàng hóa. (xem them phụ lục 2.3 về các biến có quan sát bị loại bỏ). Tóm lại,
bộ dữ liệu tinh lọc được sử dụng trong nghiên cứu bao gồm 8.654 quan sát hộ.
Việc kiểm chứng dạng phân phối của các biến được thực hiện qua sự kết hợp giữa
đồ thị Histogram và box plot. Hình 2.2 cho thấy mối tương quan giữa hai dạng đồ thị
histogram và Box plot. Khi biến có trung bình trùng với trung vị trên box plot thì tương
ứng ở đồ thị Histogram có dạng phân phối chuẩn đối xứng. Ngược lại, khi giá trị trung
bình lớn hơn giá trị trung vị thì biến có phân phối chuẩn lệch phải. Tương tự, nhưng
Hình 2.1: Tính tốn các giá trị của box plot trị của box plot
ngược lại phân phối của biến sẽ lệch trái nếu giá trị trung bình nhỏ hơn trung vị. (xem thêm phụ lục 2.4 về phân phối của các biến trong mơ hình)
Hình 2.2: Kết hợp giữa biểu đồ histogram và box plot 2.3.3 Cách thức ước lượng 2.3.3 Cách thức ước lượng
2.3.3.1. Phương pháp ước lượng
Mơ hình LA/AIDS được ước lượng bằng phương pháp hồi quy tuyến tính theo
phương pháp SUR. Quá trình ước lượng được thực hiện trong ba ràng buộc quan trọng
của mơ hình như tính cộng dồn, tính đồng nhất và tính đối xứng.
Cầu của một hàng hóa ngồi việc phụ thuộc vào giá, thu nhập của người tiêu dùng, nó cịn bị ảnh hưởng bởi nhiều nhân tố khác không quan sát được, chẳng hạn như
thị hiếu người tiêu dùng, phân phối thu nhập của quốc gia, kì vọng sự thay đổi giá, thu
nhập trong tương lai (Sloman, 2006, trang 36 và Parkin, 2005, trang 101). Do vậy, các sai số của các biểu thức cầu riêng rẽ trong mơ hình LA/AIDS sẽ có những mối tương quan với nhau. Theo (Zellner, 1962) hồi quy theo phương pháp SUR có thể nâng cao
được tính hiệu quả các thơng số ước lượng, bởi vì các sai số giữa các hàm cầu được tính
tốn đồng thời và điều chỉnh để có được sai số chung của hệ thống các biểu thức.
SUR (Seemingly Unrelated Regression) là một hệ thống bao gồm nhiều biểu thức hồi quy riêng rẻ có dạng giống nhau, trong đó mỗi biểu thức bao gồm nhiều biến giải
thích khác nhau. Các biểu thức cầu trong mơ hình SUR có dạng “dường như” không liên quan với nhau, nhưng thực tế, lại có mối tương quan với nhau (như đã đề cập ở trên).
2.3.3.2. Kiểm định các ràng buộc
Liên quan đến câu trả lời về độ tin cậy của mơ hình cần thiết phải kiểm tra tính
hiệu quả của các ràng buộc được thêm vào hệ thống các hàm cầu. Một điểm thuận lợi
quan trọng của mơ hình AIDS là nó có khả năng cho phép các nhà nghiên cứu áp đặt và kiểm tra tính hợp lý theo lý thuyết tiêu dùng trong kinh tế học. Cụ thể, trong nghiên cứu này, 3 ràng buộc được thêm vào mơ hình là tính đối xứng, tính đồng nhất và tính bổ sung
được kiểm tra qua kiểm định thống kê likelihood.
Theo Verbeek (2004) trang 171 – 173, có 3 cách kiểm định các giả thuyết ràng
buộc được thêm vào mơ hình, đó là kiểm định Wald, kiểm định Likelihood (LR) và kiểm
định Lagrange (LM).
Thông số ước lượng θ thỏa mãn ràng buộc Ho: Rθ = q, với R là ma trận JxK các hệ số ràng buộc, q là ma trận dòng Jx1 giá trị các ràng buộc.
Nguyên tắc kiểm định của 3 phương pháp trên được tóm tắt như sau:
Kiểm định Wald: ước lượng θ bằng giá trị likelihood lớn nhất và kiểm tra xem sự
sai lệch Rθ∧−q có tiến đến 0 không bằng cách sử dụng ma trận hiệp phương sai của nó.
Kiểm định LR: Nguyên tắc của kiểm định LR tập trung vào so sánh sự sai biệt
giữa hai giá trị hàm likelihood của mơ hình có và khơng có các ràng buộc. Giá trị hàm Likelihood được tính từ q trình ước lượng mơ hình hai lần, một cho mơ hình khơng có các ràng buộc (ước lượng θ) và một ước lượng θ∧ cho mơ hình có các ràng buộc. Từ đó tính tốn các giá trị lớn nhất của hàm likelihood trong điều kiện khơng có ràng buộc
(LΩ) và có ràng buộc (Lω), đồng thời so sánh hiệu số LΩ - Lω với 0. Nếu sai biệt này nhỏ, thì việc thêm vào các ràng buộc là đúng. Ngược lại, nếu khác biệt của hiệu số này với 0 lớn thì việc thêm vào các ràng buộc là không cần thiết.
Theo Verbeek (2004), kiểm định LR được tính tốn đơn giản theo cơng thức sau:
2[log ( ) log ( )]
LR L L
ξ = θ∧ − θ (3.5)
Giá trị ξLR được so sánh với giá trị Chi – bình phương (χ2) với J bậc tự do. Giả thiết Ho: Các ràng buộc thêm vào là cần thiết
Ho bị bác bỏ khi giá trị tính tốn (ξLR) lớn hơn giá trị Chi-bình phương (χ2) tra bảng (với mức ý nghĩa α cho trước và bậc tự do là số các ràng buộc trong mơ hình).
Kiểm định LM: Ước lượng mơ hình với các ràng buộc được thêm vào và kiểm
tra tuần tự các ràng buộc có vi phạm (ý nghĩa thống kê) so với trong mơ hình tổng qt khơng. Nghĩa là đánh giá log ( )L 0
θ θ θ∧
∂ ≠
∂ có ý nghĩa thống kê khơng.
Việc chấp nhận hoặc bác bỏ giả thuyết Ho về các ràng buộc cần thiết bổ sung vào hệ thống cầu có rất nhiều nguyên nhân khác nhau. Theo Barten (1977) ông cho rằng có 4 lý do chính sau: (i) Thứ nhất, tất cả các loại kiểm định không được sử dụng giống nhau ở các nghiên cứu thực nghiệm; (ii) Thứ hai, phương thức kiểm định thông thường dựa vào các phân phối gần đúng của kiểm định thống kê mà khơng có sự điều chỉnh cho sự thiên chệch của mẫu nhỏ. Kết quả của sự thiên chệch này diễn ra theo hướng bác bỏ giả thuyết Ho; (iii) Thứ ba, có sự trùng lặp giữa các nghiên cứu thực nghiệm khác nhau; (iv) Thứ tư, trình tự các ràng buộc được thực hiện cũng đóng một vai trị quan trọng. Thơng
thường, kiểm định về tính đối xứng được thực hiện sau các ràng buộc về tính đồng nhất hoặc đồng thời cùng với nó.
Với tính đơn giản dễ thực hiện và phù hợp với mơ hình nghiên cứu, do vậy trong nghiên cứu này sử dụng kiểm định LR để kiểm tra tính phù hợp của mơ hình. Quy trình và trình tự thực hiện, được tóm tắt như sau:
Bảng 2.3: Quy trình và trình tự thực hiện kiểm định giả thuyết Ho Thứ tự Giả thuyết Ho Bậc tự do Thứ tự Giả thuyết Ho Bậc tự do 1 Ho: Tính đồng nhất H1: Khơng ràng buộc 19 2 Ho: Tính đối xứng H1: Khơng ràng buộc 36 3 Ho: Tính đối xứng H1: Tính đồng nhất 36 4 Ho: Tính đối xứng Tính đồng nhất H1: Khơng ràng buộc 55 2.4. Quy trình phân tích
Quy trình phân tích của đề tài được thực hiện theo 3 bước được thể hiện trong hình 2.3
như sau:
Hình 2.3: Quy trình phân tích của đề tài
Tóm lược ý chính chương 2:
10 nhóm hàng ăn uống trong nghiên cứu bao gồm: gạo, lương thực khác gạo, thịt các loại, dầu mỡ - gia vị, tôm cá, rau quả, trứng, đồ uống, đường - bánh kẹo - sữa, và ăn