CHƢƠNG 2 : TỔNG QUAN CÁC NGHIÊN CỨU TRƢỚC ĐÂY
3.3 Phƣơng pháp nghiên cứu
Phƣơng pháp nghiên cứu định lƣợng: thực hiện phân tích tƣơng quan để
lƣợng hóa mức độ chặt chẽ của mối liên hệ tuyến tính giữa các biến độc lập và biến phụ thuộc. Giữa biến độc lập và biến phụ thuộc phải có tƣơng quan thì các biến đó mới đƣợc áp dụng vào để tính hồi quy. Sử dụng dữ liệu bảng thơng qua hồi quy tuyến tính đa biến để lƣợng hóa ảnh hƣởng của các biến độc lập lên biến phụ thuộc trong mơ hình hồi quy phân vị.
Hồi quy phân vị đƣợc Koenker & Bassett giới thiệu lần đầu tiên năm 1978.
Thay vì ƣớc lƣợng các tham số của hàm hồi quy trung bình bằng phƣơng pháp OLS, Koenker & Bassett (1978) đề xuất việc ƣớc lƣợng tham số hồi quy trên từng phân vị của biến phụ thuộc để sao cho tổng chênh lệch tuyệt đối của hàm hồi quy tại phân vị τ của biến phụ thuộc là nhỏ nhất. Nói một cách khác, thay vì xác định tác động biên của biến độc lập đến giá trị trung bình của biến phụ thuộc, hồi quy phân vị sẽ giúp xác định tác động biên của biến độc lập đến biến phụ thuộc trên từng phân vị của biến phụ thuộc đó. Đồng thời những ƣu điểm của phƣơng pháp hồi quy phân vị với phƣơng pháp OLS của hồi quy cổ điển để cho thấy ƣu điểm của hồi quy phân vị và sự phù hợp của hồi quy phân vị trong những nghiên cứu về chênh lệch tiền lƣơng, cũng nhƣ trong các nghiên cứu về bất bình đẳng trong xã hội.
Phƣơng pháp hồi quy phân vị cho phép thể hiện một cách chi tiết về mối quan hệ giữa biến phụ thuộc và các biến độc lập trên từng phân vị của biến phụ thuộc mà không chỉ xét mối quan hệ này trên giá trị trung bình nhƣ hồi quy OLS. Ƣu điểm này thể hiện nhiều hàm hồi quy cho nhiều phân vị, cho thấy tác
41
động khác nhau của biến độc lập X ứng với nhiều phân vị của biến phụ thuộc Y. Tuy cách tính tốn thực hiện trong hồi quy phân vị khá phức tạp, khối lƣợng tính tốn cũng nhiều hơn trong hồi quy OLS nhƣng với sự phát triển của toán học, thống kê học cộng với sự hỗ trợ của cơng nghệ thơng tin thì những tính tốn nhƣ quy hoạch tuyến tính, bootstrap, đƣợc thực hiện rất dễ dàng và nhanh chóng. Đồng thời,các kiểm định về tham số của hồi quy phân vị khơng dựa vào tính chuẩn của sai số. Hơn nữa, các kiểm định này không dựa trên bất kỳ một giả định nào về dạng phân phối của sai số hồi quy.
Trong hồi quy OLS, các quan sát bất thƣờng (outliers) thƣờng đƣợc loại bỏ để ƣớc lƣợng OLS khơng bị chệch. Trong khi đó, hồi quy phân vị có tính ổn định (robustness), không bị ảnh hƣởng bởi sự hiện diện của các quan sát bất thƣờng đó, dễ dàng thấy rằng 2 mơ hình này sẽ hỗ trợ nhau khắc phục đƣợc các nhƣợc điểm khơng đáng có.
Đặc biệt, hồi quy phân vị phù hợp khi phân tích trên mơ hình hồi quy có sự hiện diện của phƣơng sai thay đổi hoặc trong mẫu số liệu mà hàm phân phối của biến phụ thuộc bất đối xứng quanh giá trị trung bình. Khi đó, hàm hồi quy phân vị trên các phân vị khác nhau sẽ có sự khác biệt rõ rệt, cho thấy tác động không giống nhau của biến độc lập đến biến phụ thuộc ở những phân vị khác nhau.
Tứ phân vị là đại lƣợng mô tả sự phân bố và sự phân tán của tập dữ liệu. Tứ
phân vị có 3 giá trị, đó là tứ phân vị thứ nhất (Q1), thứ nhì (Q2), và thứ ba (Q3). Ba giá trị này chia một tập hợp dữ liệu (đã sắp xếp dữ liệu theo trật từ từ bé đến lớn) thành 4 phần có số lƣợng quan sát đều nhau.
Tứ phân vị được xác định như sau:
· Sắp xếp các số theo thứ tự tăng dần · Cắt dãy số thành 4 phàn bằng nhau · Tứ phân vị là các giá trị tại vị trí cắt
42
Độ trải giữa (Interquartile Range - IQR) Interquartile Range đƣợc xác định nhƣ sau:
43
CHƢƠNG 4 KẾT QUẢ NGHIÊN CỨU