CHƯƠNG 4: KẾT QUẢ NGHIÊN CỨU
4.8. Đánh giá giả định hồi quy qua 3 biểu đồ
Phần dư có thể không tuân theo phân phối chuẩn vì những lý do như: sử dụng sai mô hình, phương sai không phải là hằng số, số lượng các phần dư không đủ nhiều để phân tích... Vì vậy, chúng ta cần thực hiện nhiều cách khảo sát khác nhau. Một cách khảo sát đơn giản nhất là xây dựng biểu đồ tần số của các phần dư Histogram.
Khi phân tích các chỉ số trong biểu đồ Histogram, nếu giá trị trung bình Mean gần bằng 0, độ lệch chuẩn Std. Dev gần bằng 1, các cột giá trị phần dư phân bố theo dạng hình chuông, ta có thể khẳng định phân phối là xấp xỉ chuẩn, giả định phân phối chuẩn của phần dư không bị vi phạm.
Hình 32 :Biểu đồ tần số phần dư chuẩn hóa Histogram
Dựa vào biểu đồ Histogram, ta thấy giá trị trung bình Mean = 2.05E-15 = 2.05 ×10-
15 gần bằng 0, độ lệch chuẩn Standard Deviation là 0.985 gần bằng 1, các cột giá trị phần dư phân bố theo dạng hình chuông, các giá trị tập trung nhiều nhất trong đoạn từ -2 đến 2, các giá trị lớn nhất nằm ở gần -1. Vậy phân phối phần dư xấp xỉ chuẩn, giả định phân phối chuẩn của phần dư không bị vi phạm.
4.8.2. Biểu đồ phần dư chuẩn hóa P-P Plot
Ngoài cách kiểm tra bằng biểu đồ Histogram, thì P-P Plot cũng là một dạng biểu đồ được sử dụng phổ biến giúp nhận diện sự vi phạm giả định phần dư chuẩn hóa. Khi phân tích biểu đồ Normal P-P Plot, nếu các điểm dữ liệu trong phân phối của phần dư bám sát vào đường chéo, phần dư càng có phân phối chuẩn. Nếu các điểm dữ liệu phân bố xa đường chéo, phân phối càng “ít chuẩn”.
Đối với biểu đồ Normal P-P Plot, nếu các điểm dữ liệu trong phân phối của phần dư bám sát vào đường chéo thì phần dư càng có phân phối chuẩn và ngược lại. Nhìn vào hình trên, ta thấy các hệ số quan sát đều nằm trên hoặc nằm gần sát đường chéo, chứng tỏ rằng phần dư có phân phối chuẩn. Các điểm phân vị của phần dư tập hợp và thể hiện thành một đường chéo tương ứng với đường phân phối chuẩn. Phân phối chuẩn của phần dư không bị vi phạm
Hình 33:Biểu đồ phần dư chuẩn hóa P-P Plot
4.8.3. Biểu đồ kiểm tra giả định liên hệ tuyến tính Scatter Plot Một giả định trong hồi quy là phải có mối liên hệ tuyến tính giữa biến phụ thuộc với các biến độc lập. Biểu đồ phân tán Scatter Plot giữa các phần dư chuẩn hóa và giá trị dự đoán chuẩn hóa giúp chúng ta dò tìm xem dữ liệu hiện tại có vi phạm giả định liên hệ tuyến tính hay không. Cách bố trí của điểm dữ liệu trên đồ thị scatter sẽ tùy thuộc vào bản chất biến phụ thuộc, khi đánh giá, chúng ta cần nhìn tổng quát xu hướng của đám mây điểm dữ liệu. Các điểm trên biểu đồ đều thể hiện giá trị của các phân vị trong phân phối của biến quan sát. Nếu các điểm phân vị này nằm trên đường chéo hoặc xấp xỉ đường chéo thì có nghĩa là giả định phân phối chuẩn của phần dư không bị vi phạm.
Dựa vào hình 27, có thể thấy rằng các điểm phân vị đang không nằm trên đường chéo và cũng không nằm sát đường thẳng kỳ vọng. Tuy nhiên một số điểm phân vị vẫn có tiếp xúc với đường chéo, và các điểm phân vị cũng không nằm quá xa đường thẳng kỳ vọng. Phần dư trên biểu đồ P- P Plot cho thấy vẫn còn sai số xảy ra, nhưng khoảng phần dư này trên biểu đồ P- P Plot không phải là quá lớn. Do vậy, kết luận ở đây là giả định phân phối chuẩn của phần dư không bị vi phạm.
Ngoài ra, chúng ta cũng có thể sử dụng biểu đồ Scatter Plot để xem xét mối liên kết giữa hai biến số định lượng. Nếu các điểm trên biểu đồ phân tán rải rác thì giả thuyết về quan hệ tuyến tính không bị vi phạm và ngược lại.
Hình 34:Biểu đồ kiểm tra giả định liên hệ tuyến tính Scatter Plot
(Nguồn: Kết quả thu được từ phân tích dữ liệu)
Qua biểu đồ có thể thấy các điểm phân vị phân tán rải rác khắp biểu đồ chứ không theo một đường thẳng nào cả. Do đó giả định về liên hệ tuyến tính không bị vi phạm, mô hình hồi quy của nghiên cứu chính xác và có độ tin cậy cao.