KINH TẾ LƯỢNG

80 11 0
KINH TẾ LƯỢNG

Đang tải... (xem toàn văn)

Tài liệu hạn chế xem trước, để xem đầy đủ mời bạn chọn Tải xuống

Thông tin tài liệu

Sử dụng tính chất hàm tuyến tính của các phân phối chuẩn cũng là phân phối chuẩn, dựa vào các giả định chặt chẽ và phương pháp bình phương tối thiểu, người ta rút ra các hàm ước lượng t[r]

(1)

BÀI GIẢNG

(2)

MỤC LỤC Trang CHƯƠNG 1GIỚI THIỆU3

1.1.Kinh tế lượng gì?3

1.2.Phương pháp luận Kinh tế lượng4

1.3.Những câu hỏi đặt cho nhà kinh tế lượng 1.4.Dữ liệu cho nghiên cứu kinh tế lượng8

1.5.Vai trị máy vi tính phầm mềm chuyên dụng

CHƯƠNG 2ÔN TẬP VỀ XÁC SUẤT VÀ THỐNG KÊ

2.1.Xác suất11

2.2.Thống kê mô tả23

2.3.Thống kê suy diễn-Vấn đề ước lượng25

2.4.Thống kê suy diễn - Kiểm định giả thiết thống kê30

CHƯƠNG 3HỒI QUY HAI BIẾN

3.1.Giới thiệu39

3.2.Hàm hồi quy tổng thể hồi quy mẫu41

3.3.Ước lượng hệ số mơ hình hồi quy theo phương pháp OLS44 3.4.Khoảng tin cậy kiểm định giả thiết hệ số hồi quy48

3.5.Định lý Gauss-Markov52

3.6.Độ thích hợp hàm hồi quy – R252

3.7.Dự báo mơ hình hồi quy hai biến54

3.8.Ý nghĩa hồi quy tuyến tính số dạng hàm thường sử dụng56

CHƯƠNG 4MƠ HÌNH HỒI QUY TUYẾN TÍNH BỘI

4.1 Xây dựng mơ hình60

4.2.Ước lượng tham số mơ hình hồi quy bội61 4.3 R2 R2 hiệu chỉnh64

4.4 Kiểm định mức ý nghĩa chung mơ hình64 4.5 Quan hệ R2 F65

4.6 Ước lượng khoảng kiểm định giả thiết thống kê cho hệ số hồi quy65 4.7 Biến phân loại (Biến giả-Dummy variable)66

CHƯƠNG 5GIỚI THIỆU MỘT SỐ VẤN ĐỀ LIÊN QUAN ĐẾN MƠ HÌNH HỒI QUY

5.1 Đa cộng tuyến72

5.2 Phương sai sai số thay đổi74 5.3 Tự tương quan (tương quan chuỗi)80 5.4 Lựa chọn mơ hình81

CHƯƠNG DỰ BÁO VỚI MƠ HÌNH HỒI QUY

6.1 Dự báo với mơ hình hồi quy đơn giản84

6.2 Tính chất trễ liệu chuỗi thời gian hệ đến mơ hình84 6.3 Mơ hình tự hồi quy85

6.4 Mơ hình có độ trễ phân phối85 6.5 Ước lượng mơ hình tự hồi quy88

6.6 Phát tự tương quan mơ hình tự hồi quy88

CHƯƠNG 7CÁC MƠ HÌNH DỰ BÁO MĂNG TÍNH THỐNG KÊ

7.1 Các thành phần liệu chuỗi thời gian90 7.2 Dự báo theo xu hướng dài hạn92

7.3 Một số kỹ thuật dự báo đơn giản93 7.4 Tiêu chuẩn đánh giá mơ hình dự báo94 7.5 Một ví dụ số95

(3)

Các bảng tra Z, t , F 2101

Tài liệu tham khảo105

CHƯƠNG GIỚI THIỆU

1.1 Kinh tế lượng gì?

Thuật ngữ tiếng Anh “Econometrics” có nghĩa đo lường kinh tế1 Thật phạm vi của

kinh tế lượng rộng đo lường kinh tế Chúng ta thấy điều qua định nghĩa kinh tế lượng sau:

“Không giống thống kê kinh tế có nội dung số liệu thống kê, kinh tế lượng là môn độc lập với kết hợp lý thuyết kinh tế, cơng cụ tốn học phương pháp luận thống kê Nói rộng hơn, kinh tế lượng liên quan đến: (1) Ước lượng quan hệ kinh tế, (2) Kiểm chứng lý thuyết kinh tế liệu thực tế kiểm định giả thiết kinh tế học hành vi, (3) Dự báo hành vi biến số kinh tế.”2

Sau số ví dụ ứng dụng kinh tế lượng

Ước lượng quan hệ kinh tế

(1) Đo lường mức độ tác động việc hạ lãi suất lên tăng trưởng kinh tế

(2) Ước lượng nhu cầu mặt hàng cụ thể, ví dụ nhu cầu xe thị trường Việt Nam

(3) Phân tích tác động quảng cáo khuyến lên doanh số công ty

Kiểm định giả thiết

(1) Kiểm định giả thiết tác động chương trình khuyến nơng làm tăng suất lúa

(2) Kiểm chứng nhận định độ co dãn theo giá cầu cá basa dạng fillet thị trường nội địa

(3) Có phân biệt đối xử mức lương nam nữ hay không?

Dự báo

(1) Doanh nghiệp dự báo doanh thu, chi phí sản xuất, lợi nhuận, nhu cầu tồn kho… (2) Chính phủ dự báo mức thâm hụt ngân sách, thâm hụt thương mại, lạm phát… (3) Dự báo số VN Index giá loại cổ phiếu cụ thể REE

1.2 Phương pháp luận kinh tế lượng

Theo phương pháp luận truyền thống, gọi phương pháp luận cổ điển, nghiên cứu sử dụng kinh tế lượng bao gồm bước sau3:

(1) Phát biểu lý thuyết giả thiết

(2) Xác định đặc trưng mơ hình tốn kinh tế cho lý thuyết giả thiết (3) Xác định đặc trưng mơ hình kinh tế lượng cho lý thuyết giả thiết (4) Thu thập liệu

(5) Ước lượng tham số mơ hình kinh tế lượng (6) Kiểm định giả thiết

(7) Diễn giải kết

(8) Dự báo sử dụng mơ hình để định sách

1A.Koutsoyiannis, Theory of Econometrics-Second Edition, ELBS with Macmillan-1996, trang 3

(4)

Hình 1.1 Phương pháp luận kinh tế lượng

Ví dụ 1: Các bước tiến hành nghiên cứu vấn đề kinh tế sử dụng kinh tế lượng với đề tài nghiên cứu xu hướng tiêu dùng biên kinh tế Việt Nam

(1) Phát biểu lý thuyết giả thiết Keynes cho rằng:

Qui luật tâm lý sở đàn ông (đàn bà) muốn, qui tắc trung bình, tăng tiêu dùng họ thu nhập họ tăng lên, không nhiều gia tăng thu nhập họ.4

Vậy Keynes cho xu hướng tiêu dùng biên(marginal propensity to consume-MPC), tức tiêu dùng tăng lên thu nhập tăng đơn vị tiền tệ lớn nhỏ

(2) Xây dựng mơ hình tốn cho lý thuyết giả thiết

Dạng hàm đơn giản thể ý tưởng Keynes dạng hàm tuyến tính

TD=β1+β2GNP (1.1) Trong : < β2 <

Biểu diển dạng đồ thị dạng hàm sau:

4 John Maynard Keynes, 1936, theo D.N.Gujarati, Basic Economics, 3rd , 1995, trang 3.

Lý thuyết giả thiết

Lập mơ hình kinh tế lượng

Thu thập số liệu

Ước lượng thông số

Kiểm định giả thiết

Diễn dịch kết Xây dựng lại mô

hình

Dự báo Quyết định

sách

(5)

1 : Tung độ gốc

2: Độ dốc

TD : Biến phụ thuộc hay biến giải thích GNP: Biến độc lập hay biến giải thích

Hình Hàm tiêu dùng theo thu nhập (3) Xây dựng mơ hình kinh tế lượng

Mơ hình tốn với dạng hàm (1.1) thể mối quan hệ tất định(deterministic relationship) tiêu dùng thu nhập quan hệ biến số kinh tế thường mang tính khơng xác Để biểu diển mối quan hệ khơng xác tiêu dùng thu nhập đưa vào thành phần sai số:

TD=β1+β2GNP+ε (1.2)

Trong  sai số, biến ngẫu nhiên đại diện cho nhân tố khác tác động lên tiêu dùng mà chưa đưa vào mơ hình

Phương trình (1.2) mơ hình kinh tế lượng Mơ hình gọi mơ hình hồi quy tuyến tính Hồi quy tuyến tính nội dung học phần

(4) Thu thập số liệu

Số liệu tiêu dùng thu nhập kinh tế Việt Nam từ 1986 đến 1998 tính theo đơn vị tiền tệ hành sau:

Năm

Tiêu dùng TD, đồng hành

Tổng thu nhập GNP, đồng

hành

Hệ số khử

lạm phát

1986 526.442.004.480 553.099.984.896 2,302

1987 2.530.537.897.984 2.667.299.995.648 10,717

1988 13.285.535.514.624 14.331.699.789.824 54,772

1989 26.849.899.970.560 28.092.999.401.472 100

1990 39.446.699.311.104 41.954.997.960.704 142,095

1991 64.036.997.693.440 76.707.000.221.696 245,18

1992 88.203.000.283.136 110.535.001.505.792 325,189

1993 114.704.005.464.064 136.571.000.979.456 371,774

1994 139.822.006.009.856 170.258.006.540.288 425,837

1995 186.418.693.406.720 222.839.999.299.584 508,802

1996 222.439.040.614.400 258.609.007.034.368 540,029

1997 250.394.999.521.280 313.623.008.247.808 605,557

G N P T

D

 2 = M P C 

(6)

1998 284.492.996.542.464 361.468.004.401.152 659,676

Bảng 1.1 Số liệu tổng tiêu dùng GNP Việt Nam

Nguồn : World Development Indicator CD-ROM 2000, WorldBank.

TD: Tổng tiêu dùng kinh tế Việt Nam, đồng hành GNP: Thu nhập quốc nội Việt Nam, đồng hành

Do thời kỳ khảo sát có lạm phát cao nên cần chuyển dạng số liệu tiêu dùng thu nhập thực với năm gốc 1989

Năm Tiêu dùng

TD, đồng-giá cố định 1989

Tổng thu nhập GNP, đồng-giá cố định

1989

1986 22.868.960.302.145 24.026.999.156.721

1987 23.611.903.339.515 24.888.000.975.960

1988 24.255.972.171.640 26.165.999.171.928

1989 26.849.899.970.560 28.092.999.401.472

1990 27.760.775.225.362 29.526.000.611.153

1991 26.118.365.110.163 31.285.998.882.813

1992 27.123.609.120.801 33.990.999.913.679

1993 30.853.195.807.667 36.735.001.692.581

1994 32.834.660.781.138 39.982.003.187.889

1995 36.638.754.378.646 43.797.002.601.354

1996 41.190.217.461.479 47.888.002.069.333

1997 41.349.567.191.335 51.790.873.128.795

1998 43.126.144.904.439 54.794.746.182.076

Bảng 1.2 Tiêu dùng thu nhập Việt Nam, giá cố định 1989

(5) Ước lượng mơ hình (Ước lượng hệ số mơ hình)

Sử dụng phương pháp tổng bình phương tối thiểu thơng thường (Ordinary Least Squares)5 thu kết hồi quy sau:

TD = 6.375.007.667 + 0,680GNP t [4,77][19,23]

R2 = 0,97

Ước lượng cho hệ số 1 ^β1=¿ 6.375.007.667

Ước lượng cho hệ số 2 2=¿ 0,68

Xu hướng tiêu dùng biên kinh tế Việt Nam MPC = 0,68 (6) Kiểm định giả thiết thống kê

Trị số xu hướng tiêu dùng biên tính tốn MPC = 0,68 theo phát biểu Keynes Tuy nhiên cần xác định MPC tính tốn có lớn nhỏ với ý nghĩa thống kê hay khơng Phép kiểm định trình bày chương

(7) Diễn giải kết

Dựa theo ý nghĩa kinh tế MPC diễn giải kết hồi quy sau: Tiêu dùng tăng 0,68 ngàn tỷ đồng GNP tăng ngàn tỷ đồng

(8) Sử dụng kết hồi quy

(7)

Dựa vào kết hồi quy dự báo phân tích tác động sách Ví dụ dự báo GNP Việt Nam năm 2004 dự báo tiêu dùng Việt Nam năm 2004 Ngồi biết MPC ước lượng số nhân kinh tế theo lý thuyết kinh tế vĩ mô sau:

M = 1/(1-MPC) = 1/(1-0,68) = 3,125

Vậy kết hồi quy hữu ích cho phân tích sách đầu tư, sách kích cầu…

1.3 Những câu hỏi đặt cho nhà kinh tế lượng

1 Mơ hình có ý nghĩa kinh tế khơng?

2 Dữ liệu có đáng tin cậy khơng?

3 Phương pháp ước lượng có phù hợp khơng?

4 Kết thu so với kết từ mơ hình khác hay phương pháp khác nào?

1.4 Dữ liệu cho nghiên cứu kinh tế lượng

Có ba dạng liệu kinh tế bản: liệu chéo, liệu chuỗi thời gian liệu bảng

Dữ liệu chéo bao gồm quan sát cho nhiều đơn vị kinh tế thời điểm cho trước Các

đơn vị kinh tế bao gồm các nhân, hộ gia đình, cơng ty, tỉnh thành, quốc gia…

Dữ liệu chuỗi thời gian bao gồm quan sát đơn vị kinh tế cho trước tại

nhiều thời điểm Ví dụ ta quan sát doanh thu, chi phí quảng cáo, mức lương nhân viên, tốc độ đổi công nghệ… công ty khoảng thời gian 1990 đến 2002

Dữ liệu bảng kết hợp liệu chéo liệu chuỗi thời gian Ví dụ với cùng

bộ biến số cơng ty ví dụ trên, thu thập số liệu nhiều công ty khoảng thời gian

Biến rời rạc hay liên tục

Biến rời rạc biến có tập hợp kết đếm được.Ví dụ biến Quy mơ hộ

gia đình ví dụ mục 1.2 biến rời rạc

Biến liên tục biến nhận kết số vô hạn kết Ví dụ lượng lượng mưa

trong năm địa điểm

Dữ liệu thu thập từ thí nghiệm có kiểm sốt, nói cách khác thay đổi biến số điều kiện biến số khác giữ không đổi Đây cách bố trí thí nghiệm nơng học, y khoa số ngành khoa học tự nhiên

Đối với kinh tế học nói riêng khoa học xã hội nói chung, khó bố trí thí nghiệm có kiểm sốt, thực dường tất thứ thay đổi nên quan sát hay điều tra để thu thập liệu

1.5 Vai trò máy vi tính phầm mềm chuyên dụng

Vì kinh tế lượng liên quan đến việc xử lý khối lượng số liệu lớn nên cần dến trợ giúp máy vi tính chương trình hỗ trợ tính tốn kinh tế lượng Hiện có nhiều phần mềm chuyên dùng cho kinh tế lượng hỗ trợ xử lý kinh tế lượng

Excel

Nói chung phần mềm bảng tính(spreadsheet) có số chức tính tốn kinh tế lượng Phần mềm bảng tính thơng dụng Excel nằm Office hãng Microsoft Do tính thơng dụng Excel nên có số hạn chế việc ứng dụng tính tốn kinh tế lượng, giáo trình có sử dụng Excel tính tốn ví dụ minh hoạ hướng dẫn giải tập

Phần mềm chuyên dùng cho kinh tế lượng

(8)

Phần mềmCông ty phát triển

AREMOS/PC Wharton Econometric Forcasting Associate BASSTALBASS Institute Inc

BMDP/PCBMDP Statistics Software Inc DATA-FITOxford Electronic Publishing

ECONOMIST WORKSTATIONData Resources, MC Graw-Hill ESPEconomic Software Package

ETNew York University

EVIEWSQuantitative Micro Software

GAUSSAptech System Inc LIMDEPNew York University MATLABMathWorks Inc PC-TSPTSP International P-STATP-Stat Inc

SAS/STATVAR Econometrics SCA SYSTEMSAS Institute Inc

SHAZAMUniversity of British Columbia SORITECThe Soritec Group Inc

SPSSSPSS Inc

STATPROPenton Sofware Inc

Trong số có hai phần mềm sử dụng tương đối phổ biến trường đại học viện nghiên cứu Việt Nam SPSS EVIEWS SPSS phù hợp cho nghiên cứu thống kê tương đối thuận tiện cho tính toán kinh tế lượng EVIEWS thiết kế chuyên cho phân tích kinh tế lượng

CHƯƠNG 2

(9)

Một biến mà giá trị xác định phép thử ngẫu nhiên gọi biến ngẫu nhiên Nói cách khác ta chưa thể xác định giá trị biến ngẫu nhiên phép thử chưa diễn Biến ngẫu nhiên ký hiệu ký tự hoa X, Y, Z… Các giá trị biến ngẫu nhiên tương ứng biểu thị ký tự thường x, y, z…

Biến ngẫu nhiên rời rạc hay liên tục Một biến ngẫu nhiên rời rạc nhận số hữu hạn(hoặc vô hạn đếm được) giá trị Một biến ngẫu nhiên liên tục nhận vô số giá trị khoảng giá trị

Ví dụ 2.1 Gọi X số chấm xuất tung súc sắc (xí ngầu) X biến

ngẫu nhiên rời rạc nhận kết 1,2,3,4,5

Ví dụ 2.2 Gọi Y chiều cao người chọn ngẫu nhiên nhóm

người Y biến ngẫu nhiên có nhận sau đo đạc chiều cao người Trên người cụ thể đo chiều cao 167 cm Con số tạo cho cảm giác chiều cao biến ngẫu nhiên rời rạc, khơng phải thế, Y thực nhận giá trị khoảng cho trước thí dụ từ 160 cm đến 170 cm tuỳ thuộc vào độ xác phép đo Y biến ngẫu nhiên liên tục

2.1 Xác suất

2.1.1 Xác suất biến ngẫu nhiên nhận giá trị cụ thể

Chúng ta thường quan tâm đến xác suất biến ngẫu nhiên nhận giá trị xác định Ví dụ ta tung súc sắc ta muốn biết xác suất xuất Xi =

Do súc sắc có mặt khơng có gian lận khả xuất mặt nên suy xác suất để X= là: P(X=4) = 1/6

Nguyên tắc lý không đầy đủ(the principle of insufficient reason): Nếu có K kết

quả có khả xảy xác suất xảy kết 1/K

Không gian mẫu: Một không gian mẫu tập hợp tất khả xảy của

một phép thử, ký hiệu cho không gian mẫu S Mỗi khả xảy điểm mẫu

Biến cố : Biến cố tập khơng gian mẫu.

Ví dụ 2.3 Gọi Z tổng số điểm phép thử tung hai súc sắc

Không gian mẫu S = {2;3;4;5;6;7;8;9;10;11;12} A = {7;11}Tổng số điểm 11

B = {2;3;12}Tổng số điểm hoặc 12 C = {4;5;6;8;9;10}

D = {4;5;6;7} Là biến cố

Hợp biến cố

E = A B = A∪B = {2;3;7;11;12}

Giao biến cố:

F = C D = C ∩ D = {4;5;6}

Các tính chất xác suất

P(S) =1

0 ≤ P( A)≤1

P(E)=P( A∪ B)=P( A)+P(B)− P (A ∩B)

Tần suất

Khảo sát biến X số điểm tung súc sắc Giả sử tung n lần số lần xuất

hiện giá trị xi ni Tần suất xuất kết xi

fi=n

n

Nếu số phép thử đủ lớn tần suất xuất xi tiến đến xác suất xuất xi

Định nghĩa xác suất

(10)

P(X =xi)=lim n → ∞

ni n

2.1.2 Hàm mật độ xác suất (phân phối xác suất) Hàm mật độ xác suất-Biến ngẫu nhiên rời rạc

X nhận giá trị xi riêng rẽ x1, x2,…, xn Hàm số

f(x) = P(X=xi) , với i = 1;2; ;n = , với x xi

được gọi hàm mật độ xác suất rời rạc X P(X=xi) xác suất biến X nhận giá trị xi

Xét biến ngẫu nhiên X số điểm phép thử tung súc sắc Hàm mật độ xác suất biểu diễn dạng bảng sau.

X

P(X=x) 1/6 1/6 1/6 1/6 1/6 1/6

Bảng 2.1 Mật độ xác suất biến ngẫu nhiên rời rạc X

Xét biến Z tổng số điểm phép thử tung súc sắc Hàm mật độ xác suất biểu diễn dạng bảng sau

z 10 11

P(Z=z) 1/36 2/36 3/36 4/36 5/36 6/36 5/36 4/36 3/36 2/36

Bảng 2.2 Mật độ xác suất biến ngẫu nhiên rời rạc Z

Hình 2.1 Biểu đồ tần suất biến ngẫu nhiên Z. Hàm mật độ xác suất(pdf)-Biến ngẫu nhiên liên tục

Ví dụ 2.4 Chúng ta xét biến R số xuất bấm nút Rand máy tính cầm

tay dạng tiêu biểu Casio fx-500 R biến ngẫu nhiên liên tục nhận giá trị từ đến Các nhà sản xuất máy tính cam kết khả xảy giá trị cụ thể Chúng ta có dạng phân phối xác suất có mật độ xác suất

Hàm mật độ xác suất định nghĩa sau:f(r) = U − L1 Với L : Giá trị thấp phân phối

(11)

Hình 2.2 Hàm mật độ xác suất R

Xác suất để R rơi vào khoảng (a; b) P(a <r<b) = b −a

U − L

Cụ thể xác suất để R nhận giá trị khoảng (0,2; 0,4) là: P(0,2 < r < 0,4) = 0,4 −0,2

1− 0 =20 % , diện tích gạch chéo hình

2.1

Tổng quát, hàm mật độ xác suất biến ngẫu nhiên liên tục có tính chất sau:

(1) f(x) ≥

(2) P(a<X<b) = Diện tích nằm đường pdf

P(a<X<b) = ∫

a b

f (x)dx

(3) ∫

S

f (x)dx=1

Hàm đồng mật độ xác suất -Biến ngẫu nhiên rời rạc

Ví dụ 2.5 Xét hai biến ngẫu nhiên rời rạc X Y có xác suất đồng xảy X = xi Y =

yi sau

X

2 P(Y)

Y 0,2 0,4 0,6

2 0,3 0,1 0,4

P(X) 0,5 0,5 1,0

Bảng 2.3 Phân phối đồng mật độ xác xuất X Y

Định nghĩa :Gọi X Y hai biến ngẫu nhiên rời rạc Hàm số

f(x,y) = P(X=x Y=y)

= X x Y y

được gọi hàm đồng mật độ xác suất, cho ta xác xuất đồng thời xảy X=x Y=y

Hàm mật độ xác suất biên

f(x) = ∑

y

f (x , y ) hàm mật độ xác suất biên X

f(y) = ∑

x

f (x , y ) hàm mật độ xác suất biên Y

Ví dụ 2.6 Ta tính hàm mật độ xác suất biên số liệu cho ví dụ 2.5.

f(x=2) = ∑

y

f (x=2 , y) =0,3 + 0,3 = 0,5

f(x=3) = ∑

y

f (x=3 , y ) =0,1 + 0,4 = 0,5

f(y=1) = ∑

x

(12)

f(y=2) = ∑

x

f (x , y =2) =0,3 +0,1 = 0,4

Xác suất có điều kiện

Hàm số

f(x│y) = P(X=x│Y=y) , xác suất X nhận giá trị x với điều kiện Y nhận giá trị y, gọi xác suất có điều kiện X

Hàm số

f(y│x) = P(Y=y│X=x) , xác suất Y nhận giá trị y với điều kiện X nhận giá trị x, gọi xác suất có điều kiện Y

Xác suất có điều kiện tính sau

f (x∨ y)=f (x , y)

f ( y ) , hàm mật độ xác suất có điều kiện X

f ( y∨x)=f (x , y)

f (x) , hàm mật độ xác suất có điều kiện Y

Như hàm mật độ xác suất có điều kiện biến tính từ hàm đồng mật độ xác suất hàm mật độ xác suất biên biến

Ví dụ 2.7 Tiếp tục ví dụ 2.5 ví dụ 2.6

f (X=2∨Y =1)=f (X=2 , Y =1) f (Y =1) =

0,2

0,6=

1

f (Y =2∨X=3)=f (X =3 ,Y =2) f (X =3) =

0,1

0,5=

1

Độc lập thống kê

Hai biến ngẫu nhiên X Y độc lập thống kê f(x,y)=f(x)f(y)

tức hàm đồng mật độ xác suất tích hàm mật độ xác suất biên

Hàm đồng mật độ xác suất cho biến ngẫu nhiên liên tục

Hàm đồng mật độ xác suất biến ngẫu nhiên liên tục X Y f(x,y) thỏa mãn f(x,y) ≥

− ∞

−∞

f (x , y)dxdy=1 a

¿

c d

f (x , y )dxdy=P(¿¿≤ x ≤ b ;c ≤ y ≤d )

a b

¿

Hàm mật độ xác suất biên tính sau

f (x)=− ∞

f (x , y )dy , hàm mật độ xác suất biên X

f ( y)=−∞

f (x , y)dx , hàm mật độ xác suất biên Y

2.1.3 Một số đặc trưng phân phối xác suất Giá trị kỳ vọng hay giá trị trung bình

Giá trị kỳ vọng biến ngẫu nhiên rời rạc

E( X)=X

(13)

Giá trị kỳ vọng biến ngẫu nhiên liên tục

E( X)=X

xf(x )dx

Ví dụ 2.8 Tính giá trị kỳ vọng biến X số điểm phép thử tung súc sắc

E( X)=1∗1

6+2

1 6+3

1 6+4

1

6+5

1

6+6

1

6=3,5

Một số tính chất giá trị kỳ vọng

(1) E(a) = avới a số

(2) E(a+bX) = a + bE(X)với a b số

(3) Nếu X Y độc lập thống kê E(XY) = E(X)E(Y) (4) Nếu X biến ngẫu nhiên có hàm mật độ xác suất f(x)

E[g (X )]=∑

x

g( X )f (x) , X rời rạc

E[g (X )]=∫

− ∞

g( X)f (x)dx , X liên tục Người ta thường ký hiệu kỳ vọng  :  = E(X)

Phương sai

X biến ngẫu nhiên  = E(X) Độ phân tán liệu xung quanh giá trị trung bình thể phương sai theo định nghĩa sau:

X − μ¿2

var(X )=σX2=E¿

Độ lệch chuẩn X bậc hai dương σ2X , ký hiệu σX .

Ta tính phương sai theo định nghĩa sau

X − μ¿2f (x) ¿

var(X )=

x

¿ , X biến ngẫu nhiên rời rạc

X − μ¿2f (x )dx ¿

¿∫

−∞

¿

, X biến ngẫu nhiên liên tục

Trong tính tốn sử dụng công thức sau

var(X)=E(X2)-[E(X)]2

Ví dụ 2.9 Tiếp tục ví dụ 2.8 Tính var(X)

Ta có E(X) = 3,5

Tính E(X2) cách áp dụng tính chất (4).

E(X2) = 121

6+2

21 6+3

21 6+4

21

6+5

21 6+6

21

6=¿ 15,17

var(X)=E(X2)-[E(X)]2 = 15,17 – 3,52 = 2,92

Các tính chất phương sai (1) E(X )2 E(X2) 2 (2) var(a) = với a số

(3) var(a+bX) = b2var(X)với a b số

(4) Nếu X Y biến ngẫu nhiên độc lập var(X+Y) = var(X) + var(Y)

var(X-Y) = var(X) + var(Y)

(14)

Hiệp phương sai

X Y hai biến ngẫu nhiên với kỳ vọng tương ứng x y Hiệp phương sai

hai biến

cov(X,Y) = E[(X-x)(Y-y)] = E(XY) - xy

Chúng ta tính tốn trực tiếp hiệp phương sai sau Đối với biến ngẫu nhiên rời rạc

cov (X , Y ) ¿∑

yx

(X − μx)(Y − μy)f (x , y)

¿∑

yx

X Yf(x , y)− μxμy

Đối với biến ngẫu nhiên liên tục

cov (X , Y ) ¿∫

−∞

−∞

(X − μx)(Y − μy)f ( x , y)dxdy ¿∫

−∞

−∞

XYf(x , y )dxdy − μxμy

Tính chất hiệp phương sai

(1) Nếu X Y độc lập thống kê hiệp phương sai chúng cov(X,Y) = E(XY) –xy

=xy–xy

=0

(2) cov(a+bX,c+dY)=bdcov(X,Y)với a,b,c,d số Nhược điểm hiệp phương sai phụ thuộc đơn vị đo lường

Hệ số tương quan

Để khắc phục nhược điểm hiệp phương sai phụ thuộc vào đơn vị đo lường, người ta sử dụng hệ số tương quan định nghĩa sau:

ρxy=cov (X , Y )

var(X )var (Y )=

cov ( X ,Y )

σxσy

Hệ số tương quan đo lường mối quan hệ tuyến tính hai biến  nhận giá trị nằm -1 Nếu =-1 mối quan hệ nghịch biến hồn hảo, =1 mối quan hệ đồng biến hoàn hảo

Từ định nghĩa ta có cov(X,Y) =xy

2.1.4 Tính chất biến tương quan

Gọi X Y hai biến có tương quan var(X+Y) = var(X) + var(Y) + 2cov(X,Y) = var(X) + var(Y) + 2xy

var(X-Y) = var(X) + var(Y) - 2cov(X,Y) = var(X) + var(Y) - 2xy

Mô men phân phối xác suất

Phương sai biến ngẫu nhiên X mô men bậc phân phối xác suất X Tổng quát mô men bậc k phân phối xác suất X

E(X-)k

Mô men bậc bậc phân phối sử dụng hai số đo hình dạng phân phối xác suất skewness(độ bất cân xứng) kurtosis(độ nhọn) mà xem xét phần sau

2.1.5 Một số phân phối xác suất quan trọng Phân phối chuẩn

Biến ngẫu nhiên X có kỳ vọng , phương sai 2 Nếu X có phân phối chuẩn nó

được ký hiệu sau

X ~ N (μ , σ2)

(15)

x − μ¿2 ¿

(¿σ2¿)

1

2¿

f (x)=

σ2 πexp¿

Hình 2.3 Hàm mật độ xác suất phân phối chuẩn

Tính chất phân phối chuẩn

(1) Hàm mật độ xác suất đối xứng quanh giá trị trung bình

(2) Xấp xỉ 68% diện tích đường pdf nằm khoảng xấp xỉ 95% diện tích nằm đường pdf nằm khoảng và xấp xỉ 99,7% diện tích nằm đường pdf nằm khoảng 

(3) Nếu đặt Z = (X-thì ta có Z~N(0,1) Z gọi biến chuẩn hoá N(0,1) gọi phân phối chuẩn hố

(4) Định lý giớí hạn trung tâm 1: Một kết hợp tuyến tính biến có phân phối chuẩn,, số điều kiện xác định phân phối chuẩn Ví dụ

X1~ N (μ1, σ12) X2~ N (μ2, σ22) Y =aX1+bX2 với a b số có phân phối

Y~N[(a1+b2),( a2σ21+b2σ22¿ ]

(5) Định lý giới hạn trung tâm 2: Dưới số điều kiện xác định, giá trị trung bình mẫu biến ngẫu nhiên gần tuân theo phân phối chuẩn

(6) Mô men phân phối chuẩn Mô men bậc ba: E[(X-)3]=0

Xấp xỉ 68% Xấp xỉ 95% -   

(16)

Mô men bậc bốn : E[(X-)4]=34

Đối với phân phối chuẩn Độ trôi (skewness):

S=E[(X − μ σ )

3

]=0

Độ nhọn(kurtosis):

K=E[(X − μ σ )

4

]=3

(7) Dựa vào kết mục (6), người kiểm định xem biến ngẫu nhiên có tn theo phân phối chuẩn hay khơng cách kiểm định xem S có gần K có gần hay không Đây nguyên tắc xây dựng kiểm định quy luật chuẩn Jarque-Bera

K −3¿2 ¿ ¿

S2 +¿

JB=n

6¿

JB tuân theo phân phối  với hai bậc tự do(df =2)

Phân phối 

Định lý : Nếu X1, X2,…, Xk biến ngẫu nhiên độc lập có phân phối chuẩn hố χk2=∑

i=1 k

Xi2 tuân theo phân phối Chi-bình phương với k bậc tự

Tính chất 

(1) Phân phối là phân phối lệch bên trái, bậc tự tăng dần phân phối

tiến gần đến phân phối chuẩn

(2) k 2 = 2k

(3) χk 12 +χk 22 =χk 1+k 22 , hay tổng hai biến có phân phối cũng có phân phối với

số bậc tự tổng bậc tự

Phân phối Student t

Định lý: Nếu Z~N(0,1) χk2 độc lập thống kê t(k)= Z

χk2/k tuân theo phân

phối Student hay nói gọn phân phối t với k bậc tự

Tính chất phân phối t

(1) Phân phối t đối xứng quanh phân phối chuẩn hoá thấp Khi

bậc tự lớn phân phối t tiệm cận đến phân phối chuẩn hoá Trong thực hành Khi bậc tự lớn 30 người ta thay phân phối t phân phối chuẩn hoá

(2)  =  = k/(k-2) Phân phối F

Định lý : Nếu χk 12 χk 22 độc lập thống kê F(K , k 2)= χk 12 k1

χk 2

2

k2

tuân theo

phân phối F với (k1,k2) bậc tự

Tính chất phân phối F

(1) Phân phối F lệch bên trái, bậc tự k1 k2 đủ lớn, phân phối F tiến đến

(17)

(2)  = k2/(k2-2) với điều kiện k2>2

k2−2¿

(k2− 4)

k1¿

σ2=2 k2

(k1+k2− 2)

¿

với điều kiện k2>4

(3) Bình phương phân phối t với k bậc tự phân phối F với k bậc

tự tk

2

=F(1 ,k)

(4) Nếu bậc tự mẫu k2 lớn k1F(k1,k2)=χk1

2

Lưu ý : Khi bậc tự đủ lớn phân phối , phân phối t phân phối F tiến đến

phân phối chuẩn Các phân phối gọi phân phối có liên quan đến phân phối chuẩn

2.2 Thống kê mô tả

Mô tả liệu thống kê(Descriptive Statistic)

Có bốn tính chất mơ tả phân phối xác suất biến ngẫu nhiên sau: - Xu hướng trung tâm hay “điểm giữa” phân phối

- Mức độ phân tán liệu quanh vị trí “điểm giữa”

- Độ trơi(skewness) phân phối

- Độ nhọn(kurtosis) phân phối

Mối quan hệ thống kê hai biến số mô tả hệ số tương quan

2.2.1 Xu hướng trung tâm liệu

Trung bình tổng thể (giá trị kỳ vọng) x = E[X]

Trung bình mẫu

X

=

i=1 n

xi n

Trung vị tổng thể : X biến ngẫu nhiên liên tục, Md trung vị tổng thể P(X<Md) = 0,5

Trung vị mẫu : Nếu số phân tử mẫu lẻ trung vị số “ở giữa” mẫu theo thứ tự tăng dần giảm dần

Nếu số phần tử mẫu chẳn trung vị trung bình cộng hai số “ở giữa”

Trong kinh tế lượng quan tâm đến trung bình mà khơng tính toán trung vị

2.2.2 Độ phân tán liệu Phương sai

Phương sai tổng thể : σ ¿

x

2

=E¿

Phương sai mẫu:

Xi− ¯X¿2

¿ ¿

i=1 n

¿

SX

2 =¿

hoặc

Xi− ¯X¿2

¿ ¿

i=1 n

¿

^

σX

2

=¿

(18)

Độ lệch chuẩn tổng thể : σx=√σ2x

Độ lệch chuẩn mẫu : Sx=√S2x

hoặc : σ^x=√σ^2x

2.2.3 Độ trôi S

Độ trôi tổng thể : E[(X − μ σ )

3

]

Độ trôi mẫu : S=1 ni=1

n

(xi− ¯X

^

σ )

3

Đối với phân phối chuẩn độ trôi 0.

2.2.4 Độ nhọn K

Độ nhọn tổng thể E[(X − μ σ )

4

]

Độ nhọn mẫu K=1

ni=1 n

(xi− ¯X

^

σ )

4

Đối với phân phối chuẩn độ nhọn Một phân phối có K lớn là nhọn, nhỏ phẳng

2.2.5 Quan hệ hai biến-Hệ số tương quan

Hệ số tương quan tổng thể ρXY=cov (X , Y )

σXσY

Hệ số tương quan mẫu rXY= SXY

SXSY

với SXY=

n − 1i=1 n

(Xi− ¯X)(Yi− ¯Y)

2.3 Thống kê suy diễn - vấn đề ước lượng 2.3.1 Ước lượng

Chúng ta tìm hiểu chất, đặc trưng yêu cầu ước lượng thống kê thông qua ví dụ đơn giản ước lượng giá trị trung bình tổng thể

Ví dụ 11 Giả sử muốn khảo sát chi phí cho học tập học sinh tiểu học tại

trường tiểu học Y Chúng ta muốn biết trung bình chi phí cho học tập học sinh tiểu học Gọi X biến ngẫu nhiên ứng với chi phí cho học tập học sinh tiểu học (X tính ngàn đồng/học sinh/tháng) Giả sử biết phương sai X

2 x

 =100 Trung bình thực X  số chưa biết Chúng ta tìm cách ước lượng 

dựa mẫu gồm n=100 học sinh lựa chọn cách ngẫu nhiên

2.3.2 Hàm ước lượng cho 

Chúng ta dùng giá trị trung bình mẫu X để ước lượng cho giá trị trung bình tổng thể  Hàm ước lượng sau

¯

X =1

n(X1+X2+⋅+ Xn)

¯

X biến ngẫu nhiên Ứng với mẫu cụ thể X¯ nhận giá trị xác định

Ước lượng điểm

Ứng với mẫu cụ thể, giả sử tính X¯ = 105 (ngàn đồng/học sinh) Đây ước lượng điểm

(19)

Ước lượng khoảng

Ước lượng khoảng cung cấp khoảng giá trị chứa giá trị chi phí trung bình cho học tập học sinh tiểu học Ví dụ tìm X = 105 Chúng ta nói  nằm khoảng X ±10¯ hay 95 ≤ μ ≤ 115

Khoảng ước lượng rộng có khả chứa giá trị trung bình thực khoảng ước lượng rộng khoảng X ±100¯ hay 5 ≤ μ ≤ 205 khơng giúp ích cho việc xác định  Như có đánh đổi ước lượng khoảng với phương pháp ước lượng định: khoảng hẹp mức độ tin cậy nhỏ

2.3.3 Phân phối X¯

Theo định lý giới hạn trung tâm X biến ngẫu nhiên có phân phối chuẩn Vì

¯

X có phân phối chuẩn nên cần tìm hai đặc trưng kỳ vọng phương sai

Kỳ vọng X

E ( ¯X ) ¿E(1

n(X1+X2+ +Xn))=

1

n E(∑i=1 n

Xi)=1

n∗nμ=μ

Phương sai X¯

var( ¯X )=var[1

n(X1+X2+⋅+Xn)]=

1

n2var[∑i=1 n

Xi]=1

n2nσx

2 =σx

2

n

Vậy độ lệch chuẩn X¯ σx

n

Từ thông tin này, áp dụng quy tắc 2 xác suất khoảng X ±2¯ σx

n chứa  xấp xỉ

95% Ước lượng khoảng với độ tin cậy 95% cho 

¯

X − 2 σx

n≤ μ ≤ ¯X +2 σxn

105 −210

√100≤ μ ≤105+2 10

√100 ^

θ1=103 ≤ μ ≤ 107= ^θ2

Lưu ý: Mặc dù mặt kỹ thuật ta nói khoảng X ±2¯ σx

n chứa  với xác suất 95%

nhưng khơng thể nói khoảng cụ thể (103; 107) có xác suất chứa  95% Khoảng (103;107) chứa  khơng chứa 

Ý nghĩa xác độ tin cậy 95% cho ước lượng khoảng cho  sau: Với quy

tắc xây dựng khoảng X ±2¯ σx

n tiến hành lấy mẫu với cỡ mẫu n

tính khoảng ước lượng Chúng ta lặp lặp lại trình lấy mẫu ước lượng khoảng khoảng 95% khoảng ước lượng tìm chứa 

Tổng quát hơn, trị thống kê cần ước lượng  và ta tính hai ước lượng 1

^θ2 cho

P(^θ1≤ μ ≤ ^θ1)=1− α với <  <

hay xác suất khoảng từ 1 đến 2 chứa giá trị thật θ 1-thì1- gọi

(20)

Nếu  = 5% 1- 95% Mức ý nghĩa 5% hay độ tin cậy 95% thường sử dụng thống kê kinh tế lượng

Các tính chất đáng mong đợi ước lượng chia thành hai nhóm, nhóm tính chất ước lượng cỡ mẫu nhỏ nhóm tính chất ước lượng cỡ mẫu lớn

2.3.4 Các tính chất ứng với mẫu nhỏ Không thiên lệch(không chệch)

Một ước lượng không thiên lệch kỳ vọng θ . E( ^θ)=θ

Như chứng minh phần trên, X¯ ước lượng khơng thiên lệch 

Hình 2.4 Tính khơng thiên lệch ước lượng

1 ước lượng không thiên lệch  2 ước lượng thiên lệch 

Phương sai nhỏ nhất

Hàm ước lượng 1 có phương sai nhỏ với hàm ước lượng 2

ta có var(^θ1)≤ var (^θ2)

Khơng thiên lệch tốt hay hiệu quả

Một ước lượng hiệu ước lượng khơng thiên lệch có phương sai nhỏ

Hình 2.5 Ước lượng hiệu Hàm ước lượng 2 hiệu 1

Tuyến tính

 ≠ 



  

 

f

  

(21)

Một ước lượng θ gọi ước lượng tuyến tính hàm số tuyến tính quan sát mẫu

Ta có X =¯

n(X1+X2+ +Xn)

Vậy X¯ ước lượng tuyến tính cho 

Ước lượng khơng thiên lệch tuyến tính tốt (Best Linear Unbiased Estimator-BLUE)

Một ước lượng gọi BLUE ước lượng tuyến tính, khơng thiên lệch có phương sai nhỏ lớp ước lượng tuyến tính khơng thiên lệch

θ Có thể chứng minh X¯ BLUE. Sai số bình phương trung bình nhỏ nhất

Sai số bình phương trung bình: MSE( )=E( - θ )2

Sau biến đổi nhận được: MSE( )=var( )+E[E( )- θ ]2

MSE( )=var( )+bias( )

Sai số bình phương trung bình phương sai ước lượng cộng với thiên lệch ước lượng Chúng ta muốn ước lượng thiên lệch đồng thời có phương sai nhỏ Người ta sử dụng tính chất sai số bình phương trung bình nhỏ khơng thể chọn ước lượng khơng thiên lệch tốt

2.3.5 Tính chất mẫu lớn

Một số ước lượng không thoả mãn tính chất thống kê mong muốn cỡ mẫu nhỏ cỡ mẫu lớn đến vô hạn lại có số tính chất thống kê mong muốn Các tính chất thống kê gọi tính chất mẫu lớn hay tính tiệm cận

Tính khơng thiên lệch tiệm cận

Ước lượng gọi không thiên lệch tiệm cận  lim

n →∞E( ^θn

)=θ

Ví dụ 2.12 Xét phương sai mẫu biến ngẫu nhiên X:

1 n

) X x ( s

n

1 i

2

i

x

  

n ) X x ( ˆ

n

1 i

2

i

x

  

Có thể chứng minh

E[sx

2

]=σ2x

E[ ^σ2x]=σx2(1 −1

n)

Vậy sx2 ước lượng không thiên lệch σ2x , σ^2x ước lượng

không thiên lệch tiệm cận 2x

Nhất quán

Một ước lượng ˆ gọi quán xác suất tiến đến giá trị 

khi cỡ mẫu ngày lớn

ˆ quán lim

(22)

f (^θ)

0 

Hình 2.6 Ước lượng quán

Quy luật chuẩn tiệm cận

Một ước lượng ˆ gọi phân phối chuẩn tiệm cận phân phối mẫu tiến

đến phân phối chuẩn cỡ mẫu n tiến đến vô

Trong phần thấy biến X có phân phối chuẩn với trung bình  phương sai 2 X¯ có phân phối chuẩn với trung bình  phương sai 2/n với cỡ

mẫu nhỏ lớn

Nếu X biến ngẫu nhiên có trung bình  phương sai 2 khơng theo phân

phân phối chuẩn X có phân phối chuẩn với trung bình  phương sai 2/n

khi n tiến đến vô Đây định lý giới hạn trung tâm

2.4 Thống kê suy diễn - Kiểm định giả thiết thống kê 2.4.1 Giả thiết

Giả thiết không phát biểu giá trị tham số giá trị tập hợp tham số Giả thiết ngược phát biểu giá trị tham số tập hợp tham số giả thiết không sai Giả thiết không thường ký hiệu H0 giả thiết ngược thường

được ký hiệu H1

2.4.2 Kiểm định hai đuôi

Ví dụ 13 Quay lại ví dụ 11 biến X chi phí cho học tập học sinh tiểu học.

Chúng ta biết phương sai X 2x=100 Với mẫu với cỡ mẫu n=100

tính X1=105 ngàn đồng/học sinh/tháng Chúng ta xem xét khả bác bỏ phát biểu

cho chi phí cho học tập trung bình học sinh tiểu học 106 ngàn đồng/tháng Giả thiết

H0: = 106 = 0

H1: ≠ 106 = 0

N nhỏ N

lớn

(23)

Chúng ta biết X~N(, σ2x /n), với độ tin cậy 95% hay mức ý nghĩa a = 5% chúng

ta xây dựng ước lượng khoảng  n

2

X x

1  

Nếu khoảng khơng chứa  ta bác bỏ giả thiết không với độ tin cậy 95%, ngược lại ta không đủ sở để bác bỏ giả thiết H0

Ở phần tính ước lượng khoảng  dựa theo X¯1

(103;107) Khoảng chứa 0 = 106 Vậy ta bác bỏ giả thiết H0

Khoảng tin cậy mà ta thiết lập được gọi miền chấp nhận, miền giá trị nằm miền chấp nhận gọi miền bác bỏ

Hình 2.7 Miền bác bỏ miền chấp nhận H0

Tổng quát ta có Z= ¯X − μ

σn ~N(0,1) hay Z tn theo phân phối chuẩn hố

Hình 2.8 Miền chấp nhận miền bác bỏ theo  trị thống kê Z

Ta có tất hai miền bác bỏ tính chất đối xứng phân phối chuẩn, mức ý nghĩa  xác suất để Z nằm miền bác bỏ bên trái /2 xác suất để Z nằm miền bác bỏ bên trái /2 Chúng ta đặt giá trị tới hạn bên trái Z/2 giá trị tới hạn bên

phải Z1-/2 Do tính đối xứng ta lại có Z/2 = - Z1-/2

Xác suất để Z nằm hai khoảng tới hạn

Z ZZ 1 

P /2 1 /2 (2.1)

hay

 Z ZZ 1 

P 1 /2 1 /2

Thay Z= ¯X − μ

σn biến đổi chút nhận

(24)

              

  

n Z X n Z X

P 1 /2 1 /2

(2) Các mệnh đề (2.1) (2.2) mệnh đề xác suất

Kiểm định giả thiết thống kê theo phương pháp truyền thống Phát biểu mệnh đề xác suất

P(X − Z¯ 1 −α /2 σ

n≤ μ ≤ ¯X+Z1 −α /2 σ

nμ=μ0)=1 −α

Nguyên tắc định

 Nếu / 1 n Z

X    

hoặc 1 /2 n

Z

X    

thì ta bác bỏ H0 với độ

tin cậy 1- hay xác suất mắc sai lầm 

 Nếu X¯1− Z1 − α/ 2

σ

n≤ μ0≤ ¯X1+Z1 − α/ 2 σ

n ta khơng thể bác bỏ H0

Với mức ý nghĩa  =5% Z1-/2 = Z97,5% = 1,96 ≈

Ta có X¯1− Z1 − α/ 2

σ

n=105−

10

10=103

¯

X1+Z1 − α/ 2

σ

n=105+2

10

10=107

Vậy ta bác bỏ giả thiết Ho

Kiểm định giả thiết thống kê theo trị thống kê Z Phát biểu mệnh đề xác suất

P(Zα /2≤ Z ≤ Z1 −α /2)=1− α

Quy tắc định

 Nếu Ztt= n

X   

< Z/2 Ztt=

¯

X1− μ0

σn > Z1-/2 ta bác bỏ H0 với

độ tin cậy 1- hay xác suất mắc sai lầm 

 Nếu Z/2 ≤ Ztt ≤ Z1-/2 ta khơng thể bác bỏ H0

Với mức ý nghĩa  =5% ta có Z1-/2 = Z97,5% = 1,96 ≈

và Z/2 = Z2,5% = -1,96 ≈ -2

Ztt=

¯

X1− μ0 σn =

105− 106

10√100 =−1

Vậy ta bác bỏ Ho

Kiểm định giả thiết thống kê theo giá trị p

Đối với kiểm định hai đuôi giá trị p tính sau:

p=2 P(|Ztt|<Z)

Với Ztt = -1 ta có P(1<Z) = 0,16, giá trị p = 0,32

Quy tắc định

 Nếu p  : Bác bỏ Ho

 Nếu p ≥ : Không thể bác bỏ Ho

Trong ví dụ p = 0,32 >  = 5% Vậy ta bác bỏ Ho

Ba cách tiếp cận cho kết thực từ biến đổi mệnh đề xác suất Trong kinh tế lượng người ta thường hay sử dụng giá trị p

(25)

Kiểm định trái

Ví dụ 14 Tiếp tục ví dụ 13 Kiểm định phát biểu : “Chi cho học tập trung bình học

sinh tiểu học lớn 108 ngàn đồng/học sinh/tháng”

Giả thiết

H0: > 108 = 0

H1: ≤ 108 = 0

Phát biểu mệnh đề xác suất

P(Z<Z) =1-

Quy tắc định

 Nếu Ztt < Z : Bác bỏ Ho

 Nếu Ztt ≥ Z : Không thể bác bỏ Ho

Với  = 5% ta có Z5% = -1,644

Ta có Ztt = ¯X1− μ0

σn =

105− 108

10√100 =− 3 < Z5% = -1,644 ta bác bỏ Ho

Kiểm định phải

Ví dụ 15 Tiếp tục ví dụ 13 Kiểm định phát biểu : “Chi tiêu cho học tập trung bình của

học sinh tiểu học nhỏ 108 ngàn đồng/học sinh/tháng”

Giả thiết

H0: < 107 = 0

H1: ≥ 107 = 0

Phát biểu mệnh đề xác suất

P(Z<Z1-) =1-

Quy tắc định

 Nếu Ztt > Z : Bác bỏ Ho

 Nếu Ztt ≤ Z : Không thể bác bỏ Ho

Ta có Ztt = ¯X1− μ0

σn =

105− 107

10√100 =−2 < Z5% = -1,644 ta bác bỏ Ho

2.4.4 Một số trường hợp đặc biệt cho ước lượng giá trị trung bình tổng thể

 Tổng thể có phân phối chuẩn, cỡ mẫu lớn, phương sai chưa biết Chiến lược kiểm định giống thay phương sai tổng thể phương sai mẫu

 Tổng thể có phân phối chuẩn, phương sai chưa biết, cỡ mẫu nhỏ:

¯

X − μ0

sn ~ t-stat~t(n-1)

Kiểm định trị thống kê t tương tự trị thống kê Z, ta việc tra t thay cho Z Khi cỡ mẫu đủ lớn trị thống kê t tương tự trị thống kê Z

 Tổng thể không tuân theo phân phối chuẩn, áp dụng định lý giới hạn trung tâm Khi cỡ mẫu đủ lớn trị thống kê t tính tốn phần có phân phối gần với phân phối Z

Ngồi cịn kiểm định giả thiết phương sai, kiểm định phương sai hai tổng thể kiểm định trung bình tổng thể Chúng ta xét kiểm định giả thiết phương sai giả định phương sai không đổi giả định quan trọng phân tích hồi quy

Kiểm định giả thiết phưong sai Xét giả thiết

Ho : σ2

=σ02

H1 : σ2≠ σ

(26)

(n −1)s

σ2~ χ(n −1)

2

Mệnh đề xác suất

χ(n −1 ,α /2)

≤ n −1 P(¿ s

2

σ❑0

2 χ(n −1,1 − α/ 2)

2

)=1− α

Quy tắc định

Nếu (n −1) s

σ❑20

χ(2n −1 , α/ 2)

(n −1) s

σ❑20

χ(2n −1 , α/ 2)

, bác bỏ H0

Nếu χ(n − ,α/ 2)

2 ≤n − 1

¿ s

2

σ❑0

2 χ(n −1,1− α/2 )

2

, khơng bác bỏ H0

Kiểm định phương sai hai tổng thể

Chúng ta có mẫu cỡ n1 từ tổng thể mẫu cỡ n2 từ tổng thể

Xét giả thiết

H0 : σ❑1

2

=σ22=σ2

H1 : σ❑1

2 σ

2

Chúng ta có (n −1)s

σ2~ χ(n −1)

2

Vậy

(n1−1)s1

σ2(n1−1)

(n2−1)s2

σ2(n2−1)

~χ(n1−1)

2

(n1−1)

χ(n

2−1)

2

(n2−1)~ F(n1−1 , n2− 1)

Hay s1

2

s22~ F(n1− 1, n2−1)

Phát biểu mệnh đề xác suất

P(F(n1−1 ,n2− 1, α/ 2)≤ s12 s2

2F(n1−1 ,n2−1,1− α/ 2))=1− α

Quy tắc định

 Nếu s1

2

s22<F(n1−1 ,n2−1 , α/ 2)

s1

s22>F(n1−1 ,n2−1,1 − α/ 2) ta bác bỏ H0  Nếu F(n1− ,n2−1 , α/ 2)≤

s12

s22F(n1− ,n2−1,1− α/ 2) khơng bác bỏ H0

2.4.5 Sai lầm loại I sai lầm loại II

Khi ta dựa vào mẫu để bác bỏ giả thiết, ta mắc phải hai sai lầm sau:

Sai lầm loại I: Bác bỏ Ho thực tế Ho Sai lầm loại II : Khơng bác bỏ Ho thực tế sai

Tính chất

Quyết định H0 H0 sai

Bác bỏ Sai lầm loại I Không mắc sai

lầm Không bác

bỏ

Không mắc sai lầm

(27)

Hình 2.7 Sai lầm loại I-Bác bỏ H0: =108 thực tế H0 đúng.

Xác suất mắc sai lầm loại I

Ví dụ 16 Tiếp tục ví dụ 13 Kiểm định phát biểu : “Chi cho học tập trung bình học

sinh tiểu học 108 ngàn đồng/học sinh/tháng” Trung bình thực  = 0=108

Giả thiết

H0: = 108 = 0

H1: ≠ 108 = 0

Giả sử giá trị  thực =108 Với ước lượng khoảng cho  (103;107) với độ tin cậy 95% bác bỏ H0 thực H0 Xác suất mắc sai lầm loại

này  = 5%

Xác suất mắc sai lầm loại II

Ví dụ 17 Tiếp tục ví dụ 13 Kiểm định phát biểu : “Chi tiêu cho học tập trung bình của

học sinh tiểu học 108 ngàn đồng/học sinh/tháng” Trung bình thực  = 0=104

Giả thiết

H0: = 108 = 0

H1: ≠ 108 = 0

Giả sử giá trị  thực =104 Với ước lượng khoảng cho  (103;107) với độ tin cậy 95% không bác bỏ H0 H0 sai Xác suất mắc sai lầm loại II

là 

Lý tưởng tối thiểu hoá hai loại sai lầm Nhưng muốn hạn chế sai lầm loại I, tức chọn mức ý nghĩa  nhỏ khoảng ước lượng lớn xác suất mắc phải sai lầm loại II lớn Nghiên cứu Newman Pearson6 cho rằng

sai lầm loại I nghiêm trọng sai lầm loại II Do đó, thống kê suy diễn cổ điển kinh tế lượng cổ điển, người ta chọn mức ý nghĩa  hay xác suất mắc sai lầm loại I nhỏ, thông thường 5% mà không quan tâm nhiều đến 

2.4.6 Tóm tắt bước kiểm định giả thiết thống kê

Bước 1.Phát biểu giả thiết H0 giả thiết ngược H1

Bước Lựa chọn trị thống kê kiểm định

Bước Xác định phân phối thống kê kiểm định

Bước Lựa chọn mức ý nghĩa  hay xác suất mắc sai lầm loại I

Bước Sử dụng phân phối xác suất thống kê kiểm định, thiết lập khoảng tin cậy 1-, khoảng gọi miền chấp nhận Nếu trị thống kê ứng với H0 nằm

trong miền chấp nhận ta khơng bác bỏ H0, trị thơng kê ứng với H0 nằm miền

chấp nhận ta bác bỏ H0 Lưu ý bác bỏ H0 chấp nhận mức độ sai lầm  6 Damodar N Gujarati, Basic Econometrics-Third Edition, McGraw-Hill Inc -1995, p 787.

(28)

CHƯƠNG 3

HỒI QUY HAI BIẾN 3.1 Giới thiệu

3.1.1 Khái niệm hồi quy

Phân tích hồi quy tìm quan hệ phụ thuộc biến, gọi biến phụ thuộc vào nhiều biến khác, gọi biến độc lập nhằm mục đích ước lượng tiên đốn giá trị kỳ vọng biến phụ thuộc biết trước giá trị biến độc lập.7

Một số tên gọi khác biến phụ thuộc biến độc lập sau:

Biến phụ thuộc: biến giải thích, biến dự báo, biến hồi quy, biến phản

ứng, biến nội sinh

Biến độc lập: biến giải thích, biến dự báo, biến hồi quy, biến tác nhân hay biến kiểm

soát, biến ngoại sinh

Sau ví dụ phân tích hồi quy

(1) Ngân hàng XYZ muốn tăng lượng tiền huy động Ngân hàng muốn biết mối quan hệ lượng tiền gửi lãi suất tiên gửi, cụ thể họ muốn biết tăng lãi suất thêm 0,1% lượng tiền gửi tăng trung bình

(2) Một nhà nghiên cứu nông nghiệp muốn biết suất tôm sú nuôi hệ thống thâm canh phụ thuộc vào diện tích ao ni, mật độ thả tơm giống, chi phí hố chất xử lý mơi trường, trình độ nhân cơng Từ phân tích hồi quy ông ta đề tiêu kỹ thuật phù hợp cho loại hình

3.1.2 Sự khác dạng quan hệ Quan hệ tất định quan hệ thống kê

Quan hệ tất định loại quan hệ biểu diễn mơt hàm số tốn học Một số quan hệ vật lý, hoá học số ngành khoa học tự nhiên khác quan hệ tất định

Ví dụ định luật Ohm vật lý : gọi U điện áp, R điện trở mạch điện dịng điện I I=U

R , nói cách khác điện áp điện trở cố định trước

chỉ nhận giá trị dòng điện

Đa số biến số kinh tế khơng có quan hệ tất định Thí dụ ta khơng thể nói với diện tích ni tơm cho trước kỹ thuật ni chọn suất Lý có nhiều biến số kể đến mơ hình tác động lên suất, ngồi số biến số vắng mặt có biến khơng thể kiểm sốt thời tiết, dịch bệnh… Nhà nghiên cứu nông nghiệp kể tiên đốn giá trị trung bình suất ứng với kỹ thuật nuôi chọn Quan hệ biến số kinh tế có tính chất quan hệ thống kê

Hồi quy quan hệ nhân quả

(29)

Mặc dù phân tích hồi quy dựa ý tưởng phụ thuộc biến số kinh tế vào biến số kinh tế khác thân kỹ thuật phân tích hồi quy khơng bao hàm quan hệ nhân Một ví dụ điển hình nhầm lẫn hai khái niệm tiến hành hồi quy số vụ trộm thành phố với số nhân viên cảnh sát thành phố Gọi Y số vụ trộm năm X số nhân viên cảnh sát Khi hồi quy Y theo X, tìm mối quan hệ đồng biến Y X có ý nghĩa thống kê phân tích hồi quy cho kết luận: “Tăng số lượng nhân viên cảnh sát làm tăng số vụ trộm” Rõ ràng phân tích sai lầm việc nhận định mối quan hệ nhân Số cảnh sát tăng lên tăng cường lực lượng cảnh sát bối cảnh số vụ trộm tăng lên Vậy phải hồi quy số cảnh sát theo số vụ trộm hay X theo Y.Vậy trước phân tích hồi quy phải nhận định xác mối quan hệ nhân quả.8

Một sai lầm phổ biến phân tích kinh tế lượng quy kết mối quan hệ nhân hai biến số trong thực tế chúng hệ nguyên nhân khác Ví dụ phân tích hồi quy số giáo viên số phịng học tồn ngành giáo dục Sự thực số giáo viên số phòng học phụ thuộc vào số học sinh Như phân tích mối quan hệ nhân dựa vào kiến thức phương pháp luận môn khác khơng từ phân tích hồi quy

Hồi quy tương quan

Phân tích tương quan cho thấy độ mạnh yếu mối quan hệ tuyến tính hai biến số Phân tích tương quan khơng thể mối quan hệ nhân quả.Ví dụ xét quan hệ hai biến số X số bệnh nhân bị xơ gan Y số lít rượu tiêu thụ nước Chúng ta nhận hệ số tương quan cao X Y Hệ số tương quan xác định sau:

rXY=cov (X , Y )

SXSY =

cov (Y , X )

SYSX =rYX

Qua đẳng thức thấy phân tích tương quan vai trị hai biến hai biến ngẫu nhiên

Phân tích hồi quy X theo Y cho ta biết trung bình số bệnh nhân bị xơ gan ứng với lượng tiêu dùng rượu cho trước Chúng ta đảo ngược hồi quy thành Y theo X Phân tích hồi quy dựa giả định biến độc lập xác định biến phụ thuộc ngẫu nhiên Chúng ta tìm giá trị kỳ vọng biến phụ thuộc dựa vào giá trị cho trước của biến độc lập

3.2.Hàm hồi quy tổng thể hồi quy mẫu 3.2.1.Hàm hồi quy tổng thể (PRF)

Ví dụ 3.1 Hồi quy tiêu dùng Y theo thu nhậpX Theo Keynes hàm tiêu dùng sau 9:

Y = 1 + 2X , với 2 xu hướng tiêu dùng biên, 0<2<1.(3.1)

Chúng ta kiểm chứng giả thiết với số liệu từ nước giả định Z có dân số 30 người với số liệu tiêu dùng thu nhậpcủa người đồ thị phân tán sau.10

8 Ramu Ramanathan, Introductory Econometrics with Applications, Harcourt College Publishers-2002, trang 113.

(30)

Thu nhập X (XD) Hình 3.1 Đồ thị phân tán quan hệ tiêu dùng thu nhập khả dụng.

Đồ thị 3.1 cho thấy có mối quan hệ đồng biến tiêu dùng thu nhập khả dụng, thu nhậptăng làm tiêu dùng tăng Tuy quan hệ Y X khơng xác hàm bậc (3.1)

Trong phân tích hồi quy xem biến độc lập X có giá trị xác định biến phụ thuộc Y biến ngẫu nhiên Điều tưởng bất hợp lý Khi chọn ngẫu nhiên người thứ i thu đồng thời hai giá trị: Xi thu nhậpvà Yi tiêu dùng người Vậy lại xem Yi ngẫu nhiên? Câu trả sau : Xét mức thu nhậpXi xác định, cách lấy mẫu chọn ngẫu nhiên số người

có thu nhậplà Xi Thu nhậpgóp phần yếu định tiêu dùng thể hàm số (1.3), nhiên nhiều yếu tố khác tác động lên tiêu dùng nên ứng với cách lấy mẫu với nhiều lần lấy mẫu với tiêu chí X = Xi ta nhận giá trị Yi khác Vậy xác biến phụ thuộc Y biến ngẫu nhiên có điều kiện theo biến độc lập X Ước lượng tốt cho Y trường hợp giá trị kỳ vọng Y ứng với điều kiện X nhận giá trị Xi xác định

Hàm hồi quy tổng thể (PRF): E(Y/X=Xi) = 1 + 2X (3.2)

Đối với quan sát cụ thể giá trị biến phụ thuộc lệch khỏi kỳ vọng toán, vậy: Yi = 1 + 2Xi + i(3.3)

1 2 : tham số mô hình

1 : tung độ gốc

2: độ dốc

Giá trị ước lượng Yi

^

Yi=β1+β2Xi

i : Sai số hồi quy hay gọi nhiễu ngẫu nhiên

Nhiễu ngẫu nhiên hình thành từ nhiều nguyên nhân:

- Bỏ sót biến giải thích

- Sai số đo lường biến phụ thuộc

(31)

- Dạng hàm hồi quy không phù hợp

Dạng hàm hồi quy (3.2) gọi hồi quy tổng thể tuyến tính Chúng ta thảo luận chi tiết thuật ngữ hồi quy tuyến tính cuối chương Hình 3.2 cho ta nhìn trực quan hồi quy tổng thể tuyến tính sai số hồi quy

Thu nhập X (XD) Hình 3.2 Hàm hồi quy tổng thể tuyến tính

3.2.2.Hàm hồi quy mẫu (SRF)

Trong thực tế chúng có số liệu tổng thể mà có số liệu mẫu Chúng ta phải sử dụng liệu mẫu để ước lượng hàm hồi quy tổng thể

Hàm hồi quy mẫu:

^

Yi= ^β1+ ^β2Xi (3.4)

Trong

1 : ước lượng cho 1

2 : Ước lượng cho 2

Đối với quan sát thứ i :

Yi = ^β1 + ^β2 Xi + ei(3.5)

(32)

Thu nhập X (XD) Hình 3.3 Hồi quy mẫu hồi quy tổng thể

3.3.Ước lượng hệ số mơ hình hồi quy theo phương pháp bình phương tối thiểu-OLS11

3.3.1.Các giả định mơ hình hồi quy tuyến tính cổ điển

Các giả định sai số hồi quy sau đảm bảo cho ước lượng hệ số hàm hồi quy tổng thể dựa mẫu theo phương pháp bình phương tối thiểu ước lượng tuyến tính khơng chệch tốt nhất(BLUE)

Giá trị kỳ vọng 0: E[εiX]=0

Phương sai không đổi: var[εiX]=E[εii

2

X]=σ2

Không tự tương quan: cov[εiεjXi, Xj]=E[εiεjXi, Xj]=0

Không tương quan với X: cov[εiXjXi, Xj]=E[εiXjXi, Xj]=0

Có phân phối chuẩn: εi=N (0 , σ

2

)

Ở chương khảo sát hậu giả thiết bị vi phạm

3.3.2.Phương pháp bình phương tối thiểu:

Ý tưởng phương pháp bình phương tối thiểu tìm 1 2 cho tổng

bình phương phần dư có giá trị nhỏ Từ hàm hồi quy (3.5)

ei=Yi− ^Yi=Yi− ^β1− ^β2Xi

Vậy ∑

i=1 n

ei2

=∑

i=1 n

(Yi− ^β1− ^β2Xi)2 (3.6) Điều kiện để (3.6) đạt cực trị là:

(33)

(1)

Y ˆ ˆ X  e

2 ˆ e n i i n

i i i

1 n i i                         (3.7) (2)

Y ˆ ˆ X X e X

2 ˆ

e n

1

i i i

i n

1

i i i

2 n i i                         (3.8) Từ (3.7) (3.8) rút

 Yi nˆ1 ˆ2 Xi

(3.9)

YiXi= ^β1∑Xi+ ^β2∑Xi2 (3.10)

Các phương trình (3.9) (3.10) gọi phương trình chuẩn Giải hệ phương trình chuẩn ta

1=¯Y − ^β2X¯ (3.11)

Thay (3.9) vào (3.8) biến đổi đại số có

2=

i=1 n

(Yi− ¯Y) (Xi− ¯X)

i=1 n

(Xi− ¯X)

2

(3.12)

Đặt xi=Xi− ¯X yi=Yi− ¯Y ta nhận được

      n i i n i i i x x y ˆ (3.13)

3.3.3.Tính chất hàm hồi quy mẫu theo OLS Tính chất tham số ước lượng

(1) 1 2 ứng với mẫu xác định gồm n quan sát (Xi,Yi)

(2) 1 2 ước lượng điểm 1 2 Giá trị 1 2

thay đổi theo mẫu dùng để ước lượng

Tính chất hàm hồi quy mẫu12

(34)

Thu nhập X (XD) Hình 3.4 Đường hồi quy mẫu qua giá trị trung bình liệu

(2) Giá trị trung bình ước lượng giá trị trung bình quan sát biến phụ thuộc: E(Y^)= ¯Y

(3) Giá trị trung bình phần dư 0: E(ei)=0

(4) Các phần dư ei Yi không tương quan với nhau: ∑ i=1 n

eiYi=0

(5) Các phần dư ei Xi không tương quan với nhau: ∑ i=1 n

eiXi=0

3.3.4.Phân phối 1 2 13

Ước lượng 1 2

Kỳ vọng E(1)=β1 E(2)=β2

Phương sai var(1)=

i=1 n

Xi2

ni=1 n

xi2

σ2 var(2)= σ2

i=1 n

xi2

Sai số chuẩn σ

1=√ ∑

i=1 n

Xi

2

ni=1 n

xi

2

σ σ^β

2=

σ

√∑

i=1 n

xi2

13 Có thể tính tốn chứng minh biểu thức dựa vào định nghĩa định lý kỳ vọng phương sai Tham

(35)

Phân phối                    n i i n i i 1 x n X , N ~

ˆ 2~ N

(β2, σ2

i=1 n

xi2)

Hiệp phương sai hai hệ số ước lượng

cov(^β , ^β2)=− ¯X var(2)=− ¯X

(∑σ2

i=1 n

xi2)

Trong biểu thức σ2=var

(εi) với giả định εi~ N (0 , σ

2

) 3.4.Khoảng tin cậy kiểm định giả thiết hệ số hồi quy 3.4.1 Khoảng tin cậy cho hệ số hồi quy

Thực σ2 nên ta dùng ước lượng khơng chệch

2 n e ˆ n i i     

Sai số chuẩn hệ số hồi quy cho độ dốc se(β2)=

^

σ

√∑

i=1 n

xi2

Từ 2~ N(β2, σ^β2

2

) với σ^β2=

σ2

i=1 n

xi

2 ta có

Z =β^2− β2

σβ2 ~ N (0,1) (3.14)

Từ tính chất phương sai mẫu ta có

(n −2)σ^

σ2~ χ❑(n− 2)

(3.15)

Từ (3.14) (3.15) Ta xây dựng trị thống kê

2− β2

σβ2

√(n− 2)σ^

σ2 n −2

~ Z

χn − 2

2

n −2

~t(n −2 )

(3.16)

Biến đổi vế trái

2− β2

σβ2

√(n− 2)σ^

2

σ2

n −2

= 2− β2

σ^2

σ2σβ2

2

= ^

β2− β2

σ^2

σ2

σ2

i=1 n

xi2

=2− β2 se( ^β2)

(36)

^

β2− β2 se(^β2)

~ t(n −2) (3.17)

Chứng minh tương tự ta có

^

β1− β1 se (^β1)

~ t(n −2) (3.18)

Ước lượng khoảng cho hệ số hồi quy với mức ý nghĩa  sau

1−t(n − 2,1 −α /2)se(^β1)≤ β1≤ ^β1+t(n − 2,1 −α /2)se(^β1) (3.19) 2−t(n − 2,1−α /2)se (^β2)≤ β2≤ ^β2+t(n− 2,1−α /2)se (^β2) (3.20)

3.4.2 Kiểm định giả thiết hệ số hồi quy

Chúng ta quan tâm nhiều đến ý nghĩa thống kê độ dốc (2) phương trình hồi quy

hơn tung độ gốc (1) Cho nên từ đến cuối chương chủ yếu kiểm định giả

thiết thống kê độ dốc Giả thiết

H0: β2=β

2

H1: β2≠ β❑2 ❑

Phát biểu mệnh đề xác suất

P(t(n −2 , α/ 2)≤ 2− β2

se(^β2) ≤ t(n− 2,1−α /2))=1 − α

Quy tắc định

 Nếu

^

β2− β❑2 se (^β2)

<t(n − 2, α/ 2) hoặc ^

β2− β❑2 se(^β2)

>t(n − 2,1−α/ 2) thì bác bỏ H0.

 Nếu t(n −2 , α/2 )≤ ^

β2− β❑2 se( ^β2)

≤t(n − 2,1 −α /2) ta khơng thể bác bỏ H0

Quy tắc thực hành-Trị thống kê t phần mềm kinh tế lượng

Trong thực tế thường xét xem biến độc lập X có tác động lên biến phụ thuộc Y

hay không Vậy thực hồi quy kỳ vọng β¿2

¿

0 Mức ý nghĩa hay

dùng phân tích hồi quy =5% Giả thiết

H0: β2=0

H1: β2≠ 0

Trị thống kê trở thành

t-stat = 2

se (^β2)

Quy tắc định

 Nếu /t-stat/ > t(n-2,97,5%) bác bỏ H0

 Nếu /t-stat/ ≤ t(n-2,97,5%) khơng thể bác bỏ H0

Tra bảng phân phối Student thấy bậc tự n 20 trị thống kê t97,5%

thì xấp xỉ

Quy tắc thực hành

 Nếu /t-stat/ > bác bỏ giả thiết 2 =

 Nếu /t-stat/≤ ta bác bỏ giả thiết 2=0

(37)

hồi quy, trị thống kê t, ước lượng khoảng hệ số hồi quy giá trị p14.Sau kết quả

hồi quy tính tốn thủ tục hồi quy vài phần mềm thông dụng

Excel

Kết Regresstion cho liệu ví dụ 3.1 (Chỉ trích phần hệ số hồi quy)

Intercept: Tung độ gốc Coefficients : Hệ số hồi quy

Standard Error : Sai số chuẩn ước lượng hệ số t Stat : Trị thống kê t(n-2)

P-value : Giá trị p

Lower95%: Giá trị tới hạn khoảng ước lượng với độ tin cậy 95% Upper95% : Giá trị tới hạn khoảng ước lượng với độ tin cậy 95%

Bác bỏ H0 /t-stat/ > p-value < 0,05 khoảng (Lower;Upper) không chứa

0.15

Eviews

Thủ tục Make Equation cho kết sau(chỉ trích phần hệ số hồi quy):

Dependent Variable: Y Method: Least Squares

Included observations: 30 after adjusting endpoints

Variable Coefficie

nt ErrorStd Statistict- Prob

C 92.24091 33.6108

9

2.74437

0.010

X 0.611539 0.06771

3

9.03128

0.000 C : Tung độ gốc

Coefficient : Hệ số hồi quy

Std Error : Sai số chuẩn ước lượng hệ số t – Statistic : Trị thống kê t(n-2)

Prob: Giá trị p.Bác bỏ H0 /t-Statistic/ > Prob < 0,05

SPSS

Thủ tục Regression->Linear (Chỉ trích phần hệ số hồi quy) Unstandardiz

ed Coefficients

Standardiz ed Coefficien ts

t Si

g

Model B Std

Error Beta

1 (Const

ant)

92,241 33,611 2,7

44 , 010

X ,612 ,068 ,863 9,0

31 , 000 Constant: Tung độ gốc

Unstandardized Coefficients: Các hệ số hồi quy

(38)

Standardized Coefficients: Các hệ số hồi quy chuẩn hoá16.

t: t-StatSig: Giá trị p

Bác bỏ H0 /t/ >2 Sig < 0,05

3.5 Định lý Gauss-Markov

Với giả định mơ hình hồi quy tuyến tính cổ điển, hàm hồi quy tuyến tính theo phương pháp bình phương tối thiểu ước lượng tuyến tính khơng thiên lệch tốt

Chúng ta không chứng minh đinh lý này.17

3.6 Độ thích hợp hàm hồi quy – R2

Làm đo lường mức độ phù hợp hàm hồi quy tìm cho liệu mẫu Thước đo độ phù hợp mơ hình liệu R2 Để có nhìn trực quan

R2, xem xét đồ thị sau

Hình 3.5 Phân tích độ thích hợp hồi quy

Yi− ¯Y : biến thiên biến phụ thuộc Y, đo lường độ lệch giá trị Yi so với giá trị

trung bình Y ¯

^

Yi− ¯Y : biến thiên Y giải thích hàm hồi quy

ei=Yi− ^Yi : biến thiên Y không giải thích hàm hồi quy hay sai số hồi quy

Trên Xi kỳ vọng ei nhỏ nhất, hay phần lớn biến thiên biến phụ thuộc

được giải thích biến độc lập Nhưng hàm hồi quy tốt phải có tính chất mang tính tổng quát Trong hồi quy tuyến tính cổ điển, người ta chọn tính chất tổng bình phương biến thiên khơng giải thích nhỏ

Ta có

Yi=^Y +ei

Y − ¯Y = ^Y − ¯Y +ei yi= ^yi+ei

Với yi=Y − ¯Y ^yi=^Y − ¯Y

16 Khái niệm nằm ngồi khn khổ giáo trình.

17 Phần chứng minh tính chất phần có Gujarati, Basic Econometrics-3rd Edition, trang 97-98.

Y Y i Y i

X i Yi - Y

Yi - Yi

Yi - Y

X Y

(39)

Vậy ∑

i=1 n

yi2=∑

i=1 n

^yi2+∑

i=1 n

ei2+2∑

i=1 n

^yiei (3.21)

Số hạng cuối (3.21)

Vậy ∑

i=1 n

yi2=∑

i=1 n

^yi2+∑

i=1 n

ei2

Đặt TSS=∑

i=1 n yi , ESS=∑ i=1 n

^yi2 RSS=∑

i=1 n

ei

2

TSS(Total Sum of Squares): Tổng bình phương biến thiên Y

ESS(Explained Sum of Squares): Tổng bình phương phần biến thiên giải thích hàm hồi quy Y

RSS(Residual Sum of Squares) : Tổng bình phương phần biến thiên khơng giải thích hàm hồi quy Y hay tổng bình phương phần dư.Ta có:

TSS = ESS + RSS

Đặt TSS

RSS TSS ESS R2   

R2=

i=1 n

^yi2

i=1 n

yi2

= ^

β22∑ i=1 n

xi2

i=1 n

yi2

= ^β22(

i=1 n

xi2n −1)

(∑

i=1 n

yi2n− 1)

= ^β22Sx

2

S2y

Mặt khác ta có 

     n i i n i i i x x y ˆ Vậy R2 = ( ∑ i=1 n

xiyi)

2

i=1 n

xi2

i=1 n

yi2

=r2X ,Y (3.22)

Vậy hồi quy hai biến R2 bình phương hệ số tương quan

Tính chất R2

(1) 0≤ R2 ≤1 Với R2=0 thể X Y độc lập thống kê R2 =1 thể X Y phụ

thuộc tuyến tính hồn hảo

(2) R2 không xét đến quan hệ nhân quả.

3.7 Dự báo mơ hình hồi quy hai biến

Dựa X0 xác định dự báo Y0

Ước lượng điểm cho Y0 : 2X0

ˆ ˆ

Yˆ   .

Để ước lượng khoảng phải tìm phân phối xác suất Y^

i

Dự báo giá trị trung bình E(YoX= X0)

Từ Yˆ0 ˆ1ˆ2X0

Suy ravar Yˆ0 varˆ1ˆ2X0var ˆ1 X02var ˆ2 2X0covˆ1,ˆ2

(40)

 

   

 

   

 

   

 n

1 i

2 i

2

0

x ) X X ( n Yˆ

var

Dự báo giá trị cụ thể Y0

Từ Y0− ^Y0=(β1− ^β1)+(β − ^β2)X0+e0

Ta có E(Y0− ^Y0)=E(β1− ^β1)+X0E(β − ^β2)+E(e0)=0

và var(Y0− ^Y0)=var(β^ 1)+X0

2 var(β^

2)+2 X0cov(1, ^β2)+var(e0) (3.25)

Số hạng cuối var(e0)=σ

Vậy

X0− ¯X¿

¿ ¿

1+1

n+¿

var(Y0− ^Y0)=σ2¿

(3.26)

Sai số chuẩn dự báo

Cho giá trị Y0 X0− ¯X¿

2

¿

1+1

n+(¿∑i=1 n

xi2¿)1

¿

se(Y^ 0)=σ¿

Khoảng tin cậy cho dự báo

^

Yo±t se( ^Yo)

Nhận xét: X0 lệch khỏi giá trị trung bình dự sai số dự báo lớn

(41)

Hình 3.6 Ước lượng khoảng cho Y0

3.8 Ý nghĩa hồi quy tuyến tính số dạng hàm thường sử dụng 3.8.1 Tuyến tính tham số

Trong mục 3.2.1 đặt yêu cầu để ước lượng theo phương pháp bình phương tối thiểu mơ hình hồi quy phải tuyến tính Sử dụng tính chất hàm tuyến tính phân phối chuẩn phân phối chuẩn, dựa vào giả định chặt chẽ phương pháp bình phương tối thiểu, người ta rút hàm ước lượng tham số hiệu trị thống kê kiểm định

Hồi quy tuyến tính yêu cầu tuyến tính tham số, khơng u cầu tuyến tính biến số

Mơ hình Y =β1+β2

X+ε (3.27)

là mơ hình tuyến tính tham số phi tuyến theo biến số Mơ hình Y1(1 12)X (3.28)

là mơ hình phi tuyến tham số tuyến tính biến số

Hồi quy tuyến tính theo OLS chấp nhận dạng mơ hình tuyến tính tham số (3.27) mà khơng chấp nhận dạng mơ hình phi tuyến tham số (3.28)

3.8.2 Một số mơ hình thơng dụng Mơ hình Logarit kép

Mơ hình logarit kép phù hợp với liệu nhiều lĩnh vực khác Ví dụ đường cầu với độ co dãn khơng đổi hàm sản xuất Cobb-Douglas

Mơ hình đường cầu : Y1X2e(3.29)

Không thể ước lượng mô hình (3.29) theo OLS phi tuyến tham số Tuy nhiên lấy logarit hai vế ta mơ hình

ln(Y )=ln(β1)+β2X +ε (3.30)

X trung bình

Ước lượng khoảng cho Y0

trung bình Ước lượng khoảng cho

Y0

(42)

Đặt Y

=ln(Y ) β❑1

=ln( β1) ta mơ hình

Y

=β1❑+β2X +ε (3.31)

Mơ hình tuyến tính theo tham số nên ước lượng theo OLS

Chúng ta chứng minh đặc tính đáng lưu ý mơ hình độ co dãn cầu theo giá không đổi Định nghĩa độ co dãn: ηD=∂ Y Y

∂ X X= ∂Y ∂ X∗

X Y

Lấy vi phân hai vế (3.30) ta có ∂YY =β2∂ X

X => ηD= ∂Y ∂ X

X Y=β2

Vậy độ co dãn cầu theo giá khơng đổi

Hình 3.8 Chuyển dạng Log-log

Tổng qt, mơ hình logarit kép, hệ số ứng với ln biến số độc lập độ co dãn biến phụ thuộc vào biến độc lập

Mơ hình Logarit-tuyến tính hay mơ hình tăng trưởng

Gọi g tốc độ tăng trưởng, t thời kỳ Mơ hình tăng trưởng sau

1+g¿tY0

Yt=¿ (3.32)

Lấy logarit hai vế (3.32)

) Y ln( ) g ln( t ) Y

ln( t    0 (3.33)

Đặt Yt

=ln(Yt) , 1ln(Y0) và 2 ln(1g)ta mơ hình hồi quy

Yt

=β1+β2t+ε (3.34)

Mơ hình tuyến tính-Logarit (Lin-log)

  

 

 ln(X)

Y 1 2

(3.35)

Mô hình phù hợp với quan hệ thu nhập tiêu dùng hàng hố thơng thường với Y chi tiêu cho hàng hố X thu nhập Quan hệ cho thấy Y tăng theo X tốc độ tăng chậm dần

0 X ln(X)

Y Y = 1X2 ln(Y) ln(Y) = ln(1) + 2ln(X)

0 X ln(X)

(43)

Hình 3.9 Chuyển dạng Lin-log

Mơ hình nghịch đảo hay mơ hình Hyperbol

     

X

Y 1 2

(3.36)

Mơ hình phù hợp cho nghiên cứu đường chi phí đơn vị, đường tiêu dùng theo thu nhập Engel đường cong Philip

Hình 3.10 Dạng hàm nghịch đảo

Phụ lục 3.1.PL Số liệu thu nhập tiêu dùng, XD

STT

Thu nhập khả

dụng Tiêu dùng

X Y

1 173 194

2 361 363

3 355 353

4 366 306

5 581 557

6 382 302

7 633 497

8 406 268

9 375 364

10 267 283

11 783 416

12 515 521

13 705 407

14 493 304

15 367 318

16 159 116

17 492 427

18 827 499

19 111 158

20 452 333

21 688 600

22 327 320

23 647 547

X X X

Y Y Y

  

(44)

24 687 518

25 443 378

26 657 633

27 105 134

28 484 269

29 653 564

30 141 155

CHƯƠNG 4

MƠ HÌNH HỒI QUY TUYẾN TÍNH BỘI 4.1 Xây dựng mơ hình

4.1.1. Giới thiệu

Mơ hình hồi quy hai biến mà nghiên cứu chương thường khơng đủ khả giải thích hành vi biến phụ thuộc Ở chương nói tiêu dùng phụ thuộc vào thu nhập khả dụng, nhiên có nhiều yếu tố khác tác động lên tiêu dùng, ví dụ độ tuổi, mức độ lạc quan vào kinh tế, nghề nghiệp… Vì cần bổ sung thêm biến giải thích(biến độc lập) vào mơ hình hồi quy Mơ hình với biến phụ thuộc với hai nhiều biến độc lập gọi hồi quy bội

Chúng ta xem xét hồi quy tuyến tính bội với mơ hình tuyến tính với tham số, khơng thiết tuyến tính biến số

Mơ hình hồi quy bội cho tổng thể

i i, k k i,

3 i, 2

i X X X

Y      

(4.1)

Với X2,i, X3,i,…,Xk,i giá trị biến độc lập ứng với quan sát i

…k tham số hồi quy

i sai số hồi quy

Với quan sát i, xác định giá trị kỳ vọng Yi

E[Y ∨X ' s]=β1+β2X2, i+β3X3,i+ +βkX (4.2)

4.1.2. Ý nghĩa tham số

Các hệ số  gọi hệ số hồi quy riêng

[Y ∨X's]

∂ Xm =βm (4.3)

k đo lường tác động riêng phần biến Xm lên Y với điều kiện biến số khác

mơ hình khơng đổi Cụ thể biến khác mô hình khơng đổi, giá trị kỳ vọng Y tăng m đơn vị Xm tăng đơn vị

4.1.3. Giả định mơ hình

Sử dụng giả định mơ hình hồi quy hai biến, bổ sung thêm giả định sau: (1) Các biến độc lập mơ hình khơng có phụ thuộc tuyến tính hồn hảo, nghĩa khơng thể tìm số thực (k) cho

λ1+λ2X2 , i+λ3X3

,i+ +λkX =0 với i

Giả định cịn được phát biểu “ khơng có đa cộng tuyến hồn hảo mơ hình”

(2) Số quan sát n phải lớn số tham số cần ước lượng k

(3) Biến độc lập Xi phải có biến thiên từ quan sát qua quan sát khác hay

Var(Xi)>0

4.2 Ước lượng tham số mơ hình hồi quy bội

(45)

Trong thực tế thường có liệu từ mẫu Từ số liệu mẫu ước lượng hồi quy tổng thể

Hàm hồi quy mẫu

Yi= ^β1+ ^β2X2 , i+ ^β3X3,i+ +^βkX +ei (4.4)

ei=Yi− ^Yi=Yi− ^β1− ^β2X2 , i− ^β3X3 ,i− − ^βkX

Với ^βm ước lượng tham số m Chúng ta trông đợi ^βm ước lượng

không chệch m, phải ước lượng hiệu Với số giả định chặt chẽ

như mục 3.3.1 chương phần bổ sung 4.1, phương pháp tối thiểu tổng bình phương phần dư cho kết ước lượng hiệu m

Phương pháp bình phương tối thiểu Chọn …k cho

i=1 n

ei2

=∑

i=1 n

(Yi− ^β1− ^β2X2 ,i− ^β3X3 ,i− − ^βkX)2 (4.5) đạt cực tiểu

Điều kiện cực trị (4.5)

i=1 n

ei2 ∂ β1

=− 2

i=1 n

(Yi− ^β1− ^β2X2 ,i− ^β3X3 ,i− − ^βKX)=0

i=1 n

ei2

∂ β2 =− 2i=1 n

(Yi− ^β1− ^β2X2 ,i− ^β3X3 ,i− − ^βK X)X2 ,i=0

i=1 n

ei2 ∂ βk

=−2

i=1 n

(Yi− ^β1− ^β2X2 ,i− ^β3X3 ,i− − ^βKX)Xk ,i=0

(4.6)

Hệ phương trình (4.6) gọi hệ phương trình chuẩn hồi quy mẫu (4.4)

Cách giải hệ phương trình (4.4) gọn gàng dùng ma trận Do giới hạn chương trình, giảng khơng trình bày thuật tốn ma trận mà trình bày kết tính tốn cho hồi quy bội đơn giản hồi quy ba biến với hai biến độc lập Một số tính chất hồi quy ta thấy hồi quy hai biến độc lập áp dụng cho hồi quy bội tổng quát

4.2.2 Ước lượng tham số cho mơ hình hồi quy ba biến

Hàm hồi quy tổng thể

Yi=β1+β2X2 , i+β3X3 , i+εi (4.7)

Hàm hồi quy mẫu

i i, 3 i, 2

i ˆ ˆ X ˆ X e

Yˆ    

(4.8) Nhắc lại giả định

(1) Kỳ vọng sai số hồi quy 0: E(eiX2 , i, X3 , i)=0

(46)

(3) Phương sai đồng nhất: var(ei)=σ

2

(4) Khơng có tương quan sai số Xm: covei,X2i,covei,X3i,0

(5) Không có đa cộng tuyến hồn hảo X2 X3

(6) Dạng hàm mơ hình xác định cách đắn

Với giả định này, dùng phương pháp bình phương tối thiểu ta nhận ước lượng hệ số sau

1=¯Y − ^β2X¯2− ^β3X¯3 (4.10)

2=(

i=1 n

yix2 , i)(∑ i=1 n

x3 ,i

2

)(∑

i=1 n

yix3 ,i)(∑ i=1 n

x2 ,ix3 ,i)

(∑

i=1 n

x2,i

2

)(∑

i=1 n

x3,i

2

)(∑

i=1 n

x2 ,ix3 ,i)

2 (4.11)

3=

(∑

i=1 n

yix3 ,i)(∑

i=1 n

x2 ,i

)(∑

i=1 n

yix2 , i)(∑

i=1 n

x2 ,ix3 ,i)

(∑

i=1 n

x2,i

2

)(∑

i=1 n

x3,i

2

)(∑

i =1 n

x2 ,ix3 ,i)

2 (4.12)

4.2.3 Phân phối ước lượng tham số

Trong phần quan tâm đến phân phối hệ số ước lựơng ˆ2 3 Hơn tương tự cơng thức xác định hệ số ước lượng nên

chỉ khảo sát ˆ2 Ở trình bày kết quả18

2 ước lượng không chệch : E ˆ2 2(4.13)

 

2 n i i, i, n i i, n i i, n i i, x x x x x ˆ var                               (4.14)

Nhắc lại hệ số tương quan X2 X3 : rX2X3=

i=1 n

x2 ,ix3 ,i

√(∑

i=1 n

x2 ,i2 )√(∑ i=1 n

x3 ,i2 )

Đặt rX2X3 = r23 biến đổi đại số (4.14) ta

    2 23 n i i, 2 r x ˆ var       (4.15)

Từ biểu thức (4.13) (4.15) rút số kết luận sau:

(47)

(1) Nếu X2 X3 có tương quan tuyến tính hồn hảo r232 =1 Hệ var(2) vô lớn hay ta xác định hệ số mơ hình hồi quy

(2) Nếu X2 X3 không tương quan tuyến tính hồn hảo có tương quan

tuyến tính cao ước lượng ˆ2 khơng chệch không hiệu

Những nhận định cho hồi quy nhiều ba biến

4.3 R2

R2 hiệu chỉnh

Nhắc lại khái niệm R2: R2=ESS

TSS=1−

RSS TSS

Một mơ hình có R2lớn tổng bình phương sai số dự báo nhỏ hay nói cách khác độ phù hợp mơ hình liệu lớn Tuy nhiên tính chất đặc trưng quan trọng có xu hướng tăng số biến giải thích mơ hình tăng lên Nếu đơn chọn tiêu chí chọn mơ hình có R2cao, người ta có xu hướng đưa nhiều biến độc lập vào mơ hình tác động riêng phần biến đưa vào biến phụ thuộc khơng có ý nghĩa thống kê

Để hiệu chỉnh phạt việc đưa thêm biến vào mơ hình, người đưa trị thống kê R2 hiệu chỉnh(Adjusted R2 )19

R2=1 −(1− R2)n −1

n− k (4.16)

Với n số quan sát k số hệ số cần ước lượng mơ hình

Qua thao tác hiệu chỉnh biến thực làm tăng khả giải thích mơ hình xứng đáng đưa vào mơ hình

4.4 Kiểm định mức ý nghĩa chung mơ hình

Trong hồi quy bội, mơ hình cho khơng có sức mạnh giải thích tồn hệ số hồi quy riêng phần không

Giả thiết

H0: 2 = 3 = … = k =

H1: Không phải tất hệ số đồng thời không

Trị thống kê kiểm định H0: F=E SS(k-1)

R SS(n-k)~ F(k −1 , n −k)

Quy tắc định

 Nếu Ftt > F(k-1,n-k,) bác bỏ H0

 Nếu Ftt ≤ F(k-1,n-k,) khơng thể bác bỏ H0

4.5 Quan hệ R2 F

F=E SS(k −1)

RSS(n − k)=

(n− k )E SS

(k-1)RSS =

(n− k )E SS (k − 1)(TSS− E SS)

¿ (n − k )E SS/TSS

(k −1)(1 − E SS/TSS)=

(n− k )R2 (k − 1)(1 − R2)=

R2(k − 1) (1− R2)(n− k )

4.6 Ước lượng khoảng kiểm định giả thiết thống kê cho hệ số hồi quy

Ước lượng phương sai sai số

19 Công thức Theil, sử dụng đa số phần mềm kinh tế lượng Một công thức khác Goldberger đề xuất

Modified R2=(1−k

n)R

2

(48)

k n e s n i i      (4.17)

Người ta chứng minh s2 ước lượng không chệch 2, hay   2 s

E   .

Nếu sai số tuân theo phân phối chuẩn (n − k)sε

2

σ2 ~ χ(n− k)

2 .

Ký hiệu s e (^βm)=s^βm=^σ^βm

Ta có trị thống kê

) k n ( m m

m ~t

) ˆ ( e s ˆ     

Ước lượng khoảng cho m với mức ý nghĩa 

) ˆ ( e s t ˆ ) ˆ ( e s t ˆ m ) / , k n ( m m m ) / , k n (

m      

    

(4.18)

Thông thường muốn kiểm định giả thiết H0 biến Xm khơng có tác động riêng

phần lên Y H0 : m =

H1 : m ≠

Quy tắc định

 Nếu /t-stat/ > t(n-k,/2) ta bác bỏ H0

 Nếu /t-stat/≤ t(n-k,/2) ta bác bỏ H0

4.7 Biến phân loại (Biến giả-Dummy variable)

Trong mơ hình hồi quy mà khảo sát từ đầu chương đến dựa biến độc lập biến phụ thuộc biến định lượng Thực mơ hình hồi quy cho phép sử dụng biến độc lập biến phụ thuộc biến định tính Trong giới hạn chương trình xét biến phụ thuộc biến định lượng Trong phần khảo sát mơ hình hồi quy có biến định tính

Đối với biến định tính phân lớp, quan sát rơi vào lớp Một số biến định tính có hai lớp như:

Biến định tính Lớp Lớp

Giới tính Nữ Nam

Vùng Thành

thị thơnNơng

Tơn giáo Có Khơng

Tốt nghiệp đại học

Đã Chưa

Bảng 4.1 Biến nhị phân

Người ta thường gán giá trị cho lớp giá trị cho lớp cịn lại Ví dụ ta ký hiệu S giới tính với S =1 nữ S = nam

Các biến định tính gán giá trị gọi biến giả(dummy variable), biến nhị phân, biến phân loại hay biến định tính

4.7.1 Hồi quy với biến định lượng biến phân loại

Ví dụ 4.1 Ở ví dụ hồi quy tiêu dùng cho gạo theo quy mơ hộ có xem xét

hộ thành thị hay nơng thơn Mơ hình kinh tế lượng sau:

Yi = 1 + 2X i+ 3Di + i(4.19)Y: Chi tiêu cho gạo, ngàn đồng/năm

X : Quy mơ hộ gia đình, người

(49)

Chúng ta muốn xem xét xem có khác biệt tiêu dùng gạo thành thị nông thôn hay không ứng với quy mô hộ gia đình Xi xác định

Đối với hộ nông thôn

E[YiXi, Di=0]=β1+β2Xi (4.20)

Đối với hộ thành thị

E[YiXi, Di=1]=(β1+β3)+β2Xi (4.21)

Vậy chênh lệch tiêu dùng gạo thành thị nông thôn sau

E[YiXi, Di=1]− E[YiXi, Di=0]=β3 (4.22)

Sự khác biệt tiêu dùng gạo thành thị nơng thơn có ý nghĩa thống kê 3 khác khơng có ý nghĩa thống kê

Chúng ta có phương trình hồi quy sau Y = 187 + 508*X - 557*D (4.23)

t-stat [0,5] [6,4] [-2,2] R2 hiệu chỉnh = 0,61

Hệ số hồi quy 3=−557 khác không với độ tin cậy 95% Vậy

bác bỏ khác biệt tiêu dùng gạo thành thị nông thôn

Chúng ta thấy tác động làm cho tung độ gốc phuơng trình hồi quy thành thị nơng thôn sai biệt khoảng 3 = -557 ngàn đồng/năm Cụ thể ứng với

quy mô hộ gia đình hộ thành thị tiêu dùng gạo hộ nông thôn 557 ngàn đồng/năm.Chúng ta thấy điều cách trực quan qua đồ thị sau:

Hình 4.1 Hồi quy với biến định lượng biến phân loại

4.7.2 Hồi quy với biến định lượng biến phân loại có nhiều hai phân lớp

Ví dụ 4.2 Giả sử muốn ước lượng tiền lương định số năm kinh

nghiệm công tác trình độ học vấn Gọi Y : Tiền lương

X : Số năm kinh nghiệm

D: Học vấn Giả sử phân loại học vấn sau : chưa tốt nghiệp đại học, đại học sau đại học

Phuơng án 1:

(50)

Cách đặt biến đưa giả định mạnh phần đóng góp học vấn vào tiền lương người có trình độ sau đại học lớn gấp hai lần đóng góp học vấn người có trình độ đại học Mục tiêu đưa biến D phân loại nên ta không chọn phương án

Phương án 2: Đặt biến giả

D1iD2iHọc vấn

00Chưa đại học 10Đại học 01Sau đại học Mơ hình hồi quy

Yi = 1 + 2X + 3D1i + 4D2i + i(4.24)

Khai triển mơ hình (4.24) sau Đối với người chưa tốt nghiệp đại học E(Yi )= 1 + 2X (4.25)

Đối với người có trình độ đại học E(Yi )= (1 + 3)+ 2X3(4.26)

Đối với người có trình độ sau đại học E(Yi )= (1 + 3+ 4 )+ 2X (4.27)

4.7.3 Cái bẩy biến giả

Số lớp biến phân loạiSố biến giả Trong ví dụ 4.1 21

Trong ví dụ 4.232

Điều xảy xây dựng số biến giả số phân lớp?

Ví dụ 4.3 Xét lại ví dụ 4.1

Giả sử đặt biến sau D1iD2iVùng

10Thành thị 01Nơng thơn Mơ hình hồi quy

Yi = 1 + 2X i+ 3D1i + 4D2i +i(4.28)

Chúng ta xem kết hồi quy Excel Coefficient

s

Standard

Error t Stat

P-value

Intercep

t 2235,533 65535 #NUM!

X 508,1297 80,36980143 6,322396

1,08E-06

D1 -2605,52 65535 #NUM!

D2 -2048 65535 #NUM!

Kết hồi quy bất thường hồn tồn khơng có ý nghĩa kinh tế

Lý có đa cộng tuyến hồn hảo D1, D2 biến X2 =-1 D1i + D2i + X2 = ∀ i

Hiện tượng đa cộng tuyến hoàn hảo làm cho hệ phương trình chuẩn khơng có lời giải Thực tế sai số chuẩn tiến đến vô tiến đến kết tính tốn Excel Hiện tượng gọi bẩy biến giả

Quy tắc: Nếu biến phân loại có k lớp sử dụng (k-1) biến giả

4.7.4 Hồi quy với nhiều biến phân loại

Ví dụ 4.4 Tiếp tục ví dụ 4.2 Chúng ta muốn khảo sát thêm có phân biệt đối xử

(51)

Đặt thêm biến đặt lại tên biến GTi: Giới tính, cho nữ cho nam

TL : Tiền lương

KN: Số năm kinh nghiệm làm việc

ĐH: Bằng tốt nghiệp đại học cho chưa tốt nghiệp đại học SĐH: Bằng có trình độ sau đại học cho chưa

Mơ hình hồi quy TLi = 1 + 2KNi + 3ĐHi + 4SĐHi +5GTi+ i(4.29)

Chúng ta xét tiền lương nữ có trình độ sau đại học E(TLi /SĐH=1∩GT=0)= (1 + 4)+ 2KNi

4.7.5 Biến tương tác

Xét lại ví dụ 4.1 Xét quan hệ tiêu dùng gạo quy mơ hộ gia đình.Để cho đơn giản trình bày sử dụng hàm toán sau

Nông thôn: Y = 1 + 1X

Thành thị: Y = 2 + 2X

D : Biến phân loại, hộ thành thị hộ nơng thơn Có bốn trường hợp xảy sau

(1) 1=2 1= 2, hay khơng có khác biệt tiêu dùng gạo thành thị

nông thôn

Mơ hình : Y = a + b X

Trong 1=2 = a 1= 2 = b

(2) 1≠2 1= 2, hay có khác biệt tung độ gốc

Mơ hình: Y = a + bX + cD

Trong 1 = a, 2 = a + c 1 = 2 = b

(3) 1=2 1≠ 2, hay có khác biệt độ dốc

Mơ hình: Y = a + bX + c(DX)

Trong DX = X nếu D =1 DX = D = 1 = 2 = a , 1 = b 2 = b + c

(4) 1≠2 1≠ 2, hay có khác biệt hoàn toàn tung độ gốc độ dốc

(52)

Hình 4.2 Các mơ hình hồi quy

Biến DX xây dựng gọi biến tương tác Tổng quát Xp

biến định lượng Dq biến giả XpDq biến tương tác Một mơ hình hồi

quy tuyến tổng qt có nhiều biến định lượng, nhiều biến định tính số biến tương tác

CHƯƠNG 5

GIỚI THIỆU MỘT SỐ VẤN ĐỀ LIÊN QUAN ĐẾN MƠ HÌNH HỒI QUY 5.1 Đa cộng tuyến

5.1.1. Bản chất đa cộng tuyến

Đa cộng tuyến hoàn hảo: Các biến X1, X2,…,Xk gọi đa cộng tuyến hoàn hảo

tồn 1, 2, …,k không đồng thời không cho

X1 + X2 + … + kXk =0(5.1)

Hiện tượng đa cộng tuyến hoàn hảo thường xảy nhầm lẫn nhà kinh tế lượng trường hợp bẩy biến giả mà xem xét mục 4.7.3 chương

Hiện tượng đa cộng tuyến mà xét kinh tế lượng hiểu với nghĩa rộng đa cộng tuyến hoàn hảo điều kiện (5.1) Các biến X1, X2,…,Xk gọi đa

cộng tuyến khơng hồn hảo tồn 1, 2, …,k cho

X1 + X2 + … + kXk + =0(5.2)

với  sai số ngẫu nhiên

Chúng ta biểu diễn biến Xi theo biến lại sau Xi= λ1

λi

X2−λ2

λi

X3−⋅ −λk λi

Xk− ε

λi với i ≠ 0.(5.3)

Vậy tượng đa cộng tuyến xảy biến kết hợp tuyến tính biến cịn lại nhiễu ngẫu nhiên

Một số nguyên nhân gây tượng đa cộng tuyến

(1) Khi chọn biến độc lập mối quan có quan hệ nhân hay có tương quan cao đồng phụ thuộc vào điều kiện khác Ví dụ số giường bệnh số bác sĩ đồng thời biến độc lập hồi quy gây tượng đa cộng tuyến gần hoàn hảo

Quy mơ hộ, X

a Mơ hình đồng nhất 

 

Tiêu dùng gạo, Y

Tiêu dùng gạo, Y

Quy mô hộ, X

b Mơ hình song song 

 

 

Quy mơ hộ, X

d Mơ hình phân biệt Tiêu dùng

gạo, Y Tiêu dùng

gạo, Y

 

    

 

   

Quy mô hộ, X

(53)

(2) Khi số quan sát nhỏ số biến độc lập Một ví dụ điển hình nghiên cứu y khoa số lượng nhỏ bệnh nhân lại khảo sát nhiều nhân tố tác động lên hiệu điều trị

(3) Cách thu thập mẫu Ví dụ thu thập mẫu số lớp giới hạn tổng thể (4) Chọn biến Xi có độ biến thiên nhỏ

5.1.2. Hệ đa cộng tuyến

Ví dụ 5.120 Nghiên cứu Klein Golberger(1995) quan hệ tiêu dùng nội địa

C, thu nhập từ lương W, thu nhập khác phi nông nghiệp P thu nhập từ nông nghiệp A kinh tế Hoa Kỳ từ năm 1928 đến 1950, với số liệu năm 1942 đến 1944 bị loại khỏi liệu Klein Golberger thực hồi quy tiêu dùng nội địa theo ba loại thu nhập sau

Ct = 1 + 2Wt + 3Pt + 4A + t(5.4)

Hồi quy gặp phải tượng đa cộng tuyến loại thu nhập có xu hướng tăng theo phát triển kinh tế.

Năm C W P A

1928 52,8

39,2

1 17,73 4,39

1929 62,2

42,3

1 20,29 4,60

1930 58,6

40,3

7 18,83 3,25

1931 56,6

39,1

5 17,44 2,61

1932 51,6

34,0

0 14,76 1,67

1933 51,1

33,5

9 13,39 2,44

1934 54

36,8

8 13,93 2,39

1935 57,2

39,2

7 14,67 5,00

1936 62,8

45,5

1 17,20 3,93

1937 65

46,0

6 17,15 5,48

1938 63,9

44,1

6 15,92 4,37

1939 67,5

47,6

8 17,59 4,51

1940 71,3 50,7 18,49 4,90

(54)

9

1941 76,6

57,7

8 19,18 6,37

1945 86,3

78,9

7 19,12 8,42

1946 95,7

73,5

4 19,76 9,27

1947 98,3

74,9

2 17,55 8,87

1948 100,3

74,0

1 19,17 9,30

1949 103,2

75,5

1 20,20 6,95

1950 108,9

80,9

7 22,12 7,15

Bảng 5.1 Số liệu thu nhập tiêu dùng kinh tế Hoa Kỳ Kết hồi quy sau

^

C =8,133 +1,059W +0,452P +0,121A(5.5) t-Stat(0,91)(6,10)(0,69)(0,11)

Khoảng 95%(-10,78;27,04)(0,69;1,73)(-0,94;1,84)(-2,18;2,43) R2 = 0,95F = 107,07 > F(3,16,99%) = 5,29.

Mơ hình có tính giải thích cao thể qua R2 cao thống kê F cao Tuy nhiên

một số hệ số lại không khác không với ý nghĩa thống kê thể qua t-stat thấp, nghĩa ước lượng khoảng cho hệ số chứa W với hệ số có t-stat lớn ý nghĩa kinh tế lại lạ: thu nhập từ lương tăng USD tiêu dùng tăng 1,059 USD Để tìm hiểu lý gây tượng phải dùng lý thuyết đại số ma trận, minh hoạ mơ hình hồi quy ba biến Phương sai ước lượng hệ số 2

 

 

2

2 23 n

1 i

2 i, 2

r x

1 ˆ

var 

 

Khi X2 X3 có tượng cộng tuyến

2 23

r cao làm cho phương sai ước lượng

2 cao Ước lượng b2 theo phương pháp bình phương tối thiểu trở nên không hiệu

Hệ đa cộng tuyến

(1) Ước lượng hệ số không hiệu phương sai ước lượng lớn Mơ hình có đa cộng tuyến có t-stat nhỏ số hệ số thể có dấu trái với lý thuyết hay có giá trị khơng phù hợp R2 thể độ phù hợp liệu F thể ý nghĩa chung hệ

số cao

(2) Giá trị ước lượng hệ số nhạy cảm việc tăng bớt quan sát loại bỏ biến có mức ý nghĩa thấp

(3) Mặc dù việc phân tích tác động riêng phần biến khó khăn tính xác dự báo cao chất đa cộng tuyến không đổi quan sát

5.1.3 Biện pháp khắc phục

(55)

Nếu mục tiêu phân tích xét tác động riêng phần biến số lên biến phụ thuộc để định sách đa cộng tuyến trở thành vấn đề nghiêm trọng Sau số biện pháp khắc phục

(1) Dùng thông tin tiên nghiệm Ví dụ hồi quy hàm sản xuất Cobb-Douglas Ln(Yi)=1 + 2ln(Ki)+ 3ln(Li) + i (5.6)

Chúng ta gặp tượng đa cộng tuyến K L tăng theo quy mô sản xuất Nếu ta biết hiệu suất không đổi theo quy mô ta có thêm thơng tin 2+3=1 Với

thơng tin tiên nghiệm chuyển mơ hình hồi quy (5.6) thành Ln(Yi)=1 + 2ln(Ki)+ (1-2)ln(Li) + i (5.7)

(2) Bỏ biến có đa cộng tuyến Đây cách làm đơn giản Ví dụ mơ hình có biến giải thích số bác sĩ số giường bệnh ta bỏ biến số giường bệnh Nếu biến bị bỏ thực cần phải có mơ hình lại gặp phải vấn đề khác, ước lượng chệch hệ số lại Vấn đề tiếp tục xem xét cuối chương

(3) Chuyển dạng liệu

Giả sử hồi quy liệu chuỗi thời gian Yt = 1 + 2X2t + 3X3t + t(5.8)

Và gặp phải tượng đa cộng tuyến X1t X3t tăng

giảm theo năm Ta tối thiểu tác động đa cộng tuyến kỹ thuật hồi quy sai phân bậc sau:

Ta có

Yt-1 = 1 + 2X2,t-1 + 3X3,t-1 + t-1(5.9)

Từ (5.8) (5.9) ta xây dựng mô hình hồi quy (Yt -Yt-1 )= 2(X2t-X2,t-1) + 3(X3t- 3X3,t-1 )+ t(5.10)

Với t= t-t-1

Một vấn đề nảy sinh t có tính tương quan chuỗi, không tuân

theo giả định mơ hình hồi quy tuyến tính cổ điển Nếu tượng tương quan chuỗi nghiêm trọng mơ hình (5.10) cịn mơ hình (5.8)

(4) Tăng thêm quan sát Giải pháp thích hợp cho tượng đa cộng tuyến cỡ mẫu nhỏ Đôi cần tăng thêm số quan sát ta khắc phục tượng đa cộng tuyến Một lần lại có đánh đổi Tăng liệu đồng nghĩa với việc tăng chi phí, liệu sơ cấp Mặt khác liệu khơng có kiểm soát, phải biết điều kiện khác tương tự với ta thu thập liệu gốc

Khắc phục tượng đa cộng tuyến đòi hỏi kỹ thuật phức tạp không mang lại hiệu ta mong muốn Mặt khác, hầu hết mơ hình hồi quy bội có tính cộng tuyến định nên phải cẩn thận việc xây dựng mơ hình giải thích kết Chúng ta nghiên cứu nguyên tắc xây dựng mơ hình cuối chương

5.2 Phương sai sai số thay đổi - HETEROSKEDASTICITY 5.2.1. Bản chất phương sai sai số thay đổi

Giả định mơ hình hồi quy tuyến tính cổ điển phương sai sai số hồi quy không đổi qua quan sát Trong thực tế sai số hồi quy tăng lên giảm giá trị biến độc lập X tăng lên Tổng quát, thay cho giả định

E(ei2)=σ2

chúng ta giả định

2 i i) e (

E  (5.11)

(56)

(1) Gọi Y số phế phẩm 100 sản phẩm thợ học việc, X số thực hành Khi số thực hành lớn số phế phẩm nhỏ biến động Chúng ta có trường hợp phương sai giảm dần X tăng dần

(2) Khi thu nhập(X) tăng chi tiêu cho mặt hàng xa xỉ tăng mức biến động lớn Chúng ta có trường hợp phương sai tăng dần X tăng dần

(3) Khi cải thiện phương pháp thu thập số liệu phương sai giảm

(4) Phương sai sai số tăng xuất điểm nằm ngồi, trường hợp bất thường với liệu khác biệt(rất lớn nhỏ so với quan sát khác)

(5) Phương sai thay đổi không xác dạng mô hình, biến quan trọng bị bỏ sót phương sai sai số lớn thay đổi Tình trạng giảm hẳn đưa biến bị bỏ sót vào mơ hình

5.2.2. Hệ phương sai thay đổi sử dụng ước lượng OLS

Xét hồi quy

Yi = 1 + 2X i+ i(5.12)

với 2i

2 i) e (

E 

Sử dụng phương pháp bình phương tối thiểu thơng thường (OLS) có

              n i i n

i i i

2 n i i n

i i i

2 x x x Y x ˆ (5.13)

  n

1 i i n

i i i

2 x ) ( E x ˆ

E 

        

vậy ước lượng theo OLS không chệch

  2

n i i n i i i x x ˆ var             

Chúng ta không chưa rõ OLS có cho ước lượng hiệu hay khơng

Ước lượng bình phương tối thiểu có trọng số (WLS)

Đặt 2i w 2i 2, chia hai vế (5,12) cho wi có mơ hình hồi quy

Yi wi

=β1

wi

+β2Xi

wi

+ εi

wi (5.14)

Ta viết lại mơ hình (5.13) sau

Yi

=β1X1i+β2X2 i❑+εi❑ (5.15)

Mơ hình (5.14) khơng có tung độ gốc phương sai đồng

var(εi❑)=var

(εi wi)=

wi

2

σ2 wi2 =σ

2

(57)

2,WLS=

i=1 n

(XiYi wi2 )∑i=1

n

(w1i2)i=1 n

(Yi wi2)∑i=1

n

(Xi wi2)

i=1 n

(Xi

2

wi

2)∑

i=1 n

(w1i

2)(∑

i=1 n

(Xi wi

2))

2 (5.16)

Ước lượng (5.16) hoàn toàn khác với (5.13) Chúng ta biết ước lượng theo WLS (5.16) ước lượng hiệu ước lượng theo OLS (5.13) không hiệu

Phương sai hệ số ước lượng 2

  n

1 i

2 i n

1 i

2 i i

2

x x ˆ

var

   

 

 

 

 

phần mềm

máy tính báo cáo phương sai var(2)=

σ2

i=1 n

xi2

Từ phương sai sai số bị tính sai trị thống kê t-stat sai số chuẩn hệ số ước lượng phần mềm cung cấp vô dụng

Tóm lại, với diện phương sai sai số thay đổi ước lượng hệ số theo OLS không chệch ước lượng không hiệu trị thống kê t-stat không xác

5.2.3. Phát khắc phục

Phát phương sai sai số thay đổi

Phương pháp đồ thị Xét đồ thị phần dư theo giá trị Y X

(58)

Hình 5.2 Đồ thị phân tán phần dư ei theo Xi

Theo đồ thị giá trị dự báo Y tăng (hoặc X tăng) phần dư có xu hướng tăng, hay mơ hình có phương sai sai số thay đổi

Các phép thử thức

Xét hồi quy bội

i i, k k i,

3 i, 2

i X X X

Y      

(5.17)

Trong (k-1) biến độc lập ta trích (p-1) biến làm biến độc lập cho hồi quy phụ Trong hồi quy phụ phần dư từ hồi quy mô hình(5.17) làm hồi quy biến phụ thuộc

Các dạng hồi quy phụ thường sử dụng

ei2=α1+α2Z2 i+⋅+αpZpi+δi (5.18)

|ei|=α1+α2Z2i+⋅+αpZpi+δi (5.19)

ln(ei2)=α1+α2Z2 i+⋅+αpZpi+δi (5.20)

Kiểm định Breusch-Pagan vào hồi quy phụ (5.18), kiểm định Glejser vào (5.19) kiểm định Harvey-Godfrey vào (5.20)

Giả thiết không phương sai khơng đồng H0 : 2 = 3 = … = p =

H1 : Không phải tất hệ số

R2 xác định từ hồi quy phụ, n cỡ mẫu dùng để xây dựng hồi quy phụ, với cỡ mẫu lớn

thì nR2 tuân theo phân phối Chi bình phương với (p-1) bậc tự

Quy tắc định

Nếu χ(2p − 1,1 −α)≤ nR2 bác bỏ H0

Nếu bác bỏ H0 chấp nhận mơ hình có phương sai sai số thay đổi

và thực kỹ thuật ước lượng mơ sau: Đối với kiểm định Breusch-Pagan

^

wi2=^α1+ ^α2Z2 i+⋅+^αpZpi

Đối với kiểm định Glejser

^

α1+ ^α2Z2 i+⋅+^αpZpi¿2 ^

wi

2 =¿

Đối với kiểm định Harvey-Godfrey

^

(59)

Ta có w^i=√w^i2 Đến chuyển dạng hồi quy theo OLS thông

thường sang hồi quy theo bình phương tối thiểu có trọng số WLS

5.3 Tự tương quan (tương quan chuỗi)

Trong mơ hình hồi quy tuyến tính cổ điển giả định khơng có tương quan phần dư hay E(ij) = với i, j

Trong thực tế liệu chuỗi thời gian, giả định hay bị vi phạm Một lý nơm na biến số kinh tế có qn tính(sức ỳ) định Ví dụ tăng cầu loại hàng hóa năm làm tăng lượng cung nội địa hàng hố vào năm sau, tác động trễ biến độc lập hay biến phụ thuộc thời kỳ t chịu tác động biến độc lập thời kỳ t-1

Đôi kinh tế lại phản ứng nhạy với thay đổi Ví dụ giá mía cao năm làm cho nơng dân đổ xơ trồng mía, sản lượng mía năm sau tăng vọt làm giảm giá mía năm sau, tác động trễ biến phụ thuộc hay giá trị biến phụ thuộc thời kỳ t chịu ảnh hưởng giá trị biến phụ thuộc thời kỳ t-1

Hiện tượng tự tương quan làm cho E(ij) ≠ gây hậu sau

(1) Ước lượng theo OLS không chệch khơng hiệu

(2) Các trị thống kê tính theo OLS khơng hữu ích việc nhận định mơ hình Chúng ta phát hiện tượng tự tương quan cách quan sát đồ thị phần dư mơ hình liệu chuỗi thời gian

(60)

Hình 5.4 Tương quan chuỗi thuận

Chúng ta tiếp tục làm việc với liệu chuỗi xử lý tượng tự tương quan phần sau giáo trình liên quan đến mơ hình dự báo

5.4 Lựa chọn mơ hình

Một yếu tố quan trọng để chọn mơ hình hồi quy chọn dạng hàm Để chọn dạng hàm phải hiểu ý nghĩa mối quan hệ kinh tế biến số Ý nghĩa số loại hàm thông dụng trình bày mục 3.8.2 chương Ở phần xét hậu số dạng xây dựng mơ hình sai chiến lược xây dựng mơ hình kinh tế lượng Chúng ta khơng sâu vào chứng minh kết

5.4.1 Thiếu biến có liên quan chứa biến khơng liên quan.

Xét hai hồi quy sau

Yi=β1+β2X2 i+⋅+βKXKi+ξi (5.21)

Yi=β1+β2X2 i+⋅+βKXKi+β(K +1)XK +1 ,i+⋅ β(K +L)XK + L, i+εi (5.22)

Mơ hình (5.21) có trị thơng kê tương ứng có ký hiệu R mơ hình (5.22) có trị thống kê tương ứng có ký hiệu U

Có hai trường hợp xảy ra:

 Trường hợp 1: Nếu mơ hình (5.22) chọn mơ hình (5.21) nghĩa bỏ sót L biến quan trọng (XK+1, XK+L) Hậu ước lượng hệ số

cho K-1 biến độc lập cịn lại bị chệch, mơ hình tính giải thích cho mục tiêu dự báo vào phân tích sách

 Trường hợp 2: Nếu mơ hình (5.21) chọn mơ hình (5.22), nghĩa đưa vào mơ hình biến khơng liên quan Hậu ước lượng hệ số cho biến quan trọng không chệch không hiệu

5.4.2 Kiểm định so sánh mơ hình (5.21) (5.22) - Kiểm định Wald

Chúng ta muốn kiểm định xem L biến (XK+1, XK+L) có đáng đưa vào mơ hình hay

không

H0: βK +1=βK+2=⋅= βK +L=0

(61)

RSSR−RSSU¿/L

¿

RSSU/(¿n − K − L)~ F

~ F(L, n− K − L)

¿ ¿

Quy tắc dịnh: Nếu F

>F((L, n − K − L),1 −α) ta bác bỏ H0 hay chấp nhận L biến

(XK+1, XK+L) xứng đáng đưa vào mơ hình

5.4.3 Hai chiến lược xây dựng mơ hình

Có hai chiến lược xây dựng mơ hình kinh tế lượng là:

 Xây dựng mơ hình từ đơn giản đến tổng quát: chứa tất biến có liên quan mơ hình loại bỏ dần biến ý nghĩa thống kê nhận mơ hình “tốt nhất”

 Xây dựng mơ hình tổng quát đến đơn giản : Xuất phát từ biến độc lập có quan hệ kinh tế trực tiếp với biến phụ thuộc, tiếp tục bổ sung biến nhận mơ hình “tốt nhất”

Mỗi cách làm có ưu nhược điểm Hiện với cơng cụ máy vi tính, người ta khơng cịn ngại tính tốn mơ hình lớn nhiều nhà kinh tế lượng cho xây dựng mơ hình từ tổng qt đến đơn giản hiệu từ đơn giản đến tổng quát Nét chung hai chiến lược bước phải thực kiểm định Wald

CHƯƠNG 6

DỰ BÁO VỚI MƠ HÌNH HỒI QUY (Đọc thêm)

PHÂN LOẠI CÁC PHƯƠNG PHÁP DỰ BÁO

Có hai nhóm phương pháp dự báo nhóm định tính nhóm định lượng Trong giáo trình chủ yếu sử dụng phương pháp định lượng có kết hợp với phán đốn định tính để dự báo

Các phương pháp dự báo định tính

Các phương pháp dự báo định tính dựa vào phán đoán chủ quan trực giác để đưa dự báo thay cho dựa vào số liệu khứ Phương pháp dự báo định tính hữu ích cho việc dự báo toàn cục số trường hợp mà số liệu q khứ khơng hữu ích cho dự báo

Các phương pháp dự báo định lượng

Các kỹ thuật dự báo định lượng dựa vào việc phân tích số liệu khứ để đưa dự báo Giả định phương pháp nhân tố tác động lên biến dự báo khứ tiếp tục ảnh hưởng đến biến tương lai Vậy dựa vào diễn biến liệu khứ ta dự báo cho tương lai Các phương pháp dự báo định lượng lại chia thành hai nhóm chính: dự báo định lượng mang tính nhân dự báo định lượng mang tính thống kê

Các phương pháp dự báo định lượng mang tính nhân quả

(62)

Các phương pháp dự báo định lượng mang tính thống kê

Nhóm phương pháp dự báo mang tính thống kê quan tâm đến quy luật biến thiên biến cần dự báo khứ để dưa dự báo Biến thiên biến số kinh tế chia thành thành phần: xu hướng, chu kỳ, thời vụ ngẫu nhiên

Nhóm phương pháp dự báo mang tính thống kê lại chia thành hai nhóm - Nhóm thứ phân tích thành phần kết hợp số thành phần riêng biệt nêu như: đường xu hướng, san số mũ, trung bình động

- Nhóm thứ hai sử dụng khái niệm thống kê liệu chuỗi thời gian mà không chia biến động liệu thành thành phần riêng biệt phương pháp luận Box-Jenkins

6.1 Dự báo với mơ hình hồi quy thơng thường

Mơ hình hồi quy

Yt=β1+β2X2 ,t+⋅+βkXk ,t+εt (6.1)

Chỉ số t thời kỳ thứ t

Giả sử mơ hình thoả mãn điều kiện phương pháp ước lượng theo bình phương tối thiểu Các tham số ước lượng từ mơ hình tương ứng ˆ1,ˆ2,,ˆk

Ước đoán tốt cho Yt+1 biết Xi,t+1 là:

^

Yt +1=E(β^1+ ^β2X2, t +1+⋅+^βkXk ,t +1) (6.2) Độ lệch chuẩn ước lượng

Đối với hồi quy hai biến

Xt +1− ¯X¿2

¿

1+1

n+(¿∑i=1 n

xi2¿)1

¿

se(Y^

t+1)=σ¿

(6.3)

Đối với hồi quy bội: công thức phức tạp nằm phạm vi giáo trình

6.2 Tính chất “trễ” liệu chuỗi thời gian hệ đến mơ hình

Khi sử dụng mơ hình (6.1) giả định biến độc lập tác động tức lên biến phụ thuộc biến phụ thuộc chịu tác động biến độc lập Đối với biến số kinh tế giả định thường không Tác động biến độc lập có thành phần tác động tức thời có thành phần tác động trễ Mặt khác, thân biến phụ thuộc có “qn tính” hay “sức ỳ” Có ba nguyên nhân gây “độ trễ” hay “sức ỳ” kinh tế

(1) Nguyên nhân tâm lý

Khi thu nhập người giảm tiêu dùng người khơng giảm thói quen trì mức sống cao Nếu tình hình thu nhập khơng phục hồi thời gian dài, phải học cách chi tiêu tiết kiệm

(2) Nguyên nhân kỹ thuật

Giả sử cầu nội địa mặt hàng tăng lên làm giá mặt hàng tăng Sản lượng nội địa khơng tăng tức thời để tăng sản lượng cần phải có thời gian xây dựng nhà máy, đầu tư máy móc thiết bị đào tạo cơng nhân Doanh nghiệp cịn phải phân tích xem tăng cầu nội địa có mang tính chất lâu dài tức thời

(3) Nguyên nhân định chế

(63)

chúng thể qua số lượt khán giả đến sân số lượt khán giả theo dõi qua truyền hình Số khán giả đến sân tăng lên tác động làm tăng số tiền tài trợ lần ký kết năm sau

Khi có tính chất “trễ” nêu liệu chuỗi thời gian, mô hình (6.1) có sai số hồi quy khơng thỏa mãn điều kiện mơ hình hồi quy tuyến tính cổ điển.(Tại sao?) Từ dự báo theo (6.2) khơng xác

6.3 Mơ hình tự hồi quy

t t t

t X Y

Y      (6.4)

Mơ hình (6.4) cịn gọi mơ hình động thể mối liên hệ giá trị biến phụ thuộc với giá trị khứ

6.4 Mơ hình có độ trễ phân phối

Yt=α+ β0Xt+β1Xt −1+⋅+βkXt − k+εt (6.5)

Trong mơ hình k gọi độ trễ Chúng ta phải xác định độ trễ k

6.4.1 Cách tiếp cận Alt Tinberger21:

Vì Xt xác định không tương quan với t nên Xt-1,Xt-2, …, Xt-k xác định

không tương quan với t Do áp dụng OLS để ước lượng tham số cho

mô hình (6.5) Chúng ta xác định k cách tăng dần độ trễ sau: (1) Hồi quy Yt theo Xt

(2) Hồi quy Yt theo Xt Xt-1…

(k) Hồi quy Yt theo Xt, Xt-1, …, Xt-k

(k+1) Hồi quy Yt theo Xt, Xt-1, …, Xt-(k+1)

Quá trình dừng độ trễ (k+1) (k+2) nhận thấy hệ số ứng với biến trễ khơng có ý nghĩa thống kê đổi dấu

Quá trình vướng phải bốn nhược điểm sau: (1) Khơng có tiên liệu trước độ trễ

(2) Mơ hình có thêm độ trễ bậc tự do, liệu chuỗi thời gian khơng đủ dài ý nghĩa thống kê mơ hình ngày

(3) Các biến giải thích thực chất giá trị biến X theo thời gian, điều gây tương quan biến giải thích mơ hình, tức có tượng đa cộng tuyến Ước lượng tham số mơ hình trường hợp có đa cộng tuyến cho kết xác

(4) Việc xác định độ trễ k mơ hình (6.5) theo cách thức dạng “đào mỏ liệu”

6.4.2 Mơ hình Koyck

Giả định:

(1) Tất hệ số ứng với biến trễ có dấu

(2) Các hệ số tuân theo cấp số nhân giảm dần: βk=β0λk với <  <

Chúng ta viết lại mơ hình (6.5) sau

Yt=α+ β0Xt+β0λXt −1+β0λ

Xt −2+⋅+εt (6.6)

Tương tự

1 t

t 2 t t

t X X X

Y          (6.7)

Nhân (6.7) với 

λYt − 1=αλ + β0λXt −1+β0λ2Xt − 2+β0λ3Xt −3+⋅+εt − 1 (6.8)

Lấy (6.6) trừ (6.7)

(64)

1  X ( ) Y

Yt   t1    0 t  t  t1 (6.9)

Kết cuối

  t t t

t X Y

Y       (6.10)

Với γt=εt− λεt −1 , γt gọi trung bình trượt t t-1

Mơ hình (6.10) gọi mơ hình chuyển dạng Koyck Chúng ta chuyển mơ hình trễ phân phối thành mơ hình tự hồi quy

6.4.3 Mơ hình kỳ vọng thích nghi

Giả sử mơ hình xác định cầu tiền có dạng sau22

t * t

t X

Y    (6.11)

Y : Cầu tiền

X*: Giá trị kỳ vọng23 lãi suất danh nghĩa

: Sai số hồi quy

Lãi suất kỳ vọng năm nay(năm t) quan sát cách trực tiếp mà xác định sau

) X X ( X

X *

1 t t *

1 t *

t      với <  ≤

Biểu thức hàm ý kỳ vọng người ta thay đổi(thích hợp) theo lãi suất thực tế, hay nói cách khác người ta học hỏi từ sai lầm

* t t

*

t X (1 )X

X      (6.12)

Thay (6.12) vào (6.11)

Yt=β0+β1[γXt+(1− γ) Xt − 1❑ ]+εt

Qua số phép biến đổi tương tự mơ hình Koyck ta có

Yt=γβ0+γβ1Xt+(1− γ)Yt − 1+γt (6.13)

Với γt=εt−(1 −γ )εt −1

6.4.4 Mơ hình hiệu chỉnh phần

Mơ hình hiệu chỉnh phần phù hợp với phân tích hồi quy có độ trễ lý kỹ thuật định chế

Giả sử mức đầu tư tư tối ưu ứng với mức sản lượng X cho trước Y* Mơ hình hồi quy đơn giản Y* theo X sau:

Yt

=β0+β1Xt+εt (6.14)

Thực tế không trực tiếp quan sát Yt

Giả định Yt

xác định sau:

Yt−Yt −1=δ(Yt−Yt −1) với <  ≤ (6.15)

Trong

I Y

Yt  t1  : Thay đổi lượng tư thực tế, đầu tư kỳ

1 t *

t Y

Y   : Thay đổi lượng tư mong muốn

Từ (6.14) và(6.15) sau vài phép biến đổi nhận

Yt=δβ0+δβ Xt+(1− δ)Yt −1+δεt (6.17)

Một lần lại nhận mơ hình tự hồi quy

6.5 Ước lượng mơ hình tự hồi quy

Trong ba mơ hình vừa xét, nhận mơ hình cuối có dạng tự hồi quy

Koyck:

22 P.Cagan, “The Monetary Dynamics of Hyperinflations”, in M.Friedman (ed.), “Studies in the Quantity Theory of Money”, University of Chicago Press, 1956.

(65)

Yt=α (1 − λ )+ β0Xt+λYt − 1+(εt−λεt − 1) (6.18)

Kỳ vọng thích nghi

Yt=γβ0+γβ1Xt+(1− γ)Yt − 1+[εt−(1− γ )εt −1] (6.19)

Hiệu chỉnh phần

Yt=δβ0+δβ Xt+(1− δ)Yt −1+δεt (6.20)

Dạng chung ba mơ hình

Yt=α0+α1Xt+α2Yt − 1+γt (6.21)

Có hai vấn đề cần lưu tâm mơ hình (6.21):

(1) Thứ nhất, có diện biến ngẫu nhiên biến độc lập, Yt-1

Điều vi phạm điều kiện mơ hình hồi quy tuyến tính cổ điển (2) Thứ hai, có khả xảy tượng tương quan chuỗi

Để tránh hệ bất lợi Yt-1 gây người ta sử dụng biến thay cho Yt-1 với

đặc tính biến tương quan mạnh với Yt-1 không tương quan với Xt Biến độc lập

có đặc tính vừa kể gọi biến công cụ24

6.6 Phát tự tương quan mơ hình tự hồi quy

Trị thống kê h

  var ˆ2 

n

n ˆ

h

 

 

(6.22)

Trong đó: n = cỡ mẫu; var(α^2) = phương sai hệ số ước lượng Yt-1

ˆ hệ số tự tương quan mẫu bậc xác định từ công thức

t=¿

^

ρ=t=1 n

^

εtε^t −1

¿

n ^εt2

(6.23)

h có phân phối chuẩn hố tiệm cận Từ phân phối chuẩn hố có P(-1,96 < h < 1,96) = 0,95

Quy tắc định:

 Nếu h < -1,96, bác bỏ H0 cho mơ hình khơng có tự tương quan bậc

nghịch

 Nếu h > 1,96, bác bỏ H0 cho mơ hình khơng có tự tương quan bậc

thuận

 Nếu -1,96 < h < 1,96: bác bỏ H0 cho khơng có tự tương

quan bậc

24 N.Levitan có đề xuất dùng X

t-1 làm biến công cụ cho Yt-1 dề xuất hệ phương trình chuẩn đặc biệt cho ước lượng

(66)

CHƯƠNG 7

CÁC MƠ HÌNH DỰ BÁO MANG TÍNH THỐNG KÊ (Tham khảo) 7.1 Các thành phần liệu chuỗi thời gian

Các thành phần liệu chuỗi thời gian

a Xu hướng

b Chu kỳ

c Thời vụ

d Ngẫu nhiên

7.1.1 Xu hướng dài hạn

Xu hướng dài hạn thể tăng trưởng giảm sút biến số theo thời gian với khoảng thời gian đủ dài Một số biến số kinh tế có xu hướng tăng giảm dài hạn

e Tốc độ tăng dân số Việt Nam có xu hướng giảm

f Tỷ trọng nơng nghiệp GDP Việt Nam có xu hướng giảm

g Mức giá có xu hướng tăng

7.1.2 Chu kỳ

Các số liệu kinh tế vĩ mơ thường có tăng giảm có quy luật theo chu kỳ kinh tế Sau thời kỳ suy thoái kinh tế thời kỳ phục hồi bùng nổ kinh tế, tăng trưởng kinh tế chựng lại khỏi đầu cho suy thoái Tuỳ theo kinh tế mà chu kỳ kinh tế có thời hạn năm, năm hay 10 năm

7.1.3 Thời vụ

Biến động thời vụ biến số kinh tế thay đổi lặp lặp lại từ năm sang năm khác theo mùa vụ Biến động thời vụ xảy khí hậu, ngày lễ, phong tục tập quán…Biến động thời vụ có tính ngắn hạn với chu kỳ lặp lại thường năm

7.1.4 Ngẫu nhiên

(67)

Hình 7.1 Xu hướng thời vụ25

Hình 7.2 Chu kỳ ngẫu nhiên-Tăng trưởng kinh tế Hoa Kỳ giai đoạn 1961-1999 Nguồn : World Development Indicator CD-Rom 2000, World Bank

7.2 Dự báo theo đường xu hướng dài hạn 7.2.1 Mơ hình xu hướng tuyến tính

Chúng ta sử dụng mơ hình xu hướng tuyến tính tin biến Y tăng lượng không đổi đơn vị thời gian

Tính thời vụ Xu hướng dài

hạn

Chu kỳ 10 năm

(68)

^

Yt=β1+β2t (7.1) dạng

^

Yn+ k=Yn+β2k (7.2)

Ứng với liệu hình 7.2, phương trình đường xu hướng gt = 3,6544- 0,029t

Với gt = tốc độ tăng trưởng GDP Hoa Kỳ, tính %

t = năm xét- 1991

Dự báo tốc độ tăng trưởng kinh tế cho năm 2000 g2000 = 3,6544 – 0,029*(2000 – 1961) = 2,52 %

7.2.2 Mô hình xu hướng dạng mũ

Chúng ta sử dụng hàm mũ cho có tỷ lệ tăng trưởng cố định đơn vị thời gian

^

Yt=αe βt

(7.3) chuyển dạng

t ln ) ln( ) Yˆ

ln( t    (7.4)

Mơ hình xu hướng dạng mũ dùng để dự báo dân số, sản lượng, nhu cầu lượng… Hình 7.3 cho thấy dân số Việt Nam có dạng hàm mũ với phương trình ước lượng sau:

Yt = 33,933e0,0214n

Từ dạng hàm (7.3), kết (7.4) cho thấy tốc độ tăng dân số Việt Nam thời kỳ 1960-1999 khoảng 2,14 %

Hình 7.3 Dân số Việt Nam giai đoạn 1960-1999

Nguồn : World Development Indicator CD-Rom 2000, World Bank

7.2.3 Mơ hình xu hướng dạng bậc hai ^

Yt=β1+β2t+β3t2 (7.5)

(69)

- Nếu 2 âm 3 dương: Y giảm sau tăng

- Nếu 2 dương 3 âm: Y tăng tốc độ tăng giảm dần sau đạt cực trị

bắt đầu giảm

7.3 Một số kỹ thuật dự báo đơn giản 7.3.1 Trung bình trượt (Moving Average)

Giá trị dự báo trung bình m giá trị trước

) Y Y

Y ( m

1

Yˆt  t1 t2  tm

(7.6)

Một lưu ý làm trơn chuỗi liệu kỹ thuật trung bình trượt mơ hình giảm (m-1) bậc tự Chúng ta tạm gác lại việc thảo luận số số hạng m mơ hình trung bình trượt (7.6)

7.3.2 San số mũ (Exponential Smoothing Method)26

Ý tưởng mơ hình san số mũ tương tự mơ hình kỳ vọng thích nghi mà xét chương Giá trị dự báo không phụ thuộc vào giá trị giai đoạn trước mà phụ thuộc giá trị dự báo giai đoạn trước

^

Yt=αYt −1+(1− α) ^Yt −1 (7.7.a)

) Yˆ Y ( Yˆ

Yˆt  t1 t1 t1 (7.7.b)

-  gần dự báo gần với giá trị gần nhất,  gần dự báo gần với dự báo gần Trong thực tế người ta thử với giá trị  khác nhau, giá trị chọn giá trị làm cho sai số dự báo bình phương trung bình(MSE) mơ hình nhỏ

- Có thể dùng trung bình đến số để làm giá trị dự báo đầu tiên27.

7.3.3 Tự hồi quy (Autoregression)

Giá trị dự báo xác định từ mơ hình tự hồi quy với m độ trễ

m t n

t t

t Y Y Y

Yˆ        (7.8)

Trong mô hình (7.7) có số 0 khơng có 0 Trường hợp có 0 ứng với liệu

có xu hướng dài hạn tăng giảm, trường hợp khơng có 0 ứng với liệu có tính

dừng28

7.4 Tiêu chuẩn đánh giá mơ hình dự báo

Gọi Yˆt giá trị dự báo cho Yt Sai số dự báo t = Yt - Yˆt

Hai tiêu chuẩn thường sử dụng để đánh giá so sánh mô hình dự báo

Sai số dự báo tuyệt đối trung bình(Mean absolute deviation-MAD)

n Yˆ Y MAD

n

1 t

t t

  

(7.9)

Sai số dự báo bình phương trung bình(Mean squared error-MSE)

26 Phương pháp dự báo gọi phương pháp Holt.

(70)

MSE=

t=1 n

(Yt− ^Yt)2

n

(7.10)

Mô hình tốt mơ hình có MAD MSE nhỏ

7.5 Một ví dụ số

Sử dụng số liệu giá bắp cải đến tháng 12/1992(hình7.1), lập mơ hình dự báo giá bắp cải dự báo cho tháng năm 1993

Mơ hình 1: Lin

Xu hướng tuyến tính: Y^

t=α0+α1k với k số thứ tự thời kỳ t Mơ hình 2: MA

Trung bình trượt: Y^

t=

Yt −1+Yt − 2 Mơ hình 3: Holt

Phuơng pháp Holt: Yˆt Yˆt1(Yt1 Yˆt1) với  = 0,6 Mơ hình 4: AR

Tự hồi quy: Y^

t=β0+β1Yt − 1+β2Yt −2

Sau ước lượng hệ số mơ hình dựa số liệu đến hết 1992(trong mẫu), ước lượng cho giai đoạn trước 1993(trong mẫu) 1993(ngoài mẫu) Chúng ta vẽ đồ thị dãy số liệu dự báo số liệu gốc hình 7.5

Kết tính tốn sai số mơ sau: Trong mẫu:

Mơ hình Lin MA Holt AR

MSE mẫu,

đồng^2 2.733 157 2.216 59.629

Ngồi mẫu

Mơ hình Lin MA Holt AR

MSE dự báo, đồng^2 429.043 245.417 216.134 260.392

(71)

Hình 7.4 Các phương pháp dự báo đơn giản

7.6 Giới thiệu mô hình ARIMA 7.6.1 Tính dừng liệu

Q trình ngẫu nhiên(Stochastic process)

Bất liệu chuỗi thời gian tạo trình ngẫu nhiên Một dãy số liệu thực tế cụ thể giá bắp cải tháng hình 7.1 kết trình ngẫu nhiên Đối với liệu chuỗi thời gian, có khái niệm tổng thể mẫu sau:

- Quá trình ngẫu nhiên tổng thể

- Số liệu thực tế sinh từ trình ngẫu nhiên mẫu

Tính dừng(Stationary)

Một trình ngẫu nhiên gọi có tính dừng có tính chất sau: - Kỳ vọng khơng đổi theo thời gian, E(Yt) = 

- Phương sai không đổi theo thời gian, Var(Yt) = E(Yt-) = 2

- Đồng phương sai phụ thuộc khoảng cách độ trễ mà không phụ thuộc thời điểm tính đồng phương sai đó, k = E[(Yt-)(Yt-k-)] khơng phụ thuộc t

Lưu ý: Chúng ta biến liệu chuỗi thời gian từ khơng có tính dừng thành có tính dừng cách lấy sai phân nó.

wt = Yt-Yt-1: Sai phân bậc nhất

wt

2

=wt− wt −1 : Sai phân bậc hai…

7.6.2 Hàm tự tương quan hàm tự tương quan mẫu

Hàm tự tương quan(ACF) độ trễ k ký hiệu ρk định nghĩa sau:

ρk=γk

γ0=

E[(Yt− μ)(Yt −k− μ)] E[(Yt− μ)

2

] (7.11)

(72)

- ρk khơng có thứ nguyên.

- Giá trị ρk nằm -1

Trong thực tế có số liệu thực tế kết q trình ngẫu nhiên, chúng tính tốn hàm tự tương quan mẫu(SAC), ký hiệu rk

rk=^γk ^

γ0 với

^

γk=∑(Yt− ¯Y )(Yt − k− ¯Y )

n

Yt− ¯Y¿

2

¿ ¿

∑¿

^

γ0=¿

Độ lệch chuẩn hệ số tự tương quan mẫu

s(rj) = √1+2∑i=1 j − 1

ri2

n

(7.12)

Trị thống kê t

tk = rk

s (rk) (7.13)

Với cỡ mẫu lớn tk ~ Z nên với t > 1,96 rk khác khơng có ý nghĩa thống kê,

người ta gọi rk đỉnh

Các phần mềm kinh tế lượng tính tốn cho kết SAC giá trị đến hạn(hoặc trị thống kê t) ứng với mức ý nghĩa  = 5%

Thống kê Ljung-Box

LB=n(n+2)

k=1 m

( rk2

n− k)~ χm

2

(7.14)

n cỡ mẫu

m chiều dài độ trễ

H0: Tất rk

H1: Không phải tất rk

Nếu LB > χm , 1− α

2

ta bác bỏ H0

Một số phần mềm kinh tế lượng có tính tốn trị thống kê LB

7.6.3 Hàm tự tương quan riêng phần (PACF)

Hệ số tự tương quan riêng phần với độ trễ k đo lường tương quan Yt-k với Yt sau

loại trừ tác động tương quan tất các độ trễ trung gian Cơng thức tính PACF sau

rkk=

rk−j=1 k −1

rk − , jrk − j

1 −

j=1 k− 1

rk − j , jrj

(7.15)

Độ lệch chuẩn rkk29 s (rkk)=

n (7.16)

Trị thống kê t

29 Công thức tính độ lệch chuẩn r

kk phụ thuộc vào bậc sai phân Cơng thức trình bày công thức gần

(73)

tkk= rkk

s (rkk) (7.17)

Với cỡ mẫu lớn tkk~ Z nên với tkk> 1,96 rkk khác khơng có ý nghĩa thống kê,

đó người ta gọi rkk đỉnh

Các chương trình kinh tế lượng tính tốn cho giá trị PACF, giá trị tới hạn hay trị thống kê t

7.6.4 Mơ hình AR, MA ARMA

Xét q trình ngẫu nhiên có tính dừng với liệu chuỗi thời gian Yt có E(Yt) =  sai

số ngẫu nhiên t có trung bình phương sai 2(nhiễu trắng)

Mơ hình tự hồi quy (AR-Autoregressive Model)

Mơ hình tự hồi quy bậc p ký hiệu AR(p) có dạng

(Yt− μ)=α1(Yt −1− μ)+α2(Yt −2− μ)+⋅+αp(Yt − p− μ)+εt

Yt=μ(1 −α1− α2−⋅− αp)+α1Yt − 1+α2Yt − 2+⋅+αpYt − p+εt (7.17)

Nhận dạng mơ hình AR(p): PACF có đỉnh đến độ trễ p SAC suy giảm nhanh

sau độ trễ thứ mơ hình dự báo có dạng tự hồi quy bậc p

Mơ hình trung bình trượt(MA-Moving average Model)

Mơ hình trung bình trượt bậc q ký hiệu MA(q) có dạng

Yt=μ+εt+β1εt −1+⋅+βqεt −q (7.18)

với  số, t nhiễu trắng

Nhận dạng mơ hình MA(q): SAC có đỉnh đến độ trễ q SPAC suy giảm nhanh sau độ trễ thứ

Mơ hình kết hợp tự hồi quy kết hợp trung bình trượt(ARMA)

Mơ hình có tự hồi quy bậc p trung bình trượt bậc q ký hiệu ARMA(p,q) có dạng

Yt=δ+α1Yt − 1+α2Yt −2+⋅+αpYt − p+εt+β1εt −1+⋅+ βqεt − q (7.19)

Nhận dạng mơ hình ARMA(p,q): SAC SPAC có giá trị giảm dần theo hàm mũ Nhận dạng p q đòi hỏi phải có nhiều kinh nghiệm Trong thực hành người ta chọn vài mơ hình ARMA lựa chọn mơ hình tốt

7.6.5 Mơ hình ARIMA SARIMA ARIMA

Đa số liệu kinh tế theo chuỗi thời gian khơng có tính dừng(stationary) mà có tính kết hợp(integrated) Để nhận liệu có tính dừng, phải sử dụng sai phân liệu

Các bậc sai phân

Sai phân bậc I(0): liệu gốc Yt

Sai phân bậc I(1): wt = Yt – Yt-1

Sai phân bậc I(2): w2

t = wt – wt-1…

Sai phân bậc d ký hiệu I(d)

Mơ hình ARMA(p,q) áp dụng cho I(d) gọi mơ hình ARIMA(p,d,q)

SARIMA

Trong mơ hình ARIMA tính tốn sai phân bậc với độ trễ lớn để khử tính mùa vụ sau wt = Yt – Yt-s, với s số kỳ mùa mơ hình gọi

SARIMA hay ARIMA có tính mùa vụ

7.6.6 Phương pháp luận Box-Jenkins

Phương pháp luận Box-Jenkins cho mơ hình ARIMA có bốn bước sau:

Bước 1: Xác lập mơ hình ARIMA(p,d,q)

(74)

- Triển khai dạng mơ hình

Bước 2: Tính tốn tham số mơ hình.

Trong số dạng ARIMA đơn giản dùng phương pháp bình phương tối thiểu Một số dạng ARIMA phức tạp đòi hỏi phải sử dụng ước lượng phi tuyến Chúng ta lo lắng việc ước lượng tham số phần mềm kinh tế lượng tính giúp Quay lại bước xây dựng mơ hình với cặp (p,q) khác dường phù hợp Giả sử ước lượng m mơ hình ARIMA

Bước 3: Kiểm tra chẩn đốn

So sánh mơ hình ARIMA ước lượng với mơ hình truyền thống(tuyến tính, đường xu hướng, san số mũ,…) mơ hình ARIMA với để chọn mơ hình tốt

Bước 4: Dự báo

Trong đa số trường hợp mơ hình ARIMA cho kết dự báo ngắn hạn đáng tin cậy phương pháp dự báo Tuy nhiên giới hạn của ARIMA là:

- Số quan sát cần cho dự báo phải lớn

- Chỉ dùng để dự báo ngắn hạn

- Không thể đưa yếu tố thay đổi có ảnh hưởng đến biến số cần dự báo thời kỳ cần dự báo vào mơ hình

Xây dựng mơ hình ARIMA theo phương pháp luận Box-Jenkins có tính chất nghệ thuật khoa học, kỹ thuật khối lượng tính tốn lớn nên địi hỏi phải có phần mềm kinh tế lượng chuyên dùng

MỘT SỐ GIÁ TRỊ Z THƯỜNG ĐƯỢC SỬ DỤNG

0 0,05 0,1 0,15 0,2 0,25 0,3 0,35 0,4 0,45

-4 -3 -2 -1 0 1 2 3 4

Z f(Z)

Z1-

0 0,05 0,1 0,15 0,2 0,25 0,3 0,35 0,4 0,45

-4 -3 -2 -1 0 1 2 3 4

Z f(Z)

 

Z Z1-

(75)

nghĩa 1 đuôi 2 đuôi

 Z Z

1% 2,326 2,576

5% 1,645 1,960

10% 1,282 1,645

20% 0,842 1,282

Nguồn: hàm Normsinv Excel.

MỘT SỐ GIÁ TRỊ t THƯỜNG ĐƯỢC SỬ DỤNG

t f(t)



t1- 

t

Bậc tự do

Mức ý nghĩa 

1% 5% 10% 20%

 63,656 12,706 6,314 3,078

2 9,925 4,303 2,920 1,886

3 5,841 3,182 2,353 1,638

4 4,604 2,776 2,132 1,533

5 4,032 2,571 2,015 1,476

6 3,707 2,447 1,943 1,440

7 3,499 2,365 1,895 1,415

8 3,355 2,306 1,860 1,397

(76)

10 3,169 2,228 1,812 1,372

11 3,106 2,201 1,796 1,363

12 3,055 2,179 1,782 1,356

13 3,012 2,160 1,771 1,350

14 2,977 2,145 1,761 1,345

15 2,947 2,131 1,753 1,341

16 2,921 2,120 1,746 1,337

17 2,898 2,110 1,740 1,333

18 2,878 2,101 1,734 1,330

19 2,861 2,093 1,729 1,328

20 2,845 2,086 1,725 1,325

21 2,831 2,080 1,721 1,323

22 2,819 2,074 1,717 1,321

23 2,807 2,069 1,714 1,319

24 2,797 2,064 1,711 1,318

25 2,787 2,060 1,708 1,316

26 2,779 2,056 1,706 1,315

27 2,771 2,052 1,703 1,314

28 2,763 2,048 1,701 1,313

29 2,756 2,045 1,699 1,311

30 2,750 2,042 1,697 1,310

>30 2,576 1,960 1,645 1,282

Nguồn: hàm Tinv Excel.

MỘT SỐ GIÁ TRỊ F TỚI HẠN TRÊN THƯỜNG ĐƯỢC SỬ DỤNG

Mức ý nghĩa  = 5%

df1

df2 1 2 3 4 5 6 7 8 9 10

10 4,96 4,10 3,71 3,48 3,33 3,22 3,14 3,07 3,02 2,98 11 4,84 3,98 3,59 3,36 3,20 3,09 3,01 2,95 2,90 2,85

(77)

12 4,75 3,89 3,49 3,26 3,11 3,00 2,91 2,85 2,80 2,75 13 4,67 3,81 3,41 3,18 3,03 2,92 2,83 2,77 2,71 2,67 14 4,60 3,74 3,34 3,11 2,96 2,85 2,76 2,70 2,65 2,60 15 4,54 3,68 3,29 3,06 2,90 2,79 2,71 2,64 2,59 2,54 16 4,49 3,63 3,24 3,01 2,85 2,74 2,66 2,59 2,54 2,49 17 4,45 3,59 3,20 2,96 2,81 2,70 2,61 2,55 2,49 2,45 18 4,41 3,55 3,16 2,93 2,77 2,66 2,58 2,51 2,46 2,41 19 4,38 3,52 3,13 2,90 2,74 2,63 2,54 2,48 2,42 2,38 20 4,35 3,49 3,10 2,87 2,71 2,60 2,51 2,45 2,39 2,35 21 4,32 3,47 3,07 2,84 2,68 2,57 2,49 2,42 2,37 2,32 22 4,30 3,44 3,05 2,82 2,66 2,55 2,46 2,40 2,34 2,30 23 4,28 3,42 3,03 2,80 2,64 2,53 2,44 2,37 2,32 2,27 24 4,26 3,40 3,01 2,78 2,62 2,51 2,42 2,36 2,30 2,25 25 4,24 3,39 2,99 2,76 2,60 2,49 2,40 2,34 2,28 2,24 26 4,23 3,37 2,98 2,74 2,59 2,47 2,39 2,32 2,27 2,22 27 4,21 3,35 2,96 2,73 2,57 2,46 2,37 2,31 2,25 2,20 28 4,20 3,34 2,95 2,71 2,56 2,45 2,36 2,29 2,24 2,19 29 4,18 3,33 2,93 2,70 2,55 2,43 2,35 2,28 2,22 2,18 30 4,17 3,32 2,92 2,69 2,53 2,42 2,33 2,27 2,21 2,16 31 4,16 3,30 2,91 2,68 2,52 2,41 2,32 2,25 2,20 2,15 32 4,15 3,29 2,90 2,67 2,51 2,40 2,31 2,24 2,19 2,14 33 4,14 3,28 2,89 2,66 2,50 2,39 2,30 2,23 2,18 2,13 34 4,13 3,28 2,88 2,65 2,49 2,38 2,29 2,23 2,17 2,12 35 4,12 3,27 2,87 2,64 2,49 2,37 2,29 2,22 2,16 2,11 36 4,11 3,26 2,87 2,63 2,48 2,36 2,28 2,21 2,15 2,11 37 4,11 3,25 2,86 2,63 2,47 2,36 2,27 2,20 2,14 2,10 38 4,10 3,24 2,85 2,62 2,46 2,35 2,26 2,19 2,14 2,09 39 4,09 3,24 2,85 2,61 2,46 2,34 2,26 2,19 2,13 2,08 40 4,08 3,23 2,84 2,61 2,45 2,34 2,25 2,18 2,12 2,08

Nguồn: hàm Finv Excel.

MỘT SỐ GIÁ TRỊ  TỚI HẠN TRÊN THƯỜNG ĐƯỢC SỬ DỤNG

Mức ý nghĩa  = 5%

(78)

df 1% 5% 10% 20%

2 9,21 5,99 4,61 3,22

3 11,34 7,81 6,25 4,64

4 13,28 9,49 7,78 5,99

5 15,09 11,07 9,24 7,29

6 16,81 12,59 10,64 8,56

7 18,48 14,07 12,02 9,80

8 20,09 15,51 13,36 11,03

9 21,67 16,92 14,68 12,24

10 23,21 18,31 15,99 13,44

11 24,73 19,68 17,28 14,63

12 26,22 21,03 18,55 15,81

13 27,69 22,36 19,81 16,98

14 29,14 23,68 21,06 18,15

15 30,58 25,00 22,31 19,31

16 32,00 26,30 23,54 20,47

17 33,41 27,59 24,77 21,61

18 34,81 28,87 25,99 22,76

19 36,19 30,14 27,20 23,90

20 37,57 31,41 28,41 25,04

21 38,93 32,67 29,62 26,17

22 40,29 33,92 30,81 27,30

23 41,64 35,17 32,01 28,43

24 42,98 36,42 33,20 29,55

25 44,31 37,65 34,38 30,68

26 45,64 38,89 35,56 31,79

27 46,96 40,11 36,74 32,91

28 48,28 41,34 37,92 34,03

29 49,59 42,56 39,09 35,14

30 50,89 43,77 40,26 36,25

31 52,19 44,99 41,42 37,36

32 53,49 46,19 42,58 38,47

33 54,78 47,40 43,75 39,57

34 56,06 48,60 44,90 40,68

35 57,34 49,80 46,06 41,78

36 58,62 51,00 47,21 42,88

37 59,89 52,19 48,36 43,98

38 61,16 53,38 49,51 45,08

39 62,43 54,57 50,66 46,17

40 63,69 55,76 51,81 47,27

Nguồn: Hàm Chiinv Excel TÀI LIỆU THAM KHẢO

1) PGS.TS Vũ Thiếu, TS Nguyễn Quang Dong, TS Nguyễn Khắc Minh Kinh tế lượng

NXB Khoa học Kỹ thuật Hà nội-1996 2) TS Bùi Phúc Trung

Giáo trình Kinh tế lượng

Trường Đại học Kinh tế TP Hồ Chí Minh-2001 3) TS Nguyễn Thống

Kinh tế lượng ứng dụng

NXB Đại học Quốc gia TP Hồ Chí Minh-2000 4) TS Nguyễn Quang Dong

(79)

5) TS Nguyễn Quang Dong Kinh tế lượng nâng cao

NXB Khoa học kỹ thuật-2002 6) Loan Lê

Hệ thống dự báo điều khiển kế hoạch định NXB Thống Kê-2001

7) Lê Thanh Phong

Hướng dẫn sử dụng SPSS for Windows V.10 Đại học Cần Thơ-2001

8) PGS Đặng Hấn Xác suất thống kê NXB Thống kê-1996 9) PGS Đặng Hấn Bài tập xác suất thống kê NXB Thống kê-1996

10) Nguyễn Đình Trí, Tạ Văn Dĩnh Nguyễn Hồ Quỳnh Toán học cao cấp

NXB Giáo Dục-1998 11) Đỗ Cơng Khanh Giải tích biến

Tủ sách Đại học đại cương TP Hồ Chí Minh-1997 12) Đỗ Cơng Khanh

Giải tích nhiều biến

Tủ sách Đại học đại cương TP Hồ Chí Minh-1997 13) Bùi Văn Mưa

Logic học

Đại học Kinh tế TP Hồ Chí Minh-1998

14) Cao Hào Thi, Lê Nguyễn Hậu, Tạ Trí Nhân, Võ Văn Huy Nguyễn Quỳnh Mai Crystal Ball- Dự báo phân tích rủi ro cho người sử dụng bảng tính

Chương trình giảng dạy kinh tế Fulbright Việt nam-1995 15) Đoàn Văn Xê

Kinh tế lượng

Đại học Cần thơ 1993

16) Ban biên dịch First News EXCEL toàn tập

Nhà Xuất Bản Trẻ-2001 17) TS.Phan Hiếu Hiền

Phương pháp bố trí thí nghiệm xử lý số liệu(Thống kê thực nghiệm) NXB Nông Nghiệp 2001

18) Chris Brooks

Introductory Econometrics for Finance Cambridge University Press-2002 19) A.Koutsoyiannis

Theory of Econometrics-Second Edition ELBS with Macmillan-1996

20) Damodar N Gujarati

Basic Econometrics-Second Edition McGraw-Hill Inc -1988

21) Damodar N Gujarati

(80)

McGraw-Hill Inc -1995 22) Damodar N Gujarati

Basic Econometrics-Student solutions manual to accompany McGraw-Hill Inc-1988

23) Ernst R Berndt

The Practice of Econometrics: Classic and Contemporary MIT-1991

24) William E Griffiths, R Carter Hill, George G.Judge Learning and Practicing Econometrics

John Wiley & Sons-1993 25) Daniel Westbrook

Applied Econometrics with Eviews

Fulbright Economics Teaching Program-2002 26) Ramu Ramanathan

Introductory Econometrics with Applications Harcourt College Publishers-2002

27) Robert S.Pindyck and Daniel L.Rubinfeld

Econometric Models and Economics Forcasts-Third Edition McGraw-Hill Inc-1991

28) Kwangchai A.Gomez and Arturo A.Gomez Statistical Procedures for Agricultural Research John Wiley & Sons-1983

29) Chandan Mukherjee, Howard White and Marc Wuyts Data Analysis in Development Economics

Draft -1995

30) Aswath Damodaran

Ngày đăng: 23/12/2020, 16:06

Từ khóa liên quan

Tài liệu cùng người dùng

  • Đang cập nhật ...

Tài liệu liên quan