MỤC LỤC MỤC LỤC 1 MỞ ĐẦU 2 1. Cơ sở lí luận về phân tích tương quan và hồi quy 6 1.1. Khái niệm và mục tiêu phân tích tương quan và hồi quy 6 1.2. Nội dung phân tích tương quan và hồi quy 6 1.3. Mô hình phân tích 6 1.3.1. Các dạng mô hình hồi quy 6 1.3.2. Hệ số xác định bội và hệ số tương quan 7 1.3.3.Các kiểm định của bài toán 9 1.4. Công cụ phân tích tương quan và hồi quy 10 1.5.Một ví dụ cụ thể về bài toán tương quan và hồi quy 10 2.Ứng dụng của phần mềm SPSS trong giải bài toán hồi quy và tương quan kinh tế 11 2.1.Giới thiệu về phần mềm 11 2.2. Ứng dụng của SPSS trong phân tích tương quan và hồi quy kinh tế 13 2.3. Phân tích kết quả 19 3.Ứng dụng của phần mềm Mfit3 trong giải bài toán tương quan và hồi quy kinh tế 21 3.1. Giới thiệu phần mềm Mfit3 21 3.2.Ứng dụng phần mềm Mfit3 trong phân tích tương quan và hồi quy kinh tế. 22 3.3. Phân tích kết quả 33 4.Ứng dụng phần mềm EViews giải bài toán tương quan và hồi quy kinh tế 36 4.1.Giới thiệu về phần mềm EViews 36 4.2.Ứng dụng phần mềm EViews giải bài toán tương quan và hồi quy kinh tế (ứng dụng Eviews 8) 37 4.3.Phân tích kết quả: 42 5.Ứng dụng phần mềm Microsoft Excel trong giải bài toán tương quan và hồi quy kinh tế 46 5.1.Giới thiệu phần mềm Microsoft Excel 46 5.2. Ứng dụng phần mềm Microsoft Excel trong phân tích tương quan và hồi quy kinh tế. 47 5.3.Phân tích kết quả 50 KẾT LUẬN 55 Tài liệu trích dẫn 56
Trang 1MỤC LỤC
MỤC LỤC 1
MỞ ĐẦU 2
1 Cơ sở lí luận về phân tích tương quan và hồi quy 6
1.1 Khái niệm và mục tiêu phân tích tương quan và hồi quy 6
1.2 Nội dung phân tích tương quan và hồi quy 6
1.3 Mô hình phân tích 6
1.3.1 Các dạng mô hình hồi quy 6
1.3.2 Hệ số xác định bội và hệ số tương quan 7
1.3.3.Các kiểm định của bài toán 9
1.4 Công cụ phân tích tương quan và hồi quy 10
1.5.Một ví dụ cụ thể về bài toán tương quan và hồi quy 10
2.Ứng dụng của phần mềm SPSS trong giải bài toán hồi quy và tương quan kinh tế 11
2.1.Giới thiệu về phần mềm 11
2.2 Ứng dụng của SPSS trong phân tích tương quan và hồi quy kinh tế 13
2.3 Phân tích kết quả 19
3.Ứng dụng của phần mềm Mfit3 trong giải bài toán tương quan và hồi quy kinh tế .21 3.1 Giới thiệu phần mềm Mfit3 21
3.2.Ứng dụng phần mềm Mfit3 trong phân tích tương quan và hồi quy kinh tế 22
3.3 Phân tích kết quả 33
4.Ứng dụng phần mềm EViews giải bài toán tương quan và hồi quy kinh tế 36
4.1.Giới thiệu về phần mềm EViews 36
4.2.Ứng dụng phần mềm EViews giải bài toán tương quan và hồi quy kinh tế (ứng dụng Eviews 8) 37
4.3.Phân tích kết quả: 42
5.Ứng dụng phần mềm Microsoft Excel trong giải bài toán tương quan và hồi quy kinh tế 46
5.1.Giới thiệu phần mềm Microsoft Excel 46
5.2 Ứng dụng phần mềm Microsoft Excel trong phân tích tương quan và hồi quy kinh tế 47
5.3.Phân tích kết quả 50
KẾT LUẬN 55
Tài liệu trích dẫn 56
Trang 2cụ đó để có thể ứng dụng một cách triệt để.
*Ở trong nước:
Ở Việt Nam, có nhiều giáo trình của môn học Tin học ứng dụng được các trường đại học[2],[3], trường cao đẳng khối ngành kinh tế biên soạn làm tài liệu cho học tập và nghiên cứu ứng dụng công nghệ thông tin ở các lĩnh vực kinh tế và quản trị doanh nghiệp Nhưng những giáo trình này thường viết tương đối rộng, hướng dẫn ứng dụng công nghệ thông tin cho nhiều lĩnh vực chứ chưa đi nghiên cứu sâu cho một bài toán
cụ thể
Ngoài ra, còn có các tài liệu hướng dẫn sử dụng các phần mềm nêu trên [1], [4] Thực chất, đó là bản dịch của các tài liệu hướng dẫn sử dụng mà các nhà cung cấp phần mềm nêu trên ban hành, nhưng được dịch một cách ngắn gọn, không đầu đủ các thông tin cần thiết khi cần nghiên cứu sâu một công cụ nào đó
Việc giải bài toán phân tích tương quan hồi quy cần có sự kêt hợp của sự nắm vững cơ
sở lí luận của bài toán và các công cụ ứng dụng để giải quyết chúng trong kinh tế Một tài liệu với sự kết hợp như vậy thì hiện nay trên thế giới cũng như Việt Nam chưa có.Như vậy, từ tổng quan các công trình nghiên cứu trong và ngoài nước, có thể thấy rõ, chưa có một công trình nghiên cứu nào hệ thống hóa toàn bộ các phần mềm hiện nay đang được sử dụng trong phân tích tương quan và hồi quy cũng như đánh giá ưu nhược điểm của mỗi phần mềm và điều kiện áp dụng của mỗi phần mềm
2
Trang 3 Tính cấp thiết của đề tài
- Sự phát triển như vũ bão của khoa học công nghệ thông tin với nhiều phần mềmtiện ích ra đời giúp con người giảm đáng kể thời gian, giảm công thức cho các phéptính toán và phân tích.Việc áp dụng những phần mềm hiện đại trở thành một nhu cầutất yếu trong thống kê nói chung và toán thống kê nói riêng
- Hiện có rất nhiều phần mềm có thể được sử dụng trong phân tích tương quan vàhồi quy Mỗi phần mềm có những nét đặc trưng riêng, cách sử dụng riêng, điều kiện
áp dụng riêng và ưu nhược điểm riêng.Vì vậy, nếu hệ thống hóa được các phần mềmnày sẽ giúp người sử dụng dễ dàng lựa chọn phần mềm phù hợp khi cần giải quyết cácbài toán phân tích tương quan và hồi quy
- Một phần mềm có thể được sử dụng để giải quyết một bài toán và ngược lại,một bài toán có nhiều phần mềm có thể sử dụng để giải Các phần mềm khi được cungcấp trên thị trường đều đã có bản hướng dẫn sử dụng cũng như các tài liệu giáo trìnhhướng dẫn ứng dụng cho giải bài toán cụ thể Tuy nhiên, chưa có một công trìnhnghiên cứu nào hệ thống hóa các phần mềm có thể sử dụng trong phân tích tương quan
và hồi quy
Chính vì tính cấp thiết trên của đề tài là lí do nhóm tác giả thực hiện nghiên cứu
về ứng dụng của các phần mềm trong giải các bài toán hồi quy tương quan Mỗi phầnmềm có những tính năng riêng và có thể sử dụng cho tính toán, giải quyết nhiều vấn đềkhác nhau.Với việc giải bài toán phân tích tương quan và hồi quy,nhóm tác giả lựachọn nghiên cứu về các phần mềm như: MFIT3, SPSS, Microsoft Excel, E-View giúpngười sử dụng ứng dụng để giải bài toán nhanh và chính xác hơn
Trang 4 Mục tiêu của đề tài
Mục tiêu nghiên cứu của đề tài nhằm giới thiệu cách sử dụng một số phần mềmtiện ích có thể sử dụng trong phân tích tương quan và hồi quy từ đó giúp người sửdụng dễ dàng lựa chọn phần mềm phù hợp
Đối tượng, phạm vi nghiên cứu
3.1.Đối tượng nghiên cứu
- Cơ sở lí luận của các bài toán tương quan và hồi quy
- Các phần mềm SPSS, MFIT3, Microsoft Excel, E-View
3.2.Phạm vi nghiên cứu
Các phần mềm trên tương đối lớn và nhiều công cụ khác nhau để có thể ứngdụng trong nhiều lĩnh vực và giải nhiều bài toán khác nhau.Trong phạm vi nghiên cứucủa đề tài, nhóm tác giả chỉ tập trung nghiên cứu sử dụng công cụ của những phầnmềm trên để giải bài toán phân tích tương quan và hồi quy
Phương pháp nghiên cứu của đề tài
+ Phương pháp nghiên cứu lí luận được sử dụng để nghiên cứu các vấn đề cơ sở lí luậncủa bài toán phân tích tương quan và hồi quy: các bước giải bài toán, lập bài toán, xácđịnh các biến số và các tham số của bài toán, các kiểm định của bài toán
+ Nghiên cứu cách thức sử dụng các công cụ của các phần mềm tiện ích, sử dụngphương pháp phân tích, so sánh để đánh giá ưu nhược điểm của mỗi phần mềm vàđiều kiện áp dụng
+ Sử dụng phương pháp tổng hợp các kết quả phân tích để giúp người sử dụng cónhững lựa chọn tối ưu khi tìm kiếm công cụ cho giải bài toán phân tích tương quan vàhồi quy
Nội dung nghiên cứu của bài toán
Nội dung 1: Nghiên cứu cơ sở lí luận về phân tích tương quan và hồi quy: Dạng bài
toán, mô hình phân tích và các biến trong mô hình, các kiểm định của bài toán
Nội dung 2: Nghiên cứu sử dụng công cụ phân tích tương quan và hồi quy của phần
mềm SPSS
Nội dung 3: Nghiên cứu sử dụng công cụ phân tích tương quan và hồi quy của phần
mềm Mfit3
4
Trang 5Nội dung 4: Nghiên cứu sử dụng công cụ phân tích tương quan và hồi quy của phần
mềm EViews
Nội dung 5: Nghiên cứu sử dụng công cụ phân tích tương quan và hồi quy của phần
mềm Microsoft Excel
Nội dung 6: Tổng hợp các công cụ phân tích tương quan và hồi quy của các phần
mềm trên, chỉ ra ưu nhược điểm và điều kiện áp dụng của mỗi phần mềm
Trang 61 Cơ sở lí luận về phân tích tương quan và hồi quy
1.1 Khái niệm và mục tiêu phân tích tương quan và hồi quy
a) Khái niệm về phân tích hồi quy và phân tích tương quan
- Phân tích hồi quy là việc phân tích mối liên hệ phụ thuộc của một biến (biếnphụ thuộc) với một hay nhiều biến khác (biến độc lập) nhằm ước lượng hoặc dự báogiá trị trung bình của biến phụ thuộc hoặc sự biến động của biến phụ thuộc với sự thayđổi của biến độc lập [Trích dẫn Bài giảng Kinh tế lượng- Nguyễn Quang Dong]
VD: Chi tiêu của người tiêu dùng đối với một hàng hóa phụ thuộc vào thu nhập của họ
và thị hiếu với hàng hóa đó…
-Phân tích tương quan là nghiên cứu mức độ kết hợp tuyến tính giữa hai biến cótính chất đối xứng nhau, giữa các biến độc lập và các biến phụ thuộc có mối quan hệnhân quả
VD: Mức độ quan hệ giữa nghiện thuốc lá và ung thư phổi, giữa số lượng sản phẩmsản xuất thêm với chi phí cận biên để sản xuất thêm sản phẩm đó
b) Mục tiêu phân tích tương quan và hồi quy
Để biết được mối quan hệ giữa các chỉ tiêu trong kinh tế, ước lượng được mức
độ phụ thuộc hay mức độ liên hệ giữa các chỉ tiêu thông qua việc xây dựng các môhình
1.2 Nội dung phân tích tương quan và hồi quy
- Sử dụng phương pháp bình phương tối thiểu, tìm một đường nào đó phản ánh đúngnhất xu thế biến động sao cho độ lệch của đường đó với điểm thực tế là nhỏ nhất
- Từ các chỉ tiêu kinh tế - xã hội xây dựng mối quan hệ giữa các chỉ tiêu đó thông quacác mô hình phân tích, từ đó:
+ Ước lượng giá trị trung bình của biến phụ thuộc với các giá trị cho trước của biếnđộc lập
+ Kiểm định giả thiết về bản chất của sự phụ thuộc
1.3 Mô hình phân tích
Một chỉ tiêu kinh tế có thể có mối liên hệ với một hay nhiều chỉ tiêu kinh tế khác, vì vậy ta có thể xây dựng nhiều mô hình với các biến khác nhau:
1.3.1 Các dạng mô hình hồi quy
a) Mô hình hồi quy tuyến tính hai biến tổng thể ( mô hình hồi quy đơn): Khi biến
6
Trang 7phụ thuộc vào một biến độc lập khác, mô hình có dạng:
Y i = β 1 + β 2 X i + u i
Trong đó:
- β1, β2 là các tham số chưa biết (hệ số hồi quy) với:
β1 là hệ số tự do,phản ánh giá trị trung bình của biến phụ thuộc Y khi không cótác động của biến độc lập X
β2 là hệ số góc, cho biết mức độ thay đổi về giá trị trung bình của biến phụthuộc Y khi biến độc lập X thay đổi 1 đơn vị
- Yi là giá trị trung bình của biến phụ thuộc Y với biến độc lập Xi
- ui là sai số ngẫu nhiên, biểu thị ảnh hưởng của các biến độc lập khác
Vấn đề là phải tìm Y^i= ^β1+ ^β2Xi , xác định được các hệ số ^β1, ^β2 là các ước lượng gần
đúng của β1, β2 vì trong thực tế chúng ta không thể xác định chính xác được giá trịthực của các chỉ tiêu
b) Mô hình hồi quy tuyến tính ba biến tổng thể: Khi biến phụ thuộc Y có mối liên hệ
với 2 biến độc lập, mô hình có dạng:
Y i = β 1 + β 2 X 2i + β 3 X 3i + u i
Các biến được giải thích tương tự như trên,cần xác định được các hệ số ^β1, ^β2, ^β3 là
các ước lượng gần đúng của β1, β2, β3
c) Mô hình hồi quy tuyến tính k biến tổng thể: Khi biến Y phụ thuộc vào nhiều biến
độc lâp khác,mô hình hồi quy có dạng:
Y i = β 1 + β 2 X 2i +…+ β k X ki + u i
Trong đó:
Yi : là giá trị của biến phụ thuộc Y ở quan sát thứ i
β1 : hệ số tự do (hệ số chặn)
βj : j= 2 , k : các hệ số hồi quy riêng´
X2i, X3i, ¸Xki : các biến độc lập
ui : yếu tố ngẫu nhiên
Khi đó hàm hồi quy tổng thể có dạng:
^
Yi= ^β1+ ^β2X2i+ …+ ^βkXki
Trong đó: ^β1, ^β2,…, ^βk là các ước lượng của β1, β2,…,βk
1.3.2 Hệ số xác định bội và hệ số tương quan
a) Hệ số xác định bội R2
Trang 8Gọi TSS= ∑ (Yi - Y´)2 ESS= ∑ (Y^i - Y´)2 RSS= ∑ ( Yi- Y^i) 2
Trong đó: -TSS là tổng bình phương của tất cả các sai lệch giữa các giá trị quan sát Y
và giá trị trung bình của chúng Y´
-ESS là tổng bình phương của tất cả các sai lệch giữa giá trị của biến phụthuộc Y với giá trị trung bình của chúng
-RSS là tổng bình phương của tất cả các sai lệch giữa các giá trị quan sát
Y và các giá trị nhận được từ hàm hồi quy
Ta có:
R2= ESS/ TSS hoặc R2= 1- (RSS/ TSS) 0 ≤R2≤ 1b) Hệ số tương quan bội
r= √R2 biểu thị mức độ tương quan giữa biến phụ thuộc Y và các biến độc lập, nó làmột đại lượng không giảm khi số biến độc lập tăng lên Tuy nhiên, khác với trong môhình hồi quy đơn, hệ số này thường nhận giá trị dương và ít được quan tâm hơn
- Tính chất của hệ số tương quan: -1 ≤ r≤ 1
r= ± 1 thì hàm hồi quy mẫu được coi là phù hợp tuyệt đối
r= 0 thì hàm hồi quy mẫu hoàn toàn không phù hợp
r> 0 thì biến độc lập và biến phụ thuộc tồn tại mối quan hệ cùng chiều
r< 0 thì biến độc lập và biến phụ thuộc có mối quan hệ ngược chiều
c) Hệ số tương quan bội đã điều chỉnh ( ´R2)
´R2 được sử dụng để so sánh mức độ phù hợp của hai mô hình hồi quy hoặc đưa ra kếtluận về việc đưa thêm một biến độc lập trong mô hình hồi quy bội
8
Trang 91.3.3.Các kiểm định của bài toán
Kiểm định giả thuyết với các hệ số hồi quy βj
Loại giả thiết Giả thiết H0 Giả thiết H1 Miền bác bỏ
Kiểm định giả thiết đối với б2
Loại giả thiết Giả thiết H0 Giả thiết H1 Miền bác bỏ
Hai phía б2= б2 б2 ≠ б2 (n-k)б^2/ б2> X2 α/2(n-k)Phía phải б2 ≤ б2 б2> б2 (n-k)б^2/ б2> X2(n-k)
k: số biến trong mô hình
+) Nếu H0 bị bác bỏ có nghĩa là có ít nhất một biến độc lập Xi ảnh hưởng đến biến phụthuộc Y
+) Nếu chấp nhận H0 thì muốn kiểm định biến độc lập Xi không ảnh hưởng đến biếnphụ thuộc X
Trang 101.4 Công cụ phân tích tương quan và hồi quy
Có rất nhiều công cụ để phân tích hồi quy tương quan,nhóm tác giả đi sâu tìmhiểu,sử dụng phương pháp bình phương tối thiểu để giải bài toán hồi quy tương quan.Trong phương pháp bình phương tối thiểu gồm 2 phương pháp:
+ Phương pháp bình phương nhỏ nhất có trọng số
+ Phương pháp bình phương nhỏ nhất tổng quát
Nhóm tác giả lựa chọn phương pháp bình phương nhỏ nhất theo tổng quát đểứng dụng vào các phần mềm giải bài toán hồi quy tương quan
1.5.Một ví dụ cụ thể về bài toán tương quan và hồi quy
a) Bài toán: Như chúng ta đã biết, lượng hàng bán của một loại hàng hóa nào đóphụ thuộc vào nhiều yếu tố như thu nhập của người tiêu dùng, giá bán của hàng hóa
đó, giá của hàng hóa liên quan khác hay thị hiếu của người tiêu dùng về hàng hóa đó Trong điều kiện các yếu tố khác là không đổi, bài toán xét đến mối quan hệ giữa lượngbán hàng hoá A với giá bán của hàng hóa đó và thu nhập của người tiêu dùng Để xácđịnh mối quan hệ đó, qua khảo sát điều tra thu thập được số liệu gồm 10 quan sát đượccho trong bảng sau:
Trong đó: Q là lượng hàng bán được của một loại hàng, đơn vị tính là tấn/tháng
P là giá bán của mặt hàng này, đơn vị tính là ngàn đồng/kg
I là thu nhập của người tiêu dùng, đơn vị tính là triệu đồng/tháng
b) Xây dựng mô hình của bài toán:
Các chỉ tiêu giá bán của hàng hóa A và thu nhập của người tiêu dùng có ảnhhưởng đến lượng bán hàng hóa Mối quan hệ của các chỉ tiêu trên là một hàm có dạng:
Q= f(P,I)Giả sử mối quan hệ là tuyến tính, hàm tuyến tính có thể viết như sau:
Q= β1 + β2*P + β3*I + ei
Trong đó:
10
Trang 11 β2, β3 – là các hệ số hồi quy riêng, thể hiện mức độ ảnh hưởng của giábán và thu nhập tới lượng bán hàng hóa đó.
β1 – là hệ số chặn (hệ số tự do), chính là giá trị trung bình của lượng bánkhi chưa xét đến giá bán và thu nhập
ei là phần dư hay ước lượng của các yếu tố khác tác động tới lượng bánhàng hóa
Vì trong thực tế chúng ta không thể xác định chính xác được giá trị thực của các
hệ số hồi quy tương quan, vì vậy cần xác định các ước lượng của các hệ số trên để biếtđược mối quan hệ giữa các chỉ tiêu là như thế nào, do đó ta cần xác định được hàm hồiquy sau:
^
Y ^ Q= ^β1+ ^β2*P+ ^β3*I
Cần xác định được các hệ số ^β1, ^β2, ^β3 là các ước lượng điểm của β1, β2, β3 để
tìm ra được giá trị của Q với ^ Q là ước lượng điểm của biến phụ thuộc Q ( chỉ tiêu^lượng bán của hàng hóa A)
Để xác định được các hệ số ^β1, ^β2, ^β3 có thể dùng phương pháp bình phương nhỏ nhất
(OLS Method)
Với bài toán trên, chúng ta có thể giải bằng tay, tuy nhiên cách giải thủ côngnày làm tốn rất nhiều thời gian và phải sử dụng rất nhiều công thức mới có thể giảiđược Hiện nay, với sự phát triển của khoa học máy tính, có rất nhiều phần mềm có thể
sử dụng để xác định các hệ số ^β1, ^β2, ^β3 đồng thời giúp kiểm định giả thuyết của mô
hình xây dựng được
Trong khuôn khổ của báo cáo, nhóm tác giả xin giới thiệu một số phần mềmphổ biến hiện nay đang được sử dụng rộng rãi và ứng dụng vào giải bài toán trên lànhững phần mềm: Mfit3, SPSS, EViews, Microsoft Excel
2.Ứng dụng của phần mềm SPSS trong giải bài toán hồi quy và tương quan kinh tế
2.1.Giới thiệu về phần mềm
SPSS (viết tắt của Statistical Package for the Social Sciences) là một phần mềmmáy tính phục vụ công tác phân tích thống kê
SPSS là phần mềm thống kê được sử dụng phổ biến cho các nghiên cứu điều tra
xã hội học và kinh tế lượng SPSS có giao diện thân thiện với người dùng, dễ sử dụngbởi sử dụng chủ yếu các thao tác click chuột dựa trên các các công cụ (tool) mà rất ít
Trang 12dùng lệnh (khác với R hay Stata) SPSS rất mạnh cho các phân tích như kiểm định phitham số (Chi-square, Phi, lamda….), thống kê mô tả, kiểm định sự tin cậy của thang
đo bằng Cronbach Alpha, phân tích tương quan, hồi quy tuyến tính đơn và bội, kiểmđịnh trung bình (T-test), kiểm định sự khác nhau giữa các biến phân loại (định danh)bằng phân tích phương sai (ANOVA), vẽ bản đồ nhận thức (dùng trong marketing)hay sử dụng biến giá (hồi quy với biến phân loại), hồi quy nhị thức (logistic), vv…
Nội dung chủ yếu của SPSS:
Nội dung của SPSS rất phong phú và đa dạng bao gồm từ việc thiết kế các bảngbiểu và sơ đồ thống kê, tính toán các đặc trưng mẫu trong thống kê mô tả, đến một hệthống đầy đủ các phương pháp thống kê phân tích như:
So sánh các mẫu bằng nhiều tiêu chuẩn tham số và phi tham số (NonparametricTest), các mô hình phân tích phương sai theo dạng tuyến tính tổng quát (GeneralLinear Models), các mô hình hồi quy đơn biến và nhiều biến, các hồi quy phituyến tính (Nonlinear), các hồi quy Logistic;
Phân tích theo nhóm (Cluster Analysis);
Phân tích tách biệt (Discriminatory Analysis);
Và nhiều chuyên sâu khác (Advanced Statistics)
Một số ứng dụng chính của SPSS:
Những nội dung nói trên, SPSS có thể là đủ để giúp các nhà khoa học thực hiện việc xử lý số liệu nghiên cứu nói chung và trong nghiên cứu các mảng chuyên ngành khác nhau của mình, chẳng hạn:
- Ứng dụng SPSS trong nghiên cứu tâm lý học: tâm lý tội phạm, tâm lý học sinh viên…;
sinh Ứng dụng SPSS trong nghiên cứu xã hội học: ý kiến của người dân trong việc xây dựng lại khu chung cư, thống kê y tế…;
- Ứng dụng SPSS trong nghiên cứu thị trường: nghiên cứu và định hướng phát triển sản phẩm, mở rộng thị trường; sự hài lòng của khách hàng ;
- Ứng dụng SPSS nghiên cứu đa dạng sinh học, trong phát triển nông lâm
nghiệp…
12
Trang 13SPSS có thể phân tích được thực trạng, tìm ra nhân tố ảnh hưởng, dự đoán được
xu hướng xảy ra tiếp theo, giúp bạn đưa ra các quyết định một cách chính xác, giải quyết các vấn đề một cách nhanh chóng và cải thiện kết quả tốt hơn
Hiện nay phần mềm SPSS đang được sử dụng rộng rãi trong thống kê phân tích
số liệu Đặc biệt trong các trường đại học, việc sử dụng SPSS làm công cụ nghiên cứu đang hết sức phổ biến
SPSS là một bộ chương trình rất dễ sử dụng nên thu hút được nhiều người sử dụng SPSS cung cấp một giao diện giữa người và máy cho phép sử dụng các Menu thả xuống để chọn các lệnh thực hiện Khi thực hiện một phân tích chỉ đơn giản chọn thủ tục cần thiết và chọn các biến phân tích rồi bấm OK là có kết quả ngay trên màn hình để xem xét
2.2 Ứng dụng của SPSS trong phân tích tương quan và hồi quy kinh tế
Trước tiên ta cần tải và cài đặt phần mềm để ứng dụng giải bài toán
Nhập dữ liệu
- Nhập dữ liệu vào bảng như sau :
Ta vào trang Variable view :
- Nhập dữ liệu cột 1 là tên ‘Name’ chính là tên kí hiệu các biến : Lượng bán (Q) , giá bán hàng (P) ,thu nhập của người tiêu dùng(I)
- Sang cột ‘Decimals’ là phần số thập phân nếu trong bảng dữ liệu có số là số thập phân thì ta đặt mũi tên vào ô đó rồi nhấn phần bên phải ô nếu ta muốn 2 hay bao nhiêu số thập phân đứng sau thì ta nhấn hình mũi tên lên
- Sang cột ‘Lable’ ta thiết lập kí tự giải thích của biến như Q là lượng bán , P là giá bán hàng , I là thu nhập
- Sang cột căn chỉnh ‘ Align’ ta nhấn vào các ô cần điền sẽ hiện ra các thanh như ‘ Right-Left-Center’ thì ta chọn Right
- Sang cột thanh đo ‘Measure’ ta nhấn vào các ô trong hàng của bảng trong đó có các thanh ‘Scale-Nominal-Ordinal’ vì các biến của chúng ta là biến được định danh nên
ta chọn Nominal cho cả 3 biến
Như vậy là ta đã hoàn thành việc nhập dữ liệu vào trong bảng và cho ta được bảng nhưsau :
Trang 14 Tiếp theo ta vào trang Data view để nhập dữ liệu thao tác như trong excel ta
nhập từng dữ liệu theo thứ tự, theo hàng cho các biến :
14
Trang 15→ Khi đó ta đã thực hiện xong các thao tác nhập dữ liệu vào trong bảng SPSS để tính.
Phân tích tương quan
Trước tiên ta chọn manu Analyze rồi chọn Correlate rồi chọn Bivariate :
Tiếp theo ta được 1 bảng :
Trang 16Khi đó ta chỉ chuột vào P(I-Q) rồi chỉ vào dấu thì ta đã chuyển biến để tạo bảng
tương quan giữa các biến khi đó nhấn OK ta được bảng sau :
- N là kích thước mẫu (=10)
- Sig là mức ý nghĩa Những Sig của phần biến phụ thuộc <10% thì kết quảtương quan có ý nghĩa thống kê khi đó kết quả của chúng ta là 0,2% → có ý nghĩathống kê
- ** Ở dòng cuối là tương quan có mức ý nghĩa là 1% lấy 2 phía với mức độ tincậy là 90%
- Nhân tố P và nhân tố Q có tương quan chặt chẽ với nhau sẽ dễ xuất hiện hiệntượng đa cộng tuyến nhưng theo bảng kết quả cho ta thấy tổng sig của các biến độc lập
< 90% nên hai biến độc lập là giá bán và thu nhập của người tiêu dùng không có tươngquan với nhau
16
Trang 17- Bắt buộc ta phải phân tích tương quan thì mới có thể đi đến việc phân tích hồiquy đây là điều kiện cần để thực hiện các phân tích bên dưới Bởi Sig (Q)<10% nênhàm ví dụ có ý nghĩa thống kê.
Phân tích hồi quy
Ta chọn menu ‘Analyze’ sao đó chọn menu Regression rồi chọn Liner khi đó
chúng ta sẽ có một bảng để chọn như sau :
- Ta cho biến Q vào ô biến phụ thuộc
- Các phần còn lại chúng ta cho vào phần Independent
- Tiếp theo vào phần Statitcs chọn Collinearity diagnostics bởi cần kiểm tra sự đacộng tuyến của các biến độc lập Ô phía dưới là ô phần dư chúng ta không điền
và chọn các hoạt động nào vì ta không có các câu hỏi thừa hay một câu hỏikhông hợp lệ rồi nhấn Continue
- Sang thanh Plots là đồ thị phần dư: ô phần dư của P , I ta chọn ZPRED là phần
dư dự đoán và ô phần dư của Q ta chọn ZRESID đồng thời cũng trong bảng đó
ta chọn biểu đồ Histogram và Normal probability Plot rồi ấn Continue
Sau khi đã thực hiện xong, bấm OK là đã hoàn tất các thao tác khi đó ta có một bảng hồi quy :
Trang 192.3 Phân tích kết quả
Từ các kết quả trên bảng ta có thể rút ra nhận xét :
1 Xét bảng Model Summaryb có R2 hiệu chỉnh = 93,2%>70% Kết quả nàytương đối là ổn cho việc phân tích
2 Xét bảng Anovaa (phân tích phương sai) có Sig (hồi quy – regression)<10%
→ bài toán có ý nghĩa thống kê
- Phần kiểm đinh F :
H0: β1= β2= β3 = 0 (hay R2 = 0)H1: Có ít nhất một βj ≠ 0 (hay R2 ≠0)
F = 62.6405 > F0.1(2,7) = 3.26
Bác bỏ H0 , chấp nhận H1
Vậy việc đưa biến giá, thu nhập người tiêu dùng, lượng bán vào mô hình là phù hợp
3 Xét bảng kết quả phân tích hồi quy Coffeicients
Trang 20 Xét sự đa cộng tuyến ta theo dõi cột VIF nếu các giá trị < 10 ta thu được cácbiến không bị đa cộng tuyến Quan sát bảng cho thấy các giá trị đều thỏa mãnđiều kiện trên.
Cột Sig: các biến có Sig <10% là các biến không bị đa cộng tuyến khi đó kếtquả cho thấy phần giá bán là 15,2% > 10% nên loại ra khỏi mô hình
4 Biểu đồ Histogram phần dư (cột và dây) theo phân phối chuẩn mang hình dạngcủa phân phối chuẩn
5 Nằm phía dưới biểu đồ phân phối chuẩn là biểu đồ mô hình hồi quy chuẩn
‘Plots of regression standardized residua’và biểu đồ phân tán ‘ Scatterplot’ củabiến độc lập doanh thu Q
→ Nhận xét: Dựa vào bảng kết quả trên ta có phương trình hồi quy:
Q = 0.598*I+ - 0.931*P + 10.754
Dựa vào kết quả thu được:
+ Nếu giá bán mặt hàng này P tăng 1 nghìn đồng/kg thì lượng hàng bán giảm 0.931tấn/tháng
+ Nếu thu nhập của người tiêu dùng I tăng 1 triệu đồng/tháng thì lượng hàng bán đượctăng lên 0.598 tấn/tháng
+ Điểm xuất phát của mô hình β1 = 10.754 khi không có tác động của giá và thu nhậpthì lượng bán ra ngoài thị trường là 10.750 tấn/tháng
- Từ bài tập ví dụ trên cho thấy phần mềm SPSS mang đến cho người sử dụngmột giải pháp trong việc quản lí dữ liệu công cộng với khả năng xử lí, phân tích số liệumột cách mạnh mẽ với các thông số xác thực để kiểm tra tính đồng bộ và đa cộngtuyến của nó Ngoài ra với giao diện thân thiện thì người dùng dễ dàng sử dụng để giảibài toán tương quan và bài toán hồi quy một cách dễ dàng sử dụng các chức năng củacác công cụ thông qua các bước đã hướng dẫn phục vụ cho công tác nghiên cứu
- Về quản lí dữ liệu thì SPSS có bộ soạn thảo dữ liệu tương tự như excel, bộ soạnthảo cho phép cài các dữ liệu và mô tả các thuộc tính của chúng, tuy nhiên SPSSkhông có những công cụ quản lí dữ liệu thật mạnh Các bước thực hiện không đượcxắp xếp vào cùng một trang để tiện theo dõi mà ra các trang khác nhau sẽ tạo nên sựlộn xộn khi chỉnh sửa các dữ liệu khi có sai xót
20
Trang 21- Về phần phân tích thống kê thì đây là một ưu điểm nổi bật của SPSS vì để lậptrình, lập ra biểu bảng như ý là một công việc tỉ mẩn, phức tạp nhưng đối với SPSS thì
nó lại là một công cụ dễ dàng, hiệu quả lại vô cùng chính xác và hoàn chỉnh
- SPSS có ưu thế lớn nhất là phân tích phương sai và phân tích nhiều chiều
- Nhưng cái yếu nhất của nó là khả năng xử lý những vấn đề ước lượng phức tạp
và do đó khó đưa ra những ước lượng sai số đối với các ước lượng này SPSS cũngkhông hỗ trợ các công cụ phân tích dữ liệu theo lược đồ mẫu
- SPSS thiên về phần biểu bảng, đồ thị, báo cáo tổng hợp số liệu nhưng lại yếu vềmột số thủ tục thống kê như phương pháp ước lượng mạnh và thiếu vắng phương phápphân tích dữ liệu theo lược đồ mẫu
→ Như vậy ưu thế lớn nhất của SPSS là sử dụng khi phân tích phương sai hoặc nhóm tổ và tổng hợp số liệu theo biểu bảng thì sẽ đạt được hiệu quả cao nhất.
3.Ứng dụng của phần mềm Mfit3 trong giải bài toán tương quan và hồi quy kinh tế
3.1 Giới thiệu phần mềm Mfit3
Mfit là một bộ phần mềm viết cho các máy PC, nó được sử dụng để giải các bàitập kinh tế lượng
Hiện nay, ở Việt Nam có nhiều phần mềm khác giao diện đẹp hơn và tính năng
có thể ưu việt hơn nhưng Mfit vẫn được lựa chọn để giảng dạy trong các trườngđại học vì hai lí do sau:
- Thứ nhất, Mfit không đòi hỏi máy tính có cấu hình cao, với phiên bản cho sinhviên chỉ cần một đĩa mềm là dùng được
- Thứ hai, Mfit chạy trên môi trường DOS nên khi thực hành người học phải thựchiện từng bước, do đó có điều kiện đối chiếu với lý thuyết, tạo điều kiện để hiểu vấn
đề một cách cặn kẽ hơn
Công dụng của Mfit3: để phân tích hồi quy tương quan trong kinh tế
Trang 223.2.Ứng dụng phần mềm Mfit3 trong phân tích tương quan và hồi quy kinh tế.
3.là nhập số liệu từ một file đặc biệt
cụ thể là đọc tệp số liệu đã ghi bằng Mfit
4.là tổ hợp2 tệp số liệu của Mfit có cùng số biến
Hộp thoại Data frequency menu :
Ý nghĩa :
Chọn 1 là
số liệu không theo thời gianChọn 2 là số liệu theo năm
Chọn 3 là số liệu theo nửa năm
22
Trang 23Chọn 4 là số liệu theo quý
Chọn 5 là số liệu theo tháng
Ở đây yêu cầu nhập số quan sát trong vd này số quan sát là 10
Bảng này yêu cầu nhập số biến ở ví dụ trên ta có 3 biến
Trang 24 Nhấn enter thì xuất hiện bảng
24
Trang 25 Nhập dữ liệu :
Nhập số liệu Q
Tương tự với P, I ta nhập số liệu vào :
Trang 26Kết thúc vào số liệu bằng phím End ta nhận được thực đơn Action menu :
Ý nghĩa:
0 Thoát khỏi Mfit1.Xử lý, vẽ biểu đồ, soạn thảo, ghi số liệu.2.Ước lượng, kiểm định, dự báo hồi qui tuyến tính
3.Ước lượng hồi qui tuyến tính đệ qui4.Ước lượng hồi qui tuyến tính xoay vòng
5.Ước lượng, kiểm định, dự báo hồi qui phi tuyến tính
6.Ước lượng, kiểm định hệ thống đồng tích hợp theo phương pháp Johansen
Hộp thoại Data processing menu:
Ý nghĩa :
26
Trang 270.Trở về thực đơn Action Menu
1.Tạo hằng số, biến xu thế theo thời gian, biến giả theo mùa
2.Chuyển đổi, soạn thảo, liệt kê, vễ biểu đồ hoặc trở về DOS
3.Ghi số liệu
4.Nối thêm một tệp số liệu đã có của Mfit
5.Bất đầu với một tệp số liệu mới
Chọn 2 gõ enter:
Ví dụ chúng ta muốn kiểm tra lại các biến Q, P, I thì gõ list có bảng sau:
Trang 28 Để hồi quy mô hình gõ inpt=1 rồi enter 2 lần:
Gõ tiếp “q” rồi enter 3 lần thì xuất hiện:
28