Tài liệu hạn chế xem trước, để xem đầy đủ mời bạn chọn Tải xuống
1
/ 33 trang
THÔNG TIN TÀI LIỆU
Thông tin cơ bản
Định dạng
Số trang
33
Dung lượng
538,52 KB
Nội dung
LỜI NÓI ĐẦU
1
MỤC LỤC
STT Họ và tên Công việc Ghi chú
1 LƯƠNG ĐÌNH LƯU
2 PHẠM DUY KHÁNH
3 TRẦN QUANG HỢP
2
CHƯƠNG I- PHÂNTÍCH BÀI TOÁN – BẢNG SỐ LIỆU
I. Phântích bài toán
1. Tên đềtài:Phântíchsảnlượngvàdoanhthungànhbưuchínhviễn thông
(giai đoạn 1995-2011).
2. Tập dữ liệu mà nhóm 13 nghiên cứu gồm 8 yếu tố với 17 bộ dữ liệu
Chúng ta nhận thấy biến phụ thuộc là biến Doanhthu (tỉ đồng). Ở dữ liệu này
có 6 biến độc lập là: Bưu phẩm đi có cước, Bưu kiện đi có cước, Thưvà điện
chuyển tiền, Báo chí phát hành, Điện báo có cước, Điện thoại đường dài. Các
biến độc lập này dùng để dự đoán được biến phụ thuộc (Doanh thu).
3. Phương pháp phântích bài toán
Với tập dữ liệu này ta sẽ dùng các phương pháp là hồi quy tuyến tính, phân
tích đặc trưng vàphântích chuỗi thời gian.
II. Bảng số liệu
3
Năm
Bưu phẩm đi có
cước (triệu cái)
Bưu kiện đi có
cước
(nghìn cái)
Thư và điện
chuyển tiền
(nghìn bức)
Báo chí phát
hành (triệu tờ)
Điện báo có
cước (triệu
tiếng)
1995 116.5 162.0 1365.0 223.5 49.6
1996 121.4 230.0 1744.0 238.9 45.9
1997 124.9 307.0 2408.0 214.8 42.0
1998 135.0 433.0 3358.0 225.6 35.0
1999 146.7 962.0 3751.0 239.6 28.2
2000 155.0 709.0 4412.0 299.1 0.0
2001 148.1 1080.0 4883.0 286.8 0.0
2002 162.3 789.9 5625.0 285.4 0.0
2003 181.6 1080.3 6518.0 307.9 0.0
2004 191.8 1378.0 7174.0 411.6 0.0
2005 238.3 1344.0 7723.0 432.3 0.0
2006 166.7 1297.0 8139.0 404.2 0.0
2007 234.7 1559.0 8786.0 396.5 0.0
2008 251.3 1753.0 8664.0 430.7 0.0
2009 332.9 2402.1 8183.0 577.2 0.0
2010 342.1 2526.0 9010.0 553.3 0.0
2011 393.4 2778.6 9460.0 608.6 0.0
4
CHƯƠNG II- PHÂNTÍCH ĐẶC TRƯNG
I- Phântích đặc trưng
Chúng ta tiến hành phântích từng thành phần số liệu riêng của từng sản
lượng của từng yếu tốvà rút ra các bảng kết quả sau:
Chú thích
o Count: Số lượng mẫu.
o Average: Số trung bình.
o Median: Trung vị.
o Mode: Số trội.
o Variance: Phương sai.
o Standard deviation: Độ lệch chuẩn.
o Coeff. of variation: Hệ số biến thiên.
o Standard Error: Sai số chuẩn.
o Minimum: Trị số quan sát bé nhất.
o Maximum: Trị số quan sát lớn nhất.
o Range: Độ biến thiên.
o Skewness: Độ lệch của phân bố.
o Kurtosis: Độ nhọn của phân bố.
o Sum: Tổng các trị số quan sát.
Làm ví dụ với yếu tố “Bưu phẩm đi có cước”. Đểphântích đặc trưng ta
chọn: Analyze > Variable Data > One – Variable Analysis…
5
Đây là bảng phântích đặc trưng nhận được
Cách tính các giá trị trong bảng:
Median Med=
Variance S
2
=
Standard deviation S
f
= = 84.3966
Coeff. of variation C
v
= = 41.6749%
Standard error
S
Range = Maximum – Minimum
Skewness == 1.89988
Kurtosis = = 0.227539s
Kết luận:
Nhận xét sơ bộ: Nhìn vào bảng kết quả ta quan tâm đến các thông số sau:
Skewness có giá trị >0 nên tập số liệu có xu hướng lớn hơn giá trị trung bình
và đồ thị phân bố có xu hướng “lệch trái” so với giá trị trung bình.
Kurtosis có giá trị >0 nên tập số liệu có xu hướng phân bố xung quanh giá trị
trung bình (Đồ thị phân bố của tập số liệu này “nhọn hơn phân phối chuẩn”)
6
CHƯƠNG III- PHÂNTÍCH HỒI QUY
I- Khái niệm
1. Khái niệm
Phân tích hồi quy là tìm quan hệ phụ thuộc của một biến, được gọi là biết
phụ thuộc vào một hoặc nhiều biến khác, được gọi là biến độc lập nhằm mục
đích ước lượng hoặc tiên đoán giá trị kỳ vọng của biến phụ thuộc khi biết trước
giá trị của biến độc lập.
2. Mục đích hồi quy:
+ Ước lượng trung bình biến phụ thuộc trong những điều kiện xác định của biến
giải thích.
+ Ước lượng các tham số.
+ Kiểm định về mối quan hệ.
+ Dự báo giá trị biến phụ thuộc khi biến giả thích thay đổi
3. Một số dạng hàm cơ bản trong phântích hồi qui
3.1. Dạng hàm tuyến tính:
- Phương trình: Y
i
= β
1
+ β
2
X
i
+ u
i
- Ưu điểm:
+ Có tính đơn giản.
+ Mỗ lần X tăng thêm một đơn vị thì Y tăng thêm β
2
đơn vị
- Nhược điểm:
+ Tính đơn giản của hàm tuyến tính,bất kỳ lúc nào tác động của X phụ thuộc
vào các giá trị của X hoặc Y, thì dạng hàm tuyến tính không thể là dạng hàm
phù hợp.
3.2. Dạng hàm Bậc hai:
- Phương trình: Y
i
= β
1
+ β
2
X
i
+ β
3
X
i
2
+ u
i
7
- Khi X tăng thêm một đơn vị thì Y tăng thêm β
2
+ 2β
3
X
i
đơn vị. Nếu β
3
>0, thì
khi tăng lên
- Nếu β
3
< 0, thì khi X tăng lên tác động bổ sung của X đến Y giảm xuống.
- Nếu có đường biểu diễn chi phí thì chi phí biên sẽ là MC= β
2
+ 2β
3
Q
3.3. Dạng hàm logarit
- Phương trình: lnY
i
= β
1
+ β
2
lnX
i
+ u
i
- Nếu X thay đổi 1% thì Y sẽ thay đổi B
2
%; đây là tính chất đặc biệt của quan
hệ logarit.
II- Các thông số đánh giá
1. Hệ số tương quan R (Coefficient of correlation)
- Yếu tố nào có R càng lớn thì ảnh hưởng càng nhiều
- Theo như kết quả kiểm duyệt:
R < 0.3 không tương quan
0.3 < R < 0.7 có dấu hiệu
0.5 < R < 0.7 hơi tương quan
0.7 < R < 0.9 tương quan
R > 0.9 rất tương quan
2. Bình phương của hệ số tương quan (R square)
8
- Yếu tố nào có R
2
càng lớn thì mối quan hệ giữa yếu tố đó và biến y càng chặt
chẽ:
Trong đó:
SSE (Sum of Square
Error):
SST (Sum of Square Total):
Adjusted R –Square:
3. Sai số chuẩn (standard error – với hồi quy đơn là N-2)
4. Hệ số hồi quy B-độ nghiêng B (regression coefficient)
- Yếu tố nào có B cao thì ảnh hưởng nhiều hơn, tuy nhiên các yếu tố có đơn vị
khác nhau (năm, triệu cái, nghìn cái, triệu tờ, triệu tiếng,…) nên không thể so
sánh mức ảnh hưởng giữa các yếu tố. Nếu muốn so sánh phải đổi các yếu tố có
cùng đơn vị là độ lệch chuẩn, lúc đó ta có hệ số hồi qui chuẩn hóa: B
s
= B. /
( Với Sx là độ lệch chuẩn của x tương ứng và Sy là độ lệch chuẩn của y).
III- Hồi quy đơn biến
Xét độ nghiêng của đồ thị để xem mô hình có thể chấp nhận Ho hay Ha. Tức
là ta phải tính giá trị t
tính
và so sánh với giá trị t
bảng
:
- Nếu t
tính
> t
bảng
: chấp nhận Ha và kết luận mô hình đưa ra khá thích hợp với
dự báo
- Ngược lại nếu t
tính
< t
bảng
: chấp nhận Ho và kết luận mô hình không có ý
nghĩa, không đủ năng lực dự báo.
Phần mềm sử dụng là STATGRAPHIC.
Để phântích hồi quy đơn biến ta làm như sau: vào Improve Regression
Analysis One factor Simple Regression
1. Yếu tố “Bưu phẩm đi có cước”
Coefficients
Least Squares Standard T
Parameter Estimate Error Statistic P-Value
9
Intercept -31864.0 4116.35 -7.74084 0.0000
Slope 307.918 18.8445 16.3399 0.0000
Analysis of Variance
Source Sum of
Squares
Df Mean
Square
F-Ratio P-Value
Model 1.08054E10 1 1.08054E10 266.99 0.0000
Residual 6.0706E8 15 4.04707E7
Total (Corr.) 1.14124E10 16
Correlation Coefficient = 0.97304
R-squared = 94.6807 percent
R-squared (adjusted for d.f.) = 94.3261 percent
Standard Error of Est. = 6361.65
Mean absolute error = 3972.39
Durbin-Watson statistic = 2.40009 (P=0.7247)
Lag 1 residual autocorrelation = -0.231529
y = -31864 + 307.918*x1
Trong đó:
- Correlation Coefficient: Hệ số tương quan
- R-squared: hệ số xác định (bình phương R)
- Standard Error of Est: độ lệch chuẩn
- Mean absolute erro: trung bình lỗi
10
[...]... cóthểviếtcácphươngtrìnhtuyếntínhđơnsau: 1 Doanhthu= -31864 + 307,918 *(Bưuphẩmđicócước) 2 Doanhthu = -9231,65 + 32,4815*(Bưukiệnđicócước) 3 4 5 6 Doanhthu = -18892,3 + 8,29571 *(Th và iệnchuyểntiền) Doanhthu = -41489,8 + 199,431 *(Báo chí phát hành) Doanhthu = 39873,6–794,566 *(Điện báo có cước) Doanhthu = 8351,48 + 7,56734 *(Điện thoại đường dài) Nhìn vào bảng phântích đơn biến ta thấy hệ số tương quan R của Bưu phẩm đi có... • Đánh giá yếu tố Bưu kiện đi có cước” với biến phụ thu c là Doanhthuđể xem số lượngbưu phẩm đi có cước ảnh hưởng thế nào đến doanh thu: Nhìn vào kết quả phântích ở trên ta thấy hệ số tương quan của nó là R=0.965408 điều đó cho thấy Bưu kiện đi có cước” rất tương quan với Doanhthu 13 • • Tiếp theo đến hệ số xác định R 2 = 93,2013% điều đó khẳng định được rằng yếu tố Bưu kiện đi có cước”... • • - Đánh giá yếu tố Bưu phẩm đi có cước” với biến phụ thu c là Doanhthuđể xem số lượngbưu phẩm đi có cước ảnh hưởng thế nào đến doanh thu: Nhìn vào kết quả phântích ở trên ta thấy hệ số tương quan của nó là R=0.97304 điều đó cho thấy Bưu phẩm đi có cước” rất tương quan với Doanhthu Tiếp theo đến hệ số xác định R 2 = 94,6807% điều đó khẳng định được rằng yếu tố Bưu phẩm đi có cước” có... • Đánh giá yếu tố “Thư và điện chuyển tiền” với biến phụ thu c là Doanhthuđể xem số thưvà điện chuyển tiền ảnh hưởng thế nào đến doanh thu: Nhìn vào kết quả phântích ở trên ta thấy hệ số tương quan của nó là R=0.844457 điều đó cho thấy “Thư và điện chuyển tiền” tương quan với Doanhthu Tiếp theo đến hệ số xác định R 2 = 71,3107% điều đó khẳng định được rằng yếu tố “Thư và điện chuyển tiền” có... residual autocorrelation = 0.791327 Đánh giá yếu tố “Điện báo có cước” với biến phụ thu c là Doanhthuđể xem số lượng Điện báo có cước ảnh hưởng thế nào đến doanh thu: 19 • • • - Nhìn vào kết quả phântích ở trên ta thấy hệ số tương quan của nó là R=0.575249 điều đó cho thấy “Điện báo có cước” không tương quan với Doanhthu Tiếp theo đến hệ số xác định R 2 = 33,0911% điều đó khẳng định được rằng yếu... autocorrelation = 0.759609 Đánh giá yếu tố “Điện thoại đường dài” với biến phụ thu c là Doanhthuđể xem số lượng Điện thoại đường dài ảnh hưởng thế nào đến doanh thu: 21 • • • Nhìn vào kết quả phântích ở trên ta thấy hệ số tương quan của nó là R=0.348768 điều đó cho thấy “Điện thoại đường dài” có dấu hiệu tương quan với Doanhthu Tiếp theo đến hệ số xác định R 2 = 12,1639% điều đó khẳng định được rằng... residual autocorrelation = 0.377733 16 • Đánh giá yếu tố “Báo chí phát hành” với biến phụ thu c là Doanhthuđể xem số lượng Báo chí phát hành ảnh hưởng thế nào đến doanh thu: Nhìn vào kết quả phântích ở trên ta thấy hệ số tương quan của nó là R=0.964244 điều đó cho thấy “Báo chí phát hành” tương quan với Doanhthu 17 • • Tiếp theo đến hệ số xác định R 2 = 92,9766% điều đó khẳng định được rằng yếu... 94,6807% sự thay đổi của biến phụ thu c chính là Doanhthu Ta so sánh đến giá trị P-value của biến độc lập này Trước hết xin nói rõ ý nghĩa của giá trị P-value trong phântíchthống kê số liệu: khi nhà nghiên cứu đã nghiên cứu ra một giả thuyết thì ông cũng pải định nghĩa giả thuyết đảo cho nó (null hypothesis) tức là một giả thuyết ngược lại với những gì mình nghiên cứu và tin nó là thật Ví dụ như theo... thích khoảng 71,3107% sự thay đổi của biến phụ thu c chính là Doanhthu 15 • Ta so sánh đến giá trị P-value của biến độc lập này Với yếu tố này Pvalue = 0.0000 điều này có nghĩa là yếu tố mà ta đang xét gần như bác bỏ giả thuyết đảo của nó, và cũng gần như chấp nhận giả thuyết đang tin tưởng đó là yếu tố “Thư và điện chuyển tiền” có ảnh hưởng nhiều đến Doanhthu - Giả định độ tin cậy P = 95% Ta cóttính=... thích khoảng 93,2013% sự thay đổi của biến phụ thu c chính là Doanhthu Ta so sánh đến giá trị P-value của biến độc lập này Với yếu tố này Pvalue = 0.0000 điều này có nghĩa là yếu tố mà ta đang xét gần như bác bỏ giả thuyết đảo của nó, và cũng gần như chấp nhận giả thuyết đang tin tưởng đó là yếu tố Bưu kiện đi có cước” có ảnh hưởng nhiều đến Doanhthu - Giả định độ tin cậy P = 95% Ta cóttính= . SỐ LIỆU
I. Phân tích bài toán
1. Tên đề tài: Phân tích sản lượng và doanh thu ngành bưu chính viễn thông
(giai đoạn 1995-2011).
2. Tập dữ liệu mà nhóm 13. Bưu phẩm đi có cước” với biến phụ thu c là Doanh thu
để xem số lượng bưu phẩm đi có cước ảnh hưởng thế nào đến doanh thu:
• Nhìn vào kết quả phân tích