Bước 1: Xác định rõ các mục tiêu Bước 2: Xác định dự báo cái gì Bước 3: Nhận dạng các khía cạnh thời gian Bước 4: Xem xét số liệu Bước 5: Lựa chọn mô hình Bước 6: Đánh giá mô hình Bước 7: Chuẩn bị dự báo Bước 8: Trình bày
Trang 1(Business Forecasting)
Khoa Kinh t ế Phát triển 1A Hoàng Diệu, Phú Nhuận Website: www.fde.ueh.edu.vn
Ph ùng Thanh Bình
1. Quy trình dự báo
2. Khảo sát dữ liệu chuỗi thời gian
3. Khảo sát dữ liệu bằng phân tích tự tương
quan
4. Lựa chọn mô hình dự báo
5. Ôn tập thống kê cơ bản
QUY TRÌNH DỰ BÁO, KHẢO SÁT DỮ
LIỆU VÀ LỰA CHỌN MÔ HÌNH
Trang 2z Nguyễn Trọng Hoài (2001): Mô hình hóa và Dự
báo chuỗi thời gian trong kinh doanh & kinh tế,
Chương 2.
z J.Holton Wilson & Barry Keating, (2007),
Business Forecasting With Accompanying
Excel-Based ForecastXTM Software, 5thEdition,
Chapter 2.
z John E.Hanke & Dean W.Wichern, (2005),
Business Forecasting, 8th Edition, Chapter 2 & 3.
TÀI LIỆU THAM KHẢO
Ph ùng Thanh Bình
Bước 1: Xác định rõ các mục tiêu
Bước 2: Xác định dự báo cái gì
Bước 3: Nhận dạng các khía cạnh thời gian
Bước 4: Xem xét số liệu
Bước 5: Lựa chọn mô hình
Bước 6: Đánh giá mô hình
Bước 7: Chuẩn bị dự báo
Bước 8: Trình bày kết quả dự báo
Bước 9: Theo dõi các kết quả
QUY TRÌNH DỰ BÁO
Trang 3z Nói rõ các mục tiêu, kể cả dự báo sẽ được sử
dụng như thế nào trong việc ra quyết định
z Các mục tiêu và ứng dụng của dự báo nên được
thảo luận giữa những cá nhân liên quan trong việc
chuẩn bị dự báo và những người sẽ sử dụng các
z Dự báo doanh số: doanh số đơn vị hay bằng tiền;
tổng doanh số, doanh số theo sản phẩm, hay
doanh số theo vùng; doanh số nội địa hay xuất
khẩu, hay cả hai
z Dự báo số bệnh nhân: số đăng ký khám, xuất
viện, số ngày nằm viện
Trang 4z Độ dài và giai đoạn của dự báo: năm, quý, tuần,
z Số lượng và loại số liệu sẵn có: nội bộ hay bên ngoài;
số liệu có ở dạng mong muốn hay không; giá trị hay
đơn vị
z Có thể có quá nhiều hoặc quá ít dữ liệu
z Có thể thiếu giá trị cần phải ước tính
z Có thể phải chuyển đổi đơn vị tính
Trang 5z Bản chất (pattern) số liệu (xem Bảng 2.1)
z Số lượng số liệu quá khứ sẵn có
z Độ dài dự báo
z Chọn mô hình phù hợp với dữ liệu đã được thu thập sao
cho tối thiểu hóa “sai số” dự báo
z Mô hình đơn giản hay phức tạp?
z Ý kiến đánh giá, nhận xét rất cần thiết
QUY TRÌNH DỰ BÁO
5 Lựa chọn mô hình
Ph ùng Thanh Bình
Trang 6z Kiểm định các mô hình trên chuỗi số liệu ta muốn dự
báo
z Phân biệt độ phù hợp và độ chính xác
z Độ phù hợp: so với giá trị quá khứ
z Độ chính xác: so với giá trị dự báo
z Nếu mô hình được chọn trong bước 6 không đạt độ
chính xác chấp nhận được, quay lại bước 5 với một mô
z Khi có nhiều phương pháp sử dụng thông tin khác
nhau, thì việc kết hợp chúng lại sẽ cho kết quả tốt
hơn so với chỉ dùng một phương pháp
QUY TRÌNH DỰ BÁO
7 Chuẩn bị dự báo
Trang 7z Cả dạng viết và thuyết trình
z Trình bày kết quả dự báo cho những ai dựa vào
đó để ra quyết định
z Cần phải có sự giao tiếp thảo luận giữa những
người có liên quan
QUY TRÌNH DỰ BÁO
8 Trình bày kết quả dự báo
Ph ùng Thanh Bình
z So sánh mức đô chính xác của giá trị dự báo và
giá trị thực tế trong giai đọan dự báo
z Người làm dự báo cần rút ra các bài học từ việc
Trang 8z 4 tiêu chí có thể được áp dụng để xác định xem
dữ liệu có hữu ích cho việc dự báo hay không:
o Dữ liệu phải đáng tin cậy và chính xác
o Thay đổi đều đặn trong chuỗi dữ liệu thời gian
tại cùng thời điểm mỗi năm
KHẢO SÁT DỮ LIỆU CHUỖI
THỜI GIAN
Trang 9o Thay đổi không phải do các yếu tố kể trên
KHẢO SÁT DỮ LIỆU CHUỖI
THỜI GIAN
Ph ùng Thanh Bình
z Tự tương quan là tương quan giữa một biến trễ
một hoặc nhiều giai đoạn và chính biến đó
với k = 0, 1, 2, khi độ trễ tăng, hệ số tự tương
2 t
k - t n
1 k t t k
)Y-Y(
)Y-(Y)Y-(Yr
Trang 10z Giản đồ tự tương quan hay hàm tự tương quan là một
đồ thị biểu diễn quan hệ giữa các hệ số tự tương quan
với độ trễ của một chuỗi thời gian
z Các hệ số tự tương quan của các độ trễ khác nhau có
thể cung cấp các thông tin sau:
z Dữ liệu có ngẫu nhiên không?
z Dữ liệu có xu thế không?
z Dữ liệu có dừng không?
z Dữ liệu có yếu tố mùa vụ không?
KHẢO SÁT DỮ LIỆU BẰNG PHÂN
TÍCH TỰ TƯƠNG QUAN
Ph ùng Thanh Bình
z Kiểm định hệ số tự tương quan có khác 0 một cách có
ý nghĩa hay không (dữ liệu có ngẫu nhiên không)?
z SE(rk) = sai số chuẩn của tự tương quan với độ trễ k
1 - k
1 i
2 i k
Trang 11z Khoảng tin cậy
0 ± t x SE(rk) với
z Kiểm định chung (một nhóm các hệ số tương
quan đầu tiên khác 0 một cách có ý nghĩa)
KHẢO SÁT DỮ LIỆU BẰNG PHÂN
TÍCH TỰ TƯƠNG QUAN
) SE(r
ρ - r
t
k
k k
2 k
k n
r 2)
n(n Q
Ph ùng Thanh Bình
o Ví dụ 3.2 (Hanke, 65)
o Ví dụ 3.3 (Hanke, 66)
z Dữ liệu có xu thế không?
o Một chuỗi thời gian có xu thế (không dừng): các hệ
số tự tương quan của các độ trễ đầu tiên lớn và sau
đó giảm dần bằng 0 khi độ trễ tăng lên
o Chuỗi dừng: hệ số tự tương quan giảm bằng 0 rất
nhanh (sau 2 hoặc 3 độ trễ)
o Phương pháp sai phân (ví dụ 3.4, Hanke, 68)
KHẢO SÁT DỮ LIỆU BẰNG PHÂN
TÍCH TỰ TƯƠNG QUAN
Trang 12z Dữ liệu có yếu tố mùa vụ không?
o Nếu dữ liệu có yếu tố mùa vụ theo quý, một hệ
số tự tương quan sẽ lặp lại tại độ trễ 4
o Nếu dữ liệu có yếu tố mùa vụ theo tháng, một hệ
số tự tương quan sẽ lặp lại tại độ trễ 12, …
o Ví dụ 3.5 (file Table 3-5)
KHẢO SÁT DỮ LIỆU BẰNG PHÂN
TÍCH TỰ TƯƠNG QUAN
Ph ùng Thanh Bình
z Một số câu hỏi cần phải xem xét trước khi quyết định
chọn phương pháp dự báo phù hợp nhất cho một vấn
đề cụ thể:
o Tại sao cần dự báo?
o Ai sẽ sử dụng kết quả dự báo?
o Đặc điểm của dữ liệu sẵn có là gì?
o Thời đọan của dự báo là gì?
o Đòi hỏi dữ liệu tối thiểu là bao nhiêu?
o Mức độ chính xác bao nhiêu là vừa?
LỰA CHỌN MÔ HÌNH DỰ BÁO
Trang 13z Để chọn một phương pháp dự báo thích hợp, cần phải:
o Xác định bản chất của vấn đề dự báo
o Bản chất của dữ liệu đang xem xét
o Mô tả các khả năng và hạn chế của các phương pháp
dự báo tiềm năng
o Xây dựng các tiêu chí để ra quyết định lựa chọn
o Một nhân tố chính ảnh hưởng đến việc lựa chọn mô
hình dự báo là nhận dạng và hiểu được bản chất số
o Gồm có phương pháp dự báo thô, trung bình giản đơn,
trung bình trượt, ARMA
LỰA CHỌN MÔ HÌNH DỰ BÁO
Trang 14z Các phương pháp dự báo đối với dữ liệu xu thế
• Mức độ chấp nhận của thị trường gia tăng
o Gồm có phương pháp trung bình trượt, san mũ bậc 1
(Holt), hồi quy đơn, đường tăng trưởng, mô hình mũ,
• Thời tiết ảnh hưởng đến biến đang xem xét
• Niên lịch ảnh hưởng đến biến đang xem xét
o Gồm có phương pháp phân tích, san mũ
Winter, hồi quy bội, và ARIMA
LỰA CHỌN MÔ HÌNH DỰ BÁO
Trang 15z Các phương pháp dự báo đối với dữ liệu chu kỳ
o Được sử dụng khi:
• Chu kỳ kinh doanh ảnh hưởng đến biến đang
xem xét
• Dịch chuyển trong sở thích chung
• Dịch chuyển trong dân số
• Dịch chuyển trong chu kỳ vòng đời sản phẩm
o Gồm có phương pháp phân tích, chỉ số kinh tế, mô
hình kinh tế lượng, hồi quy bội, và ARIMA
LỰA CHỌN MÔ HÌNH DỰ BÁO
Ph ùng Thanh Bình
Trang 16z Mô tả dữ liệu bằng số
o Mô tả độ lớn chung của một biến sử dụng các
thước đo mức độ tập trung: Trung bình, Trung
bị, và mode
• Xem c2t2.xls
o Hai thước đo mức độ phân tán: Phương sai và
Độ lệch chuẩn (nhắc lại bậc tự do)
o Đồ thị phân tán (scatter diagrams), …
o Đồ thị chuỗi thời gian (time series plot) thường
được sử dụng nhất, và được biểu diễn bằng:
• Hệ trục tọa độ đơn
Hệ trục tọa độ kép
ÔN TẬP THỐNG KÊ CĂN BẢN
Trang 17z Chỉ số
o Chỉ số đơn giản không trọng số
o Chỉ số gộp không trọng số đơn giản
ÔN TẬP THỐNG KÊ CĂN BẢN
, 1
i
n i
t i
n i t
Y
Y I
0 , ,
n i
i t i
n i t
Q P
Q P I
Trang 18n i
T t i
n i t
Q P
Q
P I
Ph ùng Thanh Bình
z Chuyển hóa dữ liệu
o San bằng chuỗi thời gian
• Phương pháp bình quân di động giản đơn
Trang 19z Chuyển hóa dữ liệu
o Chuyển dữ liệu tháng, quý, nữa năm thành dữ
liệu năm bằng cách nhân giá trị với tần suất
(tháng x 12, quý x 4, nữa năm x 2)
o Chuyển đổi tần xuất dữ liệu
• Từ tần suất cao đến tần suất thấp:
z Chuyển hóa dữ liệu
o Chuyển đổi tần xuất dữ liệu
• Từ tần suất thấp đến tần suất cao:
' ' 1 ' 2
' 1
∆ +
=
∆ +
=
=
Y Y
Y Y Y
Y I
Trang 20z Chuyển hóa dữ liệu
o Phương pháp sai phân
• Ý nghĩa:
Sai phân bậc 1 Æ hằng số: dữ liệu gốc có xu
hướng đường thẳng
Sai phân bậc 2 Æ hằng số: dữ liệu gốc có xu
hướng đường cong
ÔN TẬP THỐNG KÊ CĂN BẢN
1 2
t t t
Y Y Y
Y Y Y
Ph ùng Thanh Bình
z Chuyển hóa dữ liệu
o Phương pháp ln
• Ý nghĩa:
R là tỷ lệ tăng trưởng mũ (không đổi cho mỗi
giai đoạn trong suốt thời kỳ nghiên cứu)
Tùy vào t được tính theo tháng, quý hay năm
ÔN TẬP THỐNG KÊ CĂN BẢN
rt
Trang 21z Phân phối xác suất
o Phân phối xác suất của một biến rời rạc
• Là liệt kê tất cả các giá trị có thể có của biến
số đó, cùng với xác suất của mỗi giá trị đó
• E(X) = Σ[X × P(X)]
o Đối với một phân phối liên tục, thì xác suất để có
một giá trị nhất định gần bằng 0 Một phân phối
quan trọng trong trường hợp này là phân phối
chuẩn
ÔN TẬP THỐNG KÊ CĂN BẢN
Ph ùng Thanh Bình
z Phân phối xác suất
o Phân phối chuẩn của một biến ngẫu nhiên liên tục
được định nghĩa với 2 đặc điểm: Trung bình và Độ
lệch chuẩn của biến số đó
• µ ± 1σ chiếm ~ 68% diện tích
• µ ± 2σ chiếm ~ 95% diện tích
• µ ± 3σ chiếm ~ 99% diện tích
o Phân phối chuẩn chuẩn tắc
ÔN TẬP THỐNG KÊ CĂN BẢN
σ
µ - X
Z =
Trang 22z Phân phối mẫu
o Phân phối mẫu là tập hợp tất cả các giá trị có thể
có của một thống kê mẫu có thể được rút ra từ một
tổng thể với một cỡ mẫu nhất định
o Theo định lý giới hạn trung tâm, khi cỡ mẫu càng
lớn, thì phân phối mẫu của các trung bình mẫu sẽ
tiến về phân phối chuẩn, và trung bình lൠvà độ
• Phân phối chuẩn cung cấp nền tảng cho nhiều
lọai phân tích dữ liệu, nhưng nó không thích
hợp với dữ liệu mẫu, nên ta sử dụng t-dist
• Khi không biết σ, hoặc khi cỡ mẫu nhỏ, thì nên
=
Trang 23z Thống kê suy luận từ mẫu
o Ước lượng điểm của một hệ số tổng thể (pop
parameter) là một giá trị riêng lẻ được tính từ số
liệu mẫu
o Ước lượng khoảng là một khoảng mà hệ số tổng
thể có thể nằm trong đó:
được gọi là sai số chuẩn của trung bình mẫu và đo lường độ phân tán
của các trung bình mẫu
n
s
ÔN TẬP THỐNG KÊ CĂN BẢN
n t X
µ = ± × s
Ph ùng Thanh Bình
z Kiểm định giả thuyết, gồm các bước sau:
o Bước 1: Xây dựng giả thuyết (H0, và H1)
o Bước 2: Thu thập một mẫu ngẫu nhiên và tính
toán các thống kê kiểm định mẫu
o Bước 3: Giả định H0là đúng và xác định phân
phối mẫu của thống kê kiểm định
o Bước 4: Tính xác suất (giá trị thống kê)
o Bước 5: So sánh xác suất (giá trị thống kê tính
toán) và quyết định chấp nhận hay bác bỏ giả
thuyết
ÔN TẬP THỐNG KÊ CĂN BẢN
Trang 24Ph ùng Thanh Bình
z Phân tích tương quan
o Giản đồ phân tán (scatter diagrams): xét quan hệ
• Mức độ quan hệ giữa 2 biến
ÔN TẬP THỐNG KÊ CĂN BẢN
Trang 25Y X
)Y(Y)
X(X
)Y(Y)X-(XZ
Z1
2
2 ( X) n Y ( Y) X
n
Y) ( X) ( XY n