Tinh mua vu 1.1 Khai niém Tính mùa vụ trong đữ liệu chuỗi thời gian đề cập đến những biến động tăng hoặc giảm lặp đi lặp lại một cách đều đặn của dữ liệu trong một khoảng thời gian.. 1.2
Trang 1
TRUONG DAI HOC KINH TE - LUAT
BAI THUC HANH NHOM
TEN MON HOC: PHAN TICH CHUOI THOI GIAN
TRONG TAI CHINH
MA HOC PHAN: 232T01701
Tính mùa vụ ngẫu nhiên là gì? Cách phát hiện? Cách loại bỏ
tình mùa vụ ngầu nhiên? Thực hành trên phần mêm?
Giảng viên hướng dẫn: TS Võ Thị Lệ Uyễn Danh sách thành viên nhóm:
Trang 2I Tông quát về tính mùa VU cece cececcecesecesessseeecessssesecessteasststeecacstiesessereatacteatstneateces 1
WV Tih mia Vue 61A 1
II Cách phát hiện tính mùa vụ ngẫu nhiên và phương pháp loại bỏ .- 2
1 Cách phát hiện tính mùa vụ ngẫu nhiên ¿- 2252222 S3 S2 SE SE zxsessez 2 2 Phương pháp loại bỏ tính mùa vụ ngẫu nhiên 2-2 +52 52 +52 S2 czx+zcz+zse2 3 III Thực hiện trên phần 1 .ằŠằ 3
“sa ẽ .4 3
2 M6 ta BG die LGU: oo ae aă ăăă 5
2.1 Mô tả kiểu đữ liệu: ¿+ 222221 HE H11” 2110 10H rêu 5
2.2 Truvo quan dit HOU: iiiááááịaáaiii 6
3 Quy trình thực hẲiỆn: 2222211121155 11 251 2 1 2k1 KT 10
4 Phát hiện tính mùa vụ ngẫu NHIÊN cccQQSn SH SH SH nY nh nh khen 10
4 Loại bỏ tính mùa vụ ngẫu n0 c cece ceeeeceeeeeeeeeeeceeueeeeseeeecueeseaneeeeaneeneneeenen 15
IV Kết luận chủ đề - :- tt x21 121222111121 1 1 101gr 17
LINK THAM KHẢO Q TT TT T121 1n 1n KH k SH xnxx TH k TH KHE kg key 19
Trang 3| Tong quat vé tinh mua vụ
1 Tinh mua vu
1.1 Khai niém
Tính mùa vụ trong đữ liệu chuỗi thời gian đề cập đến những biến động tăng
hoặc giảm lặp đi lặp lại một cách đều đặn của dữ liệu trong một khoảng thời gian
1.2 Đặc điểm
Một số tính mùa vụ phố biến khi phân tích Time Series data:
Weekly Seasonality: Sự thay đối lặp lại trong khoảng thời gian 7 ngày Ví dụ: số
lượng vẻ xem phim tại các rạp tăng mạnh vào các địp cuối tuần
Monthly Seasonality: Sự thay đôi lặp lại trong khoảng thời gian 30 hoặc 31 ngày Ví du: Chị tiêu của người dùng shopee tăng vọt vào các đợt sales dinh ky hang thang
Annual Seasonality: Su thay doi lap lại trong khoảng thời gian 365 hoặc 366 ngày Ví dụ: Số lượng khách du lich tang vọt vào các đợt cao điểm tháng hè
Holiday Seasonality: Sy thay déi nay thuong được gây ra bởi các sự kiện đặc biệt như ngày lễ, lễ hội, sự kiện thể thao Ví dụ: Doanh số các hãng bán lẻ tăng mạnh vào địp
sát Tết
2 Tính mùa vụ ngẫu nhiên
2.1 Định nghĩa
Tính mùa vụ ngẫu nhiên là sự biến đối không có một mô hình cố định theo thời
gian và không có sự dự đoán trước về các biến đôi này Trong ngữ cảnh phân tích thời
gian, tính mùa vụ ngẫu nhiên đề cập đến các biến đôi không theo quy luật hoặc chu kỳ
có định trong đữ liệu thời gian, mà thường do các yếu tố ngẫu nhiên như biến động
ngầu nhiên của thị trường, sự kiện bât ngờ, hoặc các yêu tô tự nhiên
Trang 42.2 Dac diem
Không có chu kỳ: Tính mùa vụ ngẫu nhiên không tuân theo một chu kỳ hoặc
mô hình cô định, mà thường biến đối một cách ngẫu nhiên và không đều
Không dự đoán được: Không thê dự đoán trước được các biến đối của tính mùa vụ
ngẫu nhiên do tính ngẫu nhiên của chúng
Ví dụ:
Tính mùa vụ hàng tuần (Weekly seasonality): Biến động theo các chu kỳ hàng
tuần, ví dụ như đoanh số bán hàng tăng vảo cuối tuần và giảm vào đầu tuần
Tính mùa vụ hàng tháng (Monthly seasonality): Biến động theo các chu kỳ hàng
tháng, ví dụ như doanh số bán hàng tăng vảo cuối tháng khi người dùng nhận lương
và giảm vào đầu tháng
Tính mùa vụ hàng năm (Yearly seasonality): Biến động theo các chu kỳ hàng
năm, ví dụ như doanh số bán hàng tăng vào mùa lễ hội như Giáng sinh và giảm sau kỳ
nghỉ lễ
II Cách phát hiện tính mùa vụ ngẫu nhiên và phương pháp loại bỏ
1 Cách phát hiện tính mùa vụ ngẫu nhiên
Biểu đồ dãn cách và Biểu đồ chu kỳ:
Vẽ biểu đồ dãn cách dé quan sát sự biến động theo thời gian vả xem xét có sự
mùa vụ nảo không Biểu đồ chu kỳ cũng có thể giúp bạn nhận diện các mô hình chu
kỳ
Biéu dé ACF va PACF:
Sử dụng biểu đồ tự tương quan (ACF) và biểu đồ tự tương quan riêng lẻ
(PACF) để phân tích mỗi quan hệ giữa các quan sát ở các khoảng thời gian khác nhau
Các đỉnh ở lớp lớn có thê chỉ ra sự hiện diện của mô hình mùa vụ
Phuong phap Spectral Analysis:
Sử dụng phân tích phô để xác định các tần số quan trọng trong đữ liệu Sự xuất
hiện của các tần số có thể chỉ ra tính chất mùa vụ
Mô hình ARIMA:
Trang 5Mô hình ARIMA có thê tự động xử lý các thành phần mùa vụ Nếu mô hình
chọn có các tham số mùa vụ, điều nảy có thể là đấu hiệu của tính mùa vụ trong đữ
liệu
Kiểm tra thống kê:
Sử dụng các kiểm tra thống kê nhu Augmented Dickey-Fuller (ADF) dé kiém
tra tính chất mùa vụ của dữ liệu
2 Phương pháp loại bỏ tính mùa vụ ngẫu nhiên
Differencing:
Áp dụng phương pháp difrencing để loại bỏ các thành phần mùa vụ từ đữ
liệu Diferencing có thé giúp chuyền đổi đữ liệu thành dạng không có mùa vụ
Decomposition:
Sử dụng phương pháp decomposition để phân rã chuỗi thời gian thành các
thành phần, bao gồm thành phần mùa vụ Sau đó, bạn có thể loại bỏ thành phần mùa
vụ trước khi tái tạo chuỗi
Mô hình Seasonal Decomposition of Time Series (STL):
STL là một phương pháp phố biến đề phân rã chuỗi thời gian thành các thành
phần mùa vụ, trend và residual Bạn có thể loại bỏ thành phần mùa vụ và nhận được
chuỗi không có mùa vụ
Sử dụng mô hình dự báo:
Huấn luyện một mô hình dự báo mà không bao gồm tính mùa vụ và sử dụng nó
để dự báo dữ liệu Sau đó, loại bỏ dự báo mùa vụ khỏi chuỗi thời gian gốc
Transformations:
Áp dụng các biến đôi như log-transform để giảm đi sự biến động mùa vụ
III Thực hiện trên phần mềm
1 Dat van de:
Trong thời buôi hiện nay, khi thị trường kinh tế có dấu hiệu khởi sắc sau những
năm bị ảnh hưởng bởi dịch bệnh và chiến tranh thì nhu cầu tiết kiệm tiền của nguoi
dân đã hết do nhà nước chủ trương giảm lãi suất tiết kiệm của ngân hàng trong năm
3
Trang 62024 Chính vì vậy nhu cầu đầu tư của người dân đã tăng lên và thị trường chứng
khoán chính là một nơi lý tưởng để dòng tiền đầu tư của người dân đồ vào Theo TS
Lê Hải Trung phân tích “Tôi cho rằng, những yếu tô này trong năm 2024 sẽ dần được
kiểm soát và đi vào ôn định Từ phía quốc tế, mặc dù các ngân hàng trung ương thế
giới phát đi tín hiệu giảm lãi suất điều hành nhưng thời điểm giảm như thế nào, mức
giảm ra sao cũng là câu hỏi còn đang bỏ ngỏ Theo tôi, thời điểm giảm sẽ không quá
sớm và mức giảm không lớn đề đảm bảo kinh tê thê giới có mức độ hạ cánh mêm
Bên cạnh đó, Chính phủ Việt Nam và Ngân hàng Nhà nước đã có động thái
tương đối rõ ràng trong việc sẵn sàng can thiệp vào thị trường vàng, nhằm đảm bảo sự
ôn định, hạn chế tính đầu cơ cũng như chênh lệch giữa giá vàng trong nước và thế
giới Vì vậy, những yếu tổ tác động đây giá vàng lên cao được giảm bớt, sẽ giúp cho
kênh đầu tư trên thị trường vàng ôn định hơn Tuy nhiên, trước những mức độ rủi ro
có thể tiém tang trong nam 2024, thì vàng vẫn là một trong những lựa chọn cho các
nhà đầu tư dưới góc độ phòng ngừa rủi ro thay vì đầu cơ ngắn hạn”
Tuy hấp dẫn là thế, nhưng thị trường chứng khoán có những rủi ro mà nhà đầu
tư khó có thê kiểm soát Chính vì vậy, nhóm chúng tôi quyết định phân tích một chỉ số
CBOE (Chicago Board Options Exchange) của một mã chứng khoán lớn là Amazon
Nhằm phân tích đo lường mức độ biến động dự kiến của thị trường chứng khoán trong
tương lai Chúng tôi hy vọng với bài phân tích này có thể giúp nhà đầu tư có cái nhìn
khách quan và tự quyết định được việc quản lý rủi ro của mã chứng khoán này
Bên cạnh đó, VIX (CBOE - Cboe Volatility Index) là chỉ số đo lường trạng thái
biến động chung của thị trường chứng khoán, dùng để đo mức độ biến động dự kiến
của 30 ngảy tới trên thị trường chứng khoán, bằng việc sử dụng dữ liệu về quyền chọn
từ 500 cô phiếu công ty thuộc chỉ số này Nguồn dữ liệu chúng tôi sẽ lấy từ trên Fred
để đảm bảo tính chính xác của bộ dữ liệu, thời gian của bộ dữ liệu sẽ được lay từ
1/1/2010 - 29/2/2024
Trang 72 Mô tả bộ dữ liệu:
2.1 Mô tả kiểu dữ liệu:
2 Mar 2024 13:14
Display format
quarter== 1.0000 quarter== 2.0000 quarter== 3.0000 quarter== 4.0000
Sorted by: time
Tong thé mà nhóm khảo sát gồm 3588 quan sat Dé tiến hành ước lượng
các mô hình phủ hợp, nhóm lựa chọn 2 biến là time với CBOE Amazon
(CBOE Amazon là chỉ số VIX của Amazon từ ngày 1/1/2010 đến ngày 29
2/2024)
Trang 8Nhận xét: Chỉ số VIX của Amazon đã biến động ngẫu nhiên trong giai đoạn
2010 đến cuối 2024 Tuy nhiên, vẫn có sự ôn định tối thiểu giữ cho chỉ số
không thấp hơn mức thấp nhất là 5 và cao hơn mức cao nhất là 76
Trang 9Đồ thị ACF cho chúng ta thấy đây là một bộ dữ liệu tương quan rất mạnh khi tất cả
các độ trề đều năm ngoài khoảng tin cậy
Đồ thị PACF cho chúng ta thấy các độ trễ tắt sau 3 độ trễ
Trang 10xấp xỉ lệch trái nghĩa là các giá trị đữ liệu được phân bố đều xung quanh gần giá trị
trái điều này có thể cho thấy rằng các yếu tố đều đóng vai trò quan trọng trong việc
xác định CBOE
Trang 11Dé thi Box plot thé hién chi s6 CBOE cho toan bé đữ liệu của tổng thể
Nhận xét: Đồ thị boxplot mô tả biến ra CBOE, nhìn đồ thị boxplot có thể nhìn
thay rd hon CBOE nam trong khoảng 10-60 và chiếm nhiều nhất là từ hơn 24-40,
mean khoảng 25 Và dữ liệu có giá trị ngoại lai
2.3 Dùng các trị thông kê mô tả:
Trang 12Nhận xét: Độ lệch (Skewness) trong trường hợp này, độ lệch của chỉ số CBOE
là 0,527463 Độ lệch dương nhỏ cho thấy phân phối có dạng đối xứng tương đối, với
phần lớn các giá trị năm ở xung quanh trung bình
Độ nhọn (Kurtosis) trong trường hợp này, độ nhọn của chỉ số CBOE là
2,899837 Độ nhọn dương cho thấy phân phối có phần đuôi nhiều hơn phân phối
chuân, tức là có nhiêu giá trị năm ở phân đuôi
Kiểm định phân phối chuẩn:
Skewness and kurtosis tests for normality
————— Joint test -
Đồ thị cho thấy hình dáng phân phối của dữ liệu khá cân đối Ta tiến hành kiêm định
phân phối chuẩn của dữ liệu với giả thiết:
H0 : Dữ liệu có phân phối chuẩn
HI : Dữ liệu không có phân phối chuẩn
Trực quan hóa đữ liệu để kiểm tra tính mùa vụ
Tìm phương pháp loại bỏ tính mùa vụ ngẫu nhiên
4 Phát hiện tính mùa vụ ngẫu nhiên
Khai báo dữ liệu chuỗi thời gian
tsset time
10
Trang 13Nhận xét: Ta có thê thấy ví dụ như quý 2 năm 2010, quý 2 năm 2015 và quý 2
năm 2020 đồ thị có sự tương đồng lặp lại, khi CBOE sẽ tăng lên, đạt đỉnh vào quý 3
và quý 4 sẽ giảm Có thê dữ liệu có tính mùa, nên chúng tôi sẽ đi kiểm tra
Kiểm tra tính mùa bằng cách đặt biến giả mùa vụ
gen quarter = quarter (dofg(time))
tab quarter, gen(quarter)
Trang 14Nhận xét: Ta thấy các đữ khá đều với các quý đều có 14 quan sát đầy đủ, trừ
năm 2010 không có quý l do dữ liệu được thu thập tử quý 2 trở đi
Hồi quy theo biến giả mùa vụ
Adj R-squared = 0.9549 Total | 68292.6077 55 1241.68378 Root MSE = 7.4855
CBOE | Coefficient Std err t P>|t| [95% conf interval]
quarterl | 34.97201 2.076116 16.84 0.000 30.80403 39.13998 quarter2 | 34.06027 2.000596 17.03 0.000 30.04391 38.07664 quarter3 | 34.0542 2.000596 17.02 0.000 30.03784 38.07056 quarter4 | 34.9063 2.000596 17.45 0.000 30.88994 38.92267
Nhận xét: các hệ số biến giả thời gian sau khi hồi quy đều khác 0, chứng tỏ có
tính mùa vụ có định
P-value (F>291.95)=0, mô hình phù hợp với mức ý nghĩa 5%
Loại bỏ tính mùa vụ cô định
Tạo chuỗi phần dư đặt tên là Y_ deseasonal
Y_ deseasonal = Y - Y
Nhận xét: vì chúng ta đã hồi quy với biến giả mùa vụ,nên chúng talấy
phằndưmôhìnhhồi quysẽ khửbỏtính mùacôđịnh
predict Y deseasonal, residuals
Trang 15Vẽ đồ thị để phát hiện mùa vụ ngẫu nhiên
Nhận xét: Sau khi đã khử tính mùa vụ có định và có được chuỗi Y_ deseasonal,
ta sẽ vẽ đồ thị xem có còn tính mùa nữa hay không Đồ thị của chuỗi phần dư sau khi
loại bỏ tính mùa vẫn còn các dấu hiệu biến động lặp lại theo chu kỳ mùa mặc dù
không được rõ ràng và ôn định Như vậy chúng ta có thé trong chuỗi dữ liệu vẫn còn
tinh mua vu ngau nhiên
13
Trang 17Nhận xét PACF: Phần mô hình theo mùa có thể là MA(1) vì độ trễ 1 và độ trễ
thứ 5 có ý nghĩa thông kê
4 Loại bỏ tính mùa vụ ngẫu nhiên
Kiêm định tính dừng
dfuller Y deseasonal
HO: Random walk without drift, d= 0
Dickey-Fuller
Test 89 - eritical value -
Z(t) -3.503 -3.574 -2.927 -2.598
MacKinnon approximate p-value for Z(t) = 0.0079
Lay sai phân bậc 1 của biến Y_ deseasonal
generate Y deseasonal diff = D.Y deseasonal
afuller Y deseasonal diff
HO: Random walk without drift, d= 0
Trang 18Lay sai phan bac 2
generate Y deseasonal diff2 = D.D.Y deseasonal
afuller Y deseasonal diff2
HO: Random walk without drift, d= 0
Dickey-Fuller
Test 89 - eritical value -
MacKinnon approximate p-value for Z(t) = 0.0000
Chạy mô hình arima
arima Y deseasonal , arima(0,1,1) sarima(0,1,1,4) noconstant
(switching optimization to BFGS)
Trang 19Note: The test of the variance against zero is one sided, and the two-sided
confidence interval is truncated at zero
Nhận xét: Mô hình S-Arima (0,1,1)(0,1,1,4) đã có thê hồi quy được chuỗi phần dư,
các hệ số có p-value = 0, mô hình phủ hợp
Mô hình hoá băng cach su dung m6 hinh AR=0, d=1, MA=1 va thanh phan theo mua
la AR=0, D=1, MA=1
IV Kết luận chủ đề
Trong quá trình thực hiện các quá trình đề đối phó với tính mùa vụ ngẫu nhiên,
chúng ta nhận thức được tầm quan trọng của việc hiểu rõ về biến động không dự đoán
được trong dữ liệu Tính mùa vụ ngẫu nhiên có thê làm suy giảm độ chính xác của kết
quả phân tích và tăng nguy cơ đưa ra kết luận không chính xác về quân thé
Bằng cách sử dụng các phương pháp thống kê, chúng ta đã có cơ hội phát hiện
và đánh giá mức độ ảnh hưởng của tính mùa vụ ngẫu nhiên Qua đó, việc kiểm soát
yếu tố ngẫu nhiên, lựa chọn phương pháp thống kê chính xác và phân tích chuỗi thời
gian đã giúp chúng ta đưa ra những kết quả đáng tin cậy hơn
Bằng cách này, chúng ta đã tăng cường sự chắc chắn và tính hợp lý của phân
tích dữ liệu, giúp đưa ra những quyết định và kết luận có tính khái quát hóa cao hơn
Việc thực hành trên các phần mềm thông kê đã mang lại sự hiệu quả và thuận lợi
trong việc triển khai các biện pháp loại bỏ tính mùa vụ ngẫu nhiên
Qua đó, việc đối mặt với tính mùa vụ ngẫu nhiên là một phần quan trọng của
quá trình nghiên cứu và phân tích dữ liệu, và các phương pháp đã thực hiện đã đóng
góp vào sự đáng tin cậy của kết quả và sự chắc chắn trong quyết định
Thông qua bài tiểu luận trên, hắn chúng ta đã có cái nhìn khách quan hơn về mã
chứng khoán của Amazon cũng như việc ứng dụng chỉ số CBOE vào việc đánh giá
17