Tính cấp thiết của đề tài: Một mô hình dự báo lợi nhuận cô phiều có tính cấp thiết cao vì nó cho phép các nhà đầu tư và doanh nghiệp có thê đưa ra các quyết định tài chính với hiệu quả
Trang 1
TRƯỜNG ĐẠI HỌC NGUYÊN TÁT THÀNH
KHOA CÔNG NGHỆ THÔNG TIN
NGUYEN TAT THANH
TIỂU LUẬN PHÂN TÍCH DU LIEU CHUỎI THỜI GIAN VÀ ỨNG
DỤNG
MO HINH DU BAO LOI NHUAN CO PHIEU
Giảng viên hướng dan: DANG NHU PHU
Nganh/ chuyén nganh: KHOA HOC DU LIEU
TPHCM, tháng 05 năm 2023
Trang 2TRƯỜNG ĐẠI HỌC NGUYÊN TẮT THÀNH
TRUNG TÂM KHẢO THÍ
Nhóm sinh viên thực hiện :
1.Lê Võ Quốc Huy
2.Võ Tuần Kiệt 00 n222122122121121 22 e2 Tham gia đóng góp:50%
 cu nh HH HH HH nh HH HH Hành kg Tham gia đóng góp:
— B Tham gia đóng góp:
L n1 n1 H11 41 ch ch nh HH HH 1 11 trg Tham gia đóng góp:
ĐT HH HH HH HH HH nh HH HH HH kg Tham gia đóng góp:
TL 1111 1 1H HH tà HH Hà cty Tham gia đóng góp:
Boi nh HH HH HH TH Hành tà Tham gia đóng góp:
Ngày thị: 11/05/2023 1c HH H11 HH g Phòng thi:L.510
Đề tài tiêu luận/báo cáo của sinh viên : BM-ChT- KY THI KET THUC HOC PHAN HỌC KỲ NĂM HỌC -
PHIEU CHAM THỊ TIỂU LUẬN/ĐỎ ÁN Môn thi: phân tích dữ liệu chuỗi thời gian và ứng dụng .Lớp học phần: 20DTH1D
Phân đánh giá của giảng viên (căn cứ trên thang rubrics của môn học): Tiêu chí (theo CDR HP) Danh gia cia GV da Diém toi Diem dat được Câu trúc của báo cáo Nội dung - Các nội dung thành phần - Lập luận - Kết luận Trinh bay TONG DIEM
Giang vién cham thi
(ky, ghi ré ho tén)
Trang 3
LỜI CẢM ƠN
Trước tiên em xin chân thành cảm ơn và biết ơn sâu sắc đến thầy Đặng Như Phú là giảng viên hướng dẫn em thực hiện đề tài Thầy đã giúp đỡ và hướng dẫn em tận tình trong suốt thời gian học tập, tạo cho em những kiến thức đề tiếp cận vấn đè, phân tích giải quyết vẫn
đề Em xin cảm ơn gia đình, bạn bè, người thân đã luôn ở bên đề động viên và là nguồn
cô vũ lớn lao, là động lực giúp em hoàn thành đề tài này
Mặc dù đã cô gắng hoàn thành đề tài trong phạm vi va kha nang co thé Tuy nhiên sẽ
không tránh khỏi những thiếu sót Em rất mong nhận được sự cảm thông và tận tinh chỉ
bảo của qúy thầy cô và toàn thê các bạn
Cuối cùng em xin gửi tới mọi người lời chúc thành công trên con đường sự nghiệp của
minh
1
Trang 4LỜI MỞ ĐẦU
Trong mười năm qua, sự phát triển của công nghệ đã và đang ảnh hưởng rất nhiều đến cuộc sông chúng ta Cách đây không lâu, chúng ta chỉ có một điện thoại nối dây cho tat ca các thành viên trong gia đình sử dụng, bây giờ không thể tưởng tượng cuộc sống hàng ngày của chúng tôi sẽ ra sao nếu không có điện thoại thông minh di động trong túi Mặc
dù chức năng chính của điện thoại di động là viễn thông, nhiều người vẫn thích sử dụng
các ứng dụng di động đề kết nối với người khác, song song với điện thoại chúng ta cũng
có những chiếc máy tính xách tay , máy tính bàn
Việc mua bán trong thời đại công nghệ 4.0 này giúp chúng ta có thể để dàng kiểm soát được việc mua bán , thống kê danh thu , khách hàng một cách đễ đàng hơn, giảm tôi thiêu những rủi ro không cần thiết trong việc mua bán Thê nên việc các sản phâm ứng dụng giúp chúng ta làm việc đó ra đời ngày càng một nhiều hơn
UL
Trang 5MỤC LỤC
1.1 Tính cấp thiết của đề tài: cua 1
1.2 Mục tiêu nghiÊn cỨU: - 0212111211112 2 2111101112111 1 11811201111 kh ch 1
1.3 Đối tượng và phạm vi nghiên CỨU: - 52 c SE 2111121121121 E111 re 1 1.4 Phương pháp nghiên cỨU: - - Đ c2 2212222122211 1121 152115211 n 55181111 key 2
2.1 Giới thiệu về chuỗi thời gian: - 5 St 1 1121111212121 12111 rrree 3
P.3 on .-.4 7 P8 (0 sa: D eeeceeeeseeeseeeestseecesseeeesstiteeesnsees 7 2.2.3 Intergrated ẽ ăanäšä5 8
Trang 6DANH MỤC BANG HINH
Hình I : Đồ thị giá đóng cửa - cv ng n HH H1 2H HH ren 11
Hình 2: Đồ thị chuỗi dữ liệu logarit giá đóng cửa Close - set 12 Hình 3 Đồ thị chuỗi đữ liệu sai phân bậc 1 của Logelose - s5: Sccsccec sec tet 12 Hình 4 Tính chất của hàm tự tương quan và tương quan riêng phần -5-55¿ 13 Hình 5 :Tính chất hàm tự tương quan và tương quan riêng phần của phân dư 15 Hình 6: Tính chất hàm tự tương quan và tương quan riêng phần của phân dư của 0/1107 - d 18 Hình 7 Kết quá dự báo cho chuỗi LogreturnclÏos - s2: s22 xcx2EeExeEzExerxererrere 20
Trang 7DANH MUC BANG BIEU
Bang 1 Kiém tra tinh dig ctta Chui Close cccccccecsscsseessscssessvseesesseesevevsrsevsvsvsesevseseees ll Bang 2: Kiém tra tinh dimg cia chudi Logretumclose c ccccccsscsscsescesessesseseeessveseseeees 13
Bảng 3: Ước lượng các hệ số của các mô hình ARIMA S2 S22 121212 re, 14
Bảng 4: Hồi quy mô hình ARIMA(1,0,4)-ARCH() 5S E2 xe rrre 16 Bảng 5: Hồi quy mô hình ARIMA(1,0,4)-GARCH(1,) 2 2c 222221125 2522122 xe 17 Bảng 6: Hồi quy mô hình ARIMA(5,0,5)-GARCH(I,) 25-25222221 212x222 xxe 19 Bảng 7: Kết quá dự báo của mô hình ARIMA(1,0,4)- ARCH() 2-55 2c 20 Bảng 8:Ước lượng các hệ số của các mô hình ARFIMA-FIGARCH - -55-: 21
Trang 8CHUONG 1:
TONG QUAN DE TAI 1.1 Tính cấp thiết của đề tài:
Một mô hình dự báo lợi nhuận cô phiều có tính cấp thiết cao vì nó cho phép các nhà đầu
tư và doanh nghiệp có thê đưa ra các quyết định tài chính với hiệu quả cao hơn Mô hình này có thê giúp đưa ra dự đoán về sự gia tăng hoặc giảm giá của cô phiếu trong tương lai,
từ đó giúp cho các nhà đầu tư có kế hoạch tái cơ cầu danh mục đầu tư của mình và đưa ra
các quyết định đầu tư thông minh hơn Đối với doanh nghiệp, một mô hình dự báo lợi
nhuận cổ phiếu có thê giúp giám đốc tài chính làm việc với các bộ phận khác để điều
chỉnh chiến lược tài chính của công ty, dựa trên dự báo về lợi nhuận cô phiều
1.2 Mục tiêu nghiên cứu:
Mục tiêu chính của mô hình dự báo lợi nhuận cô phiêu là đưa ra các dự đoán về giá trị
cô phiéu trong tương lai, dựa trên các chỉ số tài chính và hoạt động kinh doanh hiện tại
của công ty Nghiên cứu mô hình này có thể giúp các nhà đầu tư và doanh nghiệp có thể đưa ra quyết định tài chính thông minh và thành công hơn, từ đó giảm thiêu rủi ro trong đầu tư và tăng cường hiệu suất tài chính Ngoài ra, một số mục tiêu khác của nghiên cứu
mô hình dự báo lợi nhuận cô phiếu có thê bao gồm tối ưu hóa việc phân bô danh mục đầu
tư, đự báo xu hướng thị trường và đóng góp vào lĩnh vực phân tích tài chính và đầu tư 1.3 Đối tượng và phạm vỉ nghiên cứu:
- Đối tượng của mô hình dự báo lợi nhuận cô phiêu là các nhà đầu tư và doanh nghiệp có
quan tâm đến việc đưa ra quyết định tài chính dựa trên dự đoán về giá trị cổ phiếu trong tương lai
- Phạm vi nghiên cửu của mô hình này bao gồm phân tích tài chính của công ty, định lượng các chỉ số tài chính và xây đựng mô hình phù hợp đề dự báo lợi nhuận cô phiếu Nghiên cứu này bao gồm cả các phương pháp thông kê, học máy, và khoa học đữ liệu đề
Trang 91.4 Phương pháp nghiên cứu:
Phương pháp nghiên cứu của mô hình dự báo lợi nhuận cổ phiếu chúng ta sẽ thực hiện theo các bước sau đây:
1 Phân tích tài chính của công ty: Nghiên cứu các thông tin chỉ tiết liên quan tới hoạt động kinh doanh, tài chính và quản lý của công ty
Xác định các chỉ số tài chính: Chọn ra những chỉ số tài chính quan trọng để sử
dụng trong việc xây dựng mô hình dự báo
Thu thập dữ liệu: Tập trung thu thập đữ liệu về các chỉ số tài chính, giá cô phiếu,
và các yếu tô khác có liên quan
Chuẩn bị đữ liệu: Tiền xử lý và chuẩn hóa các dữ liệu thu thập được
Xây đựng mô hình: Áp dụng các phương pháp thống kê và học máy để xây dựng
mô hình dự báo lợi nhuận cô phiếu
Kiểm định và đánh giá mô hình: Sử dụng các phương pháp đánh giá mô hình đề đo
lường độ chính xác và độ ôn định của mô hình
Triển khai mô hình: Sử đụng mô hình đề dự đoán giá trị cô phiếu trong tương lai
và đưa ra các quyết định tài chính thông minh
Phương pháp nghiên cứu của mô hình dự báo lợi nhuận cổ phiếu hiện nay thường sử dụng
các công cụ khoa học đữ liệu, học máy, va phân tích thống kê để đảm bảo tính chính xác
và ôn định của mô hình
Trang 10CHƯƠNG 2:
CO SO LY THUYET
2.1 Giới thiệu về chuỗi thời gian:
Dự báo chuỗi thời gian là một lớp mô hình quan trọng trong thống kê, kinh tế lượng và machine learning, so di chung ta goi lớp mô hình này là chuôi thời gian (time series) là vì
mô hình được áp dụng trên các chuỗi đặc thù có yêu tô thời gian Một mô hình chuôi thời gian thường dự báo dựa trên giả định răng các qui luật trong quá khứ sẽ lặp lại ở tương lai Do đó, xây dựng mô hình chuôi thời gian là chúng ta đang mô hình hóa môi quan hệ trong quá khứ giữa biến độc lập (biến đầu vào) và biến phụ thuộc (biến mục tiêu), dựa vào mỗi quan hệ này đề dự đoán giá trị trong tương lai của biến phụ thuộc
Do là dữ liệu chịu ảnh hướng bởi tính chất thời gian nên chuỗi thời gian thường xuất hiện những qui luật đặc trưng như : yêu tô chu kỳ, mùa vụ và yêu tô xu hướng Dây là những đặc trưng thường thây và xuất hiện ở hâu hệt các chuối thời gian
« Yếu tố chu kỳ, mùa vụ là những đặc tính lặp lại theo chu kỳ Ví dụ như nhiệt độ
trung bình các tháng trong năm sẽ chịu ảnh hưởng bởi các mùa xuân, hạ, thu, đông
Trang 11Hay xuất nhập khẩu của một quốc gia thường có chu kỳ theo các quí
Series Values for Temperature
Trang 12tăng này đại điện cho sự mất giá của đồng tiền
AR(2) Data with Time Trend
chính sách Bên dưới là một số ứng dụng của dự báo chuỗi thời gian:
® Dự báo nhu cầu thị trường dé lap kết hoạch sản xuất kinh đoanh cho hãng
® Dự báo lợi suất tài sản tài chính, tỷ giá, giá cả hàng hóa phái sinh đề thực hiện
trading hiéu qua trong market risk
¢ Dy bao gia chứng khoán, các chuỗi lợi suất danh mục đề quản trị danh mục đầu tư
® Dự báo giá bitcoin, giá dầu mỏ, giá gas
® Dự báo nhiệt độ, lượng mưa để lập kế hoạch sản xuất nông, lâm, ngư nghiệp
® Dự báo tác động của các nhân tô vĩ mô như lãi suất, cung tiền, đầu tư trực tiếp nước ngoài, ch¡ tiêu chính phủ, lạm phát tác động lên tăng trưởng GDP đề điều hành nên kinh tế
Vai trò của chuỗi thời gian rất quan trọng đối với nền kinh tế và hoạt động của doanh nghiệp nên trong machine learning và thống kê có những ngành học nghiên cứu chuyên sâu về chuỗi thời gian như kinh tế lượng, định giá tài sản tài chính
Khác với các mô hình dự báo thông thuong trong machine learning, các mô hình trong dự báo chuỗi thời gian trong kinh tế lượng có những đặc trưng rất riêng Đòi hỏi phải tuân thủ nghiêm ngặt các điều kiện về chuỗi dừng, nhiễu trắng và tự tương quan Có rất nhiều lớp mô hình chuỗi thời gian khác nhau và môi một lớp mô hình sẽ có một tiêu chuẩn áp dụng cụ thê Chúng ta có thể liệt kê một số mô hình phô biến:
s® Mô hình ARIMA: Dựa trên giả thuyết chuỗi dừng và phương sai sai số không đôi
Mô hình sử dụng đầu vào chính là những tín hiệu quá khứ của chuỗi được đự báo
dé dir bao no Các tín hiệu đó bao gồm: chuỗi tự hồi qui AR (auto regression) và chuỗi trung bình trượt MA (moving average) Hầu hết các chuỗi thời gian sẽ có xu
5
Trang 13hướng tăng hoặc giảm theo thời gian, đo đó yếu tô chuỗi đừng thường không đạt được Trong trường hợp chuỗi không dừng thì ta sẽ cần biến đổi sang chuỗi dừng bằng sai phân Khi đó tham số đặc trưng của mô hình sẽ có thêm thành phần bậc của sai phân d và mô hình được đặc tả bởi 3 tham số ARIMA(, đ, q)
se Mô hình SARIMA: Về bản chất đây là mô hình ARIMA nhưng được điều chỉnh
đặc biệt đề áp dụng cho những chuỗi thời gian có yêu tổ mùa vụ Như chúng ta đã
biết về bản chất ARIMA chính là mô hình hồi qui tuyến tính nhưng mối quan hệ
tuyến tính thường không giải thích tốt chuỗi trong trường hợp chuỗi xuất hiện yếu
tô mùa vụ Chính vì thế, bằng cách tìm ra chu kì của qui luật mùa vụ và loại bỏ nó
khỏi chuỗi ta sẽ để dàng hồi qui mô hình theo phương pháp ARIMA
® Mô hình ARIMAX: Là một dạng mở rộng của model ARIMA Mô hình cũng dựa trên giải định về mối quan hệ tuyến tính giữa giá trị và phương sai trong quá khứ với giá trị hiện tại và sử dụng phương trình hồi qui tuyến tính được suy ra từ mối quan hệ trong quá khứ nhằm dự báo tương lai Mô hình sẽ có thêm một vài biến độc lập khác và cũng được xem như một mô hình hồi qui động (hoặc một số tài
liệu tiếng việt gọi là mô hình hồi qui động thái) Về bản chất ARIMAX tương ứng
với một mô hình hồi qui đa biến nhưng chiếm lợi thế trong dự báo nhờ xem xét
đến yêu tô tự tương quan được biều điễn trong phần dư của mô hình Nhờ đó cải thiện độ chính xác
s® Mô hình GARCH: Các giả thuyết về chuỗi dừng và phương sai sai số không đôi đều không dễ đạt được trong thực tế Trái lại phương sai sai số biến đi rất đễ xảy
ra đôi với các chuỗi tài chính, kinh tế bởi thường có những sự kiện không mong đợi và cú sốc kinh tế không lường trước khiến biến động phương sai của chuỗi thay đôi Trong trường hợp đó nếu áp dụng ARIMA thì thường không mang lại hiệu quả cao cho mô hình Các nhà kinh tế lượng và thống kê học đã nghĩ đến một lớp mô hình mà có thê dự báo được phương sai đề kiểm soát các thay đôi không mong đợi Dựa trên qui luật của phương sai, kết quả dự báo chuỗi sẽ tốt hơn so với trước đó
2.2 Mô hình ARIMA:
Hiện tại cả R và python đều support xây dựng các mô hình chuỗi thời gian ARIMA, SARIMA, ARIMAX, GARCH Trên R chúng ta có thê sử dụng các packages như forecast va Imtest dé xây dựng các mô hình này khá dễ đàng Đối với thông kê và các
mô hình chuỗi thời gian R đang support tốt hơn python Một lý đo đó là các nhà thống
kê và kinh tế lượng ưa chuộng sử dụng R hơn
Lý thuyết: Chúng ta biết rằng hầu hết các chuỗi thời gian đều có sự tương quan giữa giá trị trong quá khứ đến giá trị hiện tại Mức độ tương quan càng lớn khi chuỗi càng - gan thoi điểm hiện tại Chính vi thể mô hình ARIMA sẽ tìm cách đưa vào các biến trễ nhằm tạo ra một mô hình dự báo ñtting tốt hơn giá trị của chuỗi
ARIMA model là viết tắt của cụm từ Autoregressive Intergrated Moving Average M6 hinh sé biéu dién phương trình hôi qui tuyén tinh da bién (multiple
6
Trang 14linear repression) của các biến đầu vào (còn gọi là biến phụ thuộc trong thống kê)
là 2 thành phân chính:
2.2.1 Auto regression:
Kí hiệu là AR Đây là thành phân tự hỗi qui bao gồm tập hợp các độ trễ của biến hiện tại Độ trễ bậc p chính là giá trị lùi về quá khử p bước thời gian của chuỗi Độ trễ đài hoặc ngắn trong quá trình AR phụ thuộc vào tham số trễ p Cụ thé, quá trình AR(p) của chuỗi xt được biểu diễn như sau:
2.2.2 Moving average:
Quá trình trung bình trượt được hiểu là quá trình dịch chuyển hoặc thay đôi giá trị
trung bình của chuỗi theo thời gian Do chuỗi của chúng ta được giả định là đừng nên quá trình thay đôi trung bình dường như là một chuỗi nhiễu trăng
Quá trình moving average sẽ tìm mối liên hệ về mặt tuyến tính giữa các phần tử ngẫu nhiên t (stochastic term) Chuỗi này phải là một chuỗi nhiễu trăng thỏa mãn các tính chất:
¢ Nhiéu trắng là một thành phần ngẫu nhiên thê hiện cho yếu tố không thể dự báo của model và không có tính qui luật Quá trình trưng bình trượt được biểu diễn theo nhiễu trắng như sau:
q
TA
t=]
® Qua trinh này có thê được biều diễn theo dịch chuyển trễ - backshift
operator (https://en.wikipedia.org/wiki/Lag_operator) B như sau:
Như vậy chúng ta đã hình dung ra moving average là gì Về mặt ý tưởng thì
đó chính là quá trình hôi qui tuyên tính của giá trị hiện tại theo các giá trị hiện tai va qua khứ của sai sô nhiéu trang (white noise error term) dai dién cho các
7
Trang 15yêu tô shock ngẫu nhiên, những sự thay đổi không lường trước và giải thích bởi
mô hình
2.2.3 Intergrated:
Là quá trình đồng tích hợp hoặc lây sai phân Yêu cầu chung của các thuật toán trong time series là chuỗi phải đảm bảo tính dừng Hầu hết các chuỗi đều tăng hoặc giảm theo thời gian Do đó yếu tô tương quan giữa chúng chưa chắc
là thực sự mà là do chúng cùng tương quan theo thời gian Khi biến đôi sang chuỗi dừng, các nhân tố ảnh hưởng thời gian được loại bỏ và chuỗi sẽ đễ dự báo hơn Để tạo thành chuỗi đừng, một phương pháp đơn giản nhất là chúng ta
sẽ lấy sai phân Một số chuỗi tài chính còn qui đổi sang logarit hoặc lợi suất
Bậc của sai phân để tạo thành chuỗi dừng còn gọi là bậc của quá trình đồng tích
hợp (order of intergration) Quá trình sai phân bậc d của chuỗi được thực hiện như sau:
Hãy xem mô hình đơn giản sau:
Y: = [Bi] + Bo [Xi] + u, Trong đó, [Xt] là một véctơ gồm k các biến giải thích và [B2] là một véctơ gồm k các hệ
sô Thông thường, ut được giả định tuân theo phân phôi chuân với trung bình băng 0 và phương sai không đôi là Q2
Giả định này được viết như sau: