1. Trang chủ
  2. » Luận Văn - Báo Cáo

Tiểu luận phân tích dữ liệu chuỗi thời gian và ứng dụng mô hình dự báo lợi nhuận cổ phiếu

31 0 0
Tài liệu được quét OCR, nội dung có thể không chính xác
Tài liệu đã được kiểm tra trùng lặp

Đang tải... (xem toàn văn)

Tài liệu hạn chế xem trước, để xem đầy đủ mời bạn chọn Tải xuống

THÔNG TIN TÀI LIỆU

Thông tin cơ bản

Tiêu đề Tiểu Luận Phân Tích Dữ Liệu Chuỗi Thời Gian Và Ứng Dụng Mô Hình Dự Báo Lợi Nhuận Cổ Phiếu
Tác giả Vũ Tuần Kiệt
Người hướng dẫn Đặng Như Phú
Trường học Trường Đại Học Nguyễn Tất Thành
Chuyên ngành Khoa Học Dữ Liệu
Thể loại tiểu luận
Năm xuất bản 2023
Thành phố TPHCM
Định dạng
Số trang 31
Dung lượng 6,01 MB

Nội dung

Tính cấp thiết của đề tài: Một mô hình dự báo lợi nhuận cô phiều có tính cấp thiết cao vì nó cho phép các nhà đầu tư và doanh nghiệp có thê đưa ra các quyết định tài chính với hiệu quả

Trang 1

TRƯỜNG ĐẠI HỌC NGUYÊN TÁT THÀNH

KHOA CÔNG NGHỆ THÔNG TIN

NGUYEN TAT THANH

TIỂU LUẬN PHÂN TÍCH DU LIEU CHUỎI THỜI GIAN VÀ ỨNG

DỤNG

MO HINH DU BAO LOI NHUAN CO PHIEU

Giảng viên hướng dan: DANG NHU PHU

Nganh/ chuyén nganh: KHOA HOC DU LIEU

TPHCM, tháng 05 năm 2023

Trang 2

TRƯỜNG ĐẠI HỌC NGUYÊN TẮT THÀNH

TRUNG TÂM KHẢO THÍ

Nhóm sinh viên thực hiện :

1.Lê Võ Quốc Huy

2.Võ Tuần Kiệt 00 n222122122121121 22 e2 Tham gia đóng góp:50%

 cu nh HH HH HH nh HH HH Hành kg Tham gia đóng góp:

— B Tham gia đóng góp:

L n1 n1 H11 41 ch ch nh HH HH 1 11 trg Tham gia đóng góp:

ĐT HH HH HH HH HH nh HH HH HH kg Tham gia đóng góp:

TL 1111 1 1H HH tà HH Hà cty Tham gia đóng góp:

Boi nh HH HH HH TH Hành tà Tham gia đóng góp:

Ngày thị: 11/05/2023 1c HH H11 HH g Phòng thi:L.510

Đề tài tiêu luận/báo cáo của sinh viên : BM-ChT- KY THI KET THUC HOC PHAN HỌC KỲ NĂM HỌC -

PHIEU CHAM THỊ TIỂU LUẬN/ĐỎ ÁN Môn thi: phân tích dữ liệu chuỗi thời gian và ứng dụng .Lớp học phần: 20DTH1D

Phân đánh giá của giảng viên (căn cứ trên thang rubrics của môn học): Tiêu chí (theo CDR HP) Danh gia cia GV da Diém toi Diem dat được Câu trúc của báo cáo Nội dung - Các nội dung thành phần - Lập luận - Kết luận Trinh bay TONG DIEM

Giang vién cham thi

(ky, ghi ré ho tén)

Trang 3

LỜI CẢM ƠN

Trước tiên em xin chân thành cảm ơn và biết ơn sâu sắc đến thầy Đặng Như Phú là giảng viên hướng dẫn em thực hiện đề tài Thầy đã giúp đỡ và hướng dẫn em tận tình trong suốt thời gian học tập, tạo cho em những kiến thức đề tiếp cận vấn đè, phân tích giải quyết vẫn

đề Em xin cảm ơn gia đình, bạn bè, người thân đã luôn ở bên đề động viên và là nguồn

cô vũ lớn lao, là động lực giúp em hoàn thành đề tài này

Mặc dù đã cô gắng hoàn thành đề tài trong phạm vi va kha nang co thé Tuy nhiên sẽ

không tránh khỏi những thiếu sót Em rất mong nhận được sự cảm thông và tận tinh chỉ

bảo của qúy thầy cô và toàn thê các bạn

Cuối cùng em xin gửi tới mọi người lời chúc thành công trên con đường sự nghiệp của

minh

1

Trang 4

LỜI MỞ ĐẦU

Trong mười năm qua, sự phát triển của công nghệ đã và đang ảnh hưởng rất nhiều đến cuộc sông chúng ta Cách đây không lâu, chúng ta chỉ có một điện thoại nối dây cho tat ca các thành viên trong gia đình sử dụng, bây giờ không thể tưởng tượng cuộc sống hàng ngày của chúng tôi sẽ ra sao nếu không có điện thoại thông minh di động trong túi Mặc

dù chức năng chính của điện thoại di động là viễn thông, nhiều người vẫn thích sử dụng

các ứng dụng di động đề kết nối với người khác, song song với điện thoại chúng ta cũng

có những chiếc máy tính xách tay , máy tính bàn

Việc mua bán trong thời đại công nghệ 4.0 này giúp chúng ta có thể để dàng kiểm soát được việc mua bán , thống kê danh thu , khách hàng một cách đễ đàng hơn, giảm tôi thiêu những rủi ro không cần thiết trong việc mua bán Thê nên việc các sản phâm ứng dụng giúp chúng ta làm việc đó ra đời ngày càng một nhiều hơn

UL

Trang 5

MỤC LỤC

1.1 Tính cấp thiết của đề tài: cua 1

1.2 Mục tiêu nghiÊn cỨU: - 0212111211112 2 2111101112111 1 11811201111 kh ch 1

1.3 Đối tượng và phạm vi nghiên CỨU: - 52 c SE 2111121121121 E111 re 1 1.4 Phương pháp nghiên cỨU: - - Đ c2 2212222122211 1121 152115211 n 55181111 key 2

2.1 Giới thiệu về chuỗi thời gian: - 5 St 1 1121111212121 12111 rrree 3

P.3 on .-.4 7 P8 (0 sa: D eeeceeeeseeeseeeestseecesseeeesstiteeesnsees 7 2.2.3 Intergrated ẽ ăanäšä5 8

Trang 6

DANH MỤC BANG HINH

Hình I : Đồ thị giá đóng cửa - cv ng n HH H1 2H HH ren 11

Hình 2: Đồ thị chuỗi dữ liệu logarit giá đóng cửa Close - set 12 Hình 3 Đồ thị chuỗi đữ liệu sai phân bậc 1 của Logelose - s5: Sccsccec sec tet 12 Hình 4 Tính chất của hàm tự tương quan và tương quan riêng phần -5-55¿ 13 Hình 5 :Tính chất hàm tự tương quan và tương quan riêng phần của phân dư 15 Hình 6: Tính chất hàm tự tương quan và tương quan riêng phần của phân dư của 0/1107 - d 18 Hình 7 Kết quá dự báo cho chuỗi LogreturnclÏos - s2: s22 xcx2EeExeEzExerxererrere 20

Trang 7

DANH MUC BANG BIEU

Bang 1 Kiém tra tinh dig ctta Chui Close cccccccecsscsseessscssessvseesesseesevevsrsevsvsvsesevseseees ll Bang 2: Kiém tra tinh dimg cia chudi Logretumclose c ccccccsscsscsescesessesseseeessveseseeees 13

Bảng 3: Ước lượng các hệ số của các mô hình ARIMA S2 S22 121212 re, 14

Bảng 4: Hồi quy mô hình ARIMA(1,0,4)-ARCH() 5S E2 xe rrre 16 Bảng 5: Hồi quy mô hình ARIMA(1,0,4)-GARCH(1,) 2 2c 222221125 2522122 xe 17 Bảng 6: Hồi quy mô hình ARIMA(5,0,5)-GARCH(I,) 25-25222221 212x222 xxe 19 Bảng 7: Kết quá dự báo của mô hình ARIMA(1,0,4)- ARCH() 2-55 2c 20 Bảng 8:Ước lượng các hệ số của các mô hình ARFIMA-FIGARCH - -55-: 21

Trang 8

CHUONG 1:

TONG QUAN DE TAI 1.1 Tính cấp thiết của đề tài:

Một mô hình dự báo lợi nhuận cô phiều có tính cấp thiết cao vì nó cho phép các nhà đầu

tư và doanh nghiệp có thê đưa ra các quyết định tài chính với hiệu quả cao hơn Mô hình này có thê giúp đưa ra dự đoán về sự gia tăng hoặc giảm giá của cô phiếu trong tương lai,

từ đó giúp cho các nhà đầu tư có kế hoạch tái cơ cầu danh mục đầu tư của mình và đưa ra

các quyết định đầu tư thông minh hơn Đối với doanh nghiệp, một mô hình dự báo lợi

nhuận cổ phiếu có thê giúp giám đốc tài chính làm việc với các bộ phận khác để điều

chỉnh chiến lược tài chính của công ty, dựa trên dự báo về lợi nhuận cô phiều

1.2 Mục tiêu nghiên cứu:

Mục tiêu chính của mô hình dự báo lợi nhuận cô phiêu là đưa ra các dự đoán về giá trị

cô phiéu trong tương lai, dựa trên các chỉ số tài chính và hoạt động kinh doanh hiện tại

của công ty Nghiên cứu mô hình này có thể giúp các nhà đầu tư và doanh nghiệp có thể đưa ra quyết định tài chính thông minh và thành công hơn, từ đó giảm thiêu rủi ro trong đầu tư và tăng cường hiệu suất tài chính Ngoài ra, một số mục tiêu khác của nghiên cứu

mô hình dự báo lợi nhuận cô phiếu có thê bao gồm tối ưu hóa việc phân bô danh mục đầu

tư, đự báo xu hướng thị trường và đóng góp vào lĩnh vực phân tích tài chính và đầu tư 1.3 Đối tượng và phạm vỉ nghiên cứu:

- Đối tượng của mô hình dự báo lợi nhuận cô phiêu là các nhà đầu tư và doanh nghiệp có

quan tâm đến việc đưa ra quyết định tài chính dựa trên dự đoán về giá trị cổ phiếu trong tương lai

- Phạm vi nghiên cửu của mô hình này bao gồm phân tích tài chính của công ty, định lượng các chỉ số tài chính và xây đựng mô hình phù hợp đề dự báo lợi nhuận cô phiếu Nghiên cứu này bao gồm cả các phương pháp thông kê, học máy, và khoa học đữ liệu đề

Trang 9

1.4 Phương pháp nghiên cứu:

Phương pháp nghiên cứu của mô hình dự báo lợi nhuận cổ phiếu chúng ta sẽ thực hiện theo các bước sau đây:

1 Phân tích tài chính của công ty: Nghiên cứu các thông tin chỉ tiết liên quan tới hoạt động kinh doanh, tài chính và quản lý của công ty

Xác định các chỉ số tài chính: Chọn ra những chỉ số tài chính quan trọng để sử

dụng trong việc xây dựng mô hình dự báo

Thu thập dữ liệu: Tập trung thu thập đữ liệu về các chỉ số tài chính, giá cô phiếu,

và các yếu tô khác có liên quan

Chuẩn bị đữ liệu: Tiền xử lý và chuẩn hóa các dữ liệu thu thập được

Xây đựng mô hình: Áp dụng các phương pháp thống kê và học máy để xây dựng

mô hình dự báo lợi nhuận cô phiếu

Kiểm định và đánh giá mô hình: Sử dụng các phương pháp đánh giá mô hình đề đo

lường độ chính xác và độ ôn định của mô hình

Triển khai mô hình: Sử đụng mô hình đề dự đoán giá trị cô phiếu trong tương lai

và đưa ra các quyết định tài chính thông minh

Phương pháp nghiên cứu của mô hình dự báo lợi nhuận cổ phiếu hiện nay thường sử dụng

các công cụ khoa học đữ liệu, học máy, va phân tích thống kê để đảm bảo tính chính xác

và ôn định của mô hình

Trang 10

CHƯƠNG 2:

CO SO LY THUYET

2.1 Giới thiệu về chuỗi thời gian:

Dự báo chuỗi thời gian là một lớp mô hình quan trọng trong thống kê, kinh tế lượng và machine learning, so di chung ta goi lớp mô hình này là chuôi thời gian (time series) là vì

mô hình được áp dụng trên các chuỗi đặc thù có yêu tô thời gian Một mô hình chuôi thời gian thường dự báo dựa trên giả định răng các qui luật trong quá khứ sẽ lặp lại ở tương lai Do đó, xây dựng mô hình chuôi thời gian là chúng ta đang mô hình hóa môi quan hệ trong quá khứ giữa biến độc lập (biến đầu vào) và biến phụ thuộc (biến mục tiêu), dựa vào mỗi quan hệ này đề dự đoán giá trị trong tương lai của biến phụ thuộc

Do là dữ liệu chịu ảnh hướng bởi tính chất thời gian nên chuỗi thời gian thường xuất hiện những qui luật đặc trưng như : yêu tô chu kỳ, mùa vụ và yêu tô xu hướng Dây là những đặc trưng thường thây và xuất hiện ở hâu hệt các chuối thời gian

« Yếu tố chu kỳ, mùa vụ là những đặc tính lặp lại theo chu kỳ Ví dụ như nhiệt độ

trung bình các tháng trong năm sẽ chịu ảnh hưởng bởi các mùa xuân, hạ, thu, đông

Trang 11

Hay xuất nhập khẩu của một quốc gia thường có chu kỳ theo các quí

Series Values for Temperature

Trang 12

tăng này đại điện cho sự mất giá của đồng tiền

AR(2) Data with Time Trend

chính sách Bên dưới là một số ứng dụng của dự báo chuỗi thời gian:

® Dự báo nhu cầu thị trường dé lap kết hoạch sản xuất kinh đoanh cho hãng

® Dự báo lợi suất tài sản tài chính, tỷ giá, giá cả hàng hóa phái sinh đề thực hiện

trading hiéu qua trong market risk

¢ Dy bao gia chứng khoán, các chuỗi lợi suất danh mục đề quản trị danh mục đầu tư

® Dự báo giá bitcoin, giá dầu mỏ, giá gas

® Dự báo nhiệt độ, lượng mưa để lập kế hoạch sản xuất nông, lâm, ngư nghiệp

® Dự báo tác động của các nhân tô vĩ mô như lãi suất, cung tiền, đầu tư trực tiếp nước ngoài, ch¡ tiêu chính phủ, lạm phát tác động lên tăng trưởng GDP đề điều hành nên kinh tế

Vai trò của chuỗi thời gian rất quan trọng đối với nền kinh tế và hoạt động của doanh nghiệp nên trong machine learning và thống kê có những ngành học nghiên cứu chuyên sâu về chuỗi thời gian như kinh tế lượng, định giá tài sản tài chính

Khác với các mô hình dự báo thông thuong trong machine learning, các mô hình trong dự báo chuỗi thời gian trong kinh tế lượng có những đặc trưng rất riêng Đòi hỏi phải tuân thủ nghiêm ngặt các điều kiện về chuỗi dừng, nhiễu trắng và tự tương quan Có rất nhiều lớp mô hình chuỗi thời gian khác nhau và môi một lớp mô hình sẽ có một tiêu chuẩn áp dụng cụ thê Chúng ta có thể liệt kê một số mô hình phô biến:

s® Mô hình ARIMA: Dựa trên giả thuyết chuỗi dừng và phương sai sai số không đôi

Mô hình sử dụng đầu vào chính là những tín hiệu quá khứ của chuỗi được đự báo

dé dir bao no Các tín hiệu đó bao gồm: chuỗi tự hồi qui AR (auto regression) và chuỗi trung bình trượt MA (moving average) Hầu hết các chuỗi thời gian sẽ có xu

5

Trang 13

hướng tăng hoặc giảm theo thời gian, đo đó yếu tô chuỗi đừng thường không đạt được Trong trường hợp chuỗi không dừng thì ta sẽ cần biến đổi sang chuỗi dừng bằng sai phân Khi đó tham số đặc trưng của mô hình sẽ có thêm thành phần bậc của sai phân d và mô hình được đặc tả bởi 3 tham số ARIMA(, đ, q)

se Mô hình SARIMA: Về bản chất đây là mô hình ARIMA nhưng được điều chỉnh

đặc biệt đề áp dụng cho những chuỗi thời gian có yêu tổ mùa vụ Như chúng ta đã

biết về bản chất ARIMA chính là mô hình hồi qui tuyến tính nhưng mối quan hệ

tuyến tính thường không giải thích tốt chuỗi trong trường hợp chuỗi xuất hiện yếu

tô mùa vụ Chính vì thế, bằng cách tìm ra chu kì của qui luật mùa vụ và loại bỏ nó

khỏi chuỗi ta sẽ để dàng hồi qui mô hình theo phương pháp ARIMA

® Mô hình ARIMAX: Là một dạng mở rộng của model ARIMA Mô hình cũng dựa trên giải định về mối quan hệ tuyến tính giữa giá trị và phương sai trong quá khứ với giá trị hiện tại và sử dụng phương trình hồi qui tuyến tính được suy ra từ mối quan hệ trong quá khứ nhằm dự báo tương lai Mô hình sẽ có thêm một vài biến độc lập khác và cũng được xem như một mô hình hồi qui động (hoặc một số tài

liệu tiếng việt gọi là mô hình hồi qui động thái) Về bản chất ARIMAX tương ứng

với một mô hình hồi qui đa biến nhưng chiếm lợi thế trong dự báo nhờ xem xét

đến yêu tô tự tương quan được biều điễn trong phần dư của mô hình Nhờ đó cải thiện độ chính xác

s® Mô hình GARCH: Các giả thuyết về chuỗi dừng và phương sai sai số không đôi đều không dễ đạt được trong thực tế Trái lại phương sai sai số biến đi rất đễ xảy

ra đôi với các chuỗi tài chính, kinh tế bởi thường có những sự kiện không mong đợi và cú sốc kinh tế không lường trước khiến biến động phương sai của chuỗi thay đôi Trong trường hợp đó nếu áp dụng ARIMA thì thường không mang lại hiệu quả cao cho mô hình Các nhà kinh tế lượng và thống kê học đã nghĩ đến một lớp mô hình mà có thê dự báo được phương sai đề kiểm soát các thay đôi không mong đợi Dựa trên qui luật của phương sai, kết quả dự báo chuỗi sẽ tốt hơn so với trước đó

2.2 Mô hình ARIMA:

Hiện tại cả R và python đều support xây dựng các mô hình chuỗi thời gian ARIMA, SARIMA, ARIMAX, GARCH Trên R chúng ta có thê sử dụng các packages như forecast va Imtest dé xây dựng các mô hình này khá dễ đàng Đối với thông kê và các

mô hình chuỗi thời gian R đang support tốt hơn python Một lý đo đó là các nhà thống

kê và kinh tế lượng ưa chuộng sử dụng R hơn

Lý thuyết: Chúng ta biết rằng hầu hết các chuỗi thời gian đều có sự tương quan giữa giá trị trong quá khứ đến giá trị hiện tại Mức độ tương quan càng lớn khi chuỗi càng - gan thoi điểm hiện tại Chính vi thể mô hình ARIMA sẽ tìm cách đưa vào các biến trễ nhằm tạo ra một mô hình dự báo ñtting tốt hơn giá trị của chuỗi

ARIMA model là viết tắt của cụm từ Autoregressive Intergrated Moving Average M6 hinh sé biéu dién phương trình hôi qui tuyén tinh da bién (multiple

6

Trang 14

linear repression) của các biến đầu vào (còn gọi là biến phụ thuộc trong thống kê)

là 2 thành phân chính:

2.2.1 Auto regression:

Kí hiệu là AR Đây là thành phân tự hỗi qui bao gồm tập hợp các độ trễ của biến hiện tại Độ trễ bậc p chính là giá trị lùi về quá khử p bước thời gian của chuỗi Độ trễ đài hoặc ngắn trong quá trình AR phụ thuộc vào tham số trễ p Cụ thé, quá trình AR(p) của chuỗi xt được biểu diễn như sau:

2.2.2 Moving average:

Quá trình trung bình trượt được hiểu là quá trình dịch chuyển hoặc thay đôi giá trị

trung bình của chuỗi theo thời gian Do chuỗi của chúng ta được giả định là đừng nên quá trình thay đôi trung bình dường như là một chuỗi nhiễu trăng

Quá trình moving average sẽ tìm mối liên hệ về mặt tuyến tính giữa các phần tử ngẫu nhiên t (stochastic term) Chuỗi này phải là một chuỗi nhiễu trăng thỏa mãn các tính chất:

¢ Nhiéu trắng là một thành phần ngẫu nhiên thê hiện cho yếu tố không thể dự báo của model và không có tính qui luật Quá trình trưng bình trượt được biểu diễn theo nhiễu trắng như sau:

q

TA

t=]

® Qua trinh này có thê được biều diễn theo dịch chuyển trễ - backshift

operator (https://en.wikipedia.org/wiki/Lag_operator) B như sau:

Như vậy chúng ta đã hình dung ra moving average là gì Về mặt ý tưởng thì

đó chính là quá trình hôi qui tuyên tính của giá trị hiện tại theo các giá trị hiện tai va qua khứ của sai sô nhiéu trang (white noise error term) dai dién cho các

7

Trang 15

yêu tô shock ngẫu nhiên, những sự thay đổi không lường trước và giải thích bởi

mô hình

2.2.3 Intergrated:

Là quá trình đồng tích hợp hoặc lây sai phân Yêu cầu chung của các thuật toán trong time series là chuỗi phải đảm bảo tính dừng Hầu hết các chuỗi đều tăng hoặc giảm theo thời gian Do đó yếu tô tương quan giữa chúng chưa chắc

là thực sự mà là do chúng cùng tương quan theo thời gian Khi biến đôi sang chuỗi dừng, các nhân tố ảnh hưởng thời gian được loại bỏ và chuỗi sẽ đễ dự báo hơn Để tạo thành chuỗi đừng, một phương pháp đơn giản nhất là chúng ta

sẽ lấy sai phân Một số chuỗi tài chính còn qui đổi sang logarit hoặc lợi suất

Bậc của sai phân để tạo thành chuỗi dừng còn gọi là bậc của quá trình đồng tích

hợp (order of intergration) Quá trình sai phân bậc d của chuỗi được thực hiện như sau:

Hãy xem mô hình đơn giản sau:

Y: = [Bi] + Bo [Xi] + u, Trong đó, [Xt] là một véctơ gồm k các biến giải thích và [B2] là một véctơ gồm k các hệ

sô Thông thường, ut được giả định tuân theo phân phôi chuân với trung bình băng 0 và phương sai không đôi là Q2

Giả định này được viết như sau:

Ngày đăng: 16/12/2024, 09:23

TÀI LIỆU CÙNG NGƯỜI DÙNG

TÀI LIỆU LIÊN QUAN