Những thành công của khóa luận

4.2.1. Đối với sinh viên.

- Khóa luận giúp tìm hiểu hoạt động phân tích tại VND, ứng dụng được kiến thức đã học để có những bước đánh giá được hoạt động phân tích tại VND dù cho là sơ khai nhất.

- Hiểu rõ hơn hoạt động phân tích tại VND, về nền chứng khoán Việt Nam nói chung, và riêng các hoạt động trong nội bộ công ty VND nói riêng.

- Bước đầu đã tìm hiểu và sử dụng được mô hình ARIMA, đã thu được những kết quả thực tế mang tính tin cậy và xác thực cao.

4.2.2. Đối với doanh nghiệp.

Dù cho bài báo cáo khóa luận này vẫn còn rất sơ khai. Tuy nhiên, với mục tiêu đồng hành cùng NĐT, đồng thời sự phát triển của thị trường chứng khoán cũng kéo theo gia tăng các rủi ro trên thị trường, yêu cầu hoạt động phân tích ngày càng phát triển, hỗ trợ tối đa cho NĐT. Nên khóa luận đã đề ra được một hướng đi mới cho việc phân tích tại VND, tạo tiền đề cho các chuyên gia tại VND nghiên cứu sâu hơn và kỹ hơn về mô hình này để áp dụng vào thực tế. Bằng việc sử dụng mô hình, doanh nghiệp có thể từ đó đề ra mức chốt lời, cắt lỗ hợp lý nhất trong quá trình đầu tư, cũng như phát hành các báo cáo cập nhật nhanh. Điều này rất thiết thực trong quá trình đầu tư của khách hàng, cũng như doanh nghiệp nói chung. Qua đó, khóa luận hy vọng đóng góp phần nhỏ vào sự phát triển của hoạt động phân tích tại VND.

4.3. Những vấn đề đặt ra sau khi thực hiện khóa luận.

Trong quá trình phân tích và chạy mô hình, tác giả đã nhận ra việc ứng dụng mô hình ARIMA thì cũng có một số hạn chế như sau:

- Số liệu dự báo cần phải lớn và được tính toán tổng hợp từ một nguồn đáng tin cậy, việc ra kết quả dự báo cho giá chứng khoán tại một thời điểm là điều không tưởng, ta chỉ có thể có những mức giá phỏng đoán cho thời kỳ, và dựa vào mức giá đó để tham chiếu cho quyết định đầu tư chứ không thể dùng nó là kim chỉ nam để đầu tư.

- Trong quá trình thực hiện khóa luận, tác giả đã ứng dụng mô hình thực nghiệm trên một số khoảng thời gian khác nhau (tháng, quý, năm…) và kết quả thu được là sai số khác nhau khá lớn giữa các khoảng thời gian lựa chọn. Điều này chứng tỏ rằng ARIMA chỉ có thể được phát huy tối ưu trong các quyết định đầu tư ngắn hạn, tính ứng dụng cao, nhưng trong các khoảng thời gian dài hạn thì bộc lộ hạn chế.

- Mô hình ARIMA dựa vào lý thuyết A, tức là hãy để số liệu nói. Nhưng trong thực tế, điều này là không khả thi, đặc biệt là khi có sự thay đổi về chính sách của Nhà nước hay biến động kinh tế thế giới. Những thay đổi này sẽ làm thay đổi mạnh kết quả dự báo. Chính vì thế, khi đã quyết định tham gia vào TTCK không chỉ riêng gì ở VN, chúng ta cần có một nền tảng chắc chắn về kiến thức, hoặc ít nhất là sự chuẩn bị về

mặt tâm lý để chấp nhận rủi ro. Nếu chỉ áp dụng duy nhất mô hình này vào dự báo giá chứng khoán có thể sẽ không thành công.

4.4. Hướng nghiên cứu tiếp theo.

Nghiên cứu thực nghiệm ứng dụng ARIMA kết hợp với các phương pháp khác nhằm hạn chế bớt những yếu điểm của ARIMA, đặc biệt trong điều kiện có nhiều biến động của nền kinh tế. Trong đó, điển hình có thể là mô hình ARCH (mô hình phương sai có điều kiện thay đổi tự hồi quy).

Trong mô hình ARIMA, phần dư Ut (nhiễu trắng) được giả định đáp ứng đầy đủ các giả thuyết của mô hình hồi quy tuyến tính cổ điển, tức là có kỳ vọng bằng không, phương sai không đổi và hiệp phương sai bằng không. Tuy nhiên đôi khi trên thực tế phần dư không phải là hằng số mà nó thay đổi theo thời gian và có thể dự báo được. Mô hình ARCH là mô hình phương sai có điều kiện thay đổi tự hồi quy, mô hình sẽ ước lượng cả giá trị trung bình và ước lượng cả phương sai khi phương sai (có điều kiện) thay đổi.

Qua quá trình thực nghiệm thu được kết quả và sự phân tích, đánh giá có thể vẫn còn non nớt của em về mô hình ARIMA, em rất hi vọng mô hình vẫn sẽ được một chuyên gia nào đó nghiên cứu và phát triển tiếp tục. Trong trường hợp có điều kiện để đi sâu hơn về mô hình này ở tương lai, em vẫn sẽ tiếp tục phát triển mô hình để đóng góp vào sự thành công chung của trường nói riêng, và TTCK VN nói chung.

KẾT LUẬN.

Sự hình thành và phát triển của thị trường chứng khoán là một nhu cầu tất yếu của một nền kinh tế phát triển, tuy nhiên lịch sử ra đời và phát triển của TTCK Việt Nam so với TTCK thế giới còn non trẻ.

Trải qua những biến động của cuộc khủng hoảng kinh tế thế giới 2008, TTCK Việt Nam cũng chịu nhiều ảnh hưởng, tuy nhiên gần đây đã có sự phục hồi. Năm 2013 và 2014 là một thời kỳ tương đối ổn định đối với TTCK Việt Nam, sự ổn định của nền kinh tế vĩ mô cũng như hàng loạt chính sách quản lý, tái cấu trúc đem lại sự khởi sắc cho TTCK. Và với nền tảng đó, qua năm 2015, TTCK đã có những bước chuyển động tích cực hơn, ngày càng khẳng định vai trò của mình đối với nền kinh tế.

Với mục tiêu đồng hành cùng NĐT, đồng thời sự phát triển của thị trường chứng khoán cũng kéo theo gia tăng các rủi ro trên thị trường, yêu cầu hoạt động phân tích ngày càng phải phát triển, hỗ trợ tối đa cho NĐT. VNDirect đã, đang và sẽ tiếp tục đẩy mạnh hơn nữa hoạt động phân tích để đóng góp vào một nền tài chính vững mạnh. Tuy đã có nhiều cố gắng tuy nhiên khóa luận vẫn còn nhiều thiếu sót, em mong nhận được sự đóng góp ý kiến, hướng dẫn của Thầy Cô và các Anh Chị trong CTCP Chứng khoán VNDirect để khóa luận hoàn thiện hơn.

PHỤ LỤC

1. Chuỗi thời gian và các thành phần của chuỗi thời gian. Chuỗi thời gian.

Trong bài toán dự báo, một kiểu dữ liệu thường gặp là dữ liệu chuỗi thời gian, tức là dữ liệu được thu nhập, lưu trữ và quan sát theo sự tăng dần của thời gian. Ví dụ, số lượng thí sinh dự thi đại học vào Trường Đại Học Bách Khoa thành phố Hồ Chí Minh được lưu trữ theo từng năm, hay số lượng hàng hóa đã bán được của một siêu thị được lưu trữ theo từng quý là các dữ liệu chuỗi thời gian.

Ta ký kiệu chuỗi thời gian là {Xt} với t là các số tự nhiên. Xt là các biến ngẫu nhiên rút ra từ một phân bố xác suất nào đó. Các chuỗi thời gian thường được biểu diễn bằng một đồ thị với trục hoành là biến thời gian. Hình 1 là một ví dụ về chuỗi thời gian, số hành khách đặt chổ hàng tháng của hãng Pan Am

Hình 1 Số khách hàng đặt chỗ hàng tháng của hãng Pan Am

Trong chuỗi thời gian thường các giá trị ở những thời điểm khác nhau có mối tương quan với nhau. Sự tương quan này được đánh giá bằng hệ số tự tương quan.

Định nghĩa: Tự tương quan là sự tương quan giữa một biến với chính nó theo những độ trễ thời gian khác nhau [1].

[( )( )] ( ) ( ) t t k k t t k E X X Var X Var X         (2.1.1) Với

*k là hệ số tự tương quan của X ở độ trễ k * là trung bình của Xt

Nếu k khác không thì giữa Xt và Xt+k có sự tương quan với nhau.

Để biểu diễn sự tự tương quan của một biến theo nhiều độ trễ khác nhau một cách trực quan, ta dùng hàm tự tương quan.

Định nghĩa: Hàm tự tương quan là một đồ thị biểu diễn các hệ số tự tương quan theo các độ trễ khác nhau [1].

Hình 2 là một ví dụ về hàm tự tương quan.

Hình 2 Hàm tự tương quan

Trong thực tế ta chỉ có thể tính được hệ số tự tương quan lấy mẫu và dùng thống kê để ước lượng các hệ số tự tương quan của đám đông (population ).

1 2 1 ( )( ) ( ) T k t t k t k T t t X X X X r X X           (2.1.2) Với

* rk là hệ số tự tương quan lấy mẫu ở độ trễ k

* X là trung bình mẫu của Xt

* T là số phần tử của mẫu.

Để kiểm tra xem hệ số tự tương quan ở độ trễ k của một chuỗi thời gian có khác không hay không, ta dùng phép thử t. 1 2 1 1 2 k k i i r t r n      (2.1.3) Với :

* ri là hệ số tự tương quan mẫu ở độ trễ i

* k là độ trễ

* n là kích cỡ mẫu

Nếu k = 0 thì t sẽ có phân phối student với n -1 bậc tự do. Đối với mẫu có kích

thước lớn, với mức ý nghĩa 5%, nếu hệ số tự tương quan mẫu nằm trong khoảng

2 / n

 thì ta có thể kết luận hệ số tự tương quan của đám đông bằng không với mức ý nghĩa 5%.

Việc đánh giá các hệ số tự tương quan có ý nghĩa quan trọng trong việc phân tích chuỗi thời gian. Hàm tự tương quan của dữ liệu giúp ta xác định được các thành phần của chuỗi thời gian từ đó có thể lựa chọn mô hình dự báo hợp lý cũng như việc đánh giá tính đầy đủ của mô hình.

Các thành phần của chuỗi thời gian

Trong thực tế, khi quan sát chuỗi thời gian ta nhận thấy bốn thành phần ảnh hưởng lên mỗi giá trị của chuỗi thời gian đó là xu hướng (trend), chu kỳ (cyclical), mùa (seasonal), bất quy tắc (irregular).

Thành phần xu hướng (trend).

Là thành phần thể hiện sự tăng hay giảm giá trị của chuỗi thời gian trong một giai đoạn dài hạn nào đó [1]. Ta có thể xác định một chuỗi thời gian có chứa thành phần xu hướng hay không bằng việc kiểm tra hàm tự tương quan của nó. Nếu một chuỗi thời gian có thành phần xu hướng sẽ có hệ số tự tương quan rất lớn ở những độ trễ đầu tiên và giảm dần về 0 khi độ trễ tăng lên. Hình 3 và 4 là một minh họa về chuỗi thời gian có thành phần xu hướng. Ở đây dù mức tăng nhiệt độ toàn cầu có biến đổi theo từng năm nhưng nhìn chung mức tăng nhiệt độ trung bình có xung hướng tăng theo thời gian. Hệ số tự tương quan rất lớn ở những độ trễ đầu tiên và giảm dần theo sự tăng của độ trễ.

Hình 3 Độ tăng nhiệt độ trung bình hàng năm từ 1856 đến 2005

Hình 4 Hàm tự tương quan của chuỗi tăng nhiệt độ trung bình hàng năm từ 1856 đến 2005.

Thành phần chu kỳ (cyclical)

Là chuỗi biến đổi dạng sóng quanh xu hướng [1]. Trong thực tế thành phần này rất khó xác định và người ta thường xem nó như là một phần của thành phần xu hướng.

Thành phần bất quy tắc (irregular)

Là thành phần thể hiện sự biến đổi ngẫu nhiên không thể đoán được của chuỗi thời gian [1].

Thành phần mùa (Seasonal)

Là thành phần thể hiện sự biến đổi lặp đi lặp lại tại từng thời điểm cố định theo từng năm của chuỗi thời gian [1]. Đối với chuỗi thời gian có thành phần mùa thì giá trị tại

những thời điểm cố định theo từng năm sẽ có sự tương quan lớn với nhau. Ví dụ một chuỗi thời gian được ghi nhận theo từng quý có tính chất mùa thì hệ số tự tương quan ở độ trễ là 4 sẽ khác không một cách có ý nghĩa. Hình 5 là đồ thị của một chuỗi thời gian có tính mùa

Hình 5 Chuỗi thời gian có tính mùa.

Việc xác định một chuỗi thời gian có thành phần xu hướng hay thành phần mùa không rất quan trong trong bài toán dự đoán chuỗi thời gian. Nó giúp ta lựa chọn được mô hình dự đoán phù hợp hay giúp cải tiến mô hình đã có chính xác hơn.

Chuỗi thời gian tĩnh

Trong quá trình qua sát các chuỗi thời gian, ta hận thấy có những chuỗi thời gian mà trung bình và phương sai của nó không phụ thuộc vào thời gian. Những chuỗi

thời gian như vậy gọi là chuỗi thời gian có tính chất tĩnh (stationary) hay gọi là chuỗi thời gian tĩnh.

Định nghĩa : Một chuỗi thời gian {Xt} có tính chất tĩnh hay gọi là chuỗi thời gian tĩnh nếu nó thỏa mãn hai tính chất sau

(1) E X( t),t

(2) Cov X X( t, t k ) k,t

Một chuỗi thời gian không thỏa hai tính chất (1) và (2) gọi là chuỗi thời gian không tĩnh (nonstationary). Việc biểu diễn một chuỗi thời gian không tĩnh bằng một mô hình đại số đơn giản là không dễ nhưng trong thực tế ta rất thường gặp các chuỗi thời gian không tĩnh, do đó ta cần biến đổi một chuỗi thời gian không tĩnh về thành chuỗi tĩnh. Một phương pháp thường dùng nhất là phương pháp lấy hiệu (differencing).

(a) chuỗi thời gian tĩnh

(b) chuỗi thời gian không tĩnh

Hình 6 (a) Chuỗi thời gian tĩnh, (b) chuỗi thời gian không tĩnh.

Đối với một chuỗi thời gian không tĩnh {Xt}, ta áp dụng toán tử lấy hiệu ∆ lên Xt để được một chuỗi thời gian mới ∆Xt với:

∆Xt = Xt – Xt-1

Nếu ∆Xt là chuỗi tĩnh thì ta xây dựng mô hình mô tả ∆Xt rồi từ đó suy ra Xt. Nếu ∆Xt

vẫn là chuỗi không tĩnh, ta tiếp tục áp dụng toán tử ∆ cho chuỗi ∆Xt

Mô hình ARIMA.

Mô hình ARIMA (p,d,q) là mô hình trung bình trượt, đồng liên kết, tự hồi quy. Mô hình sử dụng dữ liệu chính là số liệu trong quá khứ của biến cần giải thích để dự báo cho biến đó. Công thức tổng quát của mô hình:

Dd (Yt) = Ф + [ α1Dd(Yt-1) +…+ αpDd(Yt-p) ] + [ β1Ut-1 +…+ βqUt-q ] + Ut Trong đó:

Ф là giá trị trung bình của quá trình Dd là sai phân bậc d

α1,…,αp ; β1,…,βq là hệ số ước lượng, điều kiện : -1< α1,…,αp ; β1,…,βq <1

Ut là nhiễu trắng (kỳ vọng bằng 0, phương sai không đổi và hiệp phương sai bằng 0). Mô hình bao gồm:

- Mô hình AR (p): AR (autoregressive) là cơ chế tự hồi quy, nghĩa là biến phụ thuộc được hồi quy theo các biến trễ của nó.

- Mô hình MA (q): MA (moving average) là trung bình trượt, nghĩa là độ lệch của biến phụ thuộc so với giá trị trung bìnhlà một hàm tuyến tính của các sai số ut trong quá khứ.

- Nếu một chuỗi dừng ở sai phân bậc d, thì ký hiệu là I(d), I là đồng liên kết(Integrated).

Cách chọn p, q trong mô hình ARIMA: ta dùng hệ số tự tương quan ACF để chọn bậc q cho MA và hệ số tự tương quan riêng PACF để chọn bậc p cho AR. Ta chọn bậc p, q mà tại đó hệ số PACF, ACF có ý nghĩa thống kê – nằm ngoài khoảng(- √; √) với mức ý nghĩa 5%, n là số phần tử trong mẫu; và hệ số PACF, ACF giảm đột ngột về 0 ngay sau đó.

2.1. Mô hình trung bình di động bậc q, MA(q)

Mô hình MA(q) là mô hình có dạng 1 1 ...

t t t q t q

y            (3.1.1) Với :

 là trung bình của chuỗi thời gian tĩnh {yt}.

 là sai số, biểu diễn thành phần không thể dự đoán được từ mô hình ở thời điểm i.

 là các hệ số ước lượng mức ảnh hưởng của t i lên yt.

Biểu diễn (3.1.1) bằng toán tử lấy hiệu B ta được

1 1 ... q t q t y     B  B  1 1 q i i t i B             t Ở đây Bqt t q và 1 ( ) 1 q i i i B  B    

Vì chuỗi  t là chuỗi nhiễu trắng(white noise), tức là E( )t 0và 2 , 0 ( ) 0, 0 h h h         Nên 1 1 ( )t ( t t ... q t q) E y  E             . 1 1 ( )t 0 ( t t ... q t q) Var y     Var           2(112  ... q2). ( ,t t k)

Đánh giá hoạt động phân tích của VND