PHƯƠNG PHÁP THU THẬP VÀ XỬ LÝ DỮ LIỆ U

Một phần của tài liệu 7 Ứng dụng một số mô hình đầu tư tài chính hiện đại vào thị trường chứng khoán Việt Nam (Trang 47)

6. Tóm tắt nội dung luận văn

2.2PHƯƠNG PHÁP THU THẬP VÀ XỬ LÝ DỮ LIỆ U

Lý thuyết danh mục Markowitz nhằm xây dựng ñường biên hiệu quả. Mỗi ñiểm trên ñường biên hiệu quả là một danh mục lựa chọn của nhà ñầu tư. Việc lựa chọn này tuỳ thuộc hoàn toàn vào ñường cong hữu dụng (mức ñộ ghét rủi ro) của mỗi nhà ñầu tư. Với lý thuyết này, chúng ta cần dữ liệu tỷ suất sinh lợi của những tài sản xem xét (cả tài sản phi rủi ro) và tỷ suất sinh lợi của thị trường. Còn CAPM ước lượng tỷ suất sinh lợi kỳ vọng của một tài sản, trên cơ sở ñó xem xét tài sản ñược ñịnh giá cao hay thấp trong thực tế. Mô hình Fama và French 3 nhân tố không chỉ sử dụng beta chứng khoán như CAPM mà còn mở rộng với 3 nhân tố: beta 3 nhân tố, SMB, HML.

Trong thực tế, rất khó ñể xác ñịnh tỷ suất sinh lợi của một tài sản và khó hơn nữa là tỷ suất sinh lợi của thị trường. Do vậy, ñể tính toán các tỷ suất sinh lợi này, người ta thường dựa vào giá chứng khoán theo ñịnh kỳ quan sát. Còn tỷ suất sinh lợi của tài sản phi rủi ro ñược coi như là lãi suất phi rủi ro, ñược xác ñịnh bằng lãi suất Trái phiếu Chính phủ hoặc lãi suất Tín phiếu Kho bạc (giống như lãi suất T-bill ở Anh và Mỹ). Các tài sản này ñược coi là có rủi ro bằng 0, hay tài sản phi rủi ro.

ðối với tỷ suất sinh lợi của các tài sản rủi ro, cụ thể ở ñây là các cổ phiếu ñược niêm yết trên SGDCK Tp. Hồ Chí Minh và tỷ suất sinh lợi thị trường, cụ thể là chỉ số VN-Index, tôi dùng phần mềm Metastock ñể cập nhật dữ liệu từ cơ sở dữ liệu của SGDCK Tp. Hồ Chí Minh từ ngày niêm yết của từng chứng khoán ñến 30/06/2008. Sau ñó, ñối chiếu với các nguồn dữ liệu khác như dữ liệu cung cấp bởi Công ty chứng khoán Ngân hàng ðầu tư và phát triển Việt Nam, Công ty chứng khoán Ngân hàng Sài Gòn Thương tín… cho thấy dữ liệu từ các nguồn hoàn toàn khớp ñúng.

ðối với lãi suất phi rủi ro, tôi dùng lãi suất của Tín phiếu Kho bạc và Trái phiếu Chính phủ kỳ hạn 60 tháng qua các năm từ năm 1999 ñến năm 2008, ñược cung cấp bởi Kho bạc Nhà nước tỉnh Phú Yên.

ðối với dữ liệu sử dụng trong mô hình Fama và French 3 nhân tố, ngoài các dữ liệu ñã thu thập ở trên, dữ liệu mỗi kỳ quan sát còn phải thu thập từ báo cáo tài chính (dạng ñầy ñủ hoặc tóm tắt) của tất cả các công ty niêm yết tại SGDCK Tp. Hồ Chí Minh. Tuy nhiên, với khối lượng dữ liệu ñồ sộ như vậy, ñể minh hoạ số liệu trong luận văn này, tôi ñã giới hạn khoảng thời gian quan sát là 15 tháng từ 30/09/2006 ñến 31/12/2007 của tất cả 138 công ty có dữ liệu niêm yết trước ngày 31/12/2007. Tuy nhiên, việc thu thập báo cáo tài chính theo từng tháng của 138 công ty qua 15 tháng là công việc rất khó khăn. Vì vậy, thay vì sử dụng báo cáo tài chính tháng, tôi dùng báo cáo tài chính quý thay cho tháng. Trong 138 công ty, có 105 công ty có ñầy ñủ dữ liệu báo cáo tài chính 5 quý, 10 công ty có dữ liệu từ 2 ñến 4 quý, 23 công ty có dữ liệu 1 quý. Như vậy, tổng số báo cáo tài chính quý ñã thu thập là 571 báo cáo. Dữ liệu báo cáo tài chính ñược thu thập từ trang web của SGDCK Tp. Hồ Chí Minh và một số từ chính trang web của các công ty niêm yết, phần lớn dữ liệu ñã ñược kiểm toán.

2.2.2 Phương pháp xử lý dữ liệu

Sau khi dữ liệu ñược thu thập và ñối chiếu từ các nguồn ñể tăng ñộ tin cậy của dữ liệu, tôi dùng phần mềm Analstock ñể xử lý dữ liệu hoàn tự ñộng, tính tỷ suất sinh lợi của tài sản rủi ro, tỷ suất sinh lợi thị trường, lãi suất phi rủi ro theo ñịnh kỳ quan sát tuỳ chọn (ngày, tuần, tháng, quí và năm) và tuỳ chọn thời kỳ quan sát, có thể từ khi một chứng khoán niêm yết ñến thời ñiểm hiện tại.

ðối với dữ liệu tỷ suất sinh lợi chứng khoán theo ñịnh kỳ, xác ñịnh bằng công thức: Tỷ suất sinh lợi bằng logarit tự nhiên của giá ñóng cửa trên giá tham chiếu. Giá tham chiếu ñược xác ñịnh theo quy ñịnh tại khoản 3 ñiều 49 của Quy chế thành viên, niêm yết, công bố thông tin và giao dịch chứng khoán, ban hành kèm theo Quyết ñịnh số 79/2000/Qð-UBCK ngày 29/12/2000 của Chủ tịch UBCK Nhà nước. Theo ñó, nếu ñịnh kỳ là ngày thì giá tham chiếu sẽ là giá ñóng

cửa của ngày giao dịch liền trước. Nếu ñịnh kỳ là tuần thì giá tham chiếu sẽ là giá ñóng cửa của ngày cách ngày hiện tại ít nhất là 7 ngày. Nếu ñịnh kỳ là tháng thì giá tham chiếu sẽ là giá ñóng cửa của ngày cuối tháng trước. Cuối cùng, nếu ñịnh kỳ là năm thì giá tham chiếu sẽ là giá ñóng cửa của ngày cuối năm trước.

Còn tỷ suất sinh lợi thị trường cũng ñược tính tương tự nhưng thay giá chứng khoán bằng chỉ số VN-Index.

Tuy nhiên, trong trường hợp này, ñể ñơn giản ñã bỏ qua phần cổ tức khi tính tỷ suất sinh lợi chứng khoán. Hơn nữa, ñiều này cũng phù hợp khi tính tỷ suất sinh lợi thị trường chỉ dựa trên chỉ số VN-Index.

ðối với dữ liệu giá ghi sổ, lấy giá trị tổng tài sản trừ ñi nợ phải trả trên báo cáo tài chính. Còn dữ liệu giá thị trường bằng giá thị trường của một cổ phiếu nhân với số lượng cổ phiếu phổ thông ñang lưu hành.

Dùng phần mềm Analstock ñể xử lý dữ liệu ñầu vào cho Mô hình Fama – French 3 nhân tố: Tính các giá trị BE/ME. Sau ñó, ứng với mỗi quan sát (kỳ dữ liệu), phân loại và sắp xếp các cổ phiếu thành 2 nhóm theo qui mô: 50% cổ phiếu thuộc nhóm qui mô nhỏ (nhóm S) và 50% cổ phiếu thuộc nhóm qui mô lớn (nhóm B). Trong mỗi nhóm S và B, tiếp tục phân loại và sắp xếp các cổ phiếu theo 3 nhóm: 33% cổ phiếu có BE/ME thấp (nhóm L), 34% cổ phiếu có BE/ME trung bình (nhóm M) và 33% cổ phiếu có BE/ME cao (nhóm H). Sau ñó, tính tỷ suất sinh lợi trung bình của từng danh mục S/L, S/M, S/H, B/M, B/L, B/H theo phương pháp bình quân gia quyền với quyền số là tỷ trọng (giá trị vốn hoá thị trường) của từng cổ phiếu. Như vậy, nhân tố SMB ñược tính bằng tỷ suất sinh lợi bình quân của danh mục có qui mô nhỏ (danh mục S) trừ cho tỷ suất sinh lợi bình quân của danh mục có qui mô lớn (danh mục B): SMB = (S/L + S/M + S/H)/3 – (B/L + B/M + B/H)/3. Và nhân tố HML ñược tính bằng tỷ suất sinh lợi bình quân của danh mục “giá trị” (danh mục H) trừ cho tỷ suất sinh lợi bình quân của danh mục “tăng trưởng” (danh mục L): HML = (S/H + B/H)/2 – (S/L + B/L)/2. Như vậy, tất cả các nhân tố là dữ liệu ñầu vào cho Mô hình Fama – French 3 nhân tố của mỗi kỳ quan sát ñã ñược tính toán.

2.3 KIỂM ðỊNH GIẢ THUYẾT THỐNG KÊ VỀ QUI LUẬT PHÂN PHỐI XÁC SUẤT CỦA TỶ SUẤT SINH LỢI CHỨNG KHOÁN PHỐI XÁC SUẤT CỦA TỶ SUẤT SINH LỢI CHỨNG KHOÁN

2.3.1 ðặt vấn ñề

Trong nhiều lĩnh vực của khoa học và ñời sống, có rất nhiều những ñại lượng ngẫu nhiên phân phối theo qui luật chuẩn. Chẳng hạn sai số kích thước của các chi tiết máy sản xuất, trọng lượng của những sản phẩm cùng loại, năng suất của một loại cây trồng trong cùng ñiều kiện, trọng lượng của gia súc cùng ñộ tuổi và ñiều kiện nuôi dưỡng… ñều là những ñại lượng ngẫu nhiên phân phối theo qui luật chuẩn. Theo ñịnh lý “Giới hạn trung tâm” của Liapunop1, với một hệ quả là: Nếu một ñại lượng ngẫu nhiên X là tổng của một số lớn các ñại lượng ngẫu nhiên ñộc lập và giá trị của mỗi ñại lượng ñóng vai trò rất nhỏ trong tổng ñó thì X sẽ có phân phối xấp xỉ với phân phối chuẩn. Do vậy, ta cũng kỳ vọng rằng, tỷ suất sinh lợi của chứng khoán cũng là một ñại lượng ngẫu nhiên xấp xỉ phân phối chuẩn. Nếu ñiều này ñúng, nhà ñầu tư dễ dàng ra quyết ñịnh dựa vào giá trị xác suất của các trường hợp có thể xảy ra của tỷ suất sinh lợi. Ngoài ra, nếu ñiều này ñúng, sẽ tăng thêm giá trị thực nghiệm cho các lý thuyết nghiên cứu trên ñây.

Do vậy, cần thiết phải kiểm ñịnh qui luật phân phối của tỷ suất sinh lợi chứng khoán.

2.3.2 Kết quả kiểm ñịnh

Dùng phần mềm Analstock ñể kiểm ñịnh. Mẫu quan sát là tỷ suất sinh lợi của 26 chứng khoán và chỉ số VN-Index tính theo ñịnh kỳ tuần trên 166 kỳ (từ 01/01/2005 ñến 30/06/2008).

Phương pháp kiểm ñịnh dùng phân phối chi bình phương (χ2), với giả thuyết H0 là: Tỷ suất sinh lợi của chứng khoán tuân theo qui luật phân phối chuẩn. Với mức ý nghĩa α = 5% (ñộ tin cậy 95%), ta thu ñược kết quả kiểm ñịnh như sau:

Bảng 2.1: Kết quả kiểm ñịnh về qui luật phân phối xác suất của tỷ suất sinh lợi gồm 26 chứng khoán và VN-Index Mã CK χ2 p-value 1 Kết quả kiểm ñịnh

AGF 287.0137 0.000000 Hoàn toàn bác bỏ H0

BBC 1.6800 0.194925 Chấp nhận H0

BBT 7.9273 0.004870 Có thể bác bỏ H0 BPC 2.8713 0.090173 Cân nhắc khi bác bỏ H0 BT6 8.8057 0.003003 Có thể bác bỏ H0 BTC 56.9259 0.000000 Hoàn toàn bác bỏ H0 CAN 37.7202 0.000000 Hoàn toàn bác bỏ H0 DHA 168.7634 0.000000 Hoàn toàn bác bỏ H0 DPC 22.3888 0.000002 Hoàn toàn bác bỏ H0 GIL 3.4128 0.064693 Cân nhắc khi bác bỏ H0 GMD 163.5180 0.000000 Hoàn toàn bác bỏ H0 HAP 194.5138 0.000000 Hoàn toàn bác bỏ H0 HAS 34.4902 0.000000 Hoàn toàn bác bỏ H0 KHA 17.0366 0.000037 Hoàn toàn bác bỏ H0 LAF 70.8109 0.000000 Hoàn toàn bác bỏ H0

NKD 1.9381 0.163873 Chấp nhận H0

PMS 2.6324 0.104702 Chấp nhận H0

REE 17.1930 0.000034 Hoàn toàn bác bỏ H0 SAM 19.2283 0.000012 Hoàn toàn bác bỏ H0 SAV 504.7186 0.000000 Hoàn toàn bác bỏ H0 SFC 52.6329 0.000000 Hoàn toàn bác bỏ H0 SGH 113.6639 0.000000 Hoàn toàn bác bỏ H0

TMS 0.0266 0.870412 Chấp nhận H0

TRI 17.2856 0.000032 Hoàn toàn bác bỏ H0 TS4 9.9577 0.001602 Có thể bác bỏ H0

VTC 0.0230 0.879558 Chấp nhận H0 (adsbygoogle = window.adsbygoogle || []).push({});

VN-Index 207.0578 0.000000 Hoàn toàn bác bỏ H0

Nhìn vào bảng kết quả trên, trong số 26 chứng khoán ñược kiểm ñịnh thì chỉ có 5 chứng khoán có tỷ suất sinh lợi tuân theo qui luật chuẩn, chỉ chiếm tỷ lệ 19.2%. Có 2 trường hợp cần cân nhắc khi bác bỏ giả thiết H0 và 3 trường hợp có thể bác bỏ giả thiết H0, còn lại là hoàn toàn bác bỏ giả thiết H0 (p-value quá nhỏ, nhỏ hơn 0.001). Tuy nhiên, với mẫu quan sát chỉ có 26 chứng khoán và khoảng thời gian quan sát hẹp nên có kết quả như vậy. Một số trường hợp, nếu chọn khoảng thời gian phù hợp sẽ cho kết quả kiểm ñịnh là phân phối chuẩn. Chẳng

1 Kết quả kiểm ñịnh phụ thuộc vào giá trị p-value, với 5 mức ñộ. Trong ñó, p-value càng nhỏ thì mức ñộ khẳng

hạn, VN-Index trong khoảng thời gian từ 01/01/2006 ñến 31/12/2006 sẽ có phân phối chuẩn.

2.4 THÀNH LẬP DANH MỤC ðẦU TƯ TỐI ƯU 2.4.1 Danh mục hiệu quả gồm các tài sản rủi ro

Một danh mục tối ưu ñối với nhà ñầu tư Markowitz là danh mục ứng với mức tỷ suất sinh lợi kỳ vọng cho trước, sẽ có mức rủi ro thấp nhất. Hoặc ngược lại, ứng với một mức rủi ro cho trước, sẽ có mức tỷ suất sinh lợi kỳ vọng cao nhất. Do vậy, trong phần này sẽ giới thiệu cách giải bài toán thuận, tức là tìm danh mục có rủi ro thấp nhất khi tỷ suất sinh lợi bằng giá trị cho trước. Hơn nữa, trong ñiều kiện thị trường chứng khoán Việt Nam chưa cho phép bán khống, vì vậy tỷ trọng tài sản trong danh mục phải không âm.

Như vậy ta sẽ giải bài toán sau:

          = ∀ ≥ = = = → = ∑ ∑ ∑ ∑ = = = = n i w w const R E w R E Min w w i n i i n i i i p n i n j ij j i p , 1 , 0 1 ) ( ) ( 1 1 1 1 2 σ σ

Thực tế, có rất nhiều phương pháp ñể giải bài toán trên. Chúng ta có thể giải bằng phương pháp giải tích ñể tính cực trị hàm nhiều biến có ràng buộc (chẳng hạn dùng phương pháp nhân tử Lagrange), hoặc sử dụng thuật toán ñơn hình ñể tìm phương án tối ưu. Tuy nhiên, với sự hỗ trợ của các phần mềm tính toán cực mạnh như hiện nay, chúng ta dễ dàng tìm ñược nghiệm của quá trình tối ưu trên và vẽ ñược ñường biên hiệu quả. Trong luận văn này, tôi sẽ sử dùng phần mềm Analstock ñược viết trên ngôn ngữ Matlab. Việc giải bài toán thủ công bằng phương pháp giải tích ñược trình bày ở phần phụ lục.

Với phần mềm Analstock, người sử dụng có thể lựa chọn bất kỳ khoảng thời gian quan sát, cũng như ñịnh kỳ quan sát. Tuy nhiên, ñể minh hoạ trong luận văn này tôi sẽ sử dụng khoảng thời gian quan sát là 42 tháng, từ ngày 01/01/2005

ñến ngày 30/06/2008, tương ứng trên sàn giao dịch chứng khoán Tp. Hồ Chí Minh có 26 cổ phiếu có dữ liệu ñầy ñủ. Tỷ suất sinh lợi tính theo tuần với 166 kỳ. Ta cần phân tích dữ liệu sơ bộ thông qua các tham số thống kê như sau:

Bảng 2.2: Các tham số thống kê của tỷ suất sinh lợi các chứng khoán và VN-Index Mã chứng khoán Kỳ vọng E(R) ðộ lệch chuẩn σ Hệ số bất ñối xứng γ1 Hệ số nhọn γ2 AGF -0.131747 5.720783 -0.394179 6.126568 BBC -0.105473 6.476352 0.493610 4.850591 BBT -0.413086 6.124419 1.004207 6.719457 BPC -0.298254 6.075948 0.459247 6.973097 BT6 0.055939 5.590740 0.390972 4.701059 BTC 0.619967 7.463412 0.950675 5.563818 CAN -0.202025 5.996153 0.522621 5.978686 DHA -0.353747 6.782376 -1.900965 12.335029 DPC 0.123645 7.580502 0.512518 5.037033 GIL -0.499337 6.315317 -1.437906 12.023645 GMD -0.380438 6.437389 -0.891836 12.194944 HAP -0.157819 7.501851 -0.196838 6.287120 HAS -0.675693 7.575830 -1.267565 7.713342 KHA -0.558346 7.035634 -0.455334 7.197775 LAF 0.036552 7.139010 0.481975 5.342975 NKD 0.198184 6.100589 -0.126742 4.748664 PMS 0.449529 6.505410 0.972101 7.073868 REE -0.143883 6.712058 -0.430739 8.504060 SAM -0.455489 7.118458 -0.134214 6.092197 SAV -0.450486 5.637442 0.449052 5.666654 SFC -0.083295 6.829275 -1.629150 16.140268 SGH 1.066743 7.554688 0.819049 5.286789 TMS -0.299527 5.607161 -0.498562 5.232274 TRI -0.472232 6.270234 0.920504 6.835392 TS4 -0.488224 6.823976 -0.174363 8.333719 VTC -0.221023 7.246956 -0.195946 7.895780 VN-Index 0.252779 4.334821 0.104886 4.876114

Nhìn vào bảng số liệu thống kê trên, những chứng khoán có tỷ suất sinh lợi kỳ vọng dương là: BT6, BTC, DPC, LAF, NKD, PMS, SGH. Là một nhà ñầu tư, ñương nhiên họ không thích những chứng khoán có tỷ suất sinh lợi kỳ vọng âm. ðộ lệch chuẩn biểu hiện mức ñộ phân tán của tỷ suất sinh lợi quanh giá trị trung bình. ðộ lệch chuẩn càng cao hàm ý rủi ro cao. Tuy nhiên, ñể lượng hoá và nhận ñịnh rủi ro, chúng ta còn có các tham số là hệ số bất ñối xứng (skewness) và hệ số nhọn (kurtosis).

Hệ số bất ñối xứng γ1 = µ3/σ3 (với µ3 là mô men trung tâm bậc 3) ño lường sự méo lệch (bất ñối xứng) của phân phối. Nếu γ1 âm thì ñồ thị phân phối sẽ méo lệch sang bên phải thể hiện rủi ro cao do nhiều khả năng sẽ xuất hiện một vài trường hợp tỷ suất sinh lợi âm mạnh trong tương lai. Ngược lại, γ1 dương thì ñồ thị phân phối sẽ méo lệch sang bên trái thể hiện khả năng xuất hiện một vài trường hợp tỷ suất sinh lợi lớn ñáng kể trong tương lai.

Hệ số nhọn γ2 = µ4/σ4 (với µ4 là mô men trung tâm bậc 4) thể hiện ñộ nhọn của ñồ thị phân phối. γ2 càng nhỏ thì ñồ thị càng nhọn thể hiện ñộ an toàn cao, tức là các giá trị tỷ suất sinh lợi có xu hướng tập trung quanh giá trị kỳ vọng.

Một phần của tài liệu 7 Ứng dụng một số mô hình đầu tư tài chính hiện đại vào thị trường chứng khoán Việt Nam (Trang 47)