CHƯƠNG 3 : THIẾT KẾ NGHIÊN CỨU
3.1 Thiết kế nghiên cứu
3.1.1 Chọn mẫu và thu thập dữ liệu
Việc chọn mẫu dữ liệu thời gian được căn cứ trên mốc thời gian hoạt động của SGDCK TP.HCM và SGDCK Hà Nội từ ngày đầu tiên cho đến nay. Xét thấy với khoảng thời gian khảo sát tương đối dài, do vậy việc đánh giá tính hiệu quả dạng yếu của các thị trường liên tục trong suốt thời gian này có thể khiến kết quả kiểm định khơng phản ánh được chính xác thực trạng của TTCK Việt Nam dưới sự tác động của khủng hoảng, của những biến cố thăng trầm ở trong nước nói riêng và của thị trường chứng khốn thế giới nói chung. Vì vậy, việc phân chia thời gian khảo sát thành các giai đoạn nhỏ mang ý nghĩa đánh giá chính xác và đầy đủ tính chất của thị trường qua từng thời kỳ nhằm đem lại cái nhìn tồn diện về tính hiệu quả về mặt thơng tin. Thị trường chứng khốn ln có mối quan hệ mật thiết với nền kinh tế và đều chịu ảnh hưởng bởi những biến động kinh tế tài chính thế giới. Điểm qua các mốc sự kiện đáng chú ý từ năm 2000 đến 2013, có thể thấy từ sau năm 2000, kinh tế thế giới xuất hiện hiện tượng bong bóng, với những thiệt hại nặng nề nhất đối với các ngành nghề, đặc biệt là từ sau sự kiện 11/9, giá dầu thế giới càng giảm mạnh hơn và ghi nhận một lần điều chỉnh mạnh mẽ của thị trường chứng khoán. Đến năm 2003, kinh tế thế giới bắt đầu phục hồi lại, một số khu vực đạt tỷ lệ tăng trưởng khá. Năm 2007 chứng kiến giá dầu và giá vàng tăng kỷ lục,
đồng USD mất giá nghiêm trọng. Nhiều nước có dự trữ ngoại tệ lớn bằng USD và các nước xuất khẩu dầu mỏ thuộc OPEC phải tính đến khả năng chuyển dần sang sử dụng các ngoại tệ mạnh khác để tính giá dầu. Giá dầu cao và nguy cơ cạn kiệt nguồn nhiên liệu đã làm bùng lên những bất ổn tiềm ẩn với các cuộc tranh chấp giữa các cường quốc về chủ quyền và là tiền đề dẫn đến cuộc khủng hoảng tài chính lan rộng vào năm 2008. Khủng hoảng khởi đầu từ thị trường bất động sản ở Mỹ, nhanh chóng lan rộng sang nhiều nước, nhiều khu vực, cùng với khủng hoảng giá lương thực, biến động giá dầu… đã đẩy nền kinh tế thế giới vào cuộc khủng hoảng tài chính trầm trọng nhất kể từ cuộc Đại suy thoái 1929 - 1933 và đẩy nền kinh tế thế giới vào suy thối kéo dài cho đến khi có dấu hiệu hồi phục vào gần cuối năm 2009.
Kết hợp với các giai đoạn phát triển của TTCK Việt Nam từ ngày đầu còn hoạt động sơ khai đến các giai đoạn thăng trầm trong và sau cuộc khủng hoảng, tác giả đã chia thời gian khảo sát thành những phân đoạn nhỏ cụ thể như sau:
- Giai đoạn tổng quát: từ 28/7/2000 đến 13/11/2013 đối với chỉ số VN-Index và từ 18/7/2005 đến 13/11/2013 đối với chỉ số HNX-Index.
- Giai đoạn 1: từ 28/7/2000 đến 29/12/2006 đối với chỉ số VN-Index và từ 18/7/2005 đến 29/12/2006 đối với chỉ số HNX-Index.
- Giai đoạn 2: từ 2/1/2007 đến 31/3/2009 đối với cả hai chỉ số VN-Index và chỉ số HNX-Index.
- Giai đoạn 3: từ 1/4/2009 đến 13/11/2013 đối với cả hai chỉ số VN-Index và chỉ số HNX-Index.
Dữ liệu quan sát là chỉ số giá đóng cửa hàng ngày của thị trường thể hiện qua các chỉ số VN-Index từ ngày 28/7/2000 đến ngày 13/11/2013 và từ ngày 18/7/2005 đến ngày 13/11/2013 đối với chỉ số HNX-Index. Do đó số lượng mẫu được xét trong toàn bộ thời gian khảo sát cũng như trong giai đoạn 1 có sự khác nhau tương đối tùy thuộc vào thời gian hoạt động thực tế của hai SGDCK, cụ thể như sau:
GĐ Giai đoạn tổng quát Giai đoạn 1 Giai đoạn 2 Giai đoạn 3 Chỉ số VN- Index HNX- Index VN- Index HNX- Index VN- Index HNX- Index VN- Index HNX- Index Thời gian khảo sát 28/7/2000- 13/11/2013 18/7/2005- 13/11/2013 28/7/2000- 29/12/2006 18/7/2005- 29/12/2006 2/1/2007- 31/3/2009 1/4/2009- 13/11/2013 Số mẫu quan sát 3.151 1.992 1.443 281 551 554 1.157
Bảng 3-1: Tổng hợp giai đoạn khảo sát và số mẫu nghiên cứu
Các dữ liệu trên được truy xuất từ các website chính thức của Sở giao dịch chứng khoán TP.HCM và Sở giao dịch chứng khoán Hà Nội.
3.1.2 Phương pháp nghiên cứu
Các bước phân tích định lượng được thực hiện theo trình tự như sau:
- Bước 1: sử dụng chuỗi dữ liệu giá đóng cửa hàng ngày để tính tỷ suất sinh lợi của thị trường theo công thức: Rt = log(Pt) – log(Pt-1) = log(Pt/Pt-1) 2
Trong đó: Pt là giá đóng cửa ở thời điểm t và Pt-1 là giá đóng cửa tại thời điểm t-1.
Có nhiều lý do sử dụng log cơ số tự nhiên cho giá thay vì chỉ theo dõi sự biến động của giá thuần túy. Chứng minh cho lập luận này như sau:
Pt+1/Pt = exp(loge(Pt+1/Pt)) Pt+1 = Pt exp(loge(Pt+1/Pt))
= Pt exp(logePt+1 - logePt))
2 Theo Trương Đông Lộc, 2008. Kiểm định giả thuyết thị trường hiệu quả ở mức độ yếu cho thị trường
chứng khoán Việt Nam: trường hợp Trung tâm Giao dịch chứng khốn Hà Nội. Tạp chí Nghiên cứu Kinh tế,
Thứ nhất, sự thay đổi theo log của giá chính là lợi tức với lãi suất kép được tính từ ngày nắm giữ một loại chứng khoán. Thứ hai, Moore (1962) cũng đã chỉ ra rằng sự đa dạng trong thay đổi giá đơn thuần của một cổ phiếu bất kỳ chỉ là một chức năng gia tăng trong mức cân bằng giá của cổ phiếu đó. Nghiên cứu của ơng cho rằng việc lấy hàm logarit đã khử được hầu hết các tác động của mức cân bằng giá. Thứ ba, đối với những thay đổi nhỏ hơn +- 15% thay đổi của log giá thì có vẻ rất gần với sự thay đổi của giá, vì vậy điều này thuận tiện hơn cho việc xem xét chuỗi dữ liệu ở khía cạnh % thay đổi của giá.3
- Bước 2: kiểm định dữ liệu tỷ suất sinh lợi của từng chỉ số chứng khoán trong giai đoạn tổng quát.
- Bước 3: kiểm định dữ liệu tỷ suất sinh lợi của từng chỉ số chứng khoán qua ba giai đoạn.
Ở bước 2 và bước 3, việc kiểm định dữ liệu được thực hiện bằng các thông qua các phương pháp và mơ hình Kiểm định đoạn mạch (Runs test) nhằm kiểm tra sự độc lập về thời gian của chuỗi lợi tức được quan sát.
Mơ hình kiểm định đoạn mạch là một trong những phương pháp phổ biến nhất để kiểm định bước đi ngẫu nhiên hay tính hiệu quả dạng yếu của thị trường. Vì mơ hình này kiểm định mối quan hệ tương quan của các chuỗi dữ liệu trong quá khứ nên phù hợp để kiểm định tính hiệu quả dạng yếu.
Theo lý luận về tính chất, đặc điểm của các thị trường có tính hiệu quả ở những mức độ cao hơn, cũng như thông qua các nghiên cứu thực nghiệm cho thấy hình thái dạng vừa và mạnh chỉ tồn tại ở những thị trường đã phát triển hay các quỹ tương hỗ lớn tại Châu Âu, Châu Mỹ. Đối với những thị trường còn non trẻ như TTCK Việt Nam mang những đặc điểm như quy mô vốn nhỏ, mức độ giao dịch thấp, độ biến động cao và mức độ mở cửa cịn hạn chế thì khó có thể đạt đến mức hiệu quả ở các dạng này. Vì vậy, trong phạm vi bài nghiên cứu này, tác giả chỉ xét về tính hiệu quả dạng yếu của TTCK Việt Nam với phương pháp kiểm định đoạn
mạch nhằm kiểm định tính ngẫu nhiên của các chuỗi tỷ suất lợi nhuận, hay chuỗi tuân theo “bước đi ngẫu nhiên”. Sau đó, từ kết quả nghiên cứu sẽ đưa đánh giá khả năng hiệu quả của thị trường Việt Nam ở các mức độ cao hơn.
3.2 Phương pháp kiểm định đoạn mạch (Runs Test)
Kiểm định đoạn mạch là một phép kiểm định thống kê giúp ta xác định xem có thể coi một dãy các ký hiệu, các khoản mục, các số liệu có phải là kết quả của một q trình mang tính ngẫu nhiên hay khơng. Giả định về tính chuẩn tắc trong phân phối được bỏ qua khi sử dụng phương pháp này. Vì vậy, đây là một phương pháp kiểm định tính ngẫu nhiên của dãy số theo thời gian hay tính độc lập của những thay đổi liên tiếp của giá; và trong phạm vi của bài nghiên cứu này, đó là chuỗi chỉ số của thị trường nhằm kiểm tra tính ngẫu nhiên trong chuỗi lợi nhuận của các cổ phiếu trên thị trường. Qua đó, tác giả có cơ sở để chấp nhận hay bác bỏ giả thuyết thị trường hiệu quả trên TTCK được xét. Kiểm định đoạn mạch hay chuỗi sẽ giúp kiểm định giả thuyết rằng dãy số có phải là ngẫu nhiên hay khơng. Với u cầu lý thuyết thị trường hiệu quả, phương pháp này khá phù hợp và thường được áp dụng để kiểm tra thị trường có phải hiệu quả ở cấp độ yếu không.
Để chứng minh một TTCK là hiệu quả thì tác giả phải kiểm định được sự không phụ thuộc của giá cổ phiếu tương lai với giá cổ phiếu trong quá khứ, cũng như không phụ thuộc vào yếu tố mùa vụ như thời điểm giữa các tuần hay các ngày trong tuần.
Quan sát một dãy các chỉ số chứng khốn kế tiếp nhau, ta có thể thấy lợi nhuận mỗi thời điểm sẽ có ba khả năng: tăng, khơng đổi, hoặc giảm. Từ đây xuất hiện chuỗi các quan sát giống nhau xảy ra liên tiếp hay còn gọi là đoạn mạch. Giả thiết H0 trong kiểm định đoạn mạch là chuỗi được quan sát là chuỗi ngẫu nhiên. Một đoạn mạch được Siegel (1956) định nghĩa là “một chuỗi liên tiếp của những dấu hiệu giống nhau được theo sau hoặc tiếp nối bằng những dấu hiệu khác hoặc khơng có dấu hiệu nào cả”. Có nghĩa là một đoạn mạch là một dãy các phần từ
giống nhau mà ở sát trước và sát sau là các phần tử khác chúng hoặc khơng có phần tử nào. Chiều dài của một đoạn mạch là số phần tử của nó.
Theo Fama (1965), kiểm định đoạn mạch có thể được thực hiện thơng qua các phương pháp kiểm định đoạn mạch tăng hoặc giảm, phương pháp kiểm định đoạn mạch trên hoặc dưới điểm chặn. Bài nghiên cứu ở đây sử dụng hai phương pháp này để kiểm định về tính ngẫu nhiên của chuỗi chỉ số VN-Index và HNX- Index.
3.2.1 Đoạn mạch tăng hoặc giảm
Ví dụ ta có chuỗi chỉ số VN-Index từ ngày 26/06/2003 đến ngày 15/07/2003 như sau:
Ngày VN-Index Chuỗi
27/06/2003 152 Tăng 30/06/2003 152,27 01/07/2003 152,62 02/07/2003 151,68 Giảm 03/07/2003 151,84 Tăng 04/07/2003 152,18 07/07/2003 152,18 Không đổi 08/07/2003 152,26 Tăng 09/07/2003 151,10 Giảm 10/07/2003 151,20 Tăng 11/07/2003 151,22 14/07/2003 150,81 Giảm 15/07/2003 150,59
Bảng 3-2: Chuỗi VN-Index từ ngày 26/06/2003 đến 15/07/2003
Với các ngày có chỉ số VN-Index tăng liên tục ta xem là một đoạn mạch tăng (+), các ngày chỉ số giảm liên tục được xem là một đoạn mạch giảm (-) và các ngày không đổi kề nhau là các đoạn mạch khơng đổi. Đoạn mạch có chiều dài i là đoạn mạch có i phần tử liên tiếp tăng, giảm hoặc khơng đổi. Như vậy ở đây ta có 8 đoạn mạch (+,-,+,0,+,-,+,-) với chiều dài tương ứng của từng đoạn mạch là (3,1,2,1,1,1,2,2).
Phương pháp đoạn mạch tăng hoặc giảm nhằm kiểm định liệu khuynh hướng chuyển động của một quan sát có tác động đến khuynh hướng hiện tại của những quan sát trước đó hay khơng. Kiểm định đoạn mạch nhằm tính tốn và so sánh số đoạn mạch thực tế với số đoạn mạch kỳ vọng theo giả thiết giá cả biến động một cách ngẫu nhiên và độc lập. Nếu chuỗi số liệu là ngẫu nhiên, điều này chứng tỏ thị trường đang quan sát có hiệu quả về mặt thông tin. Ngược lại, nếu chuỗi không ngẫu nhiên, nghĩa là sự biến động về lợi nhuận có tương quan với nhau thì ta sẽ có cơ sở để bác bỏ giả thiết H0.
Ta có kỳ vọng số đoạn mạch E(N) như sau: 𝐸𝐸(𝑁𝑁) =�𝑁𝑁(𝑁𝑁+ 1)− � 𝑛𝑛𝑖𝑖2
3
𝑖𝑖=1
�/𝑁𝑁
Trong đó N là tổng số đoạn mạch và ni là số đoạn mạch có các quan sát dương, âm hoặc không đổi.
Và sai số chuẩn 𝜎𝜎: 𝜎𝜎 = �∑ 𝑛𝑛3 𝑖𝑖2 𝑖𝑖=1 [∑ 𝑛𝑛3 𝑖𝑖2 𝑖𝑖=1 +𝑁𝑁(𝑁𝑁+ 1)]−2𝑁𝑁 ∑ 𝑛𝑛3 𝑖𝑖3 − 𝑁𝑁3 𝑖𝑖=1 𝑁𝑁2(𝑁𝑁 −1) � 1�2
Vì vậy, sự khác biệt giữa số đoạn mạch thực tế 𝑅𝑅 và số đoạn mạch kỳ vọng 𝑚𝑚 có thể được thể hiện trong biến chuẩn hóa 𝑍𝑍như sau:
𝑍𝑍=�𝑅𝑅 + 12� − 𝑚𝑚 𝜎𝜎𝑚𝑚
Trong đó 12 là hệ số điều chỉnh liên tục. Với các mẫu quan sát lớn, Z xấp xỉ phân phối chuẩn với kỳ vọng 0 và phương sai 1: Z ~ (0,1). Khi sự khác biệt là có ý nghĩa thì lợi nhuận hàng ngày là khơng ngẫu nhiên và các nhà đầu tư có cơ hội đạt được lợi nhuận vượt trội. Nếu số đoạn mạch thực tế thấp hơn nhiều so với kỳ vọng, điều này cho thấy phản ứng của thị trường trước các thông tin với một độ trễ nào đó.
Giả thiết H0 cần kiểm định ở đây là chuỗi quan sát về lợi nhuận theo ngày của chỉ số VN-Index và HNX-Index là ngẫu nhiên.
H0: 𝜎𝜎𝑚𝑚 = 0 H1: 𝜎𝜎𝑚𝑚 ≠0
Giá trị thống kê Z được so sánh với Zα/2: H0 bị bác bỏ nếu |Z| > Zα/2
Khi số đoạn mạch thực tế quá lớn hoặc quá nhỏ so với số đoạn mạch được kỳ vọng đều sẽ không rơi vào phạm vi H0 được chấp nhận. Tức là dãy số biến động khơng theo ngẫu nhiên mà có sự phụ thuộc giữa các quan sát với nhau. Vì vậy, giả thuyết về thị trường hiệu quả cũng không được chấp nhận trên TTCK Việt Nam.
3.2.2 Đoạn mạch trên hoặc dưới điểm chặn
Ở phương pháp này, số đoạn mạch được đếm dựa trên sự thay đổi lớn hơn hoặc nhỏ hơn của chuỗi quan sát so với một điểm chặn, đó có thể là giá trị trung bình (mean), trung vị (median), mode hoặc bất kỳ giá trị nào được chọn. Mỗi quan sát được phân loại là trên (+) hoặc dưới (–) tùy thuộc vào sự so sánh giữa quan sát đó với điểm chặn (đối với trường hợp giá trị quan sát bằng với điểm chặn, chương trình SPSS sẽ mặc định là +). Sau khi phân loại các quan sát, ta có số đoạn mạch trên (+) hoặc dưới (–) điểm chặn tương ứng. Cơng thức tính giá trị điểm chặn, số đoạn mạch và mức ý nghĩa như sau:
- Giá trị điểm chặn:
Nếu điểm chặn là giá trị trung bình:
𝑀𝑀𝑀𝑀𝑀𝑀𝑛𝑛 =� 𝑋𝑋𝑖𝑖
𝑁𝑁 𝑖𝑖=1
/𝑁𝑁
Nếu điểm chặn là giá trị trung vị:
𝑀𝑀𝑀𝑀𝑀𝑀𝑖𝑖𝑀𝑀𝑛𝑛 =��𝑋𝑋(𝑁𝑁/2+1+𝑋𝑋(𝑁𝑁/2)�/2 𝑁𝑁ế𝑢𝑢 𝑁𝑁 𝑐𝑐ℎẵ𝑛𝑛
Trong đó các quan sát trong chuỗi dữ liệu được xếp tăng dần từ giá trị nhỏ nhất 𝑋𝑋(1) đến giá trị lớn nhất 𝑋𝑋(𝑁𝑁).
Mode cũng được dùng là điểm chặn khá phổ biến. Nếu có nhiều giá trị mode khác nhau, ta chọn giá trị mode lớn nhất.
- Số đoạn mạch:
Chênh lệch giữa giá trị quan sát và điểm chặn được tính như sau: 𝐷𝐷𝑡𝑡 =𝑋𝑋𝑡𝑡 − Đ𝑖𝑖ể𝑚𝑚 𝑐𝑐ℎặ𝑛𝑛
Nếu 𝐷𝐷𝑡𝑡 ≥0, chênh lệch này là dương. Ngược lại, nếu 𝐷𝐷𝑡𝑡 < 0, chênh lệch là âm. Từ đó chúng ta xác định được số lần thay đổi của các quan sát có 𝐷𝐷𝑡𝑡 ≥0 và 𝐷𝐷𝑡𝑡+1 < 0 hoặc 𝐷𝐷𝑡𝑡 < 0 và 𝐷𝐷𝑡𝑡+1 ≥0cũng như số ký hiệu dương 𝑛𝑛𝑝𝑝 và số ký hiệu âm 𝑛𝑛𝑀𝑀.
- Mức ý nghĩa:
Số đoạn mạch R có phân phối chuẩn với kỳ vọng 𝜇𝜇𝑟𝑟 và phương sai 𝜎𝜎𝑟𝑟2 được tính như sau: 𝜇𝜇𝑟𝑟 =𝑛𝑛2𝑛𝑛𝑝𝑝𝑛𝑛𝑀𝑀 𝑝𝑝 +𝑛𝑛𝑀𝑀 + 1 𝜎𝜎𝑟𝑟2 =2𝑛𝑛𝑝𝑝𝑛𝑛𝑀𝑀�2𝑛𝑛𝑝𝑝𝑛𝑛𝑀𝑀− 𝑛𝑛𝑀𝑀 − 𝑛𝑛𝑝𝑝� �𝑛𝑛𝑝𝑝 +𝑛𝑛𝑀𝑀�2�𝑛𝑛𝑝𝑝 +𝑛𝑛𝑀𝑀 −1�