7. Tổng quan tài liệu nghiên cứu
2.4. QUY TRÌNH NGHIÊN CỨU
Bước 1: Lựa chọn các nhân tố ảnh hưởng đến giá cổ phiếu các công ty ngành Thép niêm yết trên Sở GDCK TP. HCM
Đề tài chọn 7 nhân tố để phân tích sự ảnh hưởng của chúng đến giá cổ phiếu, đó là: Vốn chủ sở hữu của doanh nghiệp, Thu nhập trên mỗi cổ phiếu, Tỷ lệ trả cổ tức bằng tiền mặt, Tỷ lệ tăng trưởng tổng sản phẩm nội địa, Chỉ số giá tiêu dùng, Chỉ số giá nhà ở, Sản lượng tiêu thụ thép trong nước.
Bước 2: Thu thập dữ liệu
Dựa vào dữ liệu của các công ty niêm yết trên sàn HOSE có tổng cộng 8 công ty thuộc ngành Thép. Ở đây mỗi công ty có thể kinh doanh nhiều ngành nghề khác nhau nhưng chúng ta chỉ phân loại dựa theo ngành kinh doanh chính của các công ty, lĩnh vực mà mang lại doanh thu cao nhất.
Do thị trường chứng khoán Việt Nam vẫn còn khá mới mẽ nên việc hạn chế về số liệu là không thể tránh khỏi, các công ty niêm yết còn ít và niêm yết chưa lâu nên chúng ta chỉ có thể lựa chọn các số liệu sao cho phù hợp với quá trình nghiên cứu.
Trong bài nghiên cứu này, chúng ta sẽ lựa chọn các chứng khoán được niêm yết từ năm 2009 để có một chuỗi số liệu đủ dài (từ Quý I/2009 đến Quý IV/2014) khi phân tích.
Cụ thể, đối với ngành thép ta sẽ chọn 5 công ty gồm: HMC, HSG, SMC, VIS, HLA làm đối tượng trong quá trình nghiên cứu. Dữ liệu giá của 5 cổ phiếu này cũng như các thông tin: Vốn chủ sở hữu của doanh nghiệp, Tỷ lệ chi trả cổ tức bằng tiền mặt được thu thập từ trang web https://www.cophieu68.vn
- Nguồn số liệu về chỉ số tăng trưởng GDP, chỉ số giá tiêu dùng, sản lượng tiêu thụ thép trong nước được lấy từ tổng cục thống kê Việt Nam trên website: https://www.gso.gov.vn
- Nguồn số chỉ số giá nhà ở được lấy từ website: http://www.savills.com.vn
Bước 3: Xử lý số liệu - Mã hóa biến
- Giá cổ phiếu: Vì thị trường chứng khoán Việt Nam niêm yết chưa được bao lâu nên không đủ dữ liệu để tính giá cổ phiếu theo năm.
Đề tài cũng không chọn giá cổ phiếu theo ngày vì sẽ bị ảnh hưởng bởi niên độ dao động. Và vì nhiều chỉ tiêu khác không thể tính dữ liệu theo tháng nên đề tài sử dụng số liệu được tính theo quý.
Thời gian chọn mẫu để nghiên cứu là từ quý I/2009 đến quý IV/2014 gồm 24 quý. Từ đó, giá cổ phiếu cho danh mục được tính là giá trị trung bình của giá các cổ phiếu có trong danh mục.
- Dữ liệu về Vốn chủ sở hữu, Tỷ lệ chi trả cổ tức bằng tiền mặt, Chỉ số giá tiêu dùng, Chỉ số giá nhà ở, sản lượng tiêu thụ thép sau khi lấy số liệu được xử lý về tốc độ tăng trưởng.
Bảng 2.2: Mã hóa các biến
Biến Nhân tố Biến mã hóa
Biến độc lập
Quy mô doanh nghiệp Vốn chủ sở hữu VCSH
Thu nhập của cổ phiếu Thu nhập trên mỗi cổ phiếu EPS Tỷ lệ chi trả cổ tức Tỷ lệ chi trả cổ tức bằng tiền mặt COTUC Tăng trưởng kinh tế Tăng trưởng GDP GDP Lạm phát Chỉ số giá tiêu dùng (CPI) CPI Chỉ số bất động sản Chỉ số giá nhà ở BDS Tính mùa vụ Sản lượng tiêu thụ thép SANLG
Biến phụ thuộc
Giá cổ phiếu Giá cổ phiếu GIACP
Bước 4: Kiểm tra dữ liệu trước khi phân tích hồi quy
a. Kiểm định tính dừng
Khi phân tích hồi qui liên quan tới các dữ liệu của chuỗi thời gian, là các dữ liệu đó phải là dừng. Nếu không như vậy thì phương thức kiểm định giả thuyết thông thường dựa trên t, F, các kiểm định Chi bình phương (χ2
) và
tương tự có thể trở nên không đáng tin cậy.
Một cách kiểm định tính dừng được phổ biến gần đây là kiểm định nghiệm đơn vị, ta xét mô hình: Yt = Yt-1 + ut
Ở đây ut là số hạng chỉ sai số ngẫu nhiên xuất phát từ các giả định cổ điển rằng nó có giá trị trung bình bằng 0, phương sai là hằng số và không tự tương quan. Số hạng sai số này còn được biết tới dưới cái tên sai số nhiễu ngẫu nhiên (while noise error term) theo thuật ngữ khoa học ứng dụng.
Mô hình trên là một hồi qui bậc một, hoặc AR(1), mà ở đó chúng ta hồi qui giá trị của Y tại thời điểm t dựa trên giá trị của nó tại thời điểm (t-1). Và nếu hệ số của Yt-1 trong thực tế bằng 1, tức là tình huống không dừng. Do vậy
nếu chúng ta thực hiện hồi qui mô hình thì ta có: Yt = ρYt-1 + ut và tìm ra rằng ρ = 1, thì chúng ta có thể nói rằng biến ngẫu nhiên Yt có nghiệm đơn vị.
Trong kinh tế lượng (về chuỗi thời gian), một chuỗi thời gian có nghiệm đơn vị được gọi là bước ngẫu nhiên (chuỗi thời gian). Và một bước ngẫu nhiên là một thí dụ của chuỗi thời gian không dừng.
Ta có các giả thiết:
H0: ρ = 1 : Yt là chuỗi thời gian không dừng H1: ρ < 1 : Yt là chuỗi thời gian dừng
Phương trình Yt = ρYt-1 + ut tương đương với phương trình sau đây:
Ở đây và là hàm sai phân bậc 1.
Nếu như một chuỗi thời gian được lấy sai phân một lần và chuỗi sai phân đó là dừng, thì ta có thể nói rằng chuỗi ban đầu (dạng bước ngẫu nhiên) là một chuỗi kết hợp bậc 1được ký hiệu là I (1).
Tương tự như vậy, nếu như chuỗi ban đầu phải được lấy sai phân hai lần (tức là lấy sai phân bậc 1 của sai phân bậc 1) để trở thành dừng, thì chuỗi ban đầu đó được gọi là chuỗi kết hợp bậc 2, hoặc I (2).
Tuy nhiên, do có thể có hiện tượng tương quan chuỗi giữa các ut do thiếu biến, nên người ta thường sử dụng kiểm định DF mở rộng là ADF (Augmented Dickey Fulller Test). Kiểm định này được thực hiện bằng cách đưa thêm vào phương trình các biến trễ của sai phân biến phụ thuộc :
Yt
b. Kiểm định đa cộng tuyến
- Dấu hiệu để gây nghi ngờ nhất là R2 của mô hình cao (thường R2 > 0,8) mà kiểm định t lại bảo một vài biến độc lập nào đó không có ý nghĩa trong việc giải thích cho Y, từ nghi ngờ này người ta dùng phương pháp đơn
giản nhất để phát hiện mô hình có tồn tại hiện tượng đa cộng tuyến không là xem xét hệ số tương quan tuyến tính giữa các biến độc lập.
- Phát hiện hiện tượng đa cộng tuyến qua hệ số tương quan giữa các biến độc lập cao. Thực tế cho thấy, khi hệ số tương quan cặp giữa các biến độc lập lớn hơn 0,8 ta có hiện tượng đa cộng tuyến cao.
- Một phương pháp để xác định đa cộng tuyến là dùng nhân tố phóng đại phương sai VIF có công thức như sau: VIFj = 1/ (1- Rj2
)
Trong đó Rj2 là giá trị hệ số xác định trong hàm hồi quy của biến giải thích thứ j theo (k-1) biến giải thích còn lại, nếu có cộng tuyến của Xj với các biến giải thích khác thì Rj2
sẽ gần bằng 1 và do đó VIFj sẽ lớn, giá trị VIFj càng lớn thì biến Xj càng cộng tuyến cao, như một qui tắc kinh nghiệm nếu VIFj bằng hoặc vượt quá 5 (khi đó Rj2 > 0,8) thì xem như có đa cộng tuyến giữa Xj và các biến độc lập kia.
Bước 5: Xác định các nhân tố ảnh hưởng đến giá cổ phiếu bằng phương pháp ước lượng mô hình
Trong kinh tế lượng, thủ tục ước lượng được dùng phổ biến nhất là phương pháp bình phương nhỏ nhất. Tiêu chuẩn tối ưu được sử dụng bởi phương pháp bình phương nhỏ nhất là cực tiểu hóa hàm mục tiêu.
Phương pháp bình phương nhỏ nhất là một phương pháp được đưa ra bởi nhà toán học Đức Carl Friedrich Gauss, đây là một phương pháp mạnh và được rất nhiều người sử dụng, nó thường được ký hiệu là OLS (Ordinary Least Squares). Tư tưởng của phương pháp này là cực tiêu tổng bình phương các phần dư. Do đó có thể nói để có được đường hồi quy thích hợp nhất, chúng ta chọn ước lượng của tung độ gốc và độ dốc sao cho phần dư là nhỏ.
Chúng ta đặt:
i : là giá trị của hàm hồi quy mẫu ei: là phần dư Yi - i
Biểu đồ 2.6: Mô hình hồi quy
Do đó cực tiểu hóa sẽ tương đương với cực tiểu ∑ei2, từ đó tìm ra β1 và β2
Chúng ta có thể mô tả tổng quát như sau:
Xét mô hình hồi quy tổng thể: Y = β0 + β1X1 +… + β kXk + u Với mẫu
Chúng ta sẽ sử dụng phương pháp bình phương nhỏ nhất để tìm các tham số của hàm hồi quy mẫu.
Sử dụng phương pháp bình phương bé nhất thông thường OLS để ước lượng phương trình hồi quy với biến phụ thuộc là giá cổ phiếu ngành thép và các biến độc lập là vốn chủ sở hữu của doanh nghiệp, tỷ lệ chi trả cổ tức, thu nhập trên mỗi cổ phiếu, chỉ số tăng trưởng GDP, chỉ số giá tiêu dùng CPI, chỉ số giá nhà ở, sản lượng tiêu thụ thép.
Chúng ta sử dụng phương pháp OLS để ước lượng các tham số của mô
y y4 y3 y2 y1 e2 e1 e4 e5 x1 x2 x3 x4 x +
hình SIM khi dữ liệu mô hình tuân thủ quy luật phân phối chuẩn, độc lập và đồng nhất.
Mô hình hồi quy được xác định như sau: Trong đó:
Y: Mức tăng trưởng giá cổ phiếu ngành Thép
X={X1; …; Xj}: Các biến thang đo nhân tố ảnh hưởng đến giá cổ phiếu β={ β0;…. βj}: Hệ số hồi quy tác động đến giá cổ phiếu
ei: sai số
Phương pháp OLS là phương pháp đáng tin cậy trong việc ước lượng các tham số của mô hình, tuy nhiên mô hình ước lượng phải thỏa mãn 7 giả thiết. Khi thỏa mãn các giả thiết, ước lượng bình phương nhỏ nhất là ước lượng tuyến tính không chệch có hiệu quả nhất trong các ước lượng.
Bước 6: Kiểm định sự vi phạm các giả định của mô hình và đưa ra kết quả nghiên cứu của đề tài.
Kiểm định tự tương quan
Tự tương quan được hiểu là sự tương quan giữa các thành phần của dãy quan sát theo thời gian (đối với số liệu chuỗi thời gian) hoặc không gian (đối với số liệu chéo).
Giả thiết không có tự tương quan giữa các nhiễu trong mô hình hồi quy tuyến tính cổ điển được biểu diễn bằng hệ số hiệp phương sai: Cov(ei, ej) =0
Khi xảy ra hiện tượng tự tương quan thì: Cov(ei, ej) ≠ 0.
Nếu kết hợp giả thiết kỳ vọng của nhiễu E(ei) = 0 và định nghĩa hiệp phương sai, ta có thể biễu diễn tính chất không có tự tương quan giữa các nhiều bằng biểu thức sau: E(ei, ej) ≠ 0.
Điều này có nghĩa là nhiễu của một quan sát không bị ảnh hưởng bởi nhiễu của quan sát khác.
Để phát hiện có hay không có hiện tượng tự tương quan trong mô hình, người ta sử dụng các phương pháp như phương pháp đồ thị phần dư, phương pháp kiểm định d của Durbin Watson, phương pháp kiểm định Breusch Godfrey.
Tuy nhiên, phương pháp Durbin Watson có một số khuyết điểm nên đề tài sử dụng phương pháp Breusch Godfrey để phát hiện ra hiện tượng tự tương quan trong các mô hình hồi quy.
Giả sử rằng số hạng nhiều ut được tạo bởi sơ đồ tự hồi qui bậc p như sau:
Trong đó εt thỏa mãn các giả thuyết của phương pháp OLS
Giả thiết H0 của chúng ta cho rằng ρ1= ρ2= …= ρk= 0, nghĩa là tất cả các hệ số tự hồi qui đồng thời bằng 0, tức là không có tự tương quan bậc k.
Breusch và Godfrey đã chỉ ra rằng giả thiết H0 có thể được kiểm định như sau:
Bước 1: Ước lượng mô hình hồi qui bằng qui trình OLS thông thường: Bước 2: Hồi qui ut được xác định theo tất cả các biến độc lập trong mô hình hồi qui cộng với các biến độc lập bổ sung này, ut-1, ut-2, …, ut-p, trong đó các biến sau là các giá trị trễ của các phần dư đã ước lượng trong Bước 1. Thu được giá trị R2
từ phép hồi qui này.
Bước 3: Nếu cỡ của mẫu lớn, Breusch và Godfrey đã chỉ ra rằng: (n-p). R2 ~ X2p
Tức là, một cách tiệm cận, (n-p) nhân với R2 vừa thu được ở Bước 2 tuân theo kiểm định Chi-bình phương với bậc tự do là p. Nếu trong một ứng dụng (n-p). R2
vượt quá giá trị Chi-bình phương tới hạn ở mức ý nghĩa đã chọn, chúng ta có thể bác bỏ giả thiết H0, trong trường hợp này ít nhất có 1 ρ là khác 0 một cách đáng kể.
Kiểm định phương sai sai số thay đổi
Một trong những giả thiết quan trọng của mô hình hồi quy tuyến tính cổ điển là các sai số ngẫu nhiên εi trong hàm hồi quy tổng thể phải có phương sai không thay đổi và bằng σ2. Đây là giả thiết phương sai không thay đổi, tức là phương sai bằng nhau. Nghĩa là:
Cũng như trường hợp đa cộng tuyến, chúng ta không có một phương pháp chắc chắn để phát hiện hiện tượng phương sai sai số thay đổi, mà chỉ có thể đưa ra một vài công cụ chuẩn đoán có thể giúp ta phát hiện ra hiện tượng này. Có rất nhều cách để chuẩn đoán như xem xét đồ thị của phần dư, sử dụng kiểm định Park, kiểm định Glejser, kiểm định Spearman, kiểm định White, kiểm định dựa trên biến phụ thuộc. Đề tài sử dụng kiểm định White để phát hiện hiện tượng phương sai thay đổi.
Kiểm định này là một kiểm định tổng quát về sự thuần nhất của phương sai, trong đó không cần có giả thiết ui có phân bố chuẩn.
Sử dụng kiểm định White
Xét mô hình: Yi = β1 + β2X2 + β3X3 + εi Và σi2= α1 + α2X2i + α3X3i + α4(X2i)2
+α5(X3i)2
+ α6X2i X3i + ei Giả thiết:
H0: α2= α3=…=α6=0, không tồn tại phương sai không đồng nhất H1: tồn tại phương sai không đồng nhất
Trình tự kiểm định:
- Ước lượng mô hình trên để tính phần dư
- Thực hiện hồi quy mô hình phụ:
= α1 + α2X2i + α3X3i + α4(X2i)2 +α5(X3i)2 + α6X2i X3i + ei
- Tính giá trị thống kê kiểm định nR2, với n là số quan sát của mẫu, R2 là hệ số xác định bội của mô hình phụ.
- So sánh nếu thì bác bỏ giả thiết H0, tức là tồn tại hiện tượng phương sai không đồng nhất (df là bậc tự do). Trong trường hợp ngược lại thì giả thiết H0 không có cơ sở bị bác bỏ
Kiểm định sự phù hợp của mô hình
Có một số phương pháp thống kê để tiến hành đánh giá sự phù hợp của mô hình là tính toán hệ số xác định, dùng số thống kê F để đánh giá mức ý nghĩa toàn diện của mô hình, tính toán sai số chuẩn của ước lượng và đánh giá ý nghĩa của từng biến độc lập riêng biệt.
Đề tài sử dụng thống kê F của mô hình Fisher để kiểm định sự phù hợp của mô hình hồi quy.
Chúng ta thiết lập giả thiết H0 và H1 như sau: H0: R2 = 0: hàm hồi quy không phù hợp H1: R2 > 0: hàm hồi quy phù hợp
Bản chất của giả thiết H0 có nghĩa là mô hình hồi quy đa biến tổng thể mà chúng ta xây dựng với tất cả các biến độc lập được đưa vào để giải thích cho biến phụ thuộc thực ra không giải thích được cho những biến thiên trong biến phụ thuộc hay nói cách khác, hàm hồi quy mẫu không phù hợp.
Tương tự, chúng ta có thể xây dựng lại một giả thiết có dạng biểu hiện khác như sau:
H0: β1= β2= β3=…= βk-1=0 H1: Có ít nhất một hệ số βj≠0
Nếu giả thiết H0 trên đúng nghĩa là tất cả các hệ số độ dốc đều đồng thời bằng 0 thì mô hình hồi quy bội đã xây dựng không hề có tác dụng trong việc dự đoán hay mô tả về biến phụ thuộc.
Ta có thể áp dụng phương pháp giá trị tới hạn hay mức ý nghĩa để quyết định. Nếu F0 > Fα hoặc p-value = P (F > F0) <α: bác bỏ giả thiết H0.