7. Các nghiên cứu trƣớc liên quan đến đề tài nghiên cứu
3.5. PHƢƠNG PHÁP NGHIÊN CỨU
3.5.1. Mô tả thống kê
Phân tích mô tả là bƣớc đầu tiên của bài nghiên cứu này. Nghiên cứu đƣợc tiến hành trong mẫu đã chọn với các thông tin về biến có sẵn. Bảng thống kê mô tả các biến sẽ cung cấp thông tin chi tiết về mỗi biến có liên quan. Thông tin đó bao gồm trung bình, độ lệch chuẩn, giá trị lớn nhất và giá trị nhỏ nhất. Qua đó, ta có cái nhìn sơ bộ về các biến có trong mô hình.
Bài nghiên cứu sử dụng phần mềm SPSS để chạy mô hình phân tích các biến trong nghiên cứu này.
Kết quả mô tả thống kê cho chúng ta biết những thông tin ban đầu về các biến đƣợc sử dụng trong nghiên cứu nhƣ kích cỡ mẫu, giá trị trung bình, độ lệch chuẩn, giá trị lớn nhất và nhỏ nhất.
3.5.2. Phân tích tƣơng quan và đa cộng tuyến
Hệ số tƣơng quan (r) là một chỉ số thống kê đo lƣờng mối liên hệ tƣơng quan giữa hai biến số X, Y.
Cho hai biến số x và y từ n mẫu, hệ số tƣơng quan Pearson đƣợc ƣớc tính bằng công thức sau đây:
∑ ( ̅)( )
√∑ ( ̅) ∑ ( )
̅ : giá trị trung bình mẫu của biến x, y
Hệ số tƣơng quan (r) có giá trị từ -1 đến 1. Hệ số tƣơng quan (r) bằng 0 (hay gần 0) có nghĩa là hai biến số không có liên hệ gì với nhau. Ngƣợc lại, nếu hệ số tƣơng quan bằng -1 hay 1 có nghĩa là hai biến số có một mối liên hệ tuyệt đối. Nếu giá trị của hệ số tƣơng quan là âm (r < 0) có nghĩa là khi x tăng cao thì y giảm (và ngƣợc lại, khi x giảm thì y tăng). Nếu giá trị hệ số tƣơng quan là dƣơng (r > 0) có nghĩa là khi x tăng cao thì y cũng tăng, và khi x giảm thì y cũng giảm theo.
׀r׀ > 0.8 : x và y tƣơng quan mạnh, tồn tại đa cộng tuyến. ׀r׀ = 0.4 đến 0.8 : x và y tƣơng quan trung bình.
׀r׀ < 0.4 : x và y tƣơng quan yếu. [2]
Dựa vào hệ số tƣơng quan Pearson r, ta có thể thấy đƣợc mối quan hệ giữa các biến, nếu hệ số tƣơng quan r giữa các biến độc lập là cao, thì có khả năng xảy ra hiện tƣợng đa cộng tuyến. Đa cộng tuyến có nghĩa là sự tồn tại mối quan hệ tuyến tính “hoàn hảo” hoặc chính xác giữa một số hoặc tất cả các biến độc lập trong một mô hình hồi quy.
Các giải pháp khắc phục đa cộng tuyến
Loại bỏ biến: Vì tính đa cộng tuyến là do những mối quan hệ chặt chẽ
giữa các biến độc lập, cách chắc chắn nhất để loại bỏ hoặc giảm bớt các tác động của tính đa cộng tuyến là bỏ một hoặc nhiều biến độc lập ra khỏi mô hình.
Tăng kích thước mẫu: Giải pháp này thích hợp cho hiện tƣợng đa cộng
tuyến do cỡ mẫu nhỏ, vì tăng cỡ mẫu sẽ làm cải thiện độ chính xác của một ƣớc lƣợng và do đó, giảm thiểu đƣợc những yếu tố phản tác dụng của tính đa cộng tuyến. Đôi khi chỉ cần tăng thêm một số quan sát là khắc phục đƣợc hiện tƣợng đa cộng tuyến. Tuy nhiên, việc tăng dữ liệu đôi khi đồng nghĩa với việc tăng chi phí, nhất là đối với dữ liệu sơ cấp.
Thay đổi dạng mô hình.
Bỏ qua đa cộng tuyến: Nếu |t| > 2 hoặc R2 của mô hình cao hơn R2 của mô hình hồi quy phụ thì bỏ qua đa cộng tuyến. Nếu nhà nghiên cứu ít quan tâm đến việc diễn dịch từng hệ số riêng lẻ nhƣng lại chú trọng hơn vào việc dự báo, thì tính đa cộng tuyến có thể không phải là một vấn đề nghiêm trọng. Ngay cả khi có tƣơng quan cao giữa các biến độc lập, nếu nhƣ các hệ số hồi quy là có ý nghĩa, có những dấu và giá trị có ý nghĩa, thì không cần quan tâm vào vấn đề đa cộng tuyến. Bởi, nếu một hệ số hồi quy có ý nghĩa ngay cả trong trƣờng hợp có sự hiện diện của đa cộng tuyến thì đó mới là một kết quả mạnh.
3.5.3. Phân tích hồi quy
Với dữ liệu chuỗi thời gian, các giá trị của một hay nhiều biến đƣợc biểu diễn trong một khoảng thời gian nhất đinh, còn với dữ liệu chéo theo không gian, giá trị của một hay nhiều biến đƣợc đƣợc biểu diễn bằng một vài đơn vị mẫu hay thực thể, vào cùng một thời điểm. Trong những năm gần đây, các nghiên cứu kinh tế vi mô thƣờng sử dụng dữ liệu bảng (panel data), đây là sự kết hợp dữ liệu theo “cá nhân” (individual) và theo thời gian. Do đó, khi các nhà phân tích cần theo dõi hay tìm hiểu các vấn đề dựa trên dữ liệu thời gian của hàng loạt “cá nhân” thì việc phân tích dữ liệu bảng là phù hợp, nhƣng cũng phức tạp hơn so với dữ liệu chéo. Các mô hình kinh tế lƣợng dữ liệu bảng ngày càng đƣợc nhiều nhà nghiên cứu sử dụng cho mục tiêu của họ, bởi lẽ nó có rất nhiều ƣu điểm [2]:
Thứ nhất, thông qua dữ liệu chuỗi thời gian và quan sát dữ liệu theo không gian, dữ liệu bảng cung cấp nhiều thông tin hữu ích hơn, tính biến thiên nhiều hơn, đa dạng hơn, ít đa cộng tuyến giữa các biến số hơn, nhiều bậc tự do hơn và hiệu quả hơn.
Thứ hai, thông qua nghiên cứu bằng quan sát theo không gian lặp lại, dữ liệu bảng phù hợp hơn để nghiên cứu tính động của sự thay đổi.
Thứ ba, dữ liệu bảng có thể phát hiện và đo lƣờng tốt hơn những ảnh hƣởng mà không thể quan sát trong dữ liệu chuỗi thời gian thuần túy hav dữ liệu chéo theo không gian thuần túy. Dữ liệu bảng liên quan đến các cá nhân doanh nghiệp, đất nƣớc,... theo thời gian, nên có tính cá biệt trong các đơn vị này. Kỹ thuật ƣớc lƣợng dữ liệu bảng có thể chính thức xem xét đến tính dị biệt đó bằng cách xem xét các biến số có tính đặc thù theo từng cá nhân.
Thứ tƣ, bằng cách cung cấp dữ liệu với vài nghìn đơn vị, dữ liệu bảng có thể giảm đến mức thấp nhất hiện tƣợng chệch có thể xảy ra nếu gộp các cá nhân hay các doanh nghiệp theo những biến số có mức tổng hợp cao.
Với đặc thù nghiên cứu dữ liệu theo thời gian (2012 - 2014) và theo không gian (64 công ty khác nhau), kết hợp lại đƣợc 192 quan sát. Vì vậy phƣơng pháp hồi quy với dữ liệu bảng (panel data) đƣợc tác giả đƣa vào sử dụng là hoàn toàn hợp lý.
Hiện nay, có 3 cách tiếp cận phổ biến để ƣớc lƣợng mô hình hồi quy theo dữ liệu bảng: Ƣớc lƣợng theo Pooled OLS (Pooled Ordinary Least Square), ƣớc lƣợng theo mô hình các ảnh hƣởng cố định (Fixed Effects Model) và ƣớc lƣợng theo mô hình các ảnh hƣởng ngẫu nhiên (Random Effects Model).
Ƣớc lƣợng theo mô hình Pooled OLS: Là mô hình hồi quy trong đó, tất cả các hệ số đều không đổi theo thời gian và theo các cá nhân. Bỏ qua bình diện thời gian và không gian của dữ liệu kết hợp và chỉ ƣớc lƣợng OLS thông thƣờng. Mô hình này là mô hình đơn giản nhất khi không xem xét tới sự khác biệt giữa các doanh nghiệp nghiên cứu. Tuy nhiên, hạn chế lớn của mô hình này là hệ số Durbin-Watson thƣờng khá nhỏ (nhỏ hơn 1), cho nên hay gây ra hiện tƣợng tự tƣơng quan dƣơng. Hai phƣơng pháp hữu hiệu khắc phục một hay nhiều vấn đề này, chính là mô hình các ảnh hƣởng cố định (FEM) và mô hình các ảnh hƣởng ngẫu nhiên (REM).
Ƣớc lƣợng theo mô hình các ảnh hƣởng cố định (Fixed Effects Model – FEM): Với giả định mỗi thực thể đều có những đặc điểm riêng biệt có thể ảnh hƣởng đến các biến giải thích, FEM phân tích mối tƣơng quan giữa phần dƣ của mỗi thực thể với các biến độc lập, qua đó kiểm soát và tách ảnh hƣởng của các đặc điểm riêng biệt (không đổi theo thời gian) ra khỏi các biến độc lập để ƣớc lƣợng những ảnh hƣởng thực (net effects) của biến độc lập lên biến phụ thuộc, cụ thể:
Mô hình các ảnh hƣởng cố định thể hiện qua phƣơng trình: Yìt=Ci + βiX1it +…+ βnXnit + uit (3.5.1)
Trong đó:
Yit: biến phụ thuộc, với i là doanh nghiệp và t là thời gian (năm) Xit: biến độc lập
Ci: hệ số chặn cho từng doanh nghiệp và (i = 1,2,.. .,n) β: hệ số góc đối với nhân tố X
uit: phần dƣ
Mô hình trên đã thêm vào chỉ số i cho hệ số chặn C để phân biệt hệ số chặn của từng doanh nghiệp khác nhau có thể khác nhau. Sự khác biệt này có thể do đặc điềm khác nhau của từng doanh nghiệp hoặc do sự khác nhau trong chính sách quản lý, hoạt động của doanh nghiệp.
Ƣớc lƣợng theo mô hình các ảnh hƣởng ngẫu nhiên (Random Effects Model - REM): Mô hình này dựa vào giả thuyết rằng, sự khác biệt giữa các doanh nghiệp đƣợc chứa trong phần sai số ngẫu nhiên và không tƣơng quan với biến độc lập.
Chính vì vậy, nếu sự khác biệt giữa các thực thể có ảnh hƣởng đến biến phụ thuộc thì REM sẽ thích hợp hơn so với FEM. Trong đó, phần dƣ của mỗi thực thể (không tƣơng quan vói biển độc lập) đƣợc xem là biến độc lập mới.
Ý tƣởng cơ bản của mô hình ảnh hƣởng ngẫu nhiên là bắt nguồn từ mô hình (3.5.1). Thay vì mô hình (3.5.1), C là cố định thì trong REM giả định
rằng, nó là một biến ngẫu nhiên với trung bình là Ci và hệ số chặn đƣợc mô tả nhƣ sau:
Ci = C1 + ɛi (i = 1,2, …, n)
Trong đó ɛi là sai số ngẫu nhiên có trung bình bằng 0 và phƣơng sai là σ2
e thay vào mô hình (3.5.1), ta có: Yìt=Cl + βiX1it +…+ βnXnit + uit + ɛi
Hay Yìt=Cl + βiX1it +…+ βnXnit + wit
Với wit = uit + ɛi
ɛi: Sai số thành phần của các đối tƣợng khác nhau (đặc điểm riêng khác nhau của từng doanh nghiệp)
uit : Sai số thành phần kết hợp của cả đặc điểm riêng theo từng đối tƣợng và theo thời gian.
Điểm khác biệt giữa mô hình ảnh hƣởng ngẫu nhiên và mô hình ảnh hƣởng cố định đƣợc thể hiện ở sự biến động giữa các thực thể. Nếu trong mô hình ảnh hƣởng cố định giả định sự biến động giữa các thực thể có tƣơng quan với biến độc lập, còn trong mô hình ảnh hƣởng ngẫu nhiên giả định sự biến động giữa các thực thể là ngẫu nhiên và không tƣơng quan với biến độc lập. Mô hình FEM sử dụng biến giả, nên nó có thể làm giảm đáng kể bậc tự do. Do vậy, REM có thể đƣợc ƣa thích hơn.
Tuy nhiên, trong trƣờng hợp các biến có sự tƣơng quan thì giả định của REM không đƣợc thỏa mãn, khi đó mô hình này sẽ đƣa ra ƣớc lƣợng chệch. Vậy, mô hình FEM hay REM tốt cho nghiên cứu, điều này phụ thuộc vào giả định có hay không sự tƣơng quan giữa ɛi và biến giải thích X. Để lựa chọn FEM hay REM phù hợp hơn với dữ liệu hồi quy thì ta sử dụng kiểm định Hausman với giả thuyết [2]:
HO: Cov(ɛi, Xit) = 0 (REM phù hợp hơn) H1: Cov(ɛi, Xit) # 0 (FEM phù hợp hơn)
Giá trị tính toán là:
W = (βFE – βRE)’[Var(βFE) - Var(βRE)]-1((βFE – βRE)
Trong đó:
βFE : vector các hệ số ƣớc lƣợng từ FEM
βRE : vector các hệ số ƣớc lƣợng từ REM
Var(.) ma trận tƣơng quan tƣơng ứng của hệ số ƣớc lƣợng từ haimô hình Sau khi kiểm định, nếu p_value < 0.05(α) cho phép kết luận giả thuyết HO bị bác bỏ, khi đó ta kết luận, FEM phù hợp hơn để sử dụng. Ngƣợc lại, REM phù hợp hơn cho mô hình chấp nhận giả thuyết H0.
3.5.4. Kiểm định sự phù hợp của mô hình
a. Kiểm định giả thuyết về β
Kiểm định giả thuyết về β đƣợc hiểu là kiểm định xem biến độc lập có thực sự ảnh hƣởng đến biến phụ thuộc hay không. Nói cách khác là hệ số hồi quy có ý nghĩa thống kê hay không.
Giả thuyết: H0 : βj = 0 H1 : βj # 0
Có thể sử dụng giá trị p_value trong Eview. Nếu p_value tính đƣợc nhỏ hơn mức ý nghĩa (α) thì bác bỏ giả thuyết H0 và ngƣợc lại.
b. Kiểm định độ phù hợp của mô hình
Trong mô hình hồi quy bội, một mô hình đƣợc cho là không có sức mạnh giải thích khi toàn bộ các hệ số hồi quy riêng phần đều bằng không.
Giả thuyết:
H0 : β2 = β3 = … = β3 = 0
H1 : Có ít nhất một trong những giá trị βj # 0
Có thể sử dụng giá trị p_value trong Eview. Nếu p_value tính đƣợc nhỏ hơn mức ý nghĩa (α) thì bác bỏ giả thuyết H0 và ngƣợc lại.
KẾT LUẬN CHƢƠNG 3
Trong chƣơng 3, tác giả đã tập trung xây dựng thiết kế nghiên cứu các nhân tố ảnh hƣởng hiệu quả tài chính các doanh nghiệp sản xuất hàng tiêu dùng. Trên nền tảng thông tin thu thập đƣợc của chƣơng 2, tác giả đã đƣa ra thiết kế nghiên cứu gồm 4 nội dung sau:
Xây dựng các giả thuyết, kết hợp với các dẫn chứng khoa học của các nghiên cứu đi trƣớc cùng với thực tế các DN sản xuất hàng tiêu dùng Việt Nam hiện tại để có thể đƣa ra giả thuyết phù hợp. Từ giả thuyết, tác giả đã xây dựng mô hình nghiên cứu các nhân tố ảnh hƣởng đến hiệu quả tài chính của các doanh nghiệp sản xuất hàng tiêu dùng.
Việc xây dựng mô hình sẽ hình thành nên các biến độc lập và biến phụ thuộc. Tác giả đã chỉ rõ cách xác định và đo lƣờng các biến độc lập cũng nhƣ biến phụ thuộc.
Quá trình chạy mô hình cần phải có dữ liệu, tác giả thực hiện chọn mẫu 64 công ty từ tổng thể 128 công ty. Cách thức chọn mẫu đƣợc tác giả miêu tả chi tiết cụ thể.
Phƣơng pháp nghiên cứu đƣợc tác giả trình bày rõ trong chƣơng, đƣa ra cách xử lý số liệu cũng nhƣ phƣơng pháp chạy mô hình hồi quy.
CHƢƠNG 4
KẾT QUẢ NGHIÊN CỨU VÀ CÁC HÀM Ý RÚT RA TỪ KẾT QUẢ NGHIÊN CỨU
4.1. KẾT QUẢ NGHIÊN CỨU
4.1.1. Thống kê mô tả mẫu nghiên cứu
Bảng 4.1: Bảng thống kê mô tả các biến
Variables Mean Minimum Maximum Std. Dev. Obs
ROE 0.18398 -0.54505 0.6061 0.14747 192 SIZE 1.41256E+12 1.53038E+10 2.57701E+13 3.07542E+12 192 GROWTH 0.08597 -0.62425 1.49781 0.23442 192 TANG 0.28683 0.00564 0.82059 0.18504 192 D/E 1.67574 0.66056 29.66716 3.46173 192 TURN 1.68918 0.40855 4.83973 0.94709 192 SAE 0.12774 0.00981 0.45713 0.08913 192 (Nguồn: Tổng hợp từ SPSS)
Lƣu ý: ROE là tỷ suất sinh lời vốn chủ sở hữu; SIZE là quy mô doanh nghiệp; GROWTH là tốc độ tăng trƣởng; TANG là tỷ lệ tài sản cố định trên tổng tài sản; D/E là tỷ suất nợ phải trả trên vốn chủ sở hữu; TURN là vòng quay tổng tài sản; SAE là tỷ lệ chi phí bán hàng và quản lý doanh nghiệp trên tổng chi phí hoạt động.
Bảng 4.1 cung cấp thống kê mô tả tỷ suất sinh lời vốn chủ sở hữu và các biến độc lập đã đƣợc tính toán của các công ty sản xuất hàng tiêu dùng niêm yết trên sàn chứng khoán thành phố Hồ Chí Minh (HOSE) và sàn chứng khoán Hà Nội (HNX) trong 3 năm 2012-2014.
Nhƣ ta đã biết, tỷ lệ ROE càng cao càng chứng tỏ công ty sử dụng hiệu quả đồng vốn của cổ đông, có nghĩa là công ty đã cân đối một cách hài hòa giữa vốn cổ đông với vốn đi vay để khai thác lợi thế cạnh tranh trong quá trình huy động vốn, mở rộng quy mô. Theo Warren Buffett, ROE > 20 đƣợc coi là hợp lý. Tuy nhiên trong giai đoạn 2012-2014, ROE có xu hƣớng giảm
trên toàn thị trƣờng do sự bất ổn về tình hình kinh tế. Theo bảng 4.1, tỷ suất sinh lời vốn chủ sở hữu (ROE) của các công ty sản xuất hàng tiêu dùng trong mẫu nghiên cứu là 18.40% với độ lệch chuẩn 14.75% là khá lớn. Điều này có nghĩa là với 100 đồng vốn chủ sở hữu bỏ ra kinh doanh thu đƣợc 18.4 đồng lợi nhuận trƣớc thuế. Trong mẫu nghiên cứu chỉ có Công ty cổ phần kỹ thuật và ô tô Trƣờng Long (mã chứng khoán: HTL) và Công ty cổ phần chế biến thủy sản xuất khẩu Ngô Quyền (mã chứng khoán: NGC) có lợi nhuận/ vốn chủ sỡ hữu khá cao vào năm 2014,ở mức trên 40 . Trong đó Công ty cổ phần kỹ thuật và ô tô Trƣờng Long đạt ROE cao nhất, 60.61%.
Quy mô doanh nghiệp: Quy mô trung bình của các công ty sản xuất hàng tiêu dùng trong mẫu nghiên cứu là 1.4125E+12 đồng, có thể hiểu là, tổng tài sản trung bình của các doanh nghiệp trong mẫu là 1,412.5 tỷ đồng. Trong đó