3.2.1. Thống kê mô tả
Dữ liệu sơ cấp sau khi làm sạch được tổng hợp, phân tích thống kê theo các đặc trưng của người tham gia khảo sát bằng phần mềm Excel và SPSS phiên bản 26.0. Các tiêu chí về độ tuổi, giới tính, thu nhập, trình độ học vấn, tần suất mua
sắm, số tiền chi tiêu trung bình… sẽ được phân tích, mô tả theo tần số, tỷ lệ, giá trị lớn nhất, giá trị nhỏ nhất, giá trị trung bình và độ lệch chuẩn trên mẫu điều tra.
3.2.2. Phân tích hệ số Cronbach’s Alpha
Kiểm định độ tin cậy thang đo Cronbach’s Alpha là một công cụ phản ánh mức độ chặt chẽ mà các mục hỏi trong thang đo tương quan với nhau (Hoàng Trọng và Chu Nguyễn Mộng Ngọc, 2005). Mục đích của việc sử dụng phương pháp này nhằm để vừa đánh giá sự phù hợp của thang đo, đồng thời vừa là cơ sở để loại bỏ các biến rác có thể tạo ra các nhân tố giả khi phân tích EFA (Nguyễn Đình Thọ và Nguyễn Thị Mai Trang, 2009). Churchill Jr (1979) cho rằng hệ số Cronbach’s Alpha nên là phép đo đầu tiên được sử dụng để đánh giá chất lượng của các biến. Bởi Churchill giả định rằng nếu tất cả các biến trong một thang đo cùng quan sát một cấu trúc duy nhất thì những biến này phải có tương quan cao với nhau.
Hệ số Cronbach’s Alpha có giá trị biến thiên trong khoảng từ 0 đến 1. Cụ thể, các mức giá trị của hệ số Alpha có ý nghĩa như sau: Lớn hơn 0,8 là thang đo lường tốt; từ 0,7 đến 0,8 là sử dụng được; từ 0,6 trở lên là có thể sử dụng trong trường hợp khái niệm nghiên cứu có nội dung mới hoặc là mới trong bối cảnh nghiên cứu (Nunally, 1978; Peterson, 1994; Slater, 1995). Theo như lý thuyết, hệ số Cronbach’s Alpha càng cao, độ tin cậy của thang đo càng lớn. Tuy nhiên, điều này không hoàn toàn phù hợp khi hệ số Cronbach’s Alpha quá lớn (≥ 0,95) bởi có thể dẫn đến hiện tượng trùng lắp thang đo (Nguyễn Đình Thọ và Nguyễn Thị Mai Trang, 2009).
Tuy nhiên, hệ số Cronbach’s Alpha không khẳng định được biến nào nên bị loại bỏ hoặc được giữ lại (Nunnally & Bernstein, 1994). Vì vậy, cần xét thêm hệ số tương quan giữa biến – tổng (Corrected Item – Total Correlation) trong cùng một thang đo để loại ra những biến quan sát không đóng góp nhiều cho sự mô tả khái niệm cần đo (Hoàng Trọng và Chu Nguyễn Mộng Ngọc, 2008). Các biến quan sát có tương quan biến – tổng nhỏ hơn 0,3 được xem là biến rác và sẽ bị loại ra và thang đo.
Tổng kết lại, có 3 tiêu chí được sử dụng để kiểm định độ tin cậy của thang đo khi phân tích Cronbach’s Alpha, bao gồm: (1) hệ số Cronbach’s Alpha tổng của thang đo ≥ 0,6; (2) hệ số tương quan biến – tổng ≥ 0,3; (3) hệ số Cronbach’s Alpha nếu loại biến nhỏ hơn hệ số Cronbach’s Alpha tổng của thang đo.
3.2.3. Phân tích nhân tố khám phá EFA
Sau bước kiểm định hệ số tin cậy Cronbach’s Alpha, các biến thỏa mãn sẽ tiếp tục được đưa vào phân tích nhân tố khám phá EFA (Exploratory Factor Analysis). EFA là một phương pháp phân tích định lượng dùng để rút gọn một tập gồm nhiều biến đo lường phụ thuộc lẫn nhau thành một tập biến ít hơn (gọi là các nhân tố) để chúng có ý nghĩa hơn nhưng vẫn chứa đựng hầu hết nội dung thông tin của tập biến ban đầu (Hair và các cộng sự, 2009). Mục đích của nhân tố khám phá EFA nhằm thu nhỏ và tóm gọn dữ liệu để xác định tập hợp biến cần thiết đưa vào hồi quy dựa vào mối quan hệ tuyến tính của các nhân tố với các biến nguyên thủy (biến quan sát). Khi thực hiện phân tích nhân tố khám phá EFA, cần phải lưu ý một số tiêu chí quan trọng sau:
Thứ nhất, hệ số tải nhân tố hay trọng số nhân tố (factor loading) là chỉ tiêu để đảm bảo mức ý nghĩa thiết thực của phân tích nhân tố EFA (Hair và cộng sự, 2009). Mức đánh giá hệ số tải nhân tố Factor loading được phân loại như sau: Factor loading > 0,3 được xem là đạt mức tối thiểu; factor loading > 0,4 được xem là quan trọng; factor loading > 0,5 được xem là có ý nghĩa thực tiễn. Tại mỗi biến quan sát, chênh lệch hệ số tải nhân tố lớn nhất và bất kỳ phải ≥ 0,3 (Jabnoun & AI – Tamimi, 2003). Nếu chênh lệch hệ số tải của một biến quan sát trên các nhân tố nhỏ hơn 0,3, biến quan sát sẽ bị loại để đảm bảo độ phân biệt của nhân tố (Nguyễn Đình Thọ, 2011).
Thứ hai, để phân tích hiệu quả các nhân tố, chỉ số KMO (Kaiser-Meyer-Olkin) phải có giá trị trong khoảng 0,5 đến 1, phản ánh các biến quan sát đủ điều kiện để hình thành nên nhân tố. Trong đó KMO ≥ 0,9 là rất tốt; KMO ≥ 0,8 là tốt; KMO ≥ 0,7 là được, KMO ≥ 0,6 là tạm được; KMO ≥ 0,5 là xấu (Kaiser, 1974; Nguyễn
Đình Thọ, 2011). Nếu trị số này nhỏ hơn 0,5 tức phân tích nhân tố có khả năng không thích hợp với dữ liệu.
Thứ ba, kiểm định Bartlett có ý nghĩa thống kê mở ngưỡng 95%. Đây là một đại lượng thống kê nhằm để xem xét giả thuyết các biến không có tương quan trong tổng thể. Nếu kiểm định này có ý nghĩa thống kê (Sig. < 0,05) thì các biến quan sát có mối tương quan với nhau trong tổng thể (Hoàng Trọng và Chu Nguyễn Mộng Ngọc, 2008).
Thứ tư, trị số Eigenvalue là một tiêu chí đại diện phần biến thiên được giải thích bởi mỗi nhân tố. Với tiêu chí này, chỉ có những nhân tố nào có Eigenvalue ≥ 1 mới được giữ lại trong mô hình phân tích (Gerbing và Anderson, 1988).
Thứ năm, phần trăm phương sai toàn bộ (percentage of variance) phải lớn hơn 50%. Đồng thời, tổng phương sai trích (cumulative % extraction sum of squared loading), cho biến các nhân tố được trích giải thích được phần trăm sự biến thiên của các biến quan sát, phải ≥ 50% thì mới chấp nhận thang đo (Hoàng Trọng và Chu Nguyễn Mộng Ngọc, 2008).
Ngoài ra, tác giả kết hợp phương pháp trích Principal Components Analysis với phép xoay Varimax trong phân tích nhân tố khám phá EFA. Do đó, tác giả không đưa biến phụ thuộc vào chung với biến độc lập để xử lý EFA cùng một lúc (Nguyễn Đình Thọ, 2011). Phương pháp trích Principal sẽ giúp rút gọn dữ liệu, giảm đa cộng tuyến giữa các nhân tố trong bước phân tích hồi quy tiếp theo.
3.2.4. Phân tích tương quan Pearson
Mục đích của kiểm định tương quan là để xem xét mức độ tương quan tuyến tính giữa các biến độc lập và phụ thuộc dựa vào hệ số tương quan Pearson (r) trong ma trận. Từ đó chọn lọc những biến độc lập thực sự có tương quan với biến phụ thuộc để tiến hành mô hình hóa mối quân hệ nhân quả bẳng mô hình hồi quy tuyến tính bội.
Mức giá trị của hệ số Pearson được phân ra như sau: Nhỏ hơn 0,2 nghĩa là các biến không tương quan; từ 0,2 đến dưới 0,4 là mức tương quan yếu; từ 0,4 đến dưới
0,6 là mức tương quan trung bình; từ 0,6 đến dưới 0,8 là mức tương quan lớn; từ 0,8 đến 1 là mức tương quan rất lớn.
Điều kiện để tương quan có ý nghĩa là khi giá trị Sig. < 0,05. Nếu hệ số Sig. này bé hơn 5% có thể kết luận được là hai biến có tương quan lẫn nhau (Hoàng Trọng và Chu Nguyễn Mộng Ngọc, 2008). Một trong những điều kiện để phân tích hồi quy là biến độc lập phải có tương quan với biến phụ thuộc, nên nếu ở bước phân tích tương quan này biến độc lập không có tương quan với biến phụ thuộc thì ta loại biến độc lập này ra khỏi phân tích hồi quy. Ngoài ra, khi phân tích hệ số Pearson, nếu giữa các biến độc lập có tương quan mạnh thì cần chú ý đến hiện tượng đa cộng tuyến.
3.2.5. Phân tích hồi quy tuyến tính bội
Mục đích của phân tích hồi quy tuyến tính bội nhằm để xét mối quan hệ tuyến tính giữa các biến độc lập và biến phụ thuộc. Cụ thể trong nghiên cứu này, phân tích hồi quy được thực hiện để tính toán mức độ tác động của các nhóm nhân tố hành vi ảnh hưởng đến biến quyết định đầu tư của NĐT cá nhân. Để xác định được mức độ ảnh hưởng của các yếu tố, tác giả dựa trên hệ số beta (β). Nếu hệ số beta càng lớn thì có thể nhận xét rằng yếu tố đó có mức độ ảnh hưởng cao hơn các yếu tố khác trong mô hình nghiên cứu. Bên cạnh đó, tác giả tiến hành kiểm định các giả thuyết của mô hình và đánh giá mức độ phù hợp tổng thể của mô hình. Tác giả phân chia giai đoạn phân tích hồi quy tuyến tính ra làm 2 bước như sau:
Bước 1: Đánh giá mức độ phù hợp của mô hình và tiến hành phân tích hồi quy
Trước hết, tác giả xem xét sự phù hợp của mô hình hồi quy tuyến tính thông qua kiểm định F trong kết quả phân tích phương sai ANOVA để biết được mô hình hồi quy tuyến tính có thể được suy rộng và áp dụng cho tổng thể hay không. Nếu Sig. < 0,05 thì mô hình hồi quy phù hợp với dữ liệu thu thập được và các biến đưa vào đều có ý nghĩa thống kê với độ tin cậy 95%.
Đồng thời, ở bước này, tác giả kiểm định ý nghĩa của các hệ số hồi quy bằng giá trị Sig. trong kết quả hồi quy. Bằng phần mềm SPSS phiên bản 26.0, tất cả các
biến được tác giả đưa vào lần lượt theo phương pháp Enter (là phương pháp đưa cùng lúc tất cả các biến vào phân tích) để thu lại các thông số thống kê liên quan đến các biến.
Bước 2: Kiểm tra sự phù hợp về mức độ tin cậy của phương trình hồi quy
Thông qua việc dò tìm vi phạm giả định, tác giả kiểm tra được sự phù hợp về mức độ tin cậy của phương trình hồi quy. Nếu bất cứ điều kiện nào sau đây bị vi phạm thì kết quả hồi quy cũng sẽ giảm đi độ chính xác.
+ Giả định 1: Phần dư ɛ trong hồi quy phải xấp xỉ phân phối chuẩn. Kiểm tra giả định này được căn cứ dựa trên biểu đồ Histogram và Normal P-P Plot phần dư. Nếu giá trị trung bình (mean) gần bằng 0 với độ lệch chuẩn xấp xỉ 1, ta có thể khẳng định phân phối là xấp xỉ chuẩn, tức giả định phân phối chuẩn của phần dư không bị
vi phạm.
+ Giả định 2: Có mối liên hệ tuyến tính giữa biến phụ thuộc và các biến độc lập. Đồ thị phân tán giữa các phần dư chuản hóa và các giá trị dư đoán chuẩn hóa sẽ giúp dò tìm xem dữ liệu có vi phạm giả định tuyến tính hay không. Nếu chúng phân tán một cách ngẫu nhiên xung quanh đường tung độ 0 và không tạo thành một hình dạng nào thì có thể kết luận giả định quan hệ tuyến tính không bị vi phạm.
+ Giả định 3: Phương sai đồng nhất (hay còn gọi là phương sai của phần dư không thay đổi). Để đánh giá mô hình hồi quy có vi phạm giả định này hay không, tác giả tiến hành phân tích tương quan hạng Spearman giữa phần dư chuẩn hóa (ABSRES) với các biến độc lập. Khi tất cả giá trị Sig. tương quan giữa phần dư chuẩn hóa với các biến độc lập đều lớn hơn 0,05 thì có thể kết luận không có hiện tượng phương sai thay đổi xảy ra. Trường hợp có bất kì một giá trị Sig. nào nhỏ hơn 0,05 thì mô hình hồi quy đã vi phạm giả định phương sai đồng nhất.
+ Giả định 4: Không có hiện tượng đa cộng tuyến, hay nói cách khác là các biến độc lập không có tương quan với nhau. Tác giả còn thực hiện kiểm tra giả định này thông qua hệ số phóng đại phương sai VIF (Variance inflation factor). Cụ thể, theo lý thuyết, để không xảy ra đa cộng tuyến, hệ số dung sai (Tolerance – Độ chấp
nhận của biến) của các biến đều phải lớn hơn 0,5 và hệ số phóng đại của phương sai VIF (Variance Inflation Factor) của tất cả các biến phải nhỏ hơn 2.
+ Giả định 5: Các sai số độc lập với nhau, không có hiện tượng tự tương quan giữa các phần dư. Hệ số Durbin – Watson sẽ có giá trị trong khoảng từ 0 đến 4, và nếu giá trị của đại lượng này gần bằng 2 thì các phần dư không có tương quan chuỗi bậc nhất (Hoàng Trọng và Chu Nguyễn Mộng Ngọc, 2008).
3.3. Thang đo sử dụng cho nghiên cứu3.3.1. Thang đo thông tin cá nhân 3.3.1. Thang đo thông tin cá nhân
Các câu hỏi được chia thành 3 phần: thông tin cá nhân, các nhân tố hành vi ảnh hưởng đến quyết định đầu tư và quyết định đầu tư. Trong phần thông tin cá nhân, phương pháp đo lường danh nghĩa và thứ bậc được sử dụng. Thang đo danh nghĩa được sử dụng để phân loại các đối tượng trong khi thang đo thứ bậc là cần thiết cho cả hai mục tiêu: phân loại và xếp hạng thứ tự của các đối tượng quan sát. Các loại phép đo sử dụng cho phần này được thể hiện trong Bảng 3.1:
Bảng 3.1: Các loại thang đo cho thông tin cá nhân
Thông tin cá nhân
Phân loại: Giới tính, tham dự các khóa học chứng khoán
Phân loại và xếp hạng thứ bậc: Độ tuổi, trình trạng hôn nhân, trình độ học vấn, số năm kinh nghiệm làm việc thời gian tham gia đầu tư trên thị trường chứng khoán.
3.3.2. Thang đo cho các nhân tố ảnh hưởng đến quyết định đầu tư
Tự nghiệm và các lệch lạc bắt đầu với lệch lạc quen thuộc, sự quen thuộc được cho sẽ dẫn đến sự đầu tư quá mức vào các chứng khoán địa phương và nội địa. Khuynh hướng ước lượng quá mức khả năng dự báo có thể ủng hộ cho quan điểm sai lầm rằng “những công ty tốt là những cơ hội đầu tư tốt”. Một khi những quan điểm (dù sai lầm hoặc hợp lý) được hình thành, mốc neo này có thể khiến cho nhiều NĐT bám vào chúng rất lâu. Ước lượng quá thấp sự hồi quy về giá trị trung bình có thể là nguyên nhân gây ra việc ngoại suy tăng trưởng thu nhập quá khứ cho tương lai quá xa. Sự sẵn có khiến các NĐT tập trung vào những chứng khoán có nhiều tin tức. Sự tức thì khiến cho họ mua những cổ phiếu nóng mặc dù không có nhiều bằng chứng cho thấy đây là một quyết định sáng suốt. Dựa vào các nghiên cứu trước đó của Mark Grinblatt và Matti Keloharju (2001); Laura Frieder và Avanidhar (2005); Ackert và Church, (2006); Brad Barber và Terrance Odean (2007); Minh Man Cao, Nhu Ty Nguyen và Thanh Tuyen Tran (2020) tác giả đã xây dựng thang đo tác động của tự nghiệm và các lệch lạc như trong Bảng 3.2 như sau:
Bảng 3.2: Thang đo tác động của tự nghiệm và các lệch lạc Kí hiệu
TNLL1 Anh/Chị ưu tiên đầu tư vào các công ty có trụ sở
gần nhà.
TNLL2
Anh/Chị ưu tiên đầu tư vào các công ty Anh/Chị làm việc hoặc thương hiệu mà Anh/Chị đã biết.
TNLL3
Anh/Chị nhận định rằng một công ty tốt đại diện cho một khoản đầu tư tốt.
Anh/Chị theo đuổi những cổ phiếu đang có xu TNLL4 hướng tăng giá và tránh những cổ phiếu có xu
hướng giảm giá.
Anh/Chị mua một số cổ phiếu dựa vào các báo cáo
TNLL5 phân tích miễn phí sẵn có trên các phương tiện
truyền thông.
Anh/Chị mua một số cổ phiếu khi biết thông tin cổ TNLL6
phiếu đó đang có khối lượng mua bán cao.
Anh/Chị mua một số cổ phiếu khi biết thông tin cổ TNLL7
phiếu đó đang có tỷ suất sinh lợi bất thường.
Anh/Chị cho rằng cổ phiếu có giá niêm yết trên sàn TNLL8 chứng khoán càng cao thì giá trị thực của nó cũng
cao tương ứng.
(Nguồn: Tác giả tổng hợp)
Hầu hết các NĐT quá tự tin thường đánh giá cao bản thân mình hơn những gì người khác đánh giá và thường phóng đại sự hiểu biết của mình (Fischhoff cùng cộng sự, 1977). Odean (1998) cho rằng, sự tự tin của NĐT có liên quan đến hành vi
ro đầu tư. Tác giả dựa trên tài liệu nghiên cứu của Saif Muhammad Ather cùng các cộng sự (2020) và một số công trình nghiên cứu khác có liên quan để xây dựng thang đo ảnh hưởng của sự quá tự tin như sau:
Bảng 3.3: Thang đo ảnh hưởng của sự quá tự tin Kí hiệu
QTT1 Càng cảm thấy tự tin vào khả năng đầu tư của bản thân
thì Anh/Chị càng muốn tiếp tục đầu tư nhiều hơn. Càng cảm thấy tự tin thì Anh/Chị càng muốn dồn tất cả