CHƯƠNG 2: PHƯƠNG PHÁP LUẬN VÀ PHƯƠNG PHÁP NGHIÊN CỨU
2.2 PHƯƠNG PHÁP NGHIÊN CỨU
2.2.2 Phương pháp phân tích số liệu
- Đề tài sử dụng phương pháp thống kê mô tả để để đánh giá sơ lược về tình hình học-thi chứng chỉ anh ngữ của sinh viên khoa KT-QTKD trường đại học Cần Thơ
- Đề tài sử dụng phương pháp kiểm định T và ANOVA để xác định sự khác biệt trong tình hình học-thi chứng chỉ anh ngữ của các sinh viên có thông tin chung (nhân khẩu học) khác nhau. Phương pháp phân tích bảng chéo để tra có
mối quan hệ giữa các đặc điểm về nhân khẩu học với việc học- thi chứng chỉ anh ngữ sinh viên hay không.
b) Mục tiêu thứ hai: sử dụng phương pháp phân tích nhân tố để phân nhóm các nhân tố ảnh hưởng đến việc học-thi chứng chỉ anh ngữ của sinh viên khoa KT-QTKD trường đại học Cần Thơ. Dùng phương pháp phân tích cụm để phân chia sinh viên thành các nhóm (phân khúc) khác nhau và tìm hiểu sự khác nhau trong mối quan tâm đến việc học - thi lấy chứng chỉ anh ngữ.
c) Mục tiêu thứ ba: từ các kết quả phân tích đưa ra giải pháp khắc phục những mặt còn hạn chế nhằm nâng cao hiệu quả học-thi chứng chỉ anh ngữ của sinh viên khoa KT-QTKD trường đại học Cần Thơ. Đề tài sử dụng phương pháp thảo luận nhóm.
2.2.2.1 Phương pháp thống kê mô tả
Thống kê mô tả (Descriptive Statistics) là tổng hợp của một số phương pháp phân tích dữ liệu từ nguồn số liệu sơ cấp hoặc thứ cấp mà chưa được xử lý thành số liệu có giá trị về mặt nào đó của nghiên cứu. Sử dụng các phương pháp đo lường, mô tả vàtrình bày số liệu bằng các phép tính và chỉ số thống kê như: số trung bình, số trung vị, phương sai ,độ lệch chuẩn…Bằng các phương pháp lập thành bảng, biểu đồ và các phương pháp tóm tắt, tính toán đơn giản nhằm làm nổi bật lên giá trị thực của thông tin. (nguồn: Phân tích dữ liệu nghiên cứu tác giả Hoàng Trọng, Chu Nguyễn Mộng Ngọc (2008)).
2.2.2.2 Phương pháp phân tích bảng chéo
Phân tích bảng chéo (Crosstabulation) là phương pháp kiểm định mối quan hệ giữa cácbiến với nhau trong quá trình phân tích. Các biến được phân tích là những biến định tính. Bằng kiểm định Chi bình phương (Chi–square) và mức ý nghĩa cho sẵn ta có thể biết được có mối quan hệ giữa các biến với nhau hay không.
Với kỳ vọng rằng các biến trên có mối quan hệ từng cặp với nhau và khi đó ta có các kiểm định và giả thuyết như sau:
- H0: Không có mối quan hệ giữa các biến - H1: Có mối quan hệ giữa các biến
Dựa vào kết quả phân tích mà kết luận là bác bỏ hay không bác bỏ H0. Nếu giá
trị Sig. ≤ α (mức ý nghĩa) thì bác bỏ giả thuyết H0. Có nghĩa là có mối quan hệ giữa các biến quan sát.
Ngoài ra, còn phải xác định số ô có tần suất mong đợi dưới 5 khi chương trình xử lý số liệu cho ra kết quả. Nếu có quá 20% số ô trong bảng chéo có tần số lý thuyết nhỏ hơn 5 thì kết quả xử lý không còn đáng tin cậy. (nguồn: Phân tích dữ liệu nghiên cứu tác giả Hoàng Trọng, Chu Nguyễn Mộng Ngọc (2008)).
2.2.2.3 Phương pháp phân tích nhân tố
Phân tích nhân tố (Factor Analysis) được sử dụng để rút gọn và tóm tắt dữ liệu. Trong nghiên cứu, khi phải thu thập một lượng biến khá lớn trong phân tích thì cần làm giảm số biến xuống để có thể dễ dàng sử dụng. Trong số các biến đưa vào mô hình thì có những biến sẽ có mối liên hệ với nhau, để có thể xác định được chúng thì cần tiến hành phân tích nhân tố để có thể chia những nhân tố trên thành những nhóm nhân tố lớn, đại diện cho một khía cạnh nào đó trong phân tích, đồng thời, cần phải sử dụng kiểm định thang đo các nhân tố. Thông qua hệ sốCronbach Alpha, có thể kiểm định mức độ chặt chẽ của các câu hỏi trong thang đo có tương quan với nhau không.
Bằng phần mềm sử lý số liệu SPSS (16.0), cho ra được kết quả của hệ số Cronbach’s Alpha, nếu hệ số này lớn hơn 0,6 thì thang đo lường có thể sử dụng cho nghiên cứu. Và bằng kiểm định Bartlett, nếu giá trị Sig.< α thì có thể nói rằng các biến không có sự tương quan lẫn nhau.
Để có thể sử dụng phương pháp phân tích nhân tố thì số liệu phải không có sự tương quan lẫn nhau và số lượng mẫu thường phải lớn hơn gấp 4 đến 5 lần số lượng biến đưa vào. KMO là một chỉ số dùng để đánh giá là có thể sử dụng phương pháp phân tích nhân tố hay không. Nếu giá trị của KMO nằm trong giữa 0,5 và 1 thì đủ điều kiện để sử dụng phân tích này. Nếu giá trị này nhỏ hơn 0,5 thì phương pháp này không phù hợp với bộ số liệu, có nghĩa cần phải sử dụng phương pháp khác để phân tích. Xoay nhân tố là một phương pháp giúp cho người nghiên cứu có thể dễ dàng giải thích hơn và có sự khác biệt với bảng ma trận nhân tố. Giá trị bảng Rolated Component Matrix(a) chứa những giá trị hệ số của từng nhân tố và cho ta biết nó thuộc nhóm nào. Trong bài phân tích sẽ sử dụng phương pháp xoay nhân tố Varimax Procedure. Phương pháp này nhằm tối
thiểu hóa lượng biến có hệ số lớn tại cùng một nhân tố lớn, từ đó có thể tăng khả năng giải thích của các nhân tố lớn với nhau. Tuy vậy, hệ số nhân tố cần phải đảm bảo để có thể phân tích, thông thường trong phân tích, người ta thường chỉ chọn những nhân tố nào có giá trị từ 0,5 trở lên để giữ lại. Đối với những nhân tố còn lại thì loại bỏ ra khỏi mô hình. (nguồn: Phân tích dữ liệu nghiên cứu tác giả Hoàng Trọng, Chu Nguyễn Mộng Ngọc (2008)).
Sau khi đã tiến hành phân nhóm nhân tố, nếu nhà nghiên cứu muốn xác định tập hợp nhân tố ít hơn để sử dụng trong các phương pháp phân tích đa biến tiếp theo (phân tích phương sai, hồi quy...) thì có thể tính toán ra các nhân số (trị số của các biến tổng hợp) cho từng trường hợp quan sát một. Nhân số của nhân tố thứ i : Fi = Wi1X1 + Wi2X2 + Wi3X3+...+WikXk
2.2.2.4 Phương pháp phân tích cụm
Phân tích cụm (còn được biết đến như là phân tích Q, phân tích phân loại, phân loại bằng kỹ thuật định lượng) là tên của một nhóm các kỹ thuật đa biến có mục tiêu chính là phân loại các đơn vị dựa vào một số các đặc tính của chúng.
Các kỹ thuật đa biến nhận diện và phân loại các đối tượng hay các biến sao cho các đối tượng trong cùng một cụm tương tự nhau xét theo các đặc tính được chọn để nghiên cứu. Nội bộ trong các cụm sẽ đồng nhất cao trong khi giữa chúng có sự khác biệt lớn. Vì vậy, nếu phân loại thành công thì các đối tượng trong cùng một cụm sẽ nằm gần với nhau và các đối tượng khác cụm sẽ nằm cách xa nhau khi được diễn giải trên đồ thị. (Giáo trình SPSS của Hoàng Trọng và Chu Nguyễn Mộng Ngọc)
Trong thực tế phân tích cụm được ứng dụng trong rất nhiều lĩnh vực khác nhau như: nghiên cứu hành vi, xã hội, tâm lý, kinh doanh. Trong tiếp thị, phân tích cụm được sử dụng để phân khúc thị trường, tìm hiểu hành vi khác hàng.
Nhìn chung, kỹ thuật phân tích cụm thường được tiến hành theo 6 bước sau:
Bước 1: Xác định vấn đề nghiên cứu : Phần quan trọng nhất khi xác định vấn đề phân cụm là việc chọn lựa các biến để phân cụm. Nếu chỉ dựa vào một hay hai biến không có liên quan hay không thích hợp thì cũng sẽ làm nhiễu hay hỏng cả kết quả phân cụm. Vì thế nên chọn tập hợp biến có khả năng mô tả được sự giống nhau giữa các đối tượng theo mục đích nghiên cứu. Các biến có thể
được chọn trên cơ sở phân tích lý thuyết, kết quả nghiên cứu trong quá khứ, hay xem xét các giả thuyết liên quan đã được kiểm định. Trong nghiên cứu thử nghiệm, người nghiên cứu có thể dùng cả phán đoán và trực giác để xác định các biến này.
Bước 2. Chọn lựa thước đo khoảng cách hay thước đo mức độ giống nhau: Vì mục tiêu của phân tích cụm là nhóm các đối tượng giống nhau lại, cho nên cần phải có một thước đo nào đó để đánh giá mức độ giống nhau hay khác nhau của các đối tượng. Phương pháp thông thường nhất là đo lường mức độ giống nhau bằng khoảng cách giữa hai đối tượng trong một cặp đối tượng. Các đối tượng có khoảng cách giữa chúng nhỏ thì giống nhau hơn là các đối tượng có khoảng cách giữa chúng lớn. Có 3 loại thước đo khoảng cách giữa hai đối tượng nhưng được sử dụng phổ biến nhất là khoảng cách Euclid hay khoảng cách Euclid bình phương. Khoảng cách Euclid là căn bậc 2 của tổng các độ lệch bình phương của các giá trị trên từng biến của hai đối tượng. Nó là chiều dài đường thẳng nối hai đối tượng
Bước 3. Chọn thủ tục phân cụm: Cácthủ tục phân cụm được chia thành hai loại thủ tục: theo thứ bậc và thủ tục không thứ bậc.
Phân cụm thứ bậc: (hierarchical clustering) Trong số các phương pháp phân cụm thứ bậc thì phương pháp khoảng cách trung tâm và thủ tục Ward thường được sử dụng rộng rãi. Thủ tục Ward sẽ tính giá trị trung bình tất cả các biến cho từng cụm một, sau đó tính khoảng cách Euclid bình phương giữa các phần tử trong cụm với trị trung bình của cụm, rồi lấy tổng tất cả các khoảng cách bình phương này.
Phân cụm không thứ bậc: (Non-hierarchical clustering) thường được gọi là phân cụm K -mean gồm có: phương pháp bắt đầu tuần tự (sequential threshold), bắt đầu song song (parallel threshold), phân chia tối ưu (optimizingpartitioning).
Bước 4. Quyết định số cụm: Đây là một vấn đề chính trong phân tích cụm.
Cho tới nay chưa có những quy tắc rõ ràng và chắc chắn về việc xác định số cụm.
Nói một cách khác là số cụm cần thiết hay hợp lý không phải là một vấn đề hoàn toàn về mặt kỹ thuật, mà nó phụ thuộc vào nhiều yếu tố khác như: phân tích lý
thuyết; sử dụng khoảng cách giữa các cụm làm tiêu chuẩn để xác định cụm; dựa vào tỷ số giữa phương sai nội bộ nhóm và phương sai giữa các nhóm; dựa vào quy mô tương đối của các cụm.
Bước 5. Diễn giải và mô tả các cụm : Để diễn giải và mô tả các cụm ta sẽ xem xét các trung bình cụm (centroid), dùng phân tích biệt số hay đơn giản hơn là dùng thủ tục tính trung bình.
Bước 6. Đánh giá: Có nhiều cách thẩm định và đánh giá độ tin cậy và tính hợp lý của kết quả phân tích cụm như: sử dụng nhiều thước đo khoảng cách khác nhau trên cùng tập hợp dữ liệu và so sánh kết quả; sử dụng các phương pháp phân cụm khác nhau; chia dữ liệu làm hai phần rồi thực hiện phân tích từng phần riêng. (nguồn: Phân tích dữ liệu nghiên cứu tác giả Hoàng Trọng, Chu Nguyễn Mộng Ngọc (2008)).