Phương pháp nghiên cứu

Một phần của tài liệu phân khúc thị trường sử dụng dịch vụ internet tại quận ninh kiều thành phố cần thơ (Trang 26 - 34)

5. Nội dung và các kết quả đạt được:

2.2.2. Phương pháp nghiên cứu

Mục tiêu 1: Phân tích thực trạng sử dụng dịch vụ Internet của người dân Quận Ninh Kiều. Sử dụng phương pháp so sánh tuyệt đối và so sánh tương đối để phân tích các dữ liệu thứ cấp qua các năm để phân tích thực trạng sử dụng dịch vụ Internet tại thành phố Cần Thơ

 Phương pháp so sánh tuyệt đối: là hiệu số của hai chỉ tiêu kỳ phân tích và kỳ gốc. Số tuyệt đối biểu hiện quy mô, khối lượng của một chỉ tiêu kinh tế nào đó: 0 1 y y y    (2.1) Trong đó: y: là phần chệnh lệch

y1: chỉ tiêu kinh tế kỳ phân tích y0: chỉ tiêu kinh tế kỳ gốc

Phương pháp này sử dụng để so sánh số liệu năm sau so với năm trước của chỉ tiêu xem có biến động không và tìm ra nguyên nhân biến động của các chỉ tiêu kinh tế. Từ đó có cách đánh giá chính xác các hoạt động phân tích.

Phương pháp so sánh tương đối: Là tỉ lệ % của chỉ tiêu kỳ phân tích so với kỳ gốc để thể hiện mức độ hoàn thành hoặc tỷ lệ của số chênh lệch tuyệt đối so với chỉ tiêu gốc để nói lên tốc độ tăng trưởng

% 100 0 1 x y y y   (2.2) Trong đó: y : tốc độ tăng trưởng y1: chỉ tiêu năm trước y0: chỉ tiêu năm sau

Phương pháp này nhằm làm rõ tình hình biến động của các chỉ tiêu trong thời gian nghiên cứu. Việc so sánh tốc độ tăng trưởng của chỉ tiêu giữa các năm cho thấy được sự tác động có liên quan đến các hoạt động trong phân tích. Từ đó có sự nhận diện rõ các hoạt động trong nghiên cứu.

Mục tiêu 2: Xử lý số liệu sơ cấp và phân tích để làm cơ sở phân khúc thị trường dựa trên các phương pháp: Thống kê mô tả, Phân tích nhân tố, Phân tích cụm (thủ tục Ward và phân tích K-mean), phân tích phân biệt.

Thống kê là tổng hợp các phương pháp lý thuyết và ứng dụng vào lĩnh vực kinh tế bằng cách rút ra những kế luận dựa trên những số liệu và thông tin thu thập được .

Thống kê mô tả là một trong hai chức năng chính của thống kê ( thống kê mô tả và thống kê ứng dụng). Thống kê mô tả là tập hợp tất cả phương pháp đo lường, mô tả và trình bày số liệu

Một số khái niệm:

- Giá trị trung bình: Mean, Average: bằng tổng tất cả giá trị biến quan sát chia cho số quan sát .

- Số trung vị (Median, kí hiệu: Me) là giá trị của biến đứng ở giữa của một dãy số được sắp xếp theo thứ tự tăng hoặc giảm dần. Số trung vị chia dãy số làm 2 phần, mỗi phần có số quan sát bằng nhau.

- Mode (kí hiệu: Mo): là giá trị có tần số xuất hiện cao nhất trong tổng số hay trong một dãy số phân phối.

- Phương sai: là trung bình giữa bình phương các độ lệch giữa các biến và trung bình của biến đó.

- Độ lệch chuẩn là căn bậc hai của phương sai

Đề tài này khoảng cách được chọn để phân tích là Likert 5 mức độ [1], và ý nghĩa của từng giá trị trung bình (TB) đối với thang đo khoảng trong phân tích thống kê mô tả được tính như sau:

Giá trị khoảng cách = (giá trị lớn nhất – giá trị nhỏ nhất)/n = (5-1)/5

Bảng 2.2: Ý nghĩa trung bình của các thang đo

Giá trị trung bình Ý nghĩa

1,00 – 1,08 Rất không đồng ý/ rất không hài lòng/ rất không quan trọng/ rất không ảnh hưởng

1,81 – 2,60 Không đồng ý/ không hài lòng/ không quan trọng/ không ảnh hưởng

2,61 – 3,40 Không ý kiến/ trung bình 3,41 – 4,20

Đồng ý/ hài lòng/ quan trọng/ ảnh hưởnh

4,21 – 5,00 Rất đồng ý/ rất hài lòng/ rất quan trọng/ rất ảnh hưởng

Nguồn: TS. Lưu Thanh Đức Hải, bai giảng Nghien cứu Marketing

Phân tích hệ số Cronbach’s Alpha

Hệ số Cronbach’s alpha là một phép kiểm định thống kê dùng để kiểm tra sự chặt chẽ và tương quan giữa các biến quan sát. Điều này liên quan đến hai khía cạnh là tương quan giữa bản thân các biến và tương quan của các điểm số của từng biến với điểm số toàn bộ các biến của mỗi người trả lời. Phương pháp này cho phép người phân tích loại bỏ những biến không phù hợp và hạn chế biến rác trong mô hình nghiên cứu vì nếu không chúng ta không thể biết được chính xác độ biến thiên cũng như độ lỗi của các biến. Theo đó, chỉ những biến có Hệ số tương quan tổng biến phù hợp (Corrected Item – Total Correlation) lớn hơn 0,3 và có Hệ số Cronbach’s alpha lớn hơn 0,6 mới được xem là chấp nhận được và thích hợp đưa vào phân tích những biến tiếp theo (Nunnally và BernStein, 1994). Cũng theo nhiều nhà nghiên cứu, nếu Cronbach’s alpha đạt từ 0,8 trở lên thì thang đo lường là tốt và mức độ tương quan sẽ càng cao hơn.[2]

Phân tích nhân t

a/ Khái niệm:

Phân tích nhân tố là tên chung của một nhóm các thủ tục được sử dụng chủ yếu để thu nhỏ và tóm tắt dữ liệu. Phân tích nhân tố là một phương pháp phân tích thống kê dùng để rút gọn một tập hợp gồm nhiều biến quan sát phụ thuộc lẫn nhau thành một tập biến (gọi là nhân tố) ít hơn để chúng có ý nghĩa hơn nhưng vẫn chứa đựng hầu hết nội dung thông tin của tập biến ban đầu. (Hair & ctg, 1998) [2]

b/ Các bước tiến hành phân tích nhân tố

- Xác định vấn đề: Các biến tham gia phân tích nhân tố phải được xác định

dựa vào các nghiên cứu đã có của các chuyên gia, các biến phải đo lường được bằng thang đo định lượng (khoảng cách hay tỷ lệ) và cỡ mẫu đủ lớn (thường là phải gấp 4 hay 5 lần tổng số biến).

- Xây dựng ma trận tương quan: Quá trình phân tích được dựa trên ma trận

tương quan của các biến này. Để có thể áp dụng được phân tích nhân tố thì các biến phải có liên hệ với nhau.

- Số lượng nhân tố: có 2 phương pháp cụ thể xác định số lượng nhân tố:

 Phương pháp xác định từ trước (Priori determination): dựa vào kinh nghiệm, từ phân tích lý thuyết hay từ kết quả của các nghiên cứu trước mà xác định số lượng nhân tố.

 Phương pháp dựa vào eigenvalue (determination based on eigen value): chỉ có những nhân tố nào có eigenvalue lớn hơn 1 mới được giữ lại trong mô hình phân tích. Nhược điểm của phương pháp này là khi qui mô mẫu lớn (trên 200), có nhiều khả năng sẽ có nhiều nhân tố thỏa mãn mức ý nghĩa thống kê mặc dù trong thực tế có nhiều nhân tố chỉ giải thích được chỉ một phần nhỏ toàn bộ biến thiên. Đề tài này sử dụng xác định số lượng nhân tố dựa vào các nghiên cứu trước nên không đi sâu vào phương pháp eigenvalue.

- Xoay các nhân tố : Một phần quan trọng trong bảng kết quả phân tích

nhân tố là ma trận nhân tố (component matrix) hay ma trận nhân tố khi các nhân tố được xoay (rotated component matrix). Ma trận nhân tố chứa các hệ số biểu diễn các biến chuẩn hóa bằng các nhân tố (mỗi biến là một đa thức của các nhân tố ).

- Đặt tên và giải thích các nhân tố: Việc giải thích các nhân tố được thể

hiện trên cơ sở nhận ra các biến có hệ số Loading Factor lớn ở cùng một nhân tố.

- Nhân số: Sau khi giải thích các nhân tố, nếu cần ta có thể tính toán ra các

nhân số. [2]

*Căn cứ chọn Loading factor:

Từ tài liệu chương trình kinh tế Fullbright, factor loading có ý nghĩa thực tiễn khi >= 50%. Tuy nhiên để nó bắt đầu tạm chấp nhận là 0,3 và có ý nghĩa tốt hơn là 0,4. Theo Hair & ctg (1998) cũng khuyên bạn đọc như sau:

 Nếu chọn tiêu chuẩn factor loading > 0.3 thì cỡ mẫu ít nhất phải là 350

 Nếu cỡ mẫu khoảng 100 thì nên chọn tiêu chuẩn factor loading > 0.5

 Nếu cỡ mẫu khoảng 50 thì Factor loading phải > 0.75 [2]

Phân tích cm

a/ Khái niệm: Là phương pháp gom các đối tượng tương tự nhau thành 1 nhóm và có sự khác biệt rõ ràng với các nhóm còn lại.[2]

b) Các bước tiến hành phân tích cụm: Có 6 bước phân tích cụm tất cả. Đó là: Xác định vấn đề nghiên cứu, chọn thước đo khoản, chọn thủ tục phân cụm, quyết định số cụm, diễn giải và mô tả cụm, đánh giá

- Xác định vấn đề: Phần quan trọng nhất khi xác định vấn đề phân cụm là việc chọn lựa các biến để phân cụm. Nếu chỉ dựa vào một hay hai biến không có liên quan hay không thích hợp thì cũng sẽ làm nhiễu hay hỏng cả kết quả phân cụm. Vì thế nên chọn tập hợp biến có khả năng mô tả được sự giống nhau giữa các đối tượng theo mục đích nghiên cứu. Các biến có thể được chọn trên cơ sở phân tích lý thuyết, kết quả nghiên cứu trong quá khứ, hay xem xét các giả

thuyết liên quan đã được kiểm định hoặc người nghiên cứu có thể dùng cả phân đoạn và trực giác để xác định các biến này

- Chọn lựa thước đo khoảng cách hay thước đo mức độ giống nhau: Chọn lựa thước đo khoảng cách hay thước đo mức độ giống nhau Phương pháp thông thường nhất là đo lường mức độ giống nhau bằng khoảng cách giữa hai đối tượng trong một cặp đối tượng. Các đối tượng có khoảng cach giữa chúng nhỏ thì giống nhau hơn là các đối tượng có khoảng cách giữa chúng lớn. Có 3 loại thước đo khoảng cách giữa hai đối tượng: khoảng cách Euclid hay khoảng cách Euclid bình phương; khoảng cách Manhattan (là tổng các độ lệch tuyệt đối của các giá trị trên từng biến); khoảng cách Chebychev (là chênh lệch tuyệt đối lớn nhất của giá trị trên từng biến).

Hình 2.1: Khoảng cách Euclid

- Chọn thủ tục phân cụm: Các thủ tục phân cụm được chia thành hai loại

thủ tục theo thứ bậc và thủ tục không thứ bậc

 Phân cụm thứ bậc: là thủ tục được xây dựng theo một cấu trúc thứ bậc hay dạng hình cây. Phương pháp này có thể tiến hành theo cách tích tụ lại (agglomerative) hay phân chia ra (divisive). Trong số các phương pháp phân cụm tích thụ thì phương pháp khoảng cách trung tâm và thủ tục Ward đã được chứng minh là có kết quả tốt hơn các phương pháp kia

Thủ thuật Ward: ta sẽ tính giá trị trung bình tất cả các biến cho từng cụm một. Sau đó tính khoảng cách Euclid bình phương giữa các phần tử trong cụm với trị trung bình của cụm, rồi lấy tổng tất cả các khoảng cách bình phương này.[2]

 Phân cụm không thứ bậc: thường được gọi là phân cụm k-means, gồm có: phương pháp bắt đầu tuần tự (sequential threshold), bắt đầu song song (parallel), phân chia tối ưu (optimizing partitioning).

- Quyết định số cụm: Đây là một vấn đề chính trong phân tích cụm. Cho tới

nay chưa có những quy tắc rõ ràng và chắc chắn về việc xác định số cụm. Nói một cách khác là số cụm cần thiết hay hợp lý không phải là một vấn đề hoàn toàn

về mặt kỹ thuật, mà nó phụ thuộc vào nhiều yếu tố khác. Ta có một số căn cứ như: phân tích lý thuyết có thể giúp ta xác định được số cụm hợp lý, sử dụng khoảng cách giữa các cụm làm tiêu chuẩn để xác định số cụm (trong phân cụm thứ bậc), dựa vào tỉ số giữa phương sai nội bộ nhóm và phương sai giữa các nhóm để xác định số cụm hợp lý (trong phân cụm không thứ bậc), dựa vào quy mô tương đối của các cụm để định số cụm.

- Diễn giải và mô tả các cụm: Để diễn giải và mô tả các cụm ta sẽ xem xét

các trung bình cụm (centroid). Các trung bình cụm được tính bình quân từ các giá trị của các đối tượng theo từng biến một. Các trung bình cụm gợi ý cho ta một cái tên cho mỗi cụm.

- Đánh giá: Có nhiều cách thẩm định và đánh giá độ tin cậy và tính hợp lý của kết quả phân tích cụm.

 Thực hiện phân tích cụm trên cùng một tập hợp dữ liệu nhưng sử dụng các thước đo khoảng cách khác nhau. So sánh kết quả để xem tính ổn định của các giải pháp.

 Sử dụng các phương pháp phân cụm khác nhau và so sánh kết quả.

 Chia dữ liệu làm hai phần, rồi thực hiện phân tích cụm riêng cho mỗi tập dữ liệu con, sau đó so sánh các trung bình cụm giữa hai tập dữ liệu con này.

 Bỏ bớt một vài biến rồi thực hiện phân tích cụm trên tập hợp các biến còn lại, sau đó so sánh kết quả này với kết quả khi sử dụng hết các biến cần thiết.

 Trong phân tích cụm không thứ bậc nên thực hiện phân tích cụm nhiều lần với nhiều thứ tự khác nhau của các quan sát cho đến khi kết quả ổn định

Phân tíchphân bit:

Phân tích phân biệt giữa hai nhóm: là phân tích được dử dụng trong trường hợp biến phụ thuộc được chia làm hai loại, trường hợp phân tích này gần giống như phân tích hồi quy nhiều chiều, biến phụ thuộc được mã hóa theo hai số 0 hoặc số 1 (dummy variables). Kết quả phân tích thể hiện các hệ số hồi quy thì tỉ lệ với các hệ số hàm phân biệt.[2]

Phân tích phân biệt đa nhóm: là kỹ thuật phân tích được sử dụng trong trường hợp biến phụ thuộc được phân loại thành ba hay nhiều nhóm.

Tiến trình phân tích phân biệt:

- Xác định vấn đề nghiên cứu: Vấn đề được hình thành bằng cách nhận dạng mục tiêu phân tích, biến độc lập và biến phụ thuộc. Biến phụ thuộc phải bao gồm hai hay nhiều nhóm được chọn. Nếu biến phụ thuộc sử dụng thang đo khoảng hay thang đo tỷ lệ, trước tiên phải phân loại chúng về tính chất thay vì dùng hệ thống thang đo. Sau khi nhận dạng các biến độc lập và phụ thuộc, mẫu sẽ được chia thành hai bộ phận khác nhau: (1) Mẫu phân tích được sử dụng để ước lượng hàm phân biệt, và (2) Mẫu tiêu chuẩn dùng để chuẩn hóa hàm phân biệt.

- Ước lượng các hệ số hàm phân biệt: Ước lượng hệ số của hàm phân biệt

thường dựa vào mẫu phân tích (analysis sample). Có hai cách tiếp cận cho ước lượng này:

 Phương pháp trực tiếp: Theo phương pháp này mô hình ban đầu bao gồm tất cả các biến độc lập. Cách tiếp cận này phù hợp khi vấn đề đã có nghiên cứu trước đây hoặc khi mô hình lý thuyết có sẵn.

 Phân tích phân biệt từng biến: Trong trường hợp này, các biến độc lập lần lượt được đưa vào mô hình, phương pháp này được sử dụng khi nhà nghiên cứu muốn chọn một số nhân tố vào hàm phân biệt.

- Xác định ý nghĩa của hàm phân biệt: Để hiểu rõ hàm phân biệt có ý nghĩa

hay không, kiểm định giả thuyết H0 là cần thiết:

H0 : Trung bình của tất cả các hàm phân biệt trong tất cả các nhóm thì bằng nhau (không có sự phân biệt).

H1 : Trung bình của tất cả các hàm phân biệt trong tất cả các nhóm thì khác nhau (sự phân biệt có ý nghĩa).

Giả thuyết H0 bị bác bỏ khi significance trong bảng kết quả phân tích Canonical discriminant functions (các hàm phân biệt chuẩn tắc) nhỏ hơn mức ý nghĩa trong xử lý, trong trường hợp này mô hình có độ phân biệt có ý nghĩa.

- Giải thích kết quả: Biến độc lập nào có hệ số phân biệt chuẩn cao thì ảnh hưởng càng lớn đến hàm phân biệt.

- Đánh giá hiệu quả của phân tích phân biệt: Để đánh giá hiệu quả phân

tích ta tính các chỉ tiêu có liên quan đến hai loại mẫu (mẫu phân tích dùng để ước lượng hàm phân biệt và mẫu chuẩn hóa sử dụng để phát triển ma trận phân loại).

 Tính điểm phân biệt (discriminant scores):

Điểm phân biệt của từng biến trong hệ số chuẩn hóa = Hệ số phân biệt từng biến trong mẫu phân tích lập x Giá trị của các biến độc trong mẫu chuẩn hóa

Chỉ tiêu điểm phân biệt này còn có thể thay thế bằng các tỷ số tiếp cận: • Tỷ số tiếp cận (hit ratio): Là phần trăm các trường hợp được phân loại

Một phần của tài liệu phân khúc thị trường sử dụng dịch vụ internet tại quận ninh kiều thành phố cần thơ (Trang 26 - 34)

Tải bản đầy đủ (PDF)

(84 trang)