Phƣơng pháp phân tích số liệu

Một phần của tài liệu PHÂN KHÚC THỊ TRƢỜNG CHO QUÁN ĂN GIA ĐÌNH TRÊN ĐỊA BÀN THÀNH PHỐ CẦN THƠ (Trang 27 - 34)

7. Kết luận (Ghi rõ mức độ đồng ý hay không đồng ý nội dung đề tài và các

2.2.2.Phƣơng pháp phân tích số liệu

Mục tiêu 1: Sử dụng phƣơng pháp so sánh số tuyệt đối, số tƣơng đối để

đánh giá kết quả hoạt động kinh doanh ăn uống trên địa bàn thành phố Cần Thơ từ 2009 đến 6 tháng năm 2012.

Mục tiêu 2: Phân tích nhân tố đƣợc sử dụng để xác định các tiêu chí phù

hợp với việc phân khúc thị trƣờng cho quán ăn gia đình ở thành phố Cần Thơ. Sau khi lựa chọn đƣợc các tiêu chí phân khúc phù hợp, tiến hành phân tích cụm với thủ tục Ward và K-mean để phân khúc thị trƣờng, phân tích phân biệt đƣợc sử dụng để đánh giá tính chính xác của việc phân khúc. Tiếp tục tiến hành phân tích Cross-tab để xác định đặc điểm của từng phân khúc.

Mục tiêu 3: Sau khi xác định đƣợc các phân khúc, dựa trên đặc điểm của

từng phân khúc để đề ra giải pháp nhằm thu hút và thỏa mãn hơn nhu cầu của khách hàng trong từng phân khúc.

Phƣơng pháp so sánh số tuyệt đối: là hiệu số của hai chỉ tiêu kỳ phân

tích và kỳ gốc. Số tuyệt đối biểu hiện quy mô, khối lƣợng của một chỉ tiêu kinh tế nào đó. Là cơ sở để tính toán các loại số khác:

∆y = y1-y0

∆y : là phần chênh lệch tăng giảm của các chỉ tiêu kinh tế y1: chỉ tiêu kinh tế kỳ phân tích

Phƣơng pháp này sử dụng để so sánh số liệu năm sau so với năm trƣớc của chỉ tiêu xem có biến động không và tìm ra nguyên nhân biến động của các chỉ tiêu kinh tế. Từ đó có cách đánh giá chính xác các hoạt động phân tích.

Phƣơng pháp so sánh số tƣơng đối: là kết quả phép chia giữa trị số của

kỳ phân tích so với kỳ gốc của các chỉ tiêu kinh tế. Số tƣơng đối cho biết rõ hơn về đặc điểm của hiện tƣợng hay bản chất của hiện tƣợng một cách sâu sắc hơn

∆y = 0 1 y y 100 %

∆y : Biểu hiện tốc độ tăng trƣởng của các chỉ tiêu kinh tế y1: chỉ tiêu kinh tế kỳ phân tích

y0: chỉ tiêu kinh tế kỳ gốc

Phƣơng pháp này dùng để đánh giá sự tăng lên hay giảm xuống của một chỉ tiêu nào đó qua thời gian hoặc đánh giá mức độ hoàn thành kế hoạch của doanh nghiệp. Ngoài ra, số tƣơng đối còn giữa bí mật cho số tuyệt đối. Đồng thời việc so sánh tốc độ tăng trƣởng của chỉ tiêu giữa các năm cho thấy đƣợc sự tác động có liên quan đến các hoạt động trong phân tích. Từ đó có sự nhận diện rõ các hoạt động trong nghiên cứu.

Phân tích nhân tố khám phá EFA (Exploralory Factor Analysis) là một

nhóm các thủ tục đƣợc sử dụng để thu nhỏ và tóm tắt các dữ liệu. Trong phân tích nhân tố EFA, trị số KMO (Kaiser – Meyer – Olkin) là chỉ số bổ sung để xem xét sự thích hợp của phân tích nhân tố. Trị số của KMO lớn (giữa 0,5 và 1) là điều kiện đủ để phân tích nhân tố EFA, còn nếu nhƣ trị số này nhỏ hơn 0,5 thì phân tích nhân tố có khả năng không thích hợp với các dữ liệu (Hoàng Trọng, Chu Nguyễn Mộng Ngọc).

Một phần quan trọng trong bảng kết quả phân tích nhân tố là ma trận nhân tố (component matrix) hay là ma trận nhân tố khi các nhân tố đƣợc xoay (rotated component matrix). Ma trận nhân tố chứa các hệ số biểu diễn các biến chuẩn hóa bằng các nhân tố. Một điều cần lƣu ý khi phân tích đó là hệ số tải nhân tố (Factor Loading), đây là chỉ tiêu đảm bảo mức ý nghĩa thiết thực cho EFA. Hệ số này lớn hơn hoặc bằng 0,3 là đạt mức tối thiểu, lớn hơn hoặc bằng 0,4 là quan trọng, lớn hơn hoặc bằng 0,5 là có ý nghĩa thực tiễn. Ngoài ra, tùy cỡ mẫu nghiên cứu mà quyết định giới hạn dƣới cho Factor Loading. Theo Nguyễn Khánh Duy, nếu cỡ

mẫu vào khoảng 100 thì Factor Loading lớn hơn hoặc bằng 0,55 thì mới đạt yêu cầu.

Mô hình phân tích nhân tố X= Ai1F1 + Ai2F2+ … +AimFm + ViUi Trong đó:

X: biến đƣợc chuẩn hóa

Aij: Hệ số hồi qui bội của biến đƣợc chuẩn hóa I trên nhân tố cung j F: Nhân tố chung

Vi : Hệ số hồi qui của biến chuẩn hóa I trên nhân tố duy nhất i Ui : Nhân tố duy nhất của biến i

m: Số nhân tố chung

Mỗi nhân tố duy nhất thì tƣơng quan với mỗi nhân tố khác và với các nhân tố chung. Các nhân tố chung có sự kết hợp tuyến tính của các biến đƣợc quan sát Fi= Wi1X1 + Wi2X2 + … + WikXk

Trong đó

Fi : Ƣớc lƣợng nhân tố thứ i

Wij: Trong số hay hệ số điểm nhân tố k: Số biến

Phân tích cụm (adsbygoogle = window.adsbygoogle || []).push({});

Phân tích cụm đƣợc dùng để phân nhóm các đối tƣợng nghiên cứu thành các nhóm khác nhau sao cho các đối tƣợng trong cùng một nhóm thì có các đặc tính tƣơng tự nhau. Việc phân nhóm này dựa trên mối quan hệ tự nhiên và hoàn toàn độc lập với ý chí chủ quan. Khi đƣợc biểu diễn trên biều đồ thì các đối tƣợng trong cùng một nhóm sẽ nằm gần với nhau và các đối tƣợng khác nhóm sẽ nằm cách xa nhau.

Các bước tiến hành phân tích cụm

Bƣớc 1: Xác định vấn đề.

Là việc chọn lựa các biến để phân cụm. Các biến có thể đƣợc chọn trên cơ sở phân tích lý thuyết, kết quả nghiên cứu trong quá khứ, hay xem xét các giả thuyết liên quan đã đƣợc kiểm định hoặc ngƣời nghiên cứu có thể dùng cả phán đoán và trực giác để xác định các biến này.

Phƣơng pháp thông thƣờng nhất là đo lƣờng mức độ giống nhau bằng khoảng cách giữa hai đối tƣợng trong một cặp đối tƣợng. Các đối tƣợng có khoảng cách giữa chúng nhỏ thì giống nhau hơn là các đối tƣợng có khoảng cách giữa chúng lớn. Có 3 loại thƣớc đo khoảng cách giữa hai đối tƣợng:

- Khoảng cách Euclid hay khoảng cách Euclid bình phƣơng là căn bậc hai của tổng các độ lệch bình phƣơng của các giá trị trên từng biến của hai đối tƣợng

- Khoảng cách Manhattan là tổng các độ lệch tuyệt đối của các giá trị trên từng biến.

- Khoảng cách Chebychev là chênh lệch tuyệt đối lớn nhất của giá trị trên từng biến

Bƣớc 3: Chọn thủ tục phân cụm.

Các thủ tục phân cụm đƣợc chia thành hai loại thủ tục theo thứ bậc và thủ tục không thứ bậc.

Phân cụm thứ bậc (hierarchical clustering)

Trong số các phƣơng pháp phân cụm tích tụ thì phƣơng pháp khoảng cách trung tâm và thủ tục Ward đã đƣợc chứng minh là có kết quả tốt hơn các phƣơng pháp kia [1, tr.84].

Thủ tục Ward: Tính giá trị trung bình tất cả các biến cho từng cụm một. Sau đó tính khoảng cách Euclid bình phƣơng giữa cá phần tử trong cụm với trị trung bình của cụm rồi lấy tất cả các khoảng bình phƣơng này

Phân cụm không thứ bậc (Non-hierarchical clustering)

Thƣờng đƣợc gọi là phân cụm K-means, gồm có: Phƣơng pháp bắt đầu tuần tự (sequential threshold), bắt đầu song song (parallel threshold), phân chia tối ƣu (optimizing partitioning).

Bƣớc 4: Quyết định số cụm

Việc quyết định số cụm thì không theo quy tắc nhất định nào cả mà nó phụ thuộc vào nhiều yếu tố khác: phân tích lý thuyết; sử dụng khoảng cách giữa các cụm làm tiêu chuẩn để xác định cụm; dựa vào tỷ số giữa phƣơng sai nội bộ nhóm và phƣơng sai giữa các nhóm; dựa vào quy mô tƣơng đối của các cụm.

Để diễn giải và mô tả các cụm ta sẽ xem xét các trung bình cụm (centroid), các trung bình cụm đƣợc tính bình quân từ các giá trị của các đối tƣợng theo từng biến một.

Bƣớc 6: Đánh giá.

Có nhiều cách thẩm định và đánh giá độ tin cậy và tính hợp lý của kết quả phân tích cụm: sử dụng nhiều thƣớc đo khoảng cách khác nhau trên cùng tập hợp dữ liệu và so sánh kết quả; sử dụng các phƣơng pháp phân cụm khác nhau; chia dữ liệu làm hai phần rồi thực hiện phân tích từng phần riêng.

Lựa chọn phương pháp phân tích cụm

Theo Sara Dolnica (2002) về việc chọn lựa phƣơng pháp phân tích cụm của các nhà nghiên cứu. Phƣơng pháp đƣợc sử dụng nhiều nhất là thủ tục Ward và K-means.

Dựa vào ƣu nhƣợc điểm của từng phƣơng pháp: Phƣơng pháp K-mean có 2 nhƣợc điểm là: phải thử xác định số cụm trƣớc và việc lựa chọn trung tâm cụm là tùy ý nên kết quả phân cụm có thể không chính xác. Nhƣng bên cạnh đó, phƣơng pháp K-means cũng có một số ƣu điểm: khối lƣợng tính toán ít hơn, thời gian thực hiện nhanh hơn phƣơng pháp phân cụm thứ bậc.

Vì vậy, phƣơng pháp cần chọn là sử dụng cả 2 phƣơng pháp Ward và K- means. Đầu tiên sử dụng phân cụm thứ bậc (thủ tục Ward) để tìm ra kết quả ban đầu, sau đó số cụm và các trung tâm cụm của kết quả này đƣợc sử dụng làm thông tin ban đầu để áp dụng phƣơng pháp phân chia tối ƣu (một phƣơng pháp của K-means).

Phân tích phân biệt

Phân tích phân biệt là một kỹ thuật phân tích sử dụng cho việc phân biệt giữa các nhóm bằng cách phân tích dữ liệu với một biến phụ thuộc đƣợc phân cấp và các biến độc lập đƣợc đo bằng thang đo khoảng. Phân tích phân biệt nhằm mục đích phân biệt rõ các biểu hiện của biến phụ thuộc; xem coi có sự khác biệt có ý nghĩa giữa các nhóm xét theo biến độc lập; biến độc lập nào là nguyên nhân lớn nhất gây ra sự khác biệt giữa các nhóm; phân loại các quan sát vào trong một nhóm; đánh giá tính chính xác của việc phân loại.

Có hai loại phân tích phân biệt đó là phân tích phân biệt hai nhóm và phân tích phân biệt đa bội.

Tiến trình phân tích phân biệt

Bƣớc 1: Xác định vấn đề nghiên cứu

Xác định biến độc lập và biến phụ thuộc. Sau đó chia mẫu quan sát thành hai bộ phận: (1) Mẫu phân tích đƣợc sử dụng để ƣớc lƣợng hàm phân biệt, và (2) Mẫu kiểm tra dùng để kiểm tra tính đúng đắn của hàm phân biệt. (adsbygoogle = window.adsbygoogle || []).push({});

Bƣớc 2: Ước lượng các hệ số của hàm phân biệt

Có hai phƣơng pháp ƣớc lƣợng hàm phân biệt:

- Phƣơng pháp trực tiếp: Đƣa tất cả các biến vào cùng lúc để ƣớc lƣợng. - Phân tích phân biệt từng biến: Các biến độc lập lần lƣợt đƣợc đƣa vào mô hình, phƣơng pháp này đƣợc sử dụng khi nhà nghiên cứu muốn chọn một số nhân tố vào hàm phân biệt.

Bƣớc 3: Xác định ý nghĩa của hàm phân biệt

Trong SPSS để xác định ý nghĩa của hàm phân biệt ta dựa vào kiểm định Wilks’ Lambda, nếu giá trị sig. của kiểm định Wilks’ Lambda nhỏ hơn mức ý nghĩa thì hàm phân biệt có ý nghĩa về mặt thống kê.

Bƣớc 4: Giải thích kết quả

Biến độc lập nào có hệ số phân biệt chuẩn cao thì ảnh hƣởng càng lớn đến hàm phân biệt.

Bƣớc 5: Đánh giá hiệu quả của phân tích phân biệt

Ta tính các chỉ tiêu có liên quan đến hai loại mẫu này nhƣ sau: - Tính điểm phân biệt (Discriminant scores):

Chỉ tiêu điểm phân biệt còn có thể thay thế bằng các tỷ số tiếp cận.

- Tỷ số tiếp cận (hit ratio): Là phần trăm các trƣờng hợp đƣợc phân loại đúng bởi phân tích phân biệt. Tỷ số này đƣợc tính bằng cách lấy tổng số trƣờng hợp đƣợc phân loại đúng theo đƣờng chéo dấu huyền chia cho tổng số trƣờng hợp xử lý.

- Tỷ số tiếp cận tối thiểu: Là tỷ số đƣợc tính từ tổng xác suất của các nhóm (nếu cỡ mẫu của các nhóm bằng nhau thì chỉ tiêu này bằng 1 chia cho số nhóm). Điểm phân biệt của từng

biến trong mẫu chuẩn hóa = Hệ số phân biệt từng biến trong mẫu phân tích

Giá trị của các biến độc lập trong mẫu chuẩn hóa x

Kết luận: Nếu các tỷ số tiếp cận trong phân tích và tỷ số tiếp cận tối thiểu lớn hơn 25% thì tính hiệu quả của phân tích phân biệt đƣợc chấp nhận.

Phân tích bảng chéo (Cross – tabulation)

Cross-Tabulation là một kỹ thuật thống kê mô tả hai hay ba biến cùng lúc và bảng phản ánh sự kết hợp hai hay nhiều biến có số lƣợng hạn chế trong phân loại hoặc trong giá trị phân biệt.

Mô tả cross-tabulation đƣợc sử dụng rộng rãi trong nghiên cứu marketing thƣơng mại bởi vì:

(1) Phân tích cross-tabulation và kết quả của nó có thể giải thích và hiểu một cách dễ dàng.

(2) Sự rõ ràng trong việc giải thích cung cấp một sự kết hợp chặc chẽ giữa kết quả nghiên cứu và quyết định trong quản lý.

(3) Chuỗi phân tích cross-tabulation cung cấp những kết luận sâu hơn trong các trƣờng hợp phức tạp.

(4) Cross-tabulation có thể làm giảm bớt các vấn đề của các ô (cell). (5) Phân tích cross-tabulation tiến hành đơn giản

Một phần của tài liệu PHÂN KHÚC THỊ TRƢỜNG CHO QUÁN ĂN GIA ĐÌNH TRÊN ĐỊA BÀN THÀNH PHỐ CẦN THƠ (Trang 27 - 34)