Ứng dụng pca trong đánh giá tổng hợp trình độ phát triển của 63 tỉnh thành ứng dụng phương pháp phân tích thành phần chính cho bài toán dự báo phụ tải điện ngắn hạn
Tài liệu hạn chế xem trước, để xem đầy đủ mời bạn chọn Tải xuống
1
/ 24 trang
THÔNG TIN TÀI LIỆU
Thông tin cơ bản
Định dạng
Số trang
24
Dung lượng
1,22 MB
Nội dung
TRƯỜNG ĐẠI HỌC KINH TẾ QUỐC DÂN KHOA THỐNG KÊ BÀI TẬP NHÓM NHÓM Giảng viên : PGS.TS Trần Thị Bích Nhóm :5 Lớp : Phân tích liệu 01 Hà Nội, 2023 Tieu luan THÀNH VIÊN NHÓM Nguyễn Thị Kim Anh 11200267 Vũ Thị Lan Anh 11200443 Lê Thị Hương Dung 11204862 Trần Thị Thúy Quỳnh 11203419 Nguyễn Linh Trang 11208074 Tieu luan MỤC LỤC PHẦN 1: GIỚI THIỆU TÀI LIỆU 1 Bài nghiên cứu 1.1 Tóm tắt nội dung 1.2 Giới thiệu 1.3 Ứng dụng PCA đánh giá tổng hợp trình độ phát triển 63 tỉnh thành 2 Bài nghiên cứu phụ 2.1 Ứng dụng phương pháp phân tích thành phần cho toán dự báo phụ tải điện ngắn hạn 2.2 Ứng dụng phương pháp phân tích thành phần để đánh giá đặc tính hóa học kháng khuẩn nọc ong mật Apis Mellifera PHẦN 2: ỨNG DỤNG VỚI BỘ DỮ LIỆU THỰC TẾ Giới thiệu liệu 3.1 Mô tả liệu 3.2 Phạm vi nghiên cứu 3.3 Mục đích nghiên cứu 3.4 Thời kỳ nghiên cứu 3.5 Phương pháp thu thập thông tin Cơ sở lý thuyết phương pháp 4.1 Mục đích PCA 4.2 Phạm vi áp dụng 4.3 Nội dung 4.4 Các bước tiến hành PCA 10 Xử lý liệu phân tích thành phần 10 5.1 Tiền xử lý liệu 10 5.2 Phân tích thành phần 11 5.3 Lựa chọn biến thành phần 14 5.4 Giải thích thành phần tính giá trị quan sát theo thành phần 18 Kết luận 20 TÀI LIỆU THAM KHẢO 21 Tieu luan PHẦN 1: GIỚI THIỆU TÀI LIỆU Bài nghiên cứu Ứng dụng phương pháp phân tích thành phần đánh giá tổng hợp trình độ phát triển kinh tế tỉnh thành Việt Nam 1.1 Tóm tắt nội dung Tác giả lên ý tưởng ứng dụng phương pháp phân tích thành phần (PCA) vào toán đánh giá lực tổng hợp nhận thấy trình độ phát triển kinh tế địa phương theo tiêu đơn có hạn chế định Vì nghiên cứu sử dụng phương pháp PCA dựa liệu gồm 11 tiêu kinh tế 63 tỉnh, thành phố Việt Nam tiến hành đánh giá, xếp hạng so sánh trình độ phát triển kinh tế tổng hợp địa phương Kết cho thấy có khác biệt rõ ràng trình độ phát triển kinh tế tỉnh, thành, cụ thể: đa phần tỉnh thuộc vùng Đồng sơng Hồng Đơng Nam Bộ có xếp hạng cao tỉnh lạc hậu chủ yếu thuộc khu vực Trung du miền núi phía Bắc 1.2 Giới thiệu Nền kinh tế sau cải cách Việt Nam đạt thành tựu đáng ghi nhận Tuy nhiên, có khác biệt lớn trình độ phát triển vùng, tỉnh Do đó, việc nhận thức phân tích chênh lệch có ý nghĩa quan trọng việc thực sách phát triển vùng, liên kết vùng sách phát triển bền vững đất nước.Theo Nghị định 92/2006/NĐ – CP Chính phủ lập, phê duyệt quản lý quy hoạch tổng thể phát triển kinh tế - xã hội, nước ta phân làm vùng kinh tế - xã hội: - Vùng trung du miền núi Bắc Bộ - Vùng đồng sông Hồng - Vùng Bắc Trung Bộ duyên hải miền Trung - Tây Nguyên - Đông Nam Bộ - Đồng sông Cửu Long Trong việc đánh giá trình độ phát triển kinh tế khu vực hay địa phương thường nhắc tới tiêu đơn tổng lượng số bình quân như: tổng sản phẩm quốc nội (GDP), tổng sản lượng quốc gia (GNP), GDP bình quân đầu người, chi tiêu bình quân… Tuy nhiên việc sử dụng tiêu có hạn chế định phản ánh phương diện định kinh tế Mặt khác, lựa chọn tiêu bình quân nhiều dẫn đến kết luận không Tieu luan sát với thực tế khu vực có dân cư diện tích lớn (Theo Tong Huili, 2019) Do cần có phương pháp để đánh giá tổng hợp nhiều tiêu lúc kinh tế địa phương khu vực Trong viết tác giả tiến hành thiết lập hệ thống gồm 11 tiêu kinh tế 63 tỉnh thành phố Thơng qua phân tích PCA cho tiêu tổng hợp đại diện cho hệ thống nhiều tiêu đơn liệu gốc, để đánh giá xếp hạng phân loại trình độ phát triển kinh tế tỉnh thành Việt Nam 1.3 Ứng dụng PCA đánh giá tổng hợp trình độ phát triển 63 tỉnh thành 1.3.1 Thiết lập hệ thống tiêu trình độ phát triển kinh tế địa phương Việc lựa chọn tiêu dựa nguyên tắc sau: Thứ nhất, phải phản ánh khía cạnh kinh tế cách tổng hợp tồn diện, vừa có tính đại diện vừa so sánh với địa phương khác Thứ hai, đảm bảo tính khả thi, nghĩa số liệu thu thập được, tính tốn rõ ràng Thứ ba, đảm bảo tính khoa học, xem xét tình hình thực tế quy luật khách quan kết hợp với sở lý luận, kết phân tích tiêu cần phù hợp với tình hình thực tế Dựa nguyên tắc lựa chọn số liệu kết hợp với tham khảo kết nghiên cứu trước, tác giả lựa chọn tiêu sau: Tổng sản phẩm địa bàn hay GRDP địa phương (X1) Tổng thu ngân sách địa phương (X2) Tổng đầu tư toàn xã hội địa phương (X3) Tổng doanh thu bán lẻ hàng hóa (X4) Đầu tư trực tiếp nước (X5) Tổng kim ngạch xuất nhập (X6) GRDP bình quân đầu người (X7) Cơ cấu công nghiệp GRDP địa phương (X8) Tỷ lệ dân thành thị (X9) 10 Thu nhập bình qn đầu người nhóm địa phương (X10) 11 Thu nhập bình quân đầu người nhóm địa phương (X11) Trong nhóm tương ứng với nhóm nghèo nhóm tương ứng với nhóm giàu Các tiêu lựa chọn nhằm phản ánh phương diện quy mô kinh tế, mức độ giàu có địa phương, độ mở thương mại, cấu kinh tế, trình độ thị hóa mức sống dân cư Số liệu xuất nhập lấy từ báo cáo xuất nhập 2018 thức Tổng cục hải quan, số liệu thu nhập bình qn nhóm lấy từ trang web Tổng cục thống kê Tieu luan địa https://www.gso.gov.vn/ Các số liệu khác lấy từ Tư liệu kinh tế – xã hội 63 tỉnh, thành phố trực thuộc trung ương Tổng cục Thống Kê Việt Nam (2020), riêng số liệu GRDP bình quân đầu người tác giả tính tốn cách chia GRDP cho tổng dân số 1.3.2 Phân tích mức độ phù hợp liệu Trước thực phân tích thành phần chính, tác giả sử dụng phần mềm SPSS để thực tính tốn hệ số KMO kiểm định Bartlett, thu kết sau: Bảng 1: Kết kiểm định KMO Bartlett’s Test Kaiser-Meyer-Olkin Measure of Sampling Adequacy 0,808 Barlett’s Test of Sphericity Approx Chi-Square 1,15E+03 df 55 Sig Giá trị KMO 0.808 kiểm định Bartlett có Sig = 0,0000 cho thấy tiêu có tương quan với Dữ liệu gốc đáp ứng yêu cầu kiểm định KMO Bartlett phù hợp hợp để tiến hành phân tích thành phần 1.3.3 Lựa chọn thành phần Sau tiêu chuẩn hóa liệu gốc sử dụng phần mềm SPSS tiến thành phân tích thành phần thu kết bảng 2: Bảng 2: Giá trị riêng tích lũy phương sai thành phần Ghi chú: Fi thành phần thứ I, Variability (%) phần trăm phương sai Cumulative (%): phần trăm tích lũy phương sai Qua Bảng thấy giá trị riêng hai thành phần thứ thứ hai lớn chiếm 83,192 % phần trăm tích lũy phương sai, tức thành phần đại diện tới 83,192% thông tin liệu gốc Cụ thể Tieu luan thành phần chứa đựng 66,496%, thành phần thứ hai chứa đựng 16,695 % thông tin liệu gốc Zscore (X4) Zscore (X3) Zscore (X2) Zscore (X1) Zscore (X5) Zscore (X6) Zscore (X9) Zscore (X8) Zscore (X7) Zscore (X10) Zscore (X11) Bảng 3: Ma trận thành phần xoay Components (Các thành phần) 0,968 0,963 0,96 0,952 0,878 0,702 0,532 -0,156 0,337 0,406 0,456 0,126 0,196 0,174 0,263 0,321 0,527 0,485 0,826 0,82 0,805 0,791 Bảng ma trận thành phần xoay thể mối tương quan biến trục (thành phần chính) Bảng cho thấy biến X4, X3, X2, X1, X5, X6 có đóng góp lớn cho thành phần thứ (F1) Các biến X7, X10 X11 có tương quan mạnh mẽ với thành phần thứ (F2) Bảng 4: Ma trận trọng số thành phần Components (Các thành phần) Zscore (X4) 0,192 -0,063 Zscore (X3) 0,211 -0,102 Zscore (X2) 0,208 -0,093 Zscore (X1) 0,222 -0,124 Zscore (X5) 0,163 -0,024 Zscore (X6) 0,081 0,096 Zscore (X9) -0,066 0,289 Zscore (X8) -0,192 0,383 Zscore (X7) 0,045 0,11 Zscore (X10) -0,045 0,27 Zscore (X11) -0,03 0,255 Từ bảng biểu diễn thành phần sau: F1 = 0,192X1 + 0,211X2 + 0,208X3 + 0,222X4 + 0,163X5+ 0,081X6 - 0,066X7 - 0,192X8 + 0,045X9 - 0,045X10 - 0,03X11 Tieu luan F2 = - 0,063X1 - 0,102X2 - 0,093X3 - 0,124X4 - 0,024X5 + 0,096X6 + 0,289X7 + 0,383X8 + 0,11X9 + 0,27X10 + 0,255X11 Từ tính điểm số quan sát trục chính, sau tính tổng điểm quan sát theo công thức: 𝜆1 𝜆2 7.315 1.836 𝐹= 𝐹1 + 𝐹2 = 𝐹1 + 𝐹 𝜆1 + 𝜆2 𝜆1 + 𝜆2 9.151 9.151 1.3.4 Kết phân tích Tác giả tiến hành tính tốn tổng điểm F, thực xếp hạng thu bảng số liệu sau: Tieu luan Kết tính tốn từ bảng cho thấy: số tỉnh đạt điểm số lớn chiếm 20,63% (13 tỉnh) 79,37% số tỉnh có điểm âm (50 tỉnh) Tp HCM xếp với 4,931 điểm, ngược lại Lai Châu xếp cuối với số điểm cực thấp - 0,572 Điều cho thấy khoảng cách tuyệt đối tỉnh lớn, trình độ phát triển kinh tế lệch Trong nội vùng có chênh lệch rõ ràng: ví dụ 9/10 tỉnh xếp cuối bảng thuộc Trung du miền núi phía Bắc, tỉnh xếp hạng cao Thái Nguyên (12), thấp Lai Châu (63); tỉnh xếp hạng cao vùng đồng sông Hồng Hà Nội (2), thấp Hà Nam (52); So sánh với số liệu GRDP bình quân đầu người thấy Bà Rịa Vũng Tàu có GRDP bình qn đầu người lớn nước có lợi khai thác dầu khí lại đứng vị trí thứ bảng xếp hạng Lào Cai có GRDP/ người mức số khác thấp dẫn đến bảng xếp hạng chung đứng thứ 53 Ngược lại, Đắk Lắk có GRDP/người mức thấp Zcore giá trị thuộc F1 âm giá trị F2 dẫn đến F1 có số điểm dương tổng xếp hạng vào vị trí 19 xét tổng thể Đắk Lắk có tiềm kinh tế định Để trực quan hóa kết lực kinh tế tổng hợp địa phương, tác giả sử dụng phần mềm Arc gis đồ hoá kết thu bảng Sử dụng chức phân loại tự nhiên jenks natural breaks để phân địa phương thành ba nhóm thấp trung bình cao tương ứng với ba nhóm trình độ phát triển kinh tế tổng hợp Tieu luan Nhờ điều kiện thuận lợi mặt tự nhiên, sách lẫn lịch sử mà Hà Nội thành phố Hồ Chí Minh trở thành hai trung tâm dẫn đầu phát triển kinh tế Việt Nam Hình cho thấy, có hai địa phương thuộc nhóm phát triển tỉnh có trình độ kinh tế nhóm đa số phân bố xung quanh hai trung tâm kinh tế Điều phần minh chứng cho hiệu ứng cực hóa lan tỏa, tác động lan tỏa ảnh hưởng đến tỉnh có vị trí gần nơi phát triển Có tới 54 tỉnh, thành phố thuộc nhóm mức mức trung bình cho thấy vấn đề phát triển vùng không đồng thiếu đồng cộm, thách thức lớn thực chiến lược phát triển toàn diện Đặc biệt miền Trung có Đà Nẵng thuộc nhóm 2, tương lai cần thúc đẩy vai trị Hà Nội Hồ Chí Minh đồng thời đầu tư cho việc phát triển miền Trung để trình độ phát triển khu vực trở nên đồng 1.3.5 Kết luận Thông qua phân tích thành phần liệu thống kê 63 tỉnh, thành phố năm 2018, tính phiến diện sử dụng tiêu kinh tế loại bỏ Kết cung cấp đánh giá toàn diện trình độ phát triển kinh tế địa phương Các tỉnh, thành phố có khác biệt đáng kể trình độ phát triển tổng hợp Tỉnh có trình độ phát triển cao tập trung chủ yếu vùng Đồng sông Hồng Đông Nam Bộ Các tỉnh lạc hậu chủ yếu thuộc khu vực Trung du miền núi phía Bắc Bài nghiên cứu phụ 2.1 Ứng dụng phương pháp phân tích thành phần cho tốn dự báo phụ tải điện ngắn hạn Tieu luan Dự báo phụ tải điện vấn đề quan trọng hệ thống điện Mục đích dự báo phụ tải tương lai dựa vào quan sát khứ, phục vụ cho công tác điều độ quy hoạch nguồn lưới hệ thống điện Trong nghiên cứu tính tốn phụ tải điện ngắn hạn cho 24 ngày tuần phương pháp ứng dụng mạng nơ ron Phương pháp phân tích thành phần (PCA) dùng cho việc phân tích số liệu thu thập Q trình xây dựng mơ hình, xét tương quan ngày dự báo phụ thuộc vào ngày khứ Áp dụng thuật toán PCA giảm số liệu không quan trọng số liệu mẫu, chọn số liệu ảnh hưởng đến phụ tải dẫn đến kết dự báo tốt Kết quả: nghiên cứu đưa phương pháp cải tiến áp dụng dự báo phụ tải điện ngắn hạn: - Ứng dụng thuật tốn PCA giảm kích thước liệu đầu vào rút ngắn thời gian huấn luyện mạng nơ ron - Thuật toán sử dụng để dự báo phụ tải cho lưới điện ISO New England kết dự báo có sai số dự báo 3% - Kết dự báo khả quan phương pháp trình bày áp dụng dự báo phụ tải ngắn hạn cho lưới điện phụ tải khơng biến động thời gian khảo sát thu thập liệu thời gian dự báo 2.2 Ứng dụng phương pháp phân tích thành phần để đánh giá đặc tính hóa học kháng khuẩn nọc ong mật Apis Mellifera Mục đích nghiên cứu sử dụng phân tích thành phần (PCA) để làm rõ mơ hình phân bố chung tương đồng bốn thành phần (apamine, phospholipase A 2, peptide phân giải tế bào mast, melittin) nọc ong thu thập từ hai dòng ong mật nhiều tháng năm khác Nội dung thành phần nọc ong phân tích sắc ký lỏng hiệu suất cao (HPLC) Ngồi ra, hoạt tính kháng khuẩn sản phẩm đặc trưng việc xác định Nồng độ ức chế tối thiểu (MIC) Sử dụng PCA tìm mơ tả mối tương quan thành phần nọc ong hoạt tính kháng khuẩn chúng Đây có lẽ nghiên cứu thành phần hoạt tính nọc ong so sánh áp dụng cách tiếp cận Nó dòng ong dường tiêu chí để phân loại mẫu nọc độc ong Hơn nữa, mối tương quan chặt chẽ phospholipase A2 melittin xác nhận Phân tích PCA cho thấy có mối quan hệ yếu thành phần nọc ong mật phân tích giá trị MIC Do đó, thành phần nhỏ nọc ong có lẽ ảnh hưởng đáng kể đến hoạt động kháng khuẩn Tieu luan PHẦN 2: ỨNG DỤNG VỚI BỘ DỮ LIỆU THỰC TẾ Giới thiệu liệu 3.1 Mô tả liệu Bộ liệu gồm 24 cột, có cột chứa ID hành khách, cột trả lời nhân học, cột chứa kết 14 cột câu trả lời hành khách mức độ hài lòng họ tương ứng 14 biến nhóm lựa chọn để phân tích PCA 3.2 Phạm vi nghiên cứu Dữ liệu sưu tầm không đề cập đến 3.3 Mục đích nghiên cứu Dự đốn hành vi nhằm giữ chân khách hàng thơng qua việc phân tích tất liệu có liên quan đến khách hàng tập trung phát triển chương trình giữ chân khách hàng 3.4 Thời kỳ nghiên cứu Nghiên cứu thực từ 21/2/2020 đến 21/3/2020 3.5 Phương pháp thu thập thông tin Chọn mẫu ngẫu nhiên Cơ sở lý thuyết phương pháp 4.1 Mục đích PCA Về mặt thống kê: làm giảm số lượng biến ban đầu số lượng biến (Thành phần chính) Về mặt tốn học: làm giảm số cột ma trận Về mặt hình học: nén khơng gian nhiều chiều thành khơng gian chiều 4.2 Phạm vi áp dụng Biến định lượng Biến định tính thang đo thứ bậc 4.3 Nội dung Có số lượng lớn biến định lượng định tính với thang đo thứ bậc có liên hệ tương quan với PCA tìm thành phần (PC) mà PC tổ hợp tuyến tính nhóm biến ban đầu Tieu luan Kết quả: biến gọi PC mà giá trị PC trung bình trọng số biến ban đầu Tức là: Trong số trọng số a(1)1, a1(1)2,…, a(1)p xác định cho PC(1) giải thích nhiều biến thiên nhóm biến ban đầu Và: Với PC(m) thành phần thứ m KHÔNG TƯƠNG QUAN với PC rút trước giải thích nhiều biến thiên lại liệu 4.4 Các bước tiến hành PCA Chọn biến sử dụng để phân tích Xác định thành phần đặc trưng cho biến ban đầu Xác định biến thuộc PC Có thể phải xoay khơng gian thành phần Giải thích thành phần tính giá trị quan sát theo thành phần - Xử lý liệu phân tích thành phần 5.1 Tiền xử lý liệu Dữ liệu nhóm bao gồm tất 14 cột với giá trị biến sau: a Departure and Arrival Time Sự thuận tiện thời gian cất cánh Convenience hạ cánh b Ease of Online Booking Trải nghiệm đặt vé online c Check-in Service Dịch vụ check-in d Online Boarding Check-in online e Gate Location Vị trí cổng sân bay f On-board Service Dịch vụ hạng thương gia 10 Tieu luan g Seat Comfort Sự thoải mái ghế ngồi h Leg Room Service Chỗ để chân ghế ngồi i Cleanliness Độ máy bay k Food and Drink Đồ ăn thức uống máy bay l In-flight Service Dịch vụ chuyến bay m In-flight Wifi Service Dịch vụ wifi chuyến bay n In-flight Entertainment Giải trí chuyến bay o Baggage Handling Việc xử lý hành lý từ hãng hàng không 5.2 Phân tích thành phần 5.2.1 Chọn biến 5.2.1.1 Kiểm định KMO Hệ số MSA kiểm định KMO thể tỷ lệ mối tương quan chung so với mức tương quan riêng phần biến Hệ số MSA > 0.7 thể mức tương quan chung tổng thể cao mức tương quan riêng phần nên biến đưa vào phù hợp để chạy PCA Sử dụng phần mềm Rstudio ta thu kết sau: Bảng 6: Giá trị KMO biến Overall MSA = 0.78 MSA for each item = a b c d e f g h i k l m n o 0.75 0.68 0.70 0.74 0.71 0.83 0.83 0.89 0.82 0.84 0.78 0.74 0.77 0.82 KMO = 0.78 Kết cho thấy KMO tổng thể lớn 0.7 cho thấy biến từ a đến o phù hợp để đưa vào phân tích thành phần 5.2.1.2 Kiểm định Bartlett’s Test Ta có cặp giả thuyết H0: Các biến khơng có mối liên hệ tương quan với H1: Các biến có mối liên hệ tương quan với Giả định với mức ý nghĩa 5% Kết cho thấy: Chisq = 753739.3 11 Tieu luan Sig = < 0.05 Kết luận: Đủ sở để bác bỏ giả thuyết H0 Do biến đưa vào phù hợp để thực PCA 5.2.1.3 Kết luận ❖ Tổng quan *Variance: (Phương sai): Các Dim có phương sai lớn chọn làm thành phần *% of var: Phần trăm thành phần giải thích biến *Cumulative % of var: Phần trăm thành phần giải thích biến tích lũy *Dist: Khoảng cách gốc tọa độ đến điểm quan sát *Dim: Khoảng cách từ gốc đến hình chiếu điểm đến trục = hệ số tương quan *ctr: : Hệ số tương quan biến đến thành phần Bảng 7: Eigenvalues Từ bảng Eigenvalues ta rút nhận xét sau: Giá trị riêng thành phần rút trích (Variance) lớn bao gồm Dim Phần trăm biến thiên liệu giải thích thành phần rút trích (% of var) Dim Kết luận: Nên giữ lại thành phần từ Dim.1 đến Dim.4 ❖ Biểu đồ scree plot 12 Tieu luan Biểu đồ 1: Scree plot Kết cho thấy từ vị trí khuỷu tay hất lên có thành phần giữ lại Biến a b c d e f g h i k Bảng 8: Communality Giá trị Communality 0,58 0,81 0,31 0,80 0,70 0,62 0,73 0,40 0,80 0,73 13 Tieu luan Từ liệu bảng trên, giá trị communality biến cao 0.3, vòng tròn tương quan cho thấy biến giải thích cao thành phần rút trích, nên tất biến giữ lại 5.3 Lựa chọn biến thành phần Tiêu chuẩn xác định: Biến có đồ thị vượt đường nằm ngang màu đỏ biến thuộc thành phần 5.3.1 Thành phần thứ Biểu đồ 2: Phần trăm đóng góp biến vào thành phần thứ 14 Tieu luan 5.3.2 Thành phần thứ hai Biểu đồ 3: Phần trăm đóng góp biến vào thành phần thứ hai 5.3.3 Thành phần thứ ba Biểu đồ 4: Phần trăm đóng góp biến vào thành phần thứ ba 15 Tieu luan 5.3.4 Thành phần thứ tư Biểu đồ 5: Phần trăm đóng góp biến vào thành phần thứ tư Theo giảm dần mức độ đóng góp biến vào thành phần từ trái qua phải ta có bảng sau: Dim.1 n i g k d f Dim.2 b m e a Dim.3 l o f k i g h Dim.4 d e a c Lập luận: Ta xét biến theo chiều từ trái qua phải sau: - Biến i, g có mức độ đóng góp Dim.1 nhiều Dim.3 nên ta loại i, g Dim.3 - Biến d mức độ đóng góp Dim.4 lớn nên loại biến d Dim.1 - Biến f mức độ đóng góp Dim.3 lớn Dim.1 nên ta loại f Dim.1 16 Tieu luan Biến e a đóng góp vào Dim.4 nhiều Dim.2 nên ta loại biến Dim.2 Trường hợp đặc biệt xét đến định tính biến k h: - Đối với h có mức độ đóng góp Dim thấp j g mà i, g bị loại khỏi Dim.3 xét phương diện định tính nên ta giữ lại - Dim.1 n i g k d f Dim.2 b m e a Dim.3 l o f k i g h Dim.4 d e a c Bảng 9: Variables Trường hợp đặc biệt biến k thuộc thành phần Dim.1 Dim.3 nên: Xét mặt định lượng: Contribution biến k với Dim1= (9.44%) < Dim3 = (12.12%) (Bảng 7) Xét mặt định tính: Biến k đồ ăn thức uống máy bay Dim.1 gồm: Giải trí chuyến bay (n), Độ máy bay (i), Sự thoải mái ghế ngồi (g) 17 Tieu luan Dim.3 gồm: Dịch vụ chuyến bay (l), Việc xử lý hành lý từ hãng hàng không (o), Dịch vụ hạng thương gia (f), Chỗ để chân ghế ngồi (h) Nhận xét: Đồ ăn thức uống máy bay (k) phần dịch vụ có chuyến bay ngồi mức độ đóng góp k vào thành phần thứ lớn thành phần thứ Như vậy, đồ ăn thức uống máy bay thuộc Dim.3 Kết luận: Từ lập luận ta bảng sau: Dim.1 n i g Dim.2 b m Dim.3 l o Dim.4 d e f h k a c 5.4 Giải thích thành phần tính giá trị quan sát theo thành phần 5.4.1 Đặt tên giải thích cho thành phần Bảng 10: Tên PC biến Dim.1 Mức độ hài lịng vệ sinh, giải trí chuyến bay Dim.2 Mức độ hài lịng cơng nghệ thơng tin n Giải trí chuyến bay i Độ máy bay g Sự thoải mái ghế ngồi b Trải nghiệm đặt vé online m Dịch vụ wifi chuyến bay 18 Tieu luan Dim.3 Mức độ hài lòng dịch vụ chuyến bay Dim.4 Mức độ hài lòng thủ tục chuyến bay l Dịch vụ chuyến bay o Việc xử lý hành lý từ hãng hàng không f Dịch vụ hạng thương gia h Chỗ để chân ghế ngồi k Đồ ăn thức uống máy bay d Check-in online e Vị trí cổng sân bay a Sự thuận tiện thời gian cất cánh hạ cánh c Dịch vụ check-in Tên PC biến thuộc thành phần trình bày Bảng 10 với mức độ hài lịng đánh giá từ “rất khơng tốt” đến “rất tốt” 5.4.2 Nhân số Nhân số quan sát tính cách nhân véc tơ riêng với liệu chuẩn hóa ta kết bảng sau: a b c d e f g h i k Dim-1 2.237 2.314 1.692 2.327 0.814 1.438 3.113 0.680 -0.150 2.162 Dim-2 -0.846 -1.669 1.157 -1.886 0.102 1.553 -0.719 1.184 -1.637 -0.262 19 Tieu luan Dim-3 -0.670 1.129 -2.178 0.993 -1.447 0.176 0.729 -1.204 0.984 1.507 Dim-4 0.918 -0.608 -0.376 -0.103 -0.710 -0.374 0.151 -0.247 -0.538 -1.163 Kết luận Các kết luận cụ thể Nhóm trình bày trên, Nhóm xin kết luận ngắn gọn lại sau: Như vậy, qua bước liệu từ 14 biến đưa vào phân tích đọng lại thành thành phần Đây coi bước tiền xử lý liệu cho phương pháp phân tích hồi quy bội phân tích cụm liệu sau Qua Nhóm thấy số điểm cần đề xuất bổ sung liệu sau: Ngoài câu hỏi cụ thể liệu có số câu chưa rõ ràng, ví dụ Dịch vụ chuyến bay (l), Dịch vụ hạng thương gia (f) Nếu nói rõ dịch vụ kết nghiên cứu ý nghĩa đào sâu hài lòng khách hàng, biết cụ thể dịch vụ khách hàng chưa hài lịng tổ chức dễ dàng khắc phục sửa đổi 20 Tieu luan TÀI LIỆU THAM KHẢO - Giáo trình Phân tích liệu - Ứng dụng phương pháp phân tích thành phần đánh giá tổng hợp trình độ phát triển kinh tế tỉnh thành Việt Nam - Ứng dụng phương pháp phân tích thành phần cho toán dự báo phụ tải điện ngắn hạn - Ứng dụng phương pháp phân tích thành phần để đánh giá đặc tính hóa học kháng khuẩn nọc ong mật Apis Mellifera 21 Tieu luan ... cứu phụ 2.1 Ứng dụng phương pháp phân tích thành phần cho tốn dự báo phụ tải điện ngắn hạn Tieu luan Dự báo phụ tải điện vấn đề quan trọng hệ thống điện Mục đích dự báo phụ tải tương lai dựa... Thuật toán sử dụng để dự báo phụ tải cho lưới điện ISO New England kết dự báo có sai số dự báo 3% - Kết dự báo khả quan phương pháp trình bày áp dụng dự báo phụ tải ngắn hạn cho lưới điện phụ tải. .. phụ 2.1 Ứng dụng phương pháp phân tích thành phần cho tốn dự báo phụ tải điện ngắn hạn 2.2 Ứng dụng phương pháp phân tích thành phần để đánh giá đặc tính hóa học