1. Trang chủ
  2. » Giáo Dục - Đào Tạo

phân tích thành phần chính pca bài tập lớn môn phân tích dữ liệu

42 3 0
Tài liệu đã được kiểm tra trùng lặp

Đang tải... (xem toàn văn)

Tài liệu hạn chế xem trước, để xem đầy đủ mời bạn chọn Tải xuống

THÔNG TIN TÀI LIỆU

Thông tin cơ bản

Tiêu đề Phân tích Thành Phần Chính (PCA)
Tác giả Lê Thị Ngọc Ánh, Phạm Thúy Hiền, Bùi Phương Hà, Dương Nguyễn Thu Hạ
Người hướng dẫn PGS. TS. Trần Thị Bích
Trường học Trường Đại Học Kinh Tế Quốc Dân
Chuyên ngành Phân tích dữ liệu
Thể loại Bài tập lớn
Năm xuất bản 2024
Thành phố Hà Nội
Định dạng
Số trang 42
Dung lượng 1,76 MB

Cấu trúc

  • PHẦN 1: TỔNG QUAN VỀ PHÂN TÍCH THÀNH PHẦN CHÍNH (6)
    • 1. Khái niệm (6)
    • 2. Bản chất của phân tích thành phần chính (6)
    • 3. Mục đích của phân tích thành phần chính (6)
    • 4. Phạm vi áp dụng (7)
  • PHẦN 2: PHÂN TÍCH NGHIÊN CỨU (8)
    • I. Ứng dụng phương pháp phân tích thành phần chính và hồi quy logistic trong đánh giá cảm quan nước ép gấc – chanh dây (8)
      • 1. Lý do chọn đề tài (8)
      • 2. Tóm tắt bài nghiên cứu (9)
      • 3. Mục tiêu bài nghiên cứu (9)
      • 4. Phương tiện và phương pháp nghiên cứu (10)
        • 4.1. Chuऀn b椃⌀ m̀u (10)
          • 4.1.1 Chuऀn b椃⌀ màng gĀc (0)
          • 4.1.2 Chuऀn b椃⌀ d椃⌀ch qu愃ऀ chanh d愃Ȁy (0)
          • 4.1.3. Chế biến nước ép gĀc-chanh d愃Ȁy (10)
        • 4.2. Đ愃Ānh gi愃Ā c愃ऀm quan n甃ᬀớc 攃Āp h̀n hợp (11)
          • 4.2.1. Phư漃ᬀng pháp đánh giá các thuộc t椃Ānh c愃ऀm quan c甃ऀa nước ép gĀc-chanh d愃Ȁy (0)
          • 4.2.2. Phư漃ᬀng pháp đánh giá c愃ऀm quan v sự chĀp nhận s愃ऀn phऀm (0)
        • 4.3. Ph甃ᬀơng ph愃Āp phân tích thống kê (11)
          • 4.3.1. Ph愃Ȁn t椃Āch thành phần ch椃Ānh (PCA) (11)
          • 4.3.2. Ph愃Ȁn t椃Āch hồi quy logistic (11)
      • 5. Kết quả và thảo luận (12)
        • 5.1. Ảnh h甃ᬀởng của tỷ lệ pha loãng và khối l甃ᬀợng chanh dây bổ sung đến chất l甃ᬀợng c愃ऀm quan s愃ऀn phऀm (12)
        • 5.2. Ảnh h甃ᬀởng của tỷ lệ pha loãng và khối l甃ᬀợng chanh dây bổ sung đến kh愃ऀ n愃؀ng chấp nhận của s愃ऀn phऀm (15)
      • 6. Kết luận (18)
    • II. Ứng dụng thuật toán trên nền tảng ngôn ngữ R để nghiên cứu vi nhựa trong nước mặt lục địa, sông Sài Gòn và sông Đồng Nai (19)
      • 1. Tóm tắt bài nghiên cứu (19)
      • 2. Phạm vi ứng dụng của phương pháp PCA trong bài nghiên cứu (19)
        • 2.1. Kết qu愃ऀ phân tích t甃ᬀơng quan và PCA c愃Āc đặc điểm về hình dạng của vi nhựa trong môi tr甃ᬀờng n甃ᬀớc sông Sài Gòn - Đồng Nai trong n愃؀m 2021 (20)
        • 2.2. Kết qu愃ऀ phân tích t甃ᬀơng quan và PCA c愃Āc đặc điểm về hình dạng của vi nhựa trong môi tr甃ᬀờng n甃ᬀớc sông Sài Gòn - Đồng Nai trong n愃؀m 2022 (22)
    • II. Đánh giá chất lượng sinh thái cho tỉnh Thanh Hóa trong năm 2021 dựa vào chỉ số sinh thái viễn thám (RSEI) (25)
      • 1. Tóm tắt nghiên cứu (25)
      • 2. Phạm vi ứng dụng của phương pháp phân tích thành phần chính PCA trong nghiên cứu (26)
        • 2.1. Chỉ số sinh th愃Āi viễn th愃Ām RSEI (26)
          • 2.1.1. Chỉ số độ xanh NDVI (0)
          • 2.1.2. Chỉ số độ ऀm Wet (0)
          • 2.1.3. Chỉ số TVDI (0)
          • 2.1.4. Chỉ số nhiệt (27)
        • 2.2. Ph甃ᬀơng ph愃Āp phân tích thành phần chính PCA (27)
      • 3. Kết quả (24)
        • 3.1. Xây dựng c愃Āc b愃ऀn đồ từng thành phần (28)
        • 3.2. Kết luận (31)
  • PHẦN 3: SỬ DỤNG BỘ DỮ LIỆU ĐỂ PHÂN TÍCH BẰNG PHẦN MỀM R (32)
    • I. Giới thiệu mẫu nghiên cứu (32)
      • 1. Giới thiệu bộ dữ liệu (32)
        • 1.1. Đề tài nghiên cứu (32)
        • 1.2. Phạm vi nghiên cứu (32)
        • 1.3. Mục đích nghiên cứu (32)
      • 2. Mô tả dữ liệu (32)
    • II. Phân tích thành phần chính (PCA) (33)
      • 1. Bước 1: Lựa chọn biến phân tích (33)
        • 1.1. Ma trận hệ số t甃ᬀơng quan (33)
        • 1.2. Kiểm đ椃⌀nh Bartlett (34)
        • 1.3. Kiểm đ椃⌀nh KMO (34)
      • 2. Bước 2: Xác định các thành phần chính (35)
        • 2.1. X愃Āc đ椃⌀nh số l甃ᬀợng thành phần chính (35)
        • 2.2. X愃Āc đ椃⌀nh số thành phần chính giữ lại (36)
        • 2.3. Đ愃Ānh gi愃Ā chất l甃ᬀợng biểu diễn của biến phân tích (37)
      • 3. Bước 3: Xác định biến nào thuộc thành phần chính nào (38)
      • 4. Bước 4: Chuyển dữ liệu sang không gian mới (40)
        • 4.1. Đặt tên 2 biến thành phần chính (40)
        • 4.2. Chuyển dữ liệu sang không gian mới (40)
    • III. Kết luận (42)
  • TÀI LIỆU THAM KHẢO (42)
    • H椃nh 2: Sự ph愃Ȁn bĀ c愃Āc thuộc tính cảm quan theo kết quả đ愃Ānh gi愃Ā c甃ऀa cảm quan viên (0)
    • H椃nh 3: Sự ph愃Ȁn bĀ c甃ऀa c愃Āc m̀u nước gĀc-chanh d愃Ȁy và c愃Āc thuộc tính cảm quan trên cùng mặt phẳng tương quan giữa thành phần chính thứ 1 và thứ 2 (0)
    • H椃nh 4: Tương quan giữa tỷ sĀ odd với khĀi lượng dịch quả và tỷ lệ pha loãng (0)
    • H椃nh 7: Bản đồ 4 chỉ sĀ NDVI, WET, TVDI, TEM (0)
    • H椃nh 8: Kết quả tính chỉ sĀ RSEI, tỉnh Thanh Hóa n愃؀m 2021 (0)
    • H椃nh 9: Kết quả c甃ऀa kiऀm định Bartlett (0)
    • H椃nh 10: Biऀu đồ khuỷu tay (0)
    • H椃nh 11: Đồ thị so s愃Ānh mức đóng góp trung b椃nh c愃Āc biến trong Dim 1 (0)
    • H椃nh 12: Đồ thị so s愃Ānh mức đóng góp trung b椃nh c愃Āc biến trong Dim 2 (0)
    • H椃nh 13: Đồ thị ph愃Ȁn t愃Ān trên 2 trục PC (0)
    • H椃nh 14: Đồ thị ph愃Ȁn t愃Ān trên 2 trục PC theo thế hệ (0)

Nội dung

DANH MỤC BẢNGBảng 1: K礃Ā hiệu c愃Āc m̀u nước 攃Āp gĀc-chanh d愃Ȁy được đ愃Ānh gi愃Ā cảm quan trong thí nghiệm với lượng gĀc cĀ định 150 g...10Bảng 2: Trọng sĀ c甃ऀa c愃Āc thành phần.

TỔNG QUAN VỀ PHÂN TÍCH THÀNH PHẦN CHÍNH

Khái niệm

Ph愃Ȁn tích thành phần chính (Principal Component Analysis - PCA) là một trong những phương ph愃Āp ph愃Ȁn tích dữ liệu đã chiều được sử dụng trong thĀng kê mục đích làm giảm chiều (giảm sĀ lượng biến) nhưng v̀n giữ lại được nhiều nhĀt c愃Āc thông tin c甃ऀa tập dữ liệu ban đầu.

Bản chất của phân tích thành phần chính

Thực chĀt việc cô đọng thông tin hay giảm chiều dữ liệu c甃ऀa phương ph愃Āp ph愃Ȁn tích thành phần chính là thay thế p biến ban đầu (có quan hệ tương quan với nhau) bằng một sĀ thành phần chính (biến mới) là z (với z < p) Mỗi thành phần chính là tổ hợp tuyến tính c甃ऀa c愃Āc biến ban đầu C愃Āc thành phần chính được x愃Āc định trên cơ sở có mĀi liên hệ tuyến tính cao với c愃Āc biến ban đầu và giữa c愃Āc thành phần chính không tương quan với nhau => được sử dụng như bước tiền xử l礃Ā dữ liệu cho c愃Āc phương ph愃Āp hồi quy bội và ph愃Ȁn cụm dữ liệu. Đऀ thực hiện giảm chiều, PCA biến đổi tập dữ liệu ban đầu lên một hệ trục tọa độ mới mà c愃Āc trục tọa độ là c愃Āc thành phần chính sao cho mỗi thành phần chính là một hàm hồi quy tuyến tính c甃ऀa c愃Āc biến ban đầu C愃Āc thành phần chính được x愃Āc định trên cơ sở có mĀi liên hệ tương quan cao với c愃Āc biến ban đầu và giữa c愃Āc thành phần chính không tương quan với nhau Thành phần chính đầu tiên sẽ có phương sai lớn nhĀt hay là trục tọa độ mà c愃Āc quan s愃Āt được ph愃Ȁn bĀ tĀi đa (ph愃Ȁn t愃Ān rộng nhĀt) trên trục đó.

Mục đích của phân tích thành phần chính

- Giảm chiều dữ liệu: PCA giúp giảm sĀ lượng biến đầu vào c甃ऀa dữ liệu, chuyऀn từ không gian ban đầu sang không gian mới có sĀ chiều (thường ít hơn) mà v̀n giữ lại được phần lớn thông tin quan trọng từ dữ liệu ban đầu Điều này giúp làm cho dữ liệu trở nên dễ quản l礃Ā hơn và giảm độ phức tạp trong việc ph愃Ȁn tích

- Ph愃Āt hiện sự tương quan: PCA giúp ph愃Āt hiện và hiऀu rõ sự tương quan giữa c愃Āc biến Nó t椃m ra c愃Āc "thành phần chính" hoặc "vector riêng" c甃ऀa dữ liệu, đó là những hướng chứa phần lớn biến thiên trong dữ liệu

- N攃Ān thông tin: PCA cho ph攃Āp biऀu diễn dữ liệu ban đầu dưới dạng tổ hợp tuyến tính c甃ऀa c愃Āc thành phần chính Điều này có nghĩa rằng bạn có thऀ lưu trữ dữ liệu một c愃Āch hiệu quả hơn với ít thông tin hơn, mà v̀n giữ lại được c愃Āc đặc trưng quan trọng

- Loại bỏ nhiễu: PCA có thऀ giúp loại bỏ hoặc giảm nhiễu từ dữ liệu, làm cho dữ liệu trở nên dễ dàng ph愃Ȁn tích và hiऀu hơn

- Visualize dữ liệu: PCA có thऀ được sử dụng đऀ biऀu diễn dữ liệu nhiều chiều trong không gian hai hoặc ba chiều đऀ dễ dàng trực quan hóa dữ liệu

- Tạo c愃Āc biến mới không tương quan (orthogonal): C愃Āc thành phần chính sau khi trích xuĀt từ PCA là không tương quan với nhau, điều này có thऀ giúp trong việc loại bỏ tương quan giữa biến đầu vào trong c愃Āc mô h椃nh thĀng kê

=> Tóm lại, PCA là một công cụ mạnh mẽ trong ph愃Ȁn tích dữ liệu, giúp tiết kiệm thời gian và tạo ra biऀu đồ hoặc biऀu đồ giúp hiऀu rõ hơn về mĀi quan hệ và đặc điऀm quan trọng trong dữ liệu.

Phạm vi áp dụng

- Ph愃Ȁn tích thành phần chính được 愃Āp dụng cho biến định lượng hoặc biến định tính với thang đo thứ bậc

- Ngoài mục đích tổng hợp biến mới sử dụng trong c愃Āc phương ph愃Āp ph愃Ȁn tích dữ liệu kh愃Āc như đã đề cập ở trên, PCA được ứng dụng nhiều trong lĩnh vực kinh tế - xã hội nhằm tính to愃Ān c愃Āc chỉ sĀ tổng hợp

PHÂN TÍCH NGHIÊN CỨU

Ứng dụng phương pháp phân tích thành phần chính và hồi quy logistic trong đánh giá cảm quan nước ép gấc – chanh dây

1 Lý do chọn đề tài

Sản xuĀt nước 攃Āp tr愃Āi c愃Ȁy ngày càng trở nên quan trọng đĀi với thị trường trong nước do nhu cầu sử dụng sản phẩm tiện lợi và bổ dưỡng Nước 攃Āp gĀc-chanh d愃Ȁy kết hợp sẽ làm t愃؀ng gi愃Ā trị dinh dưỡng và cải thiện mùi vị thơm ngon cho sản phẩm Tuy vậy, sản phẩm cần có thêm c愃Āc bước nghiên cứu về đ愃Ānh gi愃Ā cảm quan c甃ऀa người tiêu dùng đऀ x愃Āc nhận kết quả c甃ऀa nghiên cứu này và đảm bảo tiềm n愃؀ng c甃ऀa sản phẩm mới trên thị trường

Ph愃Ȁn tích cảm quan cung cĀp cho c愃Āc nhà tiếp thị hiऀu về chĀt lượng sản phẩm thực phẩm, hướng đến chĀt lượng sản phẩm tĀt và cải tiến sản phẩm theo quan điऀm c甃ऀa người tiêu dùng (Lawless and Heymann, 1998) Phương ph愃Āp ph愃Ȁn tích thành phần chính (PCA) đã được sử dụng và xem x攃Āt bởi c愃Āc nhà nghiên cứu cho c愃Āc ứng dụng đ愃Ānh gi愃Ā cảm quan cho c愃Āc sản phẩm thực phẩm kh愃Āc nhau PCA có thऀ được 愃Āp dụng cho việc điều tra dữ liệu ưa thích, do đó có thऀ tạo ra một không gian sản phẩm- người tiêu dùng dựa trên dữ liệu chĀp nhận (Hough et al., 1992; Greenhooff and McFie, 1994) Đ愃Ȁy c甃̀ng là một công cụ đऀ miêu tả sự kh愃Āc biệt giữa c愃Āc thuộc tính cảm quan c甃ऀa c愃Āc sản phẩm thực phẩm (Powers, 1984) MĀi quan hệ giữa người tiêu dùng và dữ liệu mô tả, c甃̀ng như dữ liệu thu nhận từ cảm quan và dụng cụ đo có thऀ được h椃nh dung một c愃Āch rõ ràng bởi PCA PCA c甃̀ng được sử dụng đऀ cung cĀp c愃Āch h椃nh dung mĀi quan hệ giữa c愃Āc sản phẩm và thuộc tính

Ngoài ra, c愃Āc mô h椃nh hồi quy logistic rĀt hữu ích đऀ mô tả ảnh hưởng c甃ऀa c愃Āc yếu tĀ dự b愃Āo (c愃Āc biến độc lập) lên biến nhị ph愃Ȁn (biến phụ thuộc) thऀ hiện kết quả chĀp nhận hoặc không chĀp nhận c甃ऀa người tiêu dùng (Agresti, 1996) Kết quả từ hồi quy logistic có thऀ được giải thích bằng c愃Āch sử dụng ước tính x愃Āc suĀt hoặc tỷ sĀ khả dĩ ước tính Hồi quy logistic có thऀ dự đo愃Ān x愃Āc suĀt ước tính rằng một sự kiện sẽ thành công hoặc thĀt bại dựa trên một sĀ dự b愃Āo (biến độc lập) (Hair et al., 1998) Nếu x愃Āc suĀt dự đo愃Ān lớn hơn 0,5 th椃 dự đo愃Ān là có (thành công), ngược lại là không (Agresti, 1996) Nói c愃Āch kh愃Āc, x愃Āc suĀt thành công hay thĀt bại c甃ऀa biến phụ thuộc không bị

8 ảnh hưởng bởi biến độc lập Tỷ sĀ odd có gi愃Ā trị 愃Ȁm cho thĀy sự suy giảm trong x愃Āc suĀt thành công, và tỷ sĀ odd dương cho thĀy khả n愃؀ng thành công t愃؀ng lên (Hair et al., 1998) Phương ph愃Āp hồi quy logistic đã được 愃Āp dụng trong một vài trường hợp trong lãnh vực đ愃Ānh gi愃Ā cảm quan

2 Tóm tắt bài nghiên cứu

Trong nghiên cứu này, c愃Āc cảm quan viên được đào tạo đऀ đ愃Ānh gi愃Ā c愃Āc thuộc tính kh愃Āc nhau c甃ऀa sản phẩm nước 攃Āp gĀc-chanh d愃Ȁy Hàm lượng dịch chanh d愃Ȁy sử dụng từ 50-200 g (150 g gĀc) và tỷ lệ pha loãng tổng c愃Āc thành phần (gĀc và chanh d愃Ȁy) với nước (1:8 đến 1:15) Ph愃Ȁn tích thành phần chính (PCA) x愃Āc định hai thành phần chính ch甃ऀ yếu chiếm 80,43% phương sai trong dữ liệu thuộc tính cảm quan PCA cho thĀy thuộc tính cảm quan quan trọng c甃ऀa nước 攃Āp này là hương vị, màu sắc và độ đồng nhĀt Khả n愃؀ng chĀp nhận chung c甃ऀa sản phẩm được mô phỏng (ph愃Ȁn tích hồi quy logistic) như một hàm c甃ऀa hàm lượng dịch quả chanh d愃Ȁy và tỷ lệ pha loãng c甃ऀa nước trong sản phẩm MĀi quan hệ thĀng kê quan trọng giữa c愃Āc biến được x愃Āc định

(P10% là PC1(56,6%), PC2(23,8%) và PC3 (12,7%) được biऀu diễn trên H椃nh 5a và H椃nh 5c

Tuy nhiên, nghiên cứu này chỉ lựa chọn 2 thành phần chính đầu tiên v椃 tổng 2 thành phần này đã giải thích được toàn bộ 80,4% tập dữ liệu yêu cầu (tổng giải thích phương sai hai thành phần chính lớn hơn 50%) C愃Āc vector màu xanh cho biết mĀi quan hệ giữa c愃Āc biến ban đầu (h椃nh d愃Āng MPs) và c愃Āc thành phần chính, độ dài c甃ऀa vector cho biết độ mạnh c甃ऀa mĀi tương quan c甃ऀa biến ban đầu với thành phần chính Theo kết quả ph愃Ȁn tích ma trận xoay trong H椃nh 5a, mĀi tương quan giữa c愃Āc h椃nh d愃Āng vi nhựa trong H椃nh 5d và kết quả gi愃Ā trị P-Value trong H椃nh 5b cho thĀy rằng: i) Dạng sợi - dạng kh愃Āc gần như không có mĀi tương quan (r = 0,08) và dạng mảnh - dạng hạt có mĀi tương quan yếu (r = 0,47), c愃Āc gi愃Ā trị P-Value < 0,05=> ChĀp nhận H0, có 礃Ā nghĩa thĀng kê ii) Ngoài ra, H椃nh 5a c甃̀ng cho thĀy dạng mảnh và dạng hạt có mĀi tương quan với thành phần chính PC1 cao hơn c愃Āc dạng kh愃Āc và dạng sợi, ngoài ra trong PC2 th椃 dạng sợi và dạng kh愃Āc có mĀi tương quan cao với thành phần chính này (nhưng gi愃Ā trị P-Value giữa dạng sợi-dạng kh愃Āc trong H椃nh 5b lại cho thĀy chúng không có 礃Ā nghĩa thĀng kê P-Value = 0,48).

Hình 5a: Kết qu愃ऀ ph愃Ȁn t椃Āch PCA c甃ऀa R Hình 5b: Kết qu愃ऀ trình di̀n hệ số tư漃ᬀng quan và giá tr椃⌀ PValue c甃ऀa các hình dạng vi nhựa từ R

Downloaded by Vu Vu (quangchinhlas199@gmail.com)

Hình 5c: Biऀu đồ Scree plot thऀ hiện phần trăm phư漃ᬀng sai mà các thành phần ch椃Ānh gi愃ऀi th椃Āch bộ dữ liệu

Hình 5d: Biऀu đồ tư漃ᬀng quan đa biến các hình dạng c甃ऀa vi nhựa được tìm thĀy

Từ c愃Āc ph愃Ȁn tích trên, nghiên cứu lựa chọn thực hiện ph攃Āp trích c愃Āc h椃nh d愃Āng vi nhựa cho c愃Āc thành phần chính như sau:

PC1 gồm: Dạng sợi (hệ sĀ x愃Āc định là 49%), dạng mảnh (56%) và dạng hạt (52,8%)

PC2 gồm: Dạng kh愃Āc (74,7%) Biऀu diễn phương tr椃nh cho thành phần chính PC1:

PC1 = 0,49DangSoi + 0,56DangManh + 0,53DangHạt Biऀu diễn phương tr椃nh cho thành phần chính PC2:

Downloaded by Vu Vu (quangchinhlas199@gmail.com)

Hình 5e: Biऀu đồ dự báo xu hướng biến đổi c甃ऀa các hình dạng vi nhựa theo

H椃nh 5e cho thĀy gần như c愃Āc h椃nh d愃Āng vi nhựa trong c愃Āc điऀm khảo s愃Āt trên sông Sài G漃n và sông Đồng Nai đều có liên quan đến thành phần chính đầu tiên C愃Āc vi nhựa bị ph愃Ȁn rã ngoài dạng sợi, mảnh, hạt có liên quan đến thành phần chính thứ hai C愃Āc hạt dạng sợi, hạt và bị ph愃Ȁn mảnh là c愃Āc loại vi nhựa chính được t椃m thĀy trong nước bề mặt lưu vực sông trong cả hai mùa, vào lúc triều lên và xuĀng trong ngày.

2.2 Kết qu愃ऀ phân tích t甃ᬀơng quan và PCA c愃Āc đặc điểm về hình dạng của vi nhựa trong môi tr甃ᬀờng n甃ᬀớc sông Sài Gòn - Đồng Nai trong n愃؀m 2022

Ph愃Ȁn tích tương tự cho n愃؀m 2022, H椃nh 6a và H椃nh 6c cho thĀy những đóng góp đầu tiên thành phần chính về h椃nh d愃Āng vi nhựa trong n愃؀m 2022 thỏa mãn phần tr愃؀m giải thích phương sai > 10% là PC1 (65,3%), PC2 (19,1%) và PC3 (12,3%)

Nghiên cứu này chỉ lựa chọn 2 thành phần chính đầu tiên v椃 tổng 2 thành phần này đã giải thích được toàn bộ 84,3% tập dữ liệu yêu cầu trong n愃؀m 2022 (tổng giải thích phương sai hai thành phần chính lớn hơn 50%) (H椃nh 6c) Vector h椃nh d愃Āng vi nhựa dạng sợi có chiều dài vượt trội hơn so với n愃؀m 2021 Điều này chứng tỏ mức nhiễm vi nhựa dạng sợi trên lưu vực 2 con sông v̀n cao và t愃؀ng hơn n愃؀m 2021 Kết luận này được khẳng định bởi 礃Ā nghĩa thĀng kê c甃ऀa dữ liệu khảo s愃Āt là rĀt rõ ràng bởi gi愃Ā trị P- Values hoàn toàn < 0,05=> ChĀp nhận H0, có 礃Ā nghĩa thĀng kê (H椃nh 6b).

Downloaded by Vu Vu (quangchinhlas199@gmail.com)

Hình 6a: Kết qu愃ऀ ph愃Ȁn t椃Āch PCA c甃ऀa R Hình 6b: Kết qu愃ऀ trình di̀n hệ số tư漃ᬀng quan và giá tr椃⌀ PValue c甃ऀa các hình dạng vi nhựa từ R

Hình 6c: Biऀu đồ Scree plot thऀ hiện phần trăm phư漃ᬀng sai mà các thành phần ch椃Ānh gi愃ऀi th椃Āch bộ dữ liệu

Hình 6d: Biऀu đồ tư漃ᬀng quan đa biến các hình dạng c甃ऀa vi nhựa được tìm thĀy Đऀ x愃Āc định c愃Āc nh愃Ȁn tĀ trong 2 thành phần PC1 và PC2, nghiên cứu dựa vào H椃nh 6a và H椃nh 6d và lựa chọn kết quả trích h椃nh dạng vi nhựa như sau:

PC1 gồm: Dạng sợi (hệ sĀ x愃Āc định là 43%), dạng mảnh (51%) và dạng kh愃Āc (46%)

Downloaded by Vu Vu (quangchinhlas199@gmail.com)

PC2 gồm: Dạng kh愃Āc (52%) Phương tr椃nh biऀu diễn thành phần chính PC1:

PC1 = 0.43DangSoi + 0.51DangManh + 0.46DangKhac Phương tr椃nh biऀu diễn thành phần chính PC2:

Hình 6e: Biऀu đồ dự báo xu hướng biến đổi c甃ऀa các hình dạng vi nhựa theo

Đánh giá chất lượng sinh thái cho tỉnh Thanh Hóa trong năm 2021 dựa vào chỉ số sinh thái viễn thám (RSEI)

Chỉ sĀ đ愃Ānh gi愃Ā chĀt lượng sinh th愃Āi được thiết lập thông qua bĀn chỉ sĀ (Chỉ sĀ thực vật kh愃Āc biệt chuẩn hóa (NDVI), Độ ẩm (WET), Chỉ sĀ khô hạn thực vật (TVDI) và Nhiệt độ (TEM)), kết hợp với phương ph愃Āp ph愃Ȁn tích thành phần chính (PCA) đऀ 愃Āp dụng đ愃Ānh gi愃Ā chĀt lượng sinh th愃Āi cho tỉnh Thanh Hóa trong n愃؀m 2021.

Chỉ sĀ chỉ sĀ sinh th愃Āi viễn th愃Ām (RSEI) được tính to愃Ān trên cơ sở ph愃Ȁn tích thành phần chính và sự kết hợp c甃ऀa bĀn chỉ sĀ cho ra công thức sau:

RSEI = 0,23*NDVI + 0,2*WET - 0,27*TVDI + 0,1*TEM.

C愃؀n cứ vào sự biến đổi c甃ऀa 4 chỉ tiêu trên, cho thĀy môi trường sinh th愃Āi c甃ऀa Thanh Hóa ở mức tĀt Kết quả cho thĀy, c愃Āc khu vực có chĀt lượng môi trường sinh th愃Āi tĀt ch甃ऀ yếu bị giới hạn bởi điều kiện địa l礃Ā, mật độ d愃Ȁn sĀ ít và ít chịu t愃Āc động c甃ऀa c愃Āc hoạt động kinh tế con người như tại huyện phía Đông Bắc tỉnh Thanh Hóa (Quan Hóa, Mường L愃Āt, Quan Sơn ), gi愃Ā trị RSEI giao động từ 0,6 đến 1 C愃Āc khu

Downloaded by Vu Vu (quangchinhlas199@gmail.com) vực có chĀt lượng môi trường sinh th愃Āi k攃Ām ch甃ऀ yếu là c愃Āc khu vực có tr椃nh độ kinh tế cao, đang diễn ra qu愃Ā tr椃nh đô thị hóa, không gian xanh ít và thường xuyên có hoạt động kinh tế c甃ऀa con người, và tập trung ch甃ऀ yếu ở phía đông c甃ऀa tỉnh như tỉnh Thanh Hóa, Nông CĀng và Hậu Lộc, gi愃Ā trị RSEI giao động từ 0,0 đến 0,4.

2 Phạm vi ứng dụng của phương pháp phân tích thành phần chính PCA trong nghiên cứu:

2.1 Chỉ số sinh th愃Āi viễn th愃Ām RSEI:

Chỉ sĀ sinh th愃Āi viễn th愃Ām RSEI được tính theo 4 thành phần: Độ xanh (Greenness), độ ẩm (Wetness), độ khô (Dryness) và độ nóng (Heat) C愃Āc t愃Āc động c甃ऀa từng thành phần đến môi trường sinh th愃Āi được x愃Āc định bằng PCA RSEI có thऀ được tính bằng c愃Āch sử dụng như sau phương tr椃nh (1), trong đó Cx là trọng sĀ c甃ऀa mỗi chỉ sĀ:

RSEI = C1 * Greenness + C2 * Wetness + C3 * Dryness + C4 * Heat (1) Trong đó, C1, C2 Là trọng sĀ tương ứng với hệ sĀ tải theo kết quả ph愃Ȁn tích thành phần chính PCA.

2.1.1 Chỉ số độ xanh NDVI

NDVI = ρ nir − ρ red ρ nir + ρ red (2) Trong đó: NIR và RED tương ứng với gi愃Ā trị phản xạ phổ tại kênh cận hồng ngoại và kênh đỏ c甃ऀa ảnh vệ tinh ĐĀi với ảnh vệ tinh Landsat 5 th椃 NIR và RED lần lượt là gi愃Ā trị phản xạ phổ tại kênh 4 và 3; đĀi với ảnh Landsat 8 là kênh 5 và 4

Chỉ sĀ độ ẩm được tính theo công thức sau (Zhang 2016):

Wet = 0,1511* NIR + 0,1973 * Red + 0,3283* Blue + 0,3407 * Green - 0,7117*SWIR1 - 0,4559 * SWIR2 (3)

2.1.3 Chỉ số TVDI Được x愃Āc định theo công thức sau (Yuhai Bao et al., 2013, Amin Zargar et al., 2011, AghaKouchak, A và cộng sự 2015):

Downloaded by Vu Vu (quangchinhlas199@gmail.com)

Trong đó: T s min , T s max là nhiệt độ bề mặt cực tiऀu và cực đại trên ảnh nhiệt sau khi được tính to愃Ān xử l礃Ā.

T = K 2 ln ⁡ ( K 1 Lλ+1 ) Trong đó: T = nhiệt độ hiệu quả trên vệ tinh (K); K 1 = 774.8853 đĀi với Landsat 8; K 2= 1321.0789 đĀi với Landsat 8

Chỉ sĀ RSEI được chia làm 5 mức:

Bảng 7: Mức đánh giá theo chỉ số RSEI

2.2 Ph甃ᬀơng ph愃Āp phân tích thành phần chính PCA

Phương ph愃Āp ph愃Ȁn tích thành phần chính PCA được 愃Āp dụng trong nghiên cứu nhằm lựa chọn trọng sĀ phù hợp cho c愃Āc tiêu chí đ愃Ānh gi愃Ā (NDVI (chỉ sĀ xanh);

WET (chỉ sĀ độ ẩm), TEM (chỉ sĀ nhiệt), TVDI (chỉ sĀ độ khô)) đऀ x愃Āc định chỉ sĀ RSEI.

C愃Āc bước thực hiện ph愃Ȁn tích thành phần chính như sau:

Bước 1: Thu thập dữ liệu Bước 2: Chuẩn hóa dữ liệu:

X愃Ȁy dựng ma trận chuẩn hóa bằng c愃Āch mang tĀt cả c愃Āc gi愃Ā trị đo được c甃ऀa mỗi cột (mỗi thông sĀ) trừ đi gi愃Ā trị trung b椃nh từng cột.

Bước 3: X愃Ȁy dựng ma trận hiệp phương sai hoặc ma trận tương quan theo công thức

Ma trận hiệp phương sai Trong đó:

Downloaded by Vu Vu (quangchinhlas199@gmail.com)

Cov φij: Hiệp phương sai giữa tính chĀt i và tính chĀt j Ma trận tương quan

Rx,y: là hệ sĀ tương quan giữa hai tính chĀt x và y.

Bước 4: X愃Āc định gi愃Ā trị riêng (λ), vectơ riêng (K) c甃ऀa một trong 2 ma trận.

Bước 5: Chọn K vector riêng ứng với (λ) gi愃Ā trị riêng lớn nhĀt đऀ x愃Ȁy dựng ma trận Uk, với c愃Āc thành phần chính, tạo thành một không gian con gần với ph愃Ȁn bĀ c甃ऀa dữ liệu ban đầu đã chuẩn hóa.

3.1 Xây dựng c愃Āc b愃ऀn đồ từng thành phần: Ảnh sau xử l礃Ā tiến hành x愃Ȁy dựng c愃Āc bản đồ thành phần theo c愃Āc công thức tính c愃Āc chỉ sĀ NDVI, TVDI, WET, TEM Kết quả x愃Ȁy dựng c愃Āc bản đồ thành phần như sau:

Downloaded by Vu Vu (quangchinhlas199@gmail.com)

Hình 7: B愃ऀn đồ 4 chỉ số NDVI, WET, TVDI, TEM

Bằng c愃Āch tính to愃Ān chỉ sĀ sinh th愃Āi môi trường (RSEI) c甃ऀa bĀn chỉ sĀ NDVI, WET, TVDI, và TEM vào n愃؀m 2021 tại tỉnh Thanh Ho愃Ā, kết hợp sử dụng mô h椃nh ph愃Ȁn tích thành chính (PCA), chĀt lượng sinh th愃Āi dưới t愃Āc động c甃ऀa hoạt động ph愃Āt triऀn kinh tế - xã hội đã được ph愃Ȁn tích.

Kết quả ph愃Ȁn tích thành phần chính c甃ऀa 4 yếu tĀ gồm độ ẩm, nhiệt độ, độ khô hạn và gi愃Ā trị NDVI tại khu vực Thanh Hóa.

Bảng 8: Bảng tổng hợp kết quả tính PCA

Kết quả ph愃Ȁn tích thành phần chính cho thĀy, nhóm thành phần chính PC1 có có thऀ giải thích 73,22% tập dữ liệu, thành phần chính thứ hai PC2 giải thích được 15,78%, thành phần chính thứ ba PC3 giải thích được 7,57% và thành phần chính

Downloaded by Vu Vu (quangchinhlas199@gmail.com) thứ 4 giải thích được 3,43% Như vậy, thành phần chính thứ nhĀt PC1 có khả n愃؀ng giải thích lớn nhĀt c甃ऀa tập dữ liệu (73,22%), nên thành phần chính PC1 được lựa chọn đऀ x愃Āc định chỉ sĀ RSEI, c愃Āc hệ sĀ tải được coi là hệ sĀ tương ứng c甃ऀa từng chỉ tiêu NDVI, WET, TVDI và TEM trong phương tr椃nh (1).

Chỉ sĀ RSEI được tính trên cơ sở kết quả ph愃Ȁn tích thành phần chính và c愃Āc chỉ tiêu độ ẩm, nhiệt độ, độ khô hạn và gi愃Ā trị NDVI theo công thức (1) Cụ thऀ như sau:

RSEI=0,23*NDVI + 0,2*WET – 0,27*TVDI + 0,1*TEM

Hình 8: Kết qu愃ऀ t椃Ānh chỉ số RSEI, tỉnh Thanh Hóa năm 2021

Từ h椃nh 3 cho thĀy, khu vực có chĀt lượng sinh th愃Āi tĀt tập trung ở c愃Āc huyện phía đông bắc khu vực tỉnh Thanh Hóa như Quan Hóa, Mường L愃Āt, Quan Sơn Khu

SỬ DỤNG BỘ DỮ LIỆU ĐỂ PHÂN TÍCH BẰNG PHẦN MỀM R

Giới thiệu mẫu nghiên cứu

1 Giới thiệu bộ dữ liệu.

Bộ dữ liệu “Pokemon.csv” là kết quả tổng hợp thô từ Kaggle cung cĀp thông tin về c愃Āc loại Pok攃Āmon (Nguồn dữ liệu lĀy từ nhiều trang web bao gồm:

Pok攃Āmon.com, Pok攃Āmondb, bulbapedia).

Bộ dữ liệu này bao gồm 898 Pok攃Āmon, với 1072 dạng thay thế.

Từ những thông tin thô, nghiên cứu ph愃Ȁn tích c愃Āc thuộc tính và thông sĀ chiến đĀu c甃ऀa c愃Āc loại Pok攃Āmon kh愃Āc nhau đऀ hiऀu rõ hơn về đặc điऀm và sức mạnh c甃ऀa chúng Đồng thời, ảnh hưởng c甃ऀa loại Pok攃Āmon trong việc x愃Ȁy dựng và triऀn khai chiến thuật chiến đĀu trong tr漃 chơi Pok攃Āmon.

Downloaded by Vu Vu (quangchinhlas199@gmail.com)

Bộ dữ liệu gồm 13 biến, trong đó có 1 biến chứa sĀ thứ tự, 5 biến trả lời về tên, ph愃Ȁn loại nhóm thuộc tính và 7 biến là thông tin sĀ liệu chiến đĀu trong tr漃 chơi tương ứng với 7 biến được nhóm lựa chọn đऀ ph愃Ȁn tích PCA.

Bảng 9: Giải thích biến hp (health points) Lượng m愃Āu c甃ऀa Pok攃Āmon. attack Sức mạnh tĀn công c甃ऀa Pok攃Āmon. defense Sức mạnh ph漃ng th甃ऀ c甃ऀa Pok攃Āmon. sp_attack Sức mạnh tĀn công đặc biệt c甃ऀa Pok攃Āmon. sp_defense Sức mạnh ph漃ng th甃ऀ đặc biệt c甃ऀa Pok攃Āmon. speed TĀc độ c甃ऀa Pok攃Āmon generation Thế hệ mà Pok攃Āmon thuộc về.

Phân tích thành phần chính (PCA)

1.1 Ma trận hệ số t甃ᬀơng quan

Mục đích: xem x攃Āt hệ sĀ tương quan giữa 2 biến nhằm loại bỏ sự t愃Āc động bên ngoài c甃ऀa c愃Āc biến đưa vào Nếu biến đó có độ tương quan cao với c愃Āc biến kh愃Āc (hay

>0.3) th椃 có thऀ đưa vào ph愃Ȁn tích tiếp.

Bảng 10: Ma trận hệ số tương quan sau khi chuẩn hóa covariance_matrix 0.3 nên c愃Āc biến có đ甃ऀ điều kiện đऀ tiếp tục ph愃Ȁn tích PC.

Sử dụng kiऀm định Bartlett đऀ kiऀm định với mức 礃Ā nghĩa 5%, ma trận hệ sĀ tương quan có phải là ma trận đơn vị không Ta có cặp giải thuyết sau:

H0: Không có sự tương quan giữa c愃Āc biến/ ma trận hệ sĀ tương quan là ma trận đơn vị

H1: Có sự tương quan giữa c愃Āc biến/ ma trận hệ sĀ tương quan không là ma trận đơn vị cortest.bartlett(pkm)

Hình 9: Kết qu愃ऀ c甃ऀa kiऀm đ椃⌀nh Bartlett

Kết luận: Với mức 礃Ā nghĩa 5%, p.value = 0 < 0.05 => Đ甃ऀ cơ sở b愃Āc bỏ H0 Ta có thऀ

愃Āp dụng phương ph愃Āp ph愃Ȁn tích thành phần chính

Hệ sĀ KMO là cơ sở kiऀm tra hệ sĀ tương quan riêng phần c甃ऀa c愃Āc cặp biến khi có sự t愃Āc động c甃ऀa c愃Āc biến kh愃Āc

Downloaded by Vu Vu (quangchinhlas199@gmail.com)

Hệ sĀ KMO chung là: 0.62 >0.5 => M̀u phù hợp ph愃Ȁn tích PCA.

Hệ sĀ KMO c甃ऀa từng biến đều lớn hơn 0.5 do đó c愃Āc biến đều phù hợp đऀ đưa vào ph愃Ȁn tích PCA.

2 Bước 2: Xác định các thành phần chính

 Eigenvalue: gi愃Ā trị riêng, phản 愃Ānh phương sai c甃ऀa thành phần chính Gi愃Ā trị tổng phương sai mô tả độ ph愃Ȁn t愃Ān chung c甃ऀa c愃Āc biến ng̀u nhiên quanh c愃Āc gi愃Ā trị trung b椃nh c甃ऀa chúng.

 Tổng c愃Āc gi愃Ā trị riêng sẽ bằng tổng c愃Āc gi愃Ā trị trên đường ch攃Āo c甃ऀa ma trận dữ liệu đầu vào PCA. pca.pkm p=7 => tổng phương sai là 7

∑variance = 2.726 + 1.122 + 0.995 + 0.794 + 0.670 + 0.435 + 0.257 = 6.999 ≈ 7 = p ∑λj => Ma trận đầu vào là ma trận hệ sĀ tương quan và có 7 PC.

 PC thứ nhĀt giải thích được 38.941% dữ liệu ban đầu

 PC thứ 2 giải thích được 16.027% dữ liệu ban đầu

 PC thứ 3 giải thích được 14.220% dữ liệu ban đầu

 PC thứ 4 giải thích được 11.350% dữ liệu ban đầu

Downloaded by Vu Vu (quangchinhlas199@gmail.com)

 PC thứ 5 giải thích được 9.575% dữ liệu ban đầu

 PC thứ 6 giải thích được 6.212% dữ liệu ban đầu

 PC thứ 7 giải thích được 3.676% dữ liệu ban đầu

2.2 X愃Āc đ椃⌀nh số thành phần chính giữ lại

Cách 1: Dựa vào tỉ lệ phần tr愃؀m biến thiên c甃ऀa dữ liệu ban đầu được giải thích bởi c愃Āc thành phần chính.

Kết luận: Từ bảng 12, % of var cộng dồn c甃ऀa Dim1 và Dim2 là 54,698% > 50%

Dim1 và Dim2 giải thích được 54,698% sự biến thiên c甃ऀa dữ liệu ban đầu

Cách 2: Gi愃Ā trị riêng c甃ऀa c愃Āc thành phần chính > gi愃Ā trị riêng trung b椃nh.

Kết luận: Từ bảng 12 ta thĀy:

 Variance c甃ऀa Dim1 là 2.726 và Dim2 là 1.122 đều lớn hơn 1 => có thऀ giữ lại

 Variance từ Dim 3 là 0.995 tuy nhỏ hơn 1 nhưng rĀt gần 1, có thऀ xem x攃Āt giữ lại.

 Variance từ Dim 4 trở đi đều b攃Ā hơn 1 => loại

C愃Āch 3: Biऀu đồ khuỷu tay (Scree Plot) fviz_eig(pca.pkm, addlabels = TRUE, ylim = c(0, 50))

Downloaded by Vu Vu (quangchinhlas199@gmail.com)

Hình 10: Biऀu đồ khuỷu tay

Kết luận: Từ biऀu đồ ta có thऀ giữ lại Dim1, Dim2 v椃 tạo độ dĀc kh愃Āc biệt.

Kết hợp 3 phương ph愃Āp ta thĀy rằng có thऀ giữ lại Dim 1,2

2.3 Đ愃Ānh gi愃Ā chất l甃ᬀợng biểu diễn của biến phân tích

- Tổng hệ sĀ x愃Āc định c甃ऀa một biến với c愃Āc thành phần chính được giữ lại (Communality) c甃ऀa từng biến cho biết bao nhiêu phần tr愃؀m biến thiên c甃ऀa biến đó được giải thích bởi hai thành phần chính được giữ lại.

Downloaded by Vu Vu (quangchinhlas199@gmail.com)

- Tương quan c甃ऀa c愃Āc biến với c愃Āc PC là lớn, tỉ lệ % biến được giải thích bởi c愃Āc PC là tĀt khi gi愃Ā trị Communality c甃ऀa từng biến lớn hơn 0.3.

(Giá tr椃⌀ Communality = ∑ R2 theo dòng)

Biến Gi愃Ā trị Communality hp (Hit Points)

0.470 attack 0.526 defense 0.756 sp_attack 0.648 sp_defense 0.586 speed 0.788 generation 0.074

Ta thĀy, Communality c甃ऀa hầu hết c愃Āc biến đều cao và tĀt cả đều lớn hơn 0.3

Communality c甃ऀa biến generation rĀt thĀp (0.07

Ngày đăng: 27/05/2024, 15:36

HÌNH ẢNH LIÊN QUAN

Bảng 1: Ký hiệu các mẫu nước ép gấc-chanh dây được đánh giá cảm quan trong thí nghiệm (với lượng gấc cố định 150 g) - phân tích thành phần chính pca bài tập lớn môn phân tích dữ liệu
Bảng 1 Ký hiệu các mẫu nước ép gấc-chanh dây được đánh giá cảm quan trong thí nghiệm (với lượng gấc cố định 150 g) (Trang 10)
Bảng 2: Trọng số của các thành phần - phân tích thành phần chính pca bài tập lớn môn phân tích dữ liệu
Bảng 2 Trọng số của các thành phần (Trang 13)
Hình 1: Giá tr椃⌀ ri攃Ȁng (Eigenvalue) và phần trăm t椃Āch l甃̀y c甃ऀa phư漃ᬀng sai (cumulative variability %)c甃ऀa các thành phần biऀu di̀n theo Scree plot - phân tích thành phần chính pca bài tập lớn môn phân tích dữ liệu
Hình 1 Giá tr椃⌀ ri攃Ȁng (Eigenvalue) và phần trăm t椃Āch l甃̀y c甃ऀa phư漃ᬀng sai (cumulative variability %)c甃ऀa các thành phần biऀu di̀n theo Scree plot (Trang 13)
Hình 2: Sự ph愃Ȁn bố các thuộc t椃Ānh c愃ऀm quan theo kết qu愃ऀ đánh giá c甃ऀa c愃ऀm quan vi攃Ȁn - phân tích thành phần chính pca bài tập lớn môn phân tích dữ liệu
Hình 2 Sự ph愃Ȁn bố các thuộc t椃Ānh c愃ऀm quan theo kết qu愃ऀ đánh giá c甃ऀa c愃ऀm quan vi攃Ȁn (Trang 14)
Hình 3: Sự ph愃Ȁn bố c甃ऀa các m̀u nước gĀc-chanh d愃Ȁy và các thuộc t椃Ānh c愃ऀm quan tr攃Ȁn c甃ng mặt phẳng tư漃ᬀng quan giữa thành phần ch椃Ānh thứ 1 và thứ 2 - phân tích thành phần chính pca bài tập lớn môn phân tích dữ liệu
Hình 3 Sự ph愃Ȁn bố c甃ऀa các m̀u nước gĀc-chanh d愃Ȁy và các thuộc t椃Ānh c愃ऀm quan tr攃Ȁn c甃ng mặt phẳng tư漃ᬀng quan giữa thành phần ch椃Ānh thứ 1 và thứ 2 (Trang 14)
Bảng 4: Kiểm định Likelihood (Likelihood Ratio Tests) của phương tr椃nh (5) - phân tích thành phần chính pca bài tập lớn môn phân tích dữ liệu
Bảng 4 Kiểm định Likelihood (Likelihood Ratio Tests) của phương tr椃nh (5) (Trang 16)
Bảng 5: Phân tích độ sai lệch (Analysis of Deviance) của phương tr椃nh (6) - phân tích thành phần chính pca bài tập lớn môn phân tích dữ liệu
Bảng 5 Phân tích độ sai lệch (Analysis of Deviance) của phương tr椃nh (6) (Trang 17)
Hình 4: Tư漃ᬀng quan giữa tỷ số odd với khối lượng d椃⌀ch qu愃ऀ và tỷ lệ pha loãng - phân tích thành phần chính pca bài tập lớn môn phân tích dữ liệu
Hình 4 Tư漃ᬀng quan giữa tỷ số odd với khối lượng d椃⌀ch qu愃ऀ và tỷ lệ pha loãng (Trang 18)
Hình 5c: Biऀu đồ Scree plot thऀ hiện phần  trăm phư漃ᬀng sai mà các thành phần ch椃Ānh gi愃ऀi th椃Āch bộ dữ liệu - phân tích thành phần chính pca bài tập lớn môn phân tích dữ liệu
Hình 5c Biऀu đồ Scree plot thऀ hiện phần trăm phư漃ᬀng sai mà các thành phần ch椃Ānh gi愃ऀi th椃Āch bộ dữ liệu (Trang 21)
Hình 5e: Biऀu đồ dự báo xu hướng biến đổi c甃ऀa các hình dạng vi nhựa theo PC1 và PC2. - phân tích thành phần chính pca bài tập lớn môn phân tích dữ liệu
Hình 5e Biऀu đồ dự báo xu hướng biến đổi c甃ऀa các hình dạng vi nhựa theo PC1 và PC2 (Trang 22)
Hình 6d: Biऀu đồ tư漃ᬀng quan đa biến các  hình dạng c甃ऀa vi nhựa được tìm thĀy - phân tích thành phần chính pca bài tập lớn môn phân tích dữ liệu
Hình 6d Biऀu đồ tư漃ᬀng quan đa biến các hình dạng c甃ऀa vi nhựa được tìm thĀy (Trang 23)
Hình 6a: Kết qu愃ऀ ph愃Ȁn t椃Āch PCA c甃ऀa R Hình 6b: Kết qu愃ऀ trình di̀n hệ số tư漃ᬀng  quan và giá tr椃⌀ PValue c甃ऀa các hình dạng  vi nhựa từ R - phân tích thành phần chính pca bài tập lớn môn phân tích dữ liệu
Hình 6a Kết qu愃ऀ ph愃Ȁn t椃Āch PCA c甃ऀa R Hình 6b: Kết qu愃ऀ trình di̀n hệ số tư漃ᬀng quan và giá tr椃⌀ PValue c甃ऀa các hình dạng vi nhựa từ R (Trang 23)
Hình 6c: Biऀu đồ Scree plot thऀ hiện phần  trăm phư漃ᬀng sai mà các thành phần ch椃Ānh gi愃ऀi th椃Āch bộ dữ liệu - phân tích thành phần chính pca bài tập lớn môn phân tích dữ liệu
Hình 6c Biऀu đồ Scree plot thऀ hiện phần trăm phư漃ᬀng sai mà các thành phần ch椃Ānh gi愃ऀi th椃Āch bộ dữ liệu (Trang 23)
Hình 6e: Biऀu đồ dự báo xu hướng biến đổi c甃ऀa các hình dạng vi nhựa theo PC1 và PC2. - phân tích thành phần chính pca bài tập lớn môn phân tích dữ liệu
Hình 6e Biऀu đồ dự báo xu hướng biến đổi c甃ऀa các hình dạng vi nhựa theo PC1 và PC2 (Trang 24)
Bảng 7: Mức đánh giá theo chỉ số RSEI - phân tích thành phần chính pca bài tập lớn môn phân tích dữ liệu
Bảng 7 Mức đánh giá theo chỉ số RSEI (Trang 27)
Hình 7: B愃ऀn đồ 4 chỉ số NDVI, WET, TVDI, TEM - phân tích thành phần chính pca bài tập lớn môn phân tích dữ liệu
Hình 7 B愃ऀn đồ 4 chỉ số NDVI, WET, TVDI, TEM (Trang 29)
Bảng 8: Bảng tổng hợp kết quả tính PCA - phân tích thành phần chính pca bài tập lớn môn phân tích dữ liệu
Bảng 8 Bảng tổng hợp kết quả tính PCA (Trang 29)
Hình 8: Kết qu愃ऀ t椃Ānh chỉ số RSEI, tỉnh Thanh Hóa năm 2021 - phân tích thành phần chính pca bài tập lớn môn phân tích dữ liệu
Hình 8 Kết qu愃ऀ t椃Ānh chỉ số RSEI, tỉnh Thanh Hóa năm 2021 (Trang 30)
Bảng 10: Ma trận hệ số tương quan sau khi chuẩn hóa - phân tích thành phần chính pca bài tập lớn môn phân tích dữ liệu
Bảng 10 Ma trận hệ số tương quan sau khi chuẩn hóa (Trang 33)
Bảng 9: Giải thích biến - phân tích thành phần chính pca bài tập lớn môn phân tích dữ liệu
Bảng 9 Giải thích biến (Trang 33)
Hình 10: Biऀu đồ khuỷu tay - phân tích thành phần chính pca bài tập lớn môn phân tích dữ liệu
Hình 10 Biऀu đồ khuỷu tay (Trang 37)
Bảng 13: Variables - phân tích thành phần chính pca bài tập lớn môn phân tích dữ liệu
Bảng 13 Variables (Trang 37)
Bảng 14: Communality - phân tích thành phần chính pca bài tập lớn môn phân tích dữ liệu
Bảng 14 Communality (Trang 38)
Hình 12: Đồ th椃⌀ so sánh mức đóng góp trung bình các biến trong Dim 2 Kết luận: sp_defense, sp_attack, attack, hp thuộc Dim1 - phân tích thành phần chính pca bài tập lớn môn phân tích dữ liệu
Hình 12 Đồ th椃⌀ so sánh mức đóng góp trung bình các biến trong Dim 2 Kết luận: sp_defense, sp_attack, attack, hp thuộc Dim1 (Trang 39)
Hình 11: Đồ th椃⌀ so sánh mức đóng góp trung bình các biến trong Dim 1 - phân tích thành phần chính pca bài tập lớn môn phân tích dữ liệu
Hình 11 Đồ th椃⌀ so sánh mức đóng góp trung bình các biến trong Dim 1 (Trang 39)
Bảng 15: Giải thích thành phần chính PC và các biến phụ thuộc - phân tích thành phần chính pca bài tập lớn môn phân tích dữ liệu
Bảng 15 Giải thích thành phần chính PC và các biến phụ thuộc (Trang 40)
4.3. Đồ thị ph愃Ȁn t愃Ān trong không gian mới - phân tích thành phần chính pca bài tập lớn môn phân tích dữ liệu
4.3. Đồ thị ph愃Ȁn t愃Ān trong không gian mới (Trang 40)
Hình 13: Đồ th椃⌀ ph愃Ȁn tán tr攃Ȁn 2 trục PC - phân tích thành phần chính pca bài tập lớn môn phân tích dữ liệu
Hình 13 Đồ th椃⌀ ph愃Ȁn tán tr攃Ȁn 2 trục PC (Trang 41)
Hình 14: Đồ th椃⌀ ph愃Ȁn tán tr攃Ȁn 2 trục PC theo thế hệ - phân tích thành phần chính pca bài tập lớn môn phân tích dữ liệu
Hình 14 Đồ th椃⌀ ph愃Ȁn tán tr攃Ȁn 2 trục PC theo thế hệ (Trang 41)

TÀI LIỆU CÙNG NGƯỜI DÙNG

TÀI LIỆU LIÊN QUAN

w