1. Trang chủ
  2. » Giáo Dục - Đào Tạo

phân tích thành phần chính pca bài tập lớn môn phân tích dữ liệu

42 0 0
Tài liệu đã được kiểm tra trùng lặp

Đang tải... (xem toàn văn)

Tài liệu hạn chế xem trước, để xem đầy đủ mời bạn chọn Tải xuống

THÔNG TIN TÀI LIỆU

DANH MỤC BẢNGBảng 1: K礃Ā hiệu c愃Āc m̀u nước 攃Āp gĀc-chanh d愃Ȁy được đ愃Ānh gi愃Ā cảm quan trong thí nghiệm với lượng gĀc cĀ định 150 g...10Bảng 2: Trọng sĀ c甃ऀa c愃Āc thành phần.

Trang 1

TRƯỜNG ĐẠI HỌC KINH TẾ QUỐC DÂN ***

BÀI TẬP LỚN Môn: Phân tích dữ liệu

Giảng viên: PGS TS Trần Thị BíchĐỀ

TÀI : PHÂN TÍCH THÀNH PHẦN CHÍNH (PCA)

Thành viên nhóm: Lê Thị Ngọc Ánh – 11210853

Phạm Thúy Hiền – 11212174Bùi Phương Hà – 11211846

Dương Nguyễn Thu Hạ 11216933

Hà Nội, tháng 03 năm 2024

Trang 2

PHẦN 2: PHÂN TÍCH NGHIÊN CỨU 8

I Ứng dụng phương pháp phân tích thành phần chính và hồi quy logistic trong đánh giá cảm quan nước ép gấc – chanh dây 8

1 Lý do chọn đề tài 8

2 Tóm tắt bài nghiên cứu 9

3 Mục tiêu bài nghiên cứu 9

4 Phương tiện và phương pháp nghiên cứu 10

4.1 Chuऀn b椃⌀ m̀u 10

4.1.1 Chuऀn b椃⌀ màng gĀc 10

4.1.2 Chuऀn b椃⌀ d椃⌀ch qu愃ऀ chanh d愃Ȁy 10

4.1.3 Chế biến nước ép gĀc-chanh d愃Ȁy 10

4.2 Đ愃Ānh gi愃Ā c愃ऀm quan n甃ᬀớc 攃Āp h̀n hợp 11

4.2.1 Phư漃ᬀng pháp đánh giá các thuộc t椃Ānh c愃ऀm quan c甃ऀa nước ép gĀc-chanh d愃Ȁy 11

4.2.2 Phư漃ᬀng pháp đánh giá c愃ऀm quan v4.3 Ph甃ᬀơng ph愃Āp phân tích thống kê 11

4.3.1 Ph愃Ȁn t椃Āch thành phần ch椃Ānh (PCA) 11

4.3.2 Ph愃Ȁn t椃Āch hồi quy logistic 11

5 Kết quả và thảo luận 12

5.1 Ảnh h甃ᬀởng của tỷ lệ pha loãng và khối l甃ᬀợng chanh dây bổ sung đến chất l甃ᬀợng c愃ऀm quan s愃ऀn phऀm 12

5.2 Ảnh h甃ᬀởng của tỷ lệ pha loãng và khối l甃ᬀợng chanh dây bổ sung đến kh愃ऀ n愃؀ng chấp nhận của s愃ऀn phऀm 15

6 Kết luận 18

II Ứng dụng thuật toán trên nền tảng ngôn ngữ R để nghiên cứu vi nhựa trong nước mặt lục địa, sông Sài Gòn và sông Đồng Nai 18

2

Trang 3

1 Tóm tắt bài nghiên cứu 18

2 Phạm vi ứng dụng của phương pháp PCA trong bài nghiên cứu 19

2.1 Kết qu愃ऀ phân tích t甃ᬀơng quan và PCA c愃Āc đặc điểm về hình dạng của vi nhựa trong môi tr甃ᬀờng n甃ᬀớc sông Sài Gòn - Đồng Nai trong n愃؀m 2021 19

2.2 Kết qu愃ऀ phân tích t甃ᬀơng quan và PCA c愃Āc đặc điểm về hình dạng của vi nhựa trong môi tr甃ᬀờng n甃ᬀớc sông Sài Gòn - Đồng Nai trong n愃؀m 2022 22

II Đánh giá chất lượng sinh thái cho tỉnh Thanh Hóa trong năm 2021 dựa vào chỉ số sinh thái viễn thám (RSEI) 25

I Giới thiệu mẫu nghiên cứu 32

1 Giới thiệu bộ dữ liệu 32

1.1 Đề tài nghiên cứu 32

1.2 Phạm vi nghiên cứu 32

1.3 Mục đích nghiên cứu 32

2 Mô tả dữ liệu 32

II Phân tích thành phần chính (PCA) 33

1 Bước 1: Lựa chọn biến phân tích 33

1.1 Ma trận hệ số t甃ᬀơng quan 33

1.2 Kiểm đ椃⌀nh Bartlett 34

1.3 Kiểm đ椃⌀nh KMO 34

3

Trang 4

2 Bước 2: Xác định các thành phần chính 35

2.1 X愃Āc đ椃⌀nh số l甃ᬀợng thành phần chính 35

2.2 X愃Āc đ椃⌀nh số thành phần chính giữ lại 36

2.3 Đ愃Ānh gi愃Ā chất l甃ᬀợng biểu diễn của biến phân tích 37

3 Bước 3: Xác định biến nào thuộc thành phần chính nào 38

4 Bước 4: Chuyển dữ liệu sang không gian mới 39

Trang 5

DANH MỤC BẢNG

Bảng 1: K礃Ā hiệu c愃Āc m̀u nước 攃Āp gĀc-chanh d愃Ȁy được đ愃Ānh gi愃Ā cảm quan trong thí

nghiệm (với lượng gĀc cĀ định 150 g) 10

Bảng 2: Trọng sĀ c甃ऀa c愃Āc thành phần 13

Bảng 3: Ph愃Ȁn tích độ sai lệch (Analysis of Deviance) c甃ऀa phương tr椃Bảng 4: Kiऀm định Likelihood (Likelihood Ratio Tests) c甃ऀa phương tr椃Bảng 5: Ph愃Ȁn tích độ sai lệch (Analysis of Deviance) c甃ऀa phương tr椃Bảng 6: Kiऀm định Likelihood (Likelihood Radio Tests) c甃ऀa phương tr椃Bảng 7: Mức đ愃Ānh gi愃Ā theo chỉ sĀ RSEI 27

Bảng 8: Bảng tổng hợp kết quả tính PCA 29

Bảng 15: Giải thích thành phần chính PC và c愃Āc biến phụ thuộc 40

Bảng 16: Nh愃Ȁn sĀ c甃ऀa 10 quan s愃Āt đầu tiên 40

DANH MỤC HÌNHH椃variability %)c甃ऀa c愃Āc thành phần biऀu diễn theo Scree plot 13

H椃 14

H椃cùng mặt phẳng tương quan giữa thành phần chính thứ 1 và thứ 2 14H椃H椃H椃H椃H椃H椃H椃H椃H椃H椃H椃

5

Trang 6

PHẦN 1: TỔNG QUAN VỀ PHÂN TÍCH THÀNH PHẦN CHÍNH1 Khái niệm

Ph愃Ȁn tích thành phần chính (Principal Component Analysis - PCA) là một trong những phương ph愃Āp ph愃Ȁn tích dữ liệu đã chiều được sử dụng trong thĀng kê mục đích làm giảm chiều (giảm sĀ lượng biến) nhưng v̀n giữ lại được nhiều nhĀt c愃Āc thông tin c甃ऀa tập dữ liệu ban đầu

2 Bản chất của phân tích thành phần chính

Thực chĀt việc cô đọng thông tin hay giảm chiều dữ liệu c甃ऀa phương ph愃Āp ph愃Ȁntích thành phần chính là thay thế p biến ban đầu (có quan hệ tương quan với nhau) bằng một sĀ thành phần chính (biến mới) là z (với z < p) Mỗi thành phần chính là tổ hợp tuyến tính c甃ऀa c愃Āc biến ban đầu C愃Āc thành phần chính được x愃Āc định trên cơ sở có mĀi liên hệ tuyến tính cao với c愃Āc biến ban đầu và giữa c愃Āc thành phần chính không tương quan với nhau => được sử dụng như bước tiền xử l礃Ā dữ liệu cho c愃Āc phương ph愃Āp hồi quy bội và ph愃Ȁn cụm dữ liệu.

Đऀ thực hiện giảm chiều, PCA biến đổi tập dữ liệu ban đầu lên một hệ trục tọa độ mới mà c愃Āc trục tọa độ là c愃Āc thành phần chính sao cho mỗi thành phần chính là một hàm hồi quy tuyến tính c甃ऀa c愃Āc biến ban đầu C愃Āc thành phần chính được x愃Āc định trên cơ sở có mĀi liên hệ tương quan cao với c愃Āc biến ban đầu và giữa c愃Āc thành phần chính không tương quan với nhau Thành phần chính đầu tiên sẽ có phương sai lớn nhĀt hay là trục tọa độ mà c愃Āc quan s愃Āt được ph愃Ȁn bĀ tĀi đa (ph愃Ȁn t愃Ān rộng nhĀt) trên trục đó.

3 Mục đích của phân tích thành phần chính

- Giảm chiều dữ liệu: PCA giúp giảm sĀ lượng biến đầu vào c甃ऀa dữ liệu, chuyऀn từ không gian ban đầu sang không gian mới có sĀ chiều (thường ít hơn) mà v̀ngiữ lại được phần lớn thông tin quan trọng từ dữ liệu ban đầu Điều này giúp làm cho dữ liệu trở nên dễ quản l礃Ā hơn và giảm độ phức tạp trong việc ph愃Ȁn tích

6

Trang 7

- Ph愃Āt hiện sự tương quan: PCA giúp ph愃Āt hiện và hiऀu rõ sự tương quan giữa c愃Āc biến Nó t椃là những hướng chứa phần lớn biến thiên trong dữ liệu

- N攃Ān thông tin: PCA cho ph攃Āp biऀu diễn dữ liệu ban đầu dưới dạng tổ hợp tuyếntính c甃ऀa c愃Āc thành phần chính Điều này có nghĩa rằng bạn có thऀ lưu trữ dữ liệu một c愃Āch hiệu quả hơn với ít thông tin hơn, mà v̀n giữ lại được c愃Āc đặc trưng quan trọng

- Loại bỏ nhiễu: PCA có thऀ giúp loại bỏ hoặc giảm nhiễu từ dữ liệu, làm cho dữ liệu trở nên dễ dàng ph愃Ȁn tích và hiऀu hơn

- Visualize dữ liệu: PCA có thऀ được sử dụng đऀ biऀu diễn dữ liệu nhiều chiều trong không gian hai hoặc ba chiều đऀ dễ dàng trực quan hóa dữ liệu

- Tạo c愃Āc biến mới không tương quan (orthogonal): C愃Āc thành phần chính sau khi trích xuĀt từ PCA là không tương quan với nhau, điều này có thऀ giúp trongviệc loại bỏ tương quan giữa biến đầu vào trong c愃Āc mô h椃

=> Tóm lại, PCA là một công cụ mạnh mẽ trong ph愃Ȁn tích dữ liệu, giúp tiết kiệm thời gian và tạo ra biऀu đồ hoặc biऀu đồ giúp hiऀu rõ hơn về mĀi quan hệ và đặc điऀm quantrọng trong dữ liệu

7

Trang 8

PHẦN 2: PHÂN TÍCH NGHIÊN CỨU

I Ứng dụng phương pháp phân tích thành phần chính và hồi quy logistic trong đánh giá cảm quan nước ép gấc – chanh dây

1 Lý do chọn đề tài

Sản xuĀt nước 攃Āp tr愃Āi c愃Ȁy ngày càng trở nên quan trọng đĀi với thị trường trong nước do nhu cầu sử dụng sản phẩm tiện lợi và bổ dưỡng Nước 攃Āp gĀc-chanh d愃Ȁy kết hợp sẽ làm t愃؀ng gi愃Ā trị dinh dưỡng và cải thiện mùi vị thơm ngon cho sản phẩm Tuy vậy, sản phẩm cần có thêm c愃Āc bước nghiên cứu về đ愃Ānh gi愃Ā cảm quan c甃ऀa người tiêu dùng đऀ x愃Āc nhận kết quả c甃ऀa nghiên cứu này và đảm bảo tiềm n愃؀ng c甃ऀa sản phẩm mới trên thị trường

Ph愃Ȁn tích cảm quan cung cĀp cho c愃Āc nhà tiếp thị hiऀu về chĀt lượng sản phẩm thực phẩm, hướng đến chĀt lượng sản phẩm tĀt và cải tiến sản phẩm theo quan điऀm c甃ऀa người tiêu dùng (Lawless and Heymann, 1998) Phương ph愃Āp ph愃Ȁn tích thành phần chính (PCA) đã được sử dụng và xem x攃Āt bởi c愃Āc nhà nghiên cứu cho c愃Āc ứng dụng đ愃Ānh gi愃Ā cảm quan cho c愃Āc sản phẩm thực phẩm kh愃Āc nhau PCA có thऀ được 愃Āpdụng cho việc điều tra dữ liệu ưa thích, do đó có thऀ tạo ra một không gian sản phẩm-

người tiêu dùng dựa trên dữ liệu chĀp nhận (Hough et al., 1992; Greenhooff and

McFie, 1994) Đ愃Ȁy c甃̀ng là một công cụ đऀ miêu tả sự kh愃Āc biệt giữa c愃Āc thuộc tính cảm quan c甃ऀa c愃Āc sản phẩm thực phẩm (Powers, 1984) MĀi quan hệ giữa người tiêu dùng và dữ liệu mô tả, c甃̀ng như dữ liệu thu nhận từ cảm quan và dụng cụ đo có thऀ được h椃h椃

Ngoài ra, c愃Āc mô h椃tĀ dự b愃Āo (c愃Āc biến độc lập) lên biến nhị ph愃Ȁn (biến phụ thuộc) thऀ hiện kết quả chĀp nhận hoặc không chĀp nhận c甃ऀa người tiêu dùng (Agresti, 1996) Kết quả từ hồi quy logistic có thऀ được giải thích bằng c愃Āch sử dụng ước tính x愃Āc suĀt hoặc tỷ sĀ khả dĩ ước tính Hồi quy logistic có thऀ dự đo愃Ān x愃Āc suĀt ước tính rằng một sự kiện sẽ thành

công hoặc thĀt bại dựa trên một sĀ dự b愃Āo (biến độc lập) (Hair et al., 1998) Nếu x愃Āc

suĀt dự đo愃Ān lớn hơn 0,5 th椃1996) Nói c愃Āch kh愃Āc, x愃Āc suĀt thành công hay thĀt bại c甃ऀa biến phụ thuộc không bị

8

Trang 9

ảnh hưởng bởi biến độc lập Tỷ sĀ odd có gi愃Ā trị 愃Ȁm cho thĀy sự suy giảm trong x愃Āc

suĀt thành công, và tỷ sĀ odd dương cho thĀy khả n愃؀ng thành công t愃؀ng lên (Hair et

al., 1998) Phương ph愃Āp hồi quy logistic đã được 愃Āp dụng trong một vài trường hợp

trong lãnh vực đ愃Ānh gi愃Ā cảm quan

2 Tóm tắt bài nghiên cứu

Trong nghiên cứu này, c愃Āc cảm quan viên được đào tạo đऀ đ愃Ānh gi愃Ā c愃Āc thuộc tính kh愃Āc nhau c甃ऀa sản phẩm nước 攃Āp gĀc-chanh d愃Ȁy Hàm lượng dịch chanh d愃Ȁy sử dụng từ 50-200 g (150 g gĀc) và tỷ lệ pha loãng tổng c愃Āc thành phần (gĀc và chanh d愃Ȁy) vớinước (1:8 đến 1:15) Ph愃Ȁn tích thành phần chính (PCA) x愃Āc định hai thành phần chính ch甃ऀ yếu chiếm 80,43% phương sai trong dữ liệu thuộc tính cảm quan PCA cho thĀy thuộc tính cảm quan quan trọng c甃ऀa nước 攃Āp này là hương vị, màu sắc và độ đồng nhĀt Khả n愃؀ng chĀp nhận chung c甃ऀa sản phẩm được mô phỏng (ph愃Ȁn tích hồi quy logistic) như một hàm c甃ऀa hàm lượng dịch quả chanh d愃Ȁy và tỷ lệ pha loãng c甃ऀa nước trong sản phẩm MĀi quan hệ thĀng kê quan trọng giữa c愃Āc biến được x愃Āc định

(P<0,05) Tỷ lệ pha loãng với nước 1:8 và hàm lượng gĀc:chanh d愃Ȁy là 150:130-150 (g/g), tương ứng cho sản phẩm có gi愃Ā trị cảm quan và hợp chĀt sinh học cao nhĀt Kết quả c甃̀ng cho thĀy tính hữu ích c甃ऀa PCA và ph愃Ȁn tích hồi quy logistic đऀ x愃Āc định và đo lường c愃Āc thuộc tính sản phẩm nước 攃Āp gĀc-chanh d愃Ȁy có 礃Ā nghĩa quan trọng đĀi với sự chĀp nhận và ưa thích c甃ऀa người tiêu dùng

3 Mục tiêu bài nghiên cứu

Mục tiêu c甃ऀa nghiên cứu này là 愃Āp dụng phương ph愃Āp ph愃Ȁn tích thành phần chính (PCA) và phương ph愃Āp hồi quy Logistic đऀ mô tả c愃Āc thuộc tính cảm quan c甃ऀa nước 攃Āp gĀc-chanh d愃Ȁy được chuẩn bị với sự kết hợp c甃ऀa c愃Āc hàm lượng thay đổi (so với gĀc) và tỷ lệ pha loãng với nước đऀ chọn ra sản phẩm có gi愃Ā trị cảm quan cao và phù hợp với sở thích c甃ऀa người tiêu dùng

9

Trang 10

4 Phương tiện và phương pháp nghiên cứu

4.1 Chuऀn b椃⌀ m̀u

Tr愃Āi gĀc chín được thu nhận, rửa sạch với nước và đऀ r愃Āo Màng gĀc được t愃Āch

ra (Nguyễn Minh Th甃ऀy và ctv., 2009) và được đóng gói sẵn trong bao b椃

trong t甃ऀ đông (ToC≤ –18oC) cho đến khi sử dụng

Tr愃Āi chanh d愃Ȁy được rửa sạch sau khi thu nhận, đऀ r愃Āo và bổ đôi quả, t愃Āch phần thịt và hạt trong quả 䔃Āp lĀy phần dịch quả và lọc sạch nhằm loại c愃Āc màng và xơ l̀n vào

4.1.3 Chế biến nước ép gĀc-chanh d愃Ȁy

Màng gĀc được c愃Ȁn định lượng 150 g, sau đó phĀi trộn với dịch quả chanh d愃Ȁy với c愃Āc khĀi lượng lần lượt như sau: 50, 100, 150, 200 g Xay mịn phần nguyên liệu đã phĀi trộn với c愃Āc tỷ lệ nước 1:8; 1:10; 1:12,5 và 1:15[tổng khĀi lượng nguyên liệu (g):nước (mL)] và lọc sạch phần hỗn hợp thu được Phần dịch hỗn hợp sau lọc được chỉnh độ Brix đến 7,5 Sau đó, thực hiện đồng hóa m̀u (GJB30-40, China), 愃Āp suĀt 30MPa trong 6 phút Sau đó, dịch quả (gĀc và chanh d愃Ȁy) được gia nhiệt ở nhiệt độ 100oC trong thời gian 5 phút Sản phẩm được tồn trữ lạnh 2 ngày trước khi đ愃Ānh gi愃Ā cảm quan và được k礃Ā hiệu (Bảng 1).

Bảng 1: Ký hiệu các mẫu nước ép gấc-chanh dây được đánh giá cảm quan trongthí nghiệm (với lượng gấc cố định 150 g)

10

Trang 11

4.2 Đ愃Ānh gi愃Ā c愃ऀm quan n甃ᬀớc 攃Āp h̀n hợp

Mười cảm quan viên được huĀn luyện tại Bộ môn Công nghệ thực phẩm, Trường Đại học Cần Thơ đऀ đ愃Ānh gi愃Ā c愃Āc m̀u nước 攃Āp gĀc–chanh d愃Ȁy C愃Āc cảm quan viên được hướng d̀n đ愃Ānh gi愃Ā sản phẩm nước 攃Āp với mức độ ưa thích theo cường độ mô tả về mùi, vị, màu sắc và trạng th愃Āi [điऀm từ 1 đến 5 theo thang điऀm c甃ऀa phương ph愃Āp ph愃Ȁn tích mô tả định lượng QDA (Quantitave Descriptive Analysis) được thiết lập)]

Khả n愃؀ng chĀp nhận sản phẩm được đ愃Ānh gi愃Ā sử dụng thang nhị thức

(có/không) theo phương ph愃Āp Garcia et al (2009) SĀ lượng cảm quan viên là 50

4.3.2 Ph愃Ȁn t椃Āch hồi quy logistic

Phương tr椃gi愃Ā trị β là 0 (không chĀp nhận) hoặc 1 (chĀp nhận) được thu nhận từ kết quả đ愃Ānh gi愃Ā cảm quan c甃ऀa người tiêu dùng

11

Trang 12

5 Kết quả và thảo luận

5.1 Ảnh h甃ᬀởng của tỷ lệ pha loãng và khối l甃ᬀợng chanh dây bổ sung đến chất l甃ᬀợng c愃ऀm quan s愃ऀn phऀm

Sản phẩm nước 攃Āp gĀc - chanh d愃Ȁy được đ愃Ānh gi愃Ā cảm quan dựa trên c愃Āc thuộc tính như: màu đỏ cam, mùi gĀc, mùi chanh d愃Ȁy, vị ngọt, vị chua, trạng th愃Āi đồng nhĀt và độ s愃Ānh theo phương ph愃Āp mô tả định lượng QDA, ph愃Ȁn tích thành phần chính (PCA) và ph愃Ȁn tích khả n愃؀ng chĀp nhận c甃ऀa người tiêu dùng theo phương ph愃Āp logistic.

Phương ph愃Āp ph愃Ȁn tích thành phần chính nhằm x愃Āc định sĀ lượng thành phần chính (7 thuộc tính cảm quan c甃ऀa sản phẩm nước 攃Āp gĀc–chanh d愃Ȁy) cần thiết đऀ biऀu diễn dữ liệu “Scree plot” thऀ hiện thứ tự giảm dần về độ lớn c甃ऀa c愃Āc gi愃Ā trị riêng (Eigenvalue) và gi愃Ā trị phần tr愃؀m tích l甃̀y c甃ऀa phương sai Trong phương diện ph愃Ȁn tích nh愃Ȁn tĀ hoặc ph愃Ȁn tích thành phần ch甃ऀ yếu, “Scree plot” giúp cho nhà ph愃Ȁn tích h椃

phải mô tả được ít nhĀt 80% phần tr愃؀m tích l甃̀y c甃ऀa phương sai (Shi et al., 2002)

Trong trường hợp này, hai thành phần 1 và 2 (F1 và F2) có gi愃Ā trị riêng lớn hơn 1 và chiếm 80,43% phần tr愃؀m tích l甃̀y phương sai (H椃và F4) có t愃Āc động rĀt nhỏ so với biến, có thऀ nhận biết qua đường cong tích l甃̀y phương sai không có sự thay đổi nhiều Bên cạnh đó, có sự giảm mạnh độ lớn c甃ऀa gi愃Ā trị riêng thành phần thứ 3 và thứ 4 (F3 và F4) Độ lớn c甃ऀa thành phần thứ 3 đến thứ 7 (F3 đến F7) rĀt nhỏ so với thành phần thứ 1 và thứ 2 (F1 và F2), do đó không cần sử dụng c愃Āc thành phần từ thành phần thứ 3 (F3) trở đi đऀ tr椃quan đã thu thập

Downloaded by Vu Vu (quangchinhlas199@gmail.com)

Trang 13

Hình 1: Giá tr椃⌀ ri攃Ȁng (Eigenvalue) và phần trăm t椃Āch l甃̀y c甃ऀa phư漃ᬀng sai (cumulativevariability %)c甃ऀa các thành phần biऀu di̀n theo Scree plot

Ma trận thऀ hiện tương t愃Āc giữa c愃Āc thuộc tính cảm quan và c愃Āc thành phần được thऀ hiện ở Bảng 2

Trang 14

Hình 2: Sự ph愃Ȁn bố các thuộc t椃Ānh c愃ऀm quan theo kết qu愃ऀ đánh giá c甃ऀa c愃ऀm quanvi攃Ȁn

Dựa vào sự ph愃Ȁn bĀ c愃Āc thuộc tính cảm quan, có thऀ chia c愃Āc thuộc tính này thành 2 vùng riêng biệt Thuộc tính độ đồng nhĀt nằm xa trục F1 (thành phần chính thứ nhĀt) nên thuộc tính này ít có ảnh hưởng đến thành phần chính thứ nhĀt Thuộc tính mùi chanh d愃Ȁy nằm cạnh trục F2 (thành phần chính thứ 2) nên thành phần chính thứ 2 phụ thuộc nhiều vào thuộc tính mùi chanh d愃Ȁy Ngoài ra, c愃Āc thuộc tính như mùigĀc, mùi chanh d愃Ȁy, độ s愃Ānh và màu đỏ cam gần trục F1 Như vậy, thành phần chính thứ 1 chịu ảnh hưởng nhiều nhĀt bởi thuộc tính mùi gĀc, mùi chanh d愃Ȁy và độ s愃Ānh Bên cạnh đó, c愃Āc thuộc tính nằm gần nhau có mĀi liên hệ thuận với nhau (như thuộc tính mùi gĀc và mùi chanh d愃Ȁy), nhóm thuộc tính nằm kh愃Āc phía nhau (180o) có mĀi liên hệ nghịch đảo với nhau và c愃Āc thuộc tính nằm c愃Āch nhau 90o th椃

với nhau (Ca渃̀eque et al., 2004)

Hình 3: Sự ph愃Ȁn bố c甃ऀa các m̀u nước gĀc-chanh d愃Ȁy và các thuộc t椃Ānh c愃ऀm quantr攃Ȁn c甃

Downloaded by Vu Vu (quangchinhlas199@gmail.com)

Trang 15

Khi thऀ hiện c愃Āc m̀u nước 攃Āp gĀc-chanh d愃Ȁy và c愃Āc thuộc tính cảm quan trên đồ thị, c愃Āc m̀u nước 攃Āp gĀc-chanh d愃Ȁy có vị trí gần nhau th椃tương tự nhau Sự ph愃Ȁn t愃Ān m̀u trên đồ thị H椃với c愃Āc mức khĀi lượng dịch quả chanh d愃Ȁy bổ sung kh愃Āc nhau có ảnh hưởng rĀt lớn đĀi với tính chĀt cảm quan c甃ऀa sản phẩm Nhóm m̀u có khĀi lượng dịch chanh d愃Ȁy bổsung 50g được đ愃Ānh gi愃Ā là có độ s愃Ānh cao, không có vị ngọt hay vị chua Đ愃Ȁy là nhómm̀u có tỷ lệ phĀi chế với hàm lượng gĀc cao hơn hàm lượng chanh d愃Ȁy rĀt nhiều Nhóm c愃Āc m̀u có lượng dịch chanh d愃Ȁy phĀi chế là 150g là nhóm được đ愃Ānh gi愃Ā có vịchua ngọt hài h漃sản phẩm được c愃Āc cảm quan viên ưa thích

5.2 Ảnh h甃ᬀởng của tỷ lệ pha loãng và khối l甃ᬀợng chanh dây bổ sung đến kh愃ऀ n愃؀ngchấp nhận của s愃ऀn phऀm

Phương ph愃Āp ph愃Ȁn tích khả dĩ (Logistic) đ愃Ānh gi愃Ā khả n愃؀ng chĀp nhận (1) hay không chĀp nhận (0) c甃ऀa người tiêu dùng đĀi với sản phẩm ở c愃Āc khĀi lượng dịch quả chanh d愃Ȁy và tỷ lệ nước phĀi chế kh愃Āc nhau Từ gi愃Ā trị cảm quan c甃ऀa sản phẩm với nhiều thuộc tính sẽ đ愃Ānh gi愃Ā được khả n愃؀ng chĀp nhận sản phẩm c甃ऀa người tiêu dùng Kết quả thĀng kê cho thĀy có thऀ x愃Ȁy dựng tĀt mô h椃tương quan giữa tỷ sĀ khả dĩ và 2 biến độc lập (tỷ lệ pha loãng và khĀi lượng dịch chanh d愃Ȁy phĀi chế) Phương tr椃

Tỷ sĀ khả dĩ = exp(η )

¿ ¿ (4)

Với X: là khĀi lượng dịch quả chanh d愃Ȁy phĀi chế (g) Y: là tỷ lệ pha loãng với nước

Phần tr愃؀m độ sai lệch c甃ऀa mô h椃chỉnh (Adjusted percentage) là 7,35%

Gi愃Ā trị độ sai lệch c甃ऀa mô h椃

Bảng 3: Phân tích độ sai lệch (Analysis of Deviance) của phương tr椃

Downloaded by Vu Vu (quangchinhlas199@gmail.com)

Trang 16

Kết quả cho thĀy Deviance c甃ऀa mô h椃hơn 0,05, có thऀ khẳng định sự tương quan có 礃Ā nghĩa về mặt thĀng kê ở mức độ tin cậy 95% Hơn nữa gi愃Ā trị P c甃ऀa residuals (sai sĀ) lớn hơn 0,05, càng có thऀ khẳng địnhrằng mô h椃cậy 95% hoặc cao hơn) Bên cạnh đó, kiऀm định Likelihood (Bảng 4) nhằm đ愃Ānh gi愃Ā độ tương thích c甃ऀa mô h椃trong mô h椃

Bảng 4: Kiểm định Likelihood (Likelihood Ratio Tests) của phương tr椃

Thông thường so s愃Ānh độ lệch c甃ऀa mô h椃với một độ tự do duy nhĀt đऀ kiऀm tra tính độc lập thĀng kê và mức độ khớp c甃ऀa dữ liệu Với hồi quy logistic, thay v椃2 đऀ mô tả sự phù hợp c甃ऀa mô h椃lệch (deviance) có thऀ được thay thế Ngoài ra, ph愃Ȁn tích Chi Squared c甃̀ng là một biện ph愃Āp đ愃Ānh gi愃Ā độ tương thích c甃ऀa c愃Āc gi愃Ā trị thực nghiệm và dự đo愃Ān từ mô h椃Độ sai lệch (deviance) nhỏ nhĀt là gi愃Ā trị mong muĀn Gi愃Ā trị P c甃ऀa c愃Āc nh愃Ȁn tĀ c甃̀ng được x愃Āc định

Kết quả thऀ hiện ở Bảng 5, cho thĀy gi愃Ā trị P c甃ऀa c愃Āc nh愃Ȁn tĀ đều nhỏ hơn 0,05,ngoại trừ tương t愃Āc X và Y có trị sĀ là 0,128 (> 0,05) Như vậy, tương t愃Āc XY không có 礃Ā nghĩa về mặt thĀng kê, phương tr椃

η=8,972+0,063X–2,072Y–0,00024X2 + 0,082Y2 (6)

Với phương tr椃được điều chỉnh tương ứng là 11,72% và 7,21% Cả hai gi愃Ā trị này đều nhỏ hơn so với

Downloaded by Vu Vu (quangchinhlas199@gmail.com)

Trang 17

mô h椃mô h椃

Kết quả ph愃Ȁn tích dữ liệu c甃ऀa mô h椃Bảng 5 Kết quả ph愃Ȁn tích độ sai lệch c甃ऀa phương tr椃c甃ऀa mô h椃Deviance c甃ऀa Residual là 195,61 (lớn hơn so với mô h椃dự đo愃Ān có độ lệch nhỏ nhĀt có 礃Ā nghĩa, tương ứng với gi愃Ā trị P rĀt nhỏ (< 0,05) th椃thऀ kết luận có sự tương quan 礃Ā nghĩa giữa c愃Āc dữ liệu dự đo愃Ān và dữ liệu đo đạc Kết quả thऀ hiện gi愃Ā trị P c甃ऀa mô h椃quan có 礃Ā nghĩa về mặt thĀng kê ở mức độ tin cậy 95% Hơn nữa gi愃Ā trị P c甃ऀa c愃Āc sai lệch c漃với mô h椃

Bảng 5: Phân tích độ sai lệch (Analysis of Deviance) của phương tr椃

Kết quả kiऀm định Likelihood được thऀ hiện ở Bảng 6 c甃ऀa phương tr椃gi愃Ā trị P c甃ऀa c愃Āc nh愃Ȁn tĀ đều rĀt nhỏ (P<0,05), cho thĀy sự đóng góp có 礃Ā nghĩa c甃ऀa c愃Āc nh愃Ȁn tĀ vào mô h椃

Bảng 6: Kiểm định Likelihood (Likelihood Radio Tests) của phương tr椃

Tương quan giữa tỷ sĀ khả dĩ (Odd ratio) và c愃Āc nh愃Ȁn tĀ c甃̀ng có thऀ được biऀu diễn theo phương tr椃

Tỷ sĀ Odd=2,385+0,014X–0,442Y - 0,00005X2 – 0,000006 XY + 0,0176Y2 (7)Mô h椃lượng dịch quả phĀi chế và tỷ lệ pha loãng với nước được tr椃

Downloaded by Vu Vu (quangchinhlas199@gmail.com)

Trang 18

Thuận lợi c甃ऀa mô h椃sĀ odd) đạt được cao nhĀt khi sản phẩm được phĀi chế với lượng dịch quả là 133,294 g và tỷ lệ pha loãng 1:8 (dữ liệu được tính to愃Ān từ mô h椃quả ph愃Ȁn tích c愃Āc chỉ tiêu l礃Ā hóa học và thông qua c愃Āc phương ph愃Āp đ愃Ānh gi愃Ā cảm quan cho thĀy m̀u phĀi chế với lượng dịch chanh d愃Ȁy là 150 g và tỷ lệ pha loãng 1:8 cho c愃Āc gi愃Ā trị về hàm lượng c愃Āc hợp chĀt có hoạt tính sinh học cao c甃̀ng như gi愃Ā trị cảm quan tĀt nhĀt và được người tiêu dùng chĀp nhận

Hình 4: Tư漃ᬀng quan giữa tỷ số odd với khối lượng d椃⌀ch qu愃ऀ và tỷ lệ pha loãng

6 Kết luận

Đ愃Ānh gi愃Ā về cảm quan (ph愃Ȁn tích mô tả và nghiên cứu sự yêu thích c甃ऀa người tiêu dùng) là yếu tĀ then chĀt cho việc giới thiệu thành công c愃Āc sản phẩm thực phẩm mới và gi愃Ām s愃Āt đ愃Āng tin cậy c愃Āc sản phẩm thực phẩm hiện có trên thị trường Từ nghiên cứu này, c愃Āc thuộc tính cảm quan quan trọng quyết định chĀt lượng c甃ऀa nước 攃Āp gĀc-chanh d愃Ȁy là trạng th愃Āi (độ s愃Ānh và độ đồng nhĀt), màu sắc (đỏ cam) và mùi vị (mùi gĀc, mùi chanh d愃Ȁy) Kết hợp c愃Āc phương ph愃Āp thĀng kê PCA và hồi quy Logistic c愃Āc dữ liệu yêu thích sản phẩm cho thĀy tiện ích c甃ऀa chúng trong x愃Āc định c愃Āc thuộc tính cảm quan c甃ऀa sản phẩm nước 攃Āp gĀc-chanh d愃Ȁy cho sự chĀp nhận c甃ऀa người tiêu dùng Nước 攃Āp gĀc-chanh d愃Ȁy sử dụng dịch quả là 133-150g (so với gĀc là 150 g) và tỷ lệ pha loãng 1:8 (khĀi lượng tổng cộng gĀc-chanh d愃Ȁy:nước) có gi愃Ā trị cảm quan và hàm lượng c愃Āc hợp chĀt sinh học cao nhĀt

Downloaded by Vu Vu (quangchinhlas199@gmail.com)

Trang 19

II Ứng dụng thuật toán trên nền tảng ngôn ngữ R để nghiên cứu vi nhựa trong nước mặt lục địa, sông Sài Gòn và sông Đồng Nai

1 Tóm tắt bài nghiên cứu

Nghiên cứu dự b愃Āo diễn biến ph愃Āt t愃Ān vi nhựa trong nước mặt lục địa bằng ngôn ngữ lập tr椃c甃ऀa vi nhựa theo mùa trong n愃؀m và mực nước th甃ऀy triều trong ngày Công t愃Āc lĀy m̀unước và c愃Āc yếu tĀ về không gian, thời gian được thực hiện tại 18 vị trí trên lưu vực sông Sài G漃th甃ऀ công c愃Āc tạp chĀt lớn hơn 5mm như cành c愃Ȁy, l愃Ā, vật liệu x愃Ȁy dựng, những mảnh nhựa lớn Tổng cộng 144 m̀u nước được bảo quản trong c愃Āc chai th甃ऀy tinh tĀi màu nhằm tr愃Ānh bị ảnh hưởng nhiệt độ hay 愃Ānh s愃Āng môi trường tự nhiên và được vận chuyऀn đến ph漃Kinh tế tuần hoàn Miền Nam (IECES) đऀ ph愃Ȁn tích x愃Āc định vi nhựa

Kết quả ứng dụng nghiên cứu cho thĀy tĀt cả c愃Āc vị trí lĀy m̀u trên lưu vực c愃Ācsông Sài G漃c愃Āc n愃؀m Kết quả nghiên cứu là công cụ hiệu quả trong dự đo愃Ān diễn biến thay đổi về đặc điऀm, h椃theo th甃ऀy triều lên và xuĀng Hơn nữa, kết quả nghiên cứu này có thऀ được sử dụng đऀđiều chỉnh c愃Āc mô h椃lượng dữ liệu lưu trữ lớn, độ chính x愃Āc cao Cần có sự chú trọng trong nguồn gĀc làm ph愃Āt sinh vi nhựa đऀ có sự kiऀm so愃Āt và quản l礃Ā kịp thời Đ愃Ȁy là công cụ đóng góp quan trọng trong nghiên cứu vi nhựa trong nước sông Sài g漃ứng dụng rộng rãi cho nghiên cứu vi nhựa nước mặt lục địa

2 Phạm vi ứng dụng của phương pháp PCA trong bài nghiên cứu

Trong nền tảng ngôn ngữ R, đऀ ph愃Ȁn tích PCA c愃Āc đặc tính c甃ऀa vi nhựa theo thời gian và không gian, nghiên cứu sử dụng c愃Āc hàm R tích hợp Prcomp() và Princomp() Gói Packages được sử dụng cho c愃Āc hàm này gồm Devtools và Factoextra.

Downloaded by Vu Vu (quangchinhlas199@gmail.com)

Trang 20

Kết quả ph愃Ȁn tích tương quan đa biến và PCA c愃Āc đặc tính h椃nhựa trong môi trường nước sông Sài G漃hiện qua h椃

2.1 Kết qu愃ऀ phân tích t甃ᬀơng quan và PCA c愃Āc đặc điểm về hình dạng của vi nhựa trong môi tr甃ᬀờng n甃ᬀớc sông Sài Gòn - Đồng Nai trong n愃؀m 2021

Dựa theo kết quả thu được sau khi ph愃Ȁn tích PCA bằng ngôn ngữ R được thऀ hiện trong H椃d愃Āng vi nhựa trong n愃؀m 2021 thỏa mãn phần tr愃؀m giải thích phương sai >10% là PC1(56,6%), PC2(23,8%) và PC3 (12,7%) được biऀu diễn trên H椃Tuy nhiên, nghiên cứu này chỉ lựa chọn 2 thành phần chính đầu tiên v椃phần này đã giải thích được toàn bộ 80,4% tập dữ liệu yêu cầu (tổng giải thích phươngsai hai thành phần chính lớn hơn 50%) C愃Āc vector màu xanh cho biết mĀi quan hệ giữa c愃Āc biến ban đầu (h椃biết độ mạnh c甃ऀa mĀi tương quan c甃ऀa biến ban đầu với thành phần chính Theo kết quả ph愃Ȁn tích ma trận xoay trong H椃trong H椃

i) Dạng sợi - dạng kh愃Āc gần như không có mĀi tương quan (r = 0,08) và dạng mảnh - dạng hạt có mĀi tương quan yếu (r = 0,47), c愃Āc gi愃Ā trị P-Value < 0,05=> ChĀp nhận H0, có 礃Ā nghĩa thĀng kê

ii) Ngoài ra, H椃với thành phần chính PC1 cao hơn c愃Āc dạng kh愃Āc và dạng sợi, ngoài ra trong PC2 th椃dạng sợi và dạng kh愃Āc có mĀi tương quan cao với thành phần chính này (nhưng gi愃Ā trị P-Value giữa dạng sợi-dạng kh愃Āc trong H椃thĀng kê P-Value = 0,48).

quan và giá tr椃⌀ PValue c甃ऀa các hình dạngvi nhựa từ R

Downloaded by Vu Vu (quangchinhlas199@gmail.com)

Trang 21

Hình 5c: Biऀu đồ Scree plot thऀ hiện phần trăm phư漃ᬀng sai mà các thành phần ch椃Ānhgi愃ऀi th椃Āch bộ dữ liệu

Hình 5d: Biऀu đồ tư漃ᬀng quan đa biến cáchình dạng c甃ऀa vi nhựa được tìm thĀy

Từ c愃Āc ph愃Ȁn tích trên, nghiên cứu lựa chọn thực hiện ph攃Āp trích c愃Āc h椃cho c愃Āc thành phần chính như sau:

PC1 gồm: Dạng sợi (hệ sĀ x愃Āc định là 49%), dạng mảnh (56%) và dạng hạt (52,8%)

PC2 gồm: Dạng kh愃Āc (74,7%)

Biऀu diễn phương tr椃

PC1 = 0,49DangSoi + 0,56DangManh + 0,53DangHạt Biऀu diễn phương tr椃

Downloaded by Vu Vu (quangchinhlas199@gmail.com)

Ngày đăng: 27/05/2024, 15:36

Xem thêm:

TÀI LIỆU CÙNG NGƯỜI DÙNG

TÀI LIỆU LIÊN QUAN

w