DANH MỤC BẢNGBảng 1: K礃Ā hiệu c愃Āc m̀u nước 攃Āp gĀc-chanh d愃Ȁy được đ愃Ānh gi愃Ā cảm quan trong thí nghiệm với lượng gĀc cĀ định 150 g...10Bảng 2: Trọng sĀ c甃ऀa c愃Āc thành phần.
Trang 1TRƯỜNG ĐẠI HỌC KINH TẾ QUỐC DÂN ***
BÀI TẬP LỚN Môn: Phân tích dữ liệu
Giảng viên: PGS TS Trần Thị BíchĐỀ
TÀI : PHÂN TÍCH THÀNH PHẦN CHÍNH (PCA)
Thành viên nhóm: Lê Thị Ngọc Ánh – 11210853
Phạm Thúy Hiền – 11212174Bùi Phương Hà – 11211846
Dương Nguyễn Thu Hạ 11216933
Hà Nội, tháng 03 năm 2024
Trang 2PHẦN 2: PHÂN TÍCH NGHIÊN CỨU 8
I Ứng dụng phương pháp phân tích thành phần chính và hồi quy logistic trong đánh giá cảm quan nước ép gấc – chanh dây 8
1 Lý do chọn đề tài 8
2 Tóm tắt bài nghiên cứu 9
3 Mục tiêu bài nghiên cứu 9
4 Phương tiện và phương pháp nghiên cứu 10
4.1 Chuऀn b椃⌀ m̀u 10
4.1.1 Chuऀn b椃⌀ màng gĀc 10
4.1.2 Chuऀn b椃⌀ d椃⌀ch qu愃ऀ chanh d愃Ȁy 10
4.1.3 Chế biến nước ép gĀc-chanh d愃Ȁy 10
4.2 Đ愃Ānh gi愃Ā c愃ऀm quan n甃ᬀớc 攃Āp h̀n hợp 11
4.2.1 Phư漃ᬀng pháp đánh giá các thuộc t椃Ānh c愃ऀm quan c甃ऀa nước ép gĀc-chanh d愃Ȁy 11
4.2.2 Phư漃ᬀng pháp đánh giá c愃ऀm quan v4.3 Ph甃ᬀơng ph愃Āp phân tích thống kê 11
4.3.1 Ph愃Ȁn t椃Āch thành phần ch椃Ānh (PCA) 11
4.3.2 Ph愃Ȁn t椃Āch hồi quy logistic 11
5 Kết quả và thảo luận 12
5.1 Ảnh h甃ᬀởng của tỷ lệ pha loãng và khối l甃ᬀợng chanh dây bổ sung đến chất l甃ᬀợng c愃ऀm quan s愃ऀn phऀm 12
5.2 Ảnh h甃ᬀởng của tỷ lệ pha loãng và khối l甃ᬀợng chanh dây bổ sung đến kh愃ऀ n愃ng chấp nhận của s愃ऀn phऀm 15
6 Kết luận 18
II Ứng dụng thuật toán trên nền tảng ngôn ngữ R để nghiên cứu vi nhựa trong nước mặt lục địa, sông Sài Gòn và sông Đồng Nai 18
2
Trang 31 Tóm tắt bài nghiên cứu 18
2 Phạm vi ứng dụng của phương pháp PCA trong bài nghiên cứu 19
2.1 Kết qu愃ऀ phân tích t甃ᬀơng quan và PCA c愃Āc đặc điểm về hình dạng của vi nhựa trong môi tr甃ᬀờng n甃ᬀớc sông Sài Gòn - Đồng Nai trong n愃m 2021 19
2.2 Kết qu愃ऀ phân tích t甃ᬀơng quan và PCA c愃Āc đặc điểm về hình dạng của vi nhựa trong môi tr甃ᬀờng n甃ᬀớc sông Sài Gòn - Đồng Nai trong n愃m 2022 22
II Đánh giá chất lượng sinh thái cho tỉnh Thanh Hóa trong năm 2021 dựa vào chỉ số sinh thái viễn thám (RSEI) 25
I Giới thiệu mẫu nghiên cứu 32
1 Giới thiệu bộ dữ liệu 32
1.1 Đề tài nghiên cứu 32
1.2 Phạm vi nghiên cứu 32
1.3 Mục đích nghiên cứu 32
2 Mô tả dữ liệu 32
II Phân tích thành phần chính (PCA) 33
1 Bước 1: Lựa chọn biến phân tích 33
1.1 Ma trận hệ số t甃ᬀơng quan 33
1.2 Kiểm đ椃⌀nh Bartlett 34
1.3 Kiểm đ椃⌀nh KMO 34
3
Trang 42 Bước 2: Xác định các thành phần chính 35
2.1 X愃Āc đ椃⌀nh số l甃ᬀợng thành phần chính 35
2.2 X愃Āc đ椃⌀nh số thành phần chính giữ lại 36
2.3 Đ愃Ānh gi愃Ā chất l甃ᬀợng biểu diễn của biến phân tích 37
3 Bước 3: Xác định biến nào thuộc thành phần chính nào 38
4 Bước 4: Chuyển dữ liệu sang không gian mới 39
Trang 5DANH MỤC BẢNG
Bảng 1: K礃Ā hiệu c愃Āc m̀u nước 攃Āp gĀc-chanh d愃Ȁy được đ愃Ānh gi愃Ā cảm quan trong thí
nghiệm (với lượng gĀc cĀ định 150 g) 10
Bảng 2: Trọng sĀ c甃ऀa c愃Āc thành phần 13
Bảng 3: Ph愃Ȁn tích độ sai lệch (Analysis of Deviance) c甃ऀa phương tr椃Bảng 4: Kiऀm định Likelihood (Likelihood Ratio Tests) c甃ऀa phương tr椃Bảng 5: Ph愃Ȁn tích độ sai lệch (Analysis of Deviance) c甃ऀa phương tr椃Bảng 6: Kiऀm định Likelihood (Likelihood Radio Tests) c甃ऀa phương tr椃Bảng 7: Mức đ愃Ānh gi愃Ā theo chỉ sĀ RSEI 27
Bảng 8: Bảng tổng hợp kết quả tính PCA 29
Bảng 15: Giải thích thành phần chính PC và c愃Āc biến phụ thuộc 40
Bảng 16: Nh愃Ȁn sĀ c甃ऀa 10 quan s愃Āt đầu tiên 40
DANH MỤC HÌNHH椃variability %)c甃ऀa c愃Āc thành phần biऀu diễn theo Scree plot 13
H椃 14
H椃cùng mặt phẳng tương quan giữa thành phần chính thứ 1 và thứ 2 14H椃H椃H椃H椃H椃H椃H椃H椃H椃H椃H椃
5
Trang 6PHẦN 1: TỔNG QUAN VỀ PHÂN TÍCH THÀNH PHẦN CHÍNH1 Khái niệm
Ph愃Ȁn tích thành phần chính (Principal Component Analysis - PCA) là một trong những phương ph愃Āp ph愃Ȁn tích dữ liệu đã chiều được sử dụng trong thĀng kê mục đích làm giảm chiều (giảm sĀ lượng biến) nhưng v̀n giữ lại được nhiều nhĀt c愃Āc thông tin c甃ऀa tập dữ liệu ban đầu
2 Bản chất của phân tích thành phần chính
Thực chĀt việc cô đọng thông tin hay giảm chiều dữ liệu c甃ऀa phương ph愃Āp ph愃Ȁntích thành phần chính là thay thế p biến ban đầu (có quan hệ tương quan với nhau) bằng một sĀ thành phần chính (biến mới) là z (với z < p) Mỗi thành phần chính là tổ hợp tuyến tính c甃ऀa c愃Āc biến ban đầu C愃Āc thành phần chính được x愃Āc định trên cơ sở có mĀi liên hệ tuyến tính cao với c愃Āc biến ban đầu và giữa c愃Āc thành phần chính không tương quan với nhau => được sử dụng như bước tiền xử l礃Ā dữ liệu cho c愃Āc phương ph愃Āp hồi quy bội và ph愃Ȁn cụm dữ liệu.
Đऀ thực hiện giảm chiều, PCA biến đổi tập dữ liệu ban đầu lên một hệ trục tọa độ mới mà c愃Āc trục tọa độ là c愃Āc thành phần chính sao cho mỗi thành phần chính là một hàm hồi quy tuyến tính c甃ऀa c愃Āc biến ban đầu C愃Āc thành phần chính được x愃Āc định trên cơ sở có mĀi liên hệ tương quan cao với c愃Āc biến ban đầu và giữa c愃Āc thành phần chính không tương quan với nhau Thành phần chính đầu tiên sẽ có phương sai lớn nhĀt hay là trục tọa độ mà c愃Āc quan s愃Āt được ph愃Ȁn bĀ tĀi đa (ph愃Ȁn t愃Ān rộng nhĀt) trên trục đó.
3 Mục đích của phân tích thành phần chính
- Giảm chiều dữ liệu: PCA giúp giảm sĀ lượng biến đầu vào c甃ऀa dữ liệu, chuyऀn từ không gian ban đầu sang không gian mới có sĀ chiều (thường ít hơn) mà v̀ngiữ lại được phần lớn thông tin quan trọng từ dữ liệu ban đầu Điều này giúp làm cho dữ liệu trở nên dễ quản l礃Ā hơn và giảm độ phức tạp trong việc ph愃Ȁn tích
6
Trang 7- Ph愃Āt hiện sự tương quan: PCA giúp ph愃Āt hiện và hiऀu rõ sự tương quan giữa c愃Āc biến Nó t椃là những hướng chứa phần lớn biến thiên trong dữ liệu
- N攃Ān thông tin: PCA cho ph攃Āp biऀu diễn dữ liệu ban đầu dưới dạng tổ hợp tuyếntính c甃ऀa c愃Āc thành phần chính Điều này có nghĩa rằng bạn có thऀ lưu trữ dữ liệu một c愃Āch hiệu quả hơn với ít thông tin hơn, mà v̀n giữ lại được c愃Āc đặc trưng quan trọng
- Loại bỏ nhiễu: PCA có thऀ giúp loại bỏ hoặc giảm nhiễu từ dữ liệu, làm cho dữ liệu trở nên dễ dàng ph愃Ȁn tích và hiऀu hơn
- Visualize dữ liệu: PCA có thऀ được sử dụng đऀ biऀu diễn dữ liệu nhiều chiều trong không gian hai hoặc ba chiều đऀ dễ dàng trực quan hóa dữ liệu
- Tạo c愃Āc biến mới không tương quan (orthogonal): C愃Āc thành phần chính sau khi trích xuĀt từ PCA là không tương quan với nhau, điều này có thऀ giúp trongviệc loại bỏ tương quan giữa biến đầu vào trong c愃Āc mô h椃
=> Tóm lại, PCA là một công cụ mạnh mẽ trong ph愃Ȁn tích dữ liệu, giúp tiết kiệm thời gian và tạo ra biऀu đồ hoặc biऀu đồ giúp hiऀu rõ hơn về mĀi quan hệ và đặc điऀm quantrọng trong dữ liệu
7
Trang 8PHẦN 2: PHÂN TÍCH NGHIÊN CỨU
I Ứng dụng phương pháp phân tích thành phần chính và hồi quy logistic trong đánh giá cảm quan nước ép gấc – chanh dây
1 Lý do chọn đề tài
Sản xuĀt nước 攃Āp tr愃Āi c愃Ȁy ngày càng trở nên quan trọng đĀi với thị trường trong nước do nhu cầu sử dụng sản phẩm tiện lợi và bổ dưỡng Nước 攃Āp gĀc-chanh d愃Ȁy kết hợp sẽ làm t愃ng gi愃Ā trị dinh dưỡng và cải thiện mùi vị thơm ngon cho sản phẩm Tuy vậy, sản phẩm cần có thêm c愃Āc bước nghiên cứu về đ愃Ānh gi愃Ā cảm quan c甃ऀa người tiêu dùng đऀ x愃Āc nhận kết quả c甃ऀa nghiên cứu này và đảm bảo tiềm n愃ng c甃ऀa sản phẩm mới trên thị trường
Ph愃Ȁn tích cảm quan cung cĀp cho c愃Āc nhà tiếp thị hiऀu về chĀt lượng sản phẩm thực phẩm, hướng đến chĀt lượng sản phẩm tĀt và cải tiến sản phẩm theo quan điऀm c甃ऀa người tiêu dùng (Lawless and Heymann, 1998) Phương ph愃Āp ph愃Ȁn tích thành phần chính (PCA) đã được sử dụng và xem x攃Āt bởi c愃Āc nhà nghiên cứu cho c愃Āc ứng dụng đ愃Ānh gi愃Ā cảm quan cho c愃Āc sản phẩm thực phẩm kh愃Āc nhau PCA có thऀ được 愃Āpdụng cho việc điều tra dữ liệu ưa thích, do đó có thऀ tạo ra một không gian sản phẩm-
người tiêu dùng dựa trên dữ liệu chĀp nhận (Hough et al., 1992; Greenhooff and
McFie, 1994) Đ愃Ȁy c甃̀ng là một công cụ đऀ miêu tả sự kh愃Āc biệt giữa c愃Āc thuộc tính cảm quan c甃ऀa c愃Āc sản phẩm thực phẩm (Powers, 1984) MĀi quan hệ giữa người tiêu dùng và dữ liệu mô tả, c甃̀ng như dữ liệu thu nhận từ cảm quan và dụng cụ đo có thऀ được h椃h椃
Ngoài ra, c愃Āc mô h椃tĀ dự b愃Āo (c愃Āc biến độc lập) lên biến nhị ph愃Ȁn (biến phụ thuộc) thऀ hiện kết quả chĀp nhận hoặc không chĀp nhận c甃ऀa người tiêu dùng (Agresti, 1996) Kết quả từ hồi quy logistic có thऀ được giải thích bằng c愃Āch sử dụng ước tính x愃Āc suĀt hoặc tỷ sĀ khả dĩ ước tính Hồi quy logistic có thऀ dự đo愃Ān x愃Āc suĀt ước tính rằng một sự kiện sẽ thành
công hoặc thĀt bại dựa trên một sĀ dự b愃Āo (biến độc lập) (Hair et al., 1998) Nếu x愃Āc
suĀt dự đo愃Ān lớn hơn 0,5 th椃1996) Nói c愃Āch kh愃Āc, x愃Āc suĀt thành công hay thĀt bại c甃ऀa biến phụ thuộc không bị
8
Trang 9ảnh hưởng bởi biến độc lập Tỷ sĀ odd có gi愃Ā trị 愃Ȁm cho thĀy sự suy giảm trong x愃Āc
suĀt thành công, và tỷ sĀ odd dương cho thĀy khả n愃ng thành công t愃ng lên (Hair et
al., 1998) Phương ph愃Āp hồi quy logistic đã được 愃Āp dụng trong một vài trường hợp
trong lãnh vực đ愃Ānh gi愃Ā cảm quan
2 Tóm tắt bài nghiên cứu
Trong nghiên cứu này, c愃Āc cảm quan viên được đào tạo đऀ đ愃Ānh gi愃Ā c愃Āc thuộc tính kh愃Āc nhau c甃ऀa sản phẩm nước 攃Āp gĀc-chanh d愃Ȁy Hàm lượng dịch chanh d愃Ȁy sử dụng từ 50-200 g (150 g gĀc) và tỷ lệ pha loãng tổng c愃Āc thành phần (gĀc và chanh d愃Ȁy) vớinước (1:8 đến 1:15) Ph愃Ȁn tích thành phần chính (PCA) x愃Āc định hai thành phần chính ch甃ऀ yếu chiếm 80,43% phương sai trong dữ liệu thuộc tính cảm quan PCA cho thĀy thuộc tính cảm quan quan trọng c甃ऀa nước 攃Āp này là hương vị, màu sắc và độ đồng nhĀt Khả n愃ng chĀp nhận chung c甃ऀa sản phẩm được mô phỏng (ph愃Ȁn tích hồi quy logistic) như một hàm c甃ऀa hàm lượng dịch quả chanh d愃Ȁy và tỷ lệ pha loãng c甃ऀa nước trong sản phẩm MĀi quan hệ thĀng kê quan trọng giữa c愃Āc biến được x愃Āc định
(P<0,05) Tỷ lệ pha loãng với nước 1:8 và hàm lượng gĀc:chanh d愃Ȁy là 150:130-150 (g/g), tương ứng cho sản phẩm có gi愃Ā trị cảm quan và hợp chĀt sinh học cao nhĀt Kết quả c甃̀ng cho thĀy tính hữu ích c甃ऀa PCA và ph愃Ȁn tích hồi quy logistic đऀ x愃Āc định và đo lường c愃Āc thuộc tính sản phẩm nước 攃Āp gĀc-chanh d愃Ȁy có 礃Ā nghĩa quan trọng đĀi với sự chĀp nhận và ưa thích c甃ऀa người tiêu dùng
3 Mục tiêu bài nghiên cứu
Mục tiêu c甃ऀa nghiên cứu này là 愃Āp dụng phương ph愃Āp ph愃Ȁn tích thành phần chính (PCA) và phương ph愃Āp hồi quy Logistic đऀ mô tả c愃Āc thuộc tính cảm quan c甃ऀa nước 攃Āp gĀc-chanh d愃Ȁy được chuẩn bị với sự kết hợp c甃ऀa c愃Āc hàm lượng thay đổi (so với gĀc) và tỷ lệ pha loãng với nước đऀ chọn ra sản phẩm có gi愃Ā trị cảm quan cao và phù hợp với sở thích c甃ऀa người tiêu dùng
9
Trang 104 Phương tiện và phương pháp nghiên cứu
4.1 Chuऀn b椃⌀ m̀u
Tr愃Āi gĀc chín được thu nhận, rửa sạch với nước và đऀ r愃Āo Màng gĀc được t愃Āch
ra (Nguyễn Minh Th甃ऀy và ctv., 2009) và được đóng gói sẵn trong bao b椃
trong t甃ऀ đông (ToC≤ –18oC) cho đến khi sử dụng
Tr愃Āi chanh d愃Ȁy được rửa sạch sau khi thu nhận, đऀ r愃Āo và bổ đôi quả, t愃Āch phần thịt và hạt trong quả 䔃Āp lĀy phần dịch quả và lọc sạch nhằm loại c愃Āc màng và xơ l̀n vào
4.1.3 Chế biến nước ép gĀc-chanh d愃Ȁy
Màng gĀc được c愃Ȁn định lượng 150 g, sau đó phĀi trộn với dịch quả chanh d愃Ȁy với c愃Āc khĀi lượng lần lượt như sau: 50, 100, 150, 200 g Xay mịn phần nguyên liệu đã phĀi trộn với c愃Āc tỷ lệ nước 1:8; 1:10; 1:12,5 và 1:15[tổng khĀi lượng nguyên liệu (g):nước (mL)] và lọc sạch phần hỗn hợp thu được Phần dịch hỗn hợp sau lọc được chỉnh độ Brix đến 7,5 Sau đó, thực hiện đồng hóa m̀u (GJB30-40, China), 愃Āp suĀt 30MPa trong 6 phút Sau đó, dịch quả (gĀc và chanh d愃Ȁy) được gia nhiệt ở nhiệt độ 100oC trong thời gian 5 phút Sản phẩm được tồn trữ lạnh 2 ngày trước khi đ愃Ānh gi愃Ā cảm quan và được k礃Ā hiệu (Bảng 1).
Bảng 1: Ký hiệu các mẫu nước ép gấc-chanh dây được đánh giá cảm quan trongthí nghiệm (với lượng gấc cố định 150 g)
10
Trang 114.2 Đ愃Ānh gi愃Ā c愃ऀm quan n甃ᬀớc 攃Āp h̀n hợp
Mười cảm quan viên được huĀn luyện tại Bộ môn Công nghệ thực phẩm, Trường Đại học Cần Thơ đऀ đ愃Ānh gi愃Ā c愃Āc m̀u nước 攃Āp gĀc–chanh d愃Ȁy C愃Āc cảm quan viên được hướng d̀n đ愃Ānh gi愃Ā sản phẩm nước 攃Āp với mức độ ưa thích theo cường độ mô tả về mùi, vị, màu sắc và trạng th愃Āi [điऀm từ 1 đến 5 theo thang điऀm c甃ऀa phương ph愃Āp ph愃Ȁn tích mô tả định lượng QDA (Quantitave Descriptive Analysis) được thiết lập)]
Khả n愃ng chĀp nhận sản phẩm được đ愃Ānh gi愃Ā sử dụng thang nhị thức
(có/không) theo phương ph愃Āp Garcia et al (2009) SĀ lượng cảm quan viên là 50
4.3.2 Ph愃Ȁn t椃Āch hồi quy logistic
Phương tr椃gi愃Ā trị β là 0 (không chĀp nhận) hoặc 1 (chĀp nhận) được thu nhận từ kết quả đ愃Ānh gi愃Ā cảm quan c甃ऀa người tiêu dùng
11
Trang 125 Kết quả và thảo luận
5.1 Ảnh h甃ᬀởng của tỷ lệ pha loãng và khối l甃ᬀợng chanh dây bổ sung đến chất l甃ᬀợng c愃ऀm quan s愃ऀn phऀm
Sản phẩm nước 攃Āp gĀc - chanh d愃Ȁy được đ愃Ānh gi愃Ā cảm quan dựa trên c愃Āc thuộc tính như: màu đỏ cam, mùi gĀc, mùi chanh d愃Ȁy, vị ngọt, vị chua, trạng th愃Āi đồng nhĀt và độ s愃Ānh theo phương ph愃Āp mô tả định lượng QDA, ph愃Ȁn tích thành phần chính (PCA) và ph愃Ȁn tích khả n愃ng chĀp nhận c甃ऀa người tiêu dùng theo phương ph愃Āp logistic.
Phương ph愃Āp ph愃Ȁn tích thành phần chính nhằm x愃Āc định sĀ lượng thành phần chính (7 thuộc tính cảm quan c甃ऀa sản phẩm nước 攃Āp gĀc–chanh d愃Ȁy) cần thiết đऀ biऀu diễn dữ liệu “Scree plot” thऀ hiện thứ tự giảm dần về độ lớn c甃ऀa c愃Āc gi愃Ā trị riêng (Eigenvalue) và gi愃Ā trị phần tr愃m tích l甃̀y c甃ऀa phương sai Trong phương diện ph愃Ȁn tích nh愃Ȁn tĀ hoặc ph愃Ȁn tích thành phần ch甃ऀ yếu, “Scree plot” giúp cho nhà ph愃Ȁn tích h椃
phải mô tả được ít nhĀt 80% phần tr愃m tích l甃̀y c甃ऀa phương sai (Shi et al., 2002)
Trong trường hợp này, hai thành phần 1 và 2 (F1 và F2) có gi愃Ā trị riêng lớn hơn 1 và chiếm 80,43% phần tr愃m tích l甃̀y phương sai (H椃và F4) có t愃Āc động rĀt nhỏ so với biến, có thऀ nhận biết qua đường cong tích l甃̀y phương sai không có sự thay đổi nhiều Bên cạnh đó, có sự giảm mạnh độ lớn c甃ऀa gi愃Ā trị riêng thành phần thứ 3 và thứ 4 (F3 và F4) Độ lớn c甃ऀa thành phần thứ 3 đến thứ 7 (F3 đến F7) rĀt nhỏ so với thành phần thứ 1 và thứ 2 (F1 và F2), do đó không cần sử dụng c愃Āc thành phần từ thành phần thứ 3 (F3) trở đi đऀ tr椃quan đã thu thập
Downloaded by Vu Vu (quangchinhlas199@gmail.com)
Trang 13Hình 1: Giá tr椃⌀ ri攃Ȁng (Eigenvalue) và phần trăm t椃Āch l甃̀y c甃ऀa phư漃ᬀng sai (cumulativevariability %)c甃ऀa các thành phần biऀu dìn theo Scree plot
Ma trận thऀ hiện tương t愃Āc giữa c愃Āc thuộc tính cảm quan và c愃Āc thành phần được thऀ hiện ở Bảng 2
Trang 14Hình 2: Sự ph愃Ȁn bố các thuộc t椃Ānh c愃ऀm quan theo kết qu愃ऀ đánh giá c甃ऀa c愃ऀm quanvi攃Ȁn
Dựa vào sự ph愃Ȁn bĀ c愃Āc thuộc tính cảm quan, có thऀ chia c愃Āc thuộc tính này thành 2 vùng riêng biệt Thuộc tính độ đồng nhĀt nằm xa trục F1 (thành phần chính thứ nhĀt) nên thuộc tính này ít có ảnh hưởng đến thành phần chính thứ nhĀt Thuộc tính mùi chanh d愃Ȁy nằm cạnh trục F2 (thành phần chính thứ 2) nên thành phần chính thứ 2 phụ thuộc nhiều vào thuộc tính mùi chanh d愃Ȁy Ngoài ra, c愃Āc thuộc tính như mùigĀc, mùi chanh d愃Ȁy, độ s愃Ānh và màu đỏ cam gần trục F1 Như vậy, thành phần chính thứ 1 chịu ảnh hưởng nhiều nhĀt bởi thuộc tính mùi gĀc, mùi chanh d愃Ȁy và độ s愃Ānh Bên cạnh đó, c愃Āc thuộc tính nằm gần nhau có mĀi liên hệ thuận với nhau (như thuộc tính mùi gĀc và mùi chanh d愃Ȁy), nhóm thuộc tính nằm kh愃Āc phía nhau (180o) có mĀi liên hệ nghịch đảo với nhau và c愃Āc thuộc tính nằm c愃Āch nhau 90o th椃
với nhau (Ca渃̀eque et al., 2004)
Hình 3: Sự ph愃Ȁn bố c甃ऀa các m̀u nước gĀc-chanh d愃Ȁy và các thuộc t椃Ānh c愃ऀm quantr攃Ȁn c甃
Downloaded by Vu Vu (quangchinhlas199@gmail.com)
Trang 15Khi thऀ hiện c愃Āc m̀u nước 攃Āp gĀc-chanh d愃Ȁy và c愃Āc thuộc tính cảm quan trên đồ thị, c愃Āc m̀u nước 攃Āp gĀc-chanh d愃Ȁy có vị trí gần nhau th椃tương tự nhau Sự ph愃Ȁn t愃Ān m̀u trên đồ thị H椃với c愃Āc mức khĀi lượng dịch quả chanh d愃Ȁy bổ sung kh愃Āc nhau có ảnh hưởng rĀt lớn đĀi với tính chĀt cảm quan c甃ऀa sản phẩm Nhóm m̀u có khĀi lượng dịch chanh d愃Ȁy bổsung 50g được đ愃Ānh gi愃Ā là có độ s愃Ānh cao, không có vị ngọt hay vị chua Đ愃Ȁy là nhómm̀u có tỷ lệ phĀi chế với hàm lượng gĀc cao hơn hàm lượng chanh d愃Ȁy rĀt nhiều Nhóm c愃Āc m̀u có lượng dịch chanh d愃Ȁy phĀi chế là 150g là nhóm được đ愃Ānh gi愃Ā có vịchua ngọt hài h漃sản phẩm được c愃Āc cảm quan viên ưa thích
5.2 Ảnh h甃ᬀởng của tỷ lệ pha loãng và khối l甃ᬀợng chanh dây bổ sung đến kh愃ऀ n愃ngchấp nhận của s愃ऀn phऀm
Phương ph愃Āp ph愃Ȁn tích khả dĩ (Logistic) đ愃Ānh gi愃Ā khả n愃ng chĀp nhận (1) hay không chĀp nhận (0) c甃ऀa người tiêu dùng đĀi với sản phẩm ở c愃Āc khĀi lượng dịch quả chanh d愃Ȁy và tỷ lệ nước phĀi chế kh愃Āc nhau Từ gi愃Ā trị cảm quan c甃ऀa sản phẩm với nhiều thuộc tính sẽ đ愃Ānh gi愃Ā được khả n愃ng chĀp nhận sản phẩm c甃ऀa người tiêu dùng Kết quả thĀng kê cho thĀy có thऀ x愃Ȁy dựng tĀt mô h椃tương quan giữa tỷ sĀ khả dĩ và 2 biến độc lập (tỷ lệ pha loãng và khĀi lượng dịch chanh d愃Ȁy phĀi chế) Phương tr椃
Tỷ sĀ khả dĩ = exp(η )
¿ ¿ (4)
Với X: là khĀi lượng dịch quả chanh d愃Ȁy phĀi chế (g) Y: là tỷ lệ pha loãng với nước
Phần tr愃m độ sai lệch c甃ऀa mô h椃chỉnh (Adjusted percentage) là 7,35%
Gi愃Ā trị độ sai lệch c甃ऀa mô h椃
Bảng 3: Phân tích độ sai lệch (Analysis of Deviance) của phương tr椃
Downloaded by Vu Vu (quangchinhlas199@gmail.com)
Trang 16Kết quả cho thĀy Deviance c甃ऀa mô h椃hơn 0,05, có thऀ khẳng định sự tương quan có 礃Ā nghĩa về mặt thĀng kê ở mức độ tin cậy 95% Hơn nữa gi愃Ā trị P c甃ऀa residuals (sai sĀ) lớn hơn 0,05, càng có thऀ khẳng địnhrằng mô h椃cậy 95% hoặc cao hơn) Bên cạnh đó, kiऀm định Likelihood (Bảng 4) nhằm đ愃Ānh gi愃Ā độ tương thích c甃ऀa mô h椃trong mô h椃
Bảng 4: Kiểm định Likelihood (Likelihood Ratio Tests) của phương tr椃
Thông thường so s愃Ānh độ lệch c甃ऀa mô h椃với một độ tự do duy nhĀt đऀ kiऀm tra tính độc lập thĀng kê và mức độ khớp c甃ऀa dữ liệu Với hồi quy logistic, thay v椃2 đऀ mô tả sự phù hợp c甃ऀa mô h椃lệch (deviance) có thऀ được thay thế Ngoài ra, ph愃Ȁn tích Chi Squared c甃̀ng là một biện ph愃Āp đ愃Ānh gi愃Ā độ tương thích c甃ऀa c愃Āc gi愃Ā trị thực nghiệm và dự đo愃Ān từ mô h椃Độ sai lệch (deviance) nhỏ nhĀt là gi愃Ā trị mong muĀn Gi愃Ā trị P c甃ऀa c愃Āc nh愃Ȁn tĀ c甃̀ng được x愃Āc định
Kết quả thऀ hiện ở Bảng 5, cho thĀy gi愃Ā trị P c甃ऀa c愃Āc nh愃Ȁn tĀ đều nhỏ hơn 0,05,ngoại trừ tương t愃Āc X và Y có trị sĀ là 0,128 (> 0,05) Như vậy, tương t愃Āc XY không có 礃Ā nghĩa về mặt thĀng kê, phương tr椃
η=8,972+0,063X–2,072Y–0,00024X2 + 0,082Y2 (6)
Với phương tr椃được điều chỉnh tương ứng là 11,72% và 7,21% Cả hai gi愃Ā trị này đều nhỏ hơn so với
Downloaded by Vu Vu (quangchinhlas199@gmail.com)
Trang 17mô h椃mô h椃
Kết quả ph愃Ȁn tích dữ liệu c甃ऀa mô h椃Bảng 5 Kết quả ph愃Ȁn tích độ sai lệch c甃ऀa phương tr椃c甃ऀa mô h椃Deviance c甃ऀa Residual là 195,61 (lớn hơn so với mô h椃dự đo愃Ān có độ lệch nhỏ nhĀt có 礃Ā nghĩa, tương ứng với gi愃Ā trị P rĀt nhỏ (< 0,05) th椃thऀ kết luận có sự tương quan 礃Ā nghĩa giữa c愃Āc dữ liệu dự đo愃Ān và dữ liệu đo đạc Kết quả thऀ hiện gi愃Ā trị P c甃ऀa mô h椃quan có 礃Ā nghĩa về mặt thĀng kê ở mức độ tin cậy 95% Hơn nữa gi愃Ā trị P c甃ऀa c愃Āc sai lệch c漃với mô h椃
Bảng 5: Phân tích độ sai lệch (Analysis of Deviance) của phương tr椃
Kết quả kiऀm định Likelihood được thऀ hiện ở Bảng 6 c甃ऀa phương tr椃gi愃Ā trị P c甃ऀa c愃Āc nh愃Ȁn tĀ đều rĀt nhỏ (P<0,05), cho thĀy sự đóng góp có 礃Ā nghĩa c甃ऀa c愃Āc nh愃Ȁn tĀ vào mô h椃
Bảng 6: Kiểm định Likelihood (Likelihood Radio Tests) của phương tr椃
Tương quan giữa tỷ sĀ khả dĩ (Odd ratio) và c愃Āc nh愃Ȁn tĀ c甃̀ng có thऀ được biऀu diễn theo phương tr椃
Tỷ sĀ Odd=2,385+0,014X–0,442Y - 0,00005X2 – 0,000006 XY + 0,0176Y2 (7)Mô h椃lượng dịch quả phĀi chế và tỷ lệ pha loãng với nước được tr椃
Downloaded by Vu Vu (quangchinhlas199@gmail.com)
Trang 18Thuận lợi c甃ऀa mô h椃sĀ odd) đạt được cao nhĀt khi sản phẩm được phĀi chế với lượng dịch quả là 133,294 g và tỷ lệ pha loãng 1:8 (dữ liệu được tính to愃Ān từ mô h椃quả ph愃Ȁn tích c愃Āc chỉ tiêu l礃Ā hóa học và thông qua c愃Āc phương ph愃Āp đ愃Ānh gi愃Ā cảm quan cho thĀy m̀u phĀi chế với lượng dịch chanh d愃Ȁy là 150 g và tỷ lệ pha loãng 1:8 cho c愃Āc gi愃Ā trị về hàm lượng c愃Āc hợp chĀt có hoạt tính sinh học cao c甃̀ng như gi愃Ā trị cảm quan tĀt nhĀt và được người tiêu dùng chĀp nhận
Hình 4: Tư漃ᬀng quan giữa tỷ số odd với khối lượng d椃⌀ch qu愃ऀ và tỷ lệ pha loãng
6 Kết luận
Đ愃Ānh gi愃Ā về cảm quan (ph愃Ȁn tích mô tả và nghiên cứu sự yêu thích c甃ऀa người tiêu dùng) là yếu tĀ then chĀt cho việc giới thiệu thành công c愃Āc sản phẩm thực phẩm mới và gi愃Ām s愃Āt đ愃Āng tin cậy c愃Āc sản phẩm thực phẩm hiện có trên thị trường Từ nghiên cứu này, c愃Āc thuộc tính cảm quan quan trọng quyết định chĀt lượng c甃ऀa nước 攃Āp gĀc-chanh d愃Ȁy là trạng th愃Āi (độ s愃Ānh và độ đồng nhĀt), màu sắc (đỏ cam) và mùi vị (mùi gĀc, mùi chanh d愃Ȁy) Kết hợp c愃Āc phương ph愃Āp thĀng kê PCA và hồi quy Logistic c愃Āc dữ liệu yêu thích sản phẩm cho thĀy tiện ích c甃ऀa chúng trong x愃Āc định c愃Āc thuộc tính cảm quan c甃ऀa sản phẩm nước 攃Āp gĀc-chanh d愃Ȁy cho sự chĀp nhận c甃ऀa người tiêu dùng Nước 攃Āp gĀc-chanh d愃Ȁy sử dụng dịch quả là 133-150g (so với gĀc là 150 g) và tỷ lệ pha loãng 1:8 (khĀi lượng tổng cộng gĀc-chanh d愃Ȁy:nước) có gi愃Ā trị cảm quan và hàm lượng c愃Āc hợp chĀt sinh học cao nhĀt
Downloaded by Vu Vu (quangchinhlas199@gmail.com)
Trang 19II Ứng dụng thuật toán trên nền tảng ngôn ngữ R để nghiên cứu vi nhựa trong nước mặt lục địa, sông Sài Gòn và sông Đồng Nai
1 Tóm tắt bài nghiên cứu
Nghiên cứu dự b愃Āo diễn biến ph愃Āt t愃Ān vi nhựa trong nước mặt lục địa bằng ngôn ngữ lập tr椃c甃ऀa vi nhựa theo mùa trong n愃m và mực nước th甃ऀy triều trong ngày Công t愃Āc lĀy m̀unước và c愃Āc yếu tĀ về không gian, thời gian được thực hiện tại 18 vị trí trên lưu vực sông Sài G漃th甃ऀ công c愃Āc tạp chĀt lớn hơn 5mm như cành c愃Ȁy, l愃Ā, vật liệu x愃Ȁy dựng, những mảnh nhựa lớn Tổng cộng 144 m̀u nước được bảo quản trong c愃Āc chai th甃ऀy tinh tĀi màu nhằm tr愃Ānh bị ảnh hưởng nhiệt độ hay 愃Ānh s愃Āng môi trường tự nhiên và được vận chuyऀn đến ph漃Kinh tế tuần hoàn Miền Nam (IECES) đऀ ph愃Ȁn tích x愃Āc định vi nhựa
Kết quả ứng dụng nghiên cứu cho thĀy tĀt cả c愃Āc vị trí lĀy m̀u trên lưu vực c愃Ācsông Sài G漃c愃Āc n愃m Kết quả nghiên cứu là công cụ hiệu quả trong dự đo愃Ān diễn biến thay đổi về đặc điऀm, h椃theo th甃ऀy triều lên và xuĀng Hơn nữa, kết quả nghiên cứu này có thऀ được sử dụng đऀđiều chỉnh c愃Āc mô h椃lượng dữ liệu lưu trữ lớn, độ chính x愃Āc cao Cần có sự chú trọng trong nguồn gĀc làm ph愃Āt sinh vi nhựa đऀ có sự kiऀm so愃Āt và quản l礃Ā kịp thời Đ愃Ȁy là công cụ đóng góp quan trọng trong nghiên cứu vi nhựa trong nước sông Sài g漃ứng dụng rộng rãi cho nghiên cứu vi nhựa nước mặt lục địa
2 Phạm vi ứng dụng của phương pháp PCA trong bài nghiên cứu
Trong nền tảng ngôn ngữ R, đऀ ph愃Ȁn tích PCA c愃Āc đặc tính c甃ऀa vi nhựa theo thời gian và không gian, nghiên cứu sử dụng c愃Āc hàm R tích hợp Prcomp() và Princomp() Gói Packages được sử dụng cho c愃Āc hàm này gồm Devtools và Factoextra.
Downloaded by Vu Vu (quangchinhlas199@gmail.com)
Trang 20Kết quả ph愃Ȁn tích tương quan đa biến và PCA c愃Āc đặc tính h椃nhựa trong môi trường nước sông Sài G漃hiện qua h椃
2.1 Kết qu愃ऀ phân tích t甃ᬀơng quan và PCA c愃Āc đặc điểm về hình dạng của vi nhựa trong môi tr甃ᬀờng n甃ᬀớc sông Sài Gòn - Đồng Nai trong n愃m 2021
Dựa theo kết quả thu được sau khi ph愃Ȁn tích PCA bằng ngôn ngữ R được thऀ hiện trong H椃d愃Āng vi nhựa trong n愃m 2021 thỏa mãn phần tr愃m giải thích phương sai >10% là PC1(56,6%), PC2(23,8%) và PC3 (12,7%) được biऀu diễn trên H椃Tuy nhiên, nghiên cứu này chỉ lựa chọn 2 thành phần chính đầu tiên v椃phần này đã giải thích được toàn bộ 80,4% tập dữ liệu yêu cầu (tổng giải thích phươngsai hai thành phần chính lớn hơn 50%) C愃Āc vector màu xanh cho biết mĀi quan hệ giữa c愃Āc biến ban đầu (h椃biết độ mạnh c甃ऀa mĀi tương quan c甃ऀa biến ban đầu với thành phần chính Theo kết quả ph愃Ȁn tích ma trận xoay trong H椃trong H椃
i) Dạng sợi - dạng kh愃Āc gần như không có mĀi tương quan (r = 0,08) và dạng mảnh - dạng hạt có mĀi tương quan yếu (r = 0,47), c愃Āc gi愃Ā trị P-Value < 0,05=> ChĀp nhận H0, có 礃Ā nghĩa thĀng kê
ii) Ngoài ra, H椃với thành phần chính PC1 cao hơn c愃Āc dạng kh愃Āc và dạng sợi, ngoài ra trong PC2 th椃dạng sợi và dạng kh愃Āc có mĀi tương quan cao với thành phần chính này (nhưng gi愃Ā trị P-Value giữa dạng sợi-dạng kh愃Āc trong H椃thĀng kê P-Value = 0,48).
quan và giá tr椃⌀ PValue c甃ऀa các hình dạngvi nhựa từ R
Downloaded by Vu Vu (quangchinhlas199@gmail.com)
Trang 21Hình 5c: Biऀu đồ Scree plot thऀ hiện phần trăm phư漃ᬀng sai mà các thành phần ch椃Ānhgi愃ऀi th椃Āch bộ dữ liệu
Hình 5d: Biऀu đồ tư漃ᬀng quan đa biến cáchình dạng c甃ऀa vi nhựa được tìm thĀy
Từ c愃Āc ph愃Ȁn tích trên, nghiên cứu lựa chọn thực hiện ph攃Āp trích c愃Āc h椃cho c愃Āc thành phần chính như sau:
PC1 gồm: Dạng sợi (hệ sĀ x愃Āc định là 49%), dạng mảnh (56%) và dạng hạt (52,8%)
PC2 gồm: Dạng kh愃Āc (74,7%)
Biऀu diễn phương tr椃
PC1 = 0,49DangSoi + 0,56DangManh + 0,53DangHạt Biऀu diễn phương tr椃
Downloaded by Vu Vu (quangchinhlas199@gmail.com)