8 1 Ứng dụng phương pháp phân tích thành phần chính và hồi quy logistic trong đánh giá cảm quan nước ép gầc — chanh dây.... C3c thành phần chính được x3c định trên cơ sở có mDi liên h2
Trang 1ĐÈ TÀI: PHÂN TÍCH THÀNH PHẢN CHÍNH (PCA)
Trang 2MỤC LỤC
PHAN 1: TONG QUAN VE PHAN TICH THÀNH PHẢN CHÍNH 6 I0 iìÀ.dđidiidŸỶẳ 6
2 Bản chất của phân tích thành phần chính 2-22 S222 27122717212221222cEee 6
3 Mục đích của phân tích thành phần chính 2 152221 S12E177121121111 121121 cEeE 6
gì 0 À/06)51(daadi 7 PHẢN 2: PHÂN TÍCH NGHIÊN CỨU - 5222222 22221112222211122212111.2.1 xe 8
1 Ứng dụng phương pháp phân tích thành phần chính và hồi quy logistic trong đánh giá cảm quan nước ép gầc — chanh dây ác n2, 8
1 Lý do chọn đề tài 56: 222221122211112222111122111111221121111.2111.0 1101110 1 de 8
2 Tóm tắt bad mghiém Cu cece cccccccceeeecesesecsesseescesessesersersessissessnssnsersevsveeseneeses 9
3 Mục tiêu bai mghién Cia ccc cece ccne scene cee aeseseseeaessceseeesseaseseeesaes 9
4 Phương tiện và phương pháp nghiên cứu - 5 c2 222112222 112122211 cssy 10
1N TT r ng 10
Nă ng ng 10 4.1.2 Chuẩn bị dịch /72859(2//1/8:/)/ 0P 10 4.1.3 Chế biến nước ép gấc-chanh đâyy 5c TEEEEEH11211111 21112 ccy 10 4.2 Danh gid cam quan HƯỚC Ép Ï H HHỢP 0Q 2Q T HH HH HH Ha II 4.2.1 Phương pháp đánh giá các thuộc t,nh cảm quan c-a nước ép gấc-chanh 2/5 II 4.2.2 Phương pháp đánh giá cảm quan về s1 chấp nh2n sản phẩm II
4.3 Phương pháp phân tích thống kê án HH are 11
4.3.1 Phân t,ch thành phân chynh (PCA) ccccccccceccccsscsvsscsscsvsscssescssesessessesesesssivsees I1
4.3.2 Phéin 1n Tp 0 6 nan ẽố 11
5 Két qua va thao Wan ccc cc cccccccceccsscsecsesseseessvsscsecsevsessessessnssnsevsesevsnsevevseses 12
5.1 Anh hưởng của tỷ lộ pha loãng và khối lượng chanh dây bỗ sung đến chất [WONG CAM QUAN SAN PRAM occ ẶẶ 12 5.2 Anh hưởng của tỷ lệ pha loãng và khối lượng chanh dây bỗ sung đến khả 11/1389/1/1/8.)/17.ÑNU/ 8/8, //,.NEN An naẢẢẢ 15
6 KOC MMA ccc ccc cccccsececssesecsecsecsessessessssvsevssvsessessssssessnssnsensensessersevsissseessnsevee 18
II Ứng dụng thuật toán trên nền tảng ngôn ngữ R để nghiên cứu vi nhựa trong nước mặt lục địa, sông Sài Gòn và sông Đồng Nai 0 He 18
Trang 31 Tóm tắt bài nghiên cứu S2 2T 1121121111111 12112171112 101111 re 18
2 Phạm vi ứng dụng của phương pháp PCA trong bai nghién cwu 19 2.1 Kết quả phân tích tương quan và PCA các đặc điểm về hình dạng của vỉ nhựa trong môi trường nước sông Sài Gòn - Đồng Nai trong năm 2021 19 2.2 Kết quả phân tích trơng quan và PCA các đặc điểm về hình dạng của vỉ nhựa trong môi trường nước sông Sài Gòn - Đồng Nai trong năm 2022 22
I Đánh giá chất lượng sinh thái cho tỉnh Thanh Hóa trong năm 2021 dựa vào
chỉ số sinh thái viễn thám (RSE') - 2s TS E1EE1111211211112121 1.11 1E errrrea 25
1 Tóm tắt nghiên cứu - 25s T1 121221211111 2121 1212221111 rea 25
2 Phạm vi ứng dụng của phương pháp phân tích thành phần chính PCA trong MIEN CUTE a 26
2.1 Chỉ số sinh thái viễn thám RSE]ä Ặ 5 SE 212222 rerag 26 'INNs Ốc nôn ng cố 26 2.1.2 Chỉ số độ ẩm WỮel - 5: 5s 2 E2122112112112112211212112221221222 re 26
VI N9 li 26
2.2 Phương pháp phân tích thành phần chính PCA à Snnnerreg 27
3 Kết quả 1 sTtT 2T 2122112111211 1c 1 2tr 28 3.1 Xây dựng các bản đồ từng thành phẩmÄ à ST He 28
PHAN 3: SU DUNG BO DU LIEU DE PHAN TICH BANG PHAN MEMR 32
I Gidi thigu mau nghién Ciuc ccccccccccccccecccsesescsesesesvsesesevsesesevsesesecseseseees 32
1 Giới thiệu bộ dữ liệu 22 S25 2122112 11121111112112111211121221211 22a 32 In" n8 nang 32
I0 1 N Nnh 32 D3 Mute dich nghién CHU 000 ốố.ố 32
2 MO Ga nnc-ÉẢÉÁÝ£ÃÉÝỶÝỶÝỶÝỶÝẢẢ 32
IL Phan tich thanh phan chinh (PCA) 00.00.cccccccccccscsccssescsssesscsessevsessessvsseeseserseeees 33
1 Bude 1: Lara chon bién phan tich 0 cccccccccccccccsccscssessesesseesessesevstssecsessnssneeees 33
LL Ma tréin hé 96 turong Quan ccccccccccccccccccccccscesscscescssessessessessesessesvseesesvssese 33
1.2 Kiém dinth 70 nan" 34
Trang 42 Bước 2: Xác định các thành phần chính - - Q0 2012112221222 22211111322 x2 35
2.1 Xác định số lượng thành phần chính - SH HH He 35 2.2 Xác định số thành phần chính giữ lại SH HH2 rgeg 36 2.3 Đánh giá chất lượng biểu diễn của biến phân tích Ặ Srrye 37
3 Bước 3: Xác định biến nào thuộc thành phần chính nào 38
4 Bước 4: Chuyên dữ liệu sang không gian mới 2 S31 S321 1711 cEtrxe 39
4.1 Đặt tên 2 biến thành phần chính nnnnHHH Hrrya 39
4.2 Chuyển dữ liệu sang không gian mới - 5 ST HH uyu 40
HI Kết luận 5 2S 512121111271 1121171112121 tr ueu 41 TAL LIEU THAM KHẢO - 5 s21 S212E1211211222712 1117122111 tre 42
Trang 5DANH MUC BANG
Bảng |: K1 hi2u c3c m4u nuSe 6p g8c-chanh day duec d3nh g13 cảm quan trong thi nghi2m (v5i luong g8c cD dinh 150 g) - -.- 2 2c 2221122122211 1211 11221111111 111 111181 x key 10 Bảng 2: Trọng sD của c3c thành phân -2- c5 S111 S11152111111E111 11111121 112111 2 1e6 13
Bang 3: Phân tích đH sai 12ch (Analysis of Deviance) của phương trLnh (5) 15
Bang 4: Kiém dinh Likelihood (Likelihood Ratio Tests) cua phuong trLnh (5) 16
Bảng 5: Phân tích đH sai 12ch (Analysis of Deviance) cua phuong trLnh (6) 17
Bang 6: Kiém dinh Likelihood (Likelihood Radio Tests) của phương trLnh (6) 17
Bang 7: étrc d3nh gi3 theo chi sD RSE cccceccccccscesesssesescseseseesesesesestseseseseseseeeres 27 Bảng 8: Bảng tơng hợp kết quả tính PCA - 55-51 12111111111 1111111171111 1.1 xe 29 Bảng 9: ủiải thích biến 5 c2 1211111 111111111 11 1211 111 1 H1 1H g tru 33 Bảng 10: êa trận h2 sD tương quan sau khi chuân hĩa - 5-52 S11 2 E2 Ezcxe2 33 Bang 11: H2 sD <.°0 .AIAIiIII 35 Bảng 12: Eligenvalue c1 221120111211 121 11121111211 1811 1101112011101 1 1001111119011 11 1g k 35 s0 4y) nh 37
Bảng 14: CommunaÏIfy - - 2 2221221111211 152311511 11211 1521118111101 115 1811111182111 ens 38 Bảng 15: ủiải thích thành phần chính PC và c3c biến phụ thuHc 55-555: 40 Bảng I6: Nhân sD của 10 quan s3t đầu tiên - 2s 111121111111111121211 112 1xe 40 DANH MỤC HÌNH HLnh 1: ui3 tri riéng (Eigenvalue) va phan tram tích lay của phương sai (cumulative variability %)của c3c thành phần biểu diễn theo Scree plot - 5:5 2s zzszx2 13 HLnh 2: Sc phan bD c3c thuHe tinh cam quan theo kết quả đ3nh gi3 của cảm quan viên c1 101111151121111 11101111 H11 1111111111111 511k HH HH HH H1 11T TH TH HH HH 11 ng 14 HLnh 3: Sc phan bD cua c3c m4u nuSe g8c-chanh day va c3c thuHe tinh cam quan trên cùng mút pheng tương quan gifa thành phần chính thir | va tht 2.0.0 14 HLnh 4: Tương quan gifa tỷ sD odd v51 khDi lượng dịch quả va ty 12 pha loang 18
HLnh 5a: Kết quả phân tích PCA của R 5-52 2s 22911 1211211211211122 12 r0 20 HLnh 6a: Kết quả phân tích PCA của R - 52 51 E911 1211211211211 21 g 23 HLnh 7: Bản đồ 4 chỉ sD NDVI, WET, TVDI, TREẺ 5-5 5S 2191121711152 26 29 HLnh 8: Két quả tính chỉ sD RSEI, tỉnh Thanh Hĩa năm 2021 2 52 2522£+zzzzzz2 30 HLnh 9: Kết quả của kiêm định Bartlett 2 SH HS 150111 51515111111115 121118 34 HLnh 10: Biểu đồ khuỷu tay c n E1 E1 1E11211112111121111111211 11 111111 run 36 HLnh I1: Đồ thị so s3nh mức đĩng gĩp trung bLnh c3c biến trong Dim l 38
HLnh 12: Đồ thị so s3nh mức đĩng gĩp trung bLnh c3c biến trong Dim 2 39
HLnh 13: Đồ thị phân tân trên 2 trục PC + 5+ 21 12111871211112112111E 151cc rrreg 40 HLnh 14: Đồ thị phan t3n trên 2 trục PC theo thế lh2 2s 221 221271271221221 115212 41
Trang 6PHAN 1: TONG QUAN VE PHAN TICH THÀNH PHẢN CHÍNH
1 Khái niệm
Phân tích thành phần chính (Principal Component Analysis - PCA) là mHt trong nhfng phương ph3p phân tích df1i2u đã chiều được sử đụng trong thDng kê mục đích làm giảm chiều (giảm sD lượng biến) nhưng v4n gif lại được nhiều nh§t c3c thông tin của tập df1i2u ban đâu
2 Bản chất của phân tích thành phần chính
Thec ch8t vi2c cô đọng thông tin hay giảm chiều df1i2u của phương ph3p phân tích thành phần chính là thay thế p biến ban đầu (có quan h2 tương quan v5i nhau)
bằng mHt sD thành phần chính (biến mãi) là z (v5i z < p) 66i thành phân chính là tô
hợp tuyến tính của c3c biến ban đầu C3c thành phần chính được x3c định trên cơ sở
có mDi liên h2 tuyến tính cao v5i c3c biến ban đầu và gifa c3c thành phần chính không tương quan v5i nhau ợ> được sử dụng như bưŠc tiền xử II df li2u cho c3c phương ph3p hồi quy bHi và phân cụm df lu
Đề thcc hi2n giảm chiều, PCA biến đôi tập df1i2u ban đầu lên mHt h2 trục tọa
đH mã5i mà c3c trục tọa đH là c3c thành phần chính sao cho mỗi thành phần chính là mHt hàm hồi quy tuyến tính của c3c biến ban đầu C3c thành phần chính được x3c định trên cơ sở có mDi liên h2 tương quan cao v5i c3c biến ban đầu và gifa c3c thành phần chính không tương quan v5i nhau Thành phần chính đầu tiên sẽ có phương sai lŠn nh§t hay là trục tọa đH mà c3c quan s3t được phân bD tDi đa (phân t3n rHng nh§t) trên trục đó
3 Mục đích của phân tích thành phần chính
- ủiảm chiều dfli2u: PCA giúp giảm sD lượng biến đầu vào của đf li2u, chuyên
từ không gian ban đầu sang không gian mãi có sD chiều (thường ít hơn) mà ván gif lai được phần l5n thông tin quan trọng từ đf1i2u ban đầu Điều này giúp làm cho df1i2u trở nên dễ quản l1 hơn và giảm đH phức tạp trong vi2c phân tích
Trang 7Phât hi2n sc tương quan: PCA giúp phât hi2n và hiểu rõ se tương quan gifa c3c biến Nó tLm ra c3c "thành phần chính" hode "vector riêng" của df li2u, đó
là những hư5ng chứa phần I5n biến thiên trong df li2u
Nón thông tin: PCA cho phóp biêu diễn dfli2u ban đầu dư5i dạng tô hợp tuyến tính của c3c thành phần chính Điều này có nghĩa rằng bạn có thể lưu trf df 1i2u mHt c3ch hi2u quả hơn vất ít thông tin hơn, mà v4n gif lai duoc c3c đdc
ợ> Tóm lại, PCA là mHt công cụ mạnh mẽ trong phân tích df li2u, giúp tiết ki2m thời gian và tạo ra biêu đồ hodc biêu đồ giúp hiệu rõ hơn về m1 quan h2 và đdc điểm quan trọng trong df li2u
4, Pham vi 4p dung:
Phan tich thanh phan chính được 3p dụng cho biến định lượng hode biến định tính vãi thang đo thứ bậc
Ngoài mục đích tổng hợp biến mối sử dụng trong c3c phương ph3p phân tích
df li2u kh3c như đã đề cập ở trên, PCA được ứng dụng nhiều trong lĩnh vcc
kinh tế - xã hHi nhằm tính to3n c3c chỉ sD tổng hợp
Trang 8PHAN 2: PHAN TICH NGHIEN CUU
1 Ứng dụng phương pháp phân tích thành phần chính và hồi quy logistic trong đánh giá cảm quan nước ép gắc — chanh dây
1 Lý đo chọn đề tài
San xu8t nưộc 6p tr3I cây ngày càng trở nên quan trọng đDI vi thị trường trong nưc đo nhu cầu sử dụng sản phẩm ti2n lợi và bổ đưỡng Nưc 6p g8%c-chanh dây kết hợp sẽ lam tang gi3 trị đính dưỡng và cải thi2n mùi vị thơm ngon cho sản phẩm Tuy vậy, sản phẩm cần cĩ thêm c3c bưŠc nghiên cứu về đ3nh gi3 cảm quan của người tiêu dùng đề x3c nhận kết quả của nghiên cứu nảy và đảm bảo tiềm năng của sản phẩm mất trên thị trường
Phân tích cảm quan cung c8p cho c3c nhà tiếp thị hiểu về ch8t lượng sản phẩm thcc phẩm, hư5ng đến ch8t lượng sản phẩm tDt và cải tiến sản phẩm theo quan điểm của người tiêu dung (Lawless and Heymann, 1998) Phuong ph3p phan tích thành phần chính (PCA) đã được sử dụng và xem xĩt bởi c3c nhà nghiên cứu cho c3c ứng dung d3nh gi3 cảm quan cho c3c sản phâm thcc phẩm kh3c nhau PCA cĩ thê được 3p dụng cho vi2c điều tra df1i2u ưa thích, do đĩ cĩ thé tạo ra mHt khơng gian sản phẩm- người tiêu dùng dea trén df li2u ch8p nhan (Hough ef a/., 1992â ủreenhooff and
écFie, 1994) Day cang 1a mHt cơng cụ để miêu tả sc kh3c bi2t gifa c3c thuHe tinh cảm quan của c3c sản phẩm thcc phâm (Powers, 1984) Di quan h2 gifa người tiêu dùng và đf li2u mơ tả, cang như df li2u thu nhận từ cảm quan và dụng cụ đo cĩ thê được hLnh dung mHt c3ch rõ ràng bởi PCA PCA cang được sử dụng để cung c8p c3ch
hLnh dung mDi quan h2 gifa c3c sản phẩm và thuHc tính
Ngồi ra, c3c mơ hLnh hồi quy logistic r8t hfu ích để mơ tả ảnh hưởng của c3c yếu
tD dc b3o (c3c biến đHc lập) lên biến nhị phân (biến phụ thuHe) thé hi2n két qua ch8p nhận hođc khơng ch8p nhận của người tiêu đùng (Agresti, 1996) Kết quả từ hồi quy
logistic cĩ thể được giải thích bằng c3ch sử dụng ưŠc tính x3c su8t hodc ty sD kha di
ưc tính Hồi quy logistic cĩ thé de do3n x3c su§t ưŠc tính rằng mHt sc ki2n sẽ thành cơng hodc th8t bại dea trên mHt sD dc b3o (biến đHc lập) (Hạr e a/., 1998) Nếu x3c su§t dc đo3n lŠn hơn 0,5 thL de do3n là cĩ (thành cơng), ngược lại là khơng (Agresti, 1996) Nĩi c3ch kh3c, x3c su8t thành cơng hay th8t bại của biến phụ thuHc khơng bị
Trang 9ảnh hưởng bởi biến đHc lập Tỷ sD oddđ có gi3 trị âm cho th8y se suy giảm trong x3c su§t thành công, vả tỷ sD odd dương cho thầy khả năng thành công tăng lên (Hanr e7 ai., 1998) Phương phầp hồi quy logistic đã được 3p dụng trong mHt vài trường hợp trong lãnh vee d3nh gi3 cam quan
2 Tóm tắt bài nghiên cứu
Trong nghiên cứu này, c3c cảm quan viên được đảo tạo để đ3nh gi3 c3c thuHc tính kh3c nhau của sản phâm nưc 6p g8c-chanh dây Hàm lượng dịch chanh dây sử dụng
từ 50-200 g (150 g g8c) va ty I2 pha loãng tông c3c thành phân (g8c và chanh dây) vi nưốc (1:8 đến 1:15) Phân tích thành phần chính (PCA) x3c định hai thành phần chính
chủ yếu chiếm 80,43% phương sai trong df li2u thuHc tinh cam quan PCA cho th8y thuHc tính cảm quan quan trọng của nưŠc óp này là hương vị, màu sắc và đH đồng nh§t Khả năng ch8p nhận chung của sản phâm được mô phỏng (phân tích hồi quy logistic) nhu mHt ham cua ham lueng dich qua chanh dây và tỷ l2 pha loãng của nưŠc trong sản phẩm êDi quan h2 thDng kê quan trọng gifa c3c biến được x3c định
(P<0,05) Ty 12 pha loãng v51 nưŠc 1:8 va ham lượng g8c:chanh day la 150:130-150 (ø/g), tương ứng cho sản phẩm có gi3 trị cam quan va hop ch8t sinh học cao nh§t Kết quả cang cho th8y tính hfu ích của PCA và phân tích hồi quy logistic đề x3c định và
đo lường c3c thuHc tính sản phâm nưŠc 6p g8c-chanh dây có 1 nghĩa quan trọng đDi
vi sc ch&p nhận và ưa thích của người tiêu dùng
3 Mục tiêu bài nghiên cứu
êục tiêu của nghiên cứu này là 3p dụng phương ph3p phân tích thành phần chính (PCA) va phuong ph3p héi quy Logistic dé m6 ta c3c thuHe tinh cam quan của nưŠc
óp g8c-chanh dây được chuẩn bị v5i sc kết hợp của c3c hàm lượng thay đổi (so vi ø8c) và ty I2 pha loãng v5i nưấc đề chọn ra sản phâm có gi3 trị cảm quan cao và phủ hợp v1 sở thích của người tiêu dùng
Trang 104 Phương tiện và phương pháp nghiên cứu
4.1 Chuẩn bị mẫu
r
4.1.1 Chuẩn bị mang gdac
Tr3i g8c¢ chin được thu nhan, riva sach v51 nuSc va dé 130 éang 28c duoc t3ch
ra (Nguyén éinh Thuy vd ctv., 2009) và được đóng gói sẵn trong bao bL PA, bảo quản trong tủ đông (T°C< -18°C) cho đến khi sử dụng
4.12 Chuẩn bị dịch guả chanh dây
Tr31 chanh dây được rửa sạch sau khi thu nhận, để r3o và bổ đôi quả, t3ch phần thịt và hạt trong quả Ép I§y phần dịch quả và lọc sạch nhằm loại c3c màng và xơ l4n vào
4.1.3 Chế biến nước ép gác-chanh đây
êàng ø8c được cân định lượng 150 g, sau đó phDi trHn v5i địch quả chanh dây vãi c3c khDi lượng lần lượt như sau: 50, 100, 150, 200 g Xay mịn phần nguyên li2u
đã phDi trHn v5i c3c ty 12 nư5c I:8â L:10â 1:12,5 và 1:15[tông khDi lượng nguyên li2u (ø):nư5c (mL)] và lọc sạch phần hỗn hợp thu được Phần dịch hỗn hợp sau lọc được
chỉnh đH Brix đến 7,5 Sau đó, thec hi2n đồng hóa m4u (ủJB30-40, China), 3p su§t
30ÊPa trong 6 phút Sau đó, dịch quả (g8c và chanh dây) được gia nhi2t ở nhi2t đH
100°C trong thời gian 5 phút Sản phâm được tồn trf lạnh 2 ngày trưŠc khi đ3nh gi3
cảm quan và được k[ hi2u (Bảng 1)
Bảng I: Ký hiệu các mẫu nước ép gắc-chanh dây được đánh giá cảm quan trong
thí nghiệm (với lượng gac co dinh 150 g)
Khoi lượng dịch Tỷ lệ pha loãng (sác-chanh dây:nướt) (g/mL)
Trang 114.2 Danh gia cam quan Hước ép hn hop
4.2.1 Phương pháp đánh giá các thuộc t.nh cảm quan c-a nước ép gác-chanh dây ười cảm quan viên được huần luy2n tại BH môn Công ngh2 thcc phẩm,
Trường Đại học Cần Tho dé d3nh gi3 c3c m4u nude óp g8c-chanh dây C3c cảm quan viên được hưŠng dán đầnh gi3 sản phâm nưŠc 6p v5i mức đH ưa thích theo cường đH
mô tả về mùi, vị, màu sắc và trạng th3i [điểm từ L đến 5 theo thang điểm của phương ph3p phân tích mô tả định lượng QDA (Quantitave Descriptive Analysis) được thiết
lập)]
4.2.2 Phương pháp đánh giá cám quan về s1 chấp nh2n sản phẩm
Khả năng ch8p nhận sản phâm được đ3nh gi3 sử dụng thang nhị thức
(c6/kh6ng) theo phuong ph3p uarcia ef al (2009) SD luong cam quan viên là 50 người
4.3 Phương pháp phân tích thông kê
4.3.1 Phân t.ch thành phân ch.nh (PCA)
Phân tích thành phần chính (PCA) là mHt kỹ thuật thDng kê phân tích đa biến được sử đụng rHng rãi, có thể 3p dụng cho đf1i2u QDA (chuẩn bị thuẴHc tính v5i c3c điểm mô tả thuHc tính) đề giảm tập hợp c3c biến phụ thuHc (gọi là thuHc tính) đến mHt tập hợp df li2u nhỏ hơn của c3c biến cơ bản (gọi là yếu tD) dca trên mô hLnh của tương quan gifa c3c biến ban đầu Df li2u được thu thập từ c3c cảm quan viên, sau khi cho điểm theo cường đH thuHc tính (QDA) C3c df1i2u của c3c thuHc tính kh3c nhau đã nêu ở trên được sắp xếp theo thứ te tăng hođc giảm dần và xử 11 bằng phần mềm thDng kê XLSTAT 2017.01.41150 Sau đó, đf 1i2u được giảm băng c3ch phân tinh df1i2u, c3c biến đHc lập và phụ thuHc được lea chọn và đồ thị 2 trục của c3c m4u được thu nhận
4.3.2 Phan t,ch héi quy logistic
Phương trLnh hồi quy logistic (phương trLnh L) có thể được xây dcng vi c3c gi3 tri B là 0 (không ch8p nhận) hodc 1 (ch8p nhận) được thu nhận từ kết quả đ3nh gi3 cảm quan của người tiêu dùng
Trang 12F(x) —efo+fia
1—F(x) Trong đó, đầu vào là gi3 trị 8o+ 1x và dau ra la F(x) Trong phân tích hàm nhiều
biến, 8o+f 1x có thê sửa đối thành 8o+, x,+B;x;+ +„x„ Sau đó, khi được sử dụng trong c3e phương trLnh liên quan đến tỷ sD odds vi gi3 trị của c3c yếu tD dc b3o, phương trLnh hồi quy tuyến tính sẽ trở thành hồi quy không tuyến tính v5i m bién, c3c
thông sDổ, cho t8t cả 7 = 0, 7, 2, , m được uốc tính
5 Kết quả và thảo luận
5.1 Ảnh hướng của tỷ lệ pha loãng và khối lượng chanh dây bỗ sung đến chất lwong cam quan san pham
Sản phẩm nưŠc óp g8c - chanh dây được đầnh gi3 cam quan dca trén c3c thuHe tính như: màu đỏ cam, mùi ø8c, mùi chanh dây, vị ngọt, vị chua, trạng th3i đồng nh§t
và đH s3nh theo phương ph3p mô tả định lượng QDA, phân tích thành phần chính (PCA) va phan tích khả năng ch8p nhận của người tiêu dùng theo phương ph3p
logistic
Phuong ph3p phan tích thành phần chính nhằm x3c định sD lượng thành phần chính (7 thuHc tính cảm quan của sản phâm nưc 6p g8c-chanh đây) cần thiết đề biéu dién df li2u “Scree plot” thé hi2n thứ te giảm dần về đH I5n của c3c gi3 trị riêng (Eigenvalue) va gi3 trị phần trăm tích lay của phương sai Trong phương di2n phan tích nhân tD hodc phân tích thành phần chủ yếu, “Scree plot” giúp cho nhà phân tích hLnh dung được tầm quan trọng tương đDi của c3c thành phần C3c thành phan can phải mô tả được ít nh8t 80% phần trăm tích lay của phương sai (Shi e a/., 2002) Trong trường hợp này, hai thành phần | va 2 (F1 và F2) có gi3 trị riêng lấn hơn 1 và
chiếm 80,43% phần trăm tích lay phương sai (HLnh L) Thành phần thứ 3 va thứ 4 (F3
và F4) có t3c đHng r8t nhỏ so v5i biến, có thê nhận biết qua đường cong tích lay phương sai không có sc thay đôi nhiều Bên cạnh đó, có sc giảm mạnh đH l5n của gi3
trị riêng thành phần thứ 3 và thứ 4 (F3 và F4) ĐH lãn của thành phần thứ 3 đến thứ 7 (F3 đến F7) r8t nhỏ so v5i thành phần thir | va thứ 2 (F1 và F2), do đó không cần sử dụng c3c thành phân từ thành phần thứ 3 (F3) trở đi đề trLnh bày tập hợp sD li2u cảm
quan đã thu thập
Trang 13Hình 1: Giá tri riéng (Eigenvalue) va phan tram 1,ch lity c-a phuong sai (cumulative
variability %)c-a cdc thanh phan biNu dién theo Scree plot
éa tran thé hi2n tuong t3c gifa c3c thuHc tính cảm quan và c3c thành phần duoc thé hi2n ở Bang 2
Từ kết quả thu được, thành phần chính thứ L (F 1) và thứ 2 (F2) được xây dcng
trên tương t3c v5i c3c thuHc tính cảm quan và thê hi2n ở phương trLnh 2 và 3
Fl 9 0,393 Vi chua + 0,251 VỊ ngọt - 0,396 éau dé cam + 0,463 êùi chanh
Trang 14
0,75 0,5 0,25
-0,5 -0,75
Dea vao sc phan bD c3c thuHe tinh cam quan, có thé chia c3c thuHe tinh nay
thành 2 vùng riêng bi2t ThuHc tính đH đồng nh§t nằm xa trục F1 (thành phần chính thứ nh§t) nên thuHc tính nảy ít có ảnh hưởng đến thành phần chính thứ nh§t ThuHc tính mùi chanh dây nằm cạnh trục F2 (thành phần chính thứ 2) nên thành phần chính
thứ 2 phụ thuHc nhiều vào thuHc tính mùi chanh dây Ngoài ra, c3c thuHe tính như mùi ø8c, mùi chanh dây, đH s3nh và màu đỏ cam gần trục F1 Như vậy, thành phần chính thứ 1 chịu ảnh hưởng nhiều nhất bởi thuHc tính mùi g8c, mùi chanh dây và đH s3nh Bên cạnh đó, c3c thuHc tính nằm gan nhau có mDI liên h2 thuận v51 nhau (như thuHe tính mùi ø8e và mùi chanh dây), nhóm thuHc tính nằm kh3c phía nhau (180°) có mDi
liên h2 nghịch đảo v51 nhau và c3c thuHe tinh nằm c3ch nhau 90° thL không có liên h2
vãi nhau (Cañeque e¿ z., 2004)
2 ^ 4À e's M10 1,5 Độ dong 1M9
M7 M15 -2
-25 -2 -15 -1 -05 O0 05 II 15 2 2,5
F1 (61,26 %)
Hình 3: S1 phân bố c-a các mẫu nước gắc-chanh dây và các thuộc t,nh cảm quan trén cSng mTt phang tương quan gia thành phân ch,nh thW 1 va thW 2
Trang 15Khi thê hi2n c3c m4u nuSe 6p g8c-chanh day va c3c thuHe tinh cam quan trên
đỗ thị, c3c m4u nưŠc óp gø8c-chanh đây có vị trí gần nhau thL có thuHc tính cảm quan
tương te nhau Sc phân t3n m4u trên đồ thị HLnh 3 cho th8y c3c mức đH tỷ 12 phDi chế
vãi c3c mức khDi lượng dịch quả chanh dây bố sung kh3c nhau có ảnh hưởng r8t l5n đDi vất tính ch§t cảm quan của sản phẩm Nhóm m4u có khDi lượng dịch chanh dây bỗ sung 50g được đãnh gi3 là có dH s3nh cao, không có vi ngọt hay vị chua Đây là nhóm máu có tỷ 12 phDi chế v5i hàm lượng ø8e cao hơn hàm lượng chanh dây r8t nhiều Nhóm c3c m4u có lượng địch chanh dây phDi chế là 150g là nhóm được đầnh gi3 có vị chua ngọt hài hòa và mùi chanh dây vừa phải đdc trưng cho sản phẩm Đây là nhóm san pham duoc c3c cảm quan viên ưa thích
5.2 Ảnh hướng của tỷ lệ pha loãng và khối lượng chanh dây bỗ sung đến kha nang chấp nhận của sản phẩm
Phương ph3p phân tich kha di (Logistic) d3nh 913 kha nang ch8p nhan (1) hay không ch8p nhận (0) của người tiêu dùng đDi v5i sản phâm ở c3c khDi lượng dịch quả chanh dây và tỷ 12 nư5c phDi chế kh3c nhau Từ gi3 trị cảm quan của sản phẩm vi nhiều thuHc tính sẽ đ3nh gi3 được khả năng ch8p nhận sản phẩm của người tiêu dùng Kết quả thDng kê cho th8y có thế xây đeng tDt mô hLnh hồi quy Logistic dién ta sc tương quan gifa ty sD kha di va 2 biến đHc lập (tỷ l2 pha loãng và khDi lượng dịch chanh dây phDi chế) Phương trLnh tương quan (4) và 5) được thê hi2n:
Tỷ sD khả dĩ oP (4)
Trong đó: tị = 11,29 + 0,045X — 2,27Y — 0,0002X’ + 0,08Y* + 0,001 XY (5)
Vãi X: là khDi lượng địch quả chanh dây phDi chế (g)
Y: là ty 12 pha loãng vŠI nưốc
Phân trăm đH sai 12ch của mô hLnh là 12,77% và phần trăm đH I2ch được điều
chinh (Adjusted percentage) la 7,35%
ui3 tri dH sai 12ch cua m6 hLnh va residual được trLnh bày ở Bảng 3
Bảng 3: Phân tích độ sai lệch (Analysis of Deviance) của phương trình (5)
Trang 16Nguồn D6 sailéch Doty Giá trị
(Source) (Deviance) do (DĐ P
Total (corr.) 221,58 159
Kết quả cho th8y Deviance của mô hLnh là 28,29 và gi3 trị P của mô hLnh nhỏ
hơn 0,05, có thể kheng định se tương quan có 1 nghĩa về mút thDng kê ở mức đH tin cay 95% Hon nfa gi3 tri P của residuals (sai sD) 15n hon 0,05, càng có thể kheng định
rằng mô hLnh này là không kóm hơn khi so v5i mô hLnh tDt nh8t c6 thé (v5i mire dH tin
cậy 95% hodc cao hơn) Bên cạnh đó, kiểm định Likelihood (Bảng 4) nhằm đầnh gi3
đH tương thích của mô hLnh thông qua đ3ãnh g13 se đóng góp của từng nhân tD vào trong mô hÙnh được dé xu8t
Bang 4: Kiém dinh Likelihood (Likelihood Ratio Tests) cia phuwong trinh (5)
(Factor) Squared do) P
DH sai 12ch (deviance) nhỏ nhất là ø13 trị mong mụDn ủi3 trị P của c3c nhân tD cang được x3c định
Kết quả thê hi2n ở Bảng 5, cho th8y gi3 trị P của c3c nhân tD đều nhỏ hơn 0,05,
ngoại trừ tương t3e X và Y co tri sD là 0,128 (> 0,05) Như vậy, tương t3c XY không
có L nghĩa về mdt thDng kê, phương trLnh (5) được chuyên thành phương trLnh (6)
rợ8,972+0,063X-2,072Y-0,00024X”+ 0,082Y”(6)
Vã5i phương trLnh này, phần trăm sai I2ch (deviance) của mô hLnh và phần trăm
được điều chỉnh tương ứng là 11,72% và 7,21% Cả hai gi3 trị này đều nhỏ hơn so vỗi
Trang 17m6 hLnh 5, cho th8y se cai thi2n dH tuong thich (goodness of fit) cha c3c 913 tri cua m6 hLnh de do3n va thee nghi2m
Kết quả phân tích df li2u của mô hLnh theo phương trLnh 6 được thế hi2n ở Bảng 5 Kết quả phân tích đH sai 12ch của phương trLnh 6 cho thầy gi3 trị Deviance của mô hLnh nay là 25,97 (nho hon so v51 Deviance cua m6 hLnh 5 1a 28,29) và Deviance cua Residual là 195,61 (I5n hơn so v5i mô hLnh 5 là 193,29) Nếu mô hLnh
dc đo3n có đH l2ch nhỏ nh§t có L nghĩa, tương ứng vối ø13 trị P rất nhỏ (< 0,05) thL co thê kết luận có sc tương quan I nghĩa gifa c3c đf 1i2u đc đo3n và đf li2u đo đạc Kết quả thê hi2n gi3 trị P của mô hLnh nhỏ hơn 0,05 VL vậy, có thê kheng định se tương quan có 1 nghĩa về mdt thDng kê ở mức đH tin cậy 95% Hơn nữa gi3 trị P của c3c sai l2ch còn lại (residuals) nhỏ hơn 0,05 chỉ ra rằng mô hLnh này là không kóm hơn khi so
vãi mô hLnh tDt nh§t có thê (mức đH tin cậy > 95%)
Bảng 5: Phân tích độ sai lệch (Analysis of Deviance) của phương trình (6)
(Source) (Deviance) do (Df) tri P
Bang 6: Kiém dinh Likelihood (Likelihood Radio Tests) cia phương trình (6)
(Factor) Squared (Df) tri P
êô hLnh bề mdt đ3p ứng thé hi2n sc tương quan gifa tỷ sD khả dĩ v5i khDi
lượng dịch quả phDi chế và ty 12 pha loãng v5i nư5c được trLnh bày ở HLnh 4
Trang 18Thuận lợi của mô hLnh thu nhận là cho th8y khả năng ưa thích sản phâm (hay tỷ
sD ođđ) đạt được cao nh§t khi sản phẩm được phDi chế v5i lượng dịch quả là 133,294
g va ty 12 pha loãng L:8 (df1i2u được tính to3n từ mô hLnh tDi ưu được de đo3n) Kết quả phân tích c3c chỉ tiêu LI hóa học và thông qua c3c phương ph3p đ3nh 913 cảm quan cho th8y m4u phDi chế v5i lượng dịch chanh dây là 150 ø và tỷ 12 pha loãng 1:8 cho c3c g13 tri về hàm lượng c3c hợp ch§t có hoạt tính sinh học cao cang như g13 tri cảm quan tDt nh§t và được người tiêu dùng ch8p nhận
Ty sé kha di (Odd ratio)
Khôi lượng dịch quả (g) we
Hinh 4: Twong quan giVa tỷ số odd với khối lượng dịch quả và tỷ lệ pha loãng
chanh dây là trạng th3i (đH s3nh và đH đồng nh§t), màu sắc (đỏ cam) và mùi vị (mùi
ø8c, mùi chanh dây) Kết hợp c3c phương ph3p thDng kê PCA và hồi quy Logistic c3c
df li2u yêu thích sản phẩm cho th8y ti2n ích của chúng trong x3c định c3c thuHc tính cảm quan của sản phâm nưŠc 6p g8c-chanh dây cho sc ch8p nhận của người tiêu dùng NưŠc 6p g8c-chanh dây sử dụng dịch qua la 133-150g (so v51 g8c la 150 g) va
tỷ 12 pha loãng 1:8 (khDi lượng tổng cHng ø8c-chanh dây:nư5c) có gi3 trị cảm quan va hàm lượng c3c hợp ch§t sinh học cao nhất
Trang 19IL Ứng dụng thuật toán trên nền tảng ngôn ngữ R để nghiên cứu vi nhựa trong nước mặt lục địa, sông Sài Gòn và sông Đồng Nai
1 Tóm tắt bài nghiên cứu
Nghiên cứu dc b3o diễn biến phầt tần vi nhca trong nưŠc mứt lục địa bằng ngôn ngf lập trLnh R, thuật to3n có chức năng mô hLnh hóa c3c đđc điểm hLnh dạng của vi nhea theo mùa trong năm và mcc nưốc thủy triều trong ngày Công t3c 18y m4u nưŠc và c3c yếu tD về không gian, thời gian được thcc hi2n tại 18 vị trí trên lưu vcc sông Sài ủòn và sông Đồng Nai, c3c m4u sau khi 18y qua lư5i êanta sẽ được loại bỏ thủ công e3c tạp ch8t lŠn hơn 5mm như cảnh cây, l3, vật 2u xây dcng, nhfng manh nhea lấn Tổng cHng 144 m4u nưŠc được bảo quản trong c3c chai thủy tính tDi màu nhăm tr3nh bị ảnh hưởng nhi2t đH hay 3nh s3ng môi trường te nhiên và được vận
chuyên đến phòng thí nghi2m Nation Lab và phòng phân tích Vi2n đôi trường và
Kinh tế tuần hoàn iền Nam (IECES) đề phân tích x3c định vi nhca
Kết quả ứng dụng nghiên cứu cho th8y t8t cả c3c vị trí 18y m4u trên lưu vce c3c sông Sài ủòn - Đồng Nai đều đang có mức vi nhca dang soi cao va tang tịnh tiến theo c3c năm Kết quả nghiên cứu là công cụ hi2u quả trong de đoần diễn biến thay đôi về đđc điểm, hLnh dạng của vi nhea dưõi t3c đHng của môi trường, theo mùa trong năm, theo thủy triều lên và xuDng Hơn na, kết quả nghiên cứu này có thê được sử dụng để
điều chỉnh c3c mô hLnh phù hợp v5i df1i2u được thu thập trong điều ki2n liên tục,
lượng df1i2u lưu trf lấn, đH chính x3c cao Cần có sc chú trọng trong nguồn øDc làm ph3t sinh ví nhea để có sc kiếm so3t và quản II kịp thời Đây là công cụ đóng góp quan trọng trong nghiên cứu ví nheca trong nưŠc sông Sài gòn, sông Đồng Nai và sẽ là ứng dụng rHng rãi cho nghiên cứu vi nhea nưŠc mứdt lục địa
2 Phạm vi ứng dụng của phương pháp PCA trong bài nghiên cứu
Trong nền tảng ngôn ngf R, để phân tích PCA c3c đdc tính của ví nhca theo thời gian và không gian, nghiên cứu sử dụng c3c hàm R tích hợp Preomp() vả
Princomp() ủói Packages được sử dụng cho c3c hàm này gồm Devtools và
Factoextra
Trang 20Kết quả phân tích tương quan đa biến và PCA c3c đdc tính hLnh dạng của vi nhca trong môi trường nưc sông Sài ủòn và sông Đồng Nai trên nền tảng R được thê hi2n qua hLnh 1 va 2 tương ứng vi 2 năm nghiên cửu
2.1 Kết quả phân tích trơng quan và PCA các đặc điểm về hình dạng của vỉ nhựa trong môi trường nước sông Sài Gòn - Đồng Nai trong nam 2021
Dea theo kết quả thu được sau khi phân tích PCA băng ngôn ngfR được thê hi2n trong HLnh 5 đã cho th8y những đóng góp đầu tiên thành phần chính về hLnh d3ng vi nhca trong năm 2021 thỏa mãn phần trăm giải thích phương sai >10% là
PCI(56,6%), PC2(23,8%) và PC3 (12,7%) được biểu diễn trên HLnh 5a và HLnh 5c
Tuy nhiên, nghiên cứu này chỉ lea chọn 2 thành phân chính đầu tiên vL tông 2 thành phan nay da giải thích được toàn bH 80,4% tập đf li2u yêu cầu (tổng giải thích phương sai hai thành phần chính I5n hơn 50%) C3c vector màu xanh cho biết mDi quan h2 gifa c3c biến ban đầu (hLnh d3ng êPs) và c3c thành phần chính, đH dài của vector cho biết đH mạnh của mDi tương quan của biến ban đầu vãi thành phần chính Theo kết qua phan tích ma trận xoay trong HLEnh 5a, mDi tương quan ø1fa c3c hLnh d3ng vi nhea trong HLnh 5d và kết qua gi3 tri P-Value trong HLnh 5b cho th8y rang:
1) Dạng sợi - dạng kh3c gần như không có mDi tương quan (r o 0,08) va dang mảnh - dạng hạt có mDi tương quan yếu (r ợ 0,47), c3c gi3 tri P-Value < 0,050> Ch8p nhận H0, có l nghĩa thDng kê
11) Ngoài ra, HLEnh 5a cang cho th8y dạng mảnh và dạng hat co mDi tuong quan vãi thành phần chính PCI cao hơn c3c dạng kh3c và dạng sợi, ngoài ra trong PC2 thL dạng sợi và dạng kh3e có mDi tương quan cao või thành phần chính này (nhưng gi3 trị P-Value gifa dạng soi-dang kh3c trong HLnh 5b lai cho th8y chung kh6ng có L nghĩa thDng ké P-Value o 0,48)
Hinh 5a: Két qua phan t,ch PCA c-a @ Hình 5b: Kết quả trình diễn hệ số tương
quan và giá trị PValue c-a các hình dạng
vỉ nhĩa từ â
20
Trang 21Dangiat 0.5285401 0.199185 0.78366503 0.25¢5351 Probability values |
Dangkhac 0.4022830 0.7412344 -0.32301907 -0.419917€ DangSoi DangMann DangHat DangKhac
Biểu diễn phương trLnh cho thành phân chính PCI:
PCI o 0,49DangSoi + 0,56Dangéanh + 0,53DangHat
Biéu dién phuong trLnh cho thanh phan chinh PC2:
21