1. Trang chủ
  2. » Luận Văn - Báo Cáo

hoàng thị bích phân loại quế theo vùng trồng bằng phân tích đa biến kết hợp phân tích mẫu bằng quang phổ hồng ngoại

50 0 0
Tài liệu đã được kiểm tra trùng lặp

Đang tải... (xem toàn văn)

Tài liệu hạn chế xem trước, để xem đầy đủ mời bạn chọn Tải xuống

THÔNG TIN TÀI LIỆU

Nội dung

Hiện nay, phương pháp sử dụng dữ liệu phổ hồng ngoại để phân loại các sản phẩm tự nhiên đang rất được quan tâm.. Do vậy, hoàn toàn có thể ứng dụng phương pháp toán hóa phân tích đa biến

Trang 1

\ươ]]]]]]]]]]]]]]]]]]]]]]]]]]]]]]]]]]]]]]]]]]]]]]]]]]]]]]]]]]]]]]]]]]]]]]]]]]]]]]]]]]]]]]]]]]]]]]]]]]]]]]]]]]]]]]]]]]]]]]]]]]]]ư[[[[[[[[[[[[[[[[[[[[[[[[[[[[[[[[[[[[[[[[[[[[[[[[[[[[[[[[[[[[[[[[[[[[[[[[[[[[[[[[[[[[[[[[[[[[[[[[[[[[[[[[[[[[[[[[[[[[[[[[[[[[[[[[[[[[[[[[[[[[[[[[[[[[[[[[[[[[[[[[[[[[[[[[[[[[[[[[[[[[[[[[[[[[[[[[[[[[[[[[[[[[[[ơ

Trang 3

LỜI CẢM ƠN

Khóa luận tốt nghiệp này được thực hiện và hoàn thành tại Viện Công nghệ Dược phẩm Quốc gia, Trung tâm Kiểm nghiệm thuốc, mỹ phẩm, thực phẩm Hà Nội và khoa Hóa phân tích và Kiểm nghiệm thuốc dưới sự hướng dẫn của NCS ThS Bùi Thị Lan Phương

Lời đầu tiên, em xin bày tỏ sự kính trọng và lòng biết ơn sâu sắc đến NCS ThS Bùi Thị Lan Phương đã dành thời gian, tâm huyết hướng dẫn em tận tình trong suốt thời gian thực hiện khóa luận này

Em xin được gửi lời cảm ơn chân thành tới các anh chị ở Viện Công nghệ Dược phẩm Quốc gia đã cho em cơ hội được thực hiện khóa luận tại đây, hỗ trợ em trong quá trình thực hiện khóa luận

Em xin gửi lời cảm ơn chân thành tới Ban lãnh đạo Trung tâm Kiểm nghiệm thuốc, mỹ phẩm, thực phẩm Hà Nội và các anh chị ở Khoa Hóa lý của Trung tâm đã tạo điều kiện, hướng dẫn, hỗ trợ em sử dụng thiết bị trong quá trình thực hiện khóa luận

Em xin cảm ơn thầy cô, anh chị khoa Hóa phân tích và Kiểm nghiệm thuốc đã hướng dẫn, chỉ dạy em trong thời gian thực hiện khóa luận

Em xin chân thành cảm ơn Ban Giám hiệu, các thầy cô công tác tại Trường Đại học Dược Hà Nội đã truyền đạt những kiến thức, kinh nghiệm quý báu để em có thể hoàn thành khóa luận tốt nghiệp này

Cuối cùng, em xin gửi lời cảm ơn sâu sắc đến gia đình, người thân, bạn bè đã luôn ủng hộ, giúp đỡ và động viên em trong quá trình học tập và hoàn thành khóa luận này

Bài khóa luận không tránh khỏi những thiếu sót, em rất mong nhận được những ý kiến đóng góp quý báu của thầy cô và các bạn để bài khóa luận được hoàn thiện hơn

Em xin chân thành cảm ơn!

Hà Nội, ngày 03 tháng 06 năm 2024 Sinh viên

Hoàng Thị Bích

Trang 4

MỤC LỤC LỜI CẢM ƠN

DANH MỤC CÁC KÝ HIỆU CHỮ VIẾT TẮT DANH MỤC CÁC BẢNG

DANH MỤC HÌNH VẼ VÀ ĐỒ THỊ

ĐẶT VẤN ĐỀ 1

CHƯƠNG 1: TỔNG QUAN 2

1.1 Tổng quan về dược liệu quế 2

1.1.1 Đặc điểm sinh thái và phân bố của quế ở Việt Nam 2

1.1.2 Bộ phận thường sử dụng của quế 2

1.1.3 Tác dụng chữa bệnh của quế 3

1.1.4 Thành phần hóa học trong quế 3

1.2 Tổng quan về phương pháp quang phổ hồng ngoại 3

1.2.1 Phương pháp quang phổ hồng ngoại 3

1.2.2 Quang phổ hồng ngoại biến đổi Fourier – phản xạ toàn phần suy giảm 5

1.2.3 Một số nghiên cứu ứng dụng quang phổ hồng ngoại trong phân tích mẫu 7

1.3 Phân loại mẫu quế theo nguồn gốc bằng phân tích đa biến 7

1.3.1 Khái quát về phân tích đa biến 7

1.3.2 Các thuật toán phân tích đa biến sử dụng để phân loại 8

1.3.3 Ứng dụng phương pháp toán hóa phân tích đa biến trong phân tích phân loại dược liệu quế 14

CHƯƠNG 2: ĐỐI TƯỢNG VÀ PHƯƠNG PHÁP NGHIÊN CỨU 15

2.1 Đối tượng nghiên cứu 15

2.2 Nguyên vật liệu, thiết bị 15

2.3 Nội dung nghiên cứu 15

2.4 Phương pháp nghiên cứu 15

2.4.1 Chuẩn bị mẫu 15

2.4.2 Lựa chọn kích thước mẫu đo 16

2.4.3 Thu nhận quang phổ hồng ngoại 16

2.4.4 Phân loại quế theo vùng trồng bằng phân tích đa biến 16

CHƯƠNG 3: KẾT QUẢ VÀ BÀN LUẬN 18

3.1 Lựa chọn kích thước mẫu nghiên cứu 18

3.2 Phân tích phổ hồng ngoại 20

3.2.1 Quế Quảng Nam 22

3.2.2 Quế Yên Bái 23

3.2.3 Quế Quảng Ninh 24

Trang 5

3.2.4 Quế Thanh Hóa 25

3.3 Phân loại quế theo vùng trồng 26

3.4.2 Phân tích phổ hồng ngoại các mẫu 34

3.4.3 Phân loại quế theo vùng trồng bằng phân tích đa biến 35

KẾT LUẬN VÀ ĐỀ XUẤT 37PHỤ LỤC

Trang 6

DANH MỤC CÁC KÝ HIỆU, CHỮ VIẾT TẮT

2 ATR Phản xạ toàn phần suy giảm Attenuated Total Reflection 3 BNN Mạng nơron lan truyền ngược Backpropagation Neural

Network

7 FTIR Quang phổ hồng ngoại biến đổi

10 LDA Phân tích phân biệt tuyến tính Linear Discriminant Analysis

17 PLS Hồi quy bình phương tối thiểu

DA

Phân tích phân biệt kết hợp hồi quy bình phương tối thiểu từng phần

Partial Least Squares – Discriminant Analysis

Trang 7

DANH MỤC CÁC BẢNG

Bảng 1.1: Bảng phân loại các vùng hồng ngoại 4

Bảng 1.2: Msố đỉnh đặc trưng trên phổ IR 5

Bảng 1.3: Dữ liệu đa biến thu được từ phân tích quang phổ 8

Bảng 1.4: Cách sắp xếp dữ liệu trong phân tích phân biệt 10

Bảng 3.1: Độ hấp thụ tại các số sóng của các kích thước khác nhau 19

Bảng 3.2: Kết quả phân tích ANOVA với mức ý nghĩa 0,05 19

Bảng 3.3: Độ hấp thụ tại các đỉnh số sóng tương ứng của các vùng 21

Bảng 3.4: Độ hấp thụ tại một số đỉnh của quế vùng Thanh Hóa và Yên Bái 26

Bảng 3.5: Bảng tóm tắt dữ liệu hồng ngoại tập luyện để phân loại (training set) 26

Bảng 3.6: Bảng tóm tắt dữ liệu hồng ngoại tập kiểm tra để phân loại (testing set) 26

Bảng 3.7: Kết quả khảo sát lựa chọn các thông số mô hình PCA – DA 27

Bảng 3.8: Kết quả phân loại mẫu theo mô hình PCA – DA 28

Bảng 3.9: Kết quả khảo sát lựa chọn các thông số mô hình PLS – DA 29

Bảng 3.10: Kết quả phân loại mẫu theo mô hình PLS – DA 30

Bảng 3.11: Kết quả khảo sát lựa chọn các thông số mô hình BNN 31

Bảng 3.12: Kết quả phân loại mẫu theo mô hình BNN 33

Trang 8

DANH MỤC CÁC HÌNH VẼ, SƠ ĐỒ, ĐỒ THỊ

Hình 1.1: Các bộ phận của cây quế (sưu tầm) (a) Vỏ quế; (b) Lá quế 3

Hình 1.2: Các sản phẩm từ quế (sưu tầm) (a) Trà quế; (b) Tinh dầu quế và quế bào 3

Hình 1.3: Giao thoa kế Michelson [14] 5

Hình 1.4: Nguyên lý của kỹ thuật đo phản xạ toàn phần suy giảm ATR [27] 6

Hình 1.5: Biểu đồ phân tán điểm PC [4] 9

Hình 1.6: Mô hình nơron nhân tạo [15] 13

Hình 3.1: Mẫu bột quế sau khi rây phân loại kích thước 18

Hình 3.2: Kết quả chồng phổ FTIR của các mẫu với 4 kích thước khác nhau 19

Hình 3.3: Biểu đồ chồng phổ FTIR trung bình của bốn vùng 21

Hình 3.4: Hình ảnh phổ FTIR mẫu quế Quảng Nam 22

Hình 3.5: Hình ảnh phổ FTIR của mẫu quế Yên Bái 23

Hình 3.6: Hình ảnh phổ FTIR mẫu quế Quảng Ninh 24

Hình 3.7: Hình ảnh phổ FTIR mẫu quế Thanh Hóa 25

Hình 3.8: Biểu đồ mô Hình phân loại PCA – DA 28

Hình 3.9: Biểu đồ mô hình PLS – DA 30

Hình 3.10: Biểu đồ mô hình BNN 4 lớp, 35 nơron mỗi lớp 33

Trang 9

1

ĐẶT VẤN ĐỀ

Quế được trồng phổ biến ở nhiều nơi trên thế giới và được sử dụng rộng rãi do mùi hương đặc trưng, giá trị dược liệu cao với các đặc tính như kháng khuẩn, chống ung

thư, chống viêm mạnh… Ở Việt Nam, loài quế chính là Cinnamomum cassia, được

trồng trải dài từ Bắc vào Nam trong đó Yên Bái, Quảng Ninh, Thanh Hóa và Quảng Nam là những địa phương có diện tích vùng trồng lớn Điều kiện địa lý, khí hậu, phương pháp canh tác khác nhau giữa các vùng trồng giúp quế sinh trưởng, phát triển với những đặc điểm khác nhau, ảnh hưởng đến chất lượng của quế, thành phần hóa học trong các bộ phận của quế Vì vậy, việc xác định nguồn gốc của các sản phẩm quế đóng vai trò quan trọng trong việc giúp nhà sản xuất khẳng định giá trị sản phẩm quế của mình

Phương pháp quang phổ hồng ngoại là phương pháp phân tích hiện đại, được sử dụng rộng rãi và hiệu quả cho cả phân tích định tính và định lượng các hợp chất hữu cơ và vô cơ Phổ hồng ngoại đặc trưng riêng cho các chất phân tích Hiện nay, phương pháp sử dụng dữ liệu phổ hồng ngoại để phân loại các sản phẩm tự nhiên đang rất được quan tâm Phương pháp này có ưu điểm chuẩn bị mẫu đơn giản, thời gian phân tích nhanh, kết quả tin cậy và thân thiện với môi trường

Phương pháp phân tích đa biến được áp dụng trong hóa học phân tích để lập kế hoạch thí nghiệm, tối ưu hóa thông tin hóa học trích xuất từ tập dữ liệu phân tích và cung cấp thông tin hữu ích từ tập dữ liệu ban đầu Sử dụng các thuật toán thống kê cho phép giảm hoặc đơn giản hóa tập số liệu ban đầu, sắp xếp hoặc nhóm các số liệu thành nhóm có cùng thuộc tính, tìm ra sự phụ thuộc và quan hệ giữa các biến, xây dựng và kiểm tra các giả thiết thông kê Trong phân tích phân loại, phương pháp phân tích đa biến cho phép phân loại mẫu căn cứ vào các dữ liệu định lượng hoặc định tính Do vậy, hoàn toàn có thể ứng dụng phương pháp toán hóa phân tích đa biến để phân loại quế theo vùng trồng với dữ liệu phân tích quang hồng ngoại của bột vỏ quế

Trên cơ sở đó, đề tài “Phân loại quế theo vùng trồng bằng phân tích đa biến kết

hợp phân tích mẫu bằng quang phổ hồng ngoại” được thực hiện với hai mục tiêu:

− Phân tích mẫu bột vỏ quế bằng quang phổ hồng ngoại − Phân loại quế theo vùng trồng dựa vào phổ hồng ngoại của mẫu bột quế bằng

phương pháp phân tích đa biến

Trang 10

2

CHƯƠNG 1: TỔNG QUAN 1.1 Tổng quan về dược liệu Quế

1.1.1 Đặc điểm sinh thái và phân bố của quế ở Việt Nam

Quế là cây nhiệt đới ẩm, thích hợp với khí hậu nóng ẩm và ưa sáng Cây sinh trưởng tốt trên đất đồi núi có độ dốc vừa phải, đất ẩm, nhiều mùn, tơi xốp, thoát nước tốt, đất chua đến hơi chua [8] Ở mỗi vùng trồng, khí hậu, vị trí địa lý và phương pháp canh tác khác nhau, chất lượng quế thu được cũng khác nhau

Tại Việt Nam, cây quế được trồng chủ yếu ở các tỉnh miền núi phía Bắc, phân bố rải rác đến phía Nam, gồm các tỉnh Quảng Ninh, Cao Bằng, Bắc Kạn, Thái Nguyên, Bắc Giang, Lào Cai, Yên Bái, Ninh Bình, Thanh Hóa, Quảng Nam Trong đó, nhiều vùng trồng quế đã được hình thành từ lâu đời: Yên Bái (quế Văn Yên, Văn Chấn…), Quảng Ninh (quế Bình Liêu, Tiên Yên, Hà Cối…), Thanh Hóa (quế Thường Xuân, Ngọc Lạc…), Quảng Nam (quế Trà My – Trà Bồng…)

Mỗi vùng trồng quế khác nhau sẽ cho các mẫu quế với đặc điểm khác nhau: - Quế Thanh Hóa: Hàm lượng tinh dầu trong quế Thanh khá cao, trung bình đạt 3,7 % Tuy nhiên hàm lượng cinnamaldehyd lại khá thấp, trung bình chỉ đạt 58,6 % [3]

- Quế Yên Bái: Quế Văn Yên có sự khác biệt rõ ràng so với các loại quế ở vùng trồng khác: hàm lượng ẩm thấp (14,1 – 15,7 %), hàm lượng tinh dầu (4,4 – 6,1 %, v/w) và hàm lượng aldehyd cinnamic trong tinh dần cao (84,9 – 90,1 %, v/w) [5]

- Quế Quảng Nam: Quế Trà My được biết đến với tên gọi “Cao sơn ngọc quế”, có mùi thơm, vị cay nồng đặc trưng, chứa hàm lượng tinh dầu cao (8,9 – 10,9 %, v/w) và hàm lượng aldehyd cinnamic trong tinh dầu từ 89,8 – 93,4 %, v/w [6]

- Quế Quảng Ninh: Hàm lượng coumarin trong quế Quảng Ninh thấp hơn so với các vùng khác (khoảng 0,06 %) [7]

1.1.2 Bộ phận thường sử dụng của quế

Quế là cây đa tác dụng, cung cấp các sản phẩm có giá trị kinh tế như vỏ quế, gỗ, tinh dầu… được sử dụng làm nguyên liệu cho nhiều ngành như sản xuất tinh dầu làm hương liệu, gia vị, làm thuốc chữa bệnh, sử dụng làm hàng thủ công mỹ nghệ [8] Vỏ thân, vỏ cành là bộ phận của cây quế thường được dùng làm dược liệu Vỏ thân được phơi khô trong bóng râm gọi là quế nhục Bên cạnh đó, tinh dầu thu từ cành hoặc lá quế cũng được sử dụng làm hương liệu; gỗ quế được dùng làm các sản phẩm như đũa, tăm, ống đựng tăm…

Trang 11

3

Hình 1.1: Các bộ phận của cây quế (Sưu tầm) (a) Vỏ quế; (b) Lá quế

Hình 1.2: Các sản phẩm từ quế (Sưu tầm) (a) Trà quế; (b) Tinh dầu quế và quế bào

1.1.3 Tác dụng chữa bệnh của quế

Từ xa xưa, quế đã được coi là một vị thuốc quý, là một trong Tứ đại danh dược: Sâm – Nhung – Quế - Phụ, được sử dụng để bồi bổ cơ thể, hỗ trợ cải thiện sức khỏe [9] Quế được sử dụng rộng rãi do có nhiều tác dụng khác nhau: tác dụng chống khối u, chống viêm và giảm đau, chống tiểu đường [10], [30] và chống béo phì, kháng khuẩn và kháng virus [28], [25], tác dụng bảo vệ tim mạch, tác dụng bảo vệ tế bào, bảo vệ thần kinh, điều hòa miễn dịch [34], [18]…

1.1.4 Thành phần hóa học trong quế

Đã có rất nhiều nghiên cứu về thành phần hóa học trong quế và có hơn 160 chất đã được phân lập từ vỏ thân, vỏ cành và lá quế Trong đó, terpenoid là nhóm chất có nhiều trong cây, bao gồm các monoterpenes, diterpenoid, sesquiterpenoid Phenylpropanoid là thành phần có hoạt tính sinh học chính của quế, gồm hợp chất cinnamaldehyd, acid cinnamic… Bên cạnh đó trong cây còn có các hợp chất nhóm glycosid, hợp chất nhóm lignan, hợp chất nhóm lactone và các hợp chất khác [20], [38], [37], [18]…

1.2 Tổng quan về phương pháp quang phổ hồng ngoại

1.2.1 Phương pháp quang phổ hồng ngoại

Trang 12

4

này Trong quang phổ hồng ngoại, bức xạ hồng ngoại được truyền qua mẫu Bức xạ hồng ngoại có bước sóng lớn hơn 100 µm được phân tử hữu cơ hấp thụ và chuyển thành năng lượng quay cực phân tử, tạo thành phổ gồm những vạch rõ rệt Bức xạ hồng ngoại ở trong vùng 1-100 µm được phân tử hữu cơ hấp thụ và chuyển thành năng lượng dao động phân tử và trên phổ xuất hiện những đỉnh rộng hơn Năng lượng của bức xạ hồng ngoại chỉ đủ làm thay đổi trạng thái dao động nên phổ IR được gọi là phổ dao động [2]

Phổ hồng ngoại đặc trưng cho các liên kết cũng như tương tác giữa các liên kết trong phân tử Hình dạng phổ, số lượng đỉnh và vị trí đỉnh thay đổi theo số lượng và loại liên kết nên độ chọn lọc của phổ cho các chất khi phân tích rất cao Các mẫu được sử dụng trong quang phổ hồng ngoại có thể ở trạng thái rắn, lỏng hoặc khí [33]

Vùng hồng ngoại được chia thành ba vùng như trong bảng sau:

Bảng 1.1: Bảng phân loại các vùng hồng ngoại [33] Vùng hồng ngoại Bước sóng,

-1 Tần số (v), Hz

Cận hồng ngoại (NIR) 0,78 – 2,5 12800 – 4000 3,8 x 1014 - 1,2 x 1014 Hồng ngoại giữa

14 - 1,2 x 1014Hồng ngoại xa (FIR) 50 - 100 200 – 10 3,8 x 1014 - 1,2 x 1014Vùng hồng ngoại

14 - 1,2 x 1014Trong đó, MIR được sử dụng nhiều nhất, tiếp đến là NIR và FIR ít được sử dụng trong phân tích Quang phổ MIR có nhiều ưu điểm như thời gian phân tích nhanh (dưới một phút mỗi mẫu), độ nhạy, cỡ mẫu nhỏ, chuẩn bị mẫu tối thiểu, không có thuốc thử hóa học độc hại Hiện nay, NIR cũng đang rất được quan tâm và ứng dụng vì NIR có năng lượng lớn, có thể đi sâu vào trong mẫu phân tích, mang nhiều thông tin của chất phân tích, đảm bảo được sự đồng đều bên trong mẫu phân tích [17], [21]

1.2.1.2 Phổ hồng ngoại và các nhóm chức đặc trưng

Quang phổ hồng ngoại thường được sử dụng để xác định cấu tạo hóa học vì các nhóm chức tạo nên các dải phổ đặc trưng trong phổ hồng ngoại Phổ IR có thể được chia thành hai vùng:

− Vùng vân tay (fingerprint region): là vùng 1350 – 750 cm-1 đặc trưng Các nghiên cứu thường dựa vào tín hiệu phổ trong vùng này để kết luận sự có hay không có mặt của một nhóm chức nào đó

− Vùng chức năng: Vùng quan trọng khác trong khi biện luận phổ IR là vùng 4000 – 2500 cm-1 và 2000 – 1500 cm-1 Đây là vùng xuất hiện dao động hóa trị của liên kết hydro – dị tố và vùng dao động của các liên kết bội như anken, carbonyl [2]

Trang 13

1.2.2 Quang phổ hồng ngoại biến đổi Fourier – phản xạ toàn phần suy giảm

Đã có nhiều tiến bộ trong kỹ thuật quang phổ hồng ngoại, nổi bật nhất là áp dụng biến đổi Fourier vào kỹ thuật này Hiện nay, quang phổ hồng ngoại biến đổi Fourier (Fourier transform infrared spectroscopy – FTIR) là dạng quang phổ hồng ngoại phổ biến nhất vì nhiều lý do như: lượng mẫu phân tích nhỏ, kết quả phân tích nhanh, nhạy và chính xác hơn đáng kể so với các kỹ thuật cũ

Quang phổ hồng ngoại biến đổi Fourier có thể kiểm tra tất cả các bước sóng của ánh sáng hồng ngoại cùng một thời gian bằng giao thoa kế Michelson

Hình 1.3: Giao thoa kế Michelson [14]

Hầu hết các giao thoa kế đều sử dụng bộ tách chùm tia, nhận chùm tia hồng ngoại tới, được gương chuẩn trực chuyển thành chùm tia song song và chia nó thành hai chùm quang học qua bộ phận tách chùm Một chùm tia phản xạ khỏi một gương phẳng được cố định tại chỗ Chùm tia còn lại phản chiếu khỏi một gương phẳng cho phép gương này di chuyển một khoảng rất ngắn khỏi bộ tách chùm Đường đi của một chùm tia có chiều dài cố định và chùm tia kia liên tục thay đổi khi gương chuyển động, nên tín hiệu thoát

Trang 14

Với kỹ thuật truyền qua, ánh sáng hồng ngoại cần phải đi qua hoàn toàn mẫu nơi nó được hấp thụ trong quá trình truyền qua Quá trình chuẩn bị mẫu để phát hiện đường truyền tốn nhiều thời gian và công sức và có thể phá hủy mẫu ban đầu [16]

Với kỹ thuật đo phản xạ, ánh sáng hồng ngoại phản xạ khỏi bề mặt mẫu sẽ được phát hiện thay vì ánh sáng hồng ngoại truyền qua mẫu Quang phổ hồng ngoại phản xạ hữu ích trong việc kiểm tra các mẫu rắn khó hoặc không thể phân tích bằng kỹ thuật truyền qua [16]

Phản xạ toàn phần suy giảm (ATR) ngày nay là kỹ thuật đo trong quang phổ FTIR được sử dụng rộng rãi nhất do ATR thường cho phép phân tích định tính hoặc định lượng mẫu với ít hoặc không cần chuẩn bị mẫu, giúp tăng tốc độ phân tích mẫu rất nhiều, dữ liệu được lấy trong vài giây

Hình 1.4: Nguyên lý của kỹ thuật đo phản xạ toàn phần suy giảm ATR [27]

Theo kỹ thuật này, ánh sáng hồng ngoại đi vào tinh thể ATR có chiết suất cao ở một góc nhất định Chùm tia hồng ngoại tiếp xúc với tinh thể ATR và tạo ra nhiều phản xạ bên trong, sau đó tạo ra một sóng phù du vượt ra ngoài bề mặt tinh thể Mẫu tiếp xúc với sóng phù du sẽ hấp thụ năng lượng sóng và do đó sóng phù du này bị suy giảm Chùm tia bị suy giảm sẽ phản xạ trở lại tinh thể, sau đó đi ra khỏi đầu đối diện của tinh thể và được dẫn tới máy dò trong máy quang phổ hồng ngoại Máy dò ghi lại chùm tia hồng ngoại đã suy giảm dưới dạng tín hiệu giao thoa kế, sau đó có thể được sử dụng để tạo ra quang phổ hồng ngoại [27] Ưu điểm của ATR – FTIR là chuẩn bị mẫu nhanh, cải

Chùm tia hồng ngoại

Trang 15

7

thiện việc thu thập và tái tạo quang phổ dẫn đến việc xây dựng cơ sở dữ liệu chất lượng tốt hơn để xác định và nhận dạng mẫu chính xác hơn

1.2.3 Một số nghiên cứu ứng dụng quang phổ hồng ngoại trong phân tích mẫu

Quang phổ hồng ngoại với kỹ thuật ATR được áp dụng cho rất nhiều ứng dụng sinh học, từ chụp ảnh các mô ung thư và tế bào sống đến xác định làm lượng protein và thành phần cấu trúc thứ cấp [22] Kỹ thuật ATR cũng được các nhà khoa học sử dụng để phân tích, phân loại mẫu dược liệu như quế [35], [42], Linh Chi [41],…

Trong nghiên cứu của Yan-qun Li và cộng sự năm 2013, kết quả phổ hồng ngoại của quế thu được cho thấy sự chồng chéo hoàn toàn của từng phổ hấp thụ của các thành phần khác nhau Đỉnh vân tay đặc trưng IR của các mẫu quế chủ yếu nằm trong khoảng 1800 – 600 cm-1 Quang phổ điển hình của quế đã được phân tích và có thể rút ra một số đặc điểm: đỉnh ở 1727 cm-1 tương ứng liên kết aldehyd của acid béo bão hòa trong mẫu, các đỉnh ở 1679 cm-1 và 1626 cm-1 tương ứng liên kết của aldehyd cacbonyl C=O… Phổ các mẫu có 16 đỉnh phổ biến được quan sát thấy trên toàn bộ phổ IR của 9 mẫu quế nghiên cứu [42]

ATR – FTIR cũng đã được sử dụng để phân tích 120 mẫu nấm Linh Chi Quang phổ của các mẫu nấm Linh Chi khác nhau có hình dạng tương tự nhau Một số đỉnh phổ biến trong quang phổ của năm loài Linh Chi đã được pháp hiện, cho phép xây dựng cấu trúc của một số nhóm chức năng hóa học đặc trưng cụ thể Các đỉnh chung vào khoảng 3292, 2923, 1637, 1546, 1370,… cm-1 Một số sự hấp thụ yếu vào khoảng 1370, 1315, 1241, 1204 cm-1 Kết quả phổ FTIR sơ bộ xác nhận rằng có sự khác biệt về thành phần hóa học giữa 5 loài Linh Chi khác nhau [41]

Phân tích 219 mẫu Paris polyphylla Smith var yunnanensis (cây Bảy lá một hoa)

được canh tác theo đợt và tại các quận thành phố khác nhau ở tỉnh Vân Nam, Trung Quốc bằng quang phổ ATR – FTIR cho kết quả phân tích mẫu cụ thể Phổ FTIR cho thấy cường độ hấp thụ của mẫu thân rễ thu được từ các vùng khác nhau cho thấy sự khác biệt đáng kể Đối với các mô thân rễ, cường độ hấp thụ xung quanh đỉnh 2885 cm-1 có liên quan đến sự dao động kéo dài của liên kết C – H của lipid Đỉnh nhọn ở 1746 cm-1đặc trưng cho liên kết C = O, cho thấy sự tồn tại của tinh dầu Đỉnh hấp thụ ở 1650 cm-1 là kết hợp của dải saccharid, saponin steroid… [40]

1.3 Phân loại mẫu quế theo nguồn gốc bằng phân tích đa biến

1.3.1 Khái quát về phân tích đa biến

Thuật ngữ “Chemometrics” được định nghĩa là môn khoa học sử dụng các

phương pháp toán học và thống kê để thiết kế hoặc lựa chọn các quy trình và thí nghiệm tối ưu, đồng thời cung cấp thông tin hóa học tối đa bằng cách phân tích dữ liệu hóa học [19], [32] Phương pháp phân tích đa biến sẽ tìm ra mối quan hệ giữa các biến trong tập dữ liệu ban đầu, giảm hoặc đơn giản hóa kích thước tập số liệu, sắp xếp hoặc nhóm các

Trang 16

8

số liệu thành nhóm có cùng thuộc tính, tìm ra sự phụ thuộc và quan hệ giữa các biến, xây dựng và kiểm tra các giả thuyết thống kê

1.3.2 Các thuật toán phân tích đa biến sử dụng để phân loại

Các mẫu được phân loại dựa trên các thuộc tính cụ thể của mẫu, được xác định bằng các phép phân tích như đo phổ hoặc sắc ký Các phương pháp phân loại mẫu bằng phân tích đa biến được chia thành hai nhóm bao gồm phương pháp phân loại có giám sát và phương pháp phân loại không giám sát [36] Các phương pháp phân loại có giám sát sử dụng thông tin của tập huấn luyện gồm các mẫu thuộc nhóm (lớp) đã biết để xây dựng một mô hình toán học và sử dụng mô hình đó để nhận dạng mẫu Phân loại có giám sát gồm các phương pháp: Phân tích phân biệt tuyến tính (Linear Discriminant Analysis – LDA), phân tích phân biệt kết hợp bình phương tối thiểu từng phần (Partial Least Squares – Discriminant Analysis – PLS-DA), mạng nơron nhân tạo (Artificial Neural Network – ANN)… [26] Phương pháp phân loại mẫu không giám sát nhằm phát hiện sự giống nhau giữa các mẫu, nhóm các mẫu có đặc trưng tương tự vào cùng một nhóm mà không cần biết trước thông tin về số lượng hoặc bản chất ban đầu của nhóm đó Phương pháp phân loại mẫu không giám sát bao gồm phân tích thành phần chính (Princial Companent Analysis – PCA), phân tích cụm (Cluster Analysis – CA)… [19] 1.3.2.1 Phân tích thành phần chính (Princial Companent Analysis – PCA)

PCA (Principal Component Analysis) là thuật toán đa biến bằng các quay các trục số liệu ban đầu đến trục tọa độ mới chứa các biến tối ưu sao cho các biến (thành phần chính – PC) chứa hầu hết thông tin có trong mẫu và chúng không tương quan với nhau dựa trên cơ sở tìm ra giá trị đồng phương sai lớn nhất Thành phần chính thứ nhất (PC1) được tạo ra có phương sai lớn nhất và chứa nhiều thông tin có trong dữ liệu gốc nhất có thể PC2 được tạo ra sao cho nó không có mối tương quan với PC1 và chứa càng nhiều thông tin của phần dữ liệu còn lại nhất có thể,… cứ như thế cho đến hết số PC Số PC tối đa bằng số biến ban đầu [24]

Giả sử có một ma trận X (𝑛 × 𝑝) mô tả dữ liệu thu được bằng phép đo quang phổ của n mẫu với p bước sóng (biến) Bảng 1.3 dưới đây cho thấy dữ liệu thu được bằng phép đo quang phổ

Bảng 1.3: Dữ liệu đa biến thu được từ phân tích quang phổ

Trang 17

𝑡1 = 𝑝11 𝑥11+ 𝑝12 𝑥12+ ⋯ + 𝑝1𝑝 𝑥1𝑝Sự kết hợp tuyến tính này được gọi là điểm PC1 cho mẫu 1 Tương tự điểm PC1 cho mẫu 2 được tính như sau:

𝑡2 = 𝑝21 𝑥21+ 𝑝22 𝑥22+ ⋯ + 𝑝2𝑝 𝑥2𝑝Tính toán cho tất cả các mẫu và PC1, PC2 có thể được biểu thị dưới dạng tính toán ma trận dưới đây:

[𝑡11 𝑡12

Hình 1.5: Biểu đồ phân tán điểm PC [4]

Như vậy, bằng phương pháp PCA có thể chuyển tập số liệu gồm p chiều (p cột trong ma trận) ban đầu thành tập số liệu có kích thước nhỏ hơn gồm m chiều tương ứng với số PC

Dựa trên dữ liệu phổ UV-Vis, thuật toán PCA – DA cho kết quả nhận dạng 125 mẫu chè xanh thuộc 4 vùng địa lý khác nhau Tại PC = 12, độ chính xác của mô hình

Trang 18

10

trong tập mẫu chuẩn và tập kiểm tra khá cao Độ chính xác của tập mẫu chuẩn là 85 % Trong tập kiểm tra, có 6 mẫu chè Lâm Đồng và 7 mẫu chè tỉnh khác nhận dạng đúng 100 % Mô hình đã nhận dạng đúng 3 trong 5 mẫu chè Thái Nguyên… Độ chính xác của mô hình nhận dạng 25 mẫu tập kiểm tra đạt 84 % [4]

PCA được ứng dụng trong dự đoán phân loại nguồn gốc địa lý của Cynomorium songaricum Rupr được trồng tại các vùng khác nhau ở Trung Quốc Sử dụng PCA để trực quan hóa các nhóm C songaricum khác nhau thu được hai PC với phương sai lần lượt là 79,5 % (PC1) và 10,1 % (PC2) Tám loại mẫu C songaricum nói chung có thể

được phân loại [23]

Trong nghiên cứu nhận dạng và phân loại mật ong của Nguyễn Thế Anh (2017), phổ NMR của 57 mẫu mật ong được chia thành 3 vùng phổ Sau khi thực hiện thuật toán PCA với từng vùng phổ cho thấy vùng phổ carbohydrat cho ý nghĩa về mặt phân loại nhất, có sự phân nhóm rõ rệt nhưng độ chụm của các mẫu chưa cao Sau khi sắp xếp lại dữ liệu, thực hiện lại thuật toán PCA cho kết quả phần trăm phương sai của hai PC đầu tiên đã được cải thiện, tổng giá trị hai PC lớn hơn 55% nên kết quả có ý nghĩa phân loại [1]

1.3.2.2 Phân tích phân biệt (Discriminant Analysis – DA)

DA là kỹ thuật đa biến được sử dụng để phân tách hai hay nhiều nhóm quan sát dựa trên k biến được đo trên mỗi mẫu và tìm ra sự đóng góp của từng biến trong việc tách các nhóm DA hoạt động bằng cách tìm ra một hoặc nhiều tổ hợp tuyến tính của k biến được chọn [13]

Giả sử có m nhóm, mỗi mẫu được chọn từ mỗi nhóm có kích thước n1, n2,…, nm với k biến được đo của mỗi mẫu Mỗi mẫu được ký hiệu Yijl được giải thích: i đại diện cho mẫu thứ i của mỗi nhóm (i = 1, 2, 3,…, ni); j đại diện cho nhóm (j = 1, 2, 3, …, m) và l đại diện cho biến đo được trong mỗi mẫu (l = 1, 2, 3, …, k) Dữ liệu được biểu diễn trong bảng sau:

Bảng 1.4: Cách sắp xếp dữ liệu trong phân tích phân biệt

Nhóm 1

Trang 19

11

Dữ liệu trong Bảng 1.4 sẽ được sử dụng để tìm tổ hợp tuyến tính của k biến đo được để phân tách m nhóm Sự kết hợp tuyến tính này được gọi là hàm phân biệt (Discriminant Function – DF) Để phân tách hai nhóm, xác định tổ hợp tuyến tính của các biến Y để tối đa hóa khoảng cách giữa hai vector trung bình Tổ hợp tuyến tính được sử dụng là:

Z = a1Y1 + a2Y2 + … + aiYi Hàm Z được gọi là DF, ai đại diện hệ số liên quan đến từng biến được ước tính Trong trường hợp có nhiều nhóm (m nhóm) được so sánh với k biến, ni mẫu trong nhóm thứ i, hàm DF được tính:

Z = ai1Y1 + ai2Y2 + … + aikYk Hàm DF1 là Z1 phản ánh sự khác biệt giữa các nhóm nhiều nhất có thể Hàm DF2 là Z2 phản ánh sự khác biệt giữa các nhóm mà không được thể hiện ở DF1 Z1 và Z2 không tương quan Số lượng các hàm tuyến tính để phân biệt các nhóm phải nhỏ hơn k biến và m-1 nhóm Hai hoặc ba DF đầu tiên sẽ đủ để thể hiện hầu hết sự khác biệt giữa các nhóm

Mục tiêu thứ hai của DA là dự đoán hoặc phân bố các mẫu vào các nhóm sử dụng các biến phân biệt để dự đoán Giả sử có m nhóm và k biến được đo của mỗi mẫu Quy trình phân loại mỗi mẫu vào các nhóm được thực hiện như sau:

− Tính vector trung bình của mỗi nhóm (𝑌̅1, 𝑌̅2,… , 𝑌̅𝑘) − Tính khoảng cách 𝐷12 từ mẫu đến mỗi nhóm bằng hàm phân biệt tuyến tính

hoặc hàm phân biệt bình phương − Phân loại Y vào nhóm có 𝐷12 có giá trị nhỏ nhất Kết quả cuối cùng của DA là một mô hình có thể được sử dụng để dự đoán phân loại mẫu vào các nhóm Mô hình này cho phép hiểu mối quan hệ giữa tập hợp các biến được chọn với các mẫu Mô hình cũng cho phép đánh giá sự đóng góp của các biến khác nhau [13]

Mô hình PCA – DA kết hợp 2 thuật toán, dùng PCA để giảm chiều kích thước dữ liệu theo các thành phần chính (PC) và dùng DA để phân loại các mẫu sau khi đã giảm chiều PCA – DA đã được áp dụng trong việc nhận dạng quế dựa vào hàm lượng các chất phân tích trong quế Mô hình PCA – DA cho kết quả phân loại trên 20 mẫu quế của tập kiểm tra có thể chấp nhận được với độ chính xác 95 % [7]

Sử dụng mô hình PCA – DA để nhận dạng loài Fritillariae cirrhosae dựa vào dữ

liệu quang phổ cận hồng ngoại và 3 nguồn dữ liệu khác được nghiên cứu năm 2023 Kết quả cho thấy, sau khi tổng hợp dữ liệu ba nguồn, độ chính xác của mô hình PCA – DA

Trang 20

12

là 95 % Sau khi tổng hợp dữ liệu bốn nguồn, độ chính xác về nhận dạng loài của mô hình là 97,5 % Qua đó có thể kết luận rằng, kết hợp bốn nguồn dữ liệu với phương pháp

tổng hợp dữ liệu và phân tích đa biến có thể xác định loài Fritillariae cirrhosae – một

loại thảo mộc của Trung Quốc [39] 1.3.2.3 Phân tích phân biệt kết hợp hồi quy bình phương tối thiểu từng phần (Pritial Least Squares Discriminant Analysis PLS – DA)

PLS – DA là phương pháp phân tích phân biệt được sử dụng khi biến đầu ra là phân loại Kỹ thuật này đặc biệt thích hợp để xử lý các mô hình có nhiều yếu tố dự đoán hơn là mẫu và có tính đa cộng tuyến [31] PLS thường dùng để mô hình hóa mối quan hệ giữa biến độc lập X và biến phụ thuộc Y, từ đó có thể đoán được thông tin Y khi đã biết các thông tin của X và ngược lại

Mô hình của PLS – DA giải thích như sau: X(𝑚 × 𝑛) là ma trận tín hiệu của m mẫu đo với n biến) Y(𝑚 × 1) là ma trận nhóm của m mẫu đo với 1 là biến phản hồi (các nhóm) Hai ma trận X và Y được phân tích dưới dạng mối quan hệ tuyến tính:

𝑌 = 𝑋 × 𝐶 + 𝑟 Trong đó, C là vecto hệ số hồi quy, r là ma trận số dư Giá trị nhóm của mẫu chưa biết Ytest, có tín hiệu Xtest được tính như sau:

𝑌𝑡𝑒𝑠𝑡 = 𝑋𝑡𝑒𝑠𝑡 × 𝐶 + 𝑟 Như vậy, PLS – DA cho phép kẻ một đường thẳng làm ranh giới giữa các nhóm tuyến tính

Mô hình PLS – DA được ứng dụng nhiều trong phân tích phân loại Mô hình PLS

– DA được ứng dụng để truy xuất nguồn gốc xuất xứ của giống Paris polyphylla Smith var yunnanensis với dữ liệu ATR – FTIR của 219 mẫu được canh tác theo đợt tại các

vùng thuộc tỉnh Vân Nam, Trung Quốc được phân loại cho kết quả đáng tin cậy [40]

Nghiên cứu lựa chọn số sóng bằng PLS – DA để phân loại mẫu thuốc dựa trên nhiều tiêu chí cho kết quả: áp dụng mô hình PLS - DA cho dữ liệu Viagra và Cialis ATR – FTIR đã làm giảm đáng kể phần trăm số sóng, cải thiện hiệu suất phân loại khi so sánh với việc sử dụng tất cả số sóng ban đầu [29]

Năm 2019, Yuan-yuan Wang và cộng sự đã sử dụng phương pháp phân tích phân biệt kết hợp bình phương tối thiểu một phần PLS – DA để phân loại Linh Chi dựa trên dữ liệu quang phổ ATR - FTIR Nghiên cứu đã kết luận rằng: dữ liệu quang phổ ATR – FTIR được xử lý trước kết hợp với PLS – DA là một phương pháp đơn giản, nhanh chóng, không phá hủy mẫu và tương đối rẻ tiền để phân biệt giữa các loài nấm Ưu điểm chính của PLS – DA là các nguồn biến thiên dữ liệu có liên quan được mô hình hóa bằng các biến tiềm ẩn và điểm PLS liên quan sau đó được tính toán và vẽ đồ thị theo cặp, cho phép biểu thị trực quan sự phân tách nhóm [41]

1.3.2.4 Mạng nơron nhân tạo (Aritificial Neural Network - ANN)

Trang 21

13

Mạng nơron nhân tạo (ANN – Artificial Neurral Network) là một hệ thống tính toán bắt nguồn từ sự hoạt động của các nơron trong hệ thần kinh Trong hệ thống thần kinh, ở mỗi nơron có phần thân (soma) chứa nhân và nhận dữ liệu đầu vào qua các sợi nhánh (dendrites) và truyền dữ liệu đầu ra qua sợi trục (axon), đến các sợi nhánh của các nơron khác Mỗi nơron nhận xung điện từ các nơron khác qua sợi nhánh

ANN chỉ lấy cảm hứng từ não bộ và cách nó hoạt động, không phải bắt chước hoàn toàn các chức năng của nó Cấu trúc của một nơron nhân tạo do McCulloch và Pitts hoặc đơn vị ngưỡng nghiên cứu vào năm 1943 như sau:

Hình 1.6: Mô hình nơron nhân tạo [15]

Đơn vị ngưỡng nhận đầu vào từ N đơn vị khác hoặc từ bên ngoài, được đánh số từ 1 đến N Đầu vào thứ i gọi là xi và trọng số liên quan được gọi là wi Tổng đầu vào của một đơn vị là tổng của các trọng số đầu vào, Σ𝑖=1𝑁 𝑤𝑖 𝑥𝑖 = 𝑤1 𝑥1+ 𝑤2 𝑥2+ ⋯ + 𝑤𝑁 𝑥𝑁 Đầu ra được biểu thị dưới dạng 𝑔(Σ𝑖=1𝑁 𝑤𝑖 𝑥𝑖− 𝑡) (𝑃𝑇1) Như vậy, có thể xem trọng số là đại lượng tương đương với synapse và hàm g tương đương với axon trong nơron sinh học [15]

Có các kiểu mạng nơron là mạng nhiều lớp (multilayered), mạng truyền thẳng (feed-forward) và mạng truyền ngược (backpropagation) Mạng truyền ngược có khả năng thực hiện liên kết mẫu, phân loại mẫu, nén dữ liệu, điều khiển robot,… [15]

Trên cơ sở dữ liệu UV-Vis của các mẫu chè xanh, mô hình ANN được ứng dụng để phân loại nguồn gốc các mẫu Mô hình mạng ANN tối ưu được sử dụng để phân loại mẫu chuẩn là mô hình 1 lớp ẩn, 200 nơron cho kết quả độ chính xác là 99 % Tiến hành thử với 25 mẫu trong tập kiểm tra đạt độ chính xác 84 % Trong đó, các mẫu chè tỉnh Thái Nguyên và tỉnh Lâm Đồng đạt độ chính xác 100 % [37]

Mô hình mạng truyền ngược BNN được ứng dụng trong phân loại quế dựa trên hàm lượng các chất có trong quế đã cho kết quả phân loại chính xác 100 % các mẫu trong tập kiểm tra Các mẫu của tập luyện và tập kiểm tra đều được phân loại rõ ràng,

𝑔(Σ𝑖=1𝑁 𝑤𝑖 𝑥𝑖 − 𝑡)

Trang 22

14

có thể nhận thấy bằng mắt thường Mô hình cho kết quả phân loại cải thiện hơn so với mô hình PCA – DA và PLS – DA [7]

1.3.3 Ứng dụng phương pháp toán hóa phân tích đa biến trong phân tích phân loại

dược liệu quế

Năm 2013, nghiên cứu phân tích, đánh giá thành phần tinh dầu của vỏ quế bằng phương pháp quang phổ GC – MS và FTIR trên 9 mẫu vỏ quế từ ba loài và bảy môi trường sống Phương pháp PCA đã được thiết lập để phân tích dấu vân tay FTIR của quế Phân tích PCA thu được ba thành phần chính là PC1, PC2, PC3 có tỷ lệ đóng góp phương sai lần lượt là 78,3 %, 10,8 %, 6,6 % Ba thành phần chính đầu tiên đã đóng góp 95,7 % tổng số phương sai và phản ánh phần lớn thông tin phổ ban đầu [42]

Đã có nghiên cứu sử dụng quang phổ FTIR và phân loại toán hóa thống kê đa biến để phát hiện sự tạp nhiễm của mẫu gia vị quế Phổ FTIR cho thấy sự khác biệt đáng kể về độ hấp thụ của các mẫu quế giả và quế thật Mô hình PCA cho thấy khả năng phân tách 2 nhóm quế còn khó khăn với mẫu quế giả có tỷ lệ trộn phụ gia thấp (< 10 %) PLS – DA là kỹ thuật cho kết quả phân loại vượt trội hơn Tỷ lệ phân loại chính xác các mẫu trong khoảng từ 78,9 – 94,4 % và luôn ở mức trên 90 % khi PLS – DA được sử dụng làm công cụ phân loại [11].

Tại Việt Nam, nghiên cứu về nhận dạng quế đã được thực hiện Các mô hình PCA – DA, PLS – DA và BNN được dùng để phân loại quế theo vùng trồng Các mô hình sử dụng dữ liệu để phân loại là hàm lượng 5 chất phân tích trong vỏ quế với 130 mẫu quế (110 mẫu tập luyện và 20 mẫu tập kiểm tra) Đối với mô hình PCA – DA, kết quả khảo sát trên 20 mẫu tập kiểm tra có độ tin cậy và độ chính xác là 95 %, nhưng biểu đồ phân loại 110 mẫu quế tập luyện cùng với 20 mẫu kiểm tra lại không khả quan, các mẫu có độ chụm không cao, không thể phân loại được mẫu của 4 tỉnh Mô hình PLS – DA cho kết quả trên cả tập kiểm tra và tất cả các mẫu đều không tốt, với độ chính xác chỉ 85 % dù độ tin cậy đạt 100 % Mô hình BNN cho kết quả phân loại chính xác nhất trên tất cả các mẫu cũng như trên tập kiểm tra, với độ chính xác và độ tin cậy đều đạt 100% Biểu đồ biểu diễn 110 mẫu tập luyện được phân loại rõ ràng thành 4 vùng, các mẫu kiểm tra cũng được xác định chỉ khu trú trong 4 vùng đó, không có sự lẫn lộn các mẫu vào các vùng khác nhau [7]

Nghiên cứu này sử dụng ba mô hình bao gồm PCA – DA, PLS – DA, BNN để phân loại quế theo vùng trồng dựa trên dữ liệu quang phổ hồng ngoại ATR – FTIR

Trang 23

chỗ mát, tránh ánh sáng Bột quế sau khi xay được đóng hút chân không, bảo quản trong tủ lạnh -30C

2.2 Nguyên vật liệu, thiết bị

− Máy xay Philip điện áp 220V/ 50Hz với công suất 700W, Trung Quốc − Máy xay bột khô có công suất motor 850W, tốc độ quay lưỡi dao 2800 vòng/ phút,

Trung Quốc − Máy hút chân không DZ-300A Household vacuum sealer điện áp 220-240V, 50-60

Hz với công suất hút 0,045 Mpa kết hợp hàn túi bằng nhiệt, Trung Quốc − Bộ rây kích thước 125, 250, 350 µm, Trung Quốc

− Tủ âm sâu – 30C bảo quản mẫu, Sanyo của Nhật Bản − Máy quang phổ hồng ngoại Shimadzu Iraffinity – 1S, Nhật Bản

+ Phần cứng : Hệ thống cấu hình của máy quang phổ hồng ngoại biến đổi Fourier IRAffinity – 1S và máy tính cá nhân Tinh thể ATR là tinh thể kim cương

+ Phần mềm: Phần mềm IRsolution − Phần mềm sử dụng phân tích phân tích đa biến: MATLAB 2023a

2.3 Nội dung nghiên cứu

Đề tài này được thực hiện với các nội dung: − Phân tích mẫu bột vỏ quế của bốn địa phương bằng phương pháp quang phổ hồng

ngoại − Phân loại quế theo vùng trồng sử dụng phương pháp phân tích đa biến với dữ liệu

Trang 24

2.4.2 Lựa chọn kích thước mẫu đo

− Tiến hành đo IR hai mẫu với 4 kích thước khác nhau Mỗi kích thước đo phổ một lần

− Phân tích, so sánh phổ thu được của các mẫu với các kích thước khác nhau − Lựa chọn kích thước phù hợp tiếp tục nghiên cứu

2.4.3 Thu nhận quang phổ hồng ngoại

Sử dụng máy quang phổ hồng ngoại biến đổi Shimadzu Iraffinity – 1S để thu dữ liệu phổ FTIR

Cài đặt các thông số để quét nền và phổ mẫu: − Số lần quét : 40

− Độ phân giải (Resolution): 4 cm-1− Phạm vi quét: 4000 – 600 cm-1Quét phổ nền: không khí Quét một lần Quét mẫu thử Mẫu thử: mẫu bột quế đã được xay, rây và lựa chọn kích thước Mỗi mẫu thử được thực hiện quét một lần Tiến hành thu thập và xuất dữ liệu phổ

− Thu dữ liệu phổ: + Dữ liệu phổ hồng ngoại thu được là phổ ATR – FTIR về độ hấp thụ (A) theo số sóng

+ Xuất và tổng hợp dữ liệu dạng file pdf dùng làm dữ liệu phân tích phổ hồng ngoại Chồng phổ các mẫu theo vùng trên phần mềm IRsolution của thiết bị Vẽ biểu đồ phổ trung bình của từng vùng và chồng phổ trung bình của các vùng dựa trên dữ liệu độ hấp thụ bằng excel

+ Với phổ của mỗi mẫu, lấy dữ liệu 1701 số sóng từ 4000 – 600 cm-1 Khoảng cách giữa hai số sóng là 2 cm-1 Xuất và tổng hợp dữ liệu trong file google sheet dùng làm dữ liệu phân loại quế

2.4.4 Phân loại quế theo vùng trồng bằng phân tích đa biến

− Phần mềm: MATLAB 2023a − Mô hình: PCA – DA, PLS – DA, BNN − Dữ liệu đầu vào: Độ hấp thụ theo số sóng trên phổ FTIR của các mẫu nghiên cứu − Các bước thực hiện:

Trang 25

Bước 3: Sử dụng dữ liệu training set và các thuật toán phân tích đa biến PCA – DA,

PLS – DA, BNN để phân loại quế theo vùng trồng với các mẫu trong tập luyện − Chọn đường dẫn đến thư mục Classification toolbox for MATLAB Mở giao diện sử

dụng của Classification toolbox bằng lệnh: class_gui;

− Load các ma trận tín hiệu (X) và ma trận nhóm (class) của tập luyện: File → Load data/ Load class → X/ class→ OK

− Lựa chọn thuật toán và các thông số mô hình: Thẻ Calculate → Discriminant Analysis → fit PCA – DA

− Xem kết quả dự đoán: Thẻ Result Để xuất một đồ thị, chọn Export − Lưu lại mô hình vừa lập: File → Save model

Bước 4: Kiểm tra lại nguồn gốc địa lý các mẫu quế bằng mô hình vừa xây dựng qua dữ

liệu tập kiểm tra (testing set)

Tiêu chí lựa chọn thông số cho các mô hình: Độ chính xác của tập luyện cao nhất và trên 95 %, không có mẫu không được phân loại Độ chính xác của tập kiểm tra cao nhất và trên 75 %, tỉ lệ mẫu không được phân loại thấp nhất

Ngày đăng: 23/08/2024, 00:40

TÀI LIỆU CÙNG NGƯỜI DÙNG

  • Đang cập nhật ...

TÀI LIỆU LIÊN QUAN