hoàng thị bích phân loại quế theo vùng trồng bằng phân tích đa biến kết hợp phân tích mẫu bằng quang phổ hồng ngoại

Hiện nay, phương pháp sử dụng dữ liệu phổ hồng ngoại để phân loại các sản phẩm tự nhiên đang rất được quan tâm.. Do vậy, hoàn toàn có thể ứng dụng phương pháp toán hóa phân tích đa biến

TỔNG QUAN

Tổng quan về dược liệu quế

1.1.1 Đặc điểm sinh thái và phân bố của quế ở Việt Nam

Quế là cây nhiệt đới ẩm, thích hợp với khí hậu nóng ẩm và ưa sáng Cây sinh trưởng tốt trên đất đồi núi có độ dốc vừa phải, đất ẩm, nhiều mùn, tơi xốp, thoát nước tốt, đất chua đến hơi chua [8] Ở mỗi vùng trồng, khí hậu, vị trí địa lý và phương pháp canh tác khác nhau, chất lượng quế thu được cũng khác nhau

Tại Việt Nam, cây quế được trồng chủ yếu ở các tỉnh miền núi phía Bắc, phân bố rải rác đến phía Nam, gồm các tỉnh Quảng Ninh, Cao Bằng, Bắc Kạn, Thái Nguyên, Bắc Giang, Lào Cai, Yên Bái, Ninh Bình, Thanh Hóa, Quảng Nam Trong đó, nhiều vùng trồng quế đã được hình thành từ lâu đời: Yên Bái (quế Văn Yên, Văn Chấn…), Quảng Ninh (quế Bình Liêu, Tiên Yên, Hà Cối…), Thanh Hóa (quế Thường Xuân, Ngọc Lạc…), Quảng Nam (quế Trà My – Trà Bồng…)

Mỗi vùng trồng quế khác nhau sẽ cho các mẫu quế với đặc điểm khác nhau:

- Quế Thanh Hóa: Hàm lượng tinh dầu trong quế Thanh khá cao, trung bình đạt 3,7 % Tuy nhiên hàm lượng cinnamaldehyd lại khá thấp, trung bình chỉ đạt 58,6 % [3]

Quế Văn Yên nổi bật với đặc điểm riêng biệt so với các loại quế khác nhờ hàm lượng ẩm thấp (14,1 – 15,7 %), tinh dầu cao (4,4 – 6,1 %, v/w) và lượng aldehyd cinnamic trong tinh dầu rất lớn (84,9 – 90,1 %, v/w) [5].

- Quế Quảng Nam: Quế Trà My được biết đến với tên gọi “Cao sơn ngọc quế”, có mùi thơm, vị cay nồng đặc trưng, chứa hàm lượng tinh dầu cao (8,9 – 10,9 %, v/w) và hàm lượng aldehyd cinnamic trong tinh dầu từ 89,8 – 93,4 %, v/w [6]

- Quế Quảng Ninh: Hàm lượng coumarin trong quế Quảng Ninh thấp hơn so với các vùng khác (khoảng 0,06 %) [7]

1.1.2 Bộ phận thường sử dụng của quế

Quế là cây đa tác dụng, cung cấp các sản phẩm có giá trị kinh tế như vỏ quế, gỗ, tinh dầu… được sử dụng làm nguyên liệu cho nhiều ngành như sản xuất tinh dầu làm hương liệu, gia vị, làm thuốc chữa bệnh, sử dụng làm hàng thủ công mỹ nghệ [8] Vỏ thân, vỏ cành là bộ phận của cây quế thường được dùng làm dược liệu Vỏ thân được phơi khô trong bóng râm gọi là quế nhục Bên cạnh đó, tinh dầu thu từ cành hoặc lá quế cũng được sử dụng làm hương liệu; gỗ quế được dùng làm các sản phẩm như đũa, tăm, ống đựng tăm…

Hình 1.1: Các bộ phận của cây quế (Sưu tầm) (a) Vỏ quế; (b) Lá quế

Hình 1.2: Các sản phẩm từ quế (Sưu tầm) (a) Trà quế; (b) Tinh dầu quế và quế bào

1.1.3 Tác dụng chữa bệnh của quế

Từ xa xưa, quế đã được coi là một vị thuốc quý, là một trong Tứ đại danh dược: Sâm – Nhung – Quế - Phụ, được sử dụng để bồi bổ cơ thể, hỗ trợ cải thiện sức khỏe [9] Quế được sử dụng rộng rãi do có nhiều tác dụng khác nhau: tác dụng chống khối u, chống viêm và giảm đau, chống tiểu đường [10], [30] và chống béo phì, kháng khuẩn và kháng virus [28], [25], tác dụng bảo vệ tim mạch, tác dụng bảo vệ tế bào, bảo vệ thần kinh, điều hòa miễn dịch [34], [18]…

1.1.4 Thành phần hóa học trong quế Đã có rất nhiều nghiên cứu về thành phần hóa học trong quế và có hơn 160 chất đã được phân lập từ vỏ thân, vỏ cành và lá quế Trong đó, terpenoid là nhóm chất có nhiều trong cây, bao gồm các monoterpenes, diterpenoid, sesquiterpenoid Phenylpropanoid là thành phần có hoạt tính sinh học chính của quế, gồm hợp chất cinnamaldehyd, acid cinnamic… Bên cạnh đó trong cây còn có các hợp chất nhóm glycosid, hợp chất nhóm lignan, hợp chất nhóm lactone và các hợp chất khác [20], [38], [37], [18]…

Tổng quan về phương pháp quang phổ hồng ngoại

1.2.1 Phương pháp quang phổ hồng ngoại

Quang phổ hồng ngoại (Infrared spectroscopy - IR) là kỹ thuật phân tích hiện đại và được sử dụng rộng rãi, đặc biệt trong việc xác định cấu trúc của các hợp chất Ở nhiệt độ thường, các liên kết của các hợp chất trong mẫu đã có sự dao động như là sự chuyển dạng của phân tử Hấp thụ bức xạ hồng ngoại làm tăng các dao động

4 này Trong quang phổ hồng ngoại, bức xạ hồng ngoại được truyền qua mẫu Bức xạ hồng ngoại cú bước súng lớn hơn 100 àm được phõn tử hữu cơ hấp thụ và chuyển thành năng lượng quay cực phân tử, tạo thành phổ gồm những vạch rõ rệt Bức xạ hồng ngoại ở trong vựng 1-100 àm được phõn tử hữu cơ hấp thụ và chuyển thành năng lượng dao động phân tử và trên phổ xuất hiện những đỉnh rộng hơn Năng lượng của bức xạ hồng ngoại chỉ đủ làm thay đổi trạng thái dao động nên phổ IR được gọi là phổ dao động [2]

Phổ hồng ngoại đặc trưng cho các liên kết cũng như tương tác giữa các liên kết trong phân tử Hình dạng phổ, số lượng đỉnh và vị trí đỉnh thay đổi theo số lượng và loại liên kết nên độ chọn lọc của phổ cho các chất khi phân tích rất cao Các mẫu được sử dụng trong quang phổ hồng ngoại có thể ở trạng thái rắn, lỏng hoặc khí [33]

Vùng hồng ngoại được chia thành ba vùng như trong bảng sau:

Bảng 1.1: Bảng phân loại các vùng hồng ngoại [33]

Vùng hồng ngoại Bước sóng, àm Số súng (V), cm -1 Tần số (v), Hz

Cận hồng ngoại (NIR) 0,78 – 2,5 12800 – 4000 3,8 x 10 14 - 1,2 x 10 14 Hồng ngoại giữa

(MIR) 2,5 - 50 4000 – 200 3,8 x 10 14 - 1,2 x 10 14 Hồng ngoại xa (FIR) 50 - 100 200 – 10 3,8 x 10 14 - 1,2 x 10 14 Vùng hồng ngoại dùng nhiều nhất 2,5 - 15 4000 – 670 3,8 x 10 14 - 1,2 x 10 14 Trong đó, MIR được sử dụng nhiều nhất, tiếp đến là NIR và FIR ít được sử dụng trong phân tích Quang phổ MIR có nhiều ưu điểm như thời gian phân tích nhanh (dưới một phút mỗi mẫu), độ nhạy, cỡ mẫu nhỏ, chuẩn bị mẫu tối thiểu, không có thuốc thử hóa học độc hại Hiện nay, NIR cũng đang rất được quan tâm và ứng dụng vì NIR có năng lượng lớn, có thể đi sâu vào trong mẫu phân tích, mang nhiều thông tin của chất phân tích, đảm bảo được sự đồng đều bên trong mẫu phân tích [17], [21]

1.2.1.2 Phổ hồng ngoại và các nhóm chức đặc trưng

Quang phổ hồng ngoại thường được sử dụng để xác định cấu tạo hóa học vì các nhóm chức tạo nên các dải phổ đặc trưng trong phổ hồng ngoại Phổ IR có thể được chia thành hai vùng:

− Vùng vân tay (fingerprint region): là vùng 1350 – 750 cm -1 đặc trưng Các nghiên cứu thường dựa vào tín hiệu phổ trong vùng này để kết luận sự có hay không có mặt của một nhóm chức nào đó

− Vùng chức năng: Vùng quan trọng khác trong khi biện luận phổ IR là vùng 4000 –

2500 cm -1 và 2000 – 1500 cm -1 Đây là vùng xuất hiện dao động hóa trị của liên kết hydro – dị tố và vùng dao động của các liên kết bội như anken, carbonyl [2]

5 Một số đỉnh đặc trưng trên phổ IR được thể hiện trong Bảng 1.2 dưới đây:

Bảng 1.2: Một số đỉnh đặc trưng trên phổ IR [2]

Liên kết Số sóng (cm -1 )

Dao động hóa trị -O-H Không có liên hết hydro 3600

Nhóm carbonyl: luôn cho đỉnh dao động hóa trị mạnh trong vùng

Aldehyd hoặc ceton thơm hay không no α, β 1660 – 1715

Các nhóm chức phân cực phổ biến

1.2.2 Quang phổ hồng ngoại biến đổi Fourier – phản xạ toàn phần suy giảm Đã có nhiều tiến bộ trong kỹ thuật quang phổ hồng ngoại, nổi bật nhất là áp dụng biến đổi Fourier vào kỹ thuật này Hiện nay, quang phổ hồng ngoại biến đổi Fourier (Fourier transform infrared spectroscopy – FTIR) là dạng quang phổ hồng ngoại phổ biến nhất vì nhiều lý do như: lượng mẫu phân tích nhỏ, kết quả phân tích nhanh, nhạy và chính xác hơn đáng kể so với các kỹ thuật cũ

Quang phổ hồng ngoại biến đổi Fourier có thể kiểm tra tất cả các bước sóng của ánh sáng hồng ngoại cùng một thời gian bằng giao thoa kế Michelson

Hình 1.3: Giao thoa kế Michelson [14]

Hầu hết các giao thoa kế sử dụng bộ tách chùm để nhận chùm tia hồng ngoại tới, chuyển thành chùm tia song song bằng gương chuẩn trực và chia thành hai chùm quang học qua bộ phận tách chùm Một chùm tia phản xạ khỏi một gương phẳng cố định, trong khi chùm tia còn lại phản chiếu khỏi một gương phẳng di chuyển một khoảng rất ngắn Đường đi của một chùm tia có chiều dài cố định, còn chùm tia kia liên tục thay đổi khi gương chuyển động, dẫn đến sự thay đổi tín hiệu thoát.

6 ra khỏi giao thoa kế là kết quả của việc hai chùm tia này giao thoa với nhau khi chúng truyền về phía gương thu, được gọi là giao thoa đồ [12]

Có ba kỹ thuật đo chính có thể được sử dụng trong quá trình đo quang phổ FTIR là kỹ thuật đo truyền qua, kỹ thuật đo phản xạ toàn phần suy giảm (Attenuated Total Reflection – ATR) và kỹ thuật phản xạ Mỗi kỹ thuật sử dụng một quy trình khác nhau để phân tích mẫu và phù hợp với các mục đích khác nhau

Với kỹ thuật truyền qua, ánh sáng hồng ngoại cần phải đi qua hoàn toàn mẫu nơi nó được hấp thụ trong quá trình truyền qua Quá trình chuẩn bị mẫu để phát hiện đường truyền tốn nhiều thời gian và công sức và có thể phá hủy mẫu ban đầu [16]

Với kỹ thuật đo phản xạ, ánh sáng hồng ngoại phản xạ khỏi bề mặt mẫu sẽ được phát hiện thay vì ánh sáng hồng ngoại truyền qua mẫu Quang phổ hồng ngoại phản xạ hữu ích trong việc kiểm tra các mẫu rắn khó hoặc không thể phân tích bằng kỹ thuật truyền qua [16]

Phản xạ toàn phần suy giảm (ATR) ngày nay là kỹ thuật đo trong quang phổ FTIR được sử dụng rộng rãi nhất do ATR thường cho phép phân tích định tính hoặc định lượng mẫu với ít hoặc không cần chuẩn bị mẫu, giúp tăng tốc độ phân tích mẫu rất nhiều, dữ liệu được lấy trong vài giây

Hình 1.4: Nguyên lý của kỹ thuật đo phản xạ toàn phần suy giảm ATR [27]

Phân loại mẫu quế theo nguồn gốc bằng phân tích đa biến

1.3.1 Khái quát về phân tích đa biến

Thuật ngữ "Chemometrics" được sử dụng để mô tả khoa học sử dụng các phương pháp toán học và thống kê nhằm tạo ra hoặc lựa chọn các quy trình và thử nghiệm được tối ưu hóa Mục đích của các quy trình này là để thu thập thông tin hóa học tối đa bằng cách phân tích dữ liệu hóa học Phương pháp phân tích đa biến được sử dụng như một phần của quy trình này, trong đó các biến trong tập dữ liệu ban đầu được xác định mối quan hệ, sau đó kích thước của tập dữ liệu sẽ được giảm bớt hoặc đơn giản hóa bằng cách sắp xếp hoặc nhóm dữ liệu.

8 số liệu thành nhóm có cùng thuộc tính, tìm ra sự phụ thuộc và quan hệ giữa các biến, xây dựng và kiểm tra các giả thuyết thống kê

1.3.2 Các thuật toán phân tích đa biến sử dụng để phân loại

Các mẫu được phân loại dựa trên các thuộc tính cụ thể của mẫu, được xác định bằng các phép phân tích như đo phổ hoặc sắc ký Các phương pháp phân loại mẫu bằng phân tích đa biến được chia thành hai nhóm bao gồm phương pháp phân loại có giám sát và phương pháp phân loại không giám sát [36] Các phương pháp phân loại có giám sát sử dụng thông tin của tập huấn luyện gồm các mẫu thuộc nhóm (lớp) đã biết để xây dựng một mô hình toán học và sử dụng mô hình đó để nhận dạng mẫu Phân loại có giám sát gồm các phương pháp: Phân tích phân biệt tuyến tính (Linear Discriminant Analysis – LDA), phân tích phân biệt kết hợp bình phương tối thiểu từng phần (Partial Least Squares – Discriminant Analysis – PLS-DA), mạng nơron nhân tạo (Artificial Neural Network – ANN)… [26] Phương pháp phân loại mẫu không giám sát nhằm phát hiện sự giống nhau giữa các mẫu, nhóm các mẫu có đặc trưng tương tự vào cùng một nhóm mà không cần biết trước thông tin về số lượng hoặc bản chất ban đầu của nhóm đó Phương pháp phân loại mẫu không giám sát bao gồm phân tích thành phần chính (Princial Companent Analysis – PCA), phân tích cụm (Cluster Analysis – CA)… [19] 1.3.2.1 Phân tích thành phần chính (Princial Companent Analysis – PCA)

PCA (Principal Component Analysis) là thuật toán đa biến bằng các quay các trục số liệu ban đầu đến trục tọa độ mới chứa các biến tối ưu sao cho các biến (thành phần chính – PC) chứa hầu hết thông tin có trong mẫu và chúng không tương quan với nhau dựa trên cơ sở tìm ra giá trị đồng phương sai lớn nhất Thành phần chính thứ nhất (PC1) được tạo ra có phương sai lớn nhất và chứa nhiều thông tin có trong dữ liệu gốc nhất có thể PC2 được tạo ra sao cho nó không có mối tương quan với PC1 và chứa càng nhiều thông tin của phần dữ liệu còn lại nhất có thể,… cứ như thế cho đến hết số PC Số PC tối đa bằng số biến ban đầu [24]

Ma trận X (𝑛 × 𝑝) thể hiện dữ liệu quang phổ của n mẫu và p bước sóng, được trình bày trong Bảng 1.3.

Bảng 1.3: Dữ liệu đa biến thu được từ phân tích quang phổ

Bước sóng 1 Bước sóng 2 Bước sóng 3 … Bước sóng p

9 Khi được biểu thị dưới dạng ma trận X, dữ liệu trong bảng chuyển thành

PCA được áp dụng cho ma trận dữ liệu X có n hàng và p cột, tạo ra p hệ số PC chính Các hệ số này được biểu thị dưới dạng p11, p12, , p1p, tạo thành tổ hợp tuyến tính cho mẫu đầu tiên.

Sự kết hợp tuyến tính này được gọi là điểm PC1 cho mẫu 1 Tương tự điểm PC1 cho mẫu 2 được tính như sau:

𝑡 2 = 𝑝 21 𝑥 21 + 𝑝 22 𝑥 22 + ⋯ + 𝑝 2𝑝 𝑥 2𝑝 Tính toán cho tất cả các mẫu và PC1, PC2 có thể được biểu thị dưới dạng tính toán ma trận dưới đây:

Ma trận T mới được hình thành là ma trận 𝑛 × 𝑚 (n là số mẫu, m là số thành phần chính) P là ma trận 𝑝 × 𝑚 (p là số bước sóng, m là số thành phần chính) Điểm PC có thể được sử dụng để vẽ biểu đồ phân tán của các mẫu bằng cách gán điểm PC1 và PC2 tương ứng với các trục x và y như hình dưới đây

Hình 1.5: Biểu đồ phân tán điểm PC [4]

Như vậy, bằng phương pháp PCA có thể chuyển tập số liệu gồm p chiều (p cột trong ma trận) ban đầu thành tập số liệu có kích thước nhỏ hơn gồm m chiều tương ứng với số PC

Dựa trên dữ liệu phổ UV-Vis, thuật toán PCA – DA cho kết quả nhận dạng 125 mẫu chè xanh thuộc 4 vùng địa lý khác nhau Tại PC = 12, độ chính xác của mô hình

Độ chính xác của tập dữ liệu huấn luyện đạt 85% Trong khi đó, trong tập dữ liệu kiểm thử, có 6 mẫu chè Lâm Đồng và 7 mẫu chè từ các tỉnh khác được nhận dạng đúng.

100 % Mô hình đã nhận dạng đúng 3 trong 5 mẫu chè Thái Nguyên… Độ chính xác của mô hình nhận dạng 25 mẫu tập kiểm tra đạt 84 % [4]

PCA được ứng dụng trong dự đoán phân loại nguồn gốc địa lý của Cynomorium songaricum Rupr được trồng tại các vùng khác nhau ở Trung Quốc Sử dụng PCA để trực quan hóa các nhóm C songaricum khác nhau thu được hai PC với phương sai lần lượt là 79,5 % (PC1) và 10,1 % (PC2) Tám loại mẫu C songaricum nói chung có thể được phân loại [23]

Nghiên cứu của Nguyễn Thế Anh (2017) chỉ ra rằng phổ NMR của mật ong khi được chia thành 3 vùng phổ thì vùng phổ carbohydrat có ý nghĩa phân loại nhất, thể hiện rõ sự phân nhóm Tuy nhiên, độ chụm mẫu còn thấp Sau khi sắp xếp lại dữ liệu và thực hiện lại thuật toán PCA, kết quả cho thấy phần trăm phương sai của hai thành phần chính đầu đã được cải thiện đáng kể, tổng giá trị vượt quá 55%, từ đó tăng tính phân loại cho kết quả.

1.3.2.2 Phân tích phân biệt (Discriminant Analysis – DA)

DA là kỹ thuật đa biến được sử dụng để phân tách hai hay nhiều nhóm quan sát dựa trên k biến được đo trên mỗi mẫu và tìm ra sự đóng góp của từng biến trong việc tách các nhóm DA hoạt động bằng cách tìm ra một hoặc nhiều tổ hợp tuyến tính của k biến được chọn [13]

Mỗi mẫu được lấy ngẫu nhiên từ m nhóm, có kích thước tương ứng là n1, n2, , nm Mỗi mẫu được đo theo k biến, được ký hiệu là Yijl, trong đó: i là chỉ số mẫu trong nhóm tương ứng (i = 1, 2, 3, , ni); j là chỉ số nhóm (j = 1, 2, 3, , m); l là chỉ số biến được đo trong mỗi mẫu (l = 1, 2, 3, , k) Bảng sau đây tóm tắt dữ liệu:

Bảng 1.4: Cách sắp xếp dữ liệu trong phân tích phân biệt

Dữ liệu trong Bảng 1.4 sẽ được sử dụng để tìm tổ hợp tuyến tính của k biến đo được để phân tách m nhóm Sự kết hợp tuyến tính này được gọi là hàm phân biệt (Discriminant Function – DF) Để phân tách hai nhóm, xác định tổ hợp tuyến tính của các biến Y để tối đa hóa khoảng cách giữa hai vector trung bình Tổ hợp tuyến tính được sử dụng là:

Hàm Z được gọi là DF, ai đại diện hệ số liên quan đến từng biến được ước tính Trong trường hợp có nhiều nhóm (m nhóm) được so sánh với k biến, ni mẫu trong nhóm thứ i, hàm DF được tính:

ĐỐI TƯỢNG VÀ PHƯƠNG PHÁP NGHIÊN CỨU

Đối tượng nghiên cứu

− Đối tượng mẫu: 189 mẫu vỏ quế thành phẩm của bốn địa phương

− Địa điểm lấy mẫu: Quế thành phẩm ở bốn địa phương: Quảng Nam (80 mẫu), Yên Bái (60 mẫu), Quảng Ninh (18 mẫu), Thanh Hóa (31 mẫu)

− Thời gian lấy mẫu: Tháng 3 và tháng 8 các năm 2021, 2022, 2023

− Điều kiện bảo quản: Các mẫu vỏ quế thành phẩm, đóng vào túi PE kín, bảo quản ở chỗ mát, tránh ánh sáng Bột quế sau khi xay được đóng hút chân không, bảo quản trong tủ lạnh -30  C.

Nguyên vật liệu, thiết bị

− Máy xay Philip điện áp 220V/ 50Hz với công suất 700W, Trung Quốc

− Máy xay bột khô có công suất motor 850W, tốc độ quay lưỡi dao 2800 vòng/ phút, Trung Quốc

− Máy hút chân không DZ-300A Household vacuum sealer điện áp 220-240V, 50-60

Hz với công suất hút 0,045 Mpa kết hợp hàn túi bằng nhiệt, Trung Quốc

− Bộ rõy kớch thước 125, 250, 350 àm, Trung Quốc

− Tủ âm sâu – 30C bảo quản mẫu, Sanyo của Nhật Bản

− Máy quang phổ hồng ngoại Shimadzu Iraffinity – 1S, Nhật Bản

+ Phần cứng : Hệ thống cấu hình của máy quang phổ hồng ngoại biến đổi Fourier IRAffinity – 1S và máy tính cá nhân Tinh thể ATR là tinh thể kim cương

+ Phần mềm: Phần mềm IRsolution

− Phần mềm sử dụng phân tích phân tích đa biến: MATLAB 2023a.

Nội dung nghiên cứu

Đề tài này được thực hiện với các nội dung:

− Phân tích mẫu bột vỏ quế của bốn địa phương bằng phương pháp quang phổ hồng ngoại

− Phân loại quế theo vùng trồng sử dụng phương pháp phân tích đa biến với dữ liệu quang phổ hồng ngoại.

Phương pháp nghiên cứu

Các mẫu quế được thu thập ngẫu nhiên từ bốn vùng Tiến hành chuẩn bị mẫu theo các bước:

− Mẫu vỏ quế thành phẩm thu thập từ bốn địa phương: Yên Bái, Thanh Hóa, Quảng Ninh, Quảng Nam

+ Xay nhỏ mẫu vỏ quế bằng máy xay Philip với công suất 700W

16 + Xay mẫu quế trên thành bột bằng máy xay bột với công suất 850W, tốc độ quay của lưỡi dao 2800 vòng/ phút

+ Rõy phõn loại mẫu bột quế qua cỏc rõy với kớch thước 350, 250, 125 àm thu được 4 kớch thước khỏc nhau: >350 àm, 250 – 350 àm, 125 – 250 àm, F-scrit (hay p < α = 0,05) nên bác bỏ giả thuyết H0 Như vậy, có sự khác biệt có ý nghĩa thống kê về độ hấp thụ tại vị trí các đỉnh hấp thụ giữa các kích thước khác nhau trong cùng một mẫu với độ tin cậy

Vì mỗi lần đo chỉ cần một lượng rất nhỏ mẫu đã có thể đo được, nếu chọn kích thước > 350 àm thỡ mỗi lần đo cú thể chỉ sử dụng một hạt để đo, khụng đảm bảo tớnh đồng nhất mẫu Kớch thước < 125 àm quỏ mịn, kớch thước này cú thể đó phỏ hủy một số chất phân tích và cần thời gian xay lâu, có thể bay hơi nước và tinh dầu nên kích thước này ớt phự hợp Nghiờn cứu [42] sử dụng rõy 250 àm để lựa chọn kớch thước bột mẫu quế < 250 àm đem phõn tớch nờn dựa vào đú loại bỏ kớch thước 250 – 350 àm

Do đú, lựa chọn kớch thước 125 – 250 àm để tiếp tục nghiờn cứu Quy trỡnh cụ thể thu mẫu bột quế như sau:

− Quá trình xay vỏ quế:

+ Xay nhỏ mẫu vỏ quế bằng máy xay Philip với công suất 700W, xay 20 giây/lần

 3 lần, nghỉ 10 giây giữa các lần

+ Xay mẫu quế nhỏ trên thành bột bằng máy xay bột với công suất 850W, tốc độ quay của lưỡi dao 2800 vòng/ phút, xay 30 giây/lần  3 lần, nghỉ 10 giây giữa các lần

− Rõy phõn loại và đúng tỳi: Rõy lần lượt qua cỏc rõy 250, 125 àm Lấy bột kớch thước

125 – 250 àm đúng vào cỏc tỳi Hỳt chõn khụng với cụng suất hỳt 0,045 Mpa và hàn miệng túi bằng nhiệt trong 3 giây

− Ghi nhãn và bảo quản mẫu trong tủ âm sâu – 30 o C

− Chuẩn bị mẫu để đo phổ hồng ngoại: Để mẫu ở nhiệt độ phòng 30 phút trước khi đo.

Phân tích phổ hồng ngoại

Phổ FTIR của 189 mẫu quế đã được thu thập và tổng hợp trong phụ lục 1 Phổ trung bình của mẫu quế từ các vùng thu thập được trình bày trong hình 3.3.

Hình 3.3: Biểu đồ chồng phổ FTIR trung bình của bốn vùng

Phổ hồng ngoại của 4 vùng đều xuất hiện đỉnh ở các vị trí đặc trưng Một số đỉnh đặc trưng nhìn thấy rõ trong phổ FTIR của bốn vùng đã được phát hiện, cho phép biết được một số nhóm chức năng hóa học đặc trưng cụ thể Các đỉnh phổ biến này vào khoảng: 1800 – 600 cm -1 (nằm trong vùng vân tay) có 16 – 17 đỉnh đặc trưng Ở vùng

3500 – 2800 cm -1 (vùng C – H và O – H), đỉnh ở 2918 cm -1 có thể được gán cho các dao động kéo dài C – H đối xứng gây ra bởi lipid quế (tinh dầu) và các đỉnh ở 3302 cm -1 là các đỉnh hấp thụ rung động kéo dài O – H Điều này là do sự có mặt của các loại rượu khác nhau như eugenol, nhóm chức carbonyl và hydroxy Hàm lượng nước (độ ẩm) có thể ảnh hưởng đến tín hiệu vùng này

Phổ FTIR của ba vùng Quảng Ninh, Thanh Hóa, Yên Bái có nhiều đỉnh đặc trưng hơn Quảng Nam Vùng vân tay của mỗi phổ có các đỉnh hấp thụ tương tự nhau: đỉnh 1734 cm-1 đại diện cho liên kết carbonyl từ aldehyd của acid béo bão hòa; 1624 cm-1 là dao động kéo dài của aldehyd carbonyl (C=O) phản ánh nồng độ cao của cinnamaldehyd và aldehyd trong vỏ quế Đỉnh 1456 cm-1 đặc trưng cho rượu C-OH; 1076 và 1018 cm-1 là dao động kéo dài của C-O và dao động biến dạng của C-OH Đỉnh hấp thụ tại 684 cm-1 tương ứng với sự hấp thụ dao động của anken.

Bảng 3.3: Độ hấp thụ tại các đỉnh số sóng tương ứng của các vùng

Biểu đồ chồng phổ trung bình của 4 vùng

Quảng Nam Yên Bái Quảng Ninh Thanh Hóa

3.2.1 Quế Quảng Nam Để so sánh phổ các mẫu quế trong cùng một vùng, chồng phổ các mẫu trong cùng năm và cùng vụ thu hoạch của một vùng quế Quảng Nam Kết quả thu được trong Hình 3.4.

(a) Chồng phổ FTIR các mẫu quế Quảng Nam

(b) Phổ FTIR trung bình mẫu quế Quảng Nam

Hình 3.4: Hình ảnh phổ FTIR mẫu quế Quảng Nam

(a) Chồng phổ FITR các mẫu quế Quảng Nam

(b) Phổ FTIR trung bình mẫu quế Quảng Nam

23 Phổ FITR của các mẫu quế trong cùng vùng Quảng Nam có các vị trí các đỉnh hấp thụ tương tự nhau, khác nhau về độ hấp thụ Quan sát thấy trong vùng vân tay, phổ FTIR trung bình mẫu quế Quảng Nam có khoảng 17 – 18 đỉnh hấp thụ đặc trưng

Kết quả chồng phổ các mẫu quế Yên Bái và phổ trung bình thu được ở hình dưới đây

(a) Chồng phổ FTIR các mẫu quế Yên Bái

(b) Phổ FTIR trung bình của mẫu quế Yên Bái

Hình 3.5: Hình ảnh phổ FTIR của mẫu quế Yên Bái

(a) Chồng phổ FTIR các mẫu Yên Bái

(b) Phổ FTIR trung bình của mẫu quế Yên Bái

24 Phổ FTIR các mẫu quế Yên Bái có các đỉnh ở vị trí đặc trưng tuy nhiên số đỉnh hấp thụ của mẫu quế Yên Bái nhiều hơn, dày đặc hơn so với quế Quảng Nam, đặc biệt trong vùng 2040 – 1840 cm -1 và 1550 – 1256 cm -1 , chứng tỏ có nhiều dao động của aldehyd hoặc ceton thơm hay không no Đây cũng là vùng của các liên kết amid, imin, nitro Do đó, phổ vùng Yên Bái cũng phức tạp hơn

Kết quả phân tích quang phổ hồng ngoại các mẫu quế Quảng Ninh được trình bày trong Hình 3.6

(a) Chồng phổ FTIR các mẫu quế Quảng Ninh

(b) Phổ FTIR trung bình của mẫu quế Quảng Ninh

Hình 3.6: Hình ảnh phổ FTIR mẫu quế Quảng Ninh

(a) Chồng phổ FTIR các mẫu quế Quảng Ninh

(b) Phổ FTIR trung bình của mẫu quế Quảng Ninh

25 Hình 3.6 cho thấy phổ của các mẫu quế Quảng Ninh cũng có các vị trí đỉnh hấp thụ đặc trưng như đỉnh 3302, 2918, 1734, 1624, 1076 cm -1 Vùng 2000 – 1200 cm -1 có nhiều đỉnh chồng chéo nhau giống phổ tỉnh Yên Bái Điều này có thể dẫn đến sự nhầm lẫn nếu phân biệt quế theo vùng trồng bằng cách quan sát phổ FTIR của các mẫu

Các mẫu quế Thanh Hóa được chồng phổ và có phổ trung bình trong Hình

(a) Chồng phổ FTIR các mẫu quế Thanh Hóa

(b) Phổ FTIR trung bình mẫu quế Thanh Hóa

Hình 3.7: Hình ảnh phổ FTIR mẫu quế Thanh Hóa

(a) Chồng phổ FTIR các mẫu quế Thanh Hóa

(b) Phổ FTIR trung bình mẫu quế Thanh Hóa

26 Phổ FTIR trung bình của quế Thanh Hóa có nhiều đỉnh đặc trưng tương ứng nhiều dao động trong vùng 2000 – 1200 cm -1 Cùng một vị trí đỉnh như 670, 1320, 1456, 1624 cm -1 độ hấp thụ của quế Thanh Hóa thấp hơn quế Yên Bái như trong bảng dưới đây.

Bảng 3.4: Độ hấp thụ tại một số đỉnh của quế vùng Thanh Hóa và Yên Bái

Yên Bái 0.171 0.156 0.213 0.206 Nhìn chung, vùng dấu vân tay của phổ FTIR xuất hiện các đỉnh giống nhau giữa các vùng Một số đỉnh đặc trưng có thể nhìn thấy bằng mắt thường Tuy nhiên, những khác biệt rất nhỏ trong dữ liệu không thể quan sát để phân biệt, có thể kết hợp phân tích toán hóa thống kê để xây dựng các mô hình phân loại quế các vùng.

Phân loại quế theo vùng trồng

Dữ liệu phổ hồng ngoại dùng để phân loại quế theo vùng trồng được trình bày trong Phụ lục 2 Tất cả 189 mẫu bột vỏ quế được khảo sát Trong đó, 142 mẫu được sử dụng để xây dựng bộ luyện (training set) cho các thuật toán phân loại, 47 mẫu còn lại được sử dụng để xây dựng bộ thử nghiệm (testing set) nhằm kiểm tra độ chính xác của bộ luyện Dữ liệu tập luyện và tập kiểm tra được trình bày trong Bảng 3.5 và Bảng 3.6.

Bảng 3.5: Bảng tóm tắt dữ liệu hồng ngoại tập luyện để phân loại (Training set)

STT Tên mẫu Nhóm Số sóng (cm -1 )

Bảng 3.6: Bảng tóm tắt dữ liệu hồng ngoại tập kiểm tra để phân loại (Testing set)

STT Tên mẫu Nhóm Số sóng (cm -1 )

27 Kết quả khảo sát dựa trên bộ dữ liệu “Dữ liệu hồng ngoại để phân loại quế” trên

3 mô hình thu được dưới đây

Thực hiện theo mục 2.4.4 để chọn mô hình PCA – DA, hộp PCA – DA setting mở ra Khảo sát các thông số và lựa chọn các thông số phù hợp:

− Number of components (Số PC): 5 – 20

− Discrimination (Thuật toán phân biệt): Quadratic và Linear

Rồi chọn Calculate Mô hình đã được chạy xong Kết quả thu được trong Bảng 3.7 dưới đây

Bảng 3.7: Kết quả khảo sát lựa chọn các thông số mô hình PCA – DA

(Thuật toán phân biệt) Độ chính xác tập luyện (%) Độ chính xác tập kiểm tra (%)

Discriminant (Thuật toán phân biệt) Độ chính xác tập luyện (%) Độ chính xác tập kiểm tra (%)

Lựa chọn thông số của mô hình cho kết quả tốt nhất là: Số PC là 10, thuật toán phân biệt là Quadratic Kết quả được trình bày trong Hình 3.8 và Bảng 3.8 dưới đây

Hình 3.8: Biểu đồ mô hình phân loại PCA – DA

Hình 3.8 biểu diễn sự phân bố của 142 mẫu tập luyện và 47 mẫu kiểm tra theo kết quả mô hình PCA – DA cho thấy, các mẫu đều được phân loại tuy nhiên độ chụm của mỗi nhóm không cao, khó quan sát Độ chụm của các nhóm chồng chéo nhau Sử dụng PCA để giảm chiều dữ liệu thu được hai PC với phương sai lần lượt là 98,36 % và

1 % Do đó, chỉ với hai PC đã chiếm trên 99 % tổng số phương sai và có thể phản ánh phần lớn thông tin của phổ Độ chính xác khi phân loại tập luyện của mô hình PCA –

Bảng 3.8: Kết quả phân loại mẫu theo mô hình PCA – DA

29 Kết quả từ Bảng 3.8 cho thấy trong tập kiểm tra, toàn bộ 47 mẫu quế đều được phân loại vào các nhóm với độ chính xác 91 % Toàn bộ mẫu của tỉnh Quảng Nam và Thanh Hóa được phân loại chính xác, chứng tỏ đặc điểm phổ của hai vùng này có những đặc trưng riêng để phân biệt 3 mẫu quế Yên Bái được phân loại chưa chính xác Quế Yên Bái và quế Quảng Ninh dễ bị phân loại nhầm cho nhau, có thể do đặc điểm phổ FTIR của hai mẫu có nhiều điểm tương đồng hơn Do đó, mô hình PCA – DA phân loại quế theo vùng trồng bằng dữ liệu phổ hồng ngoại khá tốt.

Thực hiện theo mục 2.4.4 để chọn mô hình PLS – DA, hộp PLS – DA setting mở ra Khảo sát các thông số và lựa chọn các thông số tối ưu:

− Number of LV (Số LV): 10 – 20

− Assignation criterion (Tiêu chí phân loại): Bayes/ Max

Rồi chọn Calculate Mô hình đã được chạy xong Kết quả khảo sát các thông số mô hình thu được trong Bảng 3.8 sau

Bảng 3.9: Kết quả khảo sát lựa chọn các thông số mô hình PLS – DA

(Tiêu chí phân loại) Độ chính xác tập luyện (%)

Không phân loại được (%) Độ chính xác tập kiểm tra (%)

LV Assignation criterion (Tiêu chí phân loại) Độ chính xác tập luyện (%) Độ chính xác tập kiểm tra (%)

Lựa chọn được thông số phù hợp nhất: Số LV là 20, tiêu chí phân loại: Bayes Kết quả thu được được trình bày trong Hình 3.9 và Bảng 3.10 dưới đây

Hình 3.9: Biểu đồ mô hình PLS – DA Bảng 3.10: Kết quả phân loại mẫu theo mô hình PLS – DA

Kết quả phân loại chính xác nguồn gốc các mẫu theo mô hình PLS – DA là 100

% Trong Hình 3.9 biểu diễn sự phân bố của mẫu tập luyện cho thấy, độ chụm của các mẫu trong một vùng không cao, khó quan sát Các mẫu của các vùng xếp chồng chéo lên nhau Kết quả từ Bảng 3.10 cho thấy, mẫu quế vùng Quảng Ninh và Thanh Hóa được phân loại chính xác hoàn toàn Mẫu quế Yên Bái dễ bị phân loại nhầm với các vùng Quảng Nam và Quảng Ninh Phổ FTIR của quế Thanh Hóa có những điểm đặc trưng riêng nên không bị phân loại nhầm hay mẫu khác nhầm vào vùng này Như vậy, mô

31 hình PLS – DA phân loại được các mẫu quế theo vùng trồng nhưng độ chính xác chưa cao

3.3.3 Mô hình mạng nơron nhân tạo

Thực hiện theo mục 2.4.4 để chọn mô hình BNN, hộp BNN setting mở ra Khảo sát các thông số và lựa chọn các thông số tối ưu:

− Number of hidden layers (Số lớp ẩn): 1 – 5

− Number of neurons in each layers (Số nơron trong mỗi lớp): 10/ 20/ 25/ 30/ 35/ 40/ 45/ 50

− Show error plot: at the end of training

Rồi chọn Calculate Mô hình đã được chạy xong Kết quả khảo sát các thông số mô hình thu được trong Bảng 3.11 sau

Bảng 3.11: Kết quả khảo sát lựa chọn các thông số mô hình BNN

Learning rate Alpha Iteration Độ chính xác tập luyện (%)

Không phân loại được (%) Độ chính xác tập kiểm tra (%)

Kết quả khi áp dụng mô hình BNN với các thông số: Số lớp là 4, số nơ ron mỗi lớp là 35, Learning rate là 0,01, Alpha là 0,05, Iteration là 1000 thu được kết quả trong Hình 3.10 và Bảng 3.12

Hình 3.10: Biểu đồ mô hình BNN 4 lớp, 35 nơron mỗi lớp Bảng 3.12: Kết quả phân loại mẫu theo mô hình BNN

Quan sát Hình 3.10, độ chụm của các mẫu trong cùng một vùng rất cao, dễ quan sát được bằng mắt thường Các mẫu của các vùng ở vị trí xa nhau trên biểu đồ Các mẫu tập kiểm tra có sự khác biệt về đặc điểm phổ FTIR rõ rệt theo vùng nên độ chính xác của tập luyện đạt 100 % tuyệt đối Kết quả từ Bảng 3.12 cho thấy độ chính xác của mẫu kiểm tra là 76 % Tuy nhiên, có 1 mẫu trong tập kiểm tra không được phân loại Quế vùng Quảng Ninh được phân loại chính xác hoàn toàn Quế vùng Yên Bái vẫn chiếm tỉ lệ phân loại sai cao nhất (6/15 mẫu), chứng tỏ quế vùng này rất đa dạng, đặc điểm phổ cũng đa dạng Mô hình BNN 4 lớp, 35 nơron mỗi lớp phân loại quế theo vùng trồng với độ chính xác chưa cao

34 Qua việc khảo sát với 189 mẫu dược liệu quế, thấy mô hình PCA-DA cho kết quả độ chính xác khá cao, biểu đồ thể hiện sự phân bố của tất cả các mẫu quế lại không phân biệt được bằng mắt thường, độ chụm của các mẫu không cao Chỉ có mẫu quế Quảng Nam và Thanh Hóa được kiểm tra phân loại chính xác hoàn toàn khi sử dụng mô hình này Khả năng phân loại của mô hình PLS-DA với tập kiểm tra cho độ chính xác tuyệt đối, tuy nhiên vẫn có mẫu không được phân loại Kết quả của tập kiểm tra bị nhầm lẫn mẫu giữa vùng Yên Bái và Quảng Nam, Quảng Ninh Khả năng phân loại của mô hình BNN chưa cao khi phân loại 189 mẫu quế theo vùng trồng Độ chụm của các mẫu trong cùng một nhóm cao, phân biệt được bằng mắt thường Vì vậy, cả ba mô hình đều có thể phân loại quế theo vùng trồng với dữ liệu đầu vào là phổ FTIR của các mẫu Vì số lượng biến trong một mẫu là quá lớn sẽ làm ảnh hưởng nhiều đến việc phân loại nên tiếp tục nghiên cứu việc phân loại quế theo vùng trồng bằng các mô hình này để có độ chính xác cao hơn bằng cách tiền xử lý dữ liệu, lựa chọn thông số tối ưu hơn.

Bàn luận

3.4.1 Phương pháp xử lý mẫu

Xử lý mẫu là bước quan trọng, ảnh hưởng đến độ đồng nhất và độ chính xác của kết quả phân tích Quy trình xử lý mẫu trong nghiên cứu này lựa chọn đơn giản, thời gian xử lý nhanh, theo tác đơn giản, có thể thực hiện ở nhiều phòng thí nghiệm

Quy trình xay vỏ quế thành bột được chia làm hai giai đoạn bao gồm xay nhỏ vỏ quế ( 20 giây/lần  3 lần, nghỉ 10 giây/lần) và xay tạo bột (30 giây/lần  3 lần, nghỉ 10 giây/lần) Quá trình vừa xay vừa nghỉ giúp tránh hiện tượng quá nhiệt, làm bay hơi tinh dầu và tăng độ ẩm cho mẫu, ảnh hưởng đến kết quả phân tích

Rây phân loại kích thước đảm bảo độ đồng nhất giữa các mẫu về mặt kích thước Nghiờn cứu [35] sử dụng cỏc rõy 1000, 100 và 10 àm, nghiờn cứu [42] sử dụng rõy 250 àm để phõn loại kớch thước mẫu, tăng tớnh đồng nhất mẫu Kớch thước sử dụng trong nghiờn cứu này là 125 – 250 àm được cho thấy đem lại kết quả phõn tớch tốt

Mẫu được hút chân không, dán nhãn và bảo quản trong tủ âm sâu -30C để tránh ẩm và bay hơi các thành phần dễ bay hơi như tinh dầu Không bảo quản tốt mẫu bột sau khi xay có thể làm ảnh hưởng xấu đến kết quả phân tích, mất chất phân tích làm giảm cường độ các đỉnh hấp thụ và tăng lượng nước làm tăng sự ảnh hưởng của nước, làm hỏng mẫu

Kết quả quá trình xử lý mẫu là phù hợp, thu được các mẫu bột khô, không bị ẩm mốc hay mất chất phân tích Các mẫu thu được đều giữ được đặc điểm tốt khi đem đi phân tích

3.4.2 Phân tích phổ hồng ngoại các mẫu

Phổ hồng ngoại các mẫu quế thu được có hình dạng phổ đặc trưng Vị trí các đỉnh hấp thụ là tương tự nhau, khác nhau về độ hấp thụ Phổ FTIR của quế vùng Thanh Hóa

35 có độ hấp thụ cao nhất và quế Quảng Nam có độ hấp thụ thấp nhất Trong vùng vân tay, phổ trung bình của ba vùng Quảng Ninh, Thanh Hóa, Yên Bái có nhiều đỉnh đặc trưng hơn mẫu vùng Quảng Nam Đó có thể là điểm để phân biệt mẫu quế các vùng

Phổ FTIR của quế nguyên chất trong nghiên cứu [35] thu được có hình dạng tương tự các phổ trung bình của mẫu quế 4 vùng ở Việt Nam Trong vùng 1800 – 600 cm -1 cũng có các đỉnh đại diện cho các liên kết như đỉnh 1727 cm -1 đại diện liên kết carbonyl, đỉnh 1679 và 1626 cm -1 là dao động kéo dài của aldehyd carbonyl, đỉnh 1573 cm -1 tương ứng với dao động khung C=C của vòng thơm… Mỗi phổ có 15 – 16 đỉnh đặc trưng Vùng vân tay của 4 phổ trung bình của 4 địa phương thu được cũng có hình dạng giống phổ IR điển hình của quế trong nghiên cứu [42] Các đỉnh hấp thụ cũng xuất hiện tại các vị trí 1727, 1679, 1626, 1573 cm -1 ,… Có 16 đỉnh chung được quan sát thấy ở tất cả 9 mẫu quế trong nghiên cứu

Như vậy, sau quá trình xử lý mẫu và thu phổ FTIR, kết quả phổ thu được của các vùng là có ý nghĩa và thống nhất với các nghiên cứu trước đó Hình dạng phổ, vị trí các đỉnh là tương tự nhau Nghiên cứu đã thu được kết quả đạt mục tiêu ban đầu đã đề ra

3.4.3 Phân loại quế theo vùng trồng bằng phân tích đa biến

Ba mô hình PCA – DA, PLS – DA, BNN được sử dụng đã cho kết quả có phân loại được các mẫu quế theo vùng trồng dựa trên dữ liệu phổ FTIR

So sánh với các nghiên cứu khác rút ra được kết luận: Cần số lượng mẫu đủ lớn và có các thuộc tính đặc trưng để phân biệt rõ ràng được các mẫu dược liệu ở các vùng trồng khác nhau Nghiên cứu [35] sử dụng dữ liệu phổ FTIR để nhận dạng mẫu gia vị quế Ba phổ vùng FTIR khác nhau được phân tích: vùng 1 (3999,6 – 549,6 cm -1 ) bao gồm toàn bộ phổ và hai vùng chọn lọc gồm, vùng 2 (1801,2 – 601,7 cm -1 ) là vùng có nhóm chức carbonyl tập trung và vùng 3 (3000,1–2800,1 cm -1 kết hợp với 1801,2 – 601,7 cm -1 ) là vùng fingerprint Vùng 1 hầu như tạo ra các mô hình tổng thể tốt nhất so với các mô hình của vùng 2 và vùng 3 Điều này có thể cho thấy quang phổ mà mắt thường không thể nhận biết được đôi khi sẽ ảnh hưởng đến kết quả phân loại của các mô hình đa biến Tiền xử lý dữ liệu được áp dụng để loại bỏ sự biến đổi quang phổ và tối ưu hóa tỉ lệ tín hiệu/ nhiễu, loại bỏ ảnh hưởng các hiệu ứng vật lý lên quang phổ như độ mờ, độ nhám… [11] Trong nghiên cứu nhận dạng quế theo vùng trồng của Bùi Thị Lan Phương và cộng sự, sử dụng 5 biến hàm lượng các chất phân tích trên mỗi mẫu, thuộc tính đặc trưng của các chất không cao nên kết quả phân loại trên mô hình PCA –

DA và PLS – DA không được khả quan Mô hình PLS – DA cho kết quả thấp nhất và có mẫu không phân loại được [7] Nghiên cứu này sử dụng 1701 biến đầu vào là dữ liệu phổ FTIR, không có bước tiền xử lý dữ liệu, kết quả phân loại tập luyện đều cho độ chính xác cao 99 – 100 % Tuy nhiên, kiểm tra lại mô hình bằng tập kiểm tra, kết quả phân loại không cao

36 Bên cạnh đó, ba mô hình được chọn để phân loại trong nghiên cứu này giúp người nghiên cứu đưa ra nhận xét phân nhóm bằng mắt thường qua đồ thị và đưa ra kết quả phân nhóm có kèm xác suất, cho biết mẫu nào phân loại vào nhóm nào từ đó đưa ra các nhận xét chính xác hơn cũng như dễ dàng đánh giá nguyên nhân gây ra sai số

KẾT LUẬN VÀ ĐỀ XUẤT Kết luận

Qua kết quả thực nghiệm, nghiên cứu đưa ra các kết luận sau:

- Nghiên cứu đã phân tích được các mẫu bằng quang phổ hồng ngoại: Phổ FTIR đã cho thấy các đỉnh đặc trưng của mẫu quế Giữa các vùng có một số đỉnh giống nhau Vùng vân tay để phân tích sự khác biệt giữa các vùng nằm trong khoảng 1800 – 600 cm -1 Quan sát bằng mắt thường, phổ của tỉnh Yên Bái và Thanh Hóa có nhiều điểm tương đồng

− Đã ứng dụng thành công ba mô hình là PCA – DA, PLS – DA và BNN để phân loại

189 mẫu quế của 4 vùng dựa vào dữ liệu hồng ngoại thu được Mô hình PCA – DA kết quả khảo sát trên tập kiểm tra có độ chính xác cao nhất là 91 %, nhưng biểu đồ phân loại các mẫu quế trong tập luyện và tập kiểm tra không khả quan, các mẫu có độ chụm không cao, không thể quan sát bằng mắt thường Mô hình PLS – DA và BNN cho kết quả phân loại mẫu tập luyện với độ chính xác 100 %, tuy nhiên, khi kiểm tra lại bằng tập kiểm tra thì độ chính xác chỉ còn 83 % và 76 % Mô hình BNN cho kết quả dạng biểu đồ phân tán các mẫu được phân loại rõ ràng thành 4 vùng (cả mẫu tập luyện và tập kiểm tra), không có sự lẫn lộn các mẫu vào vùng khác Đề xuất

- Nghiên cứu tiền xử lý mẫu nghiên cứu và tiền xử lý dữ liệu trước khi đưa kết quả phổ ATR – FTIR vào phân loại

- Lựa chọn mô hình và các thông số phù hợp để nâng độ chính xác khi phân loại

TÀI LIỆU THAM KHẢO Tiếng Việt

1 Nguyễn Thế Anh (2017), Nghiên cứu ứng dụng thống kê đa biến sử dụng phần mềm Matlab trong nhận dạng, phân loại và phân tích nhanh đồng thời các chất,

Khóa luận tốt nghiệp đại học, Đại học Quốc gia Hà Nội, Trường Đại học Khoa học tự nhiên

2 Bộ Y tế (2007), Hóa phân tích Nhà xuất bản Y học Hà Nội, tr 63 - 68

Tiêu đề	Phân loại quế theo vùng trồng bằng phân tích đa biến kết hợp phân tích mẫu bằng quang phổ hồng ngoại
Tác giả	Hoàng Thị Bích
Người hướng dẫn	NCS. ThS. Bùi Thị Lan Phương
Trường học	Trường Đại học Dược Hà Nội
Chuyên ngành	Dược Sĩ
Thể loại	Khóa luận tốt nghiệp
Năm xuất bản	2024
Thành phố	Hà Nội

Định dạng
Số trang	50
Dung lượng	2,27 MB