TỔNG QUAN
Tổng quan về hồ tiêu
Hồ tiêu (Piper nigrum Linn.) thuộc họ Piperaceae là một họ thực vật có hoa có hơn 3610 loài được tổ chức thành năm chi: Manekia, Peperomia, Piper, Zippelia và Verhuellia Họ này bao gồm các cây nhỏ, cây bụi và dây leo được tìm thấy trên khắp các vùng nhiệt đới và cận nhiệt đới Lá của chúng có hương vị đậm đà, và chúng có nhiều bông hoa nhưng không có lá đài hoặc cánh hoa Trong họ này có khoảng 1000-2000 loài bao gồm chi Tiêu có ý nghĩa về mặt thương mại và sinh thái trong họ Hồ tiêu Sự đa dạng của các chi này có lợi cho việc nghiên cứu lịch sử tự nhiên, hóa học các sản phẩm tự nhiên, sinh học tiến hóa và sinh thái cộng đồng Các loài đáng chú ý bao gồm: Piper lolot; Piper nigrum L; Piper longum;
1.1.1 Tên gọi và đặc điểm
Tên thường gọi: hồ tiêu, cây tiêu, tiêu đen, tiêu hồi;
Tên khoa học: Piper nigrum Linn;
Tên đồng nghĩa: Piper aromaticum Lamk;
Họ thực vật: Piperaceae (Hồ tiêu).
Hình 1.1: Cây hồ tiêu Piper nigrum Linn Đặc điểm về hình thái:
Cây hồ tiêu là một loại dây leo, thân dài, nhẵn không mang lông, bám vào các cây khác bằng rễ Trong dân gian gọi đó là các “trụ tiêu”.
Thân gồm nhiều đốt, mỗi đốt dài chừng 5 – 12 cm Ở những mấu của các đốt có những rễ nhỏ, ngắn, giúp cho cây tiêu bám chặc vào “trụ tiêu”.
Lá mọc cách; phiến lá đơn, nguyên, nhẵn, mặt trên màu xanh đậm hay nhạt, có 5-7 gân chính, với nhiều tuyến chứa tinh dầu Lá như lá trầu không, nhưng dài và thuôn hơn.
Cụm hoa bông, mọc đối diện với lá trên các nhánh sinh sản, dài 3 –
15 cm và mang khoảng 50-150 hoa.
Quả mọng, hình cầu, không cuống, đường kính cỡ 4 – 8 mm, lúc non có màu lục rồi vàng và khi chín có màu đỏ Một chùm có từ 20 – 40 hạt Hạt tròn, cứng có mùi nồng và vị cay.
1.1.2 Nguồn gốc của hồ tiêu
Hồ tiêu có nguồn gốc từ khu vực miền Tây Ghate bang Kerala của Ấn Độ Tại đây vẫn còn gặp hồ tiêu mọc hoang dại trên các khu vực đồi núi Người Ấn Độ đã đưa hồ tiêu vào gây trồng khoảng trên 100 năm trước Công nguyên Từ đây nó được đưa vào trồng tại các nước Đông Nam Á và sau đó là các nước nhiệt đới châu Mỹ.
Năm 2020, diện tích trồng tiêu đen của Việt Nam là 132.000 ha, sản lượng 270.000 tấn, trong đó vùng Tây Nguyên chiếm khoảng 70% cả về diện tích và sản lượng [4]. Ở nước ta hồ tiêu được trồng phổ biến ở các tỉnh miền Nam từ thế kỷ XIX và dần trở thành một cây kinh tế quan trọng: Châu Đốc, Hà Tiên, Phú Quốc, Bà Rịa – Vũng Tàu, Quảng Trị.
Bảng 1.1: Độ phổ biến của các giống tiêu tại các vùng trồng tiêu Việt Nam [5]
Vùng giống Tiêu Tiêu Vĩnh Phú Lada Ấn Độ trung Trâu Linh Quốc Belangtoeng Đông Bình ++ _ ++ + ++ + phước
Ký hiệu: (+++) Rất phổ biến (++) Khá phổ biến (+) Ít phổ biến
Giống tiêu Vĩnh Linh được trồng phổ biến nhất ở cả 3 vùng trông tiêu chính của Việt Nam: Đông Nam Bộ, Duyên hải miền Trung và Tây Nguyên do đặc điểm nổi bật của giống tiêu này là sinh trường và phát triển khỏe, khả năng chống chịu bệnh cao và năng suất tốt (trung bình 4,25kg/trụ).
Hình 1.2: Giống tiêu Vĩnh Linh
1.1.3 Sự phân bố hồ tiêu ở Việt Nam
Các tỉnh sản xuất hồ tiêu hiện nay ở nước ta bao gồm Bình Phước, Đăk Nông, Đăk Lăk, Bà Rịa - Vũng Tàu, Đồng Nai và Gia Lai [5] Xét về diện tích đất, sản lượng và sản lượng, Tây Nguyên và Đông Nam Bộ dẫn đầu Ngoài ra, còn có thêm các địa điểm trồng tiêu như Lâm Đồng, Bình Thuận, … trong đó có Phú Quốc (Kiên Giang) đã có thương hiệu lâu đời.
1.1.4 Công dụng của hồ tiêu
Cây hồ tiêu trồng với mục đích là để lấy quả và hạt, hạt hồ tiêu có nhiều ứng dụng: làm thuốc, làm hương liệu, nhưng chủ yếu là làm gia vị Ngoài ra, hồ tiêu còn có thể trừ sâu mọt trong lúa gạo Ngày xưa, hồ tiêu rất hiếm và rất quý, lúc đó người ta sử dụng hạt hồ tiêu để trao đổi thay cho tiền tệ, dùng hạt hồ tiêu giả nhỏ thành bột sơn quét lên tường cho ấm những nơi cung cấm của vua Ngày nay, hồ tiêu đã trở thành loại gia vị được sử dụng phổ biến trên toàn thế giới, đặc biệt là ở các nước công nghiệp phát triển
[6] Sau đây là một số công dụng của hạt tiêu:
- Tăng cường hệ miễn dịch: Hạt tiêu chứa các chất chống oxy hóa và chất kháng viêm, giúp tăng cường hệ miễn dịch và giảm nguy cơ mắc bệnh.
- Giảm đau: Hạt tiêu chứa các hợp chất có tác dụng giảm đau, giúp giảm các triệu chứng đau nhức cơ thể.
- Hỗ trợ tiêu hóa: Hạt tiêu có tác dụng kích thích tiêu hóa và giúp tăng cường chức năng tiêu hóa Nó cũng giúp giảm triệu chứng khó tiêu và táo bón.
- Giảm nguy cơ ung thư: Hạt tiêu chứa các hợp chất có khả năng chống lại một số loại ung thư, giúp giảm nguy cơ mắc các bệnh liên quan đến ung thư.
- Làm đẹp da: Hạt tiêu có tác dụng chống oxy hóa, giúp ngăn ngừa sự lão hóa da và giúp da trở nên trẻ trung và sáng mịn hơn.
- Bảo vệ tốt cho da, tóc và da dầu: Ngoài hồ tiêu nghiền, người ta còn chưng cất, tẩm trích tinh dầu và nhựa dầu để sử dụng trong công nghệ thực phẩm Người ta có thể tìm thấy những chất tự nhiên có tính chất áp dụng rất tốt cho da, tóc và cho da đầu trong lá và quả hồ tiêu.
- Giảm cân: Hạt tiêu có tác dụng kích thích quá trình trao đổi chất, giúp đốt cháy chất béo và giảm cân.
- Hồ tiêu có tính kháng khuẩn và diệt trùng nên được dùng để giữ gìn thức ăn Người ta còn dùng hồ tiêu để trừ sâu bọ, thường bỏ vào tủ áo khỏi bị côn trùng cắn phá.
Hồ tiêu không chỉ là một loại gia vị phổ biến trong nấu ăn mà còn có nhiều tác dụng có lợi đối với sức khỏe và làm đẹp [7]–[12] Tuy nhiên, như với bất kỳ loại thực phẩm nào khác, cần sử dụng hạt tiêu một cách hợp lý và trong đội ngũ dinh dưỡng cân đối để tận dụng được tất cả các lợi ích của nó.
1.1.5 Thành phần hóa học chính của hồ tiêu
Hạt tiêu đen bao gồm tinh dầu (1,5-2,2%), alkaloid (5-8%), tinh bột (36%), chất béo (8%), tro (4%) và muối khoáng Tinh dầu tập trung ở phần vỏ trung tâm, màu vàng hoặc xanh nhạt, mùi thơm, vị vừa phải gồm các hydrocacbon như phellandrene, cadinene, caryophyllene, terpen như pinene, limonene và một số ít phân tử chứa oxy [13].
Một số hợp chất có trong tinh dầu hạt tiêu đen:
Hạt tiêu có hai alkaloid chính: piperin và chavixin.
Tình hình sản xuất và tiêu thụ hạt tiêu tại Việt Nam
Trong 5 tháng đầu năm 2022, xuất khẩu hạt tiêu của Việt Nam tuy giảm về lượng nhưng lại tăng mạnh về trị giá so với cùng kỳ năm 2021 Trong tháng 5/2022, Việt Nam đã xuất khẩu 21.84 nghìn tấn hạt tiêu, trị giá 98.4 triệu USD, giảm 11.3% về lượng và giảm 13.7% về trị giá so với tháng 4/2022 Tính chung 5 tháng đầu năm
2022, nước ta đã xuất khẩu 99.54 nghìn tấn, trị giá 460.54 triệu USD, mặc dù giảm 17.8% về lượng nhưng tăng 21.6% về trị giá so với cùng kỳ năm 2021 [14].
So với tháng 5/2021 thì tháng 5/2022, lượng hạt tiêu xuất khẩu sang một số thị trường giảm, như: Ấn Độ, Đức, Hàn Quốc, Pakistan Nhưng lượng hạt tiêu xuất khẩu sang Hoa Kỳ, Các Tiểu vương quốc Ả rập Thống nhất, Hà Lan, Philippines, Thái Lan, Anh lại tăng Giá xuất khẩu bình quân hạt tiêu của Việt Nam đạt 4627 USD/tấn trong 5 tháng đầu năm 2022, tăng 47.9% so với cùng kỳ năm 2021 [14]. Đối với thị trường trong nước, hiện giá hạt tiêu đen và trắng tăng lại do nhu cầu nhập khẩu tăng từ Trung Quốc sau khi gỡ bỏ phỏng tỏa do dịch bệnh Covid.
1.2.1 Yêu cầu chung của các nước về chất lượng hồ tiêu của Việt Nam
Các nước chủ yếu nhập Tiêu Đen, Tiêu Trắng, Tiêu Xanh (rút chân không hoặc ngâm muối), và các loại Tiêu Nghiền Bột của Việt Nam để dùng làm thực phẩm, bào chế các thực phẩm chức năng, thuốc chữa bệnh và các loại mỹ phẩm v.v Do làm thực phầm và chất trong y học nên các nước đăc biệt coi trọng chất lượng và vệ sinh an toàn, hạt tiêu luôn nằm trong danh mục bị kiểm soát chặt của Cơ quan Bảo vệ Sức khoẻ người tiêu dùng của các nước;
Mức độ quy định chất lượng và tiêu chuẩn an toàn tuy có khác nhau ở các nước nhưng đều có chung hai (02) qui định đối với hồ tiêu thu hoạch từ đồng ruộng (còn gọi là hạt tiêu nguyên liệu), đó là phải được sản xuất an toàn từ đồng ruộng theo GAP (còn gọi là Thực hành Nông nghiệp Tốt) và GMP (Thực hành Thu hoạch, Xử lý, Bảo quản và Chế biến Tốt).
1.2.2 Yêu cầu liên quan đến chất lượng tiêu đen theo TCVN
Các yêu cầu kỹ thuật đối với tiêu trong nước theo Tiêu chuẩn Việt Nam (TCVN 7036:2008) [15]
Yêu cầu về cảm quan:
- Mùi vị: Khi nghiền thành bột có mùi thơm đặc trưng của hạt tiêu đen, cay và không có mùi và vị lạ.
- Hạt tiêu đen không được có nấm mốc, côn trùng và các phần xác của côn trùng nhìn thấy được bằng mắt thường (kể cả kính lúp).
Yêu cầu về lý – hóa:
Các chỉ tiêu vật lý của hạt tiêu đen:
Bảng 1.3: Các chỉ tiêu vật lý của hạt tiêu đen [15]
Hạt tiêu đen NP hoặc SP Hạt tiêu Tên chỉ tiêu Loại Loại 1 Loại 2 Loại 3 đã chế đặc biệt biến
1 Tạp chất lạ, % khối lượng, 0,2 0,5 1,0 1,0 0,2 không lớn hơn.
2 Hạt lép, % khối lượng, 2 6 10 18 2,0 không lớn hơn.
3 Hạt đầu đinh hoặc hạt vỡ, % 2,0 2,0 4,0 4,0 1,0 khối lượng, không lớn hơn.
4 Khối lượng theo thể tích, g/l, 600 550 500 450 600 không nhỏ hơn
(NP: non-processed – Chưa qua chế biến; SP: semi-processed – Đã qua sơ chế)
Các chỉ tiêu hóa học của hạt tiêu đen:
Bảng 1.4: Các chỉ tiêu hóa học của hạt tiêu đen [15]
Mức yêu cầu Các chỉ tiêu Hạt tiêu đen Hạt tiêu đã Hạt tiêu bột
NP hoặc SP chế biến
1 Độ ẩm, % khối lượng, không lớn 13,0 12,5 12,5 hơn.
2 Tro tổng số, % khối lượng theo 7,0 6,0 6,0 chất khô, không lớn hơn.
3 Chất chiết ete không bay hơi, % khối lượng tính theo chất khô, 6,0 6,0 6,0 không nhỏ hơn.
4 Dầu bay hơi, % (ml/100g) tính 2,0 2,0 1,0 theo chất khô, không nhỏ hơn.
5 Piperin, % khối lượng tính theo 4,0 4,0 4,0 chất khô, không nhỏ hơn.
6 Tro không tan trong axit, % khối lượng tính theo chất khô, không lớn – – 1,2 hơn.
7 Xơ khô, chỉ số không hòa tan, % khối lượng tính theo chẩ khô, không – – 17,5 lớn hơn.
Yêu cầu vi sinh vật đối với hạt tiêu đã chế biến:
Bảng 1.5: Các yêu cầu về vi sinh vật đối với hạt tiêu đen [15]
Tên chỉ tiêu Mức giới hạn
1 Tổng số vi sinh vật hiếu khí, số vi khuẩn trong 1 mg sản phẩm 10 4
2 Coliform, số vi sinh vật trong 1g sản phẩm 10 2
3 E.Coli, số vi khuẩn trong 1 g sản phẩm 3
4 Samolnella, số khuẩn lạc trong 25 g sản phẩm 0
5 S aureus, số vi khuẩn trong 1 g sản phẩm 10 2
6 Nấm men và nấm mốc, số khuẩn lạc có trong 1 mg sản phẩm 10 2
1.2.3 Một số Tiêu chuẩn - Chứng nhận chất lượng đối với hồ tiêu
Cũng như cà phê, cao su, lúa gạo, trái cây v.v., nhiều nước đặt ra các Bộ Tiêu chuẩn để khuyến khích nông dân các nước phát triển bền vững, tạo ra sản phẩm có chất lượng tốt, bảo vệ được sức khoẻ cộng đồng, bảo vệ môi trường, nâng cao giá trị kinh tế và lợi ích xã hội hơn, ví dụ Tiêu chuẩn RA hướng đến canh tác nhưng không làm ảnh hưởng đến môi trường sống, đến sự đa dạng sinh học và đảm bảo quyền lợi của người lao động, đăc biệt là lao động nữ và trẻ em hay; Chứng nhận Mã số vùng trồng giúp quản lý chất lượng và có thể truy suất nguồn gốc Một số chứng nhận tiêu chuẩn được khuyến khích gồm:
Chứng nhận Tiêu chuẩn Global GAP;
Chứng nhân Tiêu chuẩn IPC GAP;
Chứng nhận Tiêu chuẩn RA (Rừng Mưa) kết hợp với Tiêu chuẩn SAN (còn gọi là Mạng lưới Nông nghiệp bền vững);
Chứng nhận Mã số vùng trồng (Traceability);
Chứng nhận bảo hộ thương hiệu tập thể;
Một số chứng nhận tiêu chuẩn khác: Tuỳ theo yêu cầu của người mua.
Tổng quan về quang phổ cận hồng ngoại NIR
Quang phổ NIR là một kỹ thuật ngày càng trở nên phổ biến cả trong công nghiệp và các nghiên cứu hàn lâm Lý do cho sự phổ biến này là kỹ thuật phân tích này rất nhanh so với các kỹ thuật phân tích khác Chỉ mất vài giây để thực hiện một phép đo Không những vậy, NIR là kỹ thuật phân tích không phá hủy, yêu cầu đơn giản hoặc không cần chuẩn bị mẫu.
1.3.1 Khái niệm về quang phổ NIR (Near-Infrared spectroscopy)
Quang phổ cận hồng ngoại (NIR) là quang phổ điện từ có bước sóng trải dài từ 780– 2500 nm Do đó, nó là một phần của quang phổ mà tồn tại giữa cuối dải bước sóng ánh sáng đỏ của quang phổ nhìn thấy được và bắt đầu của vùng hồng ngoại giữa.
Hình 1.3: Vùng bước sóng của quang phổ cận hồng ngoại
Quang phổ cận hồng ngoại (NIR) được phát hiện bởi Herschel vào thế kỷ
19 Tuy nhiên tiềm năng của nó chỉ được khai thác khoảng 30 năm gần đây để phân tích chất lượng của các mẫu rắn, quang phổ NIR được đo bằng cách phản xạ và phổ thu được thường phức tạp với nhiều đỉnh chồng chéo Độ hấp thụ của dải phổ NIR thu được biểu diễn bằng âm bội và sự kết hợp của các phân tử cơ bản được dao động ở trạng thái kích thích.
1.3.2 Nguyên lý ứng dụng quang phổ cận hồng ngoại trong phân tích
Nguyên lý cơ bản của phương pháp là khi chiếu một chùm bức xạ điện từ với dải tần số khác nhau thì các phân tử chỉ hấp thụ bức xạ điện từ có tần số đúng bằng tần số riêng để phân tử đạt các trạng thái kích thích của nó và xảy ra các quá trình biến đổi.
Hình 1.4: Các trạng thái kích thích của phân tử
Do sự hấp thụ này là chọn lọc nên khi chiếu chùm bức xạ điện từ với một dải tần số khác nhau đi qua môi trường vật chất, thì sau khi đi qua chùm bức xạ này sẽ bị mất đi một số bức xạ có tần số xác định Đây chính là những bức xạ bị phân tử hấp thụ. Tương tác giữa bức xạ cận hồng ngoại với cấu trúc các hạt rắn làm phát sinh các hiệu ứng khúc xạ, truyền qua, hấp thụ, phản xạ hay hiệu ứng tán xạ.
Hình 1.5: Các hiệu ứng tương tác giữa quang phổ NIR với mẫu rắn
1.3.3 Thiết bị đo quang phổ cận hồng ngoại
Cấu hình cơ bản của thiết bị đo quang phổ cận hồng ngoại bao gồm năm thành phần sau:
- Bộ phận xử lý tín hiệu.
Các nguồn sáng phổ biến là đèn dây tóc vonfram vì nó phát ra ánh sáng có bước sóng từ 320-2500 nm Bộ lọc và bộ đơn sắc dùng để phân biệt bước sóng Trên bộ lọc các bộ đơn sắc được gắn trên một đĩa phẳng quay cho phép các bức xạ từ đèn đi qua theo trình tự
Bộ lọc thường Bộ lọc hoặc bộ đơn sắc được sử dụng để phân biệt bước sóng Bộ lọc (thường là từ sáu và mười chín) được gắn trên một đĩa phẳng quay cho phép bức xạ từ đèn đi qua tuần tự qua từng bộ lọc trong khi các bộ đơn sắc quét toàn bộ dải bước sóng bằng sử dụng lăng kính hoặc cách tử làm môi trường phân tán Phát hiện bức xạ NIR xảy ra photo bằng điện Các photon tới làm thay đổi trạng thái electron của vật liệu cảm quang của máy đo, do đó tạo ra xung điện làm đầu ra máy đo Để giảm thiểu sự tán xạ máy dò hiệu ứng được đặt gần mẫu ở 45 độ Các tín hiệu từ máy đo được được khuếch đại và đọc dưới dạng quang phổ [11]
Trong thực tế, các thiết bị đo quang phổ cận hồng ngoại thường sử dụng theo 2 nguyên lý chính gồm: Truyền qua hoặc Phản xạ.
Hình 1.6: Cấu tạo thiết bị đo quang phổ NIR a) Chế độ truyền qua b) Chế độ phản xạ
Tổng quan học máy
Học máy (Machine Learning) là một trong những ngành công nghệ hứa hẹn nhất của lĩnh vực trí tuệ nhân tạo, liên quan đến việc sử dụng các thuật toán cho phép máy móc có thể đưa ra quyết định như quá trình học từng bước của con người Nó bao gồm các thuật toán và phương pháp tự động để máy tính có thể tìm ra quan điểm và quyết định từ dữ liệu mà không cần được hướng dẫn trực tiếp. Học máy có thể được sử dụng trong rất nhiều lĩnh vực khác nhau, bao gồm xử lý ngôn ngữ tự nhiên, định vị vị trí, xử lý ảnh và phân tích dữ liệu.
Chemometrics là các thuật toán học máy, phương pháp thống kê và phép biến đổi toán học được áp dụng cho dữ liệu hóa lý [16].
Phân loại: Có hai loại phương pháp học máy chính
Phương pháp quy nạp: Máy học có thể phân loại các khái niệm dựa trên dữ liệu đã thu thập được trước đó Phương pháp này cho phép tận dụng được nguồn dữ liệu rất nhiều và sẵn có.
Phương pháp suy diễn: Máy học phân loại các khái niệm dựa vào các luật Phương pháp này cho phép tận dụng được các kiến thức toán học, xác xuất, thống kê, … để hỗ trợ máy tính.
Có hai loại học máy chính: Học có giám sát (Supervised Learning) và học không giám sát (Unsupervised Learning)
- Học có giám sát là kiểu học mà mô hình được huấn luyện bằng cách sử dụng tập dữ liệu có nhãn Trong kiểu học này, mục tiêu là dự đoán nhãn cho một đầu vào mới dựa trên dữ liệu đã học Ví dụ: Xây dựng mô hình phân loại hình ảnh, cần cung cấp tập dữ liệu hình ảnh và nhãn tương ứng Sau đó, mô hình sẽ “học” các quan hệ giữa đặc trưng của hình ảnh và nhãn để dự đoán nhãn cho hình ảnh mới.
- Học không giám sát là kiểu học mà mô hình được huấn luyện bằng cách sử dụng tập dữ liệu không có nhãn Trong kiểu học này, mục tiêu là phát hiện các mẫu hoặc các nhóm trong tập dữ liệu Ví dụ, phân tích dữ liệu bans để tìm ra nhóm khách hàng có sở thích giống nhau.
Các bài toán cơ bản trong học máy:
- Bài toán phân loại (Classification): Là bài toán trong đó mô hình được huấn luyện để dự đoán các nhãn đầu ra rời rạc (discrete), chẳng hạn như phân loại thực phẩm lành mạnh và không lành mạnh dựa trên các thành phần dinh dưỡng của chúng.
- Bài toán hồi quy (Regression): Là bài toán trong đó mô hình được huấn luyện để dự đoán các giá trị đầu ra liên tục (continuous), chẳng hạn như
Dự đoán giá trị dinh dưỡng của một món ăn từ những thành phần như calo, đạm, chất béo và đường của món ăn đó.
- Bài toán phân cụm (Clustering): Là bài toán trong đó các đối tượng được phân vào các nhóm dựa trên đặc tính tương tự nhau Ví dụ: Phân nhóm các loại rau, thực phẩm chức năng,
Trí tuệ nhân tạo (AI) là sự kết hợp của nhiều phương pháp khác nhau, trong đó khái niệm chính là Mạng thần kinh (NN), Học máy (ML) và Học sâu (DL) là nguyên nhân giúp AI đạt được bước tiến vượt bậc trong thời đại ngày nay [17] Đặc biệt khi công nghệ chế tạo phát triển, sức mạnh tính toàn đỉnh cao của các bộ xử lý đồ họa (GPU) hiện đại cho phép các mạng nơ-ron bắt chước hoạt động của bộ não con người, tạo điều kiện cho AI học các nhiệm vụ phức tạp thông qua lượng dữ liệu đào tạo khổng lồ Năm 2015, cỗ máy Alpha Go do DeepMind đào tạo thông qua kỹ thuật Học tăng cường đã tự học và chơi hơn 10000 ván cờ, sau đó đã đánh bại cờ thủ cơ vây chuyên nghiệp thế giới vào năm 2016 Sự kiện này khiến các nhà khoa học, nhà nghiên cứu thấy trước cuộc cách mạng công nghiệp tiếp theo với sự kết hợp giữa dữ liệu khổng lồ và AI.
Trong lĩnh vực thực phẩm, học máy có thể giúp tăng cường chất lượng và độ tin cậy của các quy trình sản xuất thực phẩm, đảm bảo an toàn thực phẩm, giảm thiểu lãng phí và tăng hiệu quả sản xuất Học máy trong thực phẩm có thể được sử dụng trong nhiều ứng dụng, bao gồm:
- Phân tích chất lượng thực phẩm: Học máy có thể được sử dụng để phân tích các đặc tính chất lượng của thực phẩm, bao gồm độ ẩm, độ tinh khiết, hàm lượng vitamin và chất dinh dưỡng, độ béo và độ chín của thực phẩm.
- Dự đoán sự cố sản xuất: Bằng cách sử dụng các thuật toán học máy để phân tích dữ liệu lịch sử sản xuất, hệ thống có thể dự đoán các sự cố tiềm ẩn và cung cấp cảnh báo cho nhân viên kỹ thuật trước khi chúng xảy ra.
- Phân loại sản phẩm: Học máy có thể được sử dụng để phân loại sản phẩm dựa trên các đặc tính như hàm lượng chất béo, độ chín, hàm lượng đường, hàm lượng protein và độ tinh khiết Điều này có thể giúp tối ưu hóa quy trình sản xuất và đảm bảo chất lượng sản phẩm.
- Dự đoán thời gian sản xuất: Bằng cách sử dụng dữ liệu lịch sử sản xuất, hệ thống có thể học cách dự đoán thời gian cần thiết để sản xuất một sản phẩm và tối ưu hóa quy trình sản xuất.
- Dự đoán vận chuyển và lưu trữ sản phẩm: Bằng cách sử dụng dữ liệu lịch sử và các điều kiện vận chuyển và lưu trữ, hệ thống có thể học cách dự đoán các điều kiện lý tưởng để bảo quản sản phẩm và đảm bảo chất lượng sản phẩm trong suốt quá trình vận chuyển và lưu trữ.
CƠ SỞ LÝ LUẬN
Các phương pháp xác thực nguồn gốc hạt tiêu
Hiện nay, có một số phương pháp để xác thực nguồn gốc địa lý của hạt tiêu đen trong đó có thể kể tới các phương pháp phổ biến như:
- Phương pháp phân tích hóa học: Phương pháp này liên quan trực tiếp đến phân tích thành phần hóa học có trong mẫu hạt tiêu để xác định các hợp chất duy nhất đặc trưng cho một khu vực địa lý cụ thể Ví dụ, sự hiện diện của piperine (alkaloid chính trong hạt tiêu) có thể được sử dụng để xác định nguồn gốc của hạt tiêu.
- Phương pháp phân tích đồng vị: Phương pháp này liên quan đến việc phân tích các đồng vị ổn định của các nguyên tố như carbon, nitơ và oxy trong các mẫu hạt tiêu Trong đó mẫu được đặt trong một phòng thí nghiệm đặc biệt được thiết kế để giảm thiểu sự nhiễu từ các nguồn phóng xạ khác Hạt tiêu đen sẽ phóng xạ các tia gamma có năng lượng cụ thể, và các tia này sẽ được thu thập và phân tích để xác định sự hiện diện của đồng vị hạt tiêu đen và nồng độ của nó Thành phần đồng vị có thể cung cấp thông tin về vị trí địa lý nơi hạt tiêu được trồng, vì các vùng khác nhau có các dấu hiệu đồng vị khác nhau.
- Phương pháp phân tích DNA: Phương pháp này liên quan đến việc phân tích vật liệu di truyền của cây tiêu để xác định các dấu hiệu DNA cụ thể là duy nhất cho một khu vực địa lý cụ thể.
- Phương pháp đánh giá cảm quan: Phương pháp này liên quan đến việc nếm và ngửi các mẫu hạt tiêu để xác định các thuộc tính cảm quan như hương vị và mùi thơm độc đáo có liên quan đến mẫu tiêu tại một khu vực địa lý cụ thể.
- Phương pháp phân tích bằng kính hiển vi: Phương pháp này liên quan đến việc phân tích các đặc điểm hiển vi của các mẫu hạt tiêu, ví dụ như hình dạng và kích thước của hạt tiêu và sự hiện diện của các nguyên liệu thực vật khác, để xác định nguồn gốc của hạt tiêu.
- Phương pháp phân tích quang phổ: Phương pháp này liên quan đến việc sử dụng quang phổ hồng ngoại hoặc cận hồng ngoại để phân tích thành phần hóa học của các mẫu hạt tiêu Phương pháp này có thể cung cấp một cách nhanh chóng và không phá hủy để xác định nguồn gốc địa lý của hạt tiêu.
- Phương pháp phân tích nguyên tố: Phương pháp này liên quan đến việc phân tích thành phần nguyên tố của các mẫu hạt tiêu bằng các kỹ thuật như quang phổ huỳnh quang, tia X Thành phần nguyên tố có thể cung cấp thông tin về vị trí địa lý nơi hạt tiêu được trồng, vì các vùng khác nhau có thành phần đất khác nhau.
Các phương pháp trên đều có thể cung cấp các bằng chứng để xác thực nguồn gốc địa lý của hạt tiêu đen và có thể kết hợp các phương pháp khác nhau nhằm tăng độ tin cậy và chính xác trong mục đích xác thực.
Các nghiên cứu ứng dụng quang phổ NIR kết hợp học máy
Trong những năm gần đây, sự phát triển nhanh của máy quang phổ NIR di động mang đến triển vọng phân tích nhanh tại chỗ và đánh dấu sự cải tiến đáng kể trong các ứng dụng thực tế để phân tích, xác thực các sản phẩm thực phẩm [18]. Tuy nhiên, các thiết bị NIR di động khác nhau về công nghệ chế tạo và khả năng ứng dụng, xử lý của chúng cũng khác nhau tùy thuộc vào vấn đề phân tích cụ thể.
Do đó, nghiên cứu phương pháp đo, tính khả thi và hiệu suất của máy quang phổ NIR di động đối với loại thực phẩm xác định là rất quan trọng vì nó liên quan đến vùng làm việc phổ hẹp của chúng và sự khác biệt trong thiết lập quang phổ [19]. Đặc biệt, vấn đề quan trọng khi sử dụng máy đo quang phổ NIR là bề mặt của mẫu cần được làm phẳng để tránh nhiễu khi đo [20].
Hình 2.1: Số lượng nghiên cứu quang phổ NIR từ các nguồn tìm kiếm Scopus, Web of Science, PubMed và Google Scholar từ năm 1995 đến tháng 2 năm 2020
Hình 2.1 cho thấy quang phổ NIR ngày càng được quan tâm, nghiên cứu và ứng dụng ở các lĩnh vực trong nghành Công nghệ thực phẩm.
Phương pháp định lượng bằng phương pháp hóa học cho phép định lượng chính xác hàm lượng các chất có trong mẫu tuy nhiên để thực hiện phương pháp này yêu cầu cần đủ các hóa chất, dụng cụ thí nghiệm, người thực hiện cần có kỹ thuật cao và mẫu đo bị phá hủy Việc ứng dụng kỹ thuật phân tích dữ liệu đa chiều và thuật toán máy học để phân tích phổ NIRS giúp đánh giá nhanh nguồn gốc đại lý các loại hạt tiêu là một giải pháp đầy triển vọng [21]. Phương pháp này không chỉ cho kết quả nhanh chóng mà nó còn không cần tiền xử lý hóa học phức tạp như nhưng phương pháp truyền thống [22].
Có 3 nhóm ứng dụng chính của quang phổ NIR trong ngành thực phẩm:
Xác thực nguồn gốc địa lý Phát hiện nhiễm tạp Xác định chất lượng
2.2.1 Ứng dụng trong xác thực nguồn gốc địa lý
Dữ liệu quang phổ NIR của mẫu có thể coi là một dấu vân tay của mẫu sản phẩm đó Khi thu thập dữ liệu đa dạng từ các vùng có thể là nguồn cơ sở dữ liệu để xác thực nguồn gốc của sản phẩm đó Một ứng dụng quang phổ NIR trong việc xác định nguồn gốc của hạt cà phê xanh kết hợp phân tích dữ liệu đa biến đã được A Giraudoa và các cộng sự nghiên cứu Dữ liệu NIR của 191 mẫu cà phê từ
2 châu lục và 9 quốc gia Kết quả phân loại theo phương pháp PLS-DA cho kết quả phân loại theo các quốc gia lên tới 100% theo lục địa lên tới 98% và đã được đề xuất độ tin cậy liên phòng thí nghiệm theo xác nhận thực nghiệm bằng phương pháp McNemar (P>0,5) [23] Một nghiên cứu khác của YongSun và các cộng sự đã chỉ ra rằng có thể phân biệt thành công nguồn gốc địa lý của Hải Sâm từ 3 vùng biển khác nhau: Bohai Sea, Yellow Sea and East China Sea Độ chính xác của mô hình lên tới 91% khi kết hợp với thuật toán lightGBM trong phân tích phổ NIR [24].
2.2.2 Ứng dụng trong phát hiện nhiễm tạp
Không chỉ ứng dụng trong xác thực nguồn gốc, các lĩnh vực về phát hiện nhiễm tạp, gian lận thực phẩm cũng được nghiên cứu Nghiên cứu của Swathi SirishaNallan và các cộng sự đã tiến hành thí nghiệm phát hiện nhiễm tạp của cà phê esperesso bằng quang phổ NIR Các mẫu cà phê được trộn với các tạp chất như rau riếp xoăn, lúa mạch, ngô
… sau đó đo quang phổ NIR và phân tích mởi các mô hình cổ điển PLS, iPLS để dự đoán độ pha trộn Nghiên cứu cho kết quả R 2 >85% và RMSEP là 0,76% đối với mô hình PLS
[25] AinaraLópez-Maestresalas và các cộng sự đã nghiên cứu quang phổ NIR với mô hình PLS-DA cho thấy có khả năng phát hiện gian lận giữa thịt cừu và thịt bò băm nhỏ Đặc biệt kết quả xác minh đúng 100% sự nhiễm tạp thịt bò trộn với thịt ngựa ngay cả khi tỉ lệ thịt bò là 1% [26].
2.2.3 Ứng dụng trong phân tích nhanh chất lượng
Kỹ thuật phân tích nhanh chất lượng của sản phẩm dựa trên quang phổ NIR cũng được phát triển mạnh trong những năng gần đây bởi ưu điểm nhanh và không phá hủy mẫu María-Teresa Sánchez và các cộng sự đã nghiên cứu phổ NIR nhằm xác định hàm lượng nitrat có trong thức ăn cho trẻ em Trong đó 157 mẫu được quét tại chỗ bởi máy đo NIR cầm tay có bước sóng từ 1600-2400 nm Mô hình hồi quy bình phương từng phẩn nhỏ nhất PLS đã được áp dụng và cho kết quả (R 2 = 0,83; sai số bình phương trung bình của xác nhận chéo MSE = 112,44 mg/L) cho thấy tiềm năng của phương pháp này trong việc xác định hàm lượng nitrat và các thông số khác trong thức ăn cho trẻ [27] Một phương pháp nhanh chóng để định lượng giá trị K ở cá đã được Akwasi Akomeah Agyekum và cộng sự nghiên cứu Kết hợp thu thập dữ liệu quang phổ NIR ở các mẫu cá trong quá trình bảo quản và các kỹ thuật xử lý thống kê đã biến Mô hình xây dựng có thể định lượng hàm lượng giá trị K của cá với hệ số tương quan R 2 là 0,947 và độ lệch của dự đoán RPD là 3,53 cho thấy tính khả thi của phương pháp mới này [28].
2.2.4 Các nghiên cứu về quang phổ NIR trên hạt tiêu
Quang phổ cận hồng ngoại NIR đã được sử dụng rộng rãi để phân tích hạt tiêu Một số nghiên cứu đã sử dụng phổ NIR để phân tích chất lượng và các thành phần hóa học của hạt tiêu Một số nghiên cứu cụ thể bao gồm:
Nghiên cứu của Andrea Massaro và cộng sự: Nghiên cứu này sử dụng phổ NIR kết hợp thuật toán LASSO nhằm xác thực sự tạp nhiễm của hạt tiêu nguyên bản và mẫu hạt tiêu thêm các chất tạp nhiễm như hạt đu đủ, rau mùi, thạch cao, hồi xanh, nhân ô liu,
… Nghiên cứu xác định các đặc trưng phổ NIR đặc trưng cho từng loại mẫu nguyên bản, bao gồm các đặc trưng phổ ở các vị trí bước sóng: 2386, 2383,
Nghiên cứu của Amanda Beatriz Sales de Lima và cộng sự: Nghiên cứu này sử dụng quang phổ NIR nhằm xác thự sự nhiễm tạp của hạt tiêu và thì là, trong đó các bước sóng đặc trưng của hạt tiêu bao gồm [22]:
- Khoảng 1450 và 1940 nm: các dải cộng hưởng của liên kết O-H liên quan đến nước và tinh bột;
- Khoảng 1500–1570 nm và 2050–2070 nm: liên quan đến sự hiện diện của liên kết N–H;
- 1730, 1770 và 2310 nm: tương ứng với lipid và có thể được quy cho dải âm bội đầu tiên của đoạn C-H và nhóm CH 2
- 2070–2100 nm: các dải kết hợp của liên kết O–H (tinh bột)
- 2280–2340 nm: Liên kết C–H (tinh bột, protein và lipid)
Nghiên cứu của Jong-Rak Park và cộng sự: Nghiên cứu sử dụng quang phổ NIR nhằm định lượng nhanh piperine có trong hạt tiêu Kết quả chỉ ra các bước sóng đặc trưng cho phổ NIR tiêu đen được mô tả như sau [30]:
- Hấp thụ mạnh ở 1450 nm (dải âm bội đầu tiên O-H)
- Hấp thụ mạnh ở 1950 nm (âm bội thứ hai C = O)
- Hấp thụ mạnh giữa 2100 nm và 2300 nm (vùng kết hợp)
Khi thực hiện các phương pháp tiền xử lý các bước sóng đặc trưng quan sát thấy được bổ sung gồm:
- 1695 nm (dải âm bội đầu tiên C-H)
- 2060 nm (dải cộng hưởng thứ hai N-H)
- 2300 nm (dải âm bội thứ hai C-H)
- 2352 nm (dải âm bội thứ hai CH 2 )
Các nghiên cứu trên chỉ ra rằng phổ cận hồng ngoại NIR là một phương pháp tiềm năng để phân tích hạt tiêu.
Ý nghĩa khoa học và tính thực tiễn của đề tài
Đề tài “Nghiên cứu phương pháp đo quang phổ cận hồng ngoại (NIRS) và áp dụng mô hình học máy nhằm xác định nhanh nguồn gốc địa lý của hạt tiêu ở Việt Nam” có thể cung cấp tính khoa học và thực tiễn rõ ràng như: Ý nghĩa về mặt khoa học: Đề tài dựa trên việc áp dụng phương pháp đo quang phổ cận hồng ngoại NIR và ứng dụng kỹ thuật phân tích dữ liệu đa chiều, thuật toán máy học để phân tích phổ cận hồng ngoại NIR giúp đánh giá nhanh nguồn gốc địa lý các loại hạt tiêu đen một cách nhanh chóng và trực tiếp Ưu điểm của phương pháp đo quang phổ NIR là thực hiện phép đo nhanh, không phá hủy mẫu, dễ bảo trì và khả năng xác định đồng thời nhiều hợp chất cần phân tích Nghiên cứu cung cấp một giải pháp hữu ích, đơn giản và nhanh chóng để xác minh nguồn gốc địa lý của hạt tiêu đen Việt Nam. Điều này giúp giảm thời gian kiểm tra chất lượng và tăng hiệu quả sản xuất. Ýnghĩa về mặt thực tiễn: Đề tài xây dựng bộ cơ sở dữ liệu quang phổ NIR trên máy đo quang phổ cầm tay giúp nâng cao chất lượng kiểm soát nguồn gốc xuất xứ trong sản xuất, mua bán hạt tiêu đen tại Việt Nam Ngoài ra, tính xác thực của thực phẩm đôi khi đòi hỏi các phương pháp phân tích phức tạp và lâu dài nên cần một phương pháp phân tích nhanh hơn để phân biệt các sản phẩm từ các nguồn gốc khác nhau Việc áp dụng mô hình học máy và thiết bị quang phổ cận hồng di động để xác định nhanh nguồn gốc địa lý của hạt tiêu đen cũng giúp giảm thiểu thời gian và chi phí cho quá trình kiểm tra chất lượng.
Từ đó, đề tài sẽ đóng góp quan trọng cho ngành công nghiệp sản xuất hạt tiêu đen tại Việt Nam, đồng thời mở ra hướng nghiên cứu mới trong việc ứng dụng phương pháp đo quang phổ cận hồng ngoại NIR và mô hình học máy trong kiểm soát chất lượng sản phẩm thực phẩm.
Mục tiêu và nội dung nghiên cứu
- Nghiên cứu và phát triển phương pháp đo NIR của hạt tiêu đen trên thiết bị cầm tay DLP NIRscan Nano EVM;
- Xây dựng được bộ dữ liệu quang phổ NIR (phổ cận hồng ngoại) cho hạt tiêu tại một số vùng trồng;
- Xác định được mô hình học máy phù hợp phục vụ cho dự đoán nguồn gốc địa lý của hạt tiêu.
- Thí nghiệm khảo sát ảnh hưởng của điều kiện đo và đánh giá kết quả trong các điều kiện đo khác nhau Xác định điều kiện đo tối ưu và xây dựng quy trình thao tác chuẩn để thu thập dữ liệu quang phổ NIR cho hạt tiêu đen bằng thiết bị quang phổ cầm tay;
- Thu thập dữ liệu quang phổ NIR bằng thiết bị đo quang phổ cầm tay DLP NIRscan Nano EVM cho các mẫu hạt tiêu đen theo quy trình thao tác đã xây dựng;
- Phân tích thăm dò dữ liệu đa biến của bộ dữ liệu theo phương pháp Phân tích thành phần chính (PCA);
- Áp dụng các mô hình phân loại theo thống kê và học máy như: SVM, RandomForest, KNN, LDA, QDA, … Trong dự đoán nguồn gốc hạt tiêu đen;
- Đánh giá hiệu suất của các mô hình qua các giá trị: Độ chính xác
(accuracy), Precision, recall và F1 Score.
VẬT LIỆU VÀ PHƯƠNG PHÁP NGHIÊN CỨU
Vật liệu nghiên cứu
Vật liệu được sử dụng trong quá trình nghiên cứu là 118 mẫu hạt tiêu đen được trồng, thu hoạch tại 6 tỉnh thuộc khu vực Bắc Trung Bộ, khu vực Tây Nguyên và khu vực Đông Nam Bộ (Việt Nam), bao gồm: Quảng Trị, Gia Lai, Đắk Lắk, Đắk Nông, Vũng Tàu và Đồng Nai Thông tin mẫu được trình bày ở Phụ lục A.
Các mẫu thu nhận đã được sấy khô đảm bảo đạt độ ẩm dưới 15% theo TCVN 7036:2008 Mẫu sau khi thu thập được gán nhãn chi tiết, bảo quản trong các túi zip, đặt trong tủ để tránh ánh sánh trực tiếp và bảo quản ở nhiệt độ thường.
Hình 3.1: Một số mẫu tiêu thu thập đã được gán nhãn và bảo quản trong túi zip
3.1.2 Thiết bị đo quang phổ cận hồng ngoại
Máy đo quang phổ cận hồng ngoại cầm tay DLP NIRscan Nano EVM (do Texas Instruments Incorporated của Mỹ sản xuất) được trang bị phụ kiện phản xạ khuếch tán Công cụ quang phổ kế quang học cận hồng ngoại được tối ưu hóa cho dải bước sóng 900 đến 1700 nm; độ phân giải từ 2 – 4 nm; Mô-đun chiếu sáng phản xạ với hai đèn hồng ngoại tích hợp.
Hình 3.2: Thiết bị đo quang phổ cận hồng ngoại DLP® NIRscan Nano EVM
Một trong những lợi thế lớn của Nano là nó duy trì mức độ tích hợp cao trong một kích thước nhỏ gọn (dài 62 mm, rộng 58 mm, cao 36 mm) Mô-đun đánh giá được trang bị bộ vi xử lý Tiva TM4C1297 mạnh mẽ, 32MB RAM để bổ sung mã và lưu trữ bộ đệm Các mẫu quét sẽ được truyền trực tuyến đến DLPC150 để kiểm soát DMD Thiết bị có thể được cấp nguồn trực tiếp bằng cổng kết nối micro-USB hoặc pin lithium với jack cắm ngoài Với hai đèn khép kín làm nguồn sáng và một khe cắm thẻ nhớ micro-
SD để lưu trữ dữ liệu ngoại tuyến, chỉ một mô-đun Nano có khả năng thực hiện phân tích NIR Ngoài ra, lớp vật lý của Nano còn hỗ trợ nhiều loại giao thức truyền dữ liệu như USB, Bluetooth và UART Hơn nữa, tất cả các giao diện này có thể được truy cập từ bảng vi xử lý của Nano Quy trình giao tiếp và gói lệnh của các giao diện khác nhau được xây dựng trong các tài liệu chính thức, điều này tạo điều kiện thuận lợi đáng kể cho tất cả các nhà phát triển trong việc tăng tốc công việc phát triển thứ cấp về phát triển công cụ dựa trên Nano EVM.
Phương pháp nghiên cứu
3.2.1 Khảo sát điều kiện thực hiện phép đo quang phổ NIR cho hạt tiêu
Trước khi tiến hành thu thập dữ liệu quang phổ NIR cho hạt tiêu cần xây dựng quy trình thao tác chuẩn và điều kiện tốt nhất nhằm mục đích hạn chế tới sai số hệ thống trong quá trình đo.
Các thí nghiệm thăm dò được thực hiện trên 06 mẫu hạt tiêu đen nguyên hạt đã qua chế biến và thành phẩm.
Hình 3.3: Các mẫu tiêu trong thí nghiệm thăm dò
Mục tiêu khảo sát của thí nghiệm tiến hành trên 2 yếu tố ảnh hưởng trực tiếp của phương pháp đo quang phổ là: Khoảng cách đo giữa đầu dò thiết bị với mặt phẳng mẫu đo và cường độ ánh sáng môi trường.
1 Điền đầy các mẫu vào chén sứ trắng sau đó gạt phẳng bề mặt mẫu sao cho bằng bề mặt chén.
2 Đo cường độ ánh sáng của môi trường đo bằng cảm biến ánh sáng trên điện thoại thông minh Ánh sáng được tạo ra bằng bóng đèn sợt đốt tạo ánh sáng liên tục.
3 Mỗi mẫu được đo ở các khoảng cách giữa miệng cốc và đầu dò khác nhau:
4 Mỗi thí nghiệm thực hiện đo 10 lần và kết quả 1 lần đo là giá trị trung bình của 6 lần quét (theo cấu hình mặc định của thiết bị)
5 Sau khi thu thập được dữ liệu tiến hành đảo trộn mẫu và thực hiện lại từ bước
1 cho tới khi thu thập đủ 10 lần lặp trên 1 mẫu ở 1 điều kiện thí nghiệm.
3.2.2 Phương pháp xử lý dữ liệu
3.2.2.1 Các phương pháp tiền xử lý quang phổ
Sự tán xạ ánh sáng do tương tác giữa bức xạ NIR và các hạt mẫu thường tạo ra sự thay đổi mức độ hấp thụ có thể làm cho việc giải thích quang phổ và hiệu chuẩn tuyến tính của phổ phản xạ khuếch tán NIR trở nên khó khăn hơn.
Sự tán xạ ánh sáng dẫn đến sự thay đổi độ dài đường truyền dẫn đến mức tín hiệu nền thay đổi theo bước sóng tạo ra sự dịch chuyển và độ cong của đường cơ sở, đồng thời có thể khác nhau rất nhiều trong và giữa các mẫu.
Do vậy, các phương pháp tiền xử lý cho phép loại bỏ nhiễu do dữ liệu phổ gây ra, cho phép loại bỏ sự biến đổi không mang tính thông tin có trong phổ Các kỹ thuật tiền xử lý dữ liệu như biến đổi thông thường (SNV), hiệu chỉnh phân tán nhân (MSC) và đạo hàm làm mịn là bắt buộc đối với phổ NIR thô để phân loại định tính thích hợp và phát triển các mô hình hiệu chuẩn định lượng Phép tiền xử lý SNV và MSC được sử dụng để bù cho các hiệu ứng kích thước hạt khi nó xoay quang phổ để loại bỏ một phần của hiệu ứng đó, điều chỉnh càng gần với phổ trung bình càng tốt [31]–[33] Các đạo hàm thứ nhất và thứ hai được tính theo phương pháp Savitzky – Golay bằng cách sử dụng cửa sổ đa điểm và đa thức bậc 2 hoặc bậc 3, cho phép loại bỏ nhiễu như trôi đường cơ sở [33].
Biến đổi chuẩn thông thường (SNV):
Phép biến đổi SNV được giới thiệu bởi Barnes [34] để giảm hiệu ứng nhân của sự tán xạ và kích thước hạt, đồng thời cũng để giảm sự khác biệt về cường độ toàn cầu của các tín hiệu Mỗi phổ được căn giữa và sau đó được chia tỷ lệ bằng cách chia cho độ lệch chuẩn của nó. ݔ ௌே ൌ ൫ ݔ , ൌ ̅ݔ൯
- ݔ , ௌே là giá trị phổ được biến đổi SNV;
- ݔ , là giá trị nguyên bản của phổ;
- ̅ݔ là giá trị trung bình của toàn bộ phổ
- σ୧ là độ lệch chuẩn của tập dữ liệu phổ, σ୧ ൌ మమమ
Tuy nhiên phương pháp SNV giả định rằng các hiệu ứng nhân xảy ra đồng nhất trên toàn bộ tập dữ liệu quang phổ và điều này không phải lúc nào cũng đúng.
Do vậy, SNV thường được sử dụng khi bộ dữ liệu không có tham chiếu chung.
Hiệu chuẩn phân tán nhân (MSC):
Cũng giống như ứng dụng của SNV, MSC thường được sử dụng hiệu quả để loại bỏ hiệu ứng tán xạ cho đường cơ sở và toàn bộ Việc hiệu chỉnh được thực hiện bằng cách áp dụng hiệu ứng cộng và nhân của phổ ban đầu tương ứng với giá trị trung bình
[35] Với mỗi đường cơ sở trong tập dữ liệu bước sóng, một giá trị trung bình được tính toán và sau đó thực hiện hồi quy tuyến tính đơn giản cho các đường cơ sở đó. ݔ ൌ ̅ݔ
Trong đó: là phổ NIR của mẫu thứ I; là phổ của NIR của mẫu lý tưởng (có thể là phổ trungbình hoặc phổ trung vị của bộ dữ liệu) Đối với mỗi mẫu, a và b được tính ݔ ̅ݔ thông qua hồi quy bình phương nhỏ nhất thông thường (OLS), e là sai số hay phần dư trong mô hình hồi quy Mỗi giá trị phổ ݔ , ௌே ௌே hiệu chỉnh MSC được tính như sau: ݔ ௌே ௌே ൌ ݔ , ൌ ൯
- ݔ , ௌே ௌே là giá trị phổ được biến đổi MSC;
- ݔ , là giá trị nguyên bản của phổ;
- , là các hệ số chặn của phương trình hồi quy
Một sửa đổi của phương pháp MSC là hiệu chuẩn phân tán nhân mở rộng EMSC (Extended multiplicative signal correction) có bao gồm các bước bổ trợ để hiệu chỉnh bước sóng Với EMSC, có thể ước tính và phân tách hiệu ứng vật lý nhân (độ dài đường dẫn, độ dày mẫu, tán xạ ánh sáng, v.v.) từ hiệu ứng vật lý phụ (sự thay đổi đường cơ sở, sự thay đổi nhiệt độ, v.v.) và ảnh hưởng của các hiệu ứng hóa học (độ hấp thụ của chất phân tích và chất cản trở) [36].
Là một kỹ thuật tiền xử lý dữ liệu được sử dụng để loại bỏ thành phần xu hướng hoặc tính thời vụ khỏi dữ liệu dạng chuỗi thời gian Xu hướng đề cập đến các mô hình có sự lặp lại xảy ra trong khung thời gian ngắn hơn Detrend giúp làm cho dữ liệu đứng yên, có nghĩa là giá trị trung bình và phương sai của dữ liệu không đổi theo thời gian Detrend là một bước quan trọng trong phân tích dữ liệu có dạng chuỗi thời gian vì nó giúp loại bỏ các tác động của xu hướng và tính thời vụ, giúp phân tích các mô hình và mối quan hệ cơ bản trong dữ liệu dễ dàng hơn. Mỗi phương pháp tiền xử lý có ý nghĩa nhất định đối với bộ dữ liệu: Các hiệu ứng cộng, nhân trong quá tình đo do bề mặt mẫu không đồng nhất có thể được giảm thiểu và loại bỏ nhờ SNV hoặc MSC Trong khi các đỉnh hấp thụ của phổ NIR có thể được khuếch đại rõ hơn khi xử dụng các dẫn xuất bằng đạo hàm.
3.2.2.2 Các mô hình phân loại
Phân loại là một nhiệm vụ cơ bản trong học máy và thống kê liên quan đến việc dự đoán nhãn lớp của một mẫu dựa trên các tính năng của nó.
Các phương pháp phân loại thống kê thường dựa trên các mô hình xác suất ước tính xác suất của một mẫu thuộc mỗi lớp dựa trên các đặc trưng của nó Cách tiếp cận này cho phép tính toán xác suất lớp và có thể được mở rộng cho các bài toán đa lớp bằng cách sử dụng hồi quy logistic đa thức Naive Bayes là một phương pháp thống kê khác giả định sự độc lập giữa các biến dự đoán và ước tính xác suất có điều kiện của biến đáp ứng với các yếu tố dự đoán Những phương pháp này có nền tảng lý thuyết vững chắc và có thể được giải thích dưới dạng suy luận thống kê và kiểm tra giả thuyết.