Tài liệu hạn chế xem trước, để xem đầy đủ mời bạn chọn Tải xuống
1
/ 68 trang
THÔNG TIN TÀI LIỆU
Thông tin cơ bản
Định dạng
Số trang
68
Dung lượng
3,23 MB
Nội dung
I HỌC TH I NGU TRƢỜNG I HỌC N THUẬT C NG NGHI P T MINH LONG XỬ LÝ ẢNH VÀ ỨNG DỤNG IỀU KHIỂN QUÁ TRÌNH LÊN MEN TRONG CÔNG NGH SẢN XUẤT CHÈ EN LUẬN VĂN TH C SĨ HOA HỌC MÃ NGÀNH: 6520203 NGÀNH K THUẬT I N TỬ HOA I N TỬ NGƢỜI HƢỚNG DẪN KHOA HỌC: PGS.TS L I KHẮC LÃI PGS.TS Huy Du T N uy n – Năm 2020 i CỘNG HÒA XÃ HỘI CHỦ NGHĨA VIỆT NAM ộc lập – Tự – Hạnh phúc BẢN XÁC NHẬN CHỈNH SỬA LUẬN VĂN TH C SĨ Họ tên tác giả luận văn: Tạ Minh Long ề tài luận văn: Xử lý ảnh ứng dụn đ ều khiển trình lên men công nghệ sản xuất c è đen Chuyên ngành: Kỹ thuật ện tử Mã số: …………… Tác giả, Cán hƣớng dẫn khoa học Hội đồng chấm luận văn xác nhận tác giả sửa chữa, bổ sung luận văn theo biên họp Hội đồng ngày 25/12/2020 với nội dung sau: - Bổ xung thêm ứng dụng điều khiển công nghệ sản xuất chè đen chƣơng - Sửa lại lỗi chế - Bổ sung kết luận chƣơng …………… …………… Thái Nguyên, ngày tháng G o v n ƣớng dẫn Tác giả luận văn PGS.TS Lại Khắc Lãi Tạ Minh Long CHỦ TỊCH HỘI ỒNG PGS.TS Nguyễn Thanh Hà năm 2020 ii LỜI CAM OAN Tên là: Tạ M n Lon Sinh ngày: 08 tháng 12 năm 1992 Học viên Cao học Khoá 20 – Lớp Kỹ thuật Điện tử - Trƣờng Đại học Kỹ thuật Công nghiệp – Đại học Thái Nguyên Xin cam đoan luận văn “Xử lý ảnh ứng dụn đ ều khiển trình lên men cơng nghệ sản xuất c è đen” thầy giáo PGS.TS Lạ ắc Lã hƣớng dẫn cơng trình nghiên cứu riêng tơi Tất tài liệu tham khảo có nguồn gốc, xuất xứ rõ ràng Tôi xin cam đoan tất nội dung luận văn nhƣ nội dung đề cƣơng yêu cầu thầy giáo hƣớng dẫn Nếu có vấn đề nội dung luận văn, tơi xin hồn tồn chịu trách nhiệm với lời cam đoan Thái Nguyên, ngày tháng Học v n Tạ M n Lon năm 2020 iii LỜI CẢM ƠN Sau thời gian nghiên cứu, đƣợc hƣớng dẫn tận tình giúp đỡ thầy giáo PGS.TS Lạ ắc Lã , luận văn với đề tài “Xử lý ảnh ứng dụn đ ều khiển trình lên men cơng nghệ sản xuất chè đen” đƣợc hồn thành Tơi xin bày tỏ lịng biết ơn sâu sắc tới: Thầy giáo hƣớng dẫn PGS.TS Lạ ắc Lã tận tình dẫn, giúp đỡ tơi hồn thành luận văn Các thầy cô giáo Trƣờng Đại học kỹ thuật công nghiệp - Đại học Thái Nguyên bạn bè đồng nghiệp, quan tâm động viên, giúp đỡ tơi suốt q trình học tập để hồn thành luận văn Mặc dù cố gắng hết sức, song điều kiện thời gian kinh nghiệm thực tế thân cịn ít, đề tài khơng thể tránh khỏi thiếu sót Vì vậy, tơi mong nhận đƣợc đóng góp ý kiến thầy giáo,cô giáo bạn bè đồng nghiệp Tô x n c ân t àn cảm ơn! Thái Nguyên, ngày tháng Học v n Tạ M n Lon năm 2020 iv MỤC LỤC LỜI CAM ĐOAN ii LỜI CẢM ƠN iii MỤC LỤC iv DANH MỤC CÁC CHỮ VIẾT TẮT vi DANH MỤC CÁC HÌNH VẼ vii LỜI NÓI ĐẦU 1 Tính cấp thiết luận văn .1 Mục tiêu nghiên cứu Đối tƣợng phạm vi nghiên cứu Ý nghĩa luận văn .3 Nội dung nghiên cứu Phƣơng pháp phƣơng pháp luận CHƢƠNG 1: LÊN MEN CHÈ ĐEN VÀ ẢNH SỐ 1.1 Chè đen lên men chè đen .4 1.1.1 Chè đen .4 1.1.2 Quá trình lên men chè đen 1.2 Ảnh số .6 1.2.1 Định nghĩa ảnh số .6 1.2.2 Thuộc tính hình ảnh số hóa 1.2.3 Các loại hình ảnh 1.2.4 Không gian màu RGB, HSV, LAB 1.3 Phƣơng pháp nghiên cứu 13 1.4 Kết luận chƣơng 13 CHƢƠNG 2: CÁC THUẬT TOÁN SỬ DỤNG 14 2.1 ANOVA, Z – Score, Correlation coefficients 14 2.1.1 ANOVA yếu tố (one-way ANOVA) 14 2.1.2 Z – Score 16 2.1.3 Correlation coefficients 16 2.2 Phân loại mẫu đào tạo kiểm tra SPXY 18 v 2.2.1 Kennard-Stone 18 2.2.2 SPXY 19 2.3 Phân tích thành phần .20 2.3.1 Ý tƣởng .20 2.3.2 Hàm mát 22 2.3.3 Tối ƣu hóa hàm mát 23 2.3.4 Các bƣớc thực phân tích thành phần 24 2.4 Thuật tốn Cây định Rừng ngẫu nhiên 26 2.4.1 Khái niện chung 26 2.4.2 Thuật toán Rừng ngẫu nhiên(Random Forest) 28 2.5 Kết luận chƣơng 38 CHƢƠNG 3: DỰ ĐOÁN CÁC CHỈ SỐ CHẤT LƢỢNG VÀ ỨNG DỤNG 39 3.1 Tiền xử lý liệu phân chia mẫu 39 3.1.1 Trích xuất tính màu 40 3.1.2 Phân tích khác biệt số chất lƣợng đặc điểm màu sắc 41 3.1.3 Tƣơng quan đặc điểm màu sắc số chất lƣợng .42 3.1.4 Tiền xử lý liệu phân chia mẫu 43 3.2 Phân chia tập huấn luyện thử nghiệm (train/test) 44 3.3 Phân tích thành phần .45 3.4 Thiết lập mơ hình phi tuyến RF cho số chất lƣợng 47 3.5 Ứng dụng 50 3.5.1 Lƣu đồ thuật toán đề xuất 50 3.5.2 Thiết bị điều khiển đề xuất .51 3.6 Kết luận chƣơng 52 KẾT LUẬN VÀ KIẾN NGHỊ 53 TÀI LIỆU THAM KHẢO 54 Phụ lục 1: Chƣơng trình tối ƣu hóa số thành phần số RF(đại diện TFs) 56 vi DANH MỤC C C CHỮ VIẾT TẮT Từ Viết Tắt Tên tiếng anh Tên tiếng việt TFs Theaflavins Chất sắc tố TRs Thearubigins Chất sắc tố TBs Theabrownin Chất sắc tố SS Sensory Score Điểm cảm quan RGB Red Green Blue Đỏ Xanh lục Xanh lam HSV Hue Saturation Value Màu, độ bão hoà, giá trị Lab L(Black ÷ White), a(Green ÷ Red), b(Blue ÷ Yellow) Mức độ màu thành phần ANOVA Analysis of variance Phân tích phƣơng sai PCA Principal Components Analysis Phân tích thành phần KS Kennard-Stone Tên thuật tốn SPXY Sample set Partitioning based on joint X–Y distance Phân vùng tập hợp mẫu dựa khớp khoảng cách x-y RF Random Forest Rừng ngẫu nhiên OBB Out-of-bag RMSEC RMSEP Mẫu không tham gia xây dựng RF Root-mean-square-error-Calibration Lỗi-trung bình-bình phƣơng set gốc hiệu chuẩn Root-mean-square-error- Prediction Lỗi-trung bình-bình phƣơng set gốc dự đốn CV Coefficient of variation Hệ số biến thiên SEP Standard Error of Prediction Sai số chuẩn dự đoán RPD Ratio of standard error of Performance to standard Deviation Tỷ lệ sai số chuẩn Hiệu suất so với Độ lệch chuẩn vii DANH MỤC C C HÌNH VẼ Hình 1.1: Chè đen .4 Hình 1.2: Màu sắc tăng cƣờng trung bình trƣớc sau lên men(S×3,H×2) Hình 1.3: Máy lên men chè đen liên tục thực tế Hình 1.4: Nguyên lý cấu tạo máy lên men liên tục .6 Hình 1.5: Tham chiếu không gian Pixel (0, 0) .7 Hình 1.6: Khơng gian màu RGB .10 Hình 1.7: Khơng gian màu HSV .11 Hình 1.8: Khơng gian màu Lab 12 Hình 1.9: Lƣu đồ thuật tốn đƣợc sử dụng để đo màu sắc mẫu trà .13 Hình 2.1: Sự ảnh hƣởng kết với yếu tố xét 15 Hình 2.2: Đồ thị thể giá trị Z-score 16 Hình 2.3: Mơ tả thuật tốn KS 19 Hình 2.4: Ví dụ phƣơng sai liệu không gian hai chiều 21 Hình 2.5: Ý tƣởng PCA 21 Hình 2.6: Minh họa thành phần với liệu hai chiều 24 Hình 2.7: Các bƣớc thực PCA 25 Hình 2.8: Mơ hình hoạt động Bagging .29 Hình 2.9: Sơ đồ kết hợp phân loại nhờ bỏ phiếu 32 Hình 2.10: Sơ đồ học tập thể học 32 Hình 2.11: Thuật tốn Random Forest 34 Hình 3.1: Bảng liệu đồ thị thể thay đổi giá trị RGB trung bình theo thời gian .39 Hình 3.2: Đồ thị thể thay đổi giá trị a, H; b, S; c, V; d, L; e, a; f, b 39 trung bình theo thời gian 39 Hình 3.3: Đồ thị thể thay đổi giá trị số chất lƣợng 40 Hình 3.4: Biểu đồ điểm PCA với thành phần 44 Hình 3.5: Đồ thị thể mối quan hệ trị riêng số thành phần 45 viii Hình 3.6: Các quan sát véc tơ riêng hai thành phần thứ thứ hai 46 Hình 3.7: Lƣu đồ thuật tốn tối ƣu PCs N 47 Hình 3.8: Giá trị RMSEC số chất lƣợng cho mơ hình RF từ PC N khác .48 Hình 3.9: Lƣu đồ thuật toán điều khiển lên men đề xuất 50 Hình 3.10: Cài đặt chế độ hoạt động thơng qua hình HMI .52 LỜI NĨI ẦU Tín cấp t ết luận văn Trong trình sản xuất chè đen, lên men giai đoạn quan trọng, tạo biến đổi sinh hóa để có hƣơng vị, màu sắc cho chè thành phẩm Tuy nhiên thực tế, trình đƣợc thực chủ yếu nhờ vào cảm quan ngƣời để xem chè lên men đạt tiêu chuẩn hay chƣa Để đảm bảo nhanh chóng xác q trình lên men với phƣơng pháp lên men liên tục (dạng băng tải) ta dựa q trình biến đổi lý, hóa, cảm quan theo thời gian thông qua số chất lƣợng tiêu chuẩn Xử lý hình ảnh thay cảm quan ngƣời để đảm bảo sản phảm đạt chất lƣợng Dựa vào hình ảnh phân tích đƣợc, ta điều khiển nhiệt độ, lƣu lƣợng khí, tốc độ băng tải để đảm bảo tiêu chất lƣợng thời điểm đạt tiêu chuẩn Khi đảm bảo điều kiện, chuyển sang giai đoạn Trong năm gần đây, thuật toán RF(Random Forest) đƣợc áp dụng rộng rãi cho nhiều ngành khác Nhƣng khơng có tài liệu liên quan đến trà dự đốn giám sát hình ảnh Xuất phát từ yêu cầu cấp thiết nêu trên, em chọn đề tài cho luận văn là: “Xử lý ảnh ứng dụn đ ều khiển q trình lên men cơng nghệ sản xuất c è đen” Mục t u n n cứu Công nghệ thị giác máy đƣợc áp dụng để phát thay đổi không gian màu màu trà đen RGB, Lab HSV, đồng thời tìm hiểu liên quan với chất lƣợng lên men trà đen Và sau đó, thơng số đặc trƣng màu sắc đƣợc sử dụng làm đầu vào để thiết lập số hóa lý (TFs, TRs TBs) mơ hình đánh giá định lƣợng tuyến tính phi tuyến tính đặc điểm cảm quan 45 Bảng 3.5: Phân bố đầu số chất lƣợng Thông số Dải train(hiệu chuẩn) Dải test(dự đoán) TFs 0.281 – 0.694 0.3 – 0.694 TRs 3.112 – 5.677 3.582 – 5.461 TBs 4.106 – 8.606 4.617 – 8.203 Điểm cảm quan(SS) 64.682 – 94.179 64.733 – 88.665 Dữ liệu train đƣợc chọn bao phủ toàn liệu test đó, liệu train lấy đại diện Dải hiệu chuẩn số chất lƣợng lớn dải dự đoán, điều đảm bảo tính mạnh mẽ mơ hình dự đốn 3.3 P ân tíc t àn p ần c ín Bảng 3.6: Phân tích ma trận tƣơng quan Hình 3.5: Đồ thị thể mối quan hệ trị riêng số thành phần Bảng 3.7: Véc tơ riêng 46 Hình 3.6: Các quan sát véc tơ riêng hai thành phần thứ thứ hai Sau có Véc tơ riêng ta chiếu điểm liệu chuẩn hóa lên véc tơ thu đƣợc bảng liệu đầu vào mới: Bảng 3.8: Dữ liệu đầu vào cho mơ hình 47 3.4 T ết lập mơ ìn p tuyến RF c o từn c ỉ số c ất lƣợn PC (số thành phần chính) N (số định) có ảnh hƣởng trực tiếp đến độ xác mơ hình RF Do đó, cần phải tối ƣu hóa thêm N PC (trong phạm vi định) 50N (20–1000, với kích thƣớc bƣớc 20) 9PC (1–9, với kích thƣớc bƣớc 1) đƣợc chọn tƣơng ứng để tối ƣu hóa thơng số dựa RMSE mơ hình số chất lƣợng Hình 3.7: Lƣu đồ thuật toán tối ƣu PCs N 48 a b c d e f h g Hình 3.8: Giá trị RMSEC số chất lƣợng cho mơ hình RF từ PC N khác 49 a, đại diện cho TF; c, đại diện cho TR; e, đại diện cho TB g, đại diện cho SS(điểm cảm quan), giá trị tham chiếu so với giá trị dự đốn mơ hình RF: b, đại diện cho TF; d, đại diện cho TR; f, đại diện cho TB h, đại diện cho SS Bảng 3.9: Tổng hợp thơng số sau tối ƣu mơ hình dự đốn Thơng PC số N RMSEC Rc biasc RMSEP Rp biasp SEP CV RPD TFs 880 0.0286 0.9762 0.0004 0.0526 0.8906 0.0007 0.0526 0.2103 1.8685 TRs 60 0.1727 0.9687 0.0105 0.3452 0.7356 0.0051 0.3451 0.0953 1.2321 TBs 380 0.1943 0.9864 0.0036 0.3789 0.9008 0.0417 0.3766 0.1083 2.0182 SS 60 1.2579 0.9773 0.0249 2.165 0.8855 -0.076 2.1637 0.0522 1.972 Qua kết mô ta thấy rằng: - Trong mơ hình dự đốn TFs, PC = N = 880, RMSEC mơ hình đạt mức tối thiểu (0,0286), Rp, RMSEP, Bias, SEP, CV RPD dự đoán 0.8906, 0.0526, 0.0007, 0.0526 , 0.2103 1.8685 tƣơng ứng, mối quan hệ giá trị dự đoán giá trị đo đƣợc thể nhƣ Hình 3.8a, b - Trong mơ hình dự đốn TRs, PC = N = 60, RMSEC mơ hình đạt mức tối thiểu (0,1727), Rp, RMSEP, Bias, SEP, CV RPD dự đoán 0.7356, 0.3452, 0.0051, 0.3451 , 0.0953 1.2321 tƣơng ứng, mối quan hệ giá trị dự đoán giá trị đo đƣợc thể nhƣ Hình 3.8c, d - Trong mơ hình dự đốn TBs, PC = N = 380, RMSEC mơ hình đạt mức tối thiểu (0,1943), Rp, RMSEP, Bias, SEP, CV RPD dự đoán 0.9008, 0.3789, 0.0417, 0.3766 , 0.1083 2.0182 tƣơng ứng, mối quan hệ giá trị dự đoán giá trị đo đƣợc thể nhƣ Hình 3.8e, f - Trong mơ hình dự đốn SS, PC = N = 60, RMSEC mơ hình đạt mức tối thiểu (1.2579), Rp, RMSEP, Bias, SEP, CV RPD dự đoán 0.8855, 2.165, -0.076, 2.1637 , 0.0522 1.972 tƣơng ứng, mối quan hệ giá trị dự đoán giá trị đo đƣợc thể nhƣ Hình 3.8g, h Nói chung, RMSEP, SEP, CV Bias nhỏ giá trị Rp RPD, phản ánh mơ hình xác tổng qt Quá trình lên men trà thƣờng kèm với phản ứng trao đổi chất phức tạp, thay đổi thành phần vật lý hóa học đƣợc thể theo trình tự thời 50 gian Trong đó, đánh giá cảm quan đƣợc thực cách phân biệt thông tin màu sắc mẫu trà mắt ngƣời, sau vào hệ thống não phức tạp ngƣời đƣợc tích hợp đánh giá tồn diện cuối Do đó, điểm cảm quan cuối màu sắc có yếu tố phi tuyến tính chủ quan Phƣơng pháp phi tuyến tính với chức tự học điều chỉnh giải hiệu vấn đề phức tạp phát huy khả dự đốn mơ hình Cơng nghệ đƣợc áp dụng cho hệ thống lên men tự động chè đen để dự đoán giám sát thông số chất lƣợng 3.5 Ứn dụn 3.5.1 Lƣu đồ t uật to n đề xuất Hình 3.9: Lƣu đồ thuật toán điều khiển lên men đề xuất 51 - Hình ảnh thu đƣợc từ điểm đo lƣờng đƣợc phân tích xử lý để so sánh với ngƣỡng chuẩn số chất lƣợng, điểm cảm quan dự đoán - Nếu liệu thu đƣợc nằm ngƣỡng cho phép ta trì tham số điều khiển, đây, tham số điều khiển thay đổi đóng mở van khí tuyến tính để thay đổi tác động nhiệt độ, độ ẩm hợp chất trình lên men vào khối chè - Nếu liệu nằm ngƣỡng cho phép, ta so sánh tiếp xem liệu ngững chƣa đủ hay ngƣỡng để thay đổi tham số, điều khiển van khí cho hợp lý 3.5.2 T ết bị đ ều k ển đề xuất - Để đảm bảo tính ổn định nhƣ xác hệ thống, đề nghị sử dụng camera chuyên dụng Ống kính đơn kỹ thuật số phản xạ (Canon DS60D, Nhật Bản, 18MP) đƣợc chọn làm cảm biến hình ảnh; thông số thu nhận máy ảnh đƣợc liệt kê bảng 3.10 Ánh sáng đồng (Sphere100, Hangzhou Flight Technology Co., Ltd, Trung Quốc) đƣợc chọn làm nguồn sáng có cƣờng độ 100 lux Điện áp yêu cầu 24V công suất 11,3 W Khoảng cách từ mẫu 180 mm Bảng 3.10: Đặc điểm camera 52 - Hệ thống xử lý ảnh đƣợc xử lý máy tính với GUI Matlab - Thiết bị xử lý điều khiển van sử dụng PLC với chuẩn truyền thông RS485 kết nối với máy tính - Cài đặt thơng số, điều khiển chế độ thơng qua hình HMI Hình 3.10: Cài đặt chế độ hoạt động thơng qua hình HMI 3.6 ết luận c ƣơn - Trong chƣơng 3, tác giả trình bày việc xử lý liệu, kết thực nghiệm áp dụng thuật toán, đƣa đƣợc mơ hình dự đốn tối ƣu với RF đƣợc kiểm nghiệm phần mềm Đánh giá đƣợc thông số liên quan - Đề xuất phƣơng án điều khiển áp dụng với thực tế, lựa chọn thiết bị xử lý hình ảnh, điều khiển 53 ẾT LUẬN VÀ IẾN NGHỊ ết c ín đạt đƣợc: - Luận văn trình bày sở lý thuyết lên men chè đen, đặc điểm màu sắc, chuyển đổi không gian màu liên quan - Hiểu, áp dụng thực viết chƣơng trình cho thuật tốn xử lý liệu - Tối ƣu hóa mơ hình hồi quy phi tuyến sử dụng thuật toán Rừng ngẫu nhiên, cụ thể dự đoán chất lƣợng lên men chè đen với số chất lƣợng - Đề xuất phƣơng án ứng dugj điều khiển sản suất thực tế Hạn c ế đề tà : - Dữ liệu luận văn mang tính chất tham khảo từ nguồn Internet nên áp dụng thực tế có khác biệt định - Chƣa tối ƣu hết thuật toàn tiền xử lý liệu, tập chung vào PCA RF - Kết chƣa thực tốt, Rc, Rp TRs lần lƣợt 0.9687 0.7356(thấp) ề xuất ƣớn n n cứu t ếp t eo: Để giúp cho tốn đƣợc hồn thiện hơn, nghiên cứu tới cần quan tâm vấn đề sau: - Cần khảo sát thực tế sở sản xuất chè đen để lấy liệu xác loại chè - Tối ƣu hóa thuật tốn sử dụng để có kết tốt nhất, so sánh mơ hình dự đốn khác để lựa chọn mơ hình phù hợp với đối tƣợng - Xây dựng mối quan hệ tiêu chí chất lƣợng với nhiệt độ, độ ẩm để đƣa tham số điều khiển tốt q trình lên men thơng qua thực nghiệm 54 TÀI LI U THAM [1] HẢO Chè (1993), Xác định tiêu cảm quan phương pháp cho điểm, TCVN 3218- 1993, Hà Nội [2] Đỗ văn chƣơng (1999), Nghiên cứu số phương pháp héo chè sản xuất chè đen yếu tố ảnh hưởng đến chất lượng trình héo, Luận án tiến sỹ khoa học kỹ thuật, Hà Nội [3] Lê Doãn Diên - Vũ Thuỵ Thƣ - Đoàn Hùng Tiến - Đỗ Thị Gấm - Giang Trung Hoa (2001), Các hợp chất hố học có chè số phương pháp phân tích thơng dụng sản xuất chè Việt Nam, Nxb Nông Nghiệp, Hà Nội [4] L NikhilR.Pal (2005), Advanced Techniques in Knowledge Discovery and DataMining, Springer [5] H.J.a.K.M ( 2001), Data Mining: Concepts and Techniques, MorganKaufman, Academic Press [6] Tiêu chuẩn nhà nƣớc (1993), Chè đen, chè xanh, phân tích cảm quan, phƣơng pháp cho điểm TCVN 3218 , Hà Nội [7] Hồng Xn Huấn (2015), Giáo trình học máy, Trƣờng Đại học Công nghệ - Đại học Quốc gia Hà Nội [8] B P Hofer J (2004), Distributed Decision Tree Induction within the Grid Data Mining Framework GridMiner-Core, Institute for Software Science, AUT [9] H Deng and G Runger (2013), Gene selection with guided regularized random forest, Journal of Pattern Recognition, vol 46, pp 3483- 3489 [10] L Breiman(2001), “Random Forest,” Machine Learning Journal Paper, vol 45 [11] Martin Obanda, P Okinda Owuor and Richard Mang'oka (2001) “Changes in the chemical and sensory quality parameters of black tea due to variations of fermentation time and temperature” Food Chemistry, Volume (75), Issue 4, Pages 395-404 [12] Martin Obanda, P Okinda Owuor, Richard Mang’oka and Mutuku M Kavoi (2004) “Changes in thearubigin fractions and theaflavin levels due to variations 55 in processing conditions and their influence on black tea liquor brightness and total colour”, Food Chemistry, Volume (85), Issue 2, Pages 163-173 [13] Mehmet Tufekci and Saadettin Guner (1997) “The determination of optimum fermentation time in Turkish black tea manufacture”, Food Chemistry, Volume (60), Issue 1, Pages 53-56 [14] Thomas Muthumani and R.S Senthil Kumar (Available online March 2006) ”Influence of fermentation time on the development of compounds responsible for quality in black tea”, Food Chemistry, In Press, Corrected Proof [15] Leo Breiman, Jerome Friedman, Charles J Stone, R.A Olshen (1984), Classification and Regression Trees, Taylor & Francis [16] Martin Obanda, P Okinda Owuor and Richard Mang'oka (2001) “Changes in the chemical and sensory quality parameters of black tea due to variations of fermentation time and temperature” Food Chemistry, Volume (75), Issue 4, Pages 395-404 [17] I.A.Khôtrôlava (1985), Kỹ thuật chế biến chè, Nxb Nông Nghiệp, Hà Nội 56 P ụ lục 1: C ƣơn trìn tố ƣu óa số t àn p ần c ín số tron RF(đạ d ện TFs) from future import division, print_function import numpy as np from sklearn.model_selection import train_test_split from scipy.spatial.distance import cdist def random_split(spectra, test_size=0.25, random_state=None, shuffle=True, stratify=None): return train_test_split( spectra, test_size=test_size, random_state=random_state, shuffle=shuffle, stratify=stratify) def kennardstone(spectra, test_size=0.33, metric='mahalanobis', *args, **kwargs): if test_size < 1: train_size = round(spectra.shape[0] * (1 - test_size)) else: train_size = spectra.shape[0] - round(test_size) if train_size > 2: distance = cdist(spectra, spectra, metric=metric, *args, **kwargs) select_pts, remaining_pts = max_min_distance_split(distance, train_size) else: raise ValueError("kich thuoc mau dao tao it nhat la 2") return select_pts, remaining_pts def spxy(spectra, yvalues, test_size=0.25, metric='euclidean', *args, **kwargs): if test_size < 1: train_size = round(spectra.shape[0] * (1 - test_size)) else: 57 train_size = spectra.shape[0] - round(test_size) if train_size > 2: yvalues = yvalues.reshape(yvalues.shape[0], -1) distance_spectra = cdist(spectra, spectra, metric=metric, *args, **kwargs) distance_y = cdist(yvalues, yvalues, metric=metric, *args, **kwargs) distance_spectra = distance_spectra / distance_spectra.max() distance_y = distance_y / distance_y.max() distance = distance_spectra + distance_y select_pts, remaining_pts = max_min_distance_split(distance, train_size) else: raise ValueError("kich thuoc mau dao tao it nhat la 2") return select_pts, remaining_pts def max_min_distance_split(distance, train_size): select_pts = [] remaining_pts = [x for x in range(distance.shape[0])] # dau tien chon dien xa nhat first_2pts = np.unravel_index(np.argmax(distance), distance.shape) select_pts.append(first_2pts[0]) select_pts.append(first_2pts[1]) # xoa diem dau tien khoi danh sach lai remaining_pts.remove(first_2pts[0]) remaining_pts.remove(first_2pts[1]) for i in range(train_size - 2): # tim khoang cach toi thieu, toi da select_distance = distance[select_pts, :] min_distance = select_distance[:, remaining_pts] min_distance = np.min(min_distance, axis=0) max_min_distance = np.max(min_distance) 58 # chon diem dau tien(truong hop khoang cach giong thi chon diem dau tien) points = np.argwhere(select_distance == max_min_distance)[:, 1].tolist() for point in points: if point in select_pts: pass else: select_pts.append(point) remaining_pts.remove(point) break return select_pts, remaining_pts from future import division, print_function import pandas as pd import numpy as np from sklearn.model_selection import train_test_split from scipy.spatial.distance import cdist data = pd.read_excel(r'C:\Users\Long TA\Desktop\test.xlsx') X = data.iloc[:, 0:9].values from sklearn.preprocessing import StandardScaler sc = StandardScaler() X_st = sc.fit_transform(X) [row_train,row_test] = spxy(X_st, y) X_train = X_st[row_train, 0:9] X_test = X_st[row_test, 0:9] y_train = data.iloc[row_train, 9].values y_test = data.iloc[row_test, 9].values from sklearn.decomposition import PCA from sklearn.ensemble import RandomForestRegressor from sklearn import metrics 59 rmsep = [] rmsec = [] for i in range(1, 10, 1): pca = PCA(n_components=i) X_trainPCA = pca.fit_transform(X_train) X_test_PCA = X_test.dot(pca.components_.transpose()) for j in range(20, 1000, 20): regressor = RandomForestRegressor(n_estimators= j, random_state=0) regressor.fit(X_trainPCA, y_train) y_c = regressor.predict(X_trainPCA) y_p = regressor.predict(X_test_PCA) rmsec.append(np.sqrt(metrics.mean_squared_error(y_train, y_c))) rmsep.append(np.sqrt(metrics.mean_squared_error(y_test, y_p))) ... – Tự – Hạnh phúc BẢN XÁC NHẬN CHỈNH SỬA LUẬN VĂN TH C SĨ Họ tên tác giả luận văn: Tạ Minh Long ề tài luận văn: Xử lý ảnh ứng dụn đ ều khiển q trình lên men cơng nghệ sản xuất c è đen Chuyên ngành:... bày trình lên men chè đen, yếu tố, hợp chất ảnh hƣởng đến trình lên men chè đen Các số chất lƣợng lên men, nguyên lý lên men liên tục băng tải (CTC) - Các không gian màu đƣợc sử dụng thu thập liệu, ... Nguyên Xin cam đoan luận văn ? ?Xử lý ảnh ứng dụn đ ều khiển q trình lên men cơng nghệ sản xuất c è đen” thầy giáo PGS.TS Lạ ắc Lã hƣớng dẫn cơng trình nghiên cứu riêng tơi Tất tài liệu tham khảo có