Nhận dạng và phân loại hoa quả trong ảnh màu (tt)Nhận dạng và phân loại hoa quả trong ảnh màu (tt)Nhận dạng và phân loại hoa quả trong ảnh màu (tt)Nhận dạng và phân loại hoa quả trong ảnh màu (tt)Nhận dạng và phân loại hoa quả trong ảnh màu (tt)Nhận dạng và phân loại hoa quả trong ảnh màu (tt)Nhận dạng và phân loại hoa quả trong ảnh màu (tt)Nhận dạng và phân loại hoa quả trong ảnh màu (tt)Nhận dạng và phân loại hoa quả trong ảnh màu (tt)Nhận dạng và phân loại hoa quả trong ảnh màu (tt)Nhận dạng và phân loại hoa quả trong ảnh màu (tt)Nhận dạng và phân loại hoa quả trong ảnh màu (tt)Nhận dạng và phân loại hoa quả trong ảnh màu (tt)Nhận dạng và phân loại hoa quả trong ảnh màu (tt)
ĐẠI HỌC QUỐC GIA HÀ NỘI TRƯỜNG ĐẠI HỌC CÔNG NGHỆ NGUYỄN ĐẮC THÀNH NHẬN DẠNG VÀ PHÂN LOẠI HOA QUẢ TRONG ẢNH MÀU Ngành: Công nghệ thông tin Chuyên ngành: Kỹ thuật phần mềm Mã số: 60480103 TÓM TẮT LUẬN VĂN THẠC SĨ KỸ THUẬT PHẦN MỀM Hà Nội – 2016 Mục lục MỞ ĐẦU Tính cấp thiết đề tài luận văn Mục tiêu luận văn 2.1 Cơ sở liệu ảnh hoa 2.2 Bộ huấn luyện nhận dạng hoa 2.3 Ứng dụng nhận dạng hoa Cấu trúc luận văn Chương Giới thiệu tổng quan 1.1 Bài toán nhận dạng phân loại hoa 1.2 Các hướng tiếp cận giải toán 1.2.1 Phương pháp Machine Learning truyền thống 1.2.2 Phương pháp Học sâu 10 Chương Mạng nơ-ron tích chập 11 2.1 Kiến trúc mạng nơ-ron tích chập 11 2.2 Học chuyển giao tinh chỉnh mơ hình huấn luyện 13 2.3 Mạng huấn luyện AlexNet 14 2.2.1 Kiến trúc mạng AlexNet 15 2.4 Ứng dụng mạng AlexNet vào toán Nhận dạng, phân loại hoa 16 Chương Tổng quan Hệ thống Fruit Recognition System 17 3.1 Tổng quan hệ thống 17 3.2 Mô đun quản lý sở liệu 18 3.3 Bộ huấn luyện mơ hình 18 3.3.1 Môi trường huấn luyện 19 3.3.2 Cấu hình mạng huấn luyện AlexNet 20 3.3.3 Một số hình ảnh đặc trưng mạng AlexNet tính tốn 20 3.3.4 Các mơ đun phía Server 21 3.4 Ứng dụng phía Client 22 Chương Kết thử nghiệm đánh giá 23 4.1 So sánh với phương pháp Machine Learning truyền thống 23 4.2 So sánh kết với CSDL sinh tự động 24 4.3 Thử nghiệm ứng dụng thực tế 26 Chương Kết luận 28 MỞ ĐẦU Tính cấp thiết đề tài luận văn Hiện nay, nước ta nói riêng nước phát triển có nơng nghiệp ngành sản xuất chủ yếu, trình thu hoạch, phân loại đánh giá chất lượng loại sản phẩm nông nghiệp, đặc biệt loại hoa quả, chủ yếu phải thực phương pháp thủ cơng Đây cơng việc khơng q khó, tiêu tốn nhiều thời gian, công sức người rào cản mở rộng phát triển quy mô sản xuất nông nghiệp Trong thời gian gần đây, nhờ có phát triển mạnh mẽ khả tính tốn hệ máy tính đại bùng nổ liệu thông qua mạng lưới Internet trải rộng, ta chứng kiến nhiều đột phá lĩnh vực Học máy, đặc biệt lĩnh vực Thị giác máy tính Sự quay lại phát triển vượt bậc phương pháp Học sâu giúp Thị giác máy tính đạt thành tựu đáng kể lĩnh vực Nhận dạng ảnh, có tốn nhận dạng hoa Đề tài nghiên “Nhận dạng phần loại hoa ảnh màu” đưa với hy vọng ứng dụng thành cơng mơ hình học sâu xây dựng hệ thống nhận dạng hoa tự động, đặc biệt loại hoa phổ biến nước ta Mục tiêu luận văn 2.1 Cơ sở liệu ảnh hoa Bộ sở liệu ảnh thành phần quan trọng hàng đầu phương pháp Học máy nói chung, sử dụng để phục vụ cho q trình tính tốn tham số huấn luyện, tinh chỉnh mơ hình Thông thường, liệu lớn chọn lọc tỉ mỉ cẩn thận độ xác mơ hình cải thiện, phạm vi luận văn hạn chế số lượng loại hoa nhận dạng số lượng ảnh chụp cho loại hoa Cụ thể: - Số lượng hoa nhận dạng: 40 loại hoa phổ biến nước ta nho, táo, chuối, long… - Số lượng ảnh gốc cho loại quả: 500-1000 ảnh Sau thu thập đủ số lượng ảnh gốc cho loại hoa quả, ta sử dụng thuật toán chỉnh sửa ảnh, làm nghiêng ảnh, chèn thêm nhiễu ghép ảnh với khác, để tạo thêm ảnh nhằm tăng cường kích thước sở liệu (CSDL) 2.2 Bộ huấn luyện nhận dạng hoa Để đưa đánh giá tổng quát so sánh độ xác tương đối phương pháp Học máy truyền thống với phương pháp Học sâu, luận văn thực cài đặt mạng huấn luyện nơ-ron nhân tạo truyền thống mạng huấn luyện nơ-ron tích chập Học sâu, sau thực huấn luyện sở liệu ảnh so sánh kết Đối với phương pháp Học máy truyền thống: nghiên cứu, tìm hiểu phương pháp trình bày báo, cơng trình khoa học thống kê đặc trưng thường sử dụng cho kết huấn luyện tốt Các đặc trưng thể thông tin hoa màu sắc, hình dạng kết cấu, đưa vào tính tốn, trích chọn đặc trưng mạng nơ-ron nhân tạo Đối với mạng nơ-ron tích chập thuộc nhóm Học sâu: tìm hiểu chọn mơ hình huấn luyện phổ biến lĩnh vực Nhận dạng ảnh giới để thực cài đặt so sánh kết với nhận dạng truyền thống 2.3 Ứng dụng nhận dạng hoa Một mục tiêu luận văn xây dựng thành công ứng dụng đơn giản smartphone nhằm hỗ trợ người dùng nhận dạng hoa Hệ thống nhận dạng hoa - Fruit Recognition System - ứng dụng client smartphone có máy chủ server để thực tất bước huấn luyện nạp mô hình nhận dạng, bước tính tốn nhận dạng loại hoa dựa ảnh chụp nhận từ ứng dụng client Cấu trúc luận văn Dựa mục tiêu cụ thể trình bày phần trước, luận văn tổ chức thành năm chương với nội dung cụ thể sau: - Chương 1: Trong chương tổng quan này, ta có nhìn tổng quan hướng tiếp cận giải pháp ứng dụng toán nhận dạng phân loại hoa quả, từ phương pháp tính tốn xử lý ảnh tương đối thô sơ phương pháp Học máy truyền thống cuối phương pháp Học sâu - Chương 2: Chương sâu vào mạng huấn luyện Học sâu thường sử dụng lĩnh vực Nhận dạng ảnh - mạng nơ-ron tích chập, tìm hiểu chìa khóa giải tốn nhận dạng ảnh với liệu huấn luyện có kích thước tương đối nhỏ - Chương 3: Trong chương tiếp theo, ta mô tả tổng quan Hệ thống nhận dạng hoa tự động nhóm đề tài phát triển, với mơ đun máy chủ, máy trạm, huấn luyện nhận dạng, tiền xử lý… Ngoài ra, cách thức thu thập, chỉnh sửa sở liệu ảnh cách cài đặt, triển khai môi trường huấn luyện cho mơ hình mạng nơ-ron tích chập chọn chương trình bày cụ thể - Chương 4: Chương tập trung trình bày kết thực nghiệm, bao gồm kết so sánh độ xác phương pháp Học máy truyền thống với phương pháp Học sâu, với đánh giá độ hiệu tạo liệu ảnh nhiễu ảnh chụp ứng dụng sử dụng thực tế Dựa kết thực nghiệm này, ta đưa số phân tích kết luận điểm mạnh điểm hạn chế mơ hình huấn luyện Học sâu chọn Chương 5: Cuối cùng, chương tổng kết nội dung trình bày luận văn, từ đề xuất phương hướng nghiên cứu để tiếp tục cải thiện chất lượng nhận dạng hệ thống - Chương Giới thiệu tổng quan 1.1 Bài toán nhận dạng phân loại hoa Nhận dạng vật thể ảnh coi toán lĩnh vực Thị giác máy tính, tảng cho nhiều tốn mở rộng khác toán phân lớp, định vị, tách biệt vật thể Tuy toán tồn hàng kỷ người chưa thể giải cách triệt để, tồn nhiều khó khăn để máy tính hiểu thông tin ảnh Những khó khăn tiêu biểu kể đến: đa dạng điểm nhìn, đa dạng kích thước, điều kiện ánh sách khác biệt, ấn giấu vật thể sau đối tượng khác ảnh, lẫn lộn với đa dạng chủng loại vật thể… Là trường hợp cụ thể toán nhận dạng phân lớp, toán nhận dạng hoa kế thừa khó khăn vốn có tốn gốc, kèm theo khó khăn riêng nó, như: số lượng khổng lồ chủng loại hoa theo mùa, vùng miền, địa hình… với vơ số loại hoa có hình dáng, màu sắc, kết cấu giống nhau, dải biến thiên màu sắc theo chu kỳ phát triển từ lúc xanh đến lúc chín, hay đa dạng hình dạng loại ảnh hưởng thời tiết, điều kiện thổ nhưỡng chế độ dinh dưỡng… 1.2 Các hướng tiếp cận giải toán Bài toán tự động nhận dạng hoa xuất từ lâu có nhiều báo, cơng trình khoa học đưa nhằm đề xuất cải tiến thuật tốn nhận dạng Trong đó, xuất sớm phương pháp Xử lý ảnh – Image Processing, phương pháp tập trung vào phát triển thuật tốn nhằm trích xuất thơng tin, ví dụ tham số màu sắc, hình dạng, kết cấu, kích thước…, từ ảnh đầu vào để nhận dạng hoa Do đơn xử lý vài ảnh đầu vào biến thiên màu sắc, hình dạng, kích thước… hoa phức tạp, kết đạt phương pháp không cao phạm vi áp dụng số lượng loại hoa bị hạn chế Bắt đầu từ năm 2000s, sau xuất vài bài báo khoa học đề xuất áp dụng phương pháp Học máy - Machine Learning - vào toán nhận dạng hoa với độ xác cao, hướng giải tốn tập trung vào ứng dụng cải tiến thuật toán Học máy, cụ thể nghiên cứu, thử nghiệm trích chọn đặc trưng phù hợp để đưa vào huấn luyện nhận dạng tự động Trong năm gần đây, nhờ phát triển vượt bậc sức mạnh tính tốn máy tính bùng nổ liệu Internet, Học sâu - Deep Learning đạt nhiều thành tựu đáng kể, đặc biệt lĩnh vực Xử lý ảnh ngôn ngữ tự nhiên Học sâu áp dụng thành cơng vào tốn nhận dạng hoa quả, phạm vi hạn chế số lượng loại hoa cần nhận dạng, phương pháp đạt kết cao đáng kinh ngạc 1.2.1 Phương pháp Machine Learning truyền thống Mơ hình hoạt động chung phương pháp Machine Learning thể hình đây: Ta thấy Machine Learning gồm hai giai đoạn Huấn luyện – Training Thử nghiệm – Testing, giai đoạn sử dụng hai thành phần quan trọng người xử lý tốn thiết kế, Trích chọn đặc trưng – Feature Engineering (hay gọi Feature Extraction) Thuật toán phân loại, nhận dạng… Algorithms Hai thành phần có ảnh hưởng trực tiếp đến kết tốn, thiết kế cẩn thận, tốn nhiều thời gian, đòi hỏi người thiết kế phải có kiến thức chuyên môn nắm rõ đặc điểm tốn cần xử lý Nhiệm vụ thi đặt mà đội tham gia phải giải toán nhận dạng, với liệu huấn luyện lên đến 1,2 triệu ảnh gán nhãn cho 1.000 hạng mục khác Nhóm SuperVision, gồm thành viên Alex Krizhevsky, Ilya Sutskever Geoff Hinton, với mạng AlexNet họ đạt kết đáng kinh ngạc chiến thắng áp đảo nhóm đứng thứ hai với độ xác chênh lệch đến 10% (15,31% 26,17%) Điều kinh ngạc mạng huấn luyện nhận liệu đầu vào giá trị điểm ảnh thô không áp dụng phương pháp trích chọn đặc trưng nào, hệ thống nhận giác thị giác truyền thống phải gồm nhiều giai đoạn trích chọn đặc trưng tỉ mỉ, cẩn thận, chí phải áp dụng nhiều mẹo để cải thiện chất lượng nhận dạng 2.2.1 Kiến trúc mạng AlexNet Nhóm Alex Krizhevsky công bố báo với tiêu đề “ImageNet Classification with Deep Convolutional Networks”, đưa mô tả cụ thể kiến trúc mạng AlexNet cách thức cài đặt sử dụng lớp mạng để huấn luyện mơ hình với liệu ảnh khổng lồ ImageNet Mạng có cấu trúc tương đối đơn giản so với mạng CNN đại gần đây, bao gồm lớp Convolutional lớp Fully-connected, huấn luyện song song card đồ họa GPU 2.4 Ứng dụng mạng AlexNet vào toán Nhận dạng, phân loại hoa 1) Cài đặt mạng AlexNet với mơ hình huấn luyện trước với ảnh ImageNet 2) Xây dựng CSDL ảnh huấn luyện 3) Tinh chỉnh lại mơ hình để giải toán nhận dạng 40 loại hoa Mặc dù kích thước CSDL ảnh khơng lớn, song độ xác mơ hình nhận dạng đảm bảo nhờ khả trích chọn đặc trưng tự động mạng AlexNet Chương Tổng quan Hệ thống Fruit Recognition System 3.1 Tổng quan hệ thống Hệ thống phần mềm Nhận dạng hoa – Fruit Recognition System – thiết kế theo kiến trúc Client/Server năm tầng: Tầng Giao diện người dùng, Tầng Server quản lý cấu hình hệ thống, Tầng server thực logic xử lý u cầu, Tầng huấn luyện mơ hình nhận dạng cuối Tầng quản lý CSDL Luồng hoạt động hệ thống cụ thể sau: - Client (ứng dụng điện thoại thông minh): 1) Người dùng khởi động ứng dụng 2) Người dùng thực chụp ảnh hoa camera, chọn ảnh chụp trước lưu Thư viện ảnh 3) Ảnh chụp mã hóa, nén lại gửi tới máy chủ 4) Ứng dụng đợi nhận kết nhận dạng từ máy chủ gửi hiển thị cho người dùng - Chương trình Server: 1) Chương trình khởi động nạp thư viện cần thiết 2) Chương trình nạp mơ hình nhận dạng huấn luyện trước 3) Giao thức gửi, nhận liệu ứng dụng phía client chương trình server cấu hình 4) Một loại luồng xử lý khởi tạo, đặt trạng thái ban đầu trạng thái rỗi 5) Khi có ứng dụng client kết nối tới, chương trình kiểm tra danh sách luồng xử lý chọn luồng trạng thái rỗi để nhận tính tốn liệu client gửi tới 6) Trong luồng xử lý: Bắt đầu trình tính tốn nhận dạng, cờ trạng thái “bận” Thực giải nén liệu thành liệu ảnh gốc Sử dụng mơ hình nạp để nhận dạng loại hoa Trả kết nhận dạng cho ứng dụng client Kết thúc trình tính tốn 7) Khi luồng xử lý hồn thành q trình tính tốn nhận dạng, chương trình giải phóng luồng xử lý cách cập nhật lại trạng thái luồng 3.2 Mô đun quản lý sở liệu Bộ CSDL ảnh phục vụ cho huấn luyện tinh chỉnh mơ hình nhận dạng thuật tốn Học sâu nói riêng Học máy nói chung thành phần vơ quan trọng, định chủ yếu đến độ xác mà mơ hình đạt Do vậy, chúng cần lưu trữ quản lý cách khoa học Trong hệ thống lưu trữ, CSDL ảnh huấn luyện chia thành thư mục riêng biệt: Thư mục ảnh gốc, Thư mục ảnh thực tế chưa duyệt Thư mục ảnh thực tế duyệt 3.3 Bộ huấn luyện mơ hình Nằm tầng thứ tư kiến trúc n tầng hệ thống, huấn luyện mơ hình thành phần có vai trò quan trọng hàng đầu, chịu tồn trách nhiệm mơ hình nhận dạng từ giai đoạn khởi tạo đến tinh chỉnh hoàn thiện, quản lý đánh giá độ xác phiên khác mơ hình Bộ huấn luyện cài đặt triển khai thành mô đun hồn tồn tách biệt với thành phần lại server, giúp cho việc nâng cấp hay thay thực độc lập mà khơng gây ảnh hưởng đến hoạt động thông thường server 3.3.1 Môi trường huấn luyện Mơi trường nhóm đề tài sử dụng để huấn luyện mơ hình nhận dạng hoa Windows 10, ngôn ngữ Python phiên 2.7.12 với framework chuyên dùng cho Học sâu Caffe Caffe framework mã nguồn mở cho Học sâu, phát triển vởi Berkeley Vision and Learning Center (BVLC), viết ngơn ngữ C++, CUDA C++ với gói wrapper cho ngôn ngữ khác Python hay Matlab Điểm mạnh framework cho phép người dùng tùy chọn huấn luyện thuật toán Học sâu CPU hay card đồ họa GPU, dễ dàng thực trình huấn luyện liệu ảnh cá nhân với câu lệnh đơn giản Bên cạnh đó, Caffe cho phép người dùng tái sử dụng lại mơ hình huấn luyện sẵn chia sẻ cộng đồng nghiên cứu khắp giới 3.3.2 Cấu hình mạng huấn luyện AlexNet Các mơ hình huấn luyện phép tinh chỉnh mạng AlexNet nói riêng mạng CNN nói chung thể cấu trúc văn thuần, nhằm tạo minh bạch rõ ràng định nghĩa phép biến đổi ảnh hay lớp mô hình dễ dàng triển khai chuyển giao mơ hình huấn luyện Các thơng số lớp mạng huấn luyện định nghĩa rõ ràng file cấu hình, để giúp framework thực việc huấn luyện mơ hình cách xác Tuy nhiên trường hợp việc tinh chỉnh mơ hình huấn luyện trước, ta cần quan tâm tới tham số sau: Thơng tin ảnh đầu vào, Thông số tỉ lệ học Số lượng lớp nhận dạng đầu 3.3.3 Một số hình ảnh đặc trưng mạng AlexNet tính tốn Các lớp mạng huấn luyện CNN coi bóc tách đặc trưng bản, chung cho tác vụ nhận dạng ảnh đường thẳng, đường cong hay đốm ảnh màu… Với Caffe ta hồn tồn hiển thị đặc trưng lên để hiểu rõ bước nâng dần mức trừu tượng qua lớp mạng CNN Ngoải độ nét mịn đặc trưng thể cho mức độ huấn luyện mạng, mạng chưa huấn luyện tốt, với kích thước CSDL ảnh lớn thời gian huấn luyện đủ lâu, hình ảnh đặc trưng bị nhiễu 3.3.4 Các mơ đun phía Server Chương trình phía server cấu thành nhiều mơ đun, đảm nhiệm vai trò nhiệm vụ khác liên quan đến huấn luyện, quản lý mơ hình nhận dạng, cấu hình giao thức giao tiếp client server hay xử lý logic đa luồng, đảm bảo khả tính tốn cho nhiều u cầu lúc… 3.4 Ứng dụng phía Client Ứng dụng phía Client ứng dụng điện thoại thông minh, thành phần hệ thống đảm nhiệm vai trò thu thập ảnh đầu vào để nhận dạng, gồm chức sau đây: Chụp ảnh, Chọn ảnh từ thư viện Xem kết nhận dạng mơ đun phía Server trả Để kết nhận dạng tốt, ảnh đầu vào cần phải thỏa mãn số ràng buộc chính, ràng buộc nhằm đảm bảo tương tự định ảnh đầu vào ảnh liệu sử dụng để huấn luyện, từ nâng cao tỉ lệ nhận dạng xác mơ hình 1) Trong ảnh đầu vào có loại 2) Hình ảnh ảnh phải chiếm tỉ lệ định ảnh, hình ảnh nhỏ dẫn đến khó khăn tính tốn đặc trưng, gây nhầm lẫn và làm sai kết 3) Hình ảnh ảnh không bị che lấp nhiều vật thể khác 4) Ảnh chụp đầu vào không bị nhòe điều kiện ánh sáng Chương Kết thử nghiệm đánh giá 4.1 So sánh với phương pháp Machine Learning truyền thống Thực nghiệm với phương pháp Học máy truyền thống: o Bước 1: Xây dựng CSDL ảnh hoa cho 20 loại o Bước 2: Tiền xử lý ảnh CSDL (lọc nền) gán nhãn Đặc trưng CSDL ảnh ảnh có chất lượng cao, có kích thước tỉ lệ ảnh, với bị loại bỏ hoàn toàn o Bước 3: Chọn lọc đặc trưng, cụ thể: Về màu sắc: Sử dụng 16 đặc trưng số lượng điểm ảnh có giá trị màu tính theo hệ màu HSI (Hue-Saturation-Intensity) Về hình dạng: Sử dụng đặc trưng hình dạng hoa ảnh chu vi, diện tích, độ dài lớn nhất, độ rộng lớn hoa ảnh Về kết cấu: Sử dụng đặc trưng kết cấu, tham số ma trận GLCM (Grey Level Co-occurrence Matrix) o Bước 4: Huấn luyện mơ hình nhận dạng hoa o Bước 5: Thống kê độ xác với tỉ lệ training/test 75/25 Kết đạt không cao, đạt ~74.5% liệu test 2.600 ảnh, thử nghiệm thực tế gặp phải sai số lớn (do ảnh chụp thực tế có chất lượng khơng cao khác biệt lớn so với CSDL ảnh để huấn luyện) Thực nghiệm với phương pháp Học sâu: o Bước 1: Xây dựng CSDL ảnh hoa cho 20 loại o Bước 2: Tiền xử lý ảnh CSDL (lọc nền) gán nhãn Hai bước cần thực lần xây dựng CSDL ảnh huấn luyện cho phương pháp Học máy truyền thống o Bước 3: Thực bước tính tốn cần thiết để ứng dụng mơ hình AlexNet o Bước 4: Huấn luyện mơ hình nhận dạng hoa o Bước 5: Thống kê độ xác với tỉ lệ training/test 75/25 Độ xác đạt cao, ~98.8%, vượt trội so với với độ xác mơ hình huấn luyện sử dụng phương pháp Học máy truyền thống Đánh giá kết quả: Với toán nhận dạng phân loại đối tượng nói chung, khó chọn đặc trưng hiệu quả, Học sâu phương pháp có ưu vượt trội so với phương pháp Học máy truyền thống Học sâu giúp đơn giản hóa q trình huấn luyện mơ hình nhận dạng khơng u cầu tham gia người huấn luyện q trình trích chọn đặc trưng, đồng thời cho phép tái sử dụng mơ hình huấn luyện trước để giảm thời gian cài đặt giải pháp cho toán nhận dạng 4.2 So sánh kết với CSDL sinh tự động Thực nghiệm với CSDL ảnh gốc: o Số lượng ảnh gốc cho loại quả: 500-1000 ảnh o Tổng số ảnh dùng để huấn luyện: 21.000 ảnh o Tổng số ảnh dùng để test: 7.000 ảnh o Thời gian huấn luyện cho 10.000 vòng lặp: tiếng o Độ xác: 65,49% Thực nghiệm với CSDL ảnh sinh tự động từ ảnh gốc: Từ ảnh gốc, sau sử dụng thuật toán xử lý ảnh chiếu nghiêng (skew), thêm nhiễu ghép khác ta thu ảnh để tăng cường cho CSDL ảnh huấn luyện o Số lượng ảnh gốc cho loại quả: 500-1000 ảnh o Số lượng ảnh sinh thêm từ ảnh gốc: ảnh o o o o Tổng số ảnh dùng để huấn luyện: 210.000 ảnh Tổng số ảnh dùng để test: 70.000 ảnh Thời gian huấn luyện cho 10.000 vòng lặp: 50 tiếng Độ xác: 98,67% Đánh giá kết quả: Sự cải thiện rõ rệt độ xác mơ hình nhận dạng sau tăng cường CSDL ảnh huấn luyện cho thấy hiệu thực tế phép sinh ảnh tự động sử dụng phương pháp xử lý ảnh Chất lượng nhận dạng ứng dụng thực tế tăng lên ảnh sinh tự động giúp mơ q trình chụp ảnh đời thực, góc chụp khác nhau, nhiễu sinh môi trường, chất lượng máy ảnh… đa dạng mà người dùng sử dụng để chụp ảnh Việc tăng cường CSDL ảnh giải pháp cho trường hợp khó thu thập ảnh để huấn luyện mơ hình, nhiên cần phải ý đến mặt trái việc lạm dụng phương pháp tăng cường ảnh này, nguy gây trạng thái “overfit” liệu (mơ hình nhận dạng q khớp với liệu huấn luyện mà bị sai lệch với liệu thực tế) 4.3 Thử nghiệm ứng dụng thực tế Ứng dụng Nhận dạng hoa thử nghiệm thực tế với nhiều mẫu hoa khác nhau, chia thành hai nhóm chính: Nhóm huấn luyện nhận dạng nhóm chưa huấn luyện - Nhóm hoa nằm danh sách 40 chọn để xây dựng liệu nhận dạng: Kết nhận dạng đạt độ xác cao, đặc biệt với loại có nét đặc trưng màu sắc hình dạng chuối, long, chơm chơm… Đối với loại có nhiều nét tương đồng lẫn nhau, kết nhận dạng ứng dụng đơi lúc bị nhầm lẫn - Nhóm hoa nằm danh sách 40 quả: Hệ thống tính tốn trả kết nhận dạng 40 loại hoa có tỉ lệ giống với loại cần nhận dạng Ngoài ra, kết thực nghiệm thu cho thấy hệ thống nhận dạng đạt kết tương đối chuẩn xác với trường hợp hình ảnh ảnh đầu vào bị che khuất phần, điều kiện ánh sáng không thực tốt trường hợp ảnh bị biến dạng nhẹ Đây khó khăn tốn nhận dạng vật thể nói chung mà ta đề cập tới phần mở đầu luận văn, lý giải cho điều trình thu thập ảnh ban đầu sinh ảnh tự động từ ảnh gốc, mơ hình nhận dạng huấn luyện để nhận trường hợp tương tự Chương Kết luận Luận văn nghiên cứu, tìm hiểu tốn tự động nhận dạng, phân loại hoa ảnh màu, thực phát triển, cài đặt phương án giải cho tốn dựa tìm kiếm, thống kê hướng tiếp cận công bố qua nhiều báo, cơng trình khoa học giới Các kết mà luận văn đạt được, tương ứng với mục tiêu đề ban đầu sau: - Hoàn thiện xây dựng sở liệu ảnh phục vụ huấn luyện nhận dạng cho 40 loại hoa phổ biến nước ta, với số lượng ảnh gốc trung bình cho loại từ 500-1000 ảnh - Thống kê đặc trưng thường sử dụng để huấn luyện nhận dạng hoa phương pháp Học máy truyền thống, bao gồm đặc trưng màu sắc, hình dạng kết cấu Từ làm sở xây dựng mạng nơ-ron nhân tạo truyền thống so sánh kết với mạng nơ-ron tích chập thuộc nhóm phương pháp Học sâu - Cài đặt tinh chỉnh mạng nơ-ron tích chập huấn luyện trước, ứng dụng vào toán nhận dạng hoa Đồng thời xây dựng hệ thống tự động nhận dạng hoa Fruit Recognition System với ứng dụng client smartphone Thực nghiệm với liệu test thực tế cho kết tốt, nguyên nhân phạm vi số lượng hoa để nhận dạng hạn chế 40 loại – số khiêm tốn so với số lượng hoa Việt Nam nói riêng giới nói chung Hệ thống tự động nhận dạng hoa cần nhiều cải thiện, đặc biệt khả mở rộng phạm vi loại hoa kích thước, chất lượng CSDL ảnh huấn luyện Trong tương lai, để cải thiện độ xác mơ hình nhận dạng, nhóm đề tài đề xuất cài đặt thử nghiệm đánh giá loại mơ hình mạng Học sâu huấn luyện trước, đặc biệt mạng đạt kết cao thi Nhận dạng ảnh quy mô lớn ImageNet tổ chức thường niên như: ZF Net (2013), VGG Net (2014), GoogleNet Microsoft ResNet (2015)… ... vực Nhận dạng ảnh, có tốn nhận dạng hoa Đề tài nghiên Nhận dạng phần loại hoa ảnh màu đưa với hy vọng ứng dụng thành cơng mơ hình học sâu xây dựng hệ thống nhận dạng hoa tự động, đặc biệt loại. .. lượng loại hoa nhận dạng số lượng ảnh chụp cho loại hoa Cụ thể: - Số lượng hoa nhận dạng: 40 loại hoa phổ biến nước ta nho, táo, chuối, long… - Số lượng ảnh gốc cho loại quả: 500-1000 ảnh Sau... sở liệu ảnh hoa 2.2 Bộ huấn luyện nhận dạng hoa 2.3 Ứng dụng nhận dạng hoa Cấu trúc luận văn Chương Giới thiệu tổng quan 1.1 Bài toán nhận dạng phân loại hoa 1.2