Cùng với sự phát triển nhanh chóng của khoa học công nghệ, các kỹ thuật dựa trên trí tuệ nhân tạo và thị giác máy tính ứng dụng trong các hệ thống thông minh đạt được những kết quả vượt bậc, có nhiều triển vọng. Cuộc cách mạng công nghiệp lần thứ 4 (Industry 4.0) hiện đang diễn ra tại trên phạm vi toàn cầu, đặc biệt ở các nước có nền khoa học kỹ thuật phát triển…. Industry 4.0 tập trung vào sản xuất và dịch vụ thông minh chủ yếu dựa trên các hệ thống tương tác thực ảo, các hệ thống thông minh dần thay thế con người. Nền tảng của các hệ thống thông minh có thể nói bắt nguồn từ lĩnh vực trí tuệ nhân tạo và thị giác máy. Trong đó, thị giác máy là một trong những giác quan máy quan trọng nhất giúp cho quá trình thu nhận tín hiệu, xử lý, phân tích nhằm đưa ra tri thức phục vụ các hệ thống ra quyết định. Nội dung cuốn sách gồm 7 chương lần lượt trình bày những kiến thức nhập môn về xử lý ảnh, các phương pháp nâng cao trong phân tích, nhận dạng mẫu, kỹ thuật học sâu như: các phép biến đổi, điều chỉnh nâng cao chất lượng ảnh; biến đổi ảnh màu, ảnh đa mức xám, toán tử tích chập, các bộ lọc ảnh và phép biến đổi không gian ảnh, biến đổi hình thái học ứng dụng trong phân tích vùng ảnh, trích biên đối tượng; phương pháp phân đoạn ảnh theo phân ngưỡng thủ công, phân ngưỡng tự động; phương pháp phân tích ảnh như phân đoạn ảnh bằng thuật toán phân cụm kmeans, Meanshift, Watershed, trích chọn đặc trưng cơ bản như kỹ thuật trích chọn cạnh, điểm chính (keypoint) và mô tả vùng đặc trưng vùng ảnh. Cuốn sách cũng giới thiệu một số phương pháp trích chọn đặc trưng nâng cao như SIFT, SUFT, HOG, Haarlike feature; phương pháp so khớp đặc trưng giữa các ảnh phục vụ phát hiện đối tượng tương đồng và nhận dạng mẫu cùng với kỹ thuật lọc loại trừ nhiễu trong so khớp ảnh. Phần cuối trình bày những kỹ thuật nhận dạng mẫu và phân loại đối tượng từ cách tiếp cận truyền thống như cây quyết định, rừng ngẫu nhiên, boosting, máy phân loại hỗ trợ vector SVM, mạng neural nhân tạo và đến kỹ thuật học sâu, mạng neural tích chập như mạng LeNet, AlexNet, ZFNet, GooLeNet, VGGNet, RCNN và kiến trúc mạng mô tả ngữ nghĩa ảnh. Cuốn sách này được biên soạn dựa trên kinh nghiệm tích lũy qua quá trình nghiên cứu và giảng dạy của tác giả liên quan đến lĩnh vực thị giác máy tính, trí tuệ nhân tạo và các hệ thống thông minh. Hy vọng, cuốn sách là nguồn kiến thức hữu ích phục vụ học tập, tham khảo cho sinh viên, học viên cao học các ngành liên quan đến khoa học máy tính, công nghệ thông tin, cũng như độc giả quan tâm đến lĩnh vực nhận dạng xử lý ảnh và ứng dụng trí tuệ nhân tạo trong nhận dạng mẫu
Chương PHƯƠNG PHÁP PHÂN ĐOẠN ẢNH Chương trình bày số phương pháp phân đoạn ảnh phân ngưỡng thủ công, phân ngưỡng tự động, phân ngưỡng Otsu Bên cạnh đó, số phương pháp xử lý nâng cao giới thiệu kỹ thuật phân đoạn ảnh thuật toán phân cụm liệu k-means, kỹ thuật trung bình dịch chuyển Meanshift, kỹ thuật dâng nước vạch ngăn cách Watershed, phân đoạn phân cấp 3.1 TỔNG QUAN VỀ PHÂN ĐOẠN ẢNH Trong lĩnh vực xử lý ảnh, phân đoạn ảnh (segmentation) hiểu q trình nhóm điểm ảnh thành vùng cho điểm ảnh vùng có chung đặc điểm, tính chất đó, ví dụ tương tự màu sắc, cường độ kết cấu Nói cách khác, phân đoạn ảnh trình chia ảnh số thành nhiều vùng khác nhau, vùng gồm tập hợp điểm ảnh (có thể gọi superpixels region) có tính chất Trong số tài liệu, phân đoạn hình ảnh gọi phân vùng ảnh Mục tiêu việc phân đoạn để đơn giản hóa thay đổi cách biểu diễn ảnh theo tiêu chuẩn nhằm làm cho ý nghĩa dễ dàng phân tích, trích xuất đặc trưng[12] Kết q trình phân đoạn ảnh tập hợp vùng (region) hay gọi phân đoạn (segments) bao gồm toàn ảnh tập hợp vùng đối tượng trích xuất từ ảnh Phân đoạn ảnh có ý nghĩa quan trọng việc phát đặc tính cấu trúc đối tượng ảnh vùng thường miêu tả cấu trúc tương ứng với đối tượng vùng Ví dụ số lượng vùng ảnh thể ảnh có chứa nhiều đối tượng khác ngược lại đối tượng chứa vùng tương ứng với phần khác đối tượng Phân đoạn ảnh có nhiều ứng dụng quan trọng nhiều lĩnh vực khác phân tích hình ảnh y học (medical imaging), phát nhận dạng đối tượng, phát hành động hệ thống camera giám sát thông minh, hệ thống điều khiển giao thông thông minh, xe khơng người lái, xử lý hình ảnh vệ tinh… 71 Phân đoạn ảnh xem trình tiền xử lý, có ý nghĩa quan trọng hệ thống xử lý ảnh Phân đoạn tốt giúp cho trình xử lý bước đạt hiệu cao hơn, nâng cao độ xác tiết kiệm chi phí tính tốn H 3.1 Phân đoạn phương pháp đồ thị phương pháp Mean shift[13] Các vùng phân tách dùng nhiều ngữ cảnh khác đặc biệt sử dụng làm đại diện thay cho đối tượng biểu diễn dạng nhiều hình thức khác nhau[10] Việc lựa chọn mơ tả vùng liệu có nhiều cách thức khác tùy thuộc vào tính chất, mục tiêu đảm bảo phù hợp cho ứng dụng cụ thể Nhiều ứng dụng khơng đòi hỏi mơ tả vùng riêng lẻ mà cần thể mối quan hệ với vùng ảnh H (a) (c) (e) (b) (d) (f) 3.2 Phân đoạn ảnh dựa vào ngưỡng đơn ngưỡng kép[10] để trích xuất vùng đối tượng khác Hình minh họa thể phân đoạn ảnh với điều kiện ngưỡng đơn ngưỡng đôi dùng giá trị ngưỡng khác Một hình ảnh 72 phân vùng cách sử dụng loại ngưỡng đơn ngưỡng đôi vùng có mức xám khác Hình (a) thể ảnh gốc (b) lược đồ màu tương ứng với ảnh, hình (c) thể kết phân đoạn với ngưỡng đơn T1=70, hình (d) thể kết phát vùng lõi sử dụng ngưỡng thứ hai T2=155, (e) phân đoạn thông thường với ngưỡng=T2, (f) phân ngưỡng kép T1 T2 để trích chọn vùng năm khoảng T1