2.23 Ảnh đầu ra của ảnh gốc I10 trong tập dữ liệu ảnh TID2013 là kết quả của các toán tử được quan sát bằng mắt người 73 là kết quả của các toán tử được quan sát bằng mắt người 73 Định s
Trang 1HỌC VIỆN KHOA HỌC VÀ CÔNG NGHỆ
NGUYỄN VĂN QUYỀN
NGHIÊN CỨU NÂNG CAO ĐỘ TƯƠNG PHẢN ẢNH
THEO TIẾP CẬN ĐẠI SỐ GIA TỬ
LUẬN ÁN TIẾN SĨ TOÁN HỌC
Hà Nội – 2018
Trang 2HỌC VIỆN KHOA VÀ CÔNG NGHỆ
NGUYỄN VĂN QUYỀN
NGHIÊN CỨU NÂNG CAO ĐỘ TƯƠNG PHẢN ẢNH
THEO TIẾP CẬN ĐẠI SỐ GIA TỬ
Chuyên ngành: Cơ sở Toán học cho Tin học
Trang 3LỜI CAM ĐOAN
Tác giả xin cam đoan đây là công trình nghiên cứu của bản thân tác giả Các kết quả nghiên cứu và các kết luận trong luận án này là trung thực, không sao chép từ bất kỳ một nguồn nào và dưới bất kỳ hình thức nào Việc tham khảo các nguồn tài liệu đã được thực hiện trích dẫn và ghi nguồn tài liệu tham khảo đúng quy định
Tác giả luận án
Nguyễn Văn Quyền
Trang 4LỜI CẢM ƠN
Luận án được hoàn thành dưới sự hướng dẫn tận tình của TS Trần Thái Sơn và PGS.TS Nguyễn Tân Ân Lời đầu tiên, xin bày tỏ lòng kính trọng và biết ơn sâu sắc tới hai Thầy
Tôi xin chân thành cảm ơn PGS.TSKH Nguyễn Cát Hồ, TS Ngô Hoàng Huy đã đóng góp những ý kiến quý báu cả về học thuật và kinh nghiệm nghiên cứu giúp đỡ tôi trong suốt quá trình thực hiện luận án
Tôi xin chân thành cảm ơn Ban lãnh đạo Học viện Khoa học và Công nghệ, Bộ phận quản lý nghiên cứu sinh - Học viện Khoa học và Công nghệ đã tạo mọi điều kiện thuận lợi trong quá trình hoàn thành và bảo vệ luận án
Xin cảm ơn các đồng nghiệp tại Phòng Nhận dạng và Công nghệ tri thức, Viện Công nghệ Thông tin đã đóng góp những ý kiến thiết thực để tôi hiệu chỉnh lại các tiếp cận nghiên cứu của mình
Xin cảm ơn Ban Giám hiệu Trường Đại học Hải Phòng, các đồng nghiệp tại Phòng Quản lý sau đại học – Trường Đại học Hải Phòng đã luôn động viên giúp đỡ tôi trong công tác để tôi có thời gian tập trung nghiên cứu
Tôi xin trân trọng cảm ơn!
Trang 5MỤC LỤC
LỜI CAM ĐOAN I LỜI CẢM ƠN II MỤC LỤC III DANH MỤC CÁC TỪ VIẾT TẮT VÀ KÝ HIỆU VI DANH MỤC CÁC BẢNG IX DANH MỤC HÌNH VẼ X
MỞ ĐẦU 1
1 Tính cấp thiết của đề tài 1
2 Mục tiêu, phạm vi nghiên cứu của luận án 10
3 Phương pháp và nội dung nghiên cứu 10
4 Cấu trúc luận án 11
5 Kết quả đạt được của luận án 12
CHƯƠNG 1 TỔNG QUAN VỀ NÂNG CAO ĐỘ TƯƠNG PHẢN ẢNH VÀ TIẾP CẬN ĐẠI SỐ GIA TỬ GIẢI HỆ LUẬT MỜ 13
1.1 Đại số gia tử: một số vấn đề cơ bản 13
1.1.1 Các khái niệm cơ bản về đại số gia tử 13
1.1.2 Vấn đề định lượng ngữ nghĩa trong đại số gia tử 15
1.1.3 Phương pháp lập luận xấp xỉ dựa trên ĐSGT 23
1.2 Khả năng xấp xỉ hàm của phương pháp HA-IRMd và ứng dụng 24
1.2.1 Khả năng xấp xỉ hàm 24
1.2.2 Ứng dụng việc xấp xỉ hàm trong xây dựng luật 26
1.2.3 Phương pháp lập luận tối ưu dựa trên ĐSGT 27
1.2.4 Hệ tham số của phương pháp nội suy gia tử 28
1.3 Tổng quan về nâng cao độ tương phản ảnh 30
1.3.1 Tăng cường độ tương phản ảnh dựa trên logic mờ 30
1.3.2 Một số thuật toán tăng cường theo tiếp cận mờ 30
Trang 61.4 Một số thuật toán nâng độ sáng tối của điểm ảnh 35
1.4.1 Toán tử tăng cường 35
1.4.2 Tăng cường với toán tử Hyperbol 36
1.4.3 Tăng cường dựa trên suy diễn hệ luật mờ (Fuzzy rule) 37
1.4.4 Một số độ đo chất lượng tăng cường ảnh 38
1.5 Thuật toán nâng cao độ tương phản ảnh của Cheng 38
1.6 Các chỉ số đánh giá 41
1.7 Tập dữ liệu thực nghiệm 43
CHƯƠNG 2 BIẾN ĐỔI ẢNH ĐA KÊNH VÀ XÂY DỰNG HÀM BIẾN ĐỔI CHỮ S THEO TIẾP CẬN ĐẠI SỐ GIA TỬ VÀ ỨNG DỤNG NÂNG CAO ĐỘ TƯƠNG PHẢN ẢNH ĐA KÊNH 44
2.1 Biến đổi ảnh đa kênh 45
2.1.1 Ước lượng nhiều dải động mức xám dựa vào phân cụm mờ FCM 45
2.1.2 Lược đồ xám mờ với phân cụm FCM 46
2.1.3 Ước lượng nhiều dải động mức xám dựa vào lược đồ xám mờ 48
2.1.4 Biến đổi kênh ảnh 50
2.1.5 Nâng cao độ tương phản ảnh kết hợp với biến đổi ảnh 51
2.1.6 Thử nghiệm phép biến đổi mờ hóa ảnh sử dụng thuật toán 2.2 53
2.2 Thiết kế hàm biến đổi độ xám dạng chữ S với tiếp cận mờ 57
2.2.1 Đánh giá việc xây dựng hàm biến đổi mức xám dạng chữ S 58
2.2.2 Xây dựng toán tử tăng cường dựa trên đại số gia tử 61
2.2.3 Thực nghiệm 67
2.2.4 So sánh với kết quả của các phương pháp gián tiếp 70
2.3 Kết quả khác 75
CHƯƠNG 3 XÂY DỰNG ĐỘ ĐO THUẦN NHẤT MỚI THEO TIẾP CẬN ĐẠI SỐ GIA TỬ VÀ ỨNG DỤNG NÂNG CAO ĐỘ TƯƠNG PHẢN ẢNH ĐA KÊNH 78
3.1 Xây dựng độ đo thuần nhất 78
Trang 73.1.1 Độ thuần nhất của Cheng 78
3.1.2 Độ đo thuần nhất với toán tử t-norm 80
3.1.3 Xây dựng độ đo thuần nhất với tiếp cận ĐSGT 82
3.2 Nâng cao độ tương phản ảnh mầu với độ đo thuần nhất đề xuất 89
3.3 Thực nghiệm 93
3.3.1 Tính độ thuần nhất kênh ảnh 93
3.3.2 Đánh giá độ đo HA-HRM 94
3.4 Các kết quả và luận giải 94
KẾT LUẬN 101
DANH MỤC CÔNG TRÌNH ĐÃ CÔNG BỐ 102
TÀI LIỆU THAM KHẢO 103
PHỤ LỤC 112
Trang 8DANH MỤC CÁC TỪ VIẾT TẮT VÀ KÝ HIỆU
Từ viết tắt Tên đầy đủ (và tạm dịch)
Tối ưu đàn kiến
(Thuật toán phân cụm mờ C-mean)
(Hệ mờ đa điều kiện)
(Đại số gia tử)
(Phương pháp lập luận nội suy dựa trên đại số gia tử)
(Cân bằng lược đồ xám)
(Bộ nhớ kết hợp ngữ nghĩa)
Trang 9Ký hiệu
1 , K
Trang 11DANH MỤC CÁC BẢNG
Số hiệu
bảng
quả của phép mờ hóa – biến đổi ảnh
54
toán trong [17] và thuật toán đề xuất
67
(%) và của Cheng áp dụng cho ảnh mầu RGB và HSV
69
và bốn phương pháp gián tiếp của 27 ảnh trong biểu diễn
mầu HSV, trong đó các giá trị tốt nhất được in đậm
70
AE, AT
84
tương ứng với AG, AE, AT
86
luật (3.5)
87
nhập để tạo giá trị thuần nhất
95
nhập để tạo giá trị thuần nhất
95
nhập để tạo giá trị thuần nhất
96
nhập để tạo giá trị thuần nhất
96
nhập để tạo giá trị thuần nhất
97
Trang 12R,G và B tương ứng
32
1.5 Phân cụm FCM với C = 5 cụm, (a) ảnh gốc, (b)-(g) ảnh ma trận
độ thuộc cụm số 1 {µi,j,1} -5 {µi,j,5}
35
(b)
54
Trang 132.5 Kênh B của ảnh biến đổi sử dụng [16] (a), sử dụng thuật
toán (b)
55
thuộc của tập mờ darker, brighter
xám đầu vào-đầu ra đã chuẩn hóa về đoạn [0, 1], độ sáng
65
là kết quả của các toán tử được quan sát bằng mắt người
72
Trang 142.23 Ảnh đầu ra của ảnh gốc I10 trong tập dữ liệu ảnh TID2013
là kết quả của các toán tử được quan sát bằng mắt người
73
là kết quả của các toán tử được quan sát bằng mắt người
73
Định sử dụng các thuật toán gián tiếp và Hint
74
Định sử dụng các thuật toán gián tiếp và Hint
75
Định sử dụng các thuật toán gián tiếp và Hint
75
nâng cao độ tương phản kênh R,G và B sử dụng công thức (3.1) (b)
79
Trang 15MỞ ĐẦU
1 Tính cấp thiết của đề tài
Nâng cao độ tương phản (ĐTP) ảnh là một vấn đề quan trọng trong xử
lý và phân tích hình ảnh, là một bước cơ bản trong phân tích, phân đoạn ảnh Mục đích của việc nâng cao ĐTP ảnh là làm nổi rõ chi tiết của ảnh và tăng độ sáng của ảnh
Các kỹ thuật thông dụng để nâng cao ĐTP ảnh được phân thành hai tiếp cận chính: (1) Các phương pháp gián tiếp và (2) các phương pháp trực tiếp [12, 19, 20]
a) Đối với các phương pháp gián tiếp
Phương pháp tăng cường ĐTP gián tiếp chỉ biến đổi lược đồ xám mà không sử dụng bất kỳ một độ đo tương phản nào Biến đổi lược đồ xám của ảnh là phương pháp làm cho lược đồ xám của ảnh kết quả đều hơn, khi đó ĐTP của ảnh đầu ra được nâng cao, độ sáng của ảnh được nâng nên Trong phương pháp này những điểm ảnh đầu vào có cùng giá trị mức xám thì ở ảnh kết quả, giá trị mức xám của những điểm ảnh này cũng bằng nhau, vì thế có thể làm mất chi tiết ảnh so với ảnh đầu vào
Có nhiều kỹ thuật đã đề xuất được tìm thấy trong tài liệu tham khảo [9,
10, 12, 15, 23, 26, 39, 51, 57, 61, 63, 68, 72]
Trong vài năm gần đây, nhiều nhà nghiên cứu đã áp dụng lý thuyết tập
mờ để phát triển các kĩ thuật mới nhằm nâng cao ĐTP của ảnh:
Tăng cường ảnh mờ dựa trên việc ánh xạ mức xám vào miền mờ, sử dụng hàm biến đổi thành viên [26] Mục tiêu là sinh một ảnh có ĐTP cao hơn ảnh gốc bằng việc gán các giá trị mức xám bằng một giá trị mới lớn hơn, gần hơn với mức xám trung bình của ảnh [26]
Trang 16Manglesh đã đề xuất thuật toán mới sử dụng logic mờ để tăng cường ảnh màu với chất lượng bị suy giảm bởi nhiễu Gaussian Đầu tiên luật logic
mờ được sinh, sau đó giá trị RGB của ảnh được đưa vào tiếp cận logic mờ Ảnh mờ đầu ra sẽ phân biệt giữa các màu mơ hồ [51] Sarode đã giới thiệu thuật toán NCĐTP ở đó kênh sắc độ mầu được bảo tồn, chỉ thay đổi các kênh cường độ mầu sắc và kênh độ bão hoà, sau đó luật logic mờ được áp dụng Dựa trên điều này những quyết định liên quan đến việc phân lớp màu sẽ được thực hiện Ảnh đầu ra sẽ chỉ bao gồm những vùng ảnh rõ, những điểm ảnh nhiễu bị loại bỏ [63] Các nghiên cứu này đã đề xuất một phương pháp tăng cường ĐTP mờ trực tiếp thích ứng mới dựa trên hàm thành viên Sigma để ánh
xạ ảnh từ miền không gian vào miền mờ Khi chuyển ảnh từ một không gian màu (RGB) vào không gian màu khác (HSV, HIS, YIQ) sắc độ không bị thay đổi, chỉ những thành phần cường độ màu và độ bão hoà bị thay đổi Tuy nhiên, ảnh sau tăng cường có thể không còn giữ được chi tiết ảnh Để khắc phục vấn đề này, trong [63], Naik đã đưa ra phương pháp giữ các giá trị mức xám được biến đổi trong phạm vi của miền mức xám
Trong [72], hai kĩ thuật tăng cường ĐTP là tăng cường dựa trên luật mờ
và tăng cường sử dụng toán tử tăng cường áp dụng với ảnh xám ĐTP thấp được đề xuất Kĩ thuật đầu tiên sử dụng hàm ứng với hệ mờ luật if-then, kĩ thuật thứ hai sử dụng toán tử tăng cường ĐTP mờ để biến đổi mức xám trong miền mờ Kết quả thực nghiệm cho thấy, lược đồ xám của ảnh gốc và các ảnh tăng cường có các đặc trưng cơ bản giống nhau, điều này không làm được trong cân bằng lược đồ xám [72] Ngoài ra, tăng cường ĐTP sử dụng kĩ thuật toán tử tăng cường có các giá trị chỉ số đánh giá khách quan mờ thấp hơn so với kĩ thuật tăng cường ĐTP sử dụng luật mờ Tuy nhiên, về thời gian xử lý,
kĩ thuật tăng cường ĐTP dựa trên luật mờ yêu cầu thời gian ít hơn kĩ thuật tăng cường sử dụng toán tử tăng cường
Trang 17Phương pháp tăng cường mờ được đề xuất bởi Hanmandlu trong đó một toán tử tăng cường ĐTP được giới thiệu Bằng việc bảo tồn kênh H, chỉ thay đổi kênh S, kênh V và cực tiểu entropy mờ, chất lượng của ảnh được cải thiện về mặt trực quan [23] Hanmandlu cũng đã giới thiệu một hàm thành viên Gaussian để mờ hoá ảnh màu, cùng với việc tối ưu entropy mờ của ảnh thì các tham số được tối ưu, ĐTP và độ sáng các ảnh tối đầu vào đã được cải thiện [24]
John See đã đề xuất bộ dò tìm cạnh Gaussian dựa trên tập mờ sử dụng
cả thuộc tính toàn cục và cục bộ [38] Trong giai đoạn tăng cường ĐTP toàn cục, hàm thành viên Gaussian được sử dụng Một hàm tăng cường ĐTP phi tuyến bao gồm ba tham số được sử dụng để tăng cường ảnh Trong giai đoạn tăng cường ĐTP cục bộ, mặt nạ dò tìm cạnh kiểu Gaussian chứa hai tham số
mờ được tối ưu bằng việc sử dụng hàm entropy ảnh mờ Thuật toán này đã thể hiện một cải tiến trực quan tương đối hiệu quả
Palanikumar đã giới thiệu một thuật toán mới dựa trên cân bằng lược
đồ xám (HE) và HE tăng giá trị thích ứng (AIVHE) [60] Bằng việc sử dụng phương pháp AIVHE, phép tăng cường ĐTP được điều khiển bởi hai tham số beta và gamma, nhưng xuất hiện vấn đề là thông tin chi tiết ảnh không phải lúc nào cũng được bảo tồn Để khắc phục vấn đề này thuật toán di truyền được dùng để tối ưu giá trị beta và gamma thông qua việc tối ưu giá trị entropy [27]
Một ảnh có thể được nhóm thành các vùng tối, vùng hỗn tạp và vùng sáng [59] Ảnh RGB được chuyển đổi thành ảnh HSV Sắc độ ảnh được bảo tồn còn thành phần độ sáng của ảnh bị thay đổi Việc mờ hoá được thực hiện trên các vùng tối và vùng sáng bằng việc sử dụng hàm thành viên Gaussian dựa trên điểm giao và tham số tăng cường Giá trị tối ưu của các tham số này đạt được bởi kĩ thuật lặp tối ưu hệ kiến [59]
Trang 18Trong [11], Aman Tusia và cộng sự đã thực hiện một phân tích hiệu năng của hệ thống mờ loại 2 cho việc tăng cường ảnh Trước khi xử lý, ảnh đầu vào được chuyển từ không gian màu RGB về không gian HSV để bảo tồn thông tin màu sắc Hai ngưỡng dưới và trên được định nghĩa để cung cấp ước lượng của các vùng tối và vùng sáng trong ảnh Ảnh được mờ hoá (loại 2) sử dụng hàm thành viên Gausian
Những tiếp cận sử dụng logic mờ để nâng cao ĐTP ảnh nói chung đều dẫn đến tạo ra một hàm biến đổi mức xám dạng chữ S (Hàm liên tục đơn điệu tăng, giảm giá trị đầu vào khi đầu vào dưới ngưỡng, và ngược lại tăng giá trị đầu vào khi đầu vào ở trên ngưỡng)
(a) Toán tử NINT [23] (b) Dạng đồ thị của hàm
biến đổi mức xám sinh bởi
hệ luật mờ if-then [72]
(c)Dạng đồ thị biến đổi mức xám của [17]
(d) Ảnh kết quả sử dụng suy diễn luật if-then [72] cho ảnh #5 (Phụ lục C)
Hình 1 Dạng hàm biến mức xám chữ S trong các phép nâng cao ĐTP
Trang 19(a) Ảnh gốc (b) Ảnh kết quả sinh bởi
toán tử tăng cường mờ [72] (c) Dạng hàm biến đổi
(d) Ảnh gốc (e) Kết quả sinh bởi toán tử
tăng cường mờ [72]
(g) Dạng hàm biến đổi
Hình 2 Một số thử nghiệm nâng cao ĐTP cho ảnh mầu tiếp cận sử dụng toán
tử tăng cường mờ [72]
b) Về phương pháp nâng cao ĐTP trực tiếp
Nâng cao ĐTP ảnh theo phương pháp trực tiếp là xây dựng một phương pháp biến đổi ĐTP tại một điểm ảnh dựa trên định nghĩa độ đo tương phản giữa độ sáng điểm ảnh và lân cận xung quanh nó Bài toán được phát biểu như sau:
Nâng cao ĐTP theo phương pháp trực tiếp là quy trình thực hiện một
Trang 20Như vậy, quy trình biến đổi '
Trong một thời gian dài cho đến nay, có rất ít các nghiên cứu theo phương pháp trực tiếp trong đó biến đổi độ tương phản ảnh dựa trên một độ
đo tương phản xác định tại mỗi điểm ảnh, chẳng hạn các nghiên cứu [16, 17,
18, 19] Hầu như chỉ có các nghiên cứu của Cheng và cộng sự là theo hướng tiếp cận này [16, 17]
Các thuật toán của Cheng là cơ sở của phép nâng cao ĐTP ảnh đa cấp xám Tuy vậy các thuật toán này vẫn còn tồn tại một số hạn chế sau khi áp dụng cho ảnh mầu, ảnh đa kênh:
(i) Ảnh nâng cao ĐTP có thể không thay đổi mức độ sáng của mầu so với ảnh gốc
(ii) Sử dụng các ảnh đã được biến đổi theo phương pháp biến đổi ảnh của Cheng để nâng cao ĐTP ảnh có thể làm mất chi tiết của ảnh gốc
Về độ đo thuần nhất cho điểm ảnh, Cheng đề xuất cách ước lượng giá
Vij, R4,ij Khi thử nghiệm với ảnh mầu, tác giả nhận thấy với phép kết nhập này ảnh kết quả có thể không trơn
Thực tế giá trị độ thuần nhất của điểm ảnh là một giá trị mờ và chúng ta
có thể áp dụng lập luận mờ để thu nhận giá trị này
như sau:
Nếu g r a d i e n t là cao và e n t r o p y là cao thì độ thuần nhất là cao
Nếu g r a d i e n t là thấp và e n t r o p y là thấp thì độ thuần nhất là thấp
của entropy tương ứng
Trang 21Nếu chúng ta bổ sung thêm các luật với từ các gia tử như “rất”, “ít”,
“vừa” v.v với các biến ngôn ngữ như “homogeneity”, “entropy”, “gradient” v.v thì các giá trị thuần nhất có thể được ước lượng bằng suy diễn của con người và vì thế sẽ mịn hơn
Do lý thuyết tập mờ ít quan tâm đến cơ sở hình thức giữa quan hệ của các biến ngôn ngữ và các tập mờ, cũng như quan hệ thứ tự giữa các từ nên cần xem xét sử dụng một phương pháp lập luận luôn đảm bảo thứ tự hoặc yêu cầu cao hơn là tạo ra một hàm biến đổi mức xám dạng chữ S dựa trên hệ luật ngôn ngữ
Hơn nữa, bản thân lý thuyết tập mờ rất khó để mô phỏng hoàn chỉnh cấu trúc ngôn ngữ mà con người vẫn sử dụng để suy luận, cho dù cách tiếp cận này đã được ứng dụng thành công trên rất nhiều lĩnh vực của cuộc sống
Vì cấu trúc thứ tự cảm sinh trên các khái niệm mờ biểu thị bằng các giá trị ngôn ngữ không được thể hiện trên các tập mờ Chẳng hạn, về mặt ngữ nghĩa
chúng ta luôn cảm nhận được “yếu” nhỏ hơn “khỏe”, “cao” lớn hơn “thấp”
nhưng hàm thuộc của chúng lại không so sánh được với nhau Mặt khác, tập các khái niệm mờ không đóng đối với một số các phép toán trên các tập mờ [80] Vì vậy trong quá trình lập luận nhiều khi người ta cần phải xấp xỉ ngôn ngữ, tức là phải tìm một giá trị ngôn ngữ mà ý nghĩa của nó xấp xỉ với một tập mờ cho trước, điều này làm tăng độ phức tạp của thuật toán và sai số cho quá trình tính toán Hơn nữa, chúng ta biết rằng một hệ suy diễn xây dựng trên một ngôn ngữ hình thức đều xác định trên tập các lớp công thức tương đương một cấu trúc đại số thuộc lớp các đại số trừu tượng [6], trong khi lôgíc
mờ giá trị ngôn ngữ (hay lôgíc mờ theo nghĩa Zadeh) còn thiếu một cơ sở đại
số làm nền tảng
Vì vậy, nhằm khắc khắc phục phần nào những nhược điểm trên, năm
1990, N.C Ho & W Wechler trong [29] đã khởi xướng phương pháp tiếp cận đại số đến cấu trúc tự nhiên của miền giá trị của các biến ngôn ngữ Theo
Trang 22cách tiếp cận này, mỗi giá trị ngôn ngữ của một biến ngôn ngữ nằm trong một cấu trúc đại số gọi là đại số gia tử (ĐSGT) Dựa trên những tính chất ngữ nghĩa của ngôn ngữ được phát hiện, bằng phương pháp tiên đề hóa nhiều tác giả đã tập trung phát triển lý thuyết ĐSGT với các kết quả như ĐSGT mở rộng [29], ĐSGT mịn hóa [32], ĐSGT mở rộng đầy đủ [1], ĐSGT PN-không thuần nhất [6] Trong đó, tiêu biểu là ĐSGT mịn hóa cùng với việc trang bị khái niệm độ đo tính mờ của các giá trị ngôn ngữ và phương pháp định lượng ngữ nghĩa [35] Trên cơ sở đó, các phương pháp lập luận xấp xỉ dựa trên ĐSGT và ứng dụng trong một số lĩnh vực được các tác giả phát triển, có thể
kể đến như phương pháp lập luận sử dụng mạng nơron trong điều khiển mờ
ưu tham số và ứng dụng trong điều khiển mờ [7], [30], [33] v.v Tuy nhiên, việc ứng dụng đại số gia tử vào lĩnh vực xử lý ảnh nói chung và bài toán nâng cao ĐTP ảnh nói riêng chưa được thực hiện
Qua khảo sát, phân tích và thực nghiệm tác giả đã rút ra kết luận:
Thứ nhất, phép lập luận if-then dựa trên tập mờ rất khó đảm bảo hình
dạng chữ S của hàm biến đổi mức xám Phép nâng cao ĐTP theo hướng tiếp cận trực tiếp của Cheng sử dụng một hàm biến đổi mức xám dạng chữ S không đối xứng, giá trị mức xám biến đổi có thể rơi ra ngoài miền giá trị của
độ xám
Thứ hai, độ đo thuần nhất của Cheng vẫn còn một vài hạn chế, chẳng
hạn ảnh kết quả có thể không trơn
Thứ ba, sử dụng trực tiếp thuật toán của Cheng trên kênh ảnh gốc thì
độ sáng của ảnh kết quả có thể không thay đổi đáng kể Để thay đổi được độ sáng của ảnh cần phải biến đổi ảnh gốc trước khi áp dụng phép nâng cao ĐTP của Cheng Tuy nhiên, phép biến đổi ảnh của Cheng có thể làm mất chi tiết của ảnh gốc
Vấn đề nghiên cứu của luận án là:
Trang 23Vấn đề 1: Xây dựng phép mờ hóa ảnh không đánh mất chi tiết ảnh gốc Vấn đề 2: Thiết kế hàm biến đổi mức xám dạng chữ S và đối xứng; Vấn đề 3:Xây dựng độ đo thuần nhất địa phương của ảnh;
Ba vấn đề nghiên cứu của luận án có thể được khái quát lại theo hình như sau:
Dùng hệ luật NN và ĐSGT
Trang 242 Mục tiêu, phạm vi nghiên cứu của luận án
2.1 Mục tiêu chính của đề tài là tập trung chủ yếu ở vấn đề:
Nghiên cứu các vấn đề của xử lý ảnh dưới tiếp cận của lý thuyết ĐSGT,
- Biến đổi ảnh mầu, ảnh đa kênh
- Xây dựng hàm biến đổi mức xám dạng chữ S dựa trên ĐSGT
- Xây dựng độ đo thuần nhất địa phương cho ảnh dựa trên ĐSGT
2.3 Đối tượng nghiên cứu của luận án:
- Ảnh đa kênh: ảnh mầu RGB (24 bit), kênh ảnh mầu của ảnh viễn thám
- Lập luận hệ luật mờ bằng ĐSGT
- Độ đo tương phản của ảnh mầu RGB (24 bit), kênh ảnh mầu của ảnh viễn thám
3 Phương pháp và nội dung nghiên cứu
Phương pháp luận trong nghiên cứu của luận án là kết hợp giữa nghiên cứu lý thuyết và thực nghiệm Các tư liệu và thông tin liên quan chủ yếu được
Trang 25thu thập, tổng hợp từ các nguồn tạp chí khoa học chuyên ngành trong và ngoài nước, qua các buổi seminar hoặc tham gia báo cáo tại các hội thảo khoa học, qua trao đổi với thầy hướng dẫn và các đồng nghiệp cùng lĩnh vực nghiên cứu v.v…Tổng hợp các thông tin liên quan, lựa chọn các cách tiếp cận
đã được áp dụng thành công, tiến hành thử nghiệm với tiếng Việt, đánh giá kết quả, từ đó sẽ tiến hành nghiên cứu sâu hơn về giải pháp cải tiến có thể xây dựng được biến đổi ảnh đa kênh, xây dựng được hàm biến đổi dạng chữ S và xây dựng độ đo thuần nhất dựa trên ĐSGT
Chương này trình bày khái quát kiến thức về ĐSGT, phương pháp giải
hệ luật mờ bằng ĐSGT Cũng trong chương này trình bày thuật toán nâng cao ĐTP trực tiếp của Cheng, phân tích những điểm mạnh và điểm hạn chế của phương pháp làm căn cứ cho các nghiên cứu, đề xuất trong chương 2 và chương 3
Chương 2: Biến đổi ảnh đa kênh và xây dựng hàm biến đổi chữ S theo tiếp cận ĐSGT và ứng dụng nâng cao ĐTP ảnh đa kênh
Chương này trình bày đề xuất của NCS về xây dựng phép biến đổi mờ hóa ảnh cho ảnh đa kênh như ảnh mầu, kênh ảnh mầu của ảnh viễn thám Cũng trong chương này trình bày phương pháp xây dựng hàm biến đổi mức xám dạng chữ S sử dụng ĐSGT ứng dụng nâng cao ĐTP ảnh đa kênh
Chương 3 Xây dựng độ đo thuần nhất mới theo tiếp cận ĐSGT và ứng dụng nâng cao ĐTP ảnh đa kênh
Trang 26Chương này trình bày đề xuất của NCS về đo thuần nhất, các phương pháp xây dựng độ đo thuần nhất, xây dựng độ đo thuần nhất sử dụng ĐSGT
và ứng dụng độ đo thuần nhất mới nâng cao ĐTP ảnh đa kênh
5 Kết quả đạt được của luận án
Các kết quả đạt được của luận án đã được công bố trong 2 bài tạp chí chuyên ngành Quốc gia năm 2017, 02 bài tạp chí chuyên ngành có tính điểm năm 2017, 01 bài báo cáo đăng tại kỷ yếu hội nghị Quốc gia năm 2017 Những kết quả đạt được của luận án:
1) Đề xuất phương pháp xây dựng phép biến đổi mờ hóa ảnh đa kênh
sử dụng nhiều dải động mức xám, các dải động được ước lượng tự động dựa trên thuật toán phân cụm FCM [CT 4] làm bước tiền đề cho quy trình nâng cao ĐTP ảnh [CT 1];
2) Đề xuất phương pháp xây dựng hàm biến đổi độ xám dạng chữ S dựa trên một toán tử HA, cụ thể là toán tử Hint (toán tử tăng cường của ĐSGT) để cải tiến thuật toán của Cheng, ứng dụng nâng cao ĐTP ảnh đa kênh [CT 5]
3) Đề xuất phương pháp xây dựng độ thuần nhất dựa trên một hệ luật ngôn ngữ, sau đó nhúng phép lập luận sử dụng ĐSGT mà cụ thể là phép nội suy giải hệ luật mờ của đại số gia tử Ứng dụng độ thuần nhất mới vào quy trình nâng cao ĐTP ảnh đa kênh [CT 2] và so sánh với phương pháp xây dựng
độ thuần nhất dựa trên các toán tử t-norm [CT 3]
Trang 27CHƯƠNG 1 TỔNG QUAN VỀ NÂNG CAO ĐỘ TƯƠNG PHẢN ẢNH
VÀ TIẾP CẬN ĐẠI SỐ GIA TỬ GIẢI HỆ LUẬT MỜ
Trong chương này luận án hệ thống lại một số kiến thức cơ bản về đại
số gia tử (ĐSGT) và phương pháp lập luận xấp xỉ dựa trên ĐSGT Trình bày tổng quan về nâng cao ĐTP ảnh, hệ thống một số thuật toán nâng cao độ sáng tối của điểm ảnh, phân tích thuật toán nâng cao ĐTP ảnh theo hướng tiếp cận trực tiếp của Cheng làm tiền đề cho những nội dung nghiên cứu trong chương
2 và chương 3 Cũng trong chương này, luận án trình bày các phương pháp được sử dụng để đánh giá tính hiệu quả của các kết quả đề xuất và tập dữ liệu dùng để thử nghiệm
1.1 Đại số gia tử: một số vấn đề cơ bản
1.1.1 Các khái niệm cơ bản về đại số gia tử
Phương pháp lập luận tính toán nhằm giải quyết vấn đề mô phỏng tư duy, lập luận của con người chính là việc chúng ta mượn cấu trúc tính toán rất phong phú của tập tất cả các hàm F(U, [0,1]) để mô phỏng các cách lập luận của con người mà chúng ta thường được thực hiện trên nền ngôn ngữ tự nhiên Tuy nhiên, trong [5], các tác giả đã chỉ ra rằng tập các giá trị ngôn ngữ của một biến ngôn ngữ sẽ là một cấu trúc đại số đủ giàu để tính toán và nghiên cứu các phương pháp lập luận Như vậy thay vì mượn cấu trúc của
F(U,[0,1]), chúng ta có một khả năng lựa chọn khác là sử dụng cấu trúc đại số
của chính các tập các giá trị ngôn ngữ
Đại số gia tử (ĐSGT) được ra đời do đề xuất của N.C Ho và W Wechler vào năm 1990 [28], đến nay đã có nhiều nghiên cứu phát triển và
Trong [28], các tác giả đã chứng minh miền ngôn ngữ X = Dom(X) của
một biến ngôn ngữ X có thể được tiên đề hóa và được gọi là đại số gia tử và
Trang 28các gia tử (hedge) còn “” là quan hệ cảm sinh ngữ nghĩa trên X Giả thiết trong G có chứa các phần tử hằng 0, 1, W với ý nghĩa là phần tử bé nhất, phần
tử lớn nhất và phần tử trung hòa (neutral) trong X Ta gọi mỗi giá trị ngôn
Nếu tập X và H là các tập sắp thứ tự tuyến tính, khi đó AX = (X, G, H,
ĐSGT cũng có nghĩa là ĐSGT tuyến tính
tăng ngữ nghĩa của một hạng từ mà nó tác động, còn gia tử âm làm giảm ngữ
nó đối với phần tử sinh cộng thêm 1, ký hiệu l(x)
Ví dụ 1.1 Cho biến ngôn ngữ TRUTH, có G = {0, FALSE, W, TRUE, 1}, H - = { Possible < Little } và H + = { More < Very } Khi đó TRUE < More TRUE < Very TRUE, Little TRUE < TRUE,
Bây giờ chúng ta xét một số tính chất của đại số gia tử tuyến tính Định
lý sau cho thấy tính thứ tự ngữ nghĩa của các hạng từ trong ĐSGT
Trang 29Định lý 1.1 [28] Cho tập H
(2) Nếu X được sinh từ G bởi các gia tử và G là tập sắp thứ tự tuyến tính thì X cũng là tập sắp thứ tự tuyến tính Hơn nữa nếu u < v, và u, v là độc
Định lý tiếp theo xem xét sự so sánh của hai hạng từ trong miền ngôn ngữ của biến X
Định lý 1.2 [29] Cho x = h n …h1u và y = k m …k1u là hai biểu diễn chính
không so sánh được với nhau
Trong phần tiếp theo, chúng ta trình bày một số vấn đề của đại số gia tử làm cơ sở cho việc nghiên cứu và phát triển một số mô hình lập luận và ứng dụng về sau
1.1.2 Vấn đề định lượng ngữ nghĩa trong đại số gia tử
Trong phần này chúng ta xem xét ba vấn đề cơ bản đó là độ đo tính mờ của các giá trị ngôn ngữ (hạng từ), phương pháp định lượng ngữ nghĩa và khoảng tính mờ của các khái niệm mờ
Tính mờ của các giá trị ngôn ngữ xuất phát từ thực tế rằng một giá trị ngôn ngữ mang ý nghĩa mô tả cho nhiều sự vật và hiện tượng trong thế giới thực, với lý do tập hữu hạn các giá trị ngôn ngữ không đủ để phản ánh thế
Trang 30giới vô hạn các sự vật hiện tượng [34] Như vậy khái niệm tính mờ và độ đo tính mờ của một giá trị ngôn ngữ được hình thành và nó là một khái niệm rất khó xác định, đặc biệt trong lý thuyết tập mờ [7] Tuy nhiên, trong ĐSGT các
tác giả đã cho thấy độ đo tính mờ được xác định một cách hợp lý: “tính mờ của một hạng từ x được hiểu như là ngữ nghĩa của nó vẫn có thể được thay đổi khi tác động vào nó bằng các gia tử” [34], [35] Do đó, tập các hạng từ
sinh từ x bằng các gia tử sẽ thể hiện cho tính mờ của x và do đó, H(x) có thể
sử dụng như là một mô hình biểu thị tính mờ của x và kích thước tập H(x)
được xem như độ đo tính mờ của x Ta có định nghĩa sau về độ đo tính mờ
Định nghĩa 1.1 [35] Cho AX = (X, G, H, , , ) là một ĐSGT tuyến
) ( )
(
) (
y fm
hy fm x
fm
hx fm
và y, vì vậy nó được gọi là độ đo tính mờ của các gia tử và được ký hiệu bởi
Trong đó, điều kiện (1) thể hiện tính đầy đủ của các phần tử sinh và các gia tử cho việc biểu diễn ngữ nghĩa của miền thực đối với các biến (2) thể hiện tính rõ của các hạng từ và (3) có thể được chấp nhận vì chúng ta đã chấp nhận giả thiết rằng các gia tử là độc lập với ngữ cảnh và, do vậy, khi áp dụng
một gia tử h lên các hạng từ thì hiệu quả tác động tương đối làm thay đổi ngữ
nghĩa của các hạng từ đó là như nhau Hình vẽ sau (Hình 1.1) minh họa rõ
Trang 31hơn cho khái niệm độ đo tính mờ của biến ngôn ngữ TRUTH (đã xét trong Ví
{-,+}, dễ dàng tính được độ đo tính mờ của x như sau:
Thông thường, ngữ nghĩa của các hạng từ thuần túy mang tính định tính Tuy nhiên, trong nhiều ứng dụng, chúng ta cần giá trị định lượng của các hạng từ này cho việc tính toán và xử lý Theo tiếp cận của tập mờ, việc định
fm(True)
fm(VeryTrue) fm(LittleTr) fm(PossTr))
fm(LVTr)
Trang 32lượng hóa các khái niệm mờ được thực hiện qua các phương pháp khử mờ
(defuzzification) Đối với ĐSGT, giá trị định lượng của các hạng từ được định
nghĩa dựa trên cấu trúc thứ tự ngữ nghĩa của miền giá trị của các biến ngôn ngữ, cụ thể là độ đo tính mờ của các hạng từ và gia tử Tuy có nhiều phương pháp xác định giá trị định lượng của các hạng từ dựa trên các tham số này nhưng phải thỏa mãn một số ràng buộc nhất định và được thể hiện trong định nghĩa sau
Định nghĩa 1.2 [35] Cho AX = (X, G, H, , , ) là một ĐSGT tuyến
Điều kiện (1) là bắt buộc tối thiểu đối với bất kỳ phương pháp định
lượng nào, còn điều kiện (2) đảm bảo tính trù mật của H(G) trong X Dựa trên
những ràng buộc này, các tác giả trong [35] đã xây dựng một phương pháp định lượng ngữ nghĩa của các hạng từ trong ĐSGT Trước hết chúng ta xét định nghĩa về dấu của các hạng từ như sau
Định nghĩa 1.3 [35] Một hàm dấu Sign : X {-1, 0, 1} là một ánh xạ
(2) Sign(hc) = -Sign(c) nếu h âm đối với c; Sign(hc) = Sign(c) nếu h dương đối với c;
Trang 33(4) Sign(h'hx) = 0, nếu h'hx = hx
Dựa trên hàm dấu này, chúng ta có tiêu chuẩn để so sánh hx và x
Mệnh đề 1.2 [35] Với bất kỳ h và x, nếu Sign(hx) = 1 thì hx > x; nếu
Sign(hx) = -1 thì hx < x và nếu Sign(hx) = 0 thì hx = x
Định nghĩa 1.4 [35] Cho AX là một ĐSGT tuyến tính đầy đủ và fm là
đo tính mờ fm nếu đƣợc định nghĩa bằng đệ qui nhƣ sau:
( )
j Sign
x j h Sign x
x j
(
) ( )
x h
j Sign j j Sign
)
x h
j Sign
Với định nghĩa này, các tác giả trong [31] đã chứng minh nó thỏa mãn các yêu cầu của một hàm định lƣợng ngữ nghĩa và đảm bảo tính trù mật của
nó đối với các hạng từ của AX trong đoạn [0,1] (xem Định lý 1.3)
Một khái niệm rất quan trọng làm cơ sở cho việc nghiên cứu và xây
dựng các mô hình ứng dụng về sau đó là khoảng tính mờ (fuzziness interval)
Trang 34của các khái niệm mờ Trong ĐSGT, dựa trên độ đo tính mờ fm, chúng ta sẽ
định nghĩa khoảng tính mờ của các hạng từ Gọi Itv([0,1]) là họ các đoạn con
Định nghĩa 1.5 [35] Khoảng tính mờ của các hạng từ x X, ký hiệu
x nhƣ sau:
phân hoạch nhƣ vậy luôn tồn tại dựa vào tính chất (1) trong Mệnh đề 1.1
mức k) Để thuận tiện về sau, ta ký hiệu:
Hình 1.2: Khoảng tính mờ của các hạng từ của biến TRUTH
Trang 35Mệnh đề 1.3 [35] Cho AX = (X, G, H, , , ) là một ĐSGT tuyến tính đầy đủ:
Trang 36Chứng minh Các tính chất (2) đến (5) đã được chứng minh trong [31],
Dễ dàng suy ra từ mệnh đề trên trong trường hợp các khoảng tính mờ
tính mờ của hạng từ bé nhất trong phân hoạch ở dạng đóng thì các tựa phân
hoạch trong (2), (3) trở thành các phân hoạch thực sự Trong đó, lmp và rmp
là điểm mút trái và điểm mút phải của khoảng tính mờ
Để ý rằng dựa trên cấu trúc thứ tự của X, phần tử x nằm ở giữa hai tập
i[-q,-1] |(h i x)| = fm(x) i[-q,-1] (h i) = .fm(x) = .|(x)|
Theo Định nghĩa 1.4 và 1.5, có một mối liên hệ giữa ánh xạ định lượng ngữ nghĩa và khoảng tính mờ của của hạng từ trong một ĐSGT, được thể hiện bằng định lý sau
Định lý 1.3 [35] Cho AX = (X, G, H, , , ) là một ĐSGT tuyến tính
Trang 37fm(x) = (x) - (x),
Định lý này cũng khẳng định rằng ĐSGT AX cùng với hàm định lượng
1.1.3 Phương pháp lập luận xấp xỉ dựa trên ĐSGT
Phần này trình bày cách giải hệ luật mờ bằng phương pháp lập luận xấp
xỉ dựa trên ĐSGT Trước hết xét mô hình mờ:
(1.1)
là các giá trị ngôn ngữ tương ứng (xem [79])
Tư tưởng chính của phương pháp là từ mỗi mệnh đề “If .then ” sẽ
cho nên giải bài toán mô hình mờ đa điều kiện có nghĩa là chúng ta đi tìm giá
Trang 38trị B ứng với giá trị A = (A11, , A 1m ) bằng cách nội suy trên siêu mặt C f
Cụ thể chúng ta phải thực hiện các bước sau đây (xem [6]):
của các phần tử sinh nguyên thủy và của các gia tử, chúng đóng vai trò các tham số của phương pháp Kết quả nội suy sẽ chịu ảnh hưởng từ cách chọn các tham số này
3) Sử dụng một phép kết nhập Agg ta sẽ chuyển được siêu mặt thực
C r,m+1 trong bước 2 thành đường cong thực C r,2 trong [0, a][0, b] với a =
1.2 Khả năng xấp xỉ hàm của phương pháp HA-IRMd và ứng dụng
1.2.1 Khả năng xấp xỉ hàm
Với phương pháp HA-IRMd vừa nêu, chúng ta thấy rằng việc giải bài toán LLXX sẽ được chuyển về bài toán nội suy trên đường cong thực Trong
Trang 39trường hợp mô hình mờ gồm hai biến, sự phụ thuộc giữa chúng được xác định
bởi một hàm f cho trước, liệu có tồn tại mô hình mờ gồm các luật sao cho
đường cong ngữ nghĩa thu được bởi phương pháp HA-IRMd trên mô hình này
Y Bằng việc chuẩn hóa, chúng ta đưa các miền U, V về đoạn [0,1], khi đó đường cong g được chuyển thành đường cong f với f: [0,1] → [0,1] Bây giờ chúng ta cần xây dựng mô hình mờ M thể hiện sự phụ thuộc của biến ngôn ngữ Y vào biến ngôn ngữ X sao cho đường cong ngữ nghĩa tương ứng với mô hình M là xấp xỉ với đường cong f
Ta có định lý sau:
Định lý 1.5 [7] Với bất kỳ đường cong liên tục f: [0,1]→[0,1] và một
1 ,
0
z f z
z
Trang 40
1.2.2 Ứng dụng việc xấp xỉ hàm trong xây dựng luật
Trong thực tế cuộc sống có rất nhiều quan hệ phụ thuộc lẫn nhau giữa các đại lượng Ví dụ như hệ số lương phụ thuộc vào số năm công tác hay năng suất cây trồng phụ thuộc vào điều kiện chăm sóc,…Sự phụ thuộc này có thể ngầm hiểu như một quan hệ hàm Tuy nhiên rất khó có thể xác định công thức của các hàm đó Chúng ta chỉ có thể biểu thị sự phụ thuộc này bởi các câu hoặc các mệnh đề If-then Ngược lại, nếu sự phụ thuộc giữa các yếu tố được biểu diễn dưới dạng hàm hoặc từ các dữ liệu đo đạc thực nghiệm, chúng
ta lại hoàn toàn có thể xây dựng các luật để diễn đạt nó Dưới đây tác giả sẽ trình bày phương pháp xây dựng hệ luật từ tập các dữ liệu phụ thuộc giữa hai đại lượng ở dạng một hàm cho trước
Bài toán xây dựng luật [5]: Cho đường cong liên tục f: [0,1] → [0,1] biểu thị sự phụ thuộc giữa hai biến ngôn ngữ X, Y và số ε > 0 bé tùy ý Cần
xây dựng mô hình mờ M sao cho đường cong ngữ nghĩa tương ứng là xấp xỉ
Bước 2 Chia đoạn [0,1] thành m phần bằng nhau (m phụ thuộc vào ε)