PHÁT TRIỂN MỘT SỐ THUẬT TOÁN PHÂN CỤM MỜ TRÊN TẬP MỜ VIỄN CẢNH

27 41 0
PHÁT TRIỂN MỘT SỐ THUẬT TOÁN PHÂN CỤM MỜ TRÊN TẬP MỜ VIỄN CẢNH

Đang tải... (xem toàn văn)

Tài liệu hạn chế xem trước, để xem đầy đủ mời bạn chọn Tải xuống

Thông tin tài liệu

ĐẠI HỌC QUỐC GIA HÀ NỘI TRƢỜNG ĐẠI HỌC KHOA HỌC TỰ NHIÊN PHẠM HUY THÔNG PHÁT TRIỂN MỘT SỐ THUẬT TOÁN PHÂN CỤM MỜ TRÊN TẬP MỜ VIỄN CẢNH VÀ ỨNG DỤNG TRONG DỰ BÁO Chuyên ngành: Cơ sở toán học cho tin học Mã số: 9460117.02 DỰ THẢO TĨM TẮT LUẬN ÁN TIẾN SĨ TỐN HỌC Hà Nội, 2019 Cơng trình đƣợc hồn thành tại: Trường Đại học Khoa học Tự nhiên, Đại học Quốc gia Hà Nội Người hướng dẫn khoa học: PGS TS Lê Hoàng Sơn PGS TS Nguyễn Thị Hồng Minh Phản biện 1: Phản biện 2: Phản biện 3: Luận án bảo vệ Hội đồng chấm luận án cấp Đại học Quốc gia họp tại: Trường Đại học Khoa học Tự nhiên – Đại học Quốc gia Hà Nội vào hồi ., ngày .tháng .năm 20 Có thể tìm hiểu luận án tại: - Thư viện Quốc gia Việt Nam, - Trung tâm thông tin - Thư viện, Đại học Quốc gia Hà Nội MỞ ĐẦU Phân cụm liệu việc xếp đối tượng liệu vào cụm cho phần tử cụm có mức độ tương tự cao hai phần tử hai cụm khác có mức độ tương tự thấp Việc phân cụm giúp cho việc khai phá liệu, đặc biệt toán liệu lớn trở nên hiệu liệu phân thành nhóm với tính chất đặc trưng Tuy nhiên, việc phân cụm có số nhược điểm phần tử thuộc cụm liệu hay số liệu bị thiếu thơng tin thơng tin khơng chắn Để giải vấn đề này, dựa lý thuyết tập mờ Zadeh, Bezdek đưa thuật toán phân cụm mờ Fuzzy C-mean (FCM) nhằm giải nhược điểm Thuật toán biết đến phương thức phân cụm mờ Tuy nhiên, chất lượng phân cụm FCM thường khơng cao thuật tốn cài đặt cở tập mờ truyền thống, có giới hạn độ thuộc, dự mơ hồ tham số mẫu Chính việc nghiên cứu thuật tốn phân cụm tập mờ nâng cao nhằm mục tiêu giải nhược điểm Đến có nhiều thuật toán phân cụm tập mờ nâng cao thuật toán phân cụm tập mờ loại (T2FS), tập mờ trực cảm, … mang lại chất lượng phân cụm tốt Tuy nhiên thuật toán phân cụm cho kết chưa đưa thông tin đầy đủ, đặc biệt phù hợp mơ hình Vào năm 2014, tác giả Bùi Công Cường giới thiệu tập mờ viễn cảnh (PFS), khái quát hóa tập mờ truyền thống tập mờ trực cảm Các mô hình dựa PFS áp dụng cho nhiều tình cần ý kiến người liên quan nhiều đến câu trả lời kiểu: đồng ý, dự, không đồng ý từ chối trả lời Các tình cho kết rõ ràng thuật toán phân cụm dựa PFS Chính việc phát triển thuật tốn phân cụm mờ PFS nâng cao độ xác phân cụm Hiện thuật toán phân cụm mờ tập mờ viễn cảnh dừng lại việc đưa số độ đo kết hợp sử dụng phân cụm phân cấp để thực mà chưa xem xét đến việc phân cụm theo cách tiếp cận phân hoạch Ngoài nhược điểm chất lượng cụm, thuật toán FCM thuật toán phân cụm tập mờ nâng cao cịn có số nhược điểm khác xác định số cụm hay xử lý với liệu phức tạp Thứ nhất, thuật toán FCM thuật toán phân cụm tập mờ nâng cao phải xác định trước số cụm trước thực phân cụm Việc xác định số cụm ban đầu không tốt dẫn đến chất lượng cụm không tốt, chứa nhiễu điểm ngoại biên Có ba cách tiếp cận cụ thể quét, tiền xử lý cắt tỉa sử dụng nhiều Các nghiên cứu chứng minh phương pháp cắt tỉa cách tiếp cận hiệu Thứ hai, xử lý với liệu phức tạp không dễ với FCM thuật toán phân cụm trẻn tập mờ nâng cao Các phương pháp phân cụm tập liệu phức tạp chia thành hai nhóm: loại liệu hỗn hợp bao gồm liệu kiểu loại, liệu số cấu trúc đặc biệt liệu Phân cụm mờ có nhiều ứng dụng thực tế sống nhiều lĩnh vực khác như: kinh tế với dự báo tỉ giá, dự báo chứng khốn, dự báo tài chính, …; y khoa: Hỗ trợ chuẩn đốn hình ảnh, hỗ trợ tư vấn khám bệnh, …; thủy văn: dự báo thời tiết ngắn hạn, …; xử lý ảnh: Phân đoạn ảnh, …; hệ tư vấn: hỗ trợ định, … Đề tài nghiên cứu tập trung vào ứng dụng phân cụm mờ toán dự báo thời tiết ngắn hạn Dự báo thời tiết ngắn hạn kết hợp mô tả trạng thái khí dự báo ngắn hạn khí xẩy vài Điều cho phép dự báo tính chất thời tiết ngắn hạn mưa, mây bão với nguyên nhân rõ ràng khoảng thời gian Các liệu rada nhất, liệu vệ tinh liệu dựa quan sát sử dụng để phân tích biến đổi phạm vi hẹp thành phố thực dự báo xác cho khoảng thời gian vài sau Tuy nhiên, quan sát vệ tinh lựa chọn thích hợp cho khu vực vùng phủ sóng Mục tiêu nghiên cứu Mục tiêu 1: Nghiên cứu, tổng hợp, phân tích đề xuất thuật toán phân cụm mờ tập mờ viễn cảnh Kiểm chứng lý thuyết hội tụ thuật toán thực nghiệm, so sách với thuật toán phân cụm mờ khác Mục tiêu 2: Nghiên cứu, phát triển thuật toán phân cụm mở rộng tập mờ viễn cảnh như: phân cụm xác định số cụm tự động, phân cụm với liệu phức tạp Kiểm chứng, so sách với thuật toán liên quan khác Mục tiêu 3: Nghiên cứu, phát triển ứng dụng thuật toán phân cụm tập mờ viễn cảnh vào toán dự báo thời tiết dựa ảnh mây vệ tinh Nội dung nghiên cứu Nội dung 1: Nghiên cứu phát triển thuật toán phân cụm mờ tập mờ viễn cảnh (FC-PFS) Nội dung 2: Khảo sát tính chất hội tụ thuật tốn FC-PFS mặt lý thuyết kiểm chứng mặt thực nghiệm liệu chuẩn UCI Nội dung 3: Đề xuất mở rộng FC-PFS cho việc phân cụm mờ tự động xác định số cụm Nội dung 4: Đề xuất mở rộng FC-PFS xử lý liệu phức tạp Nội dung 5: Xây dựng luật mờ viễn cảnh từ FC-PFS Nội dung 6: Ứng dụng luật mờ viễn cảnh toán dự báo thời tiết ngắn hạn dựa ảnh mây vệ tinh - - - - Phƣơng pháp nghiên cứu Khảo cứu: Khảo sát phương pháp liên quan phân cụm mờ, xử lý liệu không chắn Nghiên cứu gia tăng: Cải tiến, mở rộng thuật toán phân cụm mờ (FCM) tập mờ viễn cảnh Nghiên cứu lý thuyết: Phân tích chứng minh số tính chất hội tụ mơ hình đề xuất Nghiên cứu mở rộng: Mở rộng FC-PFS số trường hợp đặc biệt Nghiên cứu ứng dụng: Ứng dụng mơ hình đề xuất cho toán dự báo thời tiết ngắn hạn dựa ảnh mây vệ tinh Phạm vi giới hạn đề tài nghiên cứu Phát triển thuật toán phân cụm mờ tập mờ viễn cảnh với phân cụm phân hoạch Ứng dụng: Áp dụng cho toán dự báo thời tiết ngắn hạn dựa ảnh mây vệ tinh với việc sử dụng phương pháp hồi quy không thời gian, suy luận mờ sử dụng luật mờ viễn cảnh Bố cục luận án Chương mở đầu: trình bày bối cảnh nghiên cứu; tổng quan nhanh hạn chế toán phân cụm mờ; vấn đề nghiên cứu; mục tiêu nghiên cứu; hướng tiếp cận phương pháp nghiên cứu; nội dung nghiên cứu; phạm vi giới hạn nghiên cứu; đóng góp bố cục luận án Chương 1: Giới thiệu số kiến thức sở chuẩn bị đề tài nghiên cứu Chương trình bày giới thiệu sơ lược tập mờ, thuật toán phân cụm mờ, thuật toán phân cụm mờ mở rộng cho việc tự động xác định số cụm, xử lý với liệu phức tạp ứng dụng dự báo thời tiết ngắn hạn Một số độ đo tiêu chí đánh giá liệu trình bày - - - Chương 2: Giới thiệu thuật toán phân cụm tập mờ viễn cảnh từ ý tưởng thuật toán, cách thức triển khai thuật toán, đánh giá lý thuyết hội tụ thực nghiệm tính tốn Chương 3: Đề xuất cải tiến thuật toán phân cụm tập mờ viễn cảnh với việc tự động xác định số cụm xử lý liệu phức tạp, có thực nghiệm kiểm chứng kèm theo Chương 4: Áp dụng thuật toán phân cụm mờ tập mờ viễn cảnh cho toán dự báo ảnh mây tinh CHƢƠNG CƠ SỞ LÝ THUYẾT 1.1 Tập mờ Trong phần tác giả trình bày khái niệm tập mờ các tập mờ nâng cao, đặc biệt tập mờ viễn cảnh Tập mờ viễn cảnh tập mờ tổng quát tập mờ trực cảm tập mờ thường với thể hành vi định giống người khẳng đinh, phủ định, trung lập từ chối 1.2 Độ đo tƣơng tự đánh giá chất lƣợng cụm Các độ đo tương tự đánh giá chất lượng cụm gồm có số Mean Accuracy (MA), số Davies-Bouldin (DB), số Rand, số Alternative Silhouette ( ), số WGLI [64] PBM [72] 1.3 Thuật toán phân cụm mờ Trong phần này, thuật toán phấn cụm mờ tập mờ thường, tập mờ loại tập mờ trực cảm trình bày 1.4 Một số thuật toán khác 1.4.1 Thuật toán tối ưu bầy đàn (PSO) Thuật tốn tối ưu hóa bầy đàn (PSO) chiến lược tiến hóa nhằm tối ưu hóa vấn đề phương pháp lặp cố gắng cải thiện giải pháp ứng viên tới chất lượng cho trước Thuật toán PSO gồm bước sau: khởi tạo bầy, tính tốn giá trị fitness cập nhật phương án 1.4.2 Thuật toán DifFuzzy Thuật toán phân cụm DifFuzzy dựa FCM biểu đồ khuếch tán để phân liệu vào cụm có cấu trúc hình học phi tuyến phức tạp 1.4.3 Thuật toán Dissimilarity Thuật toán Dissimilarity dựa thuật toán phân cụm mờ K-Medoids với trọng số liên quan cho ma trận không tương tự bao gồm bước: khởi tạo, tính tốn giá trị tốt nhất, tính tốn trọng số liên quan tốt nhất, định nghĩa phân hoạch mờ tốt nhất, điều kiện dừng 1.4.4 Phương pháp FCM-STAR Pfeifer Deutsch đề xuất mô hình khơng thời gian tuyến tính, phiên 3D mơ hình hồi quy thơng thường (AR) cho phép người dùng dự báo chuỗi khơng thời gian dựa thông tin khứ theo khơng gian thời gian Mật độ ) miền hình ảnh mơ điểm ảnh ( hàm " " mật độ pixel lân cận theo không gian thời gian, với giả định quan hệ nhân 1.5 Bộ liệu thực nghiệm Tập liệu thử nghiệm cho FC-PFS thuật toán cải tiến lấy kho liệu học máy chuẩn UCI với liệu hoàn toàn số IRIS, WINE, WDBC, GLASS, IONOSPHERE, HABERMAN, HEART and CMC Các liệu đầu vào cho toán dự báo thời tiết ngắn hạn ảnh vệ tinh lấy vị trí khoảng thời gian Bộ sưu tập hình ảnh bao gồm ba hình ảnh: Malaysia (dữ liệu 1), Luzon – Philippines (dữ liệu 2) Jakarta – Indonesia (Dữ liệu 3) Mỗi tập liệu chứa ảnh liên tiếp từ 7.30 sáng đến 13.30 chiều ngày 28/11/2014 Các hình ảnh có kích thước (100x100 pixel) 1.6 Kết luận chƣơng Trong chương này, kiến thức sở tập mờ, độ đo đánh giá chất lượng cụm, thuật toán phân cụm thuật toán liên quan khác trình bày Các kiến thức sở tảng cho việc giải toán chương sau CHƢƠNG THUẬT TOÁN PHÂN CỤM TRÊN TẬP MỜ VIỄN CẢNH 2.1 Ý tƣởng thuật toán Ý tưởng thuật toán thiết kế hàm mục tiêu gồm hai thành phần thuật toán phân cụm tập mờ trực cảm Với thành phần thứ cải tiến từ hàm mục tiêu thuật toán phân cụm mờ thường thành phần độ thuộc thay đại lượng )) Đại lượng thể cho việc điểm liệu ( ( thuộc cụm giá trị phải lớn phải nhỏ Thành phần thứ hai hàm mục tiêu đại lượng entropy ( ) Bằng việc cực tiểu hóa đại lượng này, điểm liệu có giá trị nhỏ, giúp giảm giá trị trung lập từ chối mơ hình, giúp mơ hình phân cụm cải tiến độ xác 2.2 Thuật tốn phân cụm tập mờ viễn cảnh 2.2.1 Hàm mục tiêu Giả sử có tập X chứa N điểm khơng gian đa chiều Hãy chia tập liệu thành C nhóm thỏa mãn hàm mục tiêu sau ∑ ∑ ( )/ ‖ ∑ ‖ ∑ ( ) , (1) Các ràng buộc định nghĩa sau: , ; ∑ ∑ ( )/ / , , - (2) (3) (4) Mơ hình đề xuất cơng thức (1-4) dựa nguyên lý tập PFS tóm tắt sau:  Mơ hình đề xuất khái qt hóa mơ hình phân cụm mờ tập mờ viễn cảnh công thức (1-4) điều kiện (4) khơng tồn tại, mơ hình đề xuất mơ hình phân cụm mờ trực cảm  Khi , điều kiện (4) không tồn tại, điều kiện khác thỏa mãn, mơ hình đề xuất mơ hình phân cụm mờ  Cơng thức (3) độ thuộc điểm tới tâm cụm ( ) thỏa mãn ràng buộc mơ hình phân cụm mờ truyền thống  Công thức (4) đảm bảo tập PFS hai nhân tố không chắn độ trung lập độ từ chối ln tồn mơ hình  Một ràng buộc khác (2) phản ảnh định nghĩa tập PFS Định lý Các giải pháp tối ưu hàm mục tiêu (1-4) là: ( ) ( ( , ‖ ‖ ‖ ‖ )( ( ; ( (6) /, (7) ), ( )/ ( ( ) ∑ ; ∑ , ), ∑ ∑ (5) ), ( ∑ ) / , )/ , (8) ) 2.2.2 Chi tiết thuật tốn Thuật tốn FC-PFS có cấu trúc lắp giống với thuật toán FCM với việc khởi tạo ngẫu nhiên tham số , Quá trình lặp bắt đầu việc tính , sau tính lại giá trị , dừng giá trị , gần không đổi Để làm điều này, giá trị nhỏ chất lượng cụm tốt ∑ ( đề xuất giá trị ), ( ), (13) c số cụm cho trước Tiêu chí cho việc lựa chọn số lượng cụm phụ thuộc vào ngưỡng phương án Khi tìm thấy số cụm tối ưu cho phương án này, áp dụng FC-PFS để có giải pháp ( ( ) , ( ) , ( ) , ( ) ) Một số đánh giá ổn định cho việc phân cụm, sử dụng để đo chất lượng cụm Nếu giải pháp đạt kết tốt so với giải pháp trước đó, giải pháp ngày ghi nhận giải pháp tối ưu cục () () () () địa phương Pbest-( , , , ) phương án Sau đó, phương án cập nhật cách thay đổi ngưỡng sau ) (14) () ( () ( ), (15) , ( ), tham số PSO để cập nhật (một cách tổng quát ) Định nghĩa giá trị mới, giải pháp () () () khác ( , , , ) nhận kết tốt so với giải pháp tối ưu cục địa phương Pbest () , () () () ( , , , ) Sự cập nhật tất phương án tiếp tục lặp lại tất bước lặp thực Các giải pháp cuối cho kết số lượng cụm phù hợp nhất, tâm cụm ma trận thuộc xác định từ tất phương án thông qua giá trị tốt giá trị cục phương án ( ) tổng thể tất phương án ( ) Thuật tốn AFC-PFS có lợi sau: - Tổng kết hợp chiến lược PSO hoạt động FC-PFS nâng cao hiệu thuật toán 11 AFC-PFS linh hoạt việc áp dụng cho phương pháp phân cụm mờ khác cách thay FC-PFS thuật toán phân cụm mờ khác Tuy nhiên, mơ hình đề xuất tồn số hạn chế thời gian tính tốn lớn Ngoài ra, số cụm phương án giảm từ số cụm định tăng lại Nói cách khác, trường hợp xảy số lượng cụm thực tế thường nhỏ nhiều số phần tử tập liệu 3.1.3 Thực nghiệm số Ở phần này, thuật toán đề xuất AFC-PFS cài đặt bên cạnh thuật tốn GA phương pháp cắt tỉa, phương pháp khơng tham số (NPM) phương pháp quét thuật toán CCE phương pháp tiền xử lý Để kiểm tra tác động việc sử dụng ASWC việc đo chất lượng phân cụm, AFC-PFS cài đặt với hai biến thể sử dụng số đánh giá khác WGLI PBM Các kết thực nghiệm cho thấy thuật toán đề xuất cho số lượng cụm gần với số lượng cụm mặc định liệu Đồng thời, thời gian chạy AFC-PFS chí cịn nhanh số thuật tốn khác 3.2 Thuật toán phân cụm mờ với liệu phức tạp 3.2.1 Độ đo cho thuộc tính kiểu loại Giả sử ( ) khoảng cách phẩn tử - thuộc tính ( , , ) Nếu thuộc tính liệu số, ( ) tính dựa theo cơng thức tính khoảng cách Euclid Nếu liệu kiểu loại khoảng cách tính phương trình (16) ( ) { (16) Dữ liệu đầu vào phải chuẩn hoá đoạn [0, 1] với khoảng cách tối thiểu hai phần tử khoảng cách lớn phần tử 12 3.2.2 Thuật toán phân cụm với liệu phức tạp (PFCA-CD) Để phân vùng liệu với kiểu kết hợp cấu trúc khác biệt, thuật toán FC-PFS kết hợp với thuật toán PSO đặt tên PFCA-CD sau: Giả sử, cho tập liệu chứa liệu kết hợp số kiểu loại có cấu trúc phức tạp số cụm Thay sử dụng thao tác lặp FC-PFS, ta sử dụng bước lặp PSO Tập ban đầu PSO { } mà phương án bao gồm thành phần sau:  ( , , ): độ thuộc, độ trung lập từ chối phần tử  ( , , ): độ thuộc, độ trung lập từ chối  phần tử có chất lượng cụm tốt theo thứ tự and : tập tâm cụm tương ứng với ( , , ) ( , ) theo thứ tự ,  : giá trị chất lượng tốt mà phương án đạt Một phương án giá trị cho trước ( , , ) cố gắng thay đổi chúng để cho đạt giá trị tối ưu Giá trị tối ưu tính sau: ∑ ∑ ∑ ∑ ( )/ ‖ ( ), ‖ (17) Q trình coi kết hợp tốt giá trị fitness trạng thái hành phương án Nếu thuật toán cho kết tốt so với thuật toán liên quan khác, giải pháp tối ưu địa phương Pbest( , , , ) phương án ghi lại Sau đó, phương án cập nhật giá trị Trong việc cập nhật, ( , ) tính theo phương trình (6-7) (18-19) ( ) ( ), (18) ( , ), 13 ( ) ( ), (19) ( , ), ( , , ) giá trị tốt toàn cục Tâm cụm chọn phần tử có độ thuộc tốt vào cụm j Việc cập nhật tất phương án tiếp tục đến đạt số lần lặp định hay giá trị tối ưu tồn cục khơng đổi Chi tiết thuật tốn sau: I: O: 1: 2: 3: 4: 5: 6: Tập liệu có số phần tử ( ) khơng gian cụm ( ); ngưỡng , số mờ số bước lặp Ma trận , , tâm cụm ; t=0 ( ) Chọn tâm Tính tốn 8: Tính toán 10: 11: 12: 13: 14: 15: ; ( ) ( , ) thỏa mãn (2) Repeat t=t+1 For each phương án 7: 9: ( ) ; chiều; Số ( ) ( ( ) ( ) ) ( ; ) công thức (18) ( ; ) công thức (19) ( ) Tính tốn ( ; ) cơng thức (5) Tính tốn giá trị fitness cơng thức (17) Cập nhật giá trị Pbest Cập nhật giá trị Gbest End Until giá trị Gbest không đổi số lần lặp vượt maxSteps Output ( , , , ) = ( , , , ) Phương pháp đề xuất có số ưu điểm sử dụng nhiều tâm cụm cho cụm cụm với phần tử liệu phân tán 14 cấu trúc khơng phải hình cầu khác biệt dễ dàng biểu diễn qua tâm cụm Hơn nữa, PFCA-CD với chiến lược PSO làm nhanh trình hội tụ, đồng thời sử dụng phép đo cho giá trị thuộc tính phân loại phù hợp việc tính tốn khoảng cách hai đối tượng Tuy nhiên, phương pháp có nhược điểm PFCA-CD cho kết tốt, khơng tốt thời gian tính toán cao 3.2.3 Thực nghiệm số Thuật toán đề xuất PFCA-CD cài đặt thuật toán khác DifFuzzy [13] Dissimilarity [16] Thực nghiệm cho thấy thuật tốn PFCA-CD có chất lượng phân cụm tốt với số đánh giá so sánh với thuật toán khác Trong hầu hết trường hợp, thuật tốn đề xuất có số đánh giá có giá trị tốt 3.3 Kết luận chƣơng Chương trình bày hai cải tiến FC-PFS thuật toán tự động xác định số cụm AFC-PFS phân cụm mờ cho liệu phức tạp PFCA-CD Các cải tiến góp phần giải hạn chế FC-PFS thuật toán phân cụm mờ khác việc tự động xác định số cụm xử lý với liệu phức tạp kiểu loại lẫn cấu trúc 15 CHƢƠNG ỨNG DỤNG CỦA THUẬT TOÁN PHÂN CỤM TRÊN TẬP MỜ VIỄN CẢNH 4.1 Phƣơng pháp PFC-STAR Các chuỗi hình ảnh đầu vào thuật toán PFC-STAR trước tiên xử lý thuật toán PFC biến đổi rời rạc Fourier (DFT) FC-PFS sử dụng để chia tất điểm ảnh hình ảnh thành cụm đánh dấu chúng màu khác DFT-Filter sử dụng để loại bỏ vùng khơng dự đốn hình ảnh thay chúng thành miền Fourier Tiếp theo, kỹ thuật STAR sử dụng để dự đốn kết hình ảnh từ tất ảnh miền Fourier cụm điểm ảnh Điều nhằm mục đích tìm trọng số cho cụm điểm ảnh ảnh để xác định hình ảnh dự đoán Cuối cùng, phương pháp lọc Adaptive Median Filtering sử dụng để lọc nhiễu ảnh đầu Để nâng cao độ xác hình ảnh dự đốn, kỹ thuật STAR sử dụng hai lần để xác định huấn luyện trọng số ảnh sử dụng đầu vào STAR để tính tốn trọng số PFC-STAR có số hạn chế Đầu tiên, việc sử dụng kỹ thuật STAR dẫn đến kết đầu tốt với liệu không tốt cho tập liệu khác Thứ hai, PFC-STAR sử dụng biến đổi DFT cho việc tiền xử lý liệu biến đổi ngược DFT để tạo đầu Thời gian thực thi thủ tục thường lớn 4.2 Phƣơng pháp PFC-PFR 4.2.1 Số mờ viễn cảnh tam giác Các luật mờ viễn cảnh phát triển dựa luật mờ IFTHEN đề xuất Zadeh [70] Số mờ hình tam giác (TPFN) ) cho luật mờ viễn cảnh mô tả năm số thực ( thỏa mãn ( ) hai hàm tam giác phương trình (20-21) sau 16 { (20) , (21) { Tích hợp (20-21) với (5) biểu thị , giá trị độ trung lập độ từ chối tính phương trình (22-23) ( ( ( ) ) ) ( ( ( ) giá trị giải mờ TPFN trình (24) ( ) (22) , ) ) (23) tính phương , ∑ (24) , , trọng số giải mờ TPFN 4.2.2 Số mờ viễn cảnh hình thang Ngồi số mờ tam viễn cảnh giác trình bày trên, luận án trình bày số mờ viễn cảnh hình thang (TpPFN) cho luật mờ viễn ) với cảnh TpPFN biểu diễn sáu số thực ( ( ) hai hàm hình thang thể phương trình (25-26) sau: , { 17 (25) (26) { Đặt kết hợp với phương trình (5), giá trị độ trung lập độ từ chối tính công thức (23-24) DEF(A) giá trị giải mờ TpPFN A tính cơng thức 27 ( ) ∑ (27) , , trọng số giải mờ TpPFN 4.2.3 Chi ti t thuật tốn Thuật tốn PFC-PFR gồm có bảy bước là: tiền xử lý, phân cụm liệu, sinh luật mờ, nội suy đầu ra, huấn luyện tham số giải mờ dự đoán ảnh đầu Chi tiết bước mô tả sau: Bƣớc 1: phần tử ma trận sai khác tính theo cơng thức (28) dựa tỷ lệ khác ( ), chuỗi thời gian thứ chuỗi đầu vào ( ) thời điểm , () () ( ( ) ) (28) ( )+ chuỗi thời gian Các tỷ lệ khác * ( ) ( ) ( )+, vào * ( ) ( ) thời điểm xác * +, định dựa (130) N mẫu huấn luyện ( ) ( )+, biểu diễn * ( ) ( ) xây dựng lại Biểu diễn { ( ) ( ) ( ) } * () ( ) () () ( )+, ( ) đầu vào (đầu ra) thứ , Bƣớc 2: Thuật toán FC-PFS sử dụng để phân vùng mẫu + Tâm huấn luyên vào cụm tương ứng ( ) * 18 cụm , độ thuộc , độ trung lập độ từ chối , , Bƣớc 3: Các luật mờ viễn cảnh sử dụng TPFN (TpPFN) +, đó, luật tương ứng , tạo dựa cụm* trình bày sau Luật j: và Ở luật luật mờ tương ứng với cụm thứ , tập mờ tiền đề thứ tập mờ hệ thứ luật , ) TPFN thực ( với ( luật , , hay ( biến tiền đề , biến hệ quả, , số ) TpPFN , bên cạnh độ thuộc, độ trung lập độ từ ) chối đóng vai trị quan trọng việc xác định điểm ranh giới phù hợp đại diện cho luật Do đó, FC-PFS cho ta thêm thông tin định hướng PFR để chọn điểm thích hợp nhằm tạo luật tốt so với thuật toán phân cụm khác FCM Ở bước này, có hai tùy chọn với số mờ viễn cảnh tam giác số mờ viễn cảnh hình thang sau: a Sử dụng số mờ viễn cảnh tam giác: ) TPFN Các giá trị ( tính sau: ( ) ( ) ( ) , , ( , với ( ) ∑ ( ) ( ) , với (31) ( ) ∑ 19 ), ), ∑ , (30) , ( ∑ (29) , ( ) , (32) ∑ ∑ ( ) ( ) ∑ ( ) ∑ ( ) ( ) (33) ( ) đầu vào thứ mẫu huấn luyện , , đầu mong muốn Dựa phương trình (29-33), TPFN luật mờ xây dựng b Sử dụng số mờ viễn cảnh hình thang: Các số thực ( ) TpPFN công thức (34-39) với ( ( ) ( ) ( ( ) ( ) ( ) ), ( ) ( ) tính ) , , (34) , , (35) /, (36) / ( ) /, tâm cụm ( ) ( ) ( ) /, với với thành phần thứ (37) ∑ ( ) ( ) ∑ ∑ , ( ) (38) ( ) ∑ ( ) ∑ ( ) ∑ ∑ , ( ) , ( ) (39) ( ) ∑ ( ) 20 ( ) đầu vào thứ mẫu huấn luyện , , đầu mong muốn Dựa theo công thức (33–39), TpPFN luật mờ viễn cảnh tạo Bƣớc 4: Nếu số luật mờ viễn cảnh kích hoạt đầu vào thứ mẫu ( ) có nghĩa / , tính đầu theo cơng thức (40) di chuyển đến bước Nếu không đến bước ∑ ( ) ∑ ( ) / ( ( ) ) (40) , / / biểu thị giá trị độ thuộc đầu vào tam giác viễn cảnh , toán dựa hàm mờ viễn cảnh tam giác với ( ) thuộc tập mờ Nó tính biểu diễn số lượng ( ) giá trị giải mờ luật mờ viễn cảnh kích hoạt tập mờ viễn cảnh kết luật mờ viễn cảnh , , Bƣớc 5: Nếu không tồn luật mờ viễn cảnh hoạt động nào, tính trọng số của luật với quan sát đầu vào , theo phương trình (41) tính tốn đầu , , theo phương trình (42) vector { ( ) giá ( Euclide vectơ , vector đầu vào{ trị giải ) mờ ( )} ‖ ( ) tập ( ) luật ( ) }, mờ - ‖ khoảng cách Ràng buộc trọng số là: ∑ ( ) giá trị giải mờ (41) ∑ ( ‖ ‖ ∑ ‖ ) ‖ ( ), 21 (42) Bƣớc 6: Để có dự đốn hình ảnh tốt, thuật toán PSO sử dụng để xác định tham số thích hợp cho hàm giải mờ Theo công thức (24) cho TPFN (27) cho TpPFN, thuật tốn huấn luyện tham số cơng thức Quá trình huấn luyện ) ( ) tham số giải mờ sử dụng hai ma trận sai khác ( với vai trò kiểm tra mẫu thử mẫu đầu vào ( ) Thuật toán PSO sử dụng để tối ưu hóa tham số ( )tại thời gian Bƣớc 7: Cuối cùng, giá trị dự báo ) giá trị tính tốn dựa tỷ lệ biến đổi , ( thực tế thời điểm phương trình (146) () ( ) ( ) (43) Phương pháp PFC-PFR có số lợi sử dụng FC-PFS để phân vùng pixel khác hình ảnh giúp quy trình làm việc xác hơn, sử dụng luật mờ viễn cảnh nội suy giúp thuật tốn tăng độ xác Việc sử dụng huấn luyện tham số giải mờ với thuật tốn PSO cải thiện độ xác dự đốn hình ảnh đầu Phương pháp cho kết dự đốn hình ảnh xác so STAR nhiên thời gian tính tốn vấn cao 4.3 Kết thực nghiệm Các thuật toán cài đặt thực nghiệm sau:  Các phương pháp PFC- STAR, PFC-PFR áp dụng luật mờ viễn cảnh tam giác PFC-PFR áp dụng luật mờ viễn cảnh hình thang  PFC-STAR* PFC-PFR*: phương pháp PFC-STAR PFC-PFR mà không cần huấn luyện  FCM-STAR phương pháp Shukla, kishtawal & Pal (2014)  FCM-FR: kết hợp fuzzy C-Means (FCM) luật mờ thường (FR)  Phương pháp suy diễn mờ (FIR)  ANN sử dụng mạng nơ ron nhân tạo 22 Hai phương pháp đề xuất (PFC-PFR PFC- STAR) có lợi đáng kể so với thuật toán khác Các phương pháp đề xuất không cho kết tốt ảnh dự đoán lại hiệu cho ảnh dự đoán 4.4 Kết luận chƣơng Trong chương này, hai phương pháp dự báo lai dựa ảnh mây vệ tinh cho toán dự báo thời tiết ngắn hạn đề xuất PFC-STAR PFC-PFR Phương pháp PFC-PFR phương pháp tích hợp FC-PFS quy tắc sinh luật mờ với hai biến thể luật mờ viễn cảnh tam giác hình thang Cả hai thuật tốn đề xuất sử dụng thuật tốn huấn luyện để nâng cao độ xác dự báo Đánh giá thử nghiệm chuỗi hình ảnh vệ tinh cho thấy phương pháp đề xuất cho chất lượng tốt so với người có liên quan KẾT LUẬN Luận án đạt số kết đóng góp sau: - Đề xuất thuật toán phân cụm mờ tập mờ viễn cảnh FC-PFS Đồng thời, khảo sát tính chất hội tụ thực nghiệm kiểm chứng liệu chuẩn UCI cho thấy tính hiệu thuật toán Đề xuất thuật toán cơng bố [CT1-CT2] - Cải tiến thuật tốn FC-PFS cho toán phân cụm mờ tự động xác định số cụm toán xử lý liệu phức tạp Đây thuật toán lai ghép FC-PFS thuật toán tối ưu bầy đàn PSO Thực nghiệm kiểm chứng cho thây thuật toán cho kết tốt thuật toán khác liên quan Kết nghiên cứu công bố [CT3CT4] - Ứng dụng FC-PFS vào toán dự báo thời tiết ngắn hạn dựa ảnh mây vệ tinh Luận án đưa hai phương pháp kết hợp FC-PFS với STAR kết hợp với luật mờ 23 viễn cảnh Luật mờ viễn cảnh luật mờ trình bày luận án sinh kết FCPFS, dựa số mờ tam giác hay hình thang để suy luận kết đầu dự báo Các thực nghiệm ảnh mây vệ tinh cho thấy tính hiệu phương pháp Kết nghiên cứu công bố [CT5] Bên cạnh kết nghiên cứu đạt được, nghiên cứu luận án tồn số hạn chế như: - Do thuật toán phân cụm mờ tập mờ viễn cảnh có nhiều tham số trình tính tốn, cần tài ngun nhớ lớn - Do thuật toán phân cụm mờ tập mờ viễn cảnh thuật toán lặp nên cần nhiều thời gian để tính tốn - Bài tốn dự báo thời tiết ngắn hạn, luận án đưa cách tiếp cận dựa ảnh mây tinh mà chưa xét đến yếu tốt khác thời tiết nhiệt độ, tốc độ gió, độ ẩm, … dẫn đến kết dự báo chưa tốt Hướng phát triển nghiên cứu luận án tập trung vào số điểm sau: - Cải tiến thuật tốn có để giảm thiểu nhớ sử dụng, đồng thời tăng tốc độ tính tốn áp dụng tính tốn mơ hình song song, mơ hình tính tốn phân tán để đạt hiệu cao - Kết hợp thêm yếu tố thời tiết nhiệt độ, độ ẩm, hướng gió, … cho tốn dự báo thời tiết ngắn hạn để có dự báo xác 24 DANH MỤC CÁC CƠNG TRÌNH KHOA HỌC CỦA TÁC GIẢ ĐÃ CÔNG BỐ [CT1] Pham Huy Thong, Le Hoang Son (2016), “Picture fuzzy clustering: a new computational intelligence method,” Soft Computing 20(9), 3549-3562 (SCIE, 2018, IF= 2.784, Springer) [CT2] Pham Thi Minh Phuong, Pham Huy Thong, Le Hoang Son (2018), “Theoretical analysis of picture fuzzy clustering: Convergence and property”, Journal of Computer Science and Cybernetics 34(1), 17-32 [CT3] Pham Huy Thong, Le Hoang Son (2016), “A novel automatic picture fuzzy clustering method based on particle swarm optimization and picture composite cardinality”, Knowledge-Based Systems 109, 48-60 (SCI, 2018, IF=5.101, Elservier) [CT4] Pham Huy Thong, Le Hoang Son (2016), “Picture fuzzy clustering for complex data”, Engineering Applications of Artificial Intelligence 56, 121-130 (SCIE, 2018, IF=3.526, Elservier) [CT5] Le Hoang Son, Pham Huy Thong (2017), “Some novel hybrid forecast methods based on picture fuzzy clustering for weather nowcasting from satellite image sequences”, Applied Intelligence 46(1), 1-15 (SCIE, 2018, IF= 2.882, Springer) ... ràng thuật tốn phân cụm dựa PFS Chính việc phát triển thuật tốn phân cụm mờ PFS nâng cao độ xác phân cụm Hiện thuật toán phân cụm mờ tập mờ viễn cảnh dừng lại việc đưa số độ đo kết hợp sử dụng phân. .. dụng cho số ứng dụng dự báo tương lai CHƢƠNG MỘT SỐ CẢI TIẾN CỦA THUẬT TOÁN PHÂN CỤM MỜ TRÊN TẬP MỜ VIỄN CẢNH 3.1 Thuật toán phân cụm mờ tự động xác định số cụm 3.1.1 Ý Tưởng thuật toán Trong... luận án tồn số hạn chế như: - Do thuật toán phân cụm mờ tập mờ viễn cảnh có nhiều tham số q trình tính tốn, cần tài nguyên nhớ lớn - Do thuật toán phân cụm mờ tập mờ viễn cảnh thuật toán lặp nên

Ngày đăng: 12/12/2020, 23:34

Từ khóa liên quan

Tài liệu cùng người dùng

Tài liệu liên quan