Nghiên cứu ứng dụng thuật toán ANFIS vào bài toán dự báo trên dữ liệu chuỗi thời gianNghiên cứu ứng dụng thuật toán ANFIS vào bài toán dự báo trên dữ liệu chuỗi thời gianNghiên cứu ứng dụng thuật toán ANFIS vào bài toán dự báo trên dữ liệu chuỗi thời gianNghiên cứu ứng dụng thuật toán ANFIS vào bài toán dự báo trên dữ liệu chuỗi thời gianNghiên cứu ứng dụng thuật toán ANFIS vào bài toán dự báo trên dữ liệu chuỗi thời gianNghiên cứu ứng dụng thuật toán ANFIS vào bài toán dự báo trên dữ liệu chuỗi thời gianNghiên cứu ứng dụng thuật toán ANFIS vào bài toán dự báo trên dữ liệu chuỗi thời gianNghiên cứu ứng dụng thuật toán ANFIS vào bài toán dự báo trên dữ liệu chuỗi thời gianNghiên cứu ứng dụng thuật toán ANFIS vào bài toán dự báo trên dữ liệu chuỗi thời gianNghiên cứu ứng dụng thuật toán ANFIS vào bài toán dự báo trên dữ liệu chuỗi thời gianNghiên cứu ứng dụng thuật toán ANFIS vào bài toán dự báo trên dữ liệu chuỗi thời gianNghiên cứu ứng dụng thuật toán ANFIS vào bài toán dự báo trên dữ liệu chuỗi thời gianNghiên cứu ứng dụng thuật toán ANFIS vào bài toán dự báo trên dữ liệu chuỗi thời gianNghiên cứu ứng dụng thuật toán ANFIS vào bài toán dự báo trên dữ liệu chuỗi thời gianNghiên cứu ứng dụng thuật toán ANFIS vào bài toán dự báo trên dữ liệu chuỗi thời gianNghiên cứu ứng dụng thuật toán ANFIS vào bài toán dự báo trên dữ liệu chuỗi thời gianNghiên cứu ứng dụng thuật toán ANFIS vào bài toán dự báo trên dữ liệu chuỗi thời gianNghiên cứu ứng dụng thuật toán ANFIS vào bài toán dự báo trên dữ liệu chuỗi thời gianNghiên cứu ứng dụng thuật toán ANFIS vào bài toán dự báo trên dữ liệu chuỗi thời gianNghiên cứu ứng dụng thuật toán ANFIS vào bài toán dự báo trên dữ liệu chuỗi thời gianNghiên cứu ứng dụng thuật toán ANFIS vào bài toán dự báo trên dữ liệu chuỗi thời gianNghiên cứu ứng dụng thuật toán ANFIS vào bài toán dự báo trên dữ liệu chuỗi thời gianNghiên cứu ứng dụng thuật toán ANFIS vào bài toán dự báo trên dữ liệu chuỗi thời gianNghiên cứu ứng dụng thuật toán ANFIS vào bài toán dự báo trên dữ liệu chuỗi thời gianNghiên cứu ứng dụng thuật toán ANFIS vào bài toán dự báo trên dữ liệu chuỗi thời gianNghiên cứu ứng dụng thuật toán ANFIS vào bài toán dự báo trên dữ liệu chuỗi thời gian
Trang 1BỘ CÔNG THƯƠNG
TRƯỜNG ĐẠI HỌC CÔNG NGHIỆP HÀ NỘI
-HOÀNG THĂNG LONG
NGUYÊN CỨU ỨNG DỤNG MÔ HÌNH ANFIS VÀO BÀI TOÁN DỰ BÁO TRÊN DỮ LIỆU CHUỖI THỜI GIAN
ĐỀ ÁN TỐT NGHIỆP THẠC SĨ HỆ THỐNG THÔNG TIN
Hà Nội – 2024
Trang 2BỘ CÔNG THƯƠNG
TRƯỜNG ĐẠI HỌC CÔNG NGHIỆP HÀ NỘI
-HOÀNG THĂNG LONG
NGUYÊN CỨU ỨNG DỤNG MÔ HÌNH ANFIS VÀO BÀI TOÁN DỰ BÁO TRÊN DỮ LIỆU CHUỖI THỜI GIAN
Ngành Hệ thống thôngtin Mã số: 8480104
ĐỀ ÁN TỐT NGHIỆP THẠC SĨ HỆ THỐNG THÔNG TIN
NGƯỜI HƯỚNG DẪN KHOA HỌC:
1 TS ĐẶNG TRỌNG HỢP
Hà Nội – 2024
Trang 3MỤC LỤC
MỤC LỤC i
LỜI CAM ĐOAN iii
DANH MỤC CÁC KÝ HIỆU, CÁC CHỮ VIẾT TẮT iv
DANH MỤC CÁC BẢNG v
DANH MỤC CÁC HÌNH vi
MỞ ĐẦU 1
CHƯƠNG 1 TỔNG QUAN LOGIC MỜ VÀ MẠNG NƠ-RON NHÂN TẠO 4
1.1 TỔNG QUAN LOGIC MỜ 4
1.1.1 Tập mờ (Ying, 2000) 4
1.1.2 Các phép toán đại số trên tập mờ (Ying, 2000) 4
1.1.3 Logic mờ (Jang, J.-S R.; Sun, C.-T.; Mizutani, E., 1997) 6
1.2 TỔNG QUAN MẠNG NƠ-RON NHÂN TẠO 11
1.2.1 Tế bào nơron 13
1.2.2 Các loại mô hình cấu trúc mạng nơ-ron 17
1.2.3 Các tính chất của mạng nơ-ron 18
1.2.4 Các nguyên tắc học 19
1.2.5 Thuật toán lan truyền ngược 22
CHƯƠNG 2 THUẬT TOÁN ANFIS VÀ BÀI TOÁN DỰ BÁO DỮ LIỆU CHUỖI THỜI GIAN 25
2.1 BÀI TOÁN DỰ BÁO 25
2.1.1 Khái niệm 25
2.1.2 Đặc điểm 25
Trang 42.1.3 Các phương pháp 26
2.2 THUẬT TOÁN ANFIS 29
2.2.1 Giới thiệu sơ lược về mô hình nơron - mờ (Jang, 1993) 29
2.2.2 Luật mờ if-then và hệ suy diễn mờ (Jang, 1993) 31
2.2.3 Mạng thích nghi 34
2.2.4 Cấu trúc của ANFIS (Jang, J.-S R.; Sun, C.-T.; Mizutani, E., 1997) 35
2.2.5 Thuật toán huấn luyện hệ ANFIS 37
2.2.6 Ứng dụng của thuật toán ANFIS 38
2.3 DỮ LIỆU CHUỖI THỜI GIAN 40
2.3.1 Giới thiệu dữ liệu chuỗi thời gian 40
2.3.2 Một số phương pháp dự báo chuỗi thời gian đơn giản 41
CHƯƠNG 3 ỨNG DỤNG THUẬT TOÁN ANFIS VÀO BÀI TOÁN DỰ BÁO DỮ LIỆU CHUỖI THỜI GIAN 45
3.1 MÔ TẢ BÀI TOÁN (El-Shafie, A.; Jaafer, O.; Seyed, A, 2011) 45
3.2 XÂY DỰNG MÔ HÌNH (Bằng, 2018) 46
3.2.1 Biến đầu ra 46
3.2.2 Lựa chọn biến đầu vào 46
3.2.3 Cấu trúc mô hình dự báo 47
3.3 THU THẬP DỮ LIỆU 48
3.4 CHỈ SỐ ĐÁNH GIÁ 50
3.5 KẾT QUẢ THỬ NGHIỆM 52
3.6 ĐÁNH GIÁ 57
KẾT LUẬN 58
TÀI LIỆU THAM KHẢO 59
Trang 5LỜI CAM ĐOAN
Tôi xin cam đoan rằng đề án thạc sĩ Hệ thống thông tin “Nghiên cứuứng dụng thuật toán ANFIS vào bài toán dự báo trên dữ liệu chuỗi thời gian”
là công trình nghiên cứu của tôi dưới sự hướng dẫn của TS Đặng TrọngHợp
Toàn bộ nội dung được trình bày trong đề án này hoặc là đến từ sự tìmhiểu nghiên cứu của tôi hoặc là tổng hợp, thu thập từ các tài liệu khác nhauđều được trích dẫn đầy đủ trong phần tài liệu tham khảo Các tài liệu thamkhảo này được sử dụng một cách hợp lý và minh bạch Tôi xin cam đoanrằng không có bất cứ vi phạm nào đối với các quy định đạo đức nghiên cứukhoa học trong quá trình thực hiện dự án
Tôi xin hoàn toàn chịu trách nhiệm và chịu mọi hình thức kỷ luật theoquy định về tính chính xác và trung thực của đề án nghiên cứu này
Hà Nội, ngày tháng năm 2024
Tác giả đề án
Trang 6DANH MỤC CÁC KÝ HIỆU, CÁC CHỮ VIẾT TẮT
AI Artificial Intelligence Trí tuệ nhân tạo
ANN Artificial Neural Network Mạng Nơ-ron nhân tạo
ANFIS Adaptive-Network-based
Fuzzy Inference System
Mạng thích nghi dựa trên cơ sở
hệ suy luận mờ
MIMO Multi Input Multi Output Nhiều đầu vào – nhiều đầu raMISO Multi Input Single Output Nhiều đầu vào – một đầu ra
CORR Correlation Coefficient Hệ số tương quan
Trang 7DANH MỤC CÁC BẢNG
Bảng 1.1 So sánh bộ não con người với phương pháp học của mạng nơron
nhân tạo 21
Bảng 2.1 So sánh mạng nơron và logic mờ 30
Bảng 3.1 Kết quả chỉ số đánh giá lượng mưa vụ 1 tháng 53
Bảng 3.2 Kết quả chỉ số đánh giá lượng mưa vụ 3 tháng 55
Bảng 3.3 Kết quả chỉ số đánh giá lượng mưa vụ 6 tháng 56
Trang 8DANH MỤC CÁC HÌNH
Hình 1.1 Hợp của hai tập mờ A và B 5
Hình 1.2 Giao của hai tập mờ A và B 5
Hình 1.3 Phần bù của tập hợp A 6
Hình 1.4 Kiến trúc của hệ mờ tổng quát 7
Hình 1.5 Hệ mờ nhiều đầu vào – một đầu ra 8
Hình 1.6 Tế bào nơron sinh học 12
Hình 1.7 Mạng nơron nhân tạo 12
Hình 1.8 Tế bào nơron nhân tạo 13
Hình 1.9 Các dạng hàm tác động thông dụng 15
Hình 1.10 Mô hình tế bào nơron 15
Hình 1.11 Ví dụ 16
Hình 1.12 Các loại mạng nơron nhân tạo thông dụng 18
Hình 1.13 Học có giám sát 19
Hình 1.14 Học củng cố 20
Hình 1.15 Học không giám sát 20
Hình 1.16 Sơ đồ tổng quát một tế bào nơron nhân tạo trong huấn luyện 21
Hình 1.17 Kiến trúc của mạng nơron lan truyền ngược 22
Hình 2.1 Dự báo định tính và dự báo định lượng 27
Hình 2.2 Hệ thống suy luận mờ 32
Hình 2.3 Mạng thích nghi 35
Hình 2.4 Cấu trúc thuật toán ANFIS 35
Hình 2.5 Phân loại các phương pháp dự báo chuỗi thời gian 41
Hình 3.1 Cấu trúc dữ liệu 49
Hình 3.2 Kết quả dự báo lượng mưa vụ 1 tháng của M1-M5 52
Hình 3.3 Kết quả dự báo lượng mưa vụ 3 tháng của M1-M5 54
Hình 3.4 Kết quả dự báo lượng mưa vụ 6 tháng của M1-M5 56
Trang 9dữ liệu chuỗi thời gian Các dữ liệu chuỗi thời gian như thời tiết, chứngkhoán, lượng điện tiêu thụ, lượng mưa, cần được dự báo để phân tích,đánh giá, đưa ra quyết định quản lý kịp thời.
Trong những năm gần đây, diễn biến về thời tiết rất phức tạp đượcquan tâm và nghiên cứu nhiều trong đó có lưu lượng mưa các khu vực phục
vụ cho các hoạt động phát triển kinh tế như: kế hoạch sản xuất nông nghiệp,
du lịch, đánh bắt và nuôi trồng thủy sản, quản lý, khai thác nguồn tài nguyênnước,… Việc dự đoán lượng mưa trong khu vực cho phép tính toán lượngnước để tưới tiêu, lập kế hoạch cho các hồ chứa nước bên cạnh đó phòngtránh giảm nhẹ thiên tai do lượng mưa lớn nếu có,
Việc áp dụng thuật toán ANFIS cho các vấn đề dự án trên dữ liệu chuỗithời gian đã trở thành một chủ đề quan trọng ngày nay Điều này là do sự pháttriển của các tập dữ liệu lớn và nhu cầu đưa ra dự đoán chính xác trong cáclĩnh vực như tài chính, kinh tế, y tế và kỹ thuật Thuật toán ANFIS rất thíchhợp để phân tích dữ liệu chuỗi thời gian do khả năng mô hình hóa mối quan
hệ phi tuyến phức tạp giữa các biến đầu vào và đầu ra
Trang 10Neuro-ANFIS là một mô hình lai kết hợp các điểm mạnh của logic mờ và mạng ron, làm cho nó trở thành một mô hình hiệu quả để dự đoán và phân tích dữliệu chuỗi thời gian.
nơ-Thuật toán ANFIS đã được áp dụng cho nhiều vấn đề phân tích dữ liệuchuỗi thời gian trong quá khứ Một số ứng dụng phổ biến bao gồm dự báo giá
cổ phiếu, dự đoán lưu lượng giao thông và phân tích các mô hình thời tiết.Tuy nhiên, vẫn còn rất nhiều tiềm năng để khám phá của thuật toán ANFIStrong phân tích dữ liệu chuỗi thời gian
Việc nghiên cứu ứng dụng thuật toán ANFIS trong phân tích dữ liệuchuỗi thời gian là rất quan trọng trong nhiều lĩnh vực Với sự phát triển củacác công nghệ thông tin, việc phân tích dữ liệu chuỗi thời gian đã trở nênquan trọng hơn Việc sử dụng thuật toán ANFIS sẽ giúp cho việc phân tích và
dự đoán dữ liệu chuỗi thời gian trở nên chính xác hơn, đồng thời cũng có thểgiúp giảm thiểu các sai số và tối ưu hóa kết quả
Tóm lại, đề tài "Nghiên cứu ứng dụng thuật toán ANFIS vào bài toán
dự báo trên dữ liệu chuỗi thời gian" sẽ tập trung vào việc phân tích và dựđoán dữ liệu chuỗi thời gian bằng cách sử dụng thuật toán ANFIS Đây là mộtchủ đề quan trọng và đầy tiềm năng trong nghiên cứu khoa học và cũng cótầm quan trọng lớn trong các lĩnh vực thực tiễn như tài chính, kinh tế, y tế và
kỹ thuật
3. Tính cấp thiết của đề tài
Dự báo là một lĩnh vực kết hợp giữa khoa học và nghệ thuật, nhằm tiênđoán những sự kiện sẽ xảy ra trong tương lai dựa trên phân tích các dữ liệuthu thập được Có hai loại cơ bản của kỹ thuật dự báo:
- Kỹ thuật dự báo định tính: Dựa trên các ý kiến, đánh giá, quan điểm,trực giác hay kinh nghiệm của chuyên gia để đưa ra dự báo về các sự kiện,kết
Trang 11quả, hoặc trạng thái có tính chất định tính, chẳng hạn như dự báo xu hướng,
dự báo thị trường, hoặc dự báo về sự thành công của một dự án
- Kỹ thuật dự báo định lượng: Dựa trên các phương pháp thống kê đểphân tích dữ liệu lịch sử và đưa ra dự báo về các giá trị cụ thể hoặc các biến
số có tính chất định lượng, chẳng hạn như dự báo doanh số bán hàng, dự báosản lượng, hoặc dự báo giá cả
Kỹ thuật định tính được sử dụng khi dữ liệu quá khứ không đầy đủ hayđối tượng dự báo bị ảnh hưởng bởi những nhân tố không thể lượng hóa
Kỹ thuật dự báo định lượng dựa trên việc phân tích dữ liệu lịch sử đểxây dựng và mô hình hóa động thái diễn biến của đối tượng theo một mô hìnhtoán học, từ đó sử dụng mô hình này để dự báo xu hướng tương lai của đốitượng đó
Các nghiên cứu xây dựng mô hình dựa trên luật mờ (hay còn gọi là môhình mờ - fuzzy models) là một trong những phương pháp tiếp cận được sửdụng để xây dựng các hệ thống hỗ trợ dự báo và dự báo điều khiển Trong số
đó, thuật toán ANFIS (Adaptive-Network-based Fuzzy Inference System) làmột trong những mô hình mờ được nghiên cứu và ứng dụng mạnh mẽ, đã đạtđược nhiều kết quả tốt
Hầu hết các nguồn cung cấp dữ liệu trên toàn cầu đều là dữ liệu chuỗithời gian, và lượng dữ liệu này đang tăng dần theo cấp số nhân Bài toán dựbáo dữ liệu chuỗi thời gian được sử dụng rộng rãi trong nhiều lĩnh vực khácnhau, bao gồm dự báo thời tiết, dự báo giá cổ phiếu, dự báo sản lượng sảnxuất và tiêu thụ, dự báo lượng điện cần tải cho thành phố, dự báo sự biến đổicủa năng lượng mặt trời, và nhiều lĩnh vực khác Dữ liệu chuỗi thời gian cungcấp một cơ sở dữ liệu đa dạng, phong phú và phức tạp để phân tích, mô hìnhhóa và dự báo xu hướng tương lai, cung cấp thông tin quan trọng để hỗ trợquyết định trong các lĩnh vực trên
Trang 12CHƯƠNG 1 TỔNG QUAN LOGIC MỜ VÀ MẠNG NƠ-RON NHÂN
"trẻ", "nhanh", "cao-thấp", "xinh đẹp" Tính chất chính của tập mờ là có độthuộc, biểu thị mức độ mà một phần tử thuộc vào tập đó
Tập mờ có ứng dụng trong nhiều lĩnh vực như trí tuệ nhân tạo, hệthống điều khiển, ra quyết định và nhận dạng mẫu Lô-gic mờ, phát triển từ lýthuyết tập mờ, cũng có ứng dụng rộng rãi trong lý luận hợp lý và các lĩnh vựckhác
Tóm lại, tập mờ là một công cụ quan trọng để mô hình hóa sự khôngchắc chắn và mơ hồ trong các khái niệm dựa trên ngôn ngữ, giúp tạo ra quyếtđịnh và giải quyết vấn đề hiệu quả hơn
1.1.2 Các phép toán đại số trên tập mờ (Ying, 2000)
Các phép toán trên tập mờ được định nghĩa thông qua các hàm thuộc
và được xây dựng tương tự như các phép toán trong lý thuyết tập mờ kinhđiển, bao gồm tập con, phép giao, phép hợp và phép lấy phần bù
Tập con: Hai tập mờ A và B bằng nhau khi hàm thuộc của chúng bằng
nhau cho mọi phần tử trong không gian Tập mờ A là tập con của B nếuhàm thuộc của A không lớn hơn hàm thuộc của B tại mọi điểm trongkhông gian
Phép hợp: Hợp của hai tập mờ A và B được xác định bằng cách chọn
giá trị lớn nhất từ hàm thuộc của A và B tại mỗi điểm trong không gian
Trang 13Đồ thị hàm thuộc của hợp mờ A, B và tập mờ A B đƣợc cho trong hìnhsau:
Hình 1.1 Hợp của hai tập mờ A và B
Phép giao: Giao của hai tập mờ A và B đƣợc xác định bằng cách chọn
giá trị nhỏ nhất từ hàm thuộc của A và B tại mỗi điểm trong không gian
Đồ thị hàm thuộc của hợp mờ A, B và tập mờ A B đƣợc cho trong hình sau:
Hình 1.2 Giao của hai tập mờ A và B
Trang 14 Phép lấy phần bù: Phần bù của tập mờ A là tập mờ chứa các phần tử
không thuộc A, được xác định bằng cách lấy giá trị bù của hàm thuộccủa A
Đồ thị hàm thuộc của tâp mờ A và tập mờ như sau:
Hình 1.3 Phần bù của tập hợp A
1.1.3 Logic mờ (Jang, J.-S R.; Sun, C.-T.; Mizutani, E., 1997)
Logic mờ là một phương pháp tổng hợp để giải quyết các vấn đề trongmột hệ thống điều khiển hoặc một mô hình hệ thống Nó xây dựng trên cácnguyên tắc về tư duy mờ và giải quyết các vấn đề bằng cách sử dụng cácphương pháp mờ, chẳng hạn như lý luận mờ, điều khiển mờ và định lý mờ
Logic mờ là một trong những công nghệ quan trọng trong lĩnh vực điềukhiển và tự động hóa, đặc biệt là trong các ứng dụng của tự động hóa và điềukhiển trong các hệ thống nhúng Nó có thể được sử dụng để xây dựng các môhình hệ thống, để giải quyết các vấn đề về điều khiển hoặc để xác định cácthuật toán điều khiển tốt nhất cho các hệ thống cụ thể
Logic mờ được sử dụng vì nó giúp phân tích và giải quyết các vấn đềcủa hệ thống có hạn chế một cách rõ ràng và dễ hiểu Nó cũng cho phép pháttriển các giải pháp tốt cho các vấn đề, và cung cấp một cách để đánh giá vàxác định sự hiệu quả của các giải pháp
Trang 151.1.3.1. Kiến trúc của hệ mờ
Hình 1.4 Kiến trúc của hệ mờ tổng quát
Trong hệ điều khiển mờ, cơ sở luật mờ là trung tâm, chứa các luật then biểu diễn tri thức của chuyên gia Bộ suy diễn mờ kết hợp các luật và ápdụng chúng vào tập mờ đầu vào để xác định tập mờ đầu ra Dữ liệu đầu vào
if-từ các cảm biến được số hóa và chuyển đổi thành tập mờ qua quá trình mờhóa trước khi được xử lý bởi bộ suy diễn mờ Đầu ra từ bộ suy diễn mờ là tập
mờ, cần được chuyển đổi thành giá trị số thông qua quá trình giải mờ trướckhi đưa vào các cơ quan chấp hành như tay máy, công tắc, van điều khiển
Trong hệ điều khiển mờ, chúng ta tập trung vào làm việc với các biến
số, xem hệ mờ như làm việc với các biến số và tín hiệu số Hệ mờ có thể nhậnđầu vào là một vector nhiều chiều và cho ra một vector đầu ra nhiều chiều,được gọi là hệ mờ nhiều đầu vào, nhiều đầu ra (MIMO) Nếu số chiều đầu ra
là 1, ta có một hệ mờ nhiều đầu vào, một đầu ra (MISO) Một hệ mờ nhiềuđầu vào, nhiều đầu ra có thể phân tách thành nhiều hệ mờ nhiều đầu vào, mộtđầu ra Do đó, khi nói về hệ mờ nhiều đầu vào, một đầu ra, ta ngầm hiểu làmột hệ mờ nhiều đầu vào, một đầu ra với các biến số Ta có mô hình hệ mờnhiều đầu vào, một đầu ra như hình vẽ
Trang 16Hình 1.5 Hệ mờ nhiều đầu vào – một đầu ra
a) Cơ sở luật mờ
Cơ sở luật mờ của hệ mờ n đầu vào, một đầu ra bao gồm m luật if-then
mờ chuẩn tắc Mỗi luật có dạng "Nếu x1 thuộc A1 và x2 thuộc A2 và và xnthuộc An thì y thuộc B", trong đó các Ai và B là các tập mờ Có các phươngpháp để xác định các luật mờ như tham khảo chuyên gia, quan sát thựcnghiệm và kết hợp các phương pháp khác nhau Quá trình này là phức tạp vàphụ thuộc vào ngữ cảnh và mục tiêu của hệ mờ
b) Bộ suy diễn mờ
Trong trường hợp MISO với m luật if-then mờ chuẩn tắc, ta có thể sửdụng phương pháp suy diễn max-min hoặc max-tích để thiết kế bộ suy diễn.Phương pháp suy diễn max-min chọn giá trị lớn nhất từ các giá trị nhỏ nhấtcủa mức độ thuộc trong các luật Trái lại, phương pháp suy diễn max-tích tínhtoán giá trị đầu ra bằng cách nhân các giá trị mức độ thuộc và chọn giá trị lớnnhất Lựa chọn giữa hai phương pháp phụ thuộc vào yêu cầu và tính chất cụthể của bài toán
c) Bộ mờ hóa
Quá trình mờ hóa biến đổi một vector x = (x1, x2, , xn) U Rn thànhmột tập mờ A′ trên U, đồng thời A′ phản ánh tính gần đúng của dữ liệu vàmang lại hiệu quả tính toán cho bộ suy diễn
Trang 17Các phương pháp mờ hóa thông dụng bao gồm:
Mờ hóa bằng hàm tam giác: Biến đổi x thành một tập mờ A′ có hình dạng tam giác
Mờ hóa bằng hàm hình thang: Biến đổi x thành một tập mờ A′ có hình dạng hình thang
Mờ hóa bằng hàm hình chuông: Biến đổi x thành một tập mờ A′ có hình dạng hình chuông
Mờ hóa bằng hàm hình chuông Gauss: Biến đổi x thành một tập mờ A′
d) Bộ giải mờ
Giải mờ là quá trình chọn ra một giá trị cụ thể từ một tập mờ trên miềngiá trị đầu ra của hệ mờ Mục tiêu là chọn giá trị đại diện tốt nhất cho tập mờ
đó, đảm bảo độ thuộc cao nhất và nằm gần trung tâm của tập
Các phương pháp giải mờ thông dụng bao gồm:
Giải mờ bằng giá trị trung bình: Xác định điểm y bằng trung bình trọng
số của các giá trị trong tập mờ
Giải mờ bằng phép cắt: Xác định điểm y bằng điểm cắt giữa tập mờ và một ngưỡng xác định
Giải mờ bằng giá trị cao nhất: Xác định điểm y bằng giá trị cao nhất trong tập mờ
Giải mờ bằng trung vị: Xác định điểm y bằng giá trị trung vị của tập mờ
Trang 18Lựa chọn phương pháp giải mờ phụ thuộc vào bối cảnh và yêu cầu cụthể của vấn đề, để đạt được tính chính xác và hiệu quả trong việc xác định giátrị y từ tập mờ và đảm bảo tính liên tục trong quá trình giải mờ.
1.1.3.2. Các khái niệm cơ bản
Thủ tục mờ là quy trình xử lý đầu vào và đầu ra sử dụng phép tính vàquy tắc mờ để tạo ra kết quả mờ Trong quá trình này, các giá trị đầu vàođược xử lý để tạo ra các giá trị đầu ra tương ứng, dựa trên các hàm mờ vàquy tắc mờ
Hàm mờ là hàm đầu vào-đầu ra dùng để tính toán kết quả mờ, sử dụngcác giá trị mờ để biểu diễn mức độ thuộc của giá trị vào một tập mờ cụ thể
Trọng số mờ là giá trị mờ dùng để xác định sự quan trọng của một yếu
tố đầu vào đối với kết quả đầu ra trong quá trình suy diễn mờ
Đầu vào mờ là giá trị đầu vào có giới hạn, biểu diễn mức độ thuộc củagiá trị vào các tập mờ khác nhau, giúp biểu diễn tính mờ và không chắc chắncủa dữ liệu
Đầu ra mờ là giá trị đầu ra tính toán bởi thủ tục mờ, được biểu diễnbằng các hàm mờ, phản ánh tính gần đúng của kết quả và mức độ thuộc vàocác tập mờ
Bảng mờ là bảng dữ liệu liệt kê các giá trị mờ của đầu vào và đầu ra,cùng với các trọng số mờ tương ứng, thường được sử dụng để biểu diễn quytắc mờ và quan hệ giữa các biến
Quy tắc mờ là cấu trúc dùng để liệt kê các điều kiện và kết luận mờ,xác định mối quan hệ giữa các biến đầu vào và đầu ra trong quá trình suy diễnmờ
Mạng mờ là cấu trúc gồm các thủ tục mờ và quy tắc mờ, giúp giảiquyết các vấn đề phức tạp trong trí tuệ nhân tạo và xử lý thông tin mờ, bằngcách lan truyền đầu vào qua các lớp để tạo ra kết quả mờ cuối cùng
Trang 191.1.3.3. Ứng dụng của Logic mờ
Trong khoa học, Logic mờ được áp dụng rộng rãi trong nhiều lĩnh vựcnhư trí tuệ nhân tạo, xử lý dữ liệu, học máy và học cụ thể Logic mờ cung cấpkhả năng biểu diễn tính mờ và không chắc chắn của thông tin, giúp mô hình
có khả năng xử lý và suy diễn dựa trên dữ liệu mờ và quy tắc mờ Điều nàyrất hữu ích khi mô hình phải đối mặt với dữ liệu không chính xác, nhiễu hoặckhông rõ ràng
Trong lĩnh vực điều khiển, Logic mờ được sử dụng để xử lý các thôngtin mờ và tạo ra các kết luận chính xác Các hệ thống điều khiển mờ có khảnăng điều chỉnh linh hoạt dựa trên mức độ thuộc mờ và quy tắc mờ, cho phépđiều khiển hiệu quả trong các môi trường không chắc chắn hoặc phức tạp
Trong lĩnh vực thị trường tài chính, Logic mờ được sử dụng để đánhgiá và xử lý các thông tin tài chính mờ Logic mờ có thể giúp đưa ra quyếtđịnh đầu tư dựa trên sự phân tích mờ và không chắc chắn của dữ liệu thịtrường, từ đó đảm bảo tính chính xác và hiệu quả của các quyết định tài
chính.Trong lĩnh vực y tế, Logic mờ được áp dụng để xử lý và đánh giá các
dữ liệu y tế mờ Hệ thống y tế mờ có khả năng đưa ra chẩn đoán và quyếtđịnh điều trị dựa trên tính mờ và không chắc chắn của thông tin y tế, giúp cảithiện độ chính xác và hiệu quả trong quá trình chẩn đoán và điều trị bệnh
Ngoài các ứng dụng trên, Logic mờ còn được áp dụng trong rất nhiềulĩnh vực khác như công nghệ, năng lượng, xuất nhập khẩu và cảnh báo chấtlượng Sự linh hoạt và khả năng xử lý thông tin mờ của Logic mờ giúp nângcao hiệu quả và chính xác trong việc giải quyết các vấn đề phức tạp và khôngchắc chắn trong các lĩnh vực này
1.2 TỔNG QUAN MẠNG NƠ-RON NHÂN TẠO
Trang 20Bộ não con người là hệ thống xử lý thông tin phức tạp và phi tuyến, có khả năng học tập, lưu trữ thông tin và tổng quát hóa Nó bao gồm khoảng 10
tế bào thần kinh nơron, kết nối với nhau thông qua khớp thần kinh để truyềntín hiệu điều tiết Mỗi tế bào nơron có cấu trúc bao gồm soma, dendrite vàaxon, và có khoảng 1011
4 khớp thần kinh, bao gồm khớp nối kích thích và khớp nối ức chế
Hình 1.6 Tế bào nơron sinh học
Tế bào nơron truyền tín hiệu qua các dây thần kinh bằng cách giảiphóng chất hóa học tại các kết nối giữa chúng Khi điện thế đạt đến ngưỡngnhất định, sẽ phát sinh một xung điện, gửi tín hiệu qua các dây thần kinh ra.Mạng nơron nhân tạo là một mô hình toán học của bộ não con người, đượcxây dựng dựa trên cấu trúc của mạng tính toán phân bố song song Để sửdụng mạng nơron hiệu quả, thường cần phải huấn luyện trước
Hình 1.7 Mạng nơron nhân tạo
Trang 21Mạng nơron có ba thành phần chính: lớp dữ liệu đầu vào, lớp ẩn và lớp
dữ liệu đầu ra Lớp ẩn chuyển đổi dữ liệu từ lớp trước đó cho lớp xử lý tiếptheo Có thể có nhiều lớp ẩn Quá trình huấn luyện mạng nơron bao gồm việcchọn mô hình phù hợp, xác định cấu trúc và liên kết nơron, cũng như áp dụngthuật toán học để điều chỉnh các tham số và tối ưu cấu trúc mạng
1.2.1 Tế bào nơron
Mạng nơron nhân tạo, hay ANN (Artificial Neural Network), là một
mô hình toán học được lấy cảm hứng từ cấu trúc và hoạt động của bộ não conngười Nó bao gồm các đơn vị xử lý được gọi là nơron nhân tạo, kết nối vớinhau thông qua các liên kết có trọng số Mỗi nơron xử lý thông tin và tạo rađầu ra dựa trên trọng số kết nối và hàm kích hoạt Mạng nơron có khả nănghọc và tự điều chỉnh dựa trên dữ liệu huấn luyện, cho phép thực hiện nhiềunhiệm vụ phức tạp như phân loại, dự đoán và nhận diện mẫu
Hình 1.8 Tế bào nơron nhân tạo
Tín hiệu đầu vào
Trong mạng nơron nhân tạo, tín hiệu đầu vào được biểu diễn bằng mộtvector (x1, x2, , xm) với m tín hiệu Trong đó, (m-1) tín hiệu đầu tiên thườnggọi là tín hiệu kích thích và tín hiệu cuối cùng, gọi là ngưỡng, có giá trị +1 đểđiều chỉnh hoạt động của nơron Mỗi tín hiệu đầu vào được kết nối với mộttrọng số w, thể hiện mức độ quan trọng của tín hiệu đối với nơron, và có thêmmột thành phần bias bi để điều chỉnh sự kích thích hoặc ức chế
Trang 22Hàm xử lý ở đầu vào có thể là hàm tuyến tính, hàm toàn phương hoặchàm cầụ Trong đó, hàm tuyến tính được sử dụng phổ biến nhất và có dạngnhư sau:
Trong đó:
f(net) là đầu ra của nơron
net là tổng của tích của các tín hiệu đầu vào với trọng số tương ứng,cộng với thành phần bias
wj là trọng số của tín hiệu đầu vào thứ j
xj là giá trị của tín hiệu đầu vào thứ j
b là thành phần bias
Tín hiệu đầu ra
Trong mạng nơron nhân tạo, tín hiệu đầu ra của mỗi nơron được xácđịnh bởi công thức y = ănet), trong đó ặ) là hàm chuyển đổị Các hàmchuyển đổi phổ biến bao gồm:
Hàm Sigmoid: Biểu diễn bởi công thức
( )
(1.2)đến 1
nơron sử dụng hàm này để biểu thị mức độ kích hoạt trong khoảng từ 0
Hàm giới hạn cứng: Bao gồm hàm step và hàm dấu, được sử dụng đểtạo ra đầu ra nhị phân (0 hoặc 1)
Hàm tuyến tính: Đơn giản là chuyển đổi tuyến tính của đầu vào,
ăf) = f
Hàm bão hòa: Có nhiệm vụ làm cho giá trị đầu ra giới hạn trong một phạm vi nhất định, như hàm dốc bão hòa và hàm tuyến tính bão hòạ
Trang 23Hàm sigmoid đơn cực và sigmoid lƣỡng cực: Cung cấp sự linh hoạttrong việc điều chỉnh độ dốc của đầu ra dựa trên giá trị của tham số λ.
Hình 1.9 Các dạng hàm tác động thông dụng a)Hàm bước nhảy; b) Hàm dấu; c) Hàm dốc; d) Hàm tuyến tính bão hòa;
e) Hàm sigmoid đơn cực; f) Hàm sigmoid lưỡng cực
Trong mạng nơron, các nơron sử dụng các hàm chuyển đổi này để tínhtoán đầu ra dựa trên tổng trọng số của các đầu vào, giúp mạng xử lý các vấn
đề phi tuyến và huấn luyện hiệu quả hơn
Hình 1.10 Mô hình tế bào nơron
Trang 24Nếu giữ tổng trọng số f như nhau, như trong ví dụ trên (f = 0.7), giá trịtín hiệu ra y sẽ khác nhau tùy vào dạng hàm chuyển đổi ặ) Trong trường
Trang 25hợp dùng hàm chuyển đổi tuyến tính (y = 0.7), giá trị tín hiệu ra y sẽ là 0.7.Trong khi đó, khi sử dụng hàm sigmoid (với λ = 1), giá trị tín hiệu ra y sẽ làkhoảng 0.6681.
Do đó, lựa chọn hàm chuyển đổi ặ) ở các dạng khác nhau có thể ảnhhưởng đáng kể đến kết quả của mạng nơron và quá trình học trong các ứngdụng thực tế
1.2.2 Các loại mô hình cấu trúc mạng nơ-ron
Mạng nơron truyền thẳng là một loại mạng trong đó tín hiệu chỉ truyền
từ lớp đầu vào đến lớp đầu ra thông qua các lớp ẩn Nó có thể không có hoặc
có nhiều lớp ẩn và được gọi là mạng đầy đủ Mạng phản hồi là loại mạng màtín hiệu ra của một nơron được phản hồi vào đầu vào của các nơron trong cáclớp trước đó hoặc của chính nó Mạng phản hồi có thể là mạng phản hồi bênhoặc mạng hồi quỵ Mạng hồi quy một lớp là một loại mạng nơron một lớpvới kết nối hồi quy, thường được sử dụng trong các tác vụ liên quan đến dựđoán và xử lý chuỗi thời gian
Trang 26Hình 1.12 Các loại mạng nơron nhân tạo thông dụng a) Mạng nơ-ron truyền thẳng một lớp; b) Mạng nơ-ron truyền thẳng nhiều lớp; c) Mạng nơ-ron hồi quy một lớp; d) Mạng nơ-ron hồi quy nhiều lớp
1.2.3 Các tính chất của mạng nơ-ron
Mạng nơ-ron nhân tạo có các tính chất quan trọng sau:
Hệ phi tuyến: Mạng nơ-ron có khả năng xử lý các tác vụ phi tuyến tính,giúp giải quyết các bài toán phức tạp
Hệ xử lý song song: Cấu trúc song song của mạng nơ-ron cho phépnhiều nơ-ron hoạt động đồng thời, tăng tốc độ tính toán và thích hợp cho cácứng dụng nhận dạng và điều khiển
Hệ học và thích nghi: Mạng nơ-ron có khả năng học từ dữ liệu quá khứ
và tự thích nghi khi đối mặt với sự thay đổi của dữ liệu đầu vào
Hệ có nhiều biến, nhiều đầu vào và đầu ra (MIMO): Mạng nơ-ron cóthể xử lý nhiều biến số đầu vào và đầu ra, làm cho nó trở nên linh hoạt và tiệndụng trong việc điều khiển các đối tƣợng có nhiều thông số đa dạng
Trang 271.2.4 Các nguyên tắc học
Mạng nơ-ron nhân tạo trải qua hai nhóm nguyên tắc học chính: họctham số và học cấu trúc Trong học tham số, trọng số kết nối giữa các nơ-ronđược điều chỉnh để tối ưu hóa hiệu suất của mạng Phương pháp này có thể
sử dụng các kỹ thuật học có giám sát, học củng cố và học không giám sát đểcập nhật trọng số Trong khi đó, học cấu trúc giải quyết việc xác định cấu trúcphù hợp của mạng, bao gồm số lượng lớp, nơ-ron và kết nối
a. Học có giám sát (Supervised Learning)
Trong học có giám sát, dữ liệu huấn luyện được biểu diễn dưới dạngcác cặp (dữ liệu đầu vào - dữ liệu đầu ra) mong muốn Các trọng số của mạngđược cập nhật dựa trên sai số giữa dữ liệu ra thực tế và dữ liệu ra mongmuốn Quá trình cập nhật tiếp tục cho đến khi sai số đạt đủ nhỏ hoặc khi đạt
số lần huấn luyện quy định
Hình 1.13 Học có giám sát
b. Học củng cố (Reinforcement Learning)
Học củng cố không yêu cầu thông tin đầy đủ về đầu ra cho mỗi mẫuđầu vào và không chỉ dẫn cụ thể cách điều chỉnh trọng số Thay vào đó, mạngphải thử nghiệm và điều chỉnh dựa trên phản hồi về hiệu suất của các hành
Trang 28động Phương pháp này thường được sử dụng trong tối ưu hóa và điều khiển, nơi mạng cần tìm ra cách tối ưu hóa hành vi dựa trên phản hồi về hiệu suất.
Hình 1.14 Học củng cố
c. Học không có giám sát (Unsupervised Learning)
Học không giám sát không dựa vào phản hồi từ dữ liệu đầu ra Thayvào đó, mạng tự phát hiện đặc điểm, mối quan hệ và nhóm dữ liệu đầu vào.Quá trình này giúp mạng tự tổ chức thông qua việc điều chỉnh các thông số đểtạo ra biểu diễn tốt nhất của dữ liệu, mà không cần thông tin phản hồi cụ thể.Học không giám sát thường được sử dụng trong gom nhóm, giảm chiều dữliệu và phát hiện bất thường, giúp mạng nơron hiểu rõ hơn về cấu trúc và tínhchất của dữ liệu
Hình 1.15 Học không giám sát
Trang 29So sánh ba phương pháp mạng nơron với ba cách học của bộ não conngười.
Bảng 1.1 So sánh bộ não con người với phương pháp học của mạng nơron nhân tạo
Bộ não con người Mạng nơron nhân tạo
Học có sự hướng dẫn của giáo viên Học có giám sát
Học có sự đánh giá của giáo viên Học củng cố
Hình 1.16 Sơ đồ tổng quát một tế bào nơron nhân tạo trong huấn luyện
Trong quá trình học, các tín hiệu đầu vào xj (với j = 1, 2, , m ) có thểđược phát ra từ tín hiệu ra của các tế bào nơron khác hoặc từ các tín hiệunhập từ bên ngoài Trong khi đó, ngưỡng của tế bào nơron cũng được xemxét và biểu diễn dưới dạng một trọng số của đầu vào xm với giá trị cố định là -
1 Tín hiệu ra mong muốn thường chỉ tồn tại trong phương pháp học có giámsát hoặc trong phương pháp học củng cố, và thường được coi là tín hiệu đánhgiá Tổng quát, vector trọng số của tế bào nơron thay đổi theo một quy luật cụthể
( ) ( ) ( ) (1.3)
Trang 30trong đó ( )là biến thiên của vector trọng số tại bước lặp thứ k.
η là một số dương quyết định tốc độ học, gọi là hằng số học; r là tín
hiệu học, tổng quát là hàm của wj, x và tín hiệu mong muốn di
( ( ) ( ) ) ( ) ( )
1.2.5 Thuật toán lan truyền ngược
Thuật toán lan truyền ngược (BP) là một phương pháp quan trọngtrong huấn luyện mạng nơron Được Werbos đề xuất năm 1970, BP cập nhậttrọng số mạng bằng cách sử dụng gradient descent Quá trình huấn luyện gồmhai bước: lan truyền tiến tính toán dự đoán và lan truyền ngược sai số điềuchỉnh trọng số BP giúp giảm thiểu sai số của mạng nơron và có nhiều ứngdụng từ dự báo thời tiết đến phân tích dữ liệu Mặc dù thường được sử dụngtrong học sâu, BP cũng là công cụ tính toán mạnh mẽ cho nhiều lĩnh vực, vàthường được gọi là "phép vi phân ngược"
Hình 1.17 Kiến trúc của mạng nơron lan truyền ngược
Backpropagation điều chỉnh trọng số mạng để giảm sai số giữa đầu rathực tế và mong muốn Nó tạo ra các tính năng mới giúp phân biệt từ các
Trang 31phương pháp trước đó và giảm chức năng chi phí bằng cách điều chỉnh trọng
số và độ lệch của mạng dựa trên độ dốc của hàm chi phí
Thuật toán lan truyền ngược được mô tả như sau:
Bước 1: Khởi tạo trọng số bởi các giá trị ngẫu nhiên nhỏ
Bước 2: Lặp lại cho tới khi thỏa mãn điều kiện kết thúc
Với mỗi mẫu, thực hiện các bước sau:
2.1 Tính đầu ra oj cho mỗi nút j:
Trang 32w ji : trọng số trên xji
b j : ngƣỡng tại nút thứ
j o j : đầu ra của nút thứ
j
t j: đầu ra mong muốn của nút thứ j
Downstream(j): Tập tất cả các nút nhận đầu ra của nút thứ j làm một
giá trị đầu vào
η: tốc độ học
f: hàm truyền với f(x) = 1 / (1 + e-x)
Trang 33CHƯƠNG 2 THUẬT TOÁN ANFIS VÀ BÀI TOÁN DỰ BÁO DỮ LIỆU
CHUỖI THỜI GIAN
2.1 BÀI TOÁN DỰ BÁO
2.1.1 Khái niệm
Dự báo là một khoa học và nghệ thuật tiên đoán những sự việc sẽ xảy
ra trong tương lai, dựa trên việc phân tích khoa học về các dữ liệu đã đượcthu thập Trong thực tế, chúng ta thường phải đưa ra các quyết định liên quanđến dự báo để chuẩn bị cho các biến động và thách thức trong tương lai vàcông việc dự báo đóng vai trò quan trọng trong việc đảm bảo tính tin cậy vàhiệu quả của những quyết định đó Điều này đặc biệt quan trọng trong mộtmôi trường kinh tế cạnh tranh như hiện nay
Tính khoa học của dự báo được thể hiện qua việc chúng ta sử dụng các
số liệu phản ánh tình hình hiện tại, quá khứ, và xu hướng phát triển để dựđoán tình hình sẽ diễn ra trong tương lai, dựa trên các mô hình toán học Tuynhiên, các dự đoán này thường có thể không chính xác hoặc thay đổi khi gặpphải các tình huống kinh tế hoặc quản trị không phù hợp hoàn toàn với môhình dự báo
Tính nghệ thuật của dự báo phụ thuộc vào kinh nghiệm thực tế và khảnăng đánh giá của các chuyên gia, giúp họ đưa ra những dự đoán với độchính xác cao nhất
2.1.2 Đặc điểm
Không thể đảm bảo chắc chắn về tương lai: Dù chúng ta sử dụngphương pháp nào, luôn tồn tại yếu tố không chắc chắn cho đến khi thực tếdiễn ra
Có điểm mù: Không thể dự báo một cách hoàn toàn chính xác về những
gì sẽ xảy ra trong tương lai Đôi khi, không thể dự báo được nếu chúng tathiếu thông tin về vấn đề cần dự báo