NGUYÊN CỨU ỨNG DỤNG MÔ HÌNH ANFIS VÀO BÀI TOÁN DỰ BÁO TRÊN DỮ LIỆU CHUỖI THỜI GIANNGUYÊN CỨU ỨNG DỤNG MÔ HÌNH ANFIS VÀO BÀI TOÁN DỰ BÁO TRÊN DỮ LIỆU CHUỖI THỜI GIANNGUYÊN CỨU ỨNG DỤNG MÔ HÌNH ANFIS VÀO BÀI TOÁN DỰ BÁO TRÊN DỮ LIỆU CHUỖI THỜI GIANNGUYÊN CỨU ỨNG DỤNG MÔ HÌNH ANFIS VÀO BÀI TOÁN DỰ BÁO TRÊN DỮ LIỆU CHUỖI THỜI GIAN
Trang 1BỘ CÔNG THƯƠNG
TRƯỜNG ĐẠI HỌC CÔNG NGHIỆP HÀ NỘI
-
HOÀNG THĂNG LONG
NGUYÊN CỨU ỨNG DỤNG MÔ HÌNH ANFIS VÀO BÀI TOÁN DỰ BÁO TRÊN DỮ LIỆU CHUỖI THỜI GIAN
ĐỀ ÁN TỐT NGHIỆP THẠC SĨ HỆ THỐNG THÔNG TIN
Hà Nội – 2024
Trang 2BỘ CÔNG THƯƠNG TRƯỜNG ĐẠI HỌC CÔNG NGHIỆP HÀ NỘI
-
HOÀNG THĂNG LONG
NGUYÊN CỨU ỨNG DỤNG MÔ HÌNH ANFIS VÀO BÀI TOÁN DỰ BÁO TRÊN DỮ LIỆU CHUỖI THỜI GIAN
Trang 3MỤC LỤC
MỤC LỤC i
LỜI CAM ĐOAN iii
DANH MỤC CÁC KÝ HIỆU, CÁC CHỮ VIẾT TẮT iv
DANH MỤC CÁC BẢNG v
DANH MỤC CÁC HÌNH vi
MỞ ĐẦU 1
CHƯƠNG 1 TỔNG QUAN LOGIC MỜ VÀ MẠNG NƠ-RON NHÂN TẠO 4
1.1 TỔNG QUAN LOGIC MỜ 4
1.1.1 Tập mờ (Ying, 2000) 4
1.1.2 Các phép toán đại số trên tập mờ (Ying, 2000) 4
1.1.3 Logic mờ (Jang, J.-S R.; Sun, C.-T.; Mizutani, E., 1997) 6
1.2 TỔNG QUAN MẠNG NƠ-RON NHÂN TẠO 11
1.2.1 Tế bào nơron 13
1.2.2 Các loại mô hình cấu trúc mạng nơ-ron 17
1.2.3 Các tính chất của mạng nơ-ron 18
1.2.4 Các nguyên tắc học 19
1.2.5 Thuật toán lan truyền ngược 22
CHƯƠNG 2 THUẬT TOÁN ANFIS VÀ BÀI TOÁN DỰ BÁO DỮ LIỆU CHUỖI THỜI GIAN 25
2.1 BÀI TOÁN DỰ BÁO 25
2.1.1 Khái niệm 25
2.1.2 Đặc điểm 25
Trang 42.1.3 Các phương pháp 26
2.2 THUẬT TOÁN ANFIS 29
2.2.1 Giới thiệu sơ lược về mô hình nơron - mờ (Jang, 1993) 29
2.2.2 Luật mờ if-then và hệ suy diễn mờ (Jang, 1993) 31
2.2.3 Mạng thích nghi 34
2.2.4 Cấu trúc của ANFIS (Jang, J.-S R.; Sun, C.-T.; Mizutani, E., 1997) 35
2.2.5 Thuật toán huấn luyện hệ ANFIS 37
2.2.6 Ứng dụng của thuật toán ANFIS 38
2.3 DỮ LIỆU CHUỖI THỜI GIAN 40
2.3.1 Giới thiệu dữ liệu chuỗi thời gian 40
2.3.2 Một số phương pháp dự báo chuỗi thời gian đơn giản 41
CHƯƠNG 3 ỨNG DỤNG THUẬT TOÁN ANFIS VÀO BÀI TOÁN DỰ BÁO DỮ LIỆU CHUỖI THỜI GIAN 45
3.1 MÔ TẢ BÀI TOÁN (El-Shafie, A.; Jaafer, O.; Seyed, A, 2011) 45
3.2 XÂY DỰNG MÔ HÌNH (Bằng, 2018) 46
3.2.1 Biến đầu ra 46
3.2.2 Lựa chọn biến đầu vào 46
3.2.3 Cấu trúc mô hình dự báo 47
3.3 THU THẬP DỮ LIỆU 48
3.4 CHỈ SỐ ĐÁNH GIÁ 50
3.5 KẾT QUẢ THỬ NGHIỆM 52
3.6 ĐÁNH GIÁ 57
KẾT LUẬN 58
TÀI LIỆU THAM KHẢO 59
Trang 5LỜI CAM ĐOAN
Tôi xin cam đoan rằng đề án thạc sĩ Hệ thống thông tin “Nghiên cứu ứng dụng thuật toán ANFIS vào bài toán dự báo trên dữ liệu chuỗi thời gian”
là công trình nghiên cứu của tôi dưới sự hướng dẫn của TS Đặng Trọng Hợp
Toàn bộ nội dung được trình bày trong đề án này hoặc là đến từ sự tìm hiểu nghiên cứu của tôi hoặc là tổng hợp, thu thập từ các tài liệu khác nhau đều được trích dẫn đầy đủ trong phần tài liệu tham khảo Các tài liệu tham khảo này được sử dụng một cách hợp lý và minh bạch Tôi xin cam đoan rằng không có bất cứ vi phạm nào đối với các quy định đạo đức nghiên cứu khoa học trong quá trình thực hiện dự án
Tôi xin hoàn toàn chịu trách nhiệm và chịu mọi hình thức kỷ luật theo quy định về tính chính xác và trung thực của đề án nghiên cứu này
Hà Nội, ngày tháng năm 2024
Tác giả đề án
Trang 6DANH MỤC CÁC KÝ HIỆU, CÁC CHỮ VIẾT TẮT
AI Artificial Intelligence Trí tuệ nhân tạo
ANN Artificial Neural Network Mạng Nơ-ron nhân tạo
ANFIS Adaptive-Network-based
Fuzzy Inference System
Mạng thích nghi dựa trên cơ sở
hệ suy luận mờ
MIMO Multi Input Multi Output Nhiều đầu vào – nhiều đầu ra MISO Multi Input Single Output Nhiều đầu vào – một đầu ra RMSE Root mean square error Sai số dự đoán
CORR Correlation Coefficient Hệ số tương quan
Trang 7DANH MỤC CÁC BẢNG
Bảng 1.1 So sánh bộ não con người với phương pháp học của mạng nơron
nhân tạo 21
Bảng 2.1 So sánh mạng nơron và logic mờ 30
Bảng 3.1 Kết quả chỉ số đánh giá lượng mưa vụ 1 tháng 53
Bảng 3.2 Kết quả chỉ số đánh giá lượng mưa vụ 3 tháng 55
Bảng 3.3 Kết quả chỉ số đánh giá lượng mưa vụ 6 tháng 56
Trang 8DANH MỤC CÁC HÌNH
Hình 1.1 Hợp của hai tập mờ A và B 5
Hình 1.2 Giao của hai tập mờ A và B 5
Hình 1.3 Phần bù của tập hợp A 6
Hình 1.4 Kiến trúc của hệ mờ tổng quát 7
Hình 1.5 Hệ mờ nhiều đầu vào – một đầu ra 8
Hình 1.6 Tế bào nơron sinh học 12
Hình 1.7 Mạng nơron nhân tạo 12
Hình 1.8 Tế bào nơron nhân tạo 13
Hình 1.9 Các dạng hàm tác động thông dụng 15
Hình 1.10 Mô hình tế bào nơron 15
Hình 1.11 Ví dụ 16
Hình 1.12 Các loại mạng nơron nhân tạo thông dụng 18
Hình 1.13 Học có giám sát 19
Hình 1.14 Học củng cố 20
Hình 1.15 Học không giám sát 20
Hình 1.16 Sơ đồ tổng quát một tế bào nơron nhân tạo trong huấn luyện 21
Hình 1.17 Kiến trúc của mạng nơron lan truyền ngược 22
Hình 2.1 Dự báo định tính và dự báo định lượng 27
Hình 2.2 Hệ thống suy luận mờ 32
Hình 2.3 Mạng thích nghi 35
Hình 2.4 Cấu trúc thuật toán ANFIS 35
Hình 2.5 Phân loại các phương pháp dự báo chuỗi thời gian 41
Hình 3.1 Cấu trúc dữ liệu 49
Hình 3.2 Kết quả dự báo lượng mưa vụ 1 tháng của M1-M5 52
Hình 3.3 Kết quả dự báo lượng mưa vụ 3 tháng của M1-M5 54
Hình 3.4 Kết quả dự báo lượng mưa vụ 6 tháng của M1-M5 56
Trang 9MỞ ĐẦU
1 Lý do chọn đề tài
Khai thác dữ liệu từ quá khứ để dự báo dữ liệu tương lai với độ chính xác cao là vấn đề thử thách trong nghiên cứu hiện nay Mạng nơron nhân tạo nói chung và hệ suy diễn mờ- nơron thích nghi (ANFIS - Adaptive-Network-based Fuzzy Inference System) nói riêng là một trong các kỹ thuật để dự báo
dữ liệu chuỗi thời gian Các dữ liệu chuỗi thời gian như thời tiết, chứng khoán, lượng điện tiêu thụ, lượng mưa, cần được dự báo để phân tích, đánh giá, đưa ra quyết định quản lý kịp thời
Trong những năm gần đây, diễn biến về thời tiết rất phức tạp được quan tâm và nghiên cứu nhiều trong đó có lưu lượng mưa các khu vực phục
vụ cho các hoạt động phát triển kinh tế như: kế hoạch sản xuất nông nghiệp,
du lịch, đánh bắt và nuôi trồng thủy sản, quản lý, khai thác nguồn tài nguyên nước,… Việc dự đoán lượng mưa trong khu vực cho phép tính toán lượng nước để tưới tiêu, lập kế hoạch cho các hồ chứa nước bên cạnh đó phòng tránh giảm nhẹ thiên tai do lượng mưa lớn nếu có,
Việc áp dụng thuật toán ANFIS cho các vấn đề dự án trên dữ liệu chuỗi thời gian đã trở thành một chủ đề quan trọng ngày nay Điều này là do sự phát triển của các tập dữ liệu lớn và nhu cầu đưa ra dự đoán chính xác trong các lĩnh vực như tài chính, kinh tế, y tế và kỹ thuật Thuật toán ANFIS rất thích hợp để phân tích dữ liệu chuỗi thời gian do khả năng mô hình hóa mối quan
hệ phi tuyến phức tạp giữa các biến đầu vào và đầu ra
Trang 10Neuro-ANFIS là một mô hình lai kết hợp các điểm mạnh của logic mờ và mạng ron, làm cho nó trở thành một mô hình hiệu quả để dự đoán và phân tích dữ liệu chuỗi thời gian
nơ-Thuật toán ANFIS đã được áp dụng cho nhiều vấn đề phân tích dữ liệu chuỗi thời gian trong quá khứ Một số ứng dụng phổ biến bao gồm dự báo giá
cổ phiếu, dự đoán lưu lượng giao thông và phân tích các mô hình thời tiết Tuy nhiên, vẫn còn rất nhiều tiềm năng để khám phá của thuật toán ANFIS trong phân tích dữ liệu chuỗi thời gian
Việc nghiên cứu ứng dụng thuật toán ANFIS trong phân tích dữ liệu chuỗi thời gian là rất quan trọng trong nhiều lĩnh vực Với sự phát triển của các công nghệ thông tin, việc phân tích dữ liệu chuỗi thời gian đã trở nên quan trọng hơn Việc sử dụng thuật toán ANFIS sẽ giúp cho việc phân tích và
dự đoán dữ liệu chuỗi thời gian trở nên chính xác hơn, đồng thời cũng có thể giúp giảm thiểu các sai số và tối ưu hóa kết quả
Tóm lại, đề tài "Nghiên cứu ứng dụng thuật toán ANFIS vào bài toán
dự báo trên dữ liệu chuỗi thời gian" sẽ tập trung vào việc phân tích và dự đoán dữ liệu chuỗi thời gian bằng cách sử dụng thuật toán ANFIS Đây là một chủ đề quan trọng và đầy tiềm năng trong nghiên cứu khoa học và cũng có tầm quan trọng lớn trong các lĩnh vực thực tiễn như tài chính, kinh tế, y tế và
kỹ thuật
3 Tính cấp thiết của đề tài
Dự báo là một lĩnh vực kết hợp giữa khoa học và nghệ thuật, nhằm tiên đoán những sự kiện sẽ xảy ra trong tương lai dựa trên phân tích các dữ liệu thu thập được Có hai loại cơ bản của kỹ thuật dự báo:
- Kỹ thuật dự báo định tính: Dựa trên các ý kiến, đánh giá, quan điểm, trực giác hay kinh nghiệm của chuyên gia để đưa ra dự báo về các sự kiện, kết
Trang 11quả, hoặc trạng thái có tính chất định tính, chẳng hạn như dự báo xu hướng,
dự báo thị trường, hoặc dự báo về sự thành công của một dự án
- Kỹ thuật dự báo định lượng: Dựa trên các phương pháp thống kê để phân tích dữ liệu lịch sử và đưa ra dự báo về các giá trị cụ thể hoặc các biến
số có tính chất định lượng, chẳng hạn như dự báo doanh số bán hàng, dự báo sản lượng, hoặc dự báo giá cả
Kỹ thuật định tính được sử dụng khi dữ liệu quá khứ không đầy đủ hay đối tượng dự báo bị ảnh hưởng bởi những nhân tố không thể lượng hóa
Kỹ thuật dự báo định lượng dựa trên việc phân tích dữ liệu lịch sử để xây dựng và mô hình hóa động thái diễn biến của đối tượng theo một mô hình toán học, từ đó sử dụng mô hình này để dự báo xu hướng tương lai của đối tượng đó
Các nghiên cứu xây dựng mô hình dựa trên luật mờ (hay còn gọi là mô hình mờ - fuzzy models) là một trong những phương pháp tiếp cận được sử dụng để xây dựng các hệ thống hỗ trợ dự báo và dự báo điều khiển Trong số
đó, thuật toán ANFIS (Adaptive-Network-based Fuzzy Inference System) là một trong những mô hình mờ được nghiên cứu và ứng dụng mạnh mẽ, đã đạt được nhiều kết quả tốt
Hầu hết các nguồn cung cấp dữ liệu trên toàn cầu đều là dữ liệu chuỗi thời gian, và lượng dữ liệu này đang tăng dần theo cấp số nhân Bài toán dự báo dữ liệu chuỗi thời gian được sử dụng rộng rãi trong nhiều lĩnh vực khác nhau, bao gồm dự báo thời tiết, dự báo giá cổ phiếu, dự báo sản lượng sản xuất và tiêu thụ, dự báo lượng điện cần tải cho thành phố, dự báo sự biến đổi của năng lượng mặt trời, và nhiều lĩnh vực khác Dữ liệu chuỗi thời gian cung cấp một cơ sở dữ liệu đa dạng, phong phú và phức tạp để phân tích, mô hình hóa và dự báo xu hướng tương lai, cung cấp thông tin quan trọng để hỗ trợ quyết định trong các lĩnh vực trên
Trang 12CHƯƠNG 1 TỔNG QUAN LOGIC MỜ VÀ MẠNG NƠ-RON NHÂN
TẠO 1.1 TỔNG QUAN LOGIC MỜ
1.1.1 Tập mờ (Ying, 2000)
Lý thuyết tập mờ của L.A Zadeh, xuất phát từ bài báo "Fuzzy Sets" năm 1965, mô tả sự không chắc chắn của thông tin mờ thông qua khái niệm tập mờ Tập mờ là một biểu diễn toán học của các khái niệm trừu tượng như
"trẻ", "nhanh", "cao-thấp", "xinh đẹp" Tính chất chính của tập mờ là có độ thuộc, biểu thị mức độ mà một phần tử thuộc vào tập đó
Tập mờ có ứng dụng trong nhiều lĩnh vực như trí tuệ nhân tạo, hệ thống điều khiển, ra quyết định và nhận dạng mẫu Lô-gic mờ, phát triển từ lý thuyết tập mờ, cũng có ứng dụng rộng rãi trong lý luận hợp lý và các lĩnh vực khác
Tóm lại, tập mờ là một công cụ quan trọng để mô hình hóa sự không chắc chắn và mơ hồ trong các khái niệm dựa trên ngôn ngữ, giúp tạo ra quyết định và giải quyết vấn đề hiệu quả hơn
1.1.2 Các phép toán đại số trên tập mờ (Ying, 2000)
Các phép toán trên tập mờ được định nghĩa thông qua các hàm thuộc và được xây dựng tương tự như các phép toán trong lý thuyết tập mờ kinh điển, bao gồm tập con, phép giao, phép hợp và phép lấy phần bù
Tập con: Hai tập mờ A và B bằng nhau khi hàm thuộc của chúng bằng nhau cho mọi phần tử trong không gian Tập mờ A là tập con của B nếu hàm thuộc của A không lớn hơn hàm thuộc của B tại mọi điểm trong không gian
Phép hợp: Hợp của hai tập mờ A và B được xác định bằng cách chọn giá trị lớn nhất từ hàm thuộc của A và B tại mỗi điểm trong không gian
Trang 13Đồ thị hàm thuộc của hợp mờ A, B và tập mờ A B đƣợc cho trong hình sau:
Trang 14 Phép lấy phần bù: Phần bù của tập mờ A là tập mờ chứa các phần tử không thuộc A, được xác định bằng cách lấy giá trị bù của hàm thuộc của
A
Đồ thị hàm thuộc của tâp mờ A và tập mờ như sau:
Hình 1.3 Phần bù của tập hợp A
1.1.3 Logic mờ (Jang, J.-S R.; Sun, C.-T.; Mizutani, E., 1997)
Logic mờ là một phương pháp tổng hợp để giải quyết các vấn đề trong một hệ thống điều khiển hoặc một mô hình hệ thống Nó xây dựng trên các nguyên tắc về tư duy mờ và giải quyết các vấn đề bằng cách sử dụng các phương pháp mờ, chẳng hạn như lý luận mờ, điều khiển mờ và định lý mờ
Logic mờ là một trong những công nghệ quan trọng trong lĩnh vực điều khiển và tự động hóa, đặc biệt là trong các ứng dụng của tự động hóa và điều khiển trong các hệ thống nhúng Nó có thể được sử dụng để xây dựng các mô hình hệ thống, để giải quyết các vấn đề về điều khiển hoặc để xác định các thuật toán điều khiển tốt nhất cho các hệ thống cụ thể
Logic mờ được sử dụng vì nó giúp phân tích và giải quyết các vấn đề của hệ thống có hạn chế một cách rõ ràng và dễ hiểu Nó cũng cho phép phát triển các giải pháp tốt cho các vấn đề, và cung cấp một cách để đánh giá và xác định sự hiệu quả của các giải pháp
Trang 151.1.3.1 Kiến trúc của hệ mờ
Hình 1.4 Kiến trúc của hệ mờ tổng quát
Trong hệ điều khiển mờ, cơ sở luật mờ là trung tâm, chứa các luật then biểu diễn tri thức của chuyên gia Bộ suy diễn mờ kết hợp các luật và áp dụng chúng vào tập mờ đầu vào để xác định tập mờ đầu ra Dữ liệu đầu vào
if-từ các cảm biến được số hóa và chuyển đổi thành tập mờ qua quá trình mờ hóa trước khi được xử lý bởi bộ suy diễn mờ Đầu ra từ bộ suy diễn mờ là tập
mờ, cần được chuyển đổi thành giá trị số thông qua quá trình giải mờ trước khi đưa vào các cơ quan chấp hành như tay máy, công tắc, van điều khiển
Trong hệ điều khiển mờ, chúng ta tập trung vào làm việc với các biến
số, xem hệ mờ như làm việc với các biến số và tín hiệu số Hệ mờ có thể nhận đầu vào là một vector nhiều chiều và cho ra một vector đầu ra nhiều chiều, được gọi là hệ mờ nhiều đầu vào, nhiều đầu ra (MIMO) Nếu số chiều đầu ra
là 1, ta có một hệ mờ nhiều đầu vào, một đầu ra (MISO) Một hệ mờ nhiều đầu vào, nhiều đầu ra có thể phân tách thành nhiều hệ mờ nhiều đầu vào, một đầu ra Do đó, khi nói về hệ mờ nhiều đầu vào, một đầu ra, ta ngầm hiểu là một hệ mờ nhiều đầu vào, một đầu ra với các biến số Ta có mô hình hệ mờ nhiều đầu vào, một đầu ra như hình vẽ
Trang 16Hình 1.5 Hệ mờ nhiều đầu vào – một đầu ra
a) Cơ sở luật mờ
Cơ sở luật mờ của hệ mờ n đầu vào, một đầu ra bao gồm m luật if-then
mờ chuẩn tắc Mỗi luật có dạng "Nếu x1 thuộc A1 và x2 thuộc A2 và và xn thuộc An thì y thuộc B", trong đó các Ai và B là các tập mờ Có các phương pháp để xác định các luật mờ như tham khảo chuyên gia, quan sát thực nghiệm và kết hợp các phương pháp khác nhau Quá trình này là phức tạp và phụ thuộc vào ngữ cảnh và mục tiêu của hệ mờ
b) Bộ suy diễn mờ
Trong trường hợp MISO với m luật if-then mờ chuẩn tắc, ta có thể sử dụng phương pháp suy diễn max-min hoặc max-tích để thiết kế bộ suy diễn Phương pháp suy diễn max-min chọn giá trị lớn nhất từ các giá trị nhỏ nhất của mức độ thuộc trong các luật Trái lại, phương pháp suy diễn max-tích tính toán giá trị đầu ra bằng cách nhân các giá trị mức độ thuộc và chọn giá trị lớn nhất Lựa chọn giữa hai phương pháp phụ thuộc vào yêu cầu và tính chất cụ thể của bài toán
c) Bộ mờ hóa
Quá trình mờ hóa biến đổi một vector x = (x1, x2, , xn) U Rn
thành một tập mờ A′ trên U, đồng thời A′ phản ánh tính gần đúng của dữ liệu và mang lại hiệu quả tính toán cho bộ suy diễn
Trang 17Các phương pháp mờ hóa thông dụng bao gồm:
Mờ hóa bằng hàm tam giác: Biến đổi x thành một tập mờ A′ có hình dạng tam giác
Mờ hóa bằng hàm hình thang: Biến đổi x thành một tập mờ A′ có hình dạng hình thang
Mờ hóa bằng hàm hình chuông: Biến đổi x thành một tập mờ A′ có hình dạng hình chuông
Mờ hóa bằng hàm hình chuông Gauss: Biến đổi x thành một tập mờ A′
d) Bộ giải mờ
Giải mờ là quá trình chọn ra một giá trị cụ thể từ một tập mờ trên miền giá trị đầu ra của hệ mờ Mục tiêu là chọn giá trị đại diện tốt nhất cho tập mờ
đó, đảm bảo độ thuộc cao nhất và nằm gần trung tâm của tập
Các phương pháp giải mờ thông dụng bao gồm:
Giải mờ bằng giá trị trung bình: Xác định điểm y bằng trung bình trọng
số của các giá trị trong tập mờ
Giải mờ bằng phép cắt: Xác định điểm y bằng điểm cắt giữa tập mờ và một ngưỡng xác định
Giải mờ bằng giá trị cao nhất: Xác định điểm y bằng giá trị cao nhất trong tập mờ
Giải mờ bằng trung vị: Xác định điểm y bằng giá trị trung vị của tập mờ
Trang 18Lựa chọn phương pháp giải mờ phụ thuộc vào bối cảnh và yêu cầu cụ thể của vấn đề, để đạt được tính chính xác và hiệu quả trong việc xác định giá trị y từ tập mờ và đảm bảo tính liên tục trong quá trình giải mờ
1.1.3.2 Các khái niệm cơ bản
Thủ tục mờ là quy trình xử lý đầu vào và đầu ra sử dụng phép tính và quy tắc mờ để tạo ra kết quả mờ Trong quá trình này, các giá trị đầu vào được xử lý để tạo ra các giá trị đầu ra tương ứng, dựa trên các hàm mờ và quy tắc mờ
Hàm mờ là hàm đầu vào-đầu ra dùng để tính toán kết quả mờ, sử dụng các giá trị mờ để biểu diễn mức độ thuộc của giá trị vào một tập mờ cụ thể
Trọng số mờ là giá trị mờ dùng để xác định sự quan trọng của một yếu
tố đầu vào đối với kết quả đầu ra trong quá trình suy diễn mờ
Đầu vào mờ là giá trị đầu vào có giới hạn, biểu diễn mức độ thuộc của giá trị vào các tập mờ khác nhau, giúp biểu diễn tính mờ và không chắc chắn của dữ liệu
Đầu ra mờ là giá trị đầu ra tính toán bởi thủ tục mờ, được biểu diễn bằng các hàm mờ, phản ánh tính gần đúng của kết quả và mức độ thuộc vào các tập mờ
Bảng mờ là bảng dữ liệu liệt kê các giá trị mờ của đầu vào và đầu ra, cùng với các trọng số mờ tương ứng, thường được sử dụng để biểu diễn quy tắc mờ và quan hệ giữa các biến
Quy tắc mờ là cấu trúc dùng để liệt kê các điều kiện và kết luận mờ, xác định mối quan hệ giữa các biến đầu vào và đầu ra trong quá trình suy diễn
mờ
Mạng mờ là cấu trúc gồm các thủ tục mờ và quy tắc mờ, giúp giải quyết các vấn đề phức tạp trong trí tuệ nhân tạo và xử lý thông tin mờ, bằng cách lan truyền đầu vào qua các lớp để tạo ra kết quả mờ cuối cùng
Trang 191.1.3.3 Ứng dụng của Logic mờ
Trong khoa học, Logic mờ được áp dụng rộng rãi trong nhiều lĩnh vực như trí tuệ nhân tạo, xử lý dữ liệu, học máy và học cụ thể Logic mờ cung cấp khả năng biểu diễn tính mờ và không chắc chắn của thông tin, giúp mô hình
có khả năng xử lý và suy diễn dựa trên dữ liệu mờ và quy tắc mờ Điều này rất hữu ích khi mô hình phải đối mặt với dữ liệu không chính xác, nhiễu hoặc không rõ ràng
Trong lĩnh vực điều khiển, Logic mờ được sử dụng để xử lý các thông tin mờ và tạo ra các kết luận chính xác Các hệ thống điều khiển mờ có khả năng điều chỉnh linh hoạt dựa trên mức độ thuộc mờ và quy tắc mờ, cho phép điều khiển hiệu quả trong các môi trường không chắc chắn hoặc phức tạp
Trong lĩnh vực thị trường tài chính, Logic mờ được sử dụng để đánh giá và xử lý các thông tin tài chính mờ Logic mờ có thể giúp đưa ra quyết định đầu tư dựa trên sự phân tích mờ và không chắc chắn của dữ liệu thị trường, từ đó đảm bảo tính chính xác và hiệu quả của các quyết định tài chính
Trong lĩnh vực y tế, Logic mờ được áp dụng để xử lý và đánh giá các
dữ liệu y tế mờ Hệ thống y tế mờ có khả năng đưa ra chẩn đoán và quyết định điều trị dựa trên tính mờ và không chắc chắn của thông tin y tế, giúp cải thiện độ chính xác và hiệu quả trong quá trình chẩn đoán và điều trị bệnh
Ngoài các ứng dụng trên, Logic mờ còn được áp dụng trong rất nhiều lĩnh vực khác như công nghệ, năng lượng, xuất nhập khẩu và cảnh báo chất lượng Sự linh hoạt và khả năng xử lý thông tin mờ của Logic mờ giúp nâng cao hiệu quả và chính xác trong việc giải quyết các vấn đề phức tạp và không chắc chắn trong các lĩnh vực này
1.2 TỔNG QUAN MẠNG NƠ-RON NHÂN TẠO
Bộ não con người là hệ thống xử lý thông tin phức tạp và phi tuyến, có khả năng học tập, lưu trữ thông tin và tổng quát hóa Nó bao gồm khoảng 1011
Trang 20tế bào thần kinh nơron, kết nối với nhau thông qua khớp thần kinh để truyền tín hiệu điều tiết Mỗi tế bào nơron có cấu trúc bao gồm soma, dendrite và axon, và có khoảng 104 khớp thần kinh, bao gồm khớp nối kích thích và khớp nối ức chế
Hình 1.6 Tế bào nơron sinh học
Tế bào nơron truyền tín hiệu qua các dây thần kinh bằng cách giải phóng chất hóa học tại các kết nối giữa chúng Khi điện thế đạt đến ngưỡng nhất định, sẽ phát sinh một xung điện, gửi tín hiệu qua các dây thần kinh ra Mạng nơron nhân tạo là một mô hình toán học của bộ não con người, được xây dựng dựa trên cấu trúc của mạng tính toán phân bố song song Để sử dụng mạng nơron hiệu quả, thường cần phải huấn luyện trước
Hình 1.7 Mạng nơron nhân tạo
Trang 21Mạng nơron có ba thành phần chính: lớp dữ liệu đầu vào, lớp ẩn và lớp
dữ liệu đầu ra Lớp ẩn chuyển đổi dữ liệu từ lớp trước đó cho lớp xử lý tiếp theo Có thể có nhiều lớp ẩn Quá trình huấn luyện mạng nơron bao gồm việc chọn mô hình phù hợp, xác định cấu trúc và liên kết nơron, cũng như áp dụng thuật toán học để điều chỉnh các tham số và tối ưu cấu trúc mạng
1.2.1 Tế bào nơron
Mạng nơron nhân tạo, hay ANN (Artificial Neural Network), là một
mô hình toán học được lấy cảm hứng từ cấu trúc và hoạt động của bộ não con người Nó bao gồm các đơn vị xử lý được gọi là nơron nhân tạo, kết nối với nhau thông qua các liên kết có trọng số Mỗi nơron xử lý thông tin và tạo ra đầu ra dựa trên trọng số kết nối và hàm kích hoạt Mạng nơron có khả năng học và tự điều chỉnh dựa trên dữ liệu huấn luyện, cho phép thực hiện nhiều nhiệm vụ phức tạp như phân loại, dự đoán và nhận diện mẫu
Hình 1.8 Tế bào nơron nhân tạo
Tín hiệu đầu vào
Trong mạng nơron nhân tạo, tín hiệu đầu vào được biểu diễn bằng một vector (x1, x2, , xm) với m tín hiệu Trong đó, (m-1) tín hiệu đầu tiên thường gọi là tín hiệu kích thích và tín hiệu cuối cùng, gọi là ngưỡng, có giá trị +1 để điều chỉnh hoạt động của nơron Mỗi tín hiệu đầu vào được kết nối với một trọng số w, thể hiện mức độ quan trọng của tín hiệu đối với nơron, và có thêm một thành phần bias bi để điều chỉnh sự kích thích hoặc ức chế
Trang 22Hàm xử lý ở đầu vào có thể là hàm tuyến tính, hàm toàn phương hoặc hàm cầụ Trong đó, hàm tuyến tính được sử dụng phổ biến nhất và có dạng như sau:
Trong đó:
f(net) là đầu ra của nơron
net là tổng của tích của các tín hiệu đầu vào với trọng số tương ứng, cộng với thành phần bias
wj là trọng số của tín hiệu đầu vào thứ j
xj là giá trị của tín hiệu đầu vào thứ j
b là thành phần bias
Tín hiệu đầu ra
Trong mạng nơron nhân tạo, tín hiệu đầu ra của mỗi nơron được xác định bởi công thức y = ănet), trong đó ặ) là hàm chuyển đổị Các hàm chuyển đổi phổ biến bao gồm:
Hàm Sigmoid: Biểu diễn bởi công thức
Trang 23Hàm sigmoid đơn cực và sigmoid lƣỡng cực: Cung cấp sự linh hoạt trong việc điều chỉnh độ dốc của đầu ra dựa trên giá trị của tham số λ
Hình 1.9 Các dạng hàm tác động thông dụng a)Hàm bước nhảy; b) Hàm dấu; c) Hàm dốc; d) Hàm tuyến tính bão hòa; e)
Hàm sigmoid đơn cực; f) Hàm sigmoid lưỡng cực
Trong mạng nơron, các nơron sử dụng các hàm chuyển đổi này để tính toán đầu ra dựa trên tổng trọng số của các đầu vào, giúp mạng xử lý các vấn
đề phi tuyến và huấn luyện hiệu quả hơn
Hình 1.10 Mô hình tế bào nơron
Trang 24Nếu giữ tổng trọng số f như nhau, như trong ví dụ trên (f = 0.7), giá trị tín hiệu ra y sẽ khác nhau tùy vào dạng hàm chuyển đổi ặ) Trong trường
Trang 25hợp dùng hàm chuyển đổi tuyến tính (y = 0.7), giá trị tín hiệu ra y sẽ là 0.7 Trong khi đó, khi sử dụng hàm sigmoid (với λ = 1), giá trị tín hiệu ra y sẽ là khoảng 0.6681
Do đó, lựa chọn hàm chuyển đổi ặ) ở các dạng khác nhau có thể ảnh hưởng đáng kể đến kết quả của mạng nơron và quá trình học trong các ứng dụng thực tế
1.2.2 Các loại mô hình cấu trúc mạng nơ-ron
Mạng nơron truyền thẳng là một loại mạng trong đó tín hiệu chỉ truyền
từ lớp đầu vào đến lớp đầu ra thông qua các lớp ẩn Nó có thể không có hoặc
có nhiều lớp ẩn và được gọi là mạng đầy đủ Mạng phản hồi là loại mạng mà tín hiệu ra của một nơron được phản hồi vào đầu vào của các nơron trong các lớp trước đó hoặc của chính nó Mạng phản hồi có thể là mạng phản hồi bên hoặc mạng hồi quỵ Mạng hồi quy một lớp là một loại mạng nơron một lớp với kết nối hồi quy, thường được sử dụng trong các tác vụ liên quan đến dự đoán và xử lý chuỗi thời gian
Trang 26Hình 1.12 Các loại mạng nơron nhân tạo thông dụng a) Mạng nơ-ron truyền thẳng một lớp; b) Mạng nơ-ron truyền thẳng nhiều lớp; c) Mạng nơ-ron hồi quy một lớp; d) Mạng nơ-ron hồi quy nhiều lớp
1.2.3 Các tính chất của mạng nơ-ron
Mạng nơ-ron nhân tạo có các tính chất quan trọng sau:
Hệ phi tuyến: Mạng nơ-ron có khả năng xử lý các tác vụ phi tuyến tính, giúp giải quyết các bài toán phức tạp
Hệ xử lý song song: Cấu trúc song song của mạng nơ-ron cho phép nhiều nơ-ron hoạt động đồng thời, tăng tốc độ tính toán và thích hợp cho các ứng dụng nhận dạng và điều khiển
Hệ học và thích nghi: Mạng nơ-ron có khả năng học từ dữ liệu quá khứ
và tự thích nghi khi đối mặt với sự thay đổi của dữ liệu đầu vào
Hệ có nhiều biến, nhiều đầu vào và đầu ra (MIMO): Mạng nơ-ron có thể xử lý nhiều biến số đầu vào và đầu ra, làm cho nó trở nên linh hoạt và tiện dụng trong việc điều khiển các đối tƣợng có nhiều thông số đa dạng
Trang 271.2.4 Các nguyên tắc học
Mạng nơ-ron nhân tạo trải qua hai nhóm nguyên tắc học chính: học tham số và học cấu trúc Trong học tham số, trọng số kết nối giữa các nơ-ron được điều chỉnh để tối ưu hóa hiệu suất của mạng Phương pháp này có thể sử dụng các kỹ thuật học có giám sát, học củng cố và học không giám sát để cập nhật trọng số Trong khi đó, học cấu trúc giải quyết việc xác định cấu trúc phù hợp của mạng, bao gồm số lượng lớp, nơ-ron và kết nối
a Học có giám sát (Supervised Learning)
Trong học có giám sát, dữ liệu huấn luyện được biểu diễn dưới dạng các cặp (dữ liệu đầu vào - dữ liệu đầu ra) mong muốn Các trọng số của mạng được cập nhật dựa trên sai số giữa dữ liệu ra thực tế và dữ liệu ra mong muốn Quá trình cập nhật tiếp tục cho đến khi sai số đạt đủ nhỏ hoặc khi đạt số lần
huấn luyện quy định
Hình 1.13 Học có giám sát
b Học củng cố (Reinforcement Learning)
Học củng cố không yêu cầu thông tin đầy đủ về đầu ra cho mỗi mẫu đầu vào và không chỉ dẫn cụ thể cách điều chỉnh trọng số Thay vào đó, mạng phải thử nghiệm và điều chỉnh dựa trên phản hồi về hiệu suất của các hành
Trang 28động Phương pháp này thường được sử dụng trong tối ưu hóa và điều khiển, nơi mạng cần tìm ra cách tối ưu hóa hành vi dựa trên phản hồi về hiệu suất
Hình 1.14 Học củng cố
c Học không có giám sát (Unsupervised Learning)
Học không giám sát không dựa vào phản hồi từ dữ liệu đầu ra Thay vào đó, mạng tự phát hiện đặc điểm, mối quan hệ và nhóm dữ liệu đầu vào Quá trình này giúp mạng tự tổ chức thông qua việc điều chỉnh các thông số để tạo ra biểu diễn tốt nhất của dữ liệu, mà không cần thông tin phản hồi cụ thể Học không giám sát thường được sử dụng trong gom nhóm, giảm chiều dữ liệu và phát hiện bất thường, giúp mạng nơron hiểu rõ hơn về cấu trúc và tính chất của dữ liệu
Hình 1.15 Học không giám sát
Trang 29So sánh ba phương pháp mạng nơron với ba cách học của bộ não con người
Bảng 1.1 So sánh bộ não con người với phương pháp học của mạng nơron nhân tạo
Bộ não con người Mạng nơron nhân tạo
Học có sự hướng dẫn của giáo viên Học có giám sát
Học có sự đánh giá của giáo viên Học củng cố
Hình 1.16 Sơ đồ tổng quát một tế bào nơron nhân tạo trong huấn luyện
Trong quá trình học, các tín hiệu đầu vào xj (với j = 1, 2, , m ) có thể được phát ra từ tín hiệu ra của các tế bào nơron khác hoặc từ các tín hiệu nhập
từ bên ngoài Trong khi đó, ngưỡng của tế bào nơron cũng được xem xét và biểu diễn dưới dạng một trọng số của đầu vào xm với giá trị cố định là -1 Tín hiệu ra mong muốn thường chỉ tồn tại trong phương pháp học có giám sát hoặc trong phương pháp học củng cố, và thường được coi là tín hiệu đánh giá Tổng quát, vector trọng số của tế bào nơron thay đổi theo một quy luật cụ thể
Trang 30trong đó ( )là biến thiên của vector trọng số tại bước lặp thứ k
η là một số dương quyết định tốc độ học, gọi là hằng số học; r là tín
hiệu học, tổng quát là hàm của wj, x và tín hiệu mong muốn di
( ( ) ( ) ) ( ) ( ) ( ) (1.5)
1.2.5 Thuật toán lan truyền ngược
Thuật toán lan truyền ngược (BP) là một phương pháp quan trọng trong huấn luyện mạng nơron Được Werbos đề xuất năm 1970, BP cập nhật trọng
số mạng bằng cách sử dụng gradient descent Quá trình huấn luyện gồm hai bước: lan truyền tiến tính toán dự đoán và lan truyền ngược sai số điều chỉnh trọng số BP giúp giảm thiểu sai số của mạng nơron và có nhiều ứng dụng từ
dự báo thời tiết đến phân tích dữ liệu Mặc dù thường được sử dụng trong học sâu, BP cũng là công cụ tính toán mạnh mẽ cho nhiều lĩnh vực, và thường được gọi là "phép vi phân ngược"
Hình 1.17 Kiến trúc của mạng nơron lan truyền ngược
Backpropagation điều chỉnh trọng số mạng để giảm sai số giữa đầu ra thực tế và mong muốn Nó tạo ra các tính năng mới giúp phân biệt từ các
Trang 31phương pháp trước đó và giảm chức năng chi phí bằng cách điều chỉnh trọng
số và độ lệch của mạng dựa trên độ dốc của hàm chi phí
Thuật toán lan truyền ngược được mô tả như sau:
Bước 1: Khởi tạo trọng số bởi các giá trị ngẫu nhiên nhỏ
Bước 2: Lặp lại cho tới khi thỏa mãn điều kiện kết thúc
Với mỗi mẫu, thực hiện các bước sau:
2.1 Tính đầu ra oj cho mỗi nút j:
Trang 32w ji : trọng số trên xji
b j : ngƣỡng tại nút thứ j
o j : đầu ra của nút thứ j
t j: đầu ra mong muốn của nút thứ j
Downstream(j): Tập tất cả các nút nhận đầu ra của nút thứ j làm một
giá trị đầu vào
η: tốc độ học
f: hàm truyền với f(x) = 1 / (1 + e-x)
Trang 33CHƯƠNG 2 THUẬT TOÁN ANFIS VÀ BÀI TOÁN DỰ BÁO DỮ LIỆU
CHUỖI THỜI GIAN 2.1 BÀI TOÁN DỰ BÁO
2.1.1 Khái niệm
Dự báo là một khoa học và nghệ thuật tiên đoán những sự việc sẽ xảy
ra trong tương lai, dựa trên việc phân tích khoa học về các dữ liệu đã được thu thập Trong thực tế, chúng ta thường phải đưa ra các quyết định liên quan đến
dự báo để chuẩn bị cho các biến động và thách thức trong tương lai và công việc dự báo đóng vai trò quan trọng trong việc đảm bảo tính tin cậy và hiệu quả của những quyết định đó Điều này đặc biệt quan trọng trong một môi trường kinh tế cạnh tranh như hiện nay
Tính khoa học của dự báo được thể hiện qua việc chúng ta sử dụng các
số liệu phản ánh tình hình hiện tại, quá khứ, và xu hướng phát triển để dự đoán tình hình sẽ diễn ra trong tương lai, dựa trên các mô hình toán học Tuy nhiên, các dự đoán này thường có thể không chính xác hoặc thay đổi khi gặp phải các tình huống kinh tế hoặc quản trị không phù hợp hoàn toàn với mô hình dự báo
Tính nghệ thuật của dự báo phụ thuộc vào kinh nghiệm thực tế và khả năng đánh giá của các chuyên gia, giúp họ đưa ra những dự đoán với độ chính xác cao nhất
2.1.2 Đặc điểm
Không thể đảm bảo chắc chắn về tương lai: Dù chúng ta sử dụng phương pháp nào, luôn tồn tại yếu tố không chắc chắn cho đến khi thực tế diễn ra
Có điểm mù: Không thể dự báo một cách hoàn toàn chính xác về những
gì sẽ xảy ra trong tương lai Đôi khi, không thể dự báo được nếu chúng ta thiếu thông tin về vấn đề cần dự báo