XÁC ĐỊNH QUAN HỆ MỜ BẰNG MẠNG NƠRON NHÂN TẠO
Trang 1KHOA CÔNG NGHỆ THÔNG TIN
Giáo viên hướng dẫn : T.S Nguyễn Tân Ân
Sinh viên thực hiện : Nguyễn Thị Thuý Chinh Lớp : C-K54-CNTT.
Hà Nội 4/2008
Trang 2PHẦN MỞ ĐẦU
1 Tên đề tài
Xác định quan hệ mờ bằng mạng nơron nhân tạo.
2 Lý do chọn đề tài
Từ 20 năm nay, lý thuyết tập mờ và mạng nơron nhân tạo đã phát triển rất nhanh và đa dạng Công nghệ mờ và công nghệ mạng nơron đã cung cấp những công nghệ mới cho các ngành công nghiệp làm ra nhiều sản phẩm thông minh, đáp ứng nhu cầu thị trường cần có những bộ điều khiển linh hoạt hơn Hệ mờ và mạng nơron được kết hợp với nhau để cùng phát huy những ưu điểm của chúng Một trong những dạng kết hợp đó là mạng nơron mờ, nhờ có nó mà chúng ta đã giải quyết được rất nhiều bài toán khó mà với thuật giải thông thì không thực hiện được hoặc nếu có thì cũng rất phức tạp và mất nhiều thời gian.
Với bài toán xác định quan hệ giữa không gian vào và không gian ra dựa
trên các cặp phần tử vào ra đã biết Cụ thể cho không gian vào X , không gian ra Y và các cặp phần tử vào ra ( x y đã biết , tức là cho một phần tử x X, ) Î thì
có một phần tử ra tương ứng y YÎ Yêu cầu bài toán đặt ra là xác định quan
hệ R giữa X và Y Một trong những phương pháp thường được sử dụng để
giải quyết bài toán trên đó là phương pháp bình phương bé nhất Để giảm độ phức tạp và thời gian tính toán trong báo cào này tôi sử dụng một phương pháp mới đó là dùng mạng nơron nhân tạo Và quan hệ giữa không gian vào và ra xác định được không phải là quan hệ bình thường mà là quan hệ mờ.
Bài nghiên cứu gồm những phần sau:
I Tổng quan lý thuyết tập mờ và quan hệ mờ
Giới thiệu về khái niệm tập mờ, các phép toán trên tập mờ, quan hệ mờ II Giới thiệu về mạng nơron nhân tạo
Giới thiệu cấu trúc của một nơron, định nghĩa và phân loại mạng nơron, các thủ học mạng nơron, thuật toán lan truyền ngược
Trang 3III Bài toỏn xỏc định quan hệ mờ bằng mạng nơron nhõn tạo
Ánh xạ bài toỏn xỏc định quan hệ mờ lờn mạng nơron nhõn tạo, đưa ra cỏch huấn luyện mạng Cuối cựng là demo thuật toỏn xỏc định quan hệ mờ bằng mạng nơron nhõn tạo.
I Tổng quan lý thuyết tập mờ và quan hệ mờ
1.1 Khỏi niệm tập mờ
Tập mờ được xem là sự mở rộng trực tiếp của tập kinh điển Bõy giờ ta xột khỏi niệm hàm thuộc của tập kinh điển.
được gọi là hàm thuộc của tập A Tập A là tập kinh điển, U là khụng gian
nền Như vậy hàm thuộc của tập cổ điển chỉ nhận hai giỏ trị là 0 hoặc 1 Giỏ trị 1 của hàm thuộc mA( )x cũn được gọi là giỏ trị đỳng, ngược lại 0 là giỏ trị sai của mA( )x Một tập U luụn cú
A={ x U xẻ thoả mãn một số tính chất nào đó}
thỡ được gọi là cú tập nền U , hay được định nghĩa trờn tập nền U Vớ dụ tập
{ 9 12}
A= xẻ Ơ < x<
cú tập nền là tập cỏc số tự nhiờn Ơ.
Trang 4Hàm thuộc mA( )x định nghĩa trên tập A , trong khái niệm kinh điển chỉ cĩ hai giá trị là 1 nếu x AỴ hoặc 0 nếu x Ạ Hình 1.1 mơ tả hàm thuộc của
hàm mA( )x , trong đĩ tập A được định nghĩa như sau:
{ 2 6}
A= xỴ ¡ < x< (1.2)
Hình 1.1 Hàm thuộc mA( )x của tập kinh điển A
Cách biểu diễn hàm phụ thuộc như vậy khơng phù hợp với những tập
được mơ tả “mờ” như tập B gồm các số thực dương nhỏ hơn nhiều so với 6
Tập B , C như vậy được gọi là các tập mờ.
Lý do là với những định nghĩa “mờ” như vậy chưa đủ để xác định được một số chẳng hạn như x =4,5 cĩ thuộc B hoặc x =2,5 cĩ thuộc C hay
khơng Nên chúng ta khơng thể dùng hàm thuộc của tập cổ điển chỉ cĩ hai giá
trị 1 và 0 để định nghĩa tập B và C trong trường hợp này.
Vì vậy người ta nghĩ rằng: tại sao lại khơng mở rộng miền giá trị cho hàm thuộc của tập cổ điển, tức là hàm thuộc sẽ cĩ nhiều hơn hai giá trị Khi đĩ
thay vì việc trả lời câu hỏi x =4,5 cĩ thuộc B hay khơng, ngưịi ta sẽ trả lời
câu hỏi là: vậy thì x =4,5 thuộc B bao nhiêu phần trăm? Giả sử rằng cĩ câu
Trang 5trả lời thì lúc này hàm thuộc mB( )x tại điểm x =4,5 phải có một giá trị trong đoạn [0,1 , tức là ]
Nói cách khác hàm mB( )x không còn là hàm hai giá trị như đối với tập
kinh điển nữa mà là một ánh xạ (hình 1.2)
Ánh xạ m được gọi là hàm thuộc (hàm phụ thuộc hay hàm thành viên ) Fcủa tập mờ F Tập kinh điển U được gọi là tập nền (hay tập vũ trụ) của tập mờ F
Ví dụ một tập mờ F của các số tự nhiên nhỏ hơn 6 với hàm phụ thuộc
Trang 6Giống như định nghĩa về tập mờ các phép toán trên tập mờ cũng sẽ được định nghĩa thông qua các hàm thuộc Nói cách khác, khái niệm xây dựng những phép toán trên tập mờ là việc xác định các hàm thuộc cho phép hợp, giao , bù từ những tập mờ Một nguyên tắc cơ bản trong việc xây dựng các phép toán trên tập mờ là không được mâu thuẫn với những phép toán đã có trong lý thuyết tập hợp kinh điển
1.2.1 Phép hợp
Cho hai tập hợp mờ A và B có cùng không gian nền U với hai hàm
thuộc tương ứng là mA( )x và mB( )x Hợp của A và B là một tập mờ cũng xác định trên U , kí hiệu là A BÈ có hàm thuộc mA BÈ ( )x thoả mãn:
Để tính hàm thuộc mA BÈ ( )x có nhiều cách khác nhau, sau đây là một công thức được dùng trong báo cáo này:
Trang 7( ) max{( ), ( )}
m È = mm (Luật lấy max) (1.8)
Hình 1.3 Hàm thuộc của hai tập mờ có cùng không gian nềna) Hàm thuộc của hai tập mờ A và B
b) Hợp của hai tập mờ A và B theo luật max.
Một cách tổng quát thì bất cứ một ánh xạ dạng
( ) : [0,1]
A Bx U
nếu thoả mãn 5 tiêu chuẩn đã nêu trong định nghĩa hợp hai tập mờ đều được
xem như là hợp của hai tập mờ A và B có chung một không gian nền U
Công thức trên cũng được mở rộng để áp dụng cho việc xác định hợp của hai tập mờ không cùng không gian nền, bằng cách đưa cả hai tập mờ về chung một không gian nền là tích của hai tập nền đã cho.
Ví dụ cho tập mờ A xác định trên không gian nền M và tập mờ B xác định trên không gian nền N Do hai tập nền M và N độc lập với nhau nên
hàm thuộc mA( )x, x MÎ của tập mờ A sẽ không phụ thuộc vào N và ngược
lại mB( )x, y NÎ của tập B cũng sẽ không phụ thuộc vào M Điều đó thể hiện ở chỗ trên không gian nền mới là tập tích M N´ hàm mA( )x phải là một
Trang 8mặt “cong” dọc theo trục y và mB( )x là một mặt “cong” dọc theo trục x (hình 1.4) Tập mờ A như vậy được định nghĩa trên hai không gian nền M và M N´ Để phân biệt được chúng, sau đây kí hiệu A sẽ được dùng để chỉ tập mờ A trên không gian nền M N´ Đối với các tập mờ khác cũng được kí hiệu tương tự Với kí hiệu đó thì a Hàm thuộc của hai tập mờ A và B
b Đưa hai tập mờ về chung một nền M N´
Trang 9c Hợp hai tập mờ trên nền M N´
Sau khi đã đưa được hai tập mờ A và B về chung một không gian nền là M N´ thành A và B thì hàm thuộc mA BÈ (x y, ) của tập mờ A BÈ được xác định theo công thức (1.8).
Hợp hai tập mờ theo luật max
Cho tập mờ A xác định trên không gian nền M và tập mờ B xác định trên không gian nền N , có hàm thuộc lần lượt là mA( )x , mB( )x Hợp của hai
tập mờ A và B theo luật max là một tập mờ xác định trên không gian nền
Một cách tổng quát, do hàm thuộc mA BÈ (x y, ) của hợp hai tập mờ A , B
không cùng không gian nền chỉ phụ thuộc vào mA( ) [x Î 0,1] và mB( ) [x Î 0,1]
nên ta có thể xem mA BÈ (x y, ) là hàm của hai biến m , Am được định nghĩa như B
Trang 10Hàm thuộc của hợp giữa hai tập mờ A với mA( )x định nghĩa trên không
gian nền M và B với mB( )x định nghĩa trên không gian nền N là một hàm
hai biến m m m( A, B) [: 0,1]2 ® [0,1] xác định trên nền M N´ thoả mãn: a) m =B 0 Þ m m m( A, B) =mA.
b) m m m( A, B) =m m m( B, A) , tức là có tính giao hoán.
c) m m m m m( A, ( B, C)) =m m m m m(( A, B), C) , tức là có tính kết hợp.
d) m m m( A, B) £ m m m( C, D), "m m m mA £ C, B£ D, tức là có tính không giảm Một hàm hai biến m m m( A, B) [: 0,1]2 ® [0,1] thoả mãn các điều kiện của
định nghĩa trên còn được gọi là hàm t-đối chuẩn (t-conorm).
1.2.2 Phép giao
Cho hai tập hợp mờ A và B có cùng không gian nền U với hai hàm
thuộc tương ứng là mA( )x và mB( )x Giao của A và B là một tập mờ cũng xác định trên U , kí hiệu là A BI có hàm thuộc mA BI ( )x thoả mãn:
Tương tự như đã trình bày về phép hợp hai tập mờ, có nhiều công thức khác nhau để tính hàm thuộc mA BI ( )x của giao hai tập mờ và bất cứ một ánh xạ
Trang 11( ) : [0,1]
A Bx U
nào thoả mãn 5 tiêu chuẩn đã nêu trong định nghĩa trên đều được xem như là
hàm thuộc của giao hai tập mờ A và B có chung một không gian nền U Sau
đây là một trong những công thức để tính hàm thuộc mA BI ( )x của phép giao gồm:
( ) min{( ), ( )}
m I = mm (Luật min) (1.11) Công thức trên cũng áp dụng được cho hợp hai tập mờ không cùng không gian nền bằng cách đưa cả hai tập mờ về chung một không gian nền là tích của hai không gian nền đã cho.
Hình 1.5 Phép giao của hai tập mờ
a) Hàm thuộc của hai tập mờ A và B
b) Phép giao hai tập mờ cùng không gian nền theo luật min.
c) Phép giao hai tập mờ cùng không gian nền theo luật tích đại số d) Phép giao hai tập mờ không cùng khôn gian nền
Trang 12Giao của hai tập mờ theo luật min
Giao của hai tập mờ A với hàm thuộc mA( )x định nghĩa trên không gian
nền M và B với hàm thuộc mB( )x định nghĩa trên không gian nền N là một tập mờ xác định trên không gian nền M N´ có hàm thuộc
Với ví dụ về tập mờ A , B có hàm đặc tính như trong hình 1.5a thì tập giao của chúng trên tập nền chung M N´ sẽ có hàm thuộc mô tả như trong
hình 1.5d.
Trong ví dụ trên ta thấy hàm thuộc mA BÇ ( x y, ) của giao hai tập mờ A , B
không cùng không gian nền chỉ phụ thuộc vào mA( ) [x Î 0,1] và mB( ) [x Î 0,1] Do đó không mất tính tổng quát nếu ta xem mA BÇ ( x y, ) là hàm của hai biến mA
, m được định nghĩa như sauB
( , )( , ) [: 0,1]2 [0,1]
Ta đi đến định nghĩa về hàm thuộc m m m của hợp hai tập mờ không ( A, B)
cùng không gian nền như sau:
Định nghĩa 1.4
Hàm thuộc của hợp giữa hai tập mờ A với mA( )x định nghĩa trên không
gian nền M và B với mB( )x định nghĩa trên không gian nền N là một hàm
hai biến m m m( A, B) [: 0,1]2 ® [0,1] xác định trên nền M N´ thoả mãn: e) m =B 1 Þ m m m( A, B) =mA.
f) m m m( A, B) =m m m( B, A) , tức là có tính giao hoán.
Trang 13g) m m m m m( A, ( B, C)) =m m m m m(( A, B), C) , tức là có tính kết hợp.
h) m m m( A, B) £ m m m( C, D), "m m m mA £ C, B£ D, tức là có tính không giảm Một hàm hai biến m m m( A, B) [: 0,1]2 ® [0,1] thoả mãn các điều kiện của
định nghĩa trên còn được gọi là hàm t- chuẩn (t-norm).
1.2.3 Phép bù
Cho tập mờ A trên không gian nền U Phép bù của A là một tập mờ cũng xác định trên không gian nền U , kí hiệu là A , nó có hàm thuộc thoả c
i mAc( )x chỉ phụ thuộc vào mA( )x
ii Nếu x AÎ thì x AÏ c, hay mA( )x = 1 Þ mAc( )x =0
iii Nếu xÏ thì Ax AÎ c, hay mA( )x = Þ 0 mAc( )x =1
m như là một hàm của mA( )x trong [0,1 Từ đó đưa ra định nghĩa tổng ]
quát hơn về phép bù mờ như sau:
Trang 14Cho X , Y là hai không gian nền R gọi là một quan hệ mờ trên X´ Y nếu R là một tập mờ trên X´ Y , tức là có một hàm thuộc mR : X Y´ ® [0,1], ở đây mR( x y, ) =R x y( , ) là độ thuộc của (x y vào quan hệ R , )
- Tính bắc cầu
Định nghĩa: Quan hệ mờ R trên X´ X gọi là:
a) Min-chuyển tiếp nếu min{ R x y R y z( , ,) ( , )} £ R x z( , , ,) "x y z XÎ b) Bắc cầu yếu nếu "x y z X, , Î có
Trang 15* Phương trình quan hệ mờ
Phương trình quan hệ mờ lần đầu tiên nghiên cứu bởi GS.Sanchez năm 1976, đóng vai trò quan trọng trong các lĩnh vực phân tích các hệ mờ, thiết kế các bộ điều khiển mờ, quá trình lấy quyết định và nhận dạng mờ.Dạng đơn giản nhất có thể diễn đạt như sau:
Cho một hệ mờ biểu diễn dưới dạng một quan hệ mờ nhị nguyên R trên không gian tích X´ Y Đầu vào (input) của hệ là một tập mờ A cho trên không gian nền input X Tác động của đầu vào A với hệ R sẽ là phép hợp thành A Ro sẽ cho ở đầu ra (output) một tập mờ trên không gian nền Y , kí hiệu là B Khi ấy ta có A Ro =B.
II Giới thiệu về mạng nơron nhân tạo
Mạng nơron hay mạng nơron nhân tạo là sự tái tạo bằng kỹ thuật những chức năng của hệ thần kinh con người Trong quá trình tái tạo không phải tất cả các chức năng của bộ não con người có đều được tái tạo, mà chỉ có những chức năng cần thiết Bên cạnh đó còn có những chức năng mới được tạo ra nhằm giải quyết một bài toán điều khiển đã định hướng trước Trước khi tìm hiểu về mạng nơron chúng ta giới thiệu sơ lược về mạng nơron sinh học.
2.1 Mạng nơron sinh học
Não người là tổ chức vật chất cấp cao, có cấu tạo vô cùng phức tạp, dày đặc các mối liên kết giữa các nơron nhưng xử lý thông tin rất linh hoạt trong môi trường bất định
Trang 16Hình 2.1 Mô hình mạng nơron sinh học
Trong bộ não người có khoảng 10 - 10 tế bào thần kinh được gọi là 1112
các nơron và mỗi nơron có thể liên kết với 10 nơron khác thông qua các 14
khớp nối thần kinh (synapse) Dưới con mắt của những người làm tin học cấu tạo của mỗi nơron gồm các thành phần cơ bản sau:
- Thân nơron được giới hạn trong một màng membran và trong cùng là nhân Từ thân nơron còn có rất nhiều đường rẽ nhánh tạm gọi là rễ - “Bus” liên kết nơron này với các nơron khác được gọi là axon, trên
axon có các đường rẽ nhánh Nơron còn có thể liên kết với các nơron khác qua các rễ Chính vì cách liên kết đa dạng như vậy nên mạng nơron có độ liên kết rất cao.
Các rễ của noron được chia làm hai loại: loại nhận thông tin từ các
nơron khác qua axon, mà ta sẽ gọi là rễ đầu vào và loại đưa thông tin qua axon tới các nơron khác, gọi là rễ đầu ra Một nơron có thể có nhiều rễ đầu vào,
nhưng chỉ có một rễ đầu ra Bởi vậy nếu coi nơron như một khâu điều khiển thì nó chính là khâu có nhiều đầu vào, một đầu ra Một nơron sẽ ở trạng thái kích thích khi tại đầu vào xuất hiện một tín hiệu tác động vượt quá ngưỡng cân bằng của nơron.
Một tính chất rất cơ bản của mạng nơron sinh học là các đáp ứng theo kích thích có khả năng thay đổi theo thời gian Các đáp ứng có thể tăng lên, giảm đi hoặc hoàn toàn biến mất Qua các nhánh axon liên kết tế bào nơron
Trang 17này với các nơron khác, sự thay đổi trạng thái của một nơron cũng dẫn theo sự thay đổi trạng thái của những nơron khác và do đó là sự thay đổi của toàn bộ mạng nơron Việc thay đổi trạng thái của mạng nơron có thể thực hiện qua một quá trình “dạy” hoặc do khả năng “học” tự nhiên.
Cấu trúc của mạng nơron luôn luôn phát triển và thay đổi để thích nghi dần với môi trường, làm cho cấu trúc bộ não ngày càng trở nên phức tạp sau mỗi lần học Một số cấu trúc của nơron được xác định trước, một số sau này mới được hình thành và một số thì bị huỷ bỏ qua quá trình chọn lọc tự nhiên, học và thích nghi.
Các nhà khoa học đã và đang xây dựng và phát triển các mô hình xử lý thông tin mô phỏng hoạt dộng của bộ não người Đó chính là mô hình mạng nơron nhân tạo
2.2 Mạng nơron nhân tạo
2.2.1 Mô hình nơron nhân tạo
Một nơron nhân tạo phản ánh các tính chất cơ bản của nơron sinh học Mỗi nơron nhân tạo là một đơn vị xử lí thông tin làm cơ sở cho hoạt động của một mạng nơron Nó có chức năng nhận tín hiệu vào, tổng hợp và xử lý các tín hiệu vào để tính tín hiệu ra Dưới đây là một mô hình của một nơron nhân tạo.
Hình 2.2 Mô hình một nơron nhân tạo
Trang 18- x với ii=1,2, ,n: các tín hiệu đầu vào.
- w với iji=1,2, ,n: các trọng số tương ứng với đầu vào - q : ngưỡng kích hoạt của nơron j j
- net : tín hiệu tổng hợp đầu vào.
- (f net : Hàm kích hoạt.) - y : tín hiệu ra của nơron j j
Đầu vào của nơron nhân tạo gồm n tín hiệu x với ii=1,2, ,n Mỗi tín hiệu đầu vào tương ứng với một trọng số w với iji=1,2, ,n, nó thể hiện mức độ ảnh hưởng của tín hiệux đến nơron j i
Một nơron có thể có nhiều đầu vào nhưng chỉ có một tín hiệu đầu ra Tín hiệu đầu vào của một nơron có thể là dữ liệu từ bên ngoài mạng, hoặc đầu ra của một nơron khác, hoặc là đầu ra của chính nó.
Nhằm tăng khả năng thích nghi của mạng nơron trong quá trình học, người ta sử dụng gán thêm một tham số (Bias) cho mỗi nơron nhân tạo Tham
số đó còn gọi là trọng số của nơron, ta kí hiệu trọng số của nơron thứ j là q j
Mỗi một nơron trong một mạng kết hợp các giá trị đưa vào nó thông qua
các liên kết với nơron khác, sinh ra một giá trị gọi là net Hàm thực hiện
nhiệm vụ này gọi là hàm kết hợp (combination function), được định nghĩa bởi một luật lan truyền cụ thể Trong phần lớn các mạng nơron, chúng ta giả sử rằng mỗi một nơron cung cấp một bộ cộng như là đầu vào cho đơn vị mà nó
liên kết Để tính tổng hợp tín hiệu đầu vào net , ta giả định net là hàm của các
Có nhiều cách để tính tổng tín hiệu vào của nơron, trên dây là cách khá đơn giản và hữu ích khi chúng ta xây dựng một mạng có nhiều nơron