Với bài toán xác định quan hệ giữa không gian vào và không gian ra dựa trên các cặp phần tử vào ra đã biết.. Cách biểu diễn hàm phụ thuộc như vậy không phù hợp với những tập được mô tả “
Trang 1KHOA CÔNG NGHỆ THÔNG TIN
Hà Nội 4/2008
Trang 2nó mà chúng ta đã giải quyết được rất nhiều bài toán khó mà với thuật giải thông thì không thực hiện được hoặc nếu có thì cũng rất phức tạp và mất nhiều thời gian
Với bài toán xác định quan hệ giữa không gian vào và không gian ra dựa
trên các cặp phần tử vào ra đã biết Cụ thể cho không gian vào X , không gian
ra Y và các cặp phần tử vào ra (x y, )đã biết , tức là cho một phần tử xÎ X thì
có một phần tử ra tương ứng yÎ Y Yêu cầu bài toán đặt ra là xác định quan
hệ R giữa X và Y Một trong những phương pháp thường được sử dụng để
giải quyết bài toán trên đó là phương pháp bình phương bé nhất Để giảm độ phức tạp và thời gian tính toán trong báo cào này tôi sử dụng một phương pháp mới đó là dùng mạng nơron nhân tạo Và quan hệ giữa không gian vào
và ra xác định được không phải là quan hệ bình thường mà là quan hệ mờ Bài nghiên cứu gồm những phần sau:
I Tổng quan lý thuyết tập mờ và quan hệ mờ
Giới thiệu về khái niệm tập mờ, các phép toán trên tập mờ, quan hệ mờ
II Giới thiệu về mạng nơron nhân tạo
Giới thiệu cấu trúc của một nơron, định nghĩa và phân loại mạng nơron, các thủ học mạng nơron, thuật toán lan truyền ngược
Trang 3III Bài toỏn xỏc định quan hệ mờ bằng mạng nơron nhõn tạo
Ánh xạ bài toỏn xỏc định quan hệ mờ lờn mạng nơron nhõn tạo, đưa ra cỏch huấn luyện mạng Cuối cựng là demo thuật toỏn xỏc định quan hệ mờ bằng mạng nơron nhõn tạo
I Tổng quan lý thuyết tập mờ và quan hệ mờ
mU( ) x = 1, với mọi x
được gọi là khụng gian nền (tập nền)
Một tập A cú dạng
A= {xẻ U x thoả mãn một số tính chất nào đó}
thỡ được gọi là cú tập nền U , hay được định nghĩa trờn tập nền U Vớ dụ tập
A= xẻ Ơ < x<
cú tập nền là tập cỏc số tự nhiờn Ơ
Trang 4Hàm thuộc mA( ) x định nghĩa trên tập A , trong khái niệm kinh điển chỉ
có hai giá trị là 1 nếu xÎ A hoặc 0 nếu xÏ A Hình 1.1 mô tả hàm thuộc của
hàm mA( ) x , trong đó tập A được định nghĩa như sau:
A= {xÎ ¡ 2< x< 6} (1.2)
Hình 1.1 Hàm thuộc m A( )x của tập kinh điển A
Cách biểu diễn hàm phụ thuộc như vậy không phù hợp với những tập
được mô tả “mờ” như tập B gồm các số thực dương nhỏ hơn nhiều so với 6
có tập nền là ¡ , hoặc tập C gồm các số thực gần bằng 3 cũng có tập nền ¡
Tập B , C như vậy được gọi là các tập mờ
Lý do là với những định nghĩa “mờ” như vậy chưa đủ để xác định được một số chẳng hạn như x = 4,5 có thuộc B hoặc x = 2,5 có thuộc C hay
không Nên chúng ta không thể dùng hàm thuộc của tập cổ điển chỉ có hai giá trị 1 và 0 để định nghĩa tập B và C trong trường hợp này
Vì vậy người ta nghĩ rằng: tại sao lại không mở rộng miền giá trị cho
hàm thuộc của tập cổ điển, tức là hàm thuộc sẽ có nhiều hơn hai giá trị Khi
đó thay vì việc trả lời câu hỏi x = 4,5 có thuộc B hay không, ngưòi ta sẽ trả
lời câu hỏi là: vậy thì x = 4,5 thuộc B bao nhiêu phần trăm? Giả sử rằng có
Trang 5câu trả lời thì lúc này hàm thuộc m B( )x tại điểm x = 4,5 phải có một giá trị trong đoạn [ ]0,1 , tức là
0£ m B( )x £ 1 (1.5) Nói cách khác hàm m B( )x không còn là hàm hai giá trị như đối với tập
kinh điển nữa mà là một ánh xạ (hình 1.2)
Ánh xạ m được gọi là hàm thuộc (hàm phụ thuộc hay hàm thành viên ) F
của tập mờ F Tập kinh điển U được gọi là tập nền (hay tập vũ trụ) của tập
Trang 61.2.1 Phép hợp
Cho hai tập hợp mờ A và B có cùng không gian nền U với hai hàm thuộc tương ứng là m A( )x và m B( )x Hợp của A và B là một tập mờ cũng xác định trên U , kí hiệu là AÈB có hàm thuộc m A BÈ ( )x thoả mãn:
Trang 7Hình 1.3 Hàm thuộc của hai tập mờ có cùng không gian nền
a) Hàm thuộc của hai tập mờ A và B
b) Hợp của hai tập mờ A và B theo luật max
Một cách tổng quát thì bất cứ một ánh xạ dạng
m A BÈ ( )x U: ® [ ]0,1 nếu thoả mãn 5 tiêu chuẩn đã nêu trong định nghĩa hợp hai tập mờ đều được
xem như là hợp của hai tập mờ A và B có chung một không gian nền U
Công thức trên cũng được mở rộng để áp dụng cho việc xác định hợp của hai tập mờ không cùng không gian nền, bằng cách đưa cả hai tập mờ về chung một không gian nền là tích của hai tập nền đã cho
Ví dụ cho tập mờ A xác định trên không gian nền M và tập mờ B xác định trên không gian nền N Do hai tập nền M và N độc lập với nhau nên
hàm thuộc m A( )x , xÎ M của tập mờ A sẽ không phụ thuộc vào N và ngược
lại m B( )x , yÎ N của tập B cũng sẽ không phụ thuộc vào M Điều đó thể hiện ở chỗ trên không gian nền mới là tập tích M´ N hàm m A( )x phải là một
mặt “cong” dọc theo trục y và m B( )x là một mặt “cong” dọc theo trục x (hình 1.4) Tập mờ A như vậy được định nghĩa trên hai không gian nền M và
Trang 8M´ N Để phân biệt được chúng, sau đây kí hiệu A sẽ được dùng để chỉ tập
mờ A trên không gian nền M´ N Đối với các tập mờ khác cũng được kí hiệu tương tự Với kí hiệu đó thì
a Hàm thuộc của hai tập mờ A và B
b Đưa hai tập mờ về chung một nền M´ N
Trang 9Sau khi đã đưa được hai tập mờ A và B về chung một không gian nền là
M´ N thành A và B thì hàm thuộc m A BÈ (x y, ) của tập mờ AÈB được xác định theo công thức (1.8)
Hợp hai tập mờ theo luật max
Cho tập mờ A xác định trên không gian nền M và tập mờ B xác định trên không gian nền N , có hàm thuộc lần lượt là m A( )x , m B( )x Hợp của hai
tập mờ A và B theo luật max là một tập mờ xác định trên không gian nền
Một cách tổng quát, do hàm thuộc m A BÈ (x y, ) của hợp hai tập mờ A , B
không cùng không gian nền chỉ phụ thuộc vào m A( ) [ ]x Î 0,1 và m B( ) [ ]x Î 0,1nên ta có thể xem m A BÈ (x y, ) là hàm của hai biến m , A m được định nghĩa như B
Hàm thuộc của hợp giữa hai tập mờ A với m A( )x định nghĩa trên không
gian nền M và B với m B( )x định nghĩa trên không gian nền N là một hàm
hai biến m m m( A, B) [ ]: 0,12 ® [ ]0,1 xác định trên nền M´ N thoả mãn:
a) m = B 0 Þ m m m( A, B)= m A
Trang 10b) m m m( A, B)= m m m( B, A), tức là có tính giao hoán
c) m m m m m( A, ( B, C) )= m m m m( ( A, B),m C), tức là có tính kết hợp
d) m m m( A, B)£ m m m( C, D), "m A£ m C, m B£ m D, tức là có tính không
giảm
Một hàm hai biến m m m( A, B) [ ]: 0,12® [ ]0,1 thoả mãn các điều kiện của
định nghĩa trên còn được gọi là hàm t-đối chuẩn (t-conorm)
1.2.2 Phép giao
Cho hai tập hợp mờ A và B có cùng không gian nền U với hai hàm
thuộc tương ứng là m A( )x và m B( )x Giao của A và B là một tập mờ cũng
xác định trên U , kí hiệu là AI B có hàm thuộc m A BI ( )x thoả mãn:
Tương tự như đã trình bày về phép hợp hai tập mờ, có nhiều công thức
khác nhau để tính hàm thuộc m A BI ( )x của giao hai tập mờ và bất cứ một ánh
xạ
( ): [ ]0,1
A B x U
m I ® nào thoả mãn 5 tiêu chuẩn đã nêu trong định nghĩa trên đều được xem như là
hàm thuộc của giao hai tập mờ A và B có chung một không gian nền U Sau
đây là một trong những công thức để tính hàm thuộc m A BI ( )x của phép giao
gồm:
Trang 11( ) min{ ( ), ( ) }
A B x A x B x
m I = m m (Luật min) (1.11) Công thức trên cũng áp dụng được cho hợp hai tập mờ không cùng không gian nền bằng cách đưa cả hai tập mờ về chung một không gian nền là tích của hai không gian nền đã cho
Hình 1.5 Phép giao của hai tập mờ
a) Hàm thuộc của hai tập mờ A và B
b) Phép giao hai tập mờ cùng không gian nền theo luật min
c) Phép giao hai tập mờ cùng không gian nền theo luật tích đại số d) Phép giao hai tập mờ không cùng khôn gian nền
Giao của hai tập mờ theo luật min
Giao của hai tập mờ A với hàm thuộc m A( )x định nghĩa trên không gian
nền M và B với hàm thuộc m B( )x định nghĩa trên không gian nền N là một
tập mờ xác định trên không gian nền M´ Ncó hàm thuộc
Trang 12Trong ví dụ trên ta thấy hàm thuộc m A BÇ (x y, ) của giao hai tập mờ A , B
không cùng không gian nền chỉ phụ thuộc vào m A( ) [ ]x Î 0,1 và m B( ) [ ]x Î 0,1
Do đó không mất tính tổng quát nếu ta xem m A BÇ (x y, ) là hàm của hai biến
Ta đi đến định nghĩa về hàm thuộc m m m của hợp hai tập mờ không ( A, B)
cùng không gian nền như sau:
Định nghĩa 1.4
Hàm thuộc của hợp giữa hai tập mờ A với m A( )x định nghĩa trên không
gian nền M và B với m B( )x định nghĩa trên không gian nền N là một hàm
hai biến m m m( A, B) [ ]: 0,12 ® [ ]0,1 xác định trên nền M´ N thoả mãn:
e) m = B 1 Þ m m m( A, B)= m A
f) m m m( A, B)= m m m( B, A), tức là có tính giao hoán
g) m m m m m( A, ( B, C) )= m m m m( ( A, B),m C), tức là có tính kết hợp
h) m m m( A, B)£ m m m( C, D), "m A£ m C, m B£ m D, tức là có tính không giảm
Trang 13Một hàm hai biến m m m( A, B) [ ]: 0,12® [ ]0,1 thoả mãn các điều kiện của
định nghĩa trên còn được gọi là hàm t- chuẩn (t-norm)
Trang 14Định nghĩa: Quan hệ mờ R trên X ´ X gọi là:
a) Min-chuyển tiếp nếu min{R x y R y z( , ) (, , ) }£ R x z( , ) "x y z, , Î X
b) Bắc cầu yếu nếu "x y z, , Î X có
R x y > R y x và R y z( , )> R z y( , ) thì R x z( , )> R z x( , ) c) bắc cầu tham số nếu có một số 0< q< sao cho: 1
Trang 15các bộ điều khiển mờ, quá trình lấy quyết định và nhận dạng mờ.Dạng đơn giản nhất có thể diễn đạt như sau:
Cho một hệ mờ biểu diễn dưới dạng một quan hệ mờ nhị nguyên R trên
không gian tích X ´ Y Đầu vào (input) của hệ là một tập mờ A cho trên
không gian nền input X Tác động của đầu vào A với hệ R sẽ là phép hợp thành A Ro sẽ cho ở đầu ra (output) một tập mờ trên không gian nền Y , kí hiệu là B Khi ấy ta có A Ro = B
II Giới thiệu về mạng nơron nhân tạo
Mạng nơron hay mạng nơron nhân tạo là sự tái tạo bằng kỹ thuật những chức năng của hệ thần kinh con người Trong quá trình tái tạo không phải tất
cả các chức năng của bộ não con người có đều được tái tạo, mà chỉ có những chức năng cần thiết Bên cạnh đó còn có những chức năng mới được tạo ra nhằm giải quyết một bài toán điều khiển đã định hướng trước Trước khi tìm hiểu về mạng nơron chúng ta giới thiệu sơ lược về mạng nơron sinh học
2.1 Mạng nơron sinh học
Não người là tổ chức vật chất cấp cao, có cấu tạo vô cùng phức tạp, dày đặc các mối liên kết giữa các nơron nhưng xử lý thông tin rất linh hoạt trong môi trường bất định
Hình 2.1 Mô hình mạng nơron sinh học
Trang 16Trong bộ não người có khoảng 10 - 10 tế bào thần kinh được gọi là 11 12các nơron và mỗi nơron có thể liên kết với 10 nơron khác thông qua các 14khớp nối thần kinh (synapse) Dưới con mắt của những người làm tin học cấu tạo của mỗi nơron gồm các thành phần cơ bản sau:
- Thân nơron được giới hạn trong một màng membran và trong cùng là nhân Từ thân nơron còn có rất nhiều đường rẽ nhánh tạm gọi là rễ
- “Bus” liên kết nơron này với các nơron khác được gọi là axon, trên axon có các đường rẽ nhánh Nơron còn có thể liên kết với các nơron khác qua các rễ Chính vì cách liên kết đa dạng như vậy nên mạng nơron có độ liên kết rất cao
Các rễ của noron được chia làm hai loại: loại nhận thông tin từ các
nơron khác qua axon, mà ta sẽ gọi là rễ đầu vào và loại đưa thông tin qua axon tới các nơron khác, gọi là rễ đầu ra Một nơron có thể có nhiều rễ đầu
vào, nhưng chỉ có một rễ đầu ra Bởi vậy nếu coi nơron như một khâu điều khiển thì nó chính là khâu có nhiều đầu vào, một đầu ra Một nơron sẽ ở trạng thái kích thích khi tại đầu vào xuất hiện một tín hiệu tác động vượt quá ngưỡng cân bằng của nơron
Một tính chất rất cơ bản của mạng nơron sinh học là các đáp ứng theo kích thích có khả năng thay đổi theo thời gian Các đáp ứng có thể tăng lên, giảm đi hoặc hoàn toàn biến mất Qua các nhánh axon liên kết tế bào nơron này với các nơron khác, sự thay đổi trạng thái của một nơron cũng dẫn theo sự thay đổi trạng thái của những nơron khác và do đó là sự thay đổi của toàn bộ mạng nơron Việc thay đổi trạng thái của mạng nơron có thể thực hiện qua một quá trình “dạy” hoặc do khả năng “học” tự nhiên
Cấu trúc của mạng nơron luôn luôn phát triển và thay đổi để thích nghi dần với môi trường, làm cho cấu trúc bộ não ngày càng trở nên phức tạp sau mỗi lần học Một số cấu trúc của nơron được xác định trước, một số sau này mới được hình thành và một số thì bị huỷ bỏ qua quá trình chọn lọc tự nhiên, học và thích nghi
Trang 17Các nhà khoa học đã và đang xây dựng và phát triển các mô hình xử lý thông tin mô phỏng hoạt dộng của bộ não người Đó chính là mô hình mạng nơron nhân tạo
2.2 Mạng nơron nhân tạo
2.2.1 Mô hình nơron nhân tạo
Một nơron nhân tạo phản ánh các tính chất cơ bản của nơron sinh học Mỗi nơron nhân tạo là một đơn vị xử lí thông tin làm cơ sở cho hoạt động của một mạng nơron Nó có chức năng nhận tín hiệu vào, tổng hợp và
xử lý các tín hiệu vào để tính tín hiệu ra Dưới đây là một mô hình của một nơron nhân tạo
Hình 2.2 Mô hình một nơron nhân tạo
Trong đó:
- x với i i= 1,2, ,n: các tín hiệu đầu vào
- w với ij i= 1,2, ,n: các trọng số tương ứng với đầu vào
- q : ngưỡng kích hoạt của nơron j j
- net : tín hiệu tổng hợp đầu vào
- f net : Hàm kích hoạt ( )
- y : tín hiệu ra của nơron j j
å M
Trang 18Đầu vào của nơron nhân tạo gồm n tín hiệu x với i i= 1, 2, ,n Mỗi tín hiệu đầu vào tương ứng với một trọng số w với ij i= 1, 2, ,n, nó thể hiện mức
độ ảnh hưởng của tín hiệux đến nơron j i
Một nơron có thể có nhiều đầu vào nhưng chỉ có một tín hiệu đầu ra Tín hiệu đầu vào của một nơron có thể là dữ liệu từ bên ngoài mạng, hoặc đầu
ra của một nơron khác, hoặc là đầu ra của chính nó
Nhằm tăng khả năng thích nghi của mạng nơron trong quá trình học, người ta sử dụng gán thêm một tham số (Bias) cho mỗi nơron nhân tạo Tham
số đó còn gọi là trọng số của nơron, ta kí hiệu trọng số của nơron thứ j là q j
Mỗi một nơron trong một mạng kết hợp các giá trị đưa vào nó thông qua
các liên kết với nơron khác, sinh ra một giá trị gọi là net Hàm thực hiện
nhiệm vụ này gọi là hàm kết hợp (combination function), được định nghĩa bởi một luật lan truyền cụ thể Trong phần lớn các mạng nơron, chúng ta giả sử rằng mỗi một nơron cung cấp một bộ cộng như là đầu vào cho đơn vị mà nó
liên kết Để tính tổng hợp tín hiệu đầu vào net , ta giả định net là hàm của các
- Tín hiệu đầu ra phải không âm với mọi giá trị của net
Trang 19- Hàm f phải liên tục và bị chặn trong khoảng [ ]0,1 Hàm kích hoạt hay còn được gọi là hàm nén vì chúng nén tín hiệu đầu ra vào một khoảng nhỏ Hàm kích hoạt hay được sử dụng là:
1) Hàm đồng nhất (Linear function, Identity function)
Nếu coi các đầu vào là một đơn vị thì chúng ta sẽ sử dụng hàm này Đôi
khi một hằng số được nhân với net để tạo ra một hàm đồng nhất
Hình 2.3 Hàm đồng nhất
2) Hàm bước nhị phân (Binary step function, Hard limit function)
Hàm này còn được gọi là hàm ngưỡng (Threshold function hay
Heaviside function) Đầu ra của hàm này chỉ giới hạn trong hai giá trị: