Tài liệu tham khảo chuyên ngành tin học Xác định quan hệ mờ bằng mạng nơron nhân tạo
Trang 1KHOA CÔNG NGHỆ THÔNG TIN - -
BÁO CÁO NGHIÊN CỨU KHOA HỌC
Tên đề tài:
XÁC ĐỊNH QUAN HỆ MỜ BẰNG MẠNG NƠRONNHÂN TẠO
Giáo viên hướng dẫn : T.S Nguyễn Tân Ân
Sinh viên thực hiện : Nguyễn Thị Thuý Chinh Lớp : C-K54-CNTT.
Hà Nội 4/2008
Trang 2Với bài toán xác định quan hệ giữa không gian vào và không gian ra dựatrên các cặp phần tử vào ra đã biết Cụ thể cho không gian vào X , không gianra Y và các cặp phần tử vào ra (x y, )đã biết , tức là cho một phần tử xÎ X thìcó một phần tử ra tương ứng yÎ Y Yêu cầu bài toán đặt ra là xác định quanhệ R giữa X và Y Một trong những phương pháp thường được sử dụng đểgiải quyết bài toán trên đó là phương pháp bình phương bé nhất Để giảm độphức tạp và thời gian tính toán trong báo cào này tôi sử dụng một phươngpháp mới đó là dùng mạng nơron nhân tạo Và quan hệ giữa không gian vàovà ra xác định được không phải là quan hệ bình thường mà là quan hệ mờ.
Bài nghiên cứu gồm những phần sau:
I Tổng quan lý thuyết tập mờ và quan hệ mờ
Giới thiệu về khái niệm tập mờ, các phép toán trên tập mờ, quan hệ mờ.II Giới thiệu về mạng nơron nhân tạo
Giới thiệu cấu trúc của một nơron, định nghĩa và phân loại mạng nơron,các thủ học mạng nơron, thuật toán lan truyền ngược
Trang 3Ánh xạ bài toỏn xỏc định quan hệ mờ lờn mạng nơron nhõn tạo, đưa racỏch huấn luyện mạng Cuối cựng là demo thuật toỏn xỏc định quan hệ mờbằng mạng nơron nhõn tạo.
I Tổng quan lý thuyết tập mờ và quan hệ mờ
xAm =ớỡùù ẻ
được gọi là hàm thuộc của tập A Tập A là tập kinh điển, U là khụng giannền Như vậy hàm thuộc của tập cổ điển chỉ nhận hai giỏ trị là 0 hoặc 1 Giỏtrị 1 của hàm thuộc mA( )x cũn được gọi là giỏ trị đỳng, ngược lại 0 là giỏ trịsai của mA( )x Một tập U luụn cú
A={xẻ U x thoả mãn một số tính chất nào đó}
thỡ được gọi là cú tập nền U, hay được định nghĩa trờn tập nền U Vớ dụ tập
hàm mA( )x , trong đú tập A được định nghĩa như sau:
Sinh viên: Nguyễn Thị Thuý Chinh – K54C - CNTT 3
Trang 4{ 2 6}
Hình 1.1 Hàm thuộc mA( )x của tập kinh điển A.
Cách biểu diễn hàm phụ thuộc như vậy không phù hợp với những tập
được mô tả “mờ” như tập B gồm các số thực dương nhỏ hơn nhiều so với 6
Tập B, C như vậy được gọi là các tập mờ.
Lý do là với những định nghĩa “mờ” như vậy chưa đủ để xác định đượcmột số chẳng hạn như x=4,5 có thuộc B hoặc x=2,5 có thuộc C haykhông Nên chúng ta không thể dùng hàm thuộc của tập cổ điển chỉ có hai giátrị 1 và 0 để định nghĩa tập B và C trong trường hợp này.
Vì vậy người ta nghĩ rằng: tại sao lại không mở rộng miền giá trị cho
hàm thuộc của tập cổ điển, tức là hàm thuộc sẽ có nhiều hơn hai giá trị Khi
đó thay vì việc trả lời câu hỏi x=4,5 có thuộc B hay không, ngưòi ta sẽ trảlời câu hỏi là: vậy thì x=4,5 thuộc B bao nhiêu phần trăm? Giả sử rằng cócâu trả lời thì lúc này hàm thuộc mB( )x tại điểm x=4,5 phải có một giá trịtrong đoạn [ ]0,1 , tức là
1
Trang 5Nói cách khác hàm mB( )x không còn là hàm hai giá trị như đối với tập
kinh điển nữa mà là một ánh xạ (hình 1.2)
Ánh xạ m được gọi là hàm thuộc (hàm phụ thuộc hay hàm thành viên )F
của tập mờ F Tập kinh điển U được gọi là tập nền (hay tập vũ trụ) của tậpmờ F.
Ví dụ một tập mờ F của các số tự nhiên nhỏ hơn 6 với hàm phụ thuộc
Trang 6các số tự nhiên 3 và 4 có độ phụ thuộc nhỏ hơn 1
Để tính hàm thuộc mA BÈ ( )x có nhiều cách khác nhau, sau đây là một
công thức được dùng trong báo cáo này:
( ) max{( ), ( )}
A BxAxBx
mÈ = mm (Luật lấy max) (1.8)
Sinh viªn: NguyÔn ThÞ Thuý Chinh – K54C - CNTT 6
AxB( )x
Trang 7Hình 1.3 Hàm thuộc của hai tập mờ có cùng không gian nền
a) Hàm thuộc của hai tập mờ A và B
b) Hợp của hai tập mờ A và B theo luật max.
Một cách tổng quát thì bất cứ một ánh xạ dạng
( ): [ ]0,1
A BxUmÈ ®
nếu thoả mãn 5 tiêu chuẩn đã nêu trong định nghĩa hợp hai tập mờ đều đượcxem như là hợp của hai tập mờ A và B có chung một không gian nền U
Công thức trên cũng được mở rộng để áp dụng cho việc xác định hợp củahai tập mờ không cùng không gian nền, bằng cách đưa cả hai tập mờ về chungmột không gian nền là tích của hai tập nền đã cho.
Ví dụ cho tập mờ A xác định trên không gian nền M và tập mờ B xácđịnh trên không gian nền N Do hai tập nền M và N độc lập với nhau nênhàm thuộc mA( )x , xÎ M của tập mờ A sẽ không phụ thuộc vào N và ngượclại mB( )x , yÎ N của tập B cũng sẽ không phụ thuộc vào M Điều đó thểhiện ở chỗ trên không gian nền mới là tập tích M´ N hàm mA( )x phải là một
mặt “cong” dọc theo trục y và mB( )x là một mặt “cong” dọc theo trục x
(hình 1.4) Tập mờ A như vậy được định nghĩa trên hai không gian nền M và
M´ N Để phân biệt được chúng, sau đây kí hiệu A sẽ được dùng để chỉ tậpmờ A trên không gian nền M´ N Đối với các tập mờ khác cũng được kíhiệu tương tự Với kí hiệu đó thì
Sinh viªn: NguyÔn ThÞ Thuý Chinh – K54C - CNTT 7
Trang 8a Hàm thuộc của hai tập mờ A và B
b Đưa hai tập mờ về chung một nền M´ N
c Hợp hai tập mờ trên nền M´ N
Sau khi đã đưa được hai tập mờ A và B về chung một không gian nền là
M´ N thành A và B thì hàm thuộc mA BÈ (x y, ) của tập mờ AÈB được xác
định theo công thức (1.8).( )
Trang 9Hợp hai tập mờ theo luật max
Cho tập mờ A xác định trên không gian nền M và tập mờ B xác địnhtrên không gian nền N, có hàm thuộc lần lượt là mA( )x , mB( )x Hợp của hai
tập mờ A và B theo luật max là một tập mờ xác định trên không gian nền
Một cách tổng quát, do hàm thuộc mA BÈ (x y, ) của hợp hai tập mờ A, B
không cùng không gian nền chỉ phụ thuộc vào mA( ) [ ]x Î 0,1 và mB( ) [ ]x Î 0,1nên ta có thể xem mA BÈ (x y, ) là hàm của hai biến m , Am được định nghĩa nhưB
Hàm thuộc của hợp giữa hai tập mờ A với mA( )x định nghĩa trên không
gian nền M và B với mB( )x định nghĩa trên không gian nền N là một hàm
hai biến () [ ]2 [ ]
, : 0,1 0,1
mm m ® xác định trên nền M´ N thoả mãn:a) m =B 0 Þ mm m( A, B)=mA.
b) mm m( A, B) =mm m( B, A), tức là có tính giao hoán.
c) mm mm m( A, ( B, C)) =mmm m m(( A, B), C), tức là có tính kết hợp.
Sinh viªn: NguyÔn ThÞ Thuý Chinh – K54C - CNTT 9
Trang 10d) mm m( A, B)£ mm m( C, D), "m m m mA £ C, B £ D, tức là có tính khônggiảm.
Một hàm hai biến () [ ]2 [ ]
, : 0,1 0,1
mm m ® thoả mãn các điều kiện của
định nghĩa trên còn được gọi là hàm t-đối chuẩn (t-conorm).
1.2.2 Phép giao
Cho hai tập hợp mờ A và B có cùng không gian nền U với hai hàmthuộc tương ứng là mA( )x và mB( )x Giao của A và B là một tập mờ cũngxác định trên U, kí hiệu là AI B có hàm thuộc mA BI ( )x thoả mãn:
nào thoả mãn 5 tiêu chuẩn đã nêu trong định nghĩa trên đều được xem như làhàm thuộc của giao hai tập mờ A và B có chung một không gian nền U Sauđây là một trong những công thức để tính hàm thuộc mA BI ( )x của phép giao
( ) min{( ), ( )}
A BxAxBx
mI = mm (Luật min) (1.11)
Trang 11Công thức trên cũng áp dụng được cho hợp hai tập mờ không cùng khônggian nền bằng cách đưa cả hai tập mờ về chung một không gian nền là tích củahai không gian nền đã cho.
Hình 1.5 Phép giao của hai tập mờ
a) Hàm thuộc của hai tập mờ A và B.
b) Phép giao hai tập mờ cùng không gian nền theo luật min.
c) Phép giao hai tập mờ cùng không gian nền theo luật tích đại số.d) Phép giao hai tập mờ không cùng khôn gian nền
Giao của hai tập mờ theo luật min
Giao của hai tập mờ A với hàm thuộc mA( )x định nghĩa trên không gian
nền M và B với hàm thuộc mB( )x định nghĩa trên không gian nền N là một
tập mờ xác định trên không gian nền M´ Ncó hàm thuộc
Trang 12Với ví dụ về tập mờ A, B có hàm đặc tính như trong hình 1.5a thì tập
giao của chúng trên tập nền chung M´ Nsẽ có hàm thuộc mô tả như trong
hình 1.5d.
Trong ví dụ trên ta thấy hàm thuộc mA BÇ (x y, ) của giao hai tập mờ A, B
không cùng không gian nền chỉ phụ thuộc vào mA( ) [ ]x Î 0,1 và mB( ) [ ]x Î 0,1 .Do đó không mất tính tổng quát nếu ta xem mA BÇ (x y, ) là hàm của hai biến mA
, m được định nghĩa như sauB
()() [ ]2 [ ]
A Bx yAB
Ta đi đến định nghĩa về hàm thuộc mm m của hợp hai tập mờ không( A, B)
cùng không gian nền như sau:
Định nghĩa 1.4
Hàm thuộc của hợp giữa hai tập mờ A với mA( )x định nghĩa trên không
gian nền M và B với mB( )x định nghĩa trên không gian nền N là một hàm
hai biến () [ ]2 [ ]
, : 0,1 0,1
mm m ® xác định trên nền M´ N thoả mãn:e) m =B 1 Þ mm m( A, B) =mA.
f) mm m( A, B)=mm m( B, A) , tức là có tính giao hoán.
g) mm mm m( A, ( B, C))=mmm m m(( A, B), C), tức là có tính kết hợp.
h) mm m( A, B)£ mm m( C, D), "m m m mA £ C, B£ D, tức là có tính không giảm.Một hàm hai biến () [ ]2 [ ]
, : 0,1 0,1
mm m ® thoả mãn các điều kiện của
định nghĩa trên còn được gọi là hàm t- chuẩn (t-norm).
Trang 131.2.3 Phép bù
Cho tập mờ A trên không gian nền U Phép bù của A là một tập mờcũng xác định trên không gian nền U, kí hiệu là c
A , nó có hàm thuộc thoảmãn:
i m =(1) 0 và m =(0) 1
ii, mA £ mB Þ mm( )A ³ mm( )B , tức là hàm không tăng.
Sinh viªn: NguyÔn ThÞ Thuý Chinh – K54C - CNTT 13
Trang 14Hình 1.6: Tập bù mạnh c
A của tập mờ A.a Hàm thuộc của tập mờ A.
b Hàm thuộc của tập mờ c
1.3 Quan hệ mờĐịnh nghĩa 1.6
Cho X , Y là hai không gian nền R gọi là một quan hệ mờ trên X´ Y
nếu R là một tập mờ trên X´ Y, tức là có một hàm thuộc mR : X´ ®Y [ ]0,1 ,ở đây mR(x y, ) =R x y( , ) là độ thuộc của (x y, ) vào quan hệ R
- Tính bắc cầu
Định nghĩa: Quan hệ mờ R trên X´ X gọi là:
a) Min-chuyển tiếp nếu min{R x y R y z( , ) (, , )}£ R x z( , ) "x y z, , Î X
b) Bắc cầu yếu nếu "x y z, , Î X có
( , )( , )
R x y >R y x và R y z( , )>R z y( , ) thì R x z( , )>R z x( , ) .
c) bắc cầu tham số nếu có một số 0< <q 1 sao cho: Nếu R x y( , )> >qR y x( , ) và R y z( , )> >qR z y( , ) thì( , )( , )
R x z > >qR z x
* Phương trình quan hệ mờ
Phương trình quan hệ mờ lần đầu tiên nghiên cứu bởi GS.Sanchez năm1976, đóng vai trò quan trọng trong các lĩnh vực phân tích các hệ mờ, thiết kếcác bộ điều khiển mờ, quá trình lấy quyết định và nhận dạng mờ.Dạng đơngiản nhất có thể diễn đạt như sau:
Trang 15Cho một hệ mờ biểu diễn dưới dạng một quan hệ mờ nhị nguyên R trênkhông gian tích X´ Y Đầu vào (input) của hệ là một tập mờ A cho trênkhông gian nền input X Tác động của đầu vào A với hệ R sẽ là phép hợpthành A Ro sẽ cho ở đầu ra (output) một tập mờ trên không gian nền Y, kíhiệu là B Khi ấy ta có A Ro =B.
II Giới thiệu về mạng nơron nhân tạo
Mạng nơron hay mạng nơron nhân tạo là sự tái tạo bằng kỹ thuật nhữngchức năng của hệ thần kinh con người Trong quá trình tái tạo không phải tấtcả các chức năng của bộ não con người có đều được tái tạo, mà chỉ có nhữngchức năng cần thiết Bên cạnh đó còn có những chức năng mới được tạo ranhằm giải quyết một bài toán điều khiển đã định hướng trước Trước khi tìmhiểu về mạng nơron chúng ta giới thiệu sơ lược về mạng nơron sinh học.
2.1 Mạng nơron sinh học
Não người là tổ chức vật chất cấp cao, có cấu tạo vô cùng phức tạp, dàyđặc các mối liên kết giữa các nơron nhưng xử lý thông tin rất linh hoạt trongmôi trường bất định
Hình 2.1 Mô hình mạng nơron sinh học
Trong bộ não người có khoảng 1112
các nơron và mỗi nơron có thể liên kết với 14
10 nơron khác thông qua cácSinh viªn: NguyÔn ThÞ Thuý Chinh – K54C - CNTT 15
Trang 16khớp nối thần kinh (synapse) Dưới con mắt của những người làm tin học cấutạo của mỗi nơron gồm các thành phần cơ bản sau:
- Thân nơron được giới hạn trong một màng membran và trong cùnglà nhân Từ thân nơron còn có rất nhiều đường rẽ nhánh tạm gọi là rễ.
- “Bus” liên kết nơron này với các nơron khác được gọi là axon, trênaxon có các đường rẽ nhánh Nơron còn có thể liên kết với các nơron khác quacác rễ Chính vì cách liên kết đa dạng như vậy nên mạng nơron có độ liên kếtrất cao.
Các rễ của noron được chia làm hai loại: loại nhận thông tin từ các
nơron khác qua axon, mà ta sẽ gọi là rễ đầu vào và loại đưa thông tin quaaxon tới các nơron khác, gọi là rễ đầu ra Một nơron có thể có nhiều rễ đầu
vào, nhưng chỉ có một rễ đầu ra Bởi vậy nếu coi nơron như một khâu điềukhiển thì nó chính là khâu có nhiều đầu vào, một đầu ra Một nơron sẽ ở trạngthái kích thích khi tại đầu vào xuất hiện một tín hiệu tác động vượt quángưỡng cân bằng của nơron.
Một tính chất rất cơ bản của mạng nơron sinh học là các đáp ứng theokích thích có khả năng thay đổi theo thời gian Các đáp ứng có thể tăng lên,giảm đi hoặc hoàn toàn biến mất Qua các nhánh axon liên kết tế bào nơronnày với các nơron khác, sự thay đổi trạng thái của một nơron cũng dẫn theo sựthay đổi trạng thái của những nơron khác và do đó là sự thay đổi của toàn bộmạng nơron Việc thay đổi trạng thái của mạng nơron có thể thực hiện quamột quá trình “dạy” hoặc do khả năng “học” tự nhiên.
Cấu trúc của mạng nơron luôn luôn phát triển và thay đổi để thích nghidần với môi trường, làm cho cấu trúc bộ não ngày càng trở nên phức tạp saumỗi lần học Một số cấu trúc của nơron được xác định trước, một số sau nàymới được hình thành và một số thì bị huỷ bỏ qua quá trình chọn lọc tự nhiên,học và thích nghi.
Các nhà khoa học đã và đang xây dựng và phát triển các mô hình xử lýthông tin mô phỏng hoạt dộng của bộ não người Đó chính là mô hình mạngnơron nhân tạo
Trang 172.2 Mạng nơron nhân tạo
2.2.1 Mô hình nơron nhân tạo
Một nơron nhân tạo phản ánh các tính chất cơ bản của nơron sinhhọc Mỗi nơron nhân tạo là một đơn vị xử lí thông tin làm cơ sở cho hoạtđộng của một mạng nơron Nó có chức năng nhận tín hiệu vào, tổng hợp vàxử lý các tín hiệu vào để tính tín hiệu ra Dưới đây là một mô hình của mộtnơron nhân tạo.
Hình 2.2 Mô hình một nơron nhân tạo
Trong đó:
- xi với i=1,2, ,n: các tín hiệu đầu vào.
- wij với i=1,2, ,n: các trọng số tương ứng với đầu vào.- q : ngưỡng kích hoạt của nơron jj.
- net: tín hiệu tổng hợp đầu vào.- f net( ): Hàm kích hoạt.
- yj: tín hiệu ra của nơron j.
Đầu vào của nơron nhân tạo gồm n tín hiệu xi với i=1,2, ,n Mỗi tínhiệu đầu vào tương ứng với một trọng số wijvới i=1,2, ,n, nó thể hiện mứcđộ ảnh hưởng của tín hiệuxi đến nơron j.
Sinh viªn: NguyÔn ThÞ Thuý Chinh – K54C - CNTTå
M1
Trang 18Một nơron có thể có nhiều đầu vào nhưng chỉ có một tín hiệu đầu ra.Tín hiệu đầu vào của một nơron có thể là dữ liệu từ bên ngoài mạng, hoặc đầura của một nơron khác, hoặc là đầu ra của chính nó.
Nhằm tăng khả năng thích nghi của mạng nơron trong quá trình học,người ta sử dụng gán thêm một tham số (Bias) cho mỗi nơron nhân tạo Thamsố đó còn gọi là trọng số của nơron, ta kí hiệu trọng số của nơron thứ j là q j
Mỗi một nơron trong một mạng kết hợp các giá trị đưa vào nó thông quacác liên kết với nơron khác, sinh ra một giá trị gọi là net Hàm thực hiệnnhiệm vụ này gọi là hàm kết hợp (combination function), được định nghĩa bởimột luật lan truyền cụ thể Trong phần lớn các mạng nơron, chúng ta giả sửrằng mỗi một nơron cung cấp một bộ cộng như là đầu vào cho đơn vị mà nóliên kết Để tính tổng hợp tín hiệu đầu vào net, ta giả định net là hàm của cáctín hiệu xi và các trọng số wij.
Sau khi tổng hợp được tín hiệu đầu vào net, sử dụng hàm kích hoạt f
biến đổi net để thu được tín hiệu đầu ra out.
Trang 191) Hàm đồng nhất (Linear function, Identity function)
2) Hàm bước nhị phân (Binary step function, Hard limit function)
Hàm này còn được gọi là hàm ngưỡng (Threshold function hay
Heaviside function) Đầu ra của hàm này chỉ giới hạn trong hai giá trị:
f(x)
1
x
Trang 20Hàm này đặc biệt thuận lợi khi sử dụng cho các mạng được huấn luyện(trained) bởi thuật toán lan truyền ngược (back-propagation), bởi vì nó dễ lấyđạo hàm, do đó có thể giảm đáng kể tính toán trong quá trình huấn luyện.Hàm này được ứng dụng cho các chương trình ứng dụng mà các đẩu ra mongmuốn rơi vào khoảng [0,1].
4) Hàm sigmoid lưỡng cực (Bipolar sigmoid function (tansig))
( ) 1
ef x
Trong định nghĩa trên, các phần tử xử lý được nhắc đến chính là các nơron
2.2.2.2 Phân loại
Liên kết các đầu vào và ra của nhiều nơron với nhau ta được một mạng nơron Nguyên lý cấu tạo của một mạng nơron bao gồm một hoặc nhiều lớp Mỗi lớp bao gồm nhiều nơron có cùng một chức năng trong mạng.
Mạng nơron nhân tạo có thể được chế tạo bằng nhiều cách khác nhau vìvậy trong thực tế tồn tại rất nhiều kiểu mạng nơron nhân tạo Dựa vào số lớphay sự liên kết giữa các lớp trong mạng mà người ta phân mạng nơron nhântạo thành các nhóm khác nhau.
* Phân loại theo số lớp