1. Trang chủ
  2. » Công Nghệ Thông Tin

Bài giảng Các hệ thống dựa trên tri thức: Phần 1

78 13 0

Đang tải... (xem toàn văn)

Tài liệu hạn chế xem trước, để xem đầy đủ mời bạn chọn Tải xuống

THÔNG TIN TÀI LIỆU

Bài giảng Các hệ thống dựa trên tri thức là một trong những hệ thống của chuyên ngành Hệ thống Thông tin. Bài giảng này là những hệ thống ứng dụng cụ thể và mở rộng của lĩnh vực Trí tuệ Nhân tạo. Phần 1 trình bày các nội dung về các hệ thống tri thức dựa trên xác suất; Hệ mờ; Mạng nơ ron nhân tạo;... Mời các bạn cùng tham khảo để nắm nội dung chi tiết.

HỌC VIỆN CƠNG NGHỆ BƯU CHÍNH VIỄN THƠNG  KHOA CÔNG NGHỆ THÔNG TIN BÀI GIẢNG CÁC HỆ THỐNG DỰA TRÊN TRI THỨC NGUYỄN QUANG HOAN HàNội 2017 MỤC LỤC BẢNG KÝ HIỆU VIẾT TẮT/GIẢI NGHĨA LỜI NÓI ĐẦU CHƯƠNG 1: CƠ BẢN VỀ HỆ THỐNG DỰA TRÊN TRI THỨC 1.1 Khái niệm tri thức 1.2 Biểu diễn tri thức 1.2.1 Mô tả tri thức mạng ngữ nghĩa 10 1.2.2 Các vấn đề mạng tính tốn 11 1.2.3 Ví dụ minh họa mạng tính toán Thuật toán vết dầu loang 11 1.3 Mục đích xây dựng hệ thống dựa tri thức 14 1.4 Các thành phần hệ thống dựa tri thức 15 1.5 Phân loại hệ thống dựa tri thức 15 1.6 Các khó khăn xây dựng hệ thống dựa tri thức 16 1.6.1 Xây dựng hệ dựa tri thức 16 1.6.2 Đặc tính tri thức 16 1.6.3 Độ lớn sở tri thức 17 1.6.4 Thu thập tri thức 17 1.6.5 Học chậm phân tích 17 1.7 Lập trình thơng minh 17 1.8 Các ngôn ngữ, công cụ sử dụng cho hệ sở tri thức 17 CHƯƠNG 2: 19 CÁC HỆ THỐNG TRI THỨC DỰA TRÊN XÁC SUẤT 19 2.1 Thuật toán độ hỗn loạn 19 2.1.2 Thuật toán độ lộn xộn 20 2.2 Thuật toán Bayes 22 2.2.1 Định lý Bayes 22 2.2.2 Bài toán thuật toán Bayes đơn giản 22 CHƯƠNG 3: 26 HỆ MỜ 26 3.1 Tập mờ 27 3.2 Các khái niệm liên quan đến tập mờ 28 3.3 Hàm thuộc (hàm thành viên) 30 3.4 Hệ mờ gì? 31 3.5 Các phép tính mờ 32 3.6 Mờ hóa 33 3.7 Giải mờ 34 CHƯƠNG 4: 41 MẠNG NƠ-RON NHÂN TẠO 41 4.1 Nguồn gốc mạng nơ ron 41 4.1.1 Quá trình phát triển nghiên cứu mạng nơ ron 41 4.1.2 Mơ hình tổng qt nơ ron sinh vật 42 4.2 Mơ hình mạng nơ ron nhân tạo luật học 44 4.2.1 Mơ hình tổng qt nơ ron nhân tạo 44 4.2.2 Mạng nơ ron nhân tạo 46 4.3 Các mạng truyền thẳng 50 4.3.1 Mạng lớp truyền thẳng - Mạng Perceptron 50 4.3.2 Mạng nơ ron Adaline (Adaptive Linear Element) 52 4.3.3 Mạng nhiều lớp lan truyền ngược (Back Propagation) 53 4.4 Các mạng phản hồi 55 4.4.1 Mạng Hopfield rời rạc 56 4.4.2 Mơ hình mạng Hopfield liên tục chuẩn 57 4.4.3 4.5 Mạng liên kết hai chiều 61 Mạng nơ ron tự tổ chức 67 4.5.1 Mơ hình cấu trúc mạng Kohonen 67 4.5.2 Học ganh đua 69 4.5.3 Thuật toán SOM 71 4.5.4 SOM với toán phân cụm 74 CHƯƠNG 5: 78 GIẢI THUẬT DI TRUYỀN 78 5.1 Khái niệm giải thuật di truyền 78 5.2 Các toán tử giải thuật di truyền 79 5.3 Giải thuật di truyền 80 5.4 Ví dụ giải thuật di truyền 84 CHƯƠNG 6: 92 CÁC HỆ CƠ SỞ TRI THỨC LAI 92 6.1 Đặc tính hệ tính tốn mềm 92 6.2 Hệ lai nơ ron mờ 95 6.3 Biểu diễn luật If-Then theo cấu trúc mạng nơ ron 97 6.4 Nơ ron mờ 98 6.5 Huấn luyện mạng nơ ron mờ 100 6.6 Phân loại kết hợp mạng nơ ron và logic mờ 102 6.7 Hệ lai tiến hóa mờ 107 6.8 Hệ lai tiến hóa nơ ron 113 BẢNG KÝ HIỆU VIẾT TẮT/GIẢI NGHĨA VIẾT TẮT/ TÊN RIÊNG NGHĨA THEO TIẾNG ANH ADALINE Adaptive Linear Element A/D AI ANFIS Analog to Digital Conveter Artificial Intelligence Adaptive Neuro Fuzzy Inference System Bidirectional Associative Memory Best Matching Unit Boltzmann Content Addressable Memory Computer-Based Information Systems Genetic Algorithm BAM BMU Boltzmann CAM CBIS GA CLIPS DỊCH RA TIẾNG VIỆT/GIẢI NGHĨA Phần tử (nơ ron) tuyến tính thích nghi, tên mạng nơ ron Widrow đề xuất năm 1960 Bộ chuyển đổi tương tự/số Trí tuệ nhân tạo Hệ thống nơ ron-mờ thích nghi Bộ nhớ liên kết hai chiều: tên mạng nơ ron hồi quy hai lớp (Roselblatt) Đơn vị (nơ ron) khớp tốt Mạng nơ ron lấy tên Boltzmann Bộ nhớ nội dung địa hoá Hệ thống thông tin dựa máy tính Giải thuật di truyền C Language Integrated Hệ thống sản xuất (nhân quả) tích hợp theo ngôn ngữ C Production System Hopfield Hopfield KBS LMS NFS NST MISO OAV Perceptron Knowledge Base System Least Mean Square Neuro-Fuzzy Systems (Chromosome) Multi Input Single Output Object Atribute Value Perceptron VLSI RBF SISO SVM Very Large Scale Integration Radian Basic Function Single Input Single Output Support Vector Machine Tên mạng nơ ron truy hồi (mạng rời rạc, 1982; liên tục, 1984) Hopfield đề xuất Hệ thống dự tri thức Trung bình bình phương nhỏ nhất: Các hệ thống nơ ron-mờ Nhiễm sắc thể Hệ thống nhiều đầu vào đầu Giá trị thuộc tính đối tượng Bộ cảm nhận: tên mạng nơ ron truyền thẳng Rosenblatt đề xuất năm 1960 Mạch tích hợp mật độ cao Hàm xuyên tâm Hệ thống đầu vào đầu Máy vec tơ hỗ trợ LỜI NĨI ĐẦU Giáo trình “Các hệ thống dựa tri thức” là hệ thống chuyên ngành Hệ thống Thơng tin Giáo trình này là hệ thống ứng dụng cụ thể và mở rộng lĩnh vực Trí tuệ Nhân tạo Nói cách khác, hệ thống dựa trí thức xây dựng dựa nguyên lý nào trí tuệ nhân tạo để xây dựng hệ thống ứng dụng riêng Các hệ thống dựa tri thức có nguồn gốc xuất xứ từ số hệ thống hệ chuyên gia Hệ thống sử dụng tính toán mềm là hệ gần gũi với hệ thông dựa tri thức chủ yếu gồm hệ mờ, mạng nơ ron, giải tḥt di truyền và lập trình tiến hóa, hệ thống dựa theo xác suất Hệ thống dựa theo trí thức có quy mơ rộng miễn là tri thức Giáo trình gồm sáu chương Chương mang tính giới thiệu, cho số khái niệm bản, phân loại hệ dựa tri thức, số công cụ hỗ trợ thực hệ thống dựa tri thức Những khái niệm giới thiệu trí tuệ nhân tạo, để tránh trùng lặp, giáo trình khơng nhắc lại nhiều Chương hai, giới thiệu tḥt tốn mang tính xác suất điển hình Một số hệ thống khác có tính xác suất hệ mờ, sử dụng nhiều nguyên tắc khác tập hợp, logic, tính toán mờ tách thành hệ riêng Chương ba là hệ mờ, chủ ́u trình bày có tính hệ thống và quy trình hướng tới giải bài tốn, không sâu lý thuyết Chương bốn đề cập tới mạng nơ ron gồm cấu trúc và luật học và vài ứng dụng mạng nơ ron cụ thể Chương năm giới thiệu thuyết tiến hóa và giải thuật di truyền Chương sáu nêu số hệ lai hệ mờ với nơ ron, mờ với hệ tiến hóa, hệ tiến hóa với mạng nơ ron Một số hệ thống khác hệ thống dựa theo trí thức không giới thiệu khn khổ giáo trình có hạn Những vấn đề hệ thống dựa trí thức là tiên tiến và tiến trình phát triển, hoàn thiện Nhiều quan điểm phân loại hay định nghĩa bàn ḷn Do vậy, giáo trình khơng tránh khỏi thiếu sót chưa đủ cập nhật Mong đóng góp từ tất bạn đồng nghiệp và độc giả CHỦ BIÊN CHƯƠNG 1: CƠ BẢN VỀ HỆ THỐNG DỰA TRÊN TRI THỨC Tri thức hệ sở tri thức 1.1 1.1.1 Khái niệm tri thức Tri thức (Knowdge) là hiểu biết lý thuyết hay thực tế đối tượng, việc, hoàn cảnh, kiện hay lĩnh vực định Tri thức là tổng tất hiểu biết thời, là khái niệm trừu tượng đời thường Chuyên gia (ExpertS) là người tập hợp nhiều tri thức người bình thường khác Để đưa tri thức vào máy tính (giống ta mô tả liệu cho máy tính để máy tính giúp ta giải qút bài tốn), khái niệm tri thức trừu tượng càn phải phải mô tả cụ thể Trong cách cụ thể hóa tri thức, người ta thơng chia tri thức làm phần, là: i) ii) iii) kiện (Events hay Facts); mối quan hệ, quy tắc, quy luật liên quan kiện hay gọi tắt luật (Rules) kiện đó; tri thức có tính heuristic Heuristic xuất phát từ tḥt ngữ ơ-ric-ca thuật ngữ khó dịch tiếng Việt; hàm ý rút từ kinh nghiệm, từ suy diễn mang tính may rủi (khơng hoàn toàn chính xác, dùng tốt theo số nghĩa nào đó) Heuristic tạm dịch tìm ra, phát (to Find hay to Discovery) Ví dụ kiện Giả sử có hai kiện “trời mưa” (ký hiệu (hay gán) là biến A); kiện “đất ướt” (ký hiệu (hay gán) là biến B) Những tượng đó, người trưởng thành nhận thức được, gọi là kiện Các kiện tương đương với liệu mà ta biết và là dạng đơn giản trí thức Nhưng chưa hoàn toàn đủ để gọi là tri thức, tương đương với kiện (hay liệu) Ở mức tri thức, người rút mối liên quan kiện qua đúc rút kinh nghiệm, qua thực tế Giữa kiện đó, người muốn hiểu sâu hơn, tìm hiểu kiện có mối quan hệ nào không? Mối quan hệ kiện có tồn khơng? Gắn hai kiên vừa nêu, ta thấy: có “trời mưa” dẫn tới (kéo theo) kiện “đất ướt”, chúng có mối liên hệ, mối liên hệ A→B Đây là mối quan hệ mà mơ tả logic mệnh đề Ta mơ tả A→B quy tắc hay là luật IF…THEN (NẾU…THÌ) sau: NẾU “trời mưa” NẾU A IF “trời mưa” IF A THÌ “đất ướt” THÌ B THEN “đất ướt” THEN B Trong ngơn ngữ lập trình, “IF…THEN” là cấu trúc Trong trí tuệ nhân tạo gọi luật “IF…THEN” hay luật nhân quả, hay luật sinh (tiếng Anh: Production Rule) Các mối quan hệ này chính là quy luật (Rule) thể mối liên hệ kiện 1.1.2 Tháp liệu hệ thống dựa máy tính Hệ thống dựa tri thức (Knowledge-Based Systems) Các hệ thống thông minh nhân tạo sử dụng kỹ tḥt trí tuệ nhân tạo, thơng qua kỹ tḥt đó, hệ thống thơng minh có khả giải toán lĩnh vực riêng Những hệ thống vậy sử dụng kiến thức nhiều chuyên gia gọi hệ thống dựa tri thức (Knowledge-Based Systems) hay hệ chuyên gia (Expert System) [1] Các hệ thống giải bài toán máy tính truyền thống từ trước tới dựa liệu (Data) và/hoặc thông tin (Information) gọi là hệ thống thơng tin dựa máy tính (Computer-Based Information Systems: CBIS) Mơ hình Un thâm Quy ḷt Tri thức Khái niệm Dữ liệu Sáng tạo (Novelty) Thông tin Làm (Experience) Dữ liệu Hiểu (Understading) Nghiên cứu Hấp thụ Tương tác Tác động lại Hình 1.1 Biểu đồ mơ tả từ liệu đến trí tuệ Hình 1.1 mơ tả đồ thị phát triển trí tuệ từ liệu, thông tin, tri thức đến thông minh (hay uyên thâm) mối quan hệ giữ bốn khái niệm Khi thực hoạt động: nghiên cứu, tiếp thu (hấp thụ), tương tác (trao đổi), phản ảnh (tương tác lại) mô tả trục x người đạt (kết quả) hiểu biết, thực hành được, tiến tới làm sáng tạo sản phẩm q trình tư Trục y coi mức (hội tụ) mô tả: từ liệu (nguyên liệu thô), xử lý (xác định hay không xác định từ liệu để có thơng tin) thành khái niệm, sau rút thành quy luật (luật) tiếp theo mô hình mơ tả Hình 1.2 cho thấy phát triển tháp (quản lý) liệu Mức thấp nhất: mức thao tác liệu hoạt động với môi trường sử dụng thủ tục (chương trình), ví dụ hệ thơng xử lý giao tác (Transaction Processing System: TPS) nhằm tạo chương trình giao tác với hoạt động (kinh doanh) Các nhà chiến lược tạo sách WBS Quản lý mức cao tạo tri thức KBS Quản lý mức dùng thông tin Thao tác xử lý liệu Độ lớn Uyên thâm: thực Tri thức: tổng hợp DSS, MIS Thơng tin: phân tích TPS Dữ liệu; chế biến thô Độ thông minh và phức tạp Hình 1.2 Tháp quản lý liệu, thơng tin, tri thức trí tuệ (un thâm) Các thơng tin từ mức thao tác phân tích, chế biến, tạo báo cáo giúp nhà quản lý quyết định (Decision Support System: DSS) mức thứ hai (mức quản lý trung gian: Management Information System: MIS) Ở mức cao (quản lý), từ kết tiến hành qua quyết định mức hai, kết hợp với định mức, luật lệ để khái quát hóa, chuyển thơng tin thành trí thức Các hệ thống thực chức này là hệ dựa tri thức (KnowledgeBased Systems: KBS) hệ dựa kiến thức uyên thâm (Wisdom-Based Systems) 1.3 Hệ sở tri thức gì? Hệ CSTT là hệ thống dựa tri thức (một tập hợp tri thức và tập quan hệ), cho phép mơ hình hóa tri thức chuyên gia, dùng tri thức này để giải quyết vấn đề phức tạp lĩnh vực Hai yếu tố quan trọng hệ sở tri thức là: kiện và lập luận hay suy diễn) Sự kiện Lập luận (suy diễn) Sự kiện Lập luận Sự kiện Lập luận …… ……… Sự kiện n 1.2 Lập luận m Biểu diễn tri thức Tri thức phân làm hai nhóm chính:  Mô tả tri thức theo kiện (Factual Knowledge Representation) ▪ Hằng (Constant) ▪ Biến (Variables) ▪ Hàm (Functions) ▪ Vị từ (Predicates) ▪ Các công thức (Well-Formed Formulas) ▪ Logic vị từ cấp (First Order Logic)  Mô tả tri thức theo thủ tục (Procedural Knowledge Representation) Trong chương trình trí tuệ nhân tạo, ta biết số phương pháp mô tả tri thức theo kiện như: - Phương pháp kinh điển: mô tả tri thức logic hình thức: Logic mệnh đề Ví dụ: A B; Logic vị từ (xem giáo trình trí tuệ nhân tạo) - Phương pháp mô tả luật IF…THEN hay luật nhân - Mô tả tri thức cặp ba: OAV (Object Atribute Value); - Mô tả tri thức băng khung (Frame) - Mô tả tri thức mạng ngữ nghĩa Đây là phương pháp mô tả có nhiều ứng dụng và thành cơng; biến thể là mạng tính tốn, mạng Bayes, mạng nơ-ron nhân tạo… Bởi vậy, tìm hiểu f (.) là hàm ngưỡng Vector y’ cung cấp cho lớp X vector x’ cung cấp đầu vào cho lớp Y cho đầu y’’.Quá trình tiếp tục cập nhật x y dừng lại Q trình truy hồi đệ quy gồm bước sau y(1)=a(Wx(0)) (qua hướng lần thứ nhất) x(2)=a(WTy(1)) (qua hướng lần thứ nhất) ……………………………………………… y(k-1)=a(Wx(k-2)) (qua hướng lần thứ k/2) x(k)=a(WTy(k-1)) (qua hướng lần thứ k/2) Trạng thái cập nhật là đồng không đồng Thuật toán lưu trữ Với p cặp vector liên kết lưu trữ BAM: {(x1,y1), (x2, y2), …, (xn, yn)} xk=(x1k,x2k,…,xmk)T y=(y1k, y2k,…, ynk)T p W=  (ykxk)T cho vector lưỡng cực : {1, -1} k 1 p W=  (2yk-1)(2xk-1)T cho vector nhị phân : {0, 1} k 1 p wij=  ykixkj Cho vector lưỡng cực :{1, -1} k 1 p wij =  (2yki-1)(2xkj-1) cho vector nhị phân :{0, 1} k 1 Tính ổn định BAM (được chứng minh dùng định lý Lyapunov) Hàm lượng: E(x,y)=-1/2xTWTy-1/2yTWx=-yTWx Xem xét ∆E sinh ∆y theo 11.36 ta có ∆Eyi= E ∆yi=Wx∆yi=-( wijxj)∆yi yi j 1 m  Có trường hợp xảy ra: m yi(k)=-1 yi(k+1)=+1→  wijxj>0, ∆yi=2 Do ∆Eyi (0 1 0) = N 1 3  3 Sử dụng công thức, ví dụ xác định lại:  1 1 3   3 3 1 1   LW= [1 1 1]  3 3 1 1 = [4 -4 -4 4]T => (1 1)=A    1 1 3   1 1 3  Như vậy (A, L), (B, M), (C < N) là điểm cố định cho BAM công thức và ma trận trọng W xác định nhờ công thức Hơn nếu cho vector (A+S) (thay đổi chỳt vector A) vào BAM, hội tụ gần tới lỗi nhóm L Vớ dụ S = (0 0 0); A+S = (1 1 1); (A+S) WT = (2 2 2) => (1 1 1)=L Chú ý việc học với BAM là cố định, vậy khơng đủ mạnh trường hợp đẩy bit mẫu kết hội tụ là sai BAM là ví dụ mạng ánh xạ 66 4.5 Mạng nơ ron tự tổ chức Mạng nơ ron tự tổ chức SOM (Self-Organizing Map) đề xuất giáo sư Teuvo Kohonen vào năm 1982 Nó cịn gọi là: Bản đồ/Ánh xạ đặc trưng tự tổ chức (SOFM-Self Organizing Feature Map) hay đơn giản là mạng nơ ron Kohonen SOM coi là mạng nơ ron hữu ích cho việc mơ q trình học não người Nó không giống với mạng nơ ron khác quan tâm đến giá trị và dấu hiệu thông tin đầu vào, mà có khả khai thác mối liên hệ có tính chất cấu trúc bên khơng gian liệu thông qua đồ đặc trưng Bản đồ đặc trưng bao gồm nơ ron tự tổ chức theo giá trị đầu vào định; huấn luyện để tìm quy luật và tương quan giá trị nhập vào, từ dự đốn kết tiếp theo Có thể nói, nếu hệ thống mơ q trình học não người thực đồ đặc trưng SOM đóng vai trò trái tim hệ thống Tính tự tổ chức SOM thực nguyên tắc học cạnh tranh, không giám sát nhằm tạo ánh xạ liệu từ không gian nhiều chiều không gian ít chiều (thường là hai chiều), đảm bảo quan hệ mặt hình trạng liệu Điều này có nghĩa là liệu có đặc trưng tương đồng đại diện nơ ron nơ ron gần và nơ ron gần tương đồng với so với nơ ron xa Kết là hình thành đồ đặc trưng tập liệu Đây thực chất là phép chiếu phi tuyến tạo “ánh xạ đặc trưng” cho phép phát và phân tích đặc trưng khơng gian đầu vào; đó, SOM là công cụ hiệu cho việc phân cụm trực quan và phân tích liệu nhiều chiều 4.5.1 Mô hình cấu trúc mạng Kohonen Mạng nơ ron SOM có cấu trúc đơn lớp, bao gồm: tín hiệu vào và lớp Kohonen (Hình 4.9), tất đầu vào kết nối đầy đủ với mọi nơ ron lớp Kohonen Kiến trúc mạng SOM thuộc đồng thời hai nhóm mạng truyền thẳng và mạng phản hồi, liệu truyền từ đầu vào tới đầu và có ảnh hưởng nơ ron lớp Kohonen Lớp Kohonen thường tổ chức dạng ma trận chiều nơ ron theo dạng lưới hình chữ nhật hình lục giác Mỗi đơn vị i (nơ ron) lớp Kohonen gắn vector trọng số wi= [wi,1, wi,2, …, wi,n], với n là kích thước (số chiều) vector đầu vào; wi,j là trọng số nơ ron i ứng với đầu vào j 67 Hình 4.9 Cấu trúc mạng SOM với lớp Kohonen chiều Các nơ ron lớp xếp mảng chiều Mảng này gọi là lớp Kohonen Lớp đầu này khác với lớp đầu mạng nơ ron truyền thẳng Đối với mạng truyền thẳng, nếu có mạng nơ ron với nơ ron đầu ra, chúng cho kết bao gồm giá trị Còn mạng nơ ron Kohonen có nơ ron đầu cho giá trị Giá trị này là sai Dữ liệu đầu từ mạng nơ ron Kohonen thường là số nơ ron Trong trường hợp lưới hai chiều, nơ ron nằm đồ tồn hai loại cấu trúc liên kết là hình lục giác hình chữ nhật Tuy nhiên, cấu trúc liên kết hình lục giác tốt tác vụ trực quan hố nơ ron có nơ ron lân cận với cấu trúc hình chữ nhật là Hình 4-10: Cấu trúc hình lục giác đều và cấu trúc hình chữ nhật đó: - Lớp vào (Input Layer): dùng để đưa liệu huấn luyện vào mạng Kohonen Kích thước lớp vào tương ứng với kích thước mẫu học - Lớp (Output Layer): nơ ron lớp xếp mảng hai chiều Mảng gọi lớp Kohonen 68 - Tất noron lớp vào nối với nơ ron lớp Mỗi liên kết đầu vào và đầu mạng Kohonen tương ứng với trọng số Kích thước véc tơ trọng số kích thước lớp vào Nói cách khác, nơ ron lớp Kohonen có thêm vector trọng số n chiều (với n là số đầu vào) 4.5.2 Học ganh đua SOM là kỹ thuật mạng nơ ron truyền thẳng sử dụng tḥt tốn học khơng giám sát (học ganh đua) và qua trình “tự tổ chức”, xếp đầu cho thể hình học liệu ban đầu Học không giám sát liên quan đến việc dùng phương pháp quy nạp để phát tính quy chuẩn thể tập liệu Mặc dù có nhiều tḥt tốn mạng nơ ron cho học khơng giám sát, có tḥt tốn học ganh đua (Conpetitive Learning, Rumelhart & Zipser, 1985) Học ganh đua coi thuật tốn học mạng nơ ron khơng giám sát thích hợp khai phá liệu, minh họa cho phù hợp phương pháp học mạng nơ ron lớp Nhiệm vụ học xác định học ganh đua phân chia ví dụ huấn luyện cho trước vào tập cụm liệu Các cụm liệu thể luật biểu diễn tập liệu minh hoạ giống ánh xạ vào lớp giống Biến thể học ganh đua mà xét gọi học ganh đua đơn điệu, liên quan đến việc học mạng nơ ron lớp Các đơn vị đầu vào mạng có giá trị liên quan đến lĩnh vực xét, k đơn vị đầu thể k lớp ví dụ đầu vào phân cụm 69 Hình 4-11: Đơn vị (nơ ron) xử lý ganh đua Giá trị đầu vào cho đầu phương pháp tổ hợp tuyến tính đầu vào: (4.48) Trong đó:  xi đầu vào thứ i; i = 1,2,…,n  wji trọng số liên kết đầu vào thứ i với đầu thứ j, j = 1,2, …,m Gọi S(netj ) là hàm chuyển tín hiệu (hàm tương tác hay hàm kích hoạt đầu ra), là hàm đơn điệu khơng giảm liên tục hàm Sigmoid hàm bước nhẩy đơn vị sau: (4.49) Đơn vị đầu có giá trị đầu vào lớn coi là chiến thắng, và kích hoạt coi (thắng cuộc), kích hoạt khác đầu lại cho (thua cuộc) Quá trình vậy gọi là ganh đua Quá trình huấn luyện cho học ganh đua liên quan đến hàm chi phí: (4.50) đó:  aj kích hoạt đầu thứ j  xi là đầu vào thứ i  wji trọng số từ đầu vào thứ i với đầu thứ j Luật cập nhật trọng số là: (4.51) với α là số, tốc độ học Ý tưởng chính học ganh đua là đầu là lấy “độ tin cậy” cho tập ví dụ huấn luyện Chỉ đầu là chiến thắng số ví dụ đưa ra, và vectơ trọng số cho đơn vị chiến thắng di chuyển phía vectơ đầu vào Giống trình huấn luyện, vectơ trọng số đầu di chuyển phía trung tâm ví dụ Huấn luyện 70 xong, đầu đại diện cho nhóm ví dụ, và vectơ trọng số cho đơn vị phù hợp với trọng tâm nhóm Học ganh đua có liên quan mật thiết với phương pháp thống kê tiếng là phương pháp phân cụm K thành phần Khác hai phương pháp là học ganh đua là phương pháp trực tuyến, nghĩa là suốt trình học cập nhập trọng số mạng sau ví dụ đưa ra, thay sau tất ví dụ đưa làm phương pháp phân cụm K thành phần chính Học ganh đua phù hợp với tập liệu lớn, tḥt tốn trực tún thường có giải pháp nhanh mọi trường hợp 4.5.3 Thuật toán SOM Về chất, SOM biết đến kỹ thuật nén liệu dựa vecto trọng số (trực quan hóa liệu) Hình 4-12: Khơng gian ban đầu và không gian sau thực thuật toán SOM Input: Dữ liệu huấn luyện gồm tập n vectơ: V={V1, V2, …, Vi, …, Vn}, vectơ ứng với nơ ron (nút) đầu vào; Trong đó, vecto Vi gồm p chiều: Vi={v1, v2, …, vp} Khởi tạo tham số số lần lặp t=1  Bước 1: Khởi tạo vecto trọng số cho nơ ron Tương ứng với vector Vi, vecto trọng số Wi gồm p chiều Wi={w1, w2, …, wp} Và tập vecto trọng số có m bộ: W={W1, W2, …, Wi, …, Wm}  Bước 2: Chọn ngẫu nhiên vecto Vi 𝜖 V làm mẫu huấn luyện  Bước 3: Tìm mẫu khớp tốt BMU (Best Matching Unit)–phần tử nơ ron chiến thắng Tìm phần tử khớp vecto trọng số Wi𝜖W và vecto đầu vào Vi Nơ ron nào có vecto trọng số Wi gần với vecto đầu vào Vi nơ ron chọn là BMU 71 Để xác định BMU, ta tính khoảng cách Euclid vecto trọng số Wi với vecto Vi chọn Bước theo công thức sau: 𝑝 𝐷𝑖𝑠𝑡1 = √∑𝑖=1(𝑉𝑖 − 𝑊𝑖 )2 (4.52) đó:  Dist1: khoảng cách vecto trọng số Wi và vecto đầu vào Vi  𝑉𝑖 : vecto đầu vào xét  𝑊𝑖 : vecto trọng số phần tử chọn  Dist1 nơ ron có vecto trọng số tương ứng chọn BMU  Bước 4: Xây dựng phần tử lân cận Bước này xác định nơ ron nào thuộc vùng lân cận BMU Để xác định vùng lân cận BMU, tính bán kính lấy tâm là BMU tới nơ ron lại, gọi là bán kính lân cận Nơ ron nào có khoảng cách tới BMU nằm bán kính lân cận nơ ron là phần tử lân cận BMU Bán kính lân cận xác định lớn thường là bán kính tính theo kích thước mạng, sau giá trị này giảm dần sau số bước thực Bán kính lân cận BMU thời điểm t xác định công thức: 𝑡 𝜎(𝑡 ) = 𝜎0 exp (− ) 𝜆 (4.53) đó:  𝜎(𝑡 ): bán kính lân cận BMU thời điểm t  𝜎0 : bán kính lân cận BMU thời điểm t0  𝜎0 tính cơng thức: 𝜎0 = max(𝑤𝑖𝑑𝑡ℎ, ℎ𝑒𝑖𝑔ℎ𝑡 ) /2  Width: chiều rộng mạng Kohonen (do người dùng tự định nghĩa)  Height: chiều dài mạng Kohonen (do người dùng tự định nghĩa)  t: bước lặp  𝜆: số thời gian Trong đó: 𝜆 = 𝑁 log(𝜎0 )  N: số lần lặp để chạy thuật toán Sau tính bán kính lân cận, ta tính khoảng cách từ BMU tới nơ ron lại để xác định nơ ron nào là phần tử lân cận BMU Nếu khoảng cách nhỏ bán kính nơ ron tương ứng là phần tử lân cận BMU Khoảng cách từ BMU tới nơ ron tính theo công thức Euclid: 𝑝 𝐷𝑖𝑠𝑡2 = √∑𝑖=1(𝐵𝑀𝑈𝑖 − 𝑊𝑖 )2 72 (4.54) Dist2: khoảng cách từ BMU tới nơ ron lại Các phần tử lân cận bao gồm BMU cập nhật lại trọng số bước tiếp theo Hình 4-13: Bán kính lân cận và phần tử lân cận sau một số lần lặp a) Lưới hình chữ nhật; b) Lưới hình lục giác  Bước 5: Hiệu chỉnh trọng số phần tử lân cận – Quá trình học SOM Trọng số phần tử lân cận xác định bước bao gồm BMU hiệu chỉnh để chúng có giá trị gần giống với giá trị vecto đầu vào xét Các vecto trọng số hiệu chỉnh theo cơng thức: W(t+1)=W(t) + 𝜃(𝑡)L(t)(V(t)-W(t)) (4.55) đó:  W(t+1): vecto trọng số bước lặp (t+1)  W(t): vecto trọng số bước lặp t  𝜃(𝑡): hàm nội suy theo thời gian học, thể tác động khoảng cách trình học Hàm nội suy 𝜃(𝑡 ) tính theo công thức: 𝜃(𝑡 ) = 𝑒𝑥𝑝(− 𝐷𝑖𝑠𝑡2 ) (4.56) 2𝜎2 (𝑡) đó:  Dist2: khoảng cách từ BMU tới phần tử lân cận  L(t): hàm nội suy tốc độ học cho bước lặp tính theo công thức: L(t)=L0 exp(- (4.57) 73 𝑡 𝜆 )  L0: giá trị khởi tạo ban đầu tốc độ học Tốc độ học nội suy dần sau số lần lặp và giá trị hàm tiền dần số lần lặp đạt tới bước cuối  Bước 6: Tăng t, lấy mẫu huấn luyện tiếp theo Lặp lại bước cho đến giải thuật tối ưu tức W(t+1)=W(t) đạt đến số lần lặp xác định N cho trước (t=N) Thuật toán dừng thực đủ số lần lặp thay đổi nào vecto trọng số Q trình thực tḥt tốn SOM tóm tắt sau:  Bước 1: Khởi tạo giá trị cho vecto trọng số  Bước 2: Chọn vecto từ tập vecto đầu vào  Bước 3: Tìm mẫu khớp tốt (Best Matching Unit - BMU) Tính tốn khoảng cách vecto đầu vào với tất vecto trọng số theo công thức Euclid: 𝑝 𝐷𝑖𝑠𝑡 = √∑𝑖=1(𝑉𝑖 − 𝑊𝑖 )2 (4.58) Dist nơ ron có vecto trọng số tương ứng chọn làm BMU  Bước 4: Tìm phần tử lân cận  Bước 5: Cập nhật lại trọng số phần tử lân cận BMU W(t+1)=W(t) + 𝜃(𝑡)L(t)(V(t)-W(t))  Bước 6: Tăng t, lặp tiếp bước 4.5.4 SOM với toán phân cụm Với khả mạnh mẽ việc biểu diễn liệu từ không gian nhiều chiều khơng gian ít chiều mà bảo tồn quan hệ hình trạng liệu không gian đầu vào, nên chức chính SOM là trình diễn cấu trúc toàn tập liệu và giúp quan sát trực quan cấu trúc phân bố tương quan mẫu liệu không gian tập liệu Do đó, SOM ứng dụng nhiều bài tốn thực tế, từ bài tốn có tính chất tảng khai phá liệu phân cụm, phân lớp bài toán ứng dụng lĩnh vực khác Cụ thể, từ năm 1980 đến nay, có hàng nghìn bài báo, cơng trình nghiên cứu liên quan đến SOM, liệt kê “Bibliography of selforganizing map (SOM) papers Trong năm gần đây, kể số nghiên cứu ứng dụng SOM đại diện lĩnh vực như: thị giác máy và phân tích ảnh, nhận dạng và phân tích tiếng nói, phân tích liệu y tế, xử lý tín hiệu viễn thông, công nghiệp và liệu thế giới thực khác, xử lý liệu video giao thông, xử lý loại liệu liên tục theo thời gian 74 SOM là phương pháp phân cụm theo cách tiếp cận mạng nơ ron và thuật toán học ganh đua Vectơ trọng số ma trận SOM trọng tâm cụm, việc phân cụm cho kết tốt cách kết hợp đơn vị ma trận để tạo thành cụm lớn Một điểm thuận lợi phương pháp này là vùng Voronoi đơn vị ma trận là lồi, cách kết hợp số đơn vị ma trận với tạo nên cụm không lồi Việc sử dụng độ đo khoảng cách khác và chuẩn kết liên kết khác tạo thành cụm lớn Ma trận khoảng cách: chiến lược chung phân cụm đơn vị SOM tìm ma trận khoảng cách vectơ tham chiếu và sử dụng giá trị lớn ma trận là số đường biên cụm Trong không gian ba chiều, cụm thể “các thung lũng” Vấn đề là làm để quyết định đơn vị ma trận thuộc cụm nào cho trước Để giải quyết vấn đề này, người ta thường sử dụng thuật toán tích tụ (Agglomerative Algorithm), gồm bước: Quy cho đơn vị ma trận cụm riêng Tính toán khoảng cách tất cụm Ghép hai cụm gần Nếu số cụm tồn số cụm người dùng định nghĩa trước dừng, nếu khơng lặp lại từ bước SOM áp dụng phân cụm tập liệu khơng chuẩn hố Dùng ḷt học ganh đua, vectơ trọng số điều chỉnh theo hàm phân bố xác suất vectơ đầu vào Sự tương đồng vectơ đầu vào x và vectơ trọng số w tính toán khoảng cách Ơclit Trong suốt trình huấn luyện vectơ trọng số wj tuỳ ý cập nhập thời điểm t là: (4.59) Với (t) tỷ lệ học giảm dần trình huấn luyện, hci(t) hàm lân cận vectơ trọng số chiến thắng wc, vectơ trọng số wj , hci(t) giảm dần trình huấn luyện Mối quan hệ lân cận xác định cấu trúc hình học mối quan hệ cố định suốt trình học Kết thúc q trình học, điều chỉnh lại bán kính lân cận đủ nhỏ để cập nhập lại cho vectơ trọng số chiến thắng wc lân cận gần chúng Đối với cấu trúc chiều biểu diễn luật huấn luyện Công thức sấp xỉ hàm đơn điệu phân bố xác suất vectơ đầu vào Trong cấu trúc hai chiều kết trả tương quan độ xấp xỉ bình 75 phương lỗi tối thiểu vectơ lượng tử Ưu điểm, nhược điểm của thuật toán SOM a) Ưu điểm - Ưu điểm tốt ḥt tốn SOM dễ hiểu SOM cài đặt đơn giản làm việc tốt - Tḥt tốn SOM có ưu điểm biểu diễn trực quan liệu đa chiều vào khơng gian chiều và đặc trưng liệu giữ lại đồ - Tḥt tốn SOM có hiệu q trình phân tích địi hỏi trí thơng minh để đưa quyết định nhanh chóng thị trường Nó giúp cho người phân tích hiểu vấn đề tập liệu tương đối lớn - Thuật toán SOM xác định cụm liệu giúp cho việc tối ưu phân bổ nguồn lực - Thuật toán SOM ứng dụng nhiều nhận dạng tiếng nói, điều khiển tự động, hóa-sinh trắc học, phân tích tài chính và xử lý ngôn ngữ tự nhiên… b) Nhược điểm - Chi phí cho việc tính tốn lớn số chiều liệu tăng lên - Việc xác định ranh giới nhóm lớp Kohonen gặp nhiều khó khăn, trường hợp liệu biến thiên liên tục, phân chia nhóm nhỏ - Khối lượng tính tốn tḥt tốn SOM là tương đối lớn, vậy tốc độ xử lý giải thuật là thách thức cần xét tới Xét mạng Kohonen sử dụng thuật toán SOM với kích thước 20x30=600 nơ ron, độ phân giải ảnh đầu vào tính đơn vị megapixel tức có tới hàng triệu điểm ảnh Như vậy, riêng trình huấn luyện, việc tìm BMU phải duyệt qua khoảng 600 triệu lần nơ ron mà chưa tính đến phép tính khoảng cách, so sánh, cập nhật trọng số… - Một vấn đề lần chạy tḥt tốn SOM, ta tìm thấy độ tương tự khác vecto mẫu Các vecto mẫu thường bao quanh mẫu tương tự, nhiên mẫu tương tự lúc nào gần Nếu có nhiều sắc thái màu tím, lúc nào thu tập lớn tất màu tìm cụm, đơi cụm phân chia có hai nhóm màu tím Sử dụng liệu màu sắc, ta nói hai cụm liệu này là tương tự với hầu hết liệu khác, hai cụm trơng hồn tồn khơng liên quan tới Vì vậy, cần lưu ý nhiều để xây dựng đồ tốt cuối CÂU HỎI VÀ BÀI TẬP Cơ sở nơ ron nhân tạo là gì? Hãy mô tả thành phần nơ ron sinh học? Mô tả thành phần nơ ron nhân tao 76 Mơ tả mơ hình mạng Perceptron và luật học Mô tả mạng lan truyền ngược và luật học Mô tả mạng BAM và thuật học Cho tập liệu đầu vào (véc tơ đặc trưng đầu vào), liệu đầu (véc tơ đặc trưng đầu ra) Vector đặc trưng Vector nhãn A=(1 11) A'=(1-1 1-1 1) B=(1 0 0) B'=(1-1 1-1-1-1) C=(0 1 1) C'=(-1 1-1 1 1) L=(1 1 1) L'=(1 1 11) M=(0 1 0) M'=(-1 1 -1-1) N=(1 0 1) N'=(1 -1 -1 11) a) Thiết kế mạng BAM; vẽ sơ đồ chi tiết b) Tính đầu N đầu vào C=(0 1 1) có sai số bit trở thành R= (0 0 0) từ đưa kết luận Hãy thiết kế và tính toán thuật toán Perceptron để xác định tham số cho nơ ron nhân tạo dùng làm mạch OR theo sơ đồ biểu diễn và tham số khởi đầu sau Bảng chân lý hàm OR STT x1 x2 d(=y)= x1 OR x2 0 1 1 1 Trọng số khơi tạo (cho ban đầu) w0= 0,2; w1= 0,4; w2= 0,5; x0=+1 Tốc độ học:  = 0,3; Sai số cần đat: e=0 77 ... -1 -1 -1 -1 -1 Bước 3: Kích hoạt biến cho (bằng cách đổi -1 thành +1) bảng 12 Biếnhàm f1 f2 f3 f4 f5 f6 f7 a +1 +1 +1 +1 +1 +1 b +1 0 +1 +1 +1 c -1 0 -1 -1 +1 +1 +1 0 0 -1 -1 0 0 -1 -1 -1. .. -1; biến và hàm khơng có liên kết nhận giá trị bảng Biếnhàm a b c ℎ

Ngày đăng: 01/03/2022, 09:33

Xem thêm:

TỪ KHÓA LIÊN QUAN