Bài giảng Trí tuệ nhân tạo: Mở đầu về máy học - TS. Đào Anh Nam

29 65 0
Bài giảng Trí tuệ nhân tạo: Mở đầu về máy học - TS. Đào Anh Nam

Đang tải... (xem toàn văn)

Tài liệu hạn chế xem trước, để xem đầy đủ mời bạn chọn Tải xuống

Thông tin tài liệu

Bài giảng "Trí tuệ nhân tạo: Mở đầu về máy học" cung cấp cho người học các kiến thức: Thế nào là máy học, học bằng cách xây dựng cây định danh. Mời các bạn cùng tham khảo nội dung chi tiết.

Artificial Intelligence Trí Tuệ Nhân tạo TS Đào Nam Anh MACHINE LEARNING INTRODUCTION MỞ ĐẦU VỀ MÁY HỌC Tài liệu Stuart Russell and Peter Norvig, Artificial Intelligence A Modern Approach R E Bellman An Introduction to Artificial Intelligence: Can Computers Think? Boyd & Fraser Publishing Company, San Francisco, 1978 E Charniak and D McDermott Introduction to Artificial Intelligence AddisonWesley,Reading, Massachusetts, 1985 J Haugeland Artificial Intelligence: The Very Idea MIT Press, Cambridge, Massachusetts, 1985 R Kurzweil The Age of Intelligent Machines MIT Press, Cambridge, Massachusetts, 1990 N J Nilsson Artificial Intelligence: A New Synthesis Morgan Kaufmann, San Mateo, California, 1998 D Poole, A K Mackworth, and R Goebel Computational Intelligence: A Logical Approach Oxford University Press, Oxford, UK, 1998 E Rich and K Knight Artificial Intelligence (Second Edition) McGrawHill, New York, 1991 P H Winston Artificial Intelligence (Third Edition) AddisonWesley, Reading, Massachusetts, 1992 N.Q.Hoan, Nhập mơn trí tuệ nhân tạo Đinh Mạnh Tường, Giáo trình Trí tuệ Nhân tạo Hồng Kiếm, Đinh Nguyễn Anh Dũng, Giáo trình Nhập mơn Trí tuệ Nhân tạo NỘI DUNG I THẾ NÀO LÀ MÁY HỌC II HỌC BẰNG CÁCH XÂY DỰNG CÂY ĐỊNH DANH THẾ NÀO LÀ MÁY HỌC Thuật ngữ "học" theo nghĩa thông thường tiếp thu tri thức để biết cách vận dụng Ở ngồi đời, q trình học diễn nhiều hình thức khác học thuộc lòng (học vẹt), học theo kinh nghiệm (học dựa theo trường hợp), học theo kiểu nghe nhìn, Trên máy tính có nhiều thuật tốn học khác Tuy nhiên, phạm vi giáo trình này, khảo sát phương pháp học dựa theo trường hợp Theo phương pháp này, hệ thống cung cấp số trường hợp "mẫu", dựa tập mẫu này, hệ thống tiến hành phân tích rút quy luật (biểu diễn luật sinh) Sau đó, hệ thống dựa luật để "đánh giá" trường hợp khác (thường không giống trường hợp "mẫu") Ngay với kiểu học này, có nhiều thuật tốn học khác Một lần nữa, với mục đích giới thiệu, khảo sát trường hợp đơn giản THẾ NÀO LÀ MÁY HỌC Có thể khái quát trình học theo trường hợp dạng hình thức sau : Dữ liệu cung cấp cho hệ thống ánh xạ f ứng trường hợp p tập hợp P với "lớp" r tập R f : P |→ R p→r Tuy nhiên, tập P thường nhỏ (và hữu hạn) so với tập tất trường hợp cần quan tâm P’ (P⊂ P’) Mục tiêu xây dựng ánh xạ f ’ cho ứng trường hợp p’ tập P’ với "lớp" r tập R Hơn nữa, f ’ phải bảo toàn f, nghĩa : Với p ∈ P f(p) ≡ f ’(p) THẾ NÀO LÀ MÁY HỌC Học theo trường hợp tìm cách xây dựng ánh xạ f’ dựa theo ánh xạ f f gọi tập mẫu Phương pháp học theo trường hợp phương pháp phổ biến nghiên cứu khoa học mê tín dị đoan Cả hai dựa liệu quan sát, thống kê để từ rút quy luật Tuy nhiên, khác với khoa học, mê tín dị đoan thường dựa tập mẫu không đặc trưng, cục bộ, thiếu sở khoa học HỌC BẰNG CÁCH XÂY DỰNG CÂY ĐỊNH DANH Ví dụ Nhiệm vụ ví dụ xây dựng quy luật để kết luận người tắm biển bị cháy nắng Ta gọi tính chất cháy nắng hay khơng cháy nắng thuộc tính quan tâm (thuộc tính mục tiêu) Như vậy, trường hợp này, tập R gồm có hai phần tử {"cháy nắng", "bình thường"} Còn tập P tất người liệt kê bảng (8 người) Chúng ta quan sát tượng cháy nắng dựa thuộc tính sau : chiều cao (cao, trung bình, thấp), màu tóc (vàng, nâu, đỏ) cân nặng (nhẹ, TB, nặng), dùng kem (có, khơng), Ta gọi thuộc tính gọi thuộc tính dẫn xuất HỌC BẰNG CÁCH XÂY DỰNG CÂY ĐỊNH DANH Ví dụ Dĩ nhiên thực tế để đưa kết luận vậy, cần nhiều liệu đồng thời cần nhiều thuộc tính dẫn xuất Ví dụ đơn giản nhằm để minh họa ý tưởng thuật tốn máy học Tên Tóc Ch.Cao Cân Nặng Dùng kem? Kết Sarah Vàng T.Bình Nhẹ Khơng Cháy Dana Vàng Cao T.Bình Có Khơng Alex Nâu Thấp T.Bình Có Khơng Annie Vàng Thấp T.Bình Khơng Cháy Emilie Đỏ T.Bình Nặng Không Cháy Peter Nâu Cao Nặng Không Không John Nâu T.Bình Nặng Khơng Khơng Kartie Vàng Thấp Nhẹ Có Khơng HỌC BẰNG CÁCH XÂY DỰNG CÂY ĐỊNH DANH Ví dụ Ý tưởng phương pháp tìm cách phân hoạch tập P ban đầu thành tập Pi cho tất phần tử tất tập Pi có chung thuộc tính mục tiêu P = P1 ∪ P2 ∪ ∪ Pn ∀ (i,j) i≠ j : (Pi ∩ Pj = ∅) ∀ i, ∀ k,l : pk ∈ Pi pl ∈ Pi f(pk) = f(pl) Sau phân hoạch xong tập P thành tập phân hoạch Pi đặc trưng thuộc tính đích ri (ri ∈ R), bước ứng với phân hoạch Pi ta xây dựng luật Li : GTi → ri GTi mệnh đề hình thành cách kết hợp thuộc tính dẫn xuất HỌC BẰNG CÁCH XÂY DỰNG CÂY ĐỊNH DANH Ví dụ Có hai cách phân hoạch hiển nhiên mà nghĩ Cách 1: cho người vào phân hoạch riêng (P1 = {Sarah}, P2 = {Dana}, … tổng cộng có phân hoạch cho người) Cách 2: phân hoạch thành hai tập, tập gồm tất người cháy nắng tập lại bao gồm tất người không cháy nắng Tuy đơn giản phân hoạch theo kiểu chẳng giải Tên Tóc Ch.Cao Cân Nặng Dùng kem? Kết Sarah Vàng T.Bình Nhẹ Khơng Cháy Dana Vàng Cao T.Bình Có Khơng Alex Nâu Thấp T.Bình Có Khơng Annie Vàng Thấp T.Bình Khơng Cháy Emilie Đỏ T.Bình Nặng Khơng Cháy Peter Nâu Cao Nặng Khơng Khơng John Nâu T.Bình Nặng Khơng Khơng Kartie Vàng Thấp Nhẹ Có 10 Khơng HỌC BẰNG CÁCH XÂY DỰNG CÂY ĐỊNH DANH Phương án chọn thuộc tính phân hoạch Quinlan Với thuộc tính dẫn xuất A sử dụng để phân hoạch, tính : VA(j) = ( T(j , r1), T(j , r2) , …, T(j , rn) ) T(j, ri) = (tổng số phần tử phân hoạch có giá trị thuộc tính dẫn xuất A j có giá trị thuộc tính mục tiêu ri ) / ( tổng số phần tử phân hoạch có giá trị thuộc tính dẫn xuất A j ) * r1, r2, … , rn giá trị thuộc tính mục tiêu Như thuộc tính A nhận giá trị khác có vector đặc trưng Một vector V(Aj ) gọi vector đơn vị có thành phần có giá trị thành phần khác có giá trị Thuộc tính chọn để phân hoạch thuộc tính có nhiều vector đơn vị 15 HỌC BẰNG CÁCH XÂY DỰNG CÂY ĐỊNH DANH Phương án chọn thuộc tính phân hoạch Quinlan Trở lại ví dụ, trạng thái ban đầu (chưa phân hoạch) tính vector đặc trưng cho thuộc tính dẫn xuất để tìm thuộc tính dùng để phân hoạch Đầu tiên thuộc tính màu tóc Thuộc tính màu tóc có giá trị khác (vàng, đỏ, nâu) nên có vector đặc trưng tương ứng : VTóc (vàng) = ( T(vàng, cháy nắng), T(vàng, khơng cháy nắng) ) Số người tóc vàng : Số người tóc vàng cháy nắng : Số người tóc vàng khơng cháy nắng : Do VTóc(vàng) = (2/4 , 2/4) = (0.5, 0.5) 16 HỌC BẰNG CÁCH XÂY DỰNG CÂY ĐỊNH DANH Phương án chọn thuộc tính phân hoạch Quinlan Tương tự VTóc(nâu) = (0/3, 3/3) = (0,1) (vector đơn vị) Số người tóc nâu : Số người tóc nâu cháy nắng : Số người tóc nâu khơng cháy nắng : VTóc(đỏ) = (1/1, 0/1) = (1,0) (vector đơn vị) Tổng số vector đơn vị thuộc tính tóc vàng 17 HỌC BẰNG CÁCH XÂY DỰNG CÂY ĐỊNH DANH Phương án chọn thuộc tính phân hoạch Quinlan Các thuộc tính khác tính tương tự, kết sau : VC.Cao(Cao) = (0/2,2/2) = (0,1) VC.Cao(T.B) = (2/3,1/3) VC.Cao(Thấp) = (1/3,2/3) VC.Nặng (Nhẹ) = (1/2,1/2) VC.Nặng (T.B) = (1/3,2/3) VC.Nặng (Nặng) = (1/3,2/3) VKem (Có) = (3/3,0/3) = (1,0) VKem (Khơng) = (3/5,2/5) 18 HỌC BẰNG CÁCH XÂY DỰNG CÂY ĐỊNH DANH Phương án chọn thuộc tính phân hoạch Quinlan Như thuộc tính màu tóc có số vector đơn vị nhiều nên chọn để phân hoạch Sau phân hoạch theo màu tóc xong, có phân hoạch theo tóc vàng (Pvàng) chứa người cháy nắng không cháy nắng nên ta tiếp tục phân hoạch tập Ta thực thao tác tính vector đặc trưng tương tự thuộc tính lại (chiều cao, cân nặng, dùng kem) Trong phân hoạch Pvàng, tập liệu lại : Tên Sarah Dana Annie Kartie Ch.Cao T.Bình Cao Thấp Thấp Cân Nặng Nhẹ T.Bình T.Bình Nhẹ Dùng kem? Khơng Có Khơng Có Kết Cháy Khơng Cháy Không 19 HỌC BẰNG CÁCH XÂY DỰNG CÂY ĐỊNH DANH Phương án chọn thuộc tính phân hoạch Quinlan VC.Cao(Cao) = (0/1,1/1) = (0,1) VC.Cao(T.B) = (1/1,0/1) = (1,0) VC.Cao(Thấp) = (1/2,1/2) VC.Nặng (Nhẹ) = (1/2,1/2) VC.Nặng (T.B) = (1/2,1/2) VC.Nặng (Nặng) = (0,0) VKem (Có) = (0/2,2/2) = (0,1) VKem (Khơng) = (2/2,0/2) = (1,0) thuộc tính dùmg kem chiều cao có vector đơn vị Tuy nhiên, số phân hoạch thuộc tính dùng kem nên ta chọn phân hoạch theo thuộc tính dùng kem 20 Cây định danh cuối hình bên : HỌC BẰNG CÁCH XÂY DỰNG CÂY ĐỊNH DANH Phương án chọn thuộc tính phân hoạch Độ đo hỗn loạn Thay phải xây dựng vector đặc trưng phương pháp Quinlan, ứng với thuộc tính dẫn xuất ta cần tính độ đo hỗn loạn lựa chọn thuộc tính có độ đo hỗn loạn thấp Cơng thức tính sau : TA = : bt tổng số phần tử có phân hoạch bj tổng số phần tử có thuộc tính dẫn xuất A có giá trị j bri : tổng số phần tử có thuộc tính dẫn xuất A có giá trị j thuộc tính mục tiêu có giá trị i 21 HỌC BẰNG CÁCH XÂY DỰNG CÂY ĐỊNH DANH Phát sinh tập luật Nguyên tắc phát sinh tập luật từ định danh đơn giản Ứng với nút lá, ta việc từ đỉnh nút phát sinh luật tương ứng Cụ thể từ định danh kết trước ta có luật sau (xét nút từ trái sang phải) – – – – (Màu tóc vàng) (có dùng kem) → khơng cháy nắng (Màu tóc vàng) (khơng dùng kem) → cháy nắng (Màu tóc nâu) → khơng cháy nắng (Màu tóc đỏ) → cháy nắng 22 HỌC BẰNG CÁCH XÂY DỰNG CÂY ĐỊNH DANH Tối ưu tập luật Loại bỏ mệnh đề thừa Khác so với phương pháp loại bỏ mệnh đề thừa trình bày phần biểu diễn tri thức (chỉ quan tâm đến logic hình thức), phương pháp loại bỏ mệnh đề thừa dựa vào liệu Với ví dụ tập luật có phần trước, quan sát luật sau : (Màu tóc vàng) (có dùng kem) → khơng cháy nắng Bây ta lập bảng (gọi bảng Contigency), bảng thống kê người có dùng kem tương ứng với tóc màu vàng bị cháy nắng hay khơng Trong liệu cho, có người khơng dùng kem Không cháy nắng Cháy nắng Màu vàng Màu khác 0 23 HỌC BẰNG CÁCH XÂY DỰNG CÂY ĐỊNH DANH Tối ưu tập luật Loại bỏ mệnh đề thừa Theo bảng thống kê rõ ràng thuộc tính tóc vàng (trong luật trên) khơng đóng góp việc đưa kết luận cháy nắng hay không (cả người dùng kem không cháy nắng) nên ta loại bỏ thuộc tính tóc vàng khỏi tập luật Sau loại bỏ mệnh đề thừa, tập mệnh đề ví dụ : – – – – (có dùng kem) → khơng cháy nắng (Màu tóc vàng) (khơng dùng kem) → cháy nắng (Màu tóc nâu) → khơng cháy nắng (Màu tóc đỏ) → cháy nắng 24 HỌC BẰNG CÁCH XÂY DỰNG CÂY ĐỊNH DANH Tối ưu tập luật Loại bỏ mệnh đề thừa Như quy tắc chung để loại bỏ mệnh đề nào? Giả sử luật có n mệnh đề : A1 A2 … An → R Để kiểm tra xem loại bỏ mệnh đề Ai hay không, bạn lập tập hợp P bao gồm phần tử thỏa tất mệnh đề A1 , A2 , … Ai-1, Ai+1, …, An (khơng cần xét có thỏa Ai hay khơng, cần thỏa mệnh đề lại được) Sau đó, lập bảng Contigency: Trong Ai E số phần tử P thỏa Ai R F số phần tử P thỏa Ai khơng thỏa R ¬ Ai G số phần tử P không thỏa Ai thỏa R H số phần tử P không thỏa Ai khơng thỏa R R ¬R E F G H Nếu tổng F+H = loại bỏ mệnh đề Ai khỏi luật 25 HỌC BẰNG CÁCH XÂY DỰNG CÂY ĐỊNH DANH Xây dựng mệnh đề mặc định Có vấn đề đặt gặp phải trường hợp mà tất luật khơng thỏa phải làm nào? Một cách hành động đặt luật mặc định : Nếu khơng có luật thỏa → cháy nắng (1) Hoặc Nếu khơng có luật thỏa → khơng cháy nắng (2) (chỉ có hai luật thuộc tính mục tiêu nhận hai giá trị cháy nắng hay không cháy nắng) Giả sử ta chọn luật mặc định (2) tập luật trở thành : (Màu tóc vàng) (khơng dùng kem) → cháy nắng (Màu tóc đỏ) → cháy nắng Nếu khơng có luật thỏa → không cháy nắng (2) 26 HỌC BẰNG CÁCH XÂY DỰNG CÂY ĐỊNH DANH Xây dựng mệnh đề mặc định Ta loại bỏ tất luật dẫn đến kết luận không cháy nắng thay luật mặc định Tại vậy? Bởi luật có kết luận với luật mặc định Rõ ràng có hai khả cháy nắng hay không 27 HỌC BẰNG CÁCH XÂY DỰNG CÂY ĐỊNH DANH Quy tắc Chọn luật Vấn đề chọn luật nào? Sau số quy tắc 1) Chọn luật mặc định cho thay cho nhiều luật (trong ví dụ ngun tắc khơng áp dụng có luật dẫn đến cháy nắng luật dẫn đến không cháy nắng) 2) Chọn luật mặc định có kết luận phổ biến Trong ví dụ nên chọn luật (2) số trường hợp khơng cháy nắng khơng cháy nắng 3) Chọn luật mặc định cho tổng số mệnh đề luật mà thay nhiều Trong ví dụ luật chọn luật (1) tổng số mệnh đề luật dẫn đến cháy nắng tổng số mệnh đề luật dẫn đến không cháy nắng 28 Câu hỏi https://sites.google.com/site/daonamanhedu/teaching/ artificial-intelligence 29 ... N.Q.Hoan, Nhập mơn trí tuệ nhân tạo Đinh Mạnh Tường, Giáo trình Trí tuệ Nhân tạo Hồng Kiếm, Đinh Nguyễn Anh Dũng, Giáo trình Nhập mơn Trí tuệ Nhân tạo NỘI DUNG I THẾ NÀO LÀ MÁY HỌC II HỌC BẰNG CÁCH... ĐỊNH DANH THẾ NÀO LÀ MÁY HỌC Thuật ngữ "học" theo nghĩa thông thường tiếp thu tri thức để biết cách vận dụng Ở ngồi đời, q trình học diễn nhiều hình thức khác học thuộc lòng (học vẹt), học theo... học theo kinh nghiệm (học dựa theo trường hợp), học theo kiểu nghe nhìn, Trên máy tính có nhiều thuật tốn học khác Tuy nhiên, phạm vi giáo trình này, khảo sát phương pháp học dựa theo trường hợp

Ngày đăng: 27/06/2020, 09:19

Hình ảnh liên quan

Còn tậ pP là tất cả những người được liệt kê trong bảng dưới (8 người)  - Bài giảng Trí tuệ nhân tạo: Mở đầu về máy học - TS. Đào Anh Nam

n.

tậ pP là tất cả những người được liệt kê trong bảng dưới (8 người) Xem tại trang 7 của tài liệu.
trong đó các GTi là mệnh đề được hình thành bằng cách kết hợp - Bài giảng Trí tuệ nhân tạo: Mở đầu về máy học - TS. Đào Anh Nam

trong.

đó các GTi là mệnh đề được hình thành bằng cách kết hợp Xem tại trang 9 của tài liệu.
Quan sát hình trên ta thấy rằng phân hoạch Pnâu và Pđỏ thỏa mãn được điều kiện "có chung thuộc  tính mục tiêu“ - Bài giảng Trí tuệ nhân tạo: Mở đầu về máy học - TS. Đào Anh Nam

uan.

sát hình trên ta thấy rằng phân hoạch Pnâu và Pđỏ thỏa mãn được điều kiện "có chung thuộc tính mục tiêu“ Xem tại trang 12 của tài liệu.
Cây định danh cuối cùng của chúng ta sẽ như hình bên : - Bài giảng Trí tuệ nhân tạo: Mở đầu về máy học - TS. Đào Anh Nam

y.

định danh cuối cùng của chúng ta sẽ như hình bên : Xem tại trang 20 của tài liệu.
bảng thống kê những người có dùng kem tương ứng với tóc màu vàng và bị cháy nắng hay không - Bài giảng Trí tuệ nhân tạo: Mở đầu về máy học - TS. Đào Anh Nam

bảng th.

ống kê những người có dùng kem tương ứng với tóc màu vàng và bị cháy nắng hay không Xem tại trang 23 của tài liệu.
Theo bảng thống kê này thì rõ ràng là thuộc tính tóc vàng (trong luật trên) không đóng góp gì trong việc đưa ra kết  luận cháy nắng hay không (cả 3 người dùng kem đều  - Bài giảng Trí tuệ nhân tạo: Mở đầu về máy học - TS. Đào Anh Nam

heo.

bảng thống kê này thì rõ ràng là thuộc tính tóc vàng (trong luật trên) không đóng góp gì trong việc đưa ra kết luận cháy nắng hay không (cả 3 người dùng kem đều Xem tại trang 24 của tài liệu.
Sau đó, lập bảng Contigency: - Bài giảng Trí tuệ nhân tạo: Mở đầu về máy học - TS. Đào Anh Nam

au.

đó, lập bảng Contigency: Xem tại trang 25 của tài liệu.

Từ khóa liên quan

Tài liệu cùng người dùng

  • Đang cập nhật ...

Tài liệu liên quan