HỌC VIỆN CÔNG NGHỆ BƯU CHÍNH VIỄN THÔNG NHẬP MÔN TRÍ TUỆ NHÂN TẠO (Dùng cho sinh viên hệ đào tạo đại học từ xa) Lưu hành nội HÀ NỘI - 2007 HỌC VIỆN CÔNG NGHỆ BƯU CHÍNH VIỄN THÔNG NHẬP MÔN TRÍ TUỆ NHÂN TẠO Biên soạn : PGS.TS NGUYỄN QUANG HOAN LỜI NÓI ĐẦU Trí tuệ nhân tạo (hay AI: Artificial Intelligence), nỗ lực tìm hiểu yếu tố trí tuệ Lý khác để nghiên cứu lĩnh vực cách để ta tự tìm hiểu thân Không giống triết học tâm lý học, hai khoa học liên quan đến trí tuệ, AI cố gắng thiết lập các yếu tố trí tuệ tìm biết chúng Lý khác để nghiên cứu AI để tạo thực thể thông minh giúp ích cho AI có nhiều sản phẩm quan trọng đáng lưu ý, chí từ lúc sản phẩm hình thành Mặc dù không dự báo tương lai, rõ ràng máy tính điện tử với độ thông minh định có ảnh hưởng lớn tới sống ngày tương lai phát triển văn minh nhân loại Trong trường đại học, cao đẳng, Trí tuệ nhân tạo trở thành môn học chuyên ngành sinh viên ngành Công nghệ Thông tin Để đáp ứng kịp thời cho đào tạo từ xa, Học viện Công nghệ Bưu Viễn thông biên soạn tài liệu cho sinh viên, đặc biêt hệ Đào tạo từ xa học tập Trong trình biên soạn, có tham khảo tài liệu Đại học Bách khoa Hà nội [1] giáo trình gần gũi tính công nghệ với Học viện Một số giáo trình khác Đại học Quốc gia thành phố Hồ Chí Minh [], tài liệu mạng tài liệu nước tiếng Anh [] tham khảo giới thiệu để sinh viên đào tạo từ xa đọc thêm Tài liệu nhằm hướng dẫn giới thiệu kiến thức bản, khái niệm, định nghĩa tóm tắt Một số thuật ngữ giải tiếng Anh để học viên đọc tiếng Anh dễ dàng, tránh hiểu nhầm chuyển sang tiếng Việt Tài liệu gồm chương sau: - Chương : Khoa học Trí tuệ nhân tạo: tổng quan - Chương : Các phương pháp giải vấn đề - Chương : Biểu diễn tri thức suy diễn - Chương : Xử lý ngôn ngữ tự nhiên - Chương : Các kỹ thuật trí tuệ nhân tạo đại Còn nhiều vấn đề khác chưa đề cập phạm vi tài liệu Đề nghị bạn đọc tìm hiểu thêm sau có kiến thức Nhiều cố gắng để cập nhật kiến thức thời gian, điều kiện, khả có hạn nên tài liệu chắn nhiều thiếu sót Chúng mong nhận nhiều ý kiến đóng góp để tài liệu hoàn thiện cho lần tái sau TÁC GIẢ CHƯƠNG 1: KHOA HỌC TRÍ TUỆ NHÂN TẠO: TỔNG QUAN Học xong phần sinh viên nắm được: Ý nghĩa, mục đích môn học; lịch sử hình thành phát triể Các tiền đề Trí tuệ nhân tạo (TTNT) Các khái niệm bản, định nghĩa TTNT Các lĩnh vực nghiên cứu ứng dụng Những vấn đè chưa giải TTNT 1.1 LỊCH SỬ HÌNH THÀNH VÀ PHÁT TRIỂN Trong phần nỗ lực giải thích coi trí tuệ nhân tạo môn đáng nghiên cứu nhất; nỗ lực nhằm giải thích trí tuệ nhân tạo Đây có phải môn hấp dẫn nghiên cứu không Trí tuệ nhân tạo hay AI (Artificial Intelligence) ngành tiên tiến Nó thức bắt đầu vào năm 1956, việc năm trước Cùng với ngành di truyền học đại, môn học nhiều nhà khoa học đánh giá: “là lĩnh vực thích nghiên cứu số môn muốn theo đuổi” Một sinh viên vật lý có lý nói rằng: tất ý tưởng hay Galileo, Newton, Einstein tìm rồi; số ý tưởng khác lại nhiều năm nghiên cứu trước có vai trò thực tiễn AI vấn đề để trống từ thời Einstein Qua 2000 năm, triết gia cố gắng để hiểu cách nhìn, học, nhớ lập luận hình thành Sự kiện máy tính sử dụng vào đầu năm 50 kỉ XX làm nhà tri thức thay đổi hướng suy nghĩ Rất nhiều người cho rằng: “những trí tuệ siêu điện tử” cho ta dự đoán tiềm trí tuệ AI thực khó nhiều so với ban đầu người nghĩ Hiện AI chuyển hướng sang nhiều lĩnh vực nhỏ, từ lĩnh vực có mục đích chung chung nhận thức, lập luận, tư logic đến công việc cụ thể đánh cờ, cung cấp định lý toán học, làm thơ chuẩn đoán bệnh Thường, nhà khoa học lĩnh vực khác nghiêng trí tuệ nhân tạo Trong lĩnh vực họ thấy phương tiện làm việc, vốn từ vựng hệ thống hoá, tự động hoá: nhiệm vụ trí tuệ công việc mà họ cống hiến đời Đây thực ngành phổ biến 1.1.1 Tư người: phương pháp nhận thức Nếu muốn chương trình máy tính có khả suy nghĩ người, phải tìm hiểu người tư nào? Có số tiêu chí xác định suy nghĩ kiểu người Chúng ta cần xem công việc bên óc người Có hai phương pháp để thực điều này: thứ thông qua tư bên - phải nắm bắt suy nghĩ người làm việc - thứ hai thông qua thí nghiệm tâm lý Khi có đầy đủ lý thuyết tư chương trình hoá máy tính Nếu đầu vào/ra chương trình thời gian làm việc phù hợp với người chương trình tự động hoạt động theo người Ví dụ, Newell Simon phát triển phương pháp giải vấn đề GPS- General Problem Solver (Newell and Simon 1961) Đây phương pháp đối lập với nghiên cứu đương thời (như Wang (1960)) ông quan tâm đến việc có giải pháp đắn, không quan tâm đến việc người phải làm 1.1.2 Các qui tắc tư Triết gia Aristote người hệ thống hoá “tư xác” Phép tam đoạn luận ông đưa kết luận tiền đề tiền đề thứ Chẳng hạn: “nếu Sô-crát người, người chết, Sô-crát chết” Môn tư logic phát triển vào cuối kỉ XIX đầu XX Năm 1965 chương trình cung cấp cho đủ thông tin, chi tiết vấn đề tư logic tìm phương pháp giải Nếu vấn đề chưa có cách giải chương trình không ngừng tìm kiếm cách giải Môn logic truyền thống AI điều mong mỏi để có chương trình mô tả hệ thống trí tuệ 1.1.3 Khởi nguồn AI (1943 - 1956) Những công việc AI Warren McCulioch Walter Pitts (1943) thực Họ nghiên cứu ba sở lí thuyết: triết học chức nơ ron thần kinh; phân tích mệnh đề logic Russell whitehead cuối thuyết dự đoán Turning Họ đề mô hình nơ ron nhân tạo, nơ ron đặc trưng hai trạng thái “bật”, “tắt” McCulloch Pitts phát hiện: mạng nơ ron có khả học Donald Hebb (1949) sử dụng luật học đơn giản tượng trưng cho việc truyền thông tin giữa nơ ron Đầu năm 1950, Claude Shannon (1950) Alan Turning (1953) viết chương trình đánh cờ theo cách mà Von Newman sáng chế máy tính Cùng lúc đó, hai sinh viên khoa toán trường đại học Princeton, Marvin Minsky Dean Edmond xây dựng hệ thống máy tính nơ ron vào năm 1951 gọi SNARC Nó sử dụng khoảng 3000 bóng điện tử chân không thiết bị khí tự động tính giá trị thặng dư từ chùm B-24 để mô mạng với 40 nơ ron Nhóm thạc sĩ Minsky nghi ngờ liệu có coi phần toán học, Neuman thành viên nhóm cho biết “nếu phần toán học ngày thế” Thật mỉa mai, sau Minsky lại người chứng minh học thuyết bác bỏ nhiều hệ thống nghiên cứu mạng nơ ron suốt năm 1970 Lòng say mê tôn trọng lớn từ sớm (1952-1969) Năm 1958 McCarthy định nghĩa ngôn ngữ bậc cao Lisp, trở thành ngôn ngữ lập trình cho AI Lisp ngôn ngữ lập trình lâu đời thứ hai mà sử dụng Với Lisp, McCarthy có phương tiện ông cần, để đáp ứng yêu cầu tài nguyên tính toán vấn đề quan trọng Cũng vào năm 1958, McCarthy xuất báo “Các chương trình với cách nhìn nhận chung” Trong báo này, ông bàn chương trình tư vấn, chương trình giả định coi hệ thống AI hoàn thiện Giống học thuyết logic cách chứng minh định lý hình học, chương trình McCarthy thiết kế nhằm sử dụng kiến thức để nghiên cứu cách giải vấn đề Không chương trình khác, chương trình phận kiến thức toàn giới quan Ông làm để điều đơn giản lại làm cho chương trình khái quát kế hoạch đến sân bay lên máy bay Chương trình thiết kế để chấp nhận vài chân lý trình thực bình thường Chính vậy, chương trình có khả thực chương trình mà không cần lập trình lại Năm 1963, McCarthy có nghiên cứu sử dụng logic để xây dựng chương trình người tư vấ Chương trình phát triển khám phá Robinson phương pháp cải cách Những công việc tạo hệ thống McCulloch Pitts làm cho chúng phát triển Các phương pháp nghiên cứu Hebb Widrow ủng hộ (Widrow Hoff, 1960; Widrow, 1962) Họ đặt tên mang nơ ron mạng ông, Frank Rosenblatt (1962) củng cố Rosenblatt chứng minh thuật toán mà ông nghiên cứu thêm vào khả nhận thức phù hợp với liệu đầu vào Những nhà nghiên cứu AI dự đoán thành công sau Herbert Simon phát biểu (1957): Không phải mục đích làm bạn ngạc nhiên, cách đơn giản để khái quát giới, máy móc suy nghĩ, học sáng tạo Hơn nữa, khả làm việc với tiến độ cao- tương lai rõ ràng – vấn đề giải được, tồn với tư người áp dụng Năm 1958, ông dự đoán 10 năm nữa, máy tính vô địch môn cờ vua, định lý toán học máy chứng minh 1.2 CÁC TIỀN ĐỀ CƠ BẢN CỦA TTNT Toàn cảnh phương pháp giải vấn đề hình thành thập kỉ đầu nghiên cứu AI mục đích nghiên cứu nỗ lực liên kết bước lập luận với để tìm phương pháp hoàn thiện Các phương pháp coi phương pháp sử dụng thông tin lĩnh vực Đối với nhiều lĩnh vực phức tạp, phương pháp thực lại Cách quanh vấn đề sử dụng kiến thức phù hợp để có bước lặp rộng để giải trường hợp nảy sinh định lĩnh vực nhỏ chuyên môn Chúng ta nói giải vấn đề khó phải biết trước đáp án Chương trình DENDRAL (Buchanan, 1969) ví dụ sớm tiếp cận phương pháp Nó phát triển Stanford, nơi Ed Feigenbaum (một sinh viên qui Herbert Simon) Bruce Buchanan (một triết gia chuyển sang làm nghiên cứu máy tính) Joshua Lederberg (nhà nghiên cứu di truyền đoạt giải Nobel) hợp lại để suy luận, giải vấn đề có cấu trúc phân tử từ thông tin máy đo quang phổ cung cấp Dữ liệu đưa vào chương trình gồm cấu trúc phân tử (Ví dụ C6H12NO2), nhiều dải quang phổ đưa hàng loạt đoạn phân tử khác khái quát chung lúc đưa dòng điện tử Ví dụ dải quang phổ chứa đựng điểm nhọn m=15 tương ứng với dải đoạn methyl (CH3) Phiên sơ khai chương trình khái quát toàn cấu trúc bên phân tử sau đoán cách quan sát dải quang phổ, so sánh với quang phổ thực tế Như nghĩ điều trở nên nan giải phân tử có kích thước đáng kể Các nhà nghiên cứu DENDRAL khuyên nhà phân tích dược khoa cho thấy họ nghiên cứu cách tìm kiếm phần bên điểm nhọn dải quang phổ, điều đưa gợi ý chung cấu trúc nhỏ bên phân tử Ví dụ, qui luật sau sử dụng để nhận nhóm nhỏ xeton (C=0) Nếu có hai đỉnh x1, x2 sau: (a) x1+x2 = M+28 (M khối lượng phân tử) (b) x1-28 đỉnh (c) x2-28 đỉnh (d) Có đỉnh x1 x2 đỉnh cao Sau có nhóm nhỏ xeton Khi nhận phân tử chứa cấu trúc nhỏ đặc biệt, số lượng thành phần tham gia bị giảm xuống nhanh chóng Nhóm DENDRAL kết luận hệ thống mạnh vì: toàn kiến thức có liên quan đến giải công việc phác thảo sơ qua từ cấu trúc chung [thành phần quang phổ đoán trước] để có cấu trúc đặc biệt Tầm quan trọng DENDRAL hệ thống cảm nhận kiến thức thành công Các chuyên gia lĩnh vực sâu từ số lượng lớn qui luật có mục đích đặc biệt Các hệ thống sau không kết hợp lại thành chủ đề phương pháp chuyên gia McCarthy - phần hoàn toàn tách biệt kiến thức (trong cấu trúc qui luật) thành phần lập luận Với học này, Feigebaum thành viên khác Stanford bắt đầu lập dự án chương trình Heuristic, để đầu tư mở rộng vào phương pháp hệ chuyên gia nhằm áp dụng vào lĩnh vực khác Những nỗ lực sau chuẩn đoán y học Feigenbaum, Buchanan Edward Shortlife phát triển hệ chuyên gia MYCIN để chẩn đoán bệnh nhiễm trùng máu Với khoảng 450 luật, hệ chuyên gia MYCIN thực tốt nhiều bác sĩ Nó có hai khác biệt với hệ chuyên gia DENDRAL Thứ nhất: không giống luật DENDRAL, không mẫu lý thuyết chung tồn mà suy luận từ luật hệ MYCIN Các luật phải có câu chất vấn chuyên gia, người có nhiệm vụ tìm chúng từ kinh nghiệm Thứ hai: luật phản ánh mối liên quan không chắn với kiến thức y học MYCIN kết hợp với hệ vi phân biến số coi nhân tố phù hợp tốt (ở lúc) với phương pháp mà bác sĩ tiếp cận với triệu chứng trình chuẩn đoán Cách tiếp cận khác để chuẩn đoán y học nghiên cứu Tại trường đại học Rutger, máy tính ngành sinh hoá Sual Amarel bắt đầu tham vọng nhằm cố gắng chuẩn đoán bệnh tật dựa kiến thức biểu đạt rõ ràng máy phân tích trình bệnh tật Trong đó, số nhóm lớn MIT trung tâm y tế Anh tiếp tục phương pháp chuẩn đoán điều trị dựa học thuyết có tính khả thi thực tế Mục đích họ xây dựng hệ thống đưa phương pháp chẩn đoán y học Về y học, phương pháp Stanford sử dụng qui luật bác sĩ cung cấp từ đầu chứng minh phổ biến Nhưng hệ chuyên gia PROSPECTOR (Duda 1979) công bố cho người cách giới thiệu thiết bị khoan thăm quặng Một vài ngôn ngữ dựa vào logic ngôn ngữ Prolog phổ biến châu Âu, PLANNER Mĩ Các ngôn ngữ khác, theo sau ý tưởng Minsky (1975) chấp nhận phương pháp tiếp cận cấu trúc, thu thập chứng đối tượng loại kiện 1.3 CÁC KHÁI NIỆM CƠ BẢN 1.3.1 Trí tuệ nhân tạo(AI) gì? Chúng ta nói: “Tuyệt thật, chương trình thực suy diễn thông minh, cần phải tiếp tục người cần bổ sung cho nó” Nhưng theo phát triển khoa học cho thấy: có ích ta hướng Định nghĩa AI có tới tám sách đề cập Những định nghĩa đưa hai nhận định chính: - Thứ nhất: quan tâm chủ yếu đến trình tư lập luận - Thứ hai: vấn đề quan tâm hơn, hoạt động Một hệ thống coi hợp lý thực Điều đưa ngành AI đến mục tiêu.(xem Bảng 1.1) Chúng ta vào chi tiết hướng theo phát biểu sau đây: “Nh ng n l c thú v m i l “Vi c nghiên c u c s trí tu t o máy tính nh ng máy móc thông qua s d ng máy vi tính” có trí tu , hi u theo c nghiã đ y đ l n ngh a bóng” (Haugeland, 1985) “[s (Charniak and McDermott, 1985) “Nghiên c u máy tính l m cho máy tính có kh n ng c m nh n, t đ ng hoá c a] ho t l p lu n v l m vi c” đ ng giúp k t h p nh ng t c a ng i v i công vi c c ng nh quy t đ nh, (Winston, 1992) gi i quy t v n đ , h c t p ” (Bellman 1978) “Ngh thu t sáng t o máy móc l “Trong l nh v c nghiên c u l đ th c hi n ch c n ng hình th nh t tìm cách gi i thích v ng đ i l m vi c” đ t c nh ng h nh đ ng có t (Kurzweil, “l nh v c x lý tính toán” 1990) (Schalkoff, 1990) "Vi c nghiên c u l m cách n o đ “Trong ng nh khoa h c máy tính b t máy tính l m nh ng vi c m có liên quan đ n s t đ ng hoá m t lúc ng i có th l m nh ng ho t đ ng mang tính trí tu ” t t h n.” (Luger and (Rich and Knight, 1991) Stubbefield, 1993) Hình 1.1 Những định nghĩa AI chia thành nhóm: Hệ thống tư người Hệ thống tư có lập luận Hệ thống hoạt động người Hệ thống hoạt động có lập luận Hoạt động người: phương pháp trắc nghiệm Turning Phương pháp trắc nghiệm Turning Alan Turning (1950) đưa Đây phương pháp nhằm định nghĩa hoạt động gọi thông minh Turning cho rằng: hoạt động trí tuệ khả có người công việc cần tri thức, đủ để đánh lừa người thẩm vấn Nói khái quát, phương pháp trắc nghiệm ông là: máy tính bị người hỏi thông qua giao tiếp gõ chữ qua vô tuyến Kết thúc thí nghiệm lúc người hỏi không câu để hỏi người máy hoàn thành Để lập chương trình cho máy tính qua trình kiểm tra cần hoàn thành nhiều việc Máy tính cần có khả sau: • Xử lý ngôn ngữ tự nhiên để giao tiếp tốt tiếng Anh (hoặc ngôn ngữ khác) • Biểu diễn tri thức, lưu trữ thông tin cung cấp trước trình thẩm vấn • Tự động lập luận để sử dụng thông tin lưu nhằm trả lời câu hỏi phác thảo kết luận • Máy học: để thích nghi với môi trường mới, kiểm tra chấp nhận mẫu • Đối với AI, không cần có cố gắng cao qua trình kiểm tra Turning Khi chương trình AI giao tiếp trực tiếp với người việc hoạt động giống người vấn đề thiết yếu Quá trình trình diễn lý giải hệ thống không cần dựa vào người 1.3.2 Tri thức gì? Tri thức hiểu biết lý thuyết hay thực tế vè chủ đề hay lĩnh vực Tri thức tổng biết nay; tri thức sức mạnh Những người có tri thư tốt chuyên gia (expert) So với chương trình truyền thống (được cấu tạo từ hai “chất liệu” liệu thuật toán), chương trình trí tuệ nhân tạo cấu tạo từ hai thành phần sở tri thức (knowledge base) động suy diễn (inference engine) 1.3.3 Cơ sở tri thức (Knowledge Base: KB) Định nghĩa: Cơ sở tri thức tập hợp tri thức liên quan đến vấn đề mà chương trình quan tâm giải Cơ sở tri thức chứa kiến thức sử dụng để giải vấn đề (bài toán) trí tuệ nhân tao 1.3.4 Hệ sở tri thức Trong hệ sở tri thức chứa hai chức tách biệt nhau, trường hợp đơn gian gồm hai khối: khối tri thức hay gọi sở tri thức; khối điều khiển hay gọi đông suy diễn Với hệ thống phức tạp, thân động suy diễn hệ sở tri thức chứa siêu tri thức (tri thức tri thức) Hình mô tả cấu trúc chương trình truyền thống (bên trái) cấu trúc chương trình trí tuệ nhân tạo (bên phải) DỮ LIỆU THUẬT TOÁN DỮ LIỆU CƠ SỞ TRI THỨC ĐỘNG CƠ SUY DIỄN Động suy diễn: phương pháp vận dụng tri thức sở tri thức để giải vấn đề ... phần nỗ lực giải thích coi trí tuệ nhân tạo môn đáng nghiên cứu nhất; nỗ lực nhằm giải thích trí tuệ nhân tạo Đây có phải môn hấp dẫn nghiên cứu không Trí tuệ nhân tạo hay AI (Artificial Intelligence)... BƯU CHÍNH VIỄN THÔNG NHẬP MÔN TRÍ TUỆ NHÂN TẠO Biên soạn : PGS.TS NGUYỄN QUANG HOAN LỜI NÓI ĐẦU Trí tuệ nhân tạo (hay AI: Artificial Intelligence), nỗ lực tìm hiểu yếu tố trí tuệ Lý khác để nghiên... TÁC GIẢ CHƯƠNG 1: KHOA HỌC TRÍ TUỆ NHÂN TẠO: TỔNG QUAN Học xong phần sinh viên nắm được: Ý nghĩa, mục đích môn học; lịch sử hình thành phát triể Các tiền đề Trí tuệ nhân tạo (TTNT) Các khái niệm