Tài liệu hạn chế xem trước, để xem đầy đủ mời bạn chọn Tải xuống
1
/ 46 trang
THÔNG TIN TÀI LIỆU
Thông tin cơ bản
Định dạng
Số trang
46
Dung lượng
1,73 MB
Nội dung
Nhìn lại 25 năm phát triển ngành trí tuệ nhân tạo Hồ Tú Bảo Phịng Nhận dạng Cơng nghệ Tri thức Viện Cơng nghệ Thơng tin & Phịng thí nghiệm Phương pháp luận Sáng tạo Tri thức Viện Khoa học Công nghệ Tiên tiến Nhật Nội dung Trí tuệ nhân tạo 25 năm qua Vài xu hướng trí tuệ nhân tạo Một số kết nghiên cứu Tìm kiếm thơng tin Web Query: 25 years, AI development Các search engines tìm q nhiều trang Web, phần lớn khơng liên quan đến câu hỏi Có hỏi ngơn ngữ tự nhiên? Query: AI during last 25 years of development Trí tuệ nhân tạo? Trí tuệ nhân tạo nhánh khoa học liên quan đến việc làm cho máy tính có khả trí tuệ người, tiêu biểu khả “suy nghĩ”, “hiểu ngôn ngữ”, biết “học tập” Sự đời ngành trí tuệ nhân tạo “birth day”: Hội nghị Dartmouth College mùa hè 1956, Minsky McCarthy tổ chức, McCarthy đề xuất tên gọi “artificial intelligence” Có Simon Newell người tham dự M Minsky - AI AI AI AI Lab Lab Lab Lab at at at at J McCarthy H Simon R Michie M.I.T (Minsky & McCarthy) Carnegie Melon Univ (Simon & Newell) Stanford Univ (McCarthy) Edinburgh Univ (Michie) Hai thành phần trí tuệ nhân tạo = + Knowledge Inference (đại số, thống kê, toán học rời rạc, ) (logic toán học, …) Biểu diễn tri thức (knowledge representation) Lập luận tự động (automatic reasoning) Học tự động (machine learning) Hiểu ngôn ngữ tự nhiên (natural language understanding) Thị giác máy (computer vision) Hệ sở tri thức (knowledge-based systems) etc Trí tuệ nhân tạo lập trình truyền thống AI Conventional Programming Xử lý Chủ yếu phi số chủ yếu số Bản chất Lập luận Tính tốn Input Có thể khơng đầy đủ Phải đầy đủ Tìm kiếm Heuristic (mostly) Algorithms Giải thích Cần thiết Khơng thiết Quan tâm Knowledge Data, Information Structure Điều khiển gắn Tách điều khiển khỏi tri thức với thông tin liệu Lịch sử ngành trí tuệ nhân tạo máy tính điện tử The birth of AI Dartmouth conference hệ chuyên gia 1941 1949 máy tính thương mại 1956 1958 1968 1970 1972 tạo SHRDLU ngôn ngữ LISP sống nhân tạo, giải thuật di truyền, mạng nơron AI phân tán, công nghệ tác tử, phát tri thức khai thác liệu, 1982 1986 1990 1997 hệ AI hạ kỳ thủ cờ vua ngôn ngữ PROLOG RoboCup 1982-1992: FGCS Project (đề án máy tính hệ thứ năm) Thăng trầm ngành trí tuệ nhân tạo 10 năm đầu: Kỳ vọng nhằm tìm giải pháp tổng quát 10 năm tiếp theo: Thất vọng 15 năm tiếp: Bùng nổ trở lại TTNT Thi đua quốc tế 10 năm gần đây: Càng hiểu rõ khó khăn để làm TTNT, TTNT làm, đường tạo hệ thơng minh, hệ có TTNT Deep Blue cờ vua Ngày tháng năm 1997, IBM Deep Blue thắng Kasparov ván thứ sáu, đánh dấu bước ngoặt lịch sử cờ vua, bước ngoặt công nghệ trước ngưỡng cửa kỷ Vơ địch cờ vua thua siêu máy tính Deep Blue chip Game 10 Thời gian đa thức hàm mũ Time complexity function n With present computer N1 With computer With computer 100 times 1000 times faster faster 100 N1 1000 N1 n2 N2 10 N2 31.6 N2 n3 N3 4.64 N3 10 N3 n5 N4 2.5 N4 3.98 N4 2n N5 N5 + 6.64 N5 + 9.97 3n N6 N6 + 4.19 N6 + 6.29 32 Thời gian đa thức hàm mũ (Thí dụ tính độ đo tương tự cho liệu hỗn hợp ) US Census database 33 sym + num attributes, Alpha 21264, 500 MHz, RAM GB, Solaris OS 33 Tám thách thức TTNT (Rodney Brooks, MIT) Challenge Chúng ta tạo khơng chương trình biết tự cài đặt chạy kiến trúc máy hoàn toàn mới? Challenge Làm để tạo chương trình ổn định (robust) hơn? Challenge Làm dùng thành công khứ để áp dụng vào toán mới? Challenge Với 50 năm phát triển neuroscience, hiểu cần nhiều nghiên cứu để làm neurons thật Liệu models cho cơng cụ tính tốn mới, dẫn đến nhìn nhận để thách thức tạo khả học tập có vật thể sống? 34 Tám thách thức TTNT (Rodney Brooks, MIT) Challenge Liệu ta tạo chương trình chơi cờ vua theo cách người chơi? Challenge Mọi hệ hiểu tiếng nói chất lượng cao dùng mơ hình Markov ẩn Liệu tạo hệ hiểu tiếng nói hồn tồn dựa ngun lý khác mơ hình Markov ẩn? Challenge Vẫn có hiểu biết hiểu nhiễu Liệu tạo hệ hiểu nhiễu hiệu quả? Challenge Có thể tạo hệ có tiến hố (evolution) hoạt động tốt thứ làm tay nhiệm vụ khơng tầm thường? 35 Nội dung Trí tuệ nhân tạo 25 năm qua Vài xu hướng trí tuệ nhân tạo Một số kết nghiên cứu 36 Nghiên cứu ứng dụng Dùng tri thức phát công cụ trợ giúp định hoạt động giải tốn APPLIED RESEARCH Cơng cụ cho hệ trợ giúp định dựa tri thức Công cụ cho phát tri thức khai thác dũ liệu DEVELOPMENT Hệ sở tri thức Học tự động Phát tri thức Khai thác liệu BASIC RESEARCH 37 Nội dung nghiên cứu Phân tích lớp theo khái niệm (conceptual clustering) Học định (decision tree learning) Học lớp (learning rare classes) Chọn mơ hình hiển thị (model selection and visualization) Ứng dụng 1-4 nghiên cứu ung thư Tính tốn mềm khai thác liệu văn (soft computing in text mining) Khai thác liệu không gian (spatial data mining) Nghiên cứu ngơn ngữ tự nhiên tiếng Việt 38 Phân tích lớp theo khái niệm (conceptual clustering) Đề xuất phát triển phương pháp OSHAM phân tích lớp theo khái niệm từ liệu chưa phân lớp (P1) Biểu diễn lai khái niệm, IEICE Information Systems (1995) Giải thích khái niệm phát hiện, IJCAI-97, Decision Support Systems (1997) P1 Non - incrementally construct a concept hierarchy (OSHAM) L H O → (Ho, 1995 - 1997) P2 Incrementally update a concept lattice ~ L ∪ {o} → L (Godin 1994, Carpineto 1996) P3 Incrementally update a concept hierarchy (I - OSHAM) ~ ~ L H H ∪ {o} → (Ho, 1997) P4 Rough concept analysis (Formal Concepts + Rough Sets) L → L* and L (Kent, 1994) * P5 Approximate Conceptual Clustering (A - OSHAM) * L and L * → H* and H H * (Ho, 1997) OSHAM với liệu có dần (P3) OSHAM xấp xỉ (P5), Chapters in books of Academic Press (2000), Kluwer Academic Publishers (1999), IOS Press (2000) 39 Học định (decision trees) Phát triển phương pháp học định CABRO từ liệu phân lớp Đề xuất độ đo R-measure để chọn thuộc tính dựa lý thuyết tập thô (rough set) Gain - ratio ∑ p ∑ p logp − ∑ p logp ∑ p logp j j i ij ij j Gini - index χ2 R - measure ∑ p ∑p j j ∑∑ i i i j j − ∑ip2i eij ∑ p max {p j j i i Quinlan, C4.5, 1993 j (eij − nij )2 j i i , eij = i j } Breiman, CART, 1984 n.jni n Statistics Ho & Nguyen, CABRO,1997 Hỗ trợ cho hiển thị (visualization), chọn mơ hình (model selection) học tương tác (interactive) Journal of Japanese Society for Artificial Intelligence (1999), book chapters Springer, LNAI 40 Học lớp (rule induction) Áp dụng vào nghiên cứu phát tri thức từ liệu y học: tìm quy luật ung thư dày, viêm màng não d_cancer = x IF d_cancer = x sex = female liver_metastasis = type = 2C bleeding = no anemia = no lesser_curvature = no middle_third = no greater_curvature = yes THEN alive circular = no See5 See5rules 100 LUPC 80 Accuracy IF 120 60 40 20 s in se ate f gm llit en e ta ti s m on ok in g sp lic e sic k f m en lare in m dia g en in -c m en u lt in -c ou st om c en r ac s u hc s an ce r Đề xuất phương pháp hiệu để học lớp (LUPC: Learning Unbalanced Positive Classes), Springer LNAI an ne al gl as s hy he po ad th yr oi d Datasets THEN death within 90 days 41 Chọn mơ hình hiển thị (Model selection and visualization) Đề xuất phương pháp chọn mơ hình hướng đến người sử dụng (human-centered model selection), Journal Applied Intelligence (2002) Đề xuất phương pháp chiều rưỡi (T2.5D) để hiển thị cấu trúc phân cấp, International Journal of Artificial Intelligence Tools (2001) Xây dựng hệ khai thác liệu D2MS (Data Mining with Model Selection), Intelligent Systems: Techniques and Applications, CRC Press (2002), Springer LNAI 42 Mơ hình tập thơ dung tha cho văn (text processing and mining) Xây dựng mơ hình tập thơ dung tha (tolerance rough set model, TRSM) dựa tính đối xứng phản xạ, Journal of Japanese Society for Artificial Intelligence (1998) Giải tốn tìm kiếm thơng tin vớI TRSM, book chapters Physica-Verlag Giải tốn phân tích lớp với TRSM, International Journal of Fuzzy Logic and Intelligent Systems (2001) International Journal of Intelligent Systems (in press) 43 Khai thác liệu không gian Nhằm tạo phương pháp công cụ hiệu cho khai thác liệu không gian Nghiên cứu cấu trúc liệu, thuật toán, tốn tử thích hợp cho khai thác liệu không gian Đề tài hợp tác labs IoIT labs JAIST 44 Về ngôn ngữ tự nhiên tiếng Việt Rất thiếu nghiên cứu lý luận công cụ xử lý ngôn ngữ tự nhiên tiếng Việt Nghiên cứu tính kế thừa Xây dựng chia sẻ chương trình làm việc chặng đường dài xử lý ngôn ngữ tự nhiên tiếng Việt (đề tài KC01-03) 45 Xin cám ơn 46