Biến đổi từ các sự kiện sang biểu diễn trong máy

30 263 0
Biến đổi từ các sự kiện sang biểu diễn trong máy

Đang tải... (xem toàn văn)

Tài liệu hạn chế xem trước, để xem đầy đủ mời bạn chọn Tải xuống

Thông tin tài liệu

LỜI MỞ ĐẦU  Cho đến nay lĩnh vực biểu diễn tri thức và ứng dụng là một lĩnh vực mới mẻ và hấp dẫn trong ngành công nghệ thông tin.với khả năng tận dụng các nguồn tài nguyên tri thức phong phú xử lý tri thức đem lại cách xử lý tối ưu cho những bài toán lớn cả về mặt kinh tế lẫn thời gian mà hiện nay các nhà khoa học chưa có khả năng giải quyết. Hiện nay công nghệ tri thức đỉnh cao vẫn còn khá mới mẻ nó mới chỉ biết được trong các đề tài nghiên cứu khoa học, và đang trở thành điểm mạnh trong các nghiên cứu của ngành Công Nghệ Thông Tin. Trong phạm vi một bài khóa luận em mong muốn trình bày các kỹ thuật cụ thể để biểu diễn và xử lý tri thức, các thuật toán suy diễn với logic mệnh đề, logic vị từ. Em xin cảm ơn sự hướng dẫn của PGS.TS Đỗ Văn Nhơn nhưng do thời gian có hạn nên việc nghiên cứu của em về đề tài này còn nhiều hạn chế rất mong những đánh giá, nhận xét quý báu của thầy. 1 MỤC LỤC Chương 1 Tổng quan 3 I. Giới thiệu 4 II. Tri thức và dữ liệu 5 1. Diễn giải bên trong 5 2. Cấu trúc bên trong 5 3. Cấu trúc bên ngoài 6 4. Thang chia 6 5. Nhúng vào không gian độ đo ngữ nghĩa 8 6. Tính chủ động 10 Chương 2 Phân loại tri thức 10 I. Vấn đề biểu diễn tri thức 16 II. Biểu diễn vấn đề nhờ logic hình thức và phương pháp suy diễn 17 1. Biểu diễn tri thức nhờ logic hình thức 17 2. Chứng minh biểu diễn tri thức nhờ logic 19 3. Cơ sở tri thức biểu diễn bằng logic mệnh đề 20 4. Cơ sở tri thức biểu diễn bằng logic vị từ 21 5. Suy diễn tiến đối với logic vị từ 22 6. Áp dụng vào bài toán đồ thị 25 Tài liệu tham khảo 32 2 Sự kiện Biểu diễn trong máy Suy diễn Biểu diễn qua ngôn ngữ tự nhiên Sản sinh tự động văn bảnHiểu ngôn ngữ tự nhiên CHƯƠNG 1 TỔNG QUAN I. Khái niệm Điều quan trọng trong các phương pháp biểu diễn tri thức là tạo ra cơ sở tri thức tường minh trong các hệ thống Trí Tuệ Nhân Tạo(TTNT) dựa trên tri thức. Thêm vào đó các ngôn ngữ này phải cung cấp công cụ truy nhập tới các sự kiện không tường minh có trong cơ sở tri thức, nghĩa là phải bao gồm trong nó cả cơ chế suy diễn tự động. Như vậy, trong bất kỳ một hệ thống biểu diễn tri thức nào, bao giờ cũng phải chứa ba yếu tố: ngôn ngữ biểu diễn, cơ chế suy diễn và công cụ lập cơ sở tri thức cho từng lĩnh vực cụ thể. Trong mọi phương pháp biểu diễn tri và xử lý thức chúng ta cần lưu tâm đến hai vấn đề: Các sự kiện (facts): các thông tin về đối tượng. Các phương pháp biểu diễn sự kiện trong một hệ phát biểu hình thức nào đó. Hình 1.1 Biến đổi từ các sự kiện sang biểu diễn trong máy. Ví dụ: xét câu “Lan là sinh viên”. Sự kiện biểu thị bởi câu này có thể biểu diễn qua ngôn ngữ logic như sau: 3 sinhvien(Lan) Giả sử có thêm vị từ nghị lực (x), có nghĩa rằng “ x là người có nghị lực. Hơn nữa bất cứ ai là sinh viên cũng có nghị lực nghĩa là: Sinhvien(x) => nghiluc(x) Từ trên với phép thay x bởi Lan và sử dụng modus tonens, suy ra rằng nghiluc(Lan) tức là “Lan là người có nghị lực”. Hay nói một cách khác, các hệ thống biểu diễn tri thức dựa trên giả thuyết sau đây: một quá trình sử lý thông minh bao gồm các thành phần cấu trúc cho phép biểu diễn toàn bộ tri thức có liên quan và độc lập với ý nghĩ bên ngoài, đồng thời cho phép tạo ra những tri thức mới từ tri thức đã có. II. Tri thức và dữ liệu Các dữ liệu theo nghĩa thông thường được xử lý trong các chương trình thường mang đặc trưng định lượng. Dù cho các đối tượng có được xử lý như thế nào (đơn giản: số nguyên, số thực, ký tự, xâu…hay phức hợp: bản ghi, tệp, mảng…), cuối cùng mọi thao tác trong máy tính trên chúng đều được qui về các phép toán cơ bản trên các đại lượng thông tin số 0,1. Trong khi đó, suy diễn với tri thức được biểu diễn bằng logic mệnh đề dựa theo nguyên lý modus ponens: Nghĩa là nếu biết A đúng và từ A suy ra B thì B cũng đúng mà không cần biết A,B biểu diễn cụ thể cho sự kiện gì. Mặt khác sự tiến triển từ dữ liệu đến tri thức trong các ngôn ngữ lập trình được thể hiện thông qua quá trình cấu trúc hóa và trừu tượng hóa các kiểu dữ liệu. Hơn nữa các thao tác trên dữ liệu phụ thuộc rất nhiều vào các cấu trúc dữ liệu cụ thể. Các cấu trúc dữ liệu qui định các thao tác tương ứng, ngược lại 4 Dữ liệu Diễn giải bên trong Cấu trúc bên trong Cấu trúc bên ngoài Thang chia Nhúng vào không gian “metric ngữ nghĩa” Tính chủ động Tri thức các tác chỉ có thể áp lên một số cấu trúc dữ liệu mà thôi. Trong khi đó, các tri thức cho phép các quá trình suy diễn khá độc lập so với nội dung bên trong của các tri thức. Tuy khó phân biệt rạch ròi ranh giới giữa ti thức và dữ liệu, có thể dẫn ra các cung bậc, cấp độ khác nhau dẫn từ dữ liệu đến tri thức. Hình 2: Từ dữ liệu đến tri thức 1. Diễn giải bên trong Trong kỹ thuật lập trình bằng ngôn ngữ máy, các đơn vị dữ liệu được đặt tương ứng với các địa chỉ thực trong bộ nhớ. Việc gán tên cho các dữ liệu (địa chỉ tương đối) cho phép truy nhập tới nội dung dữ liệu thông qua tên, mà không cần nó được lưu giữ ở đâu và nó như thế nào. Tuy vậy, ngữ nghĩa thông tin của các dữ liệu đã được làm rõ thêm một chút thông qua việc đặt tên cho nó. Chẳng hạn, chương trình tính nghiệm đa thức bậc hai ax 2 +bx+c=0 có thể gọi như sau GIAI(a,b,c). Các tham số được giữ nguyên hoặc sửa sao cho gần gũi nhất với biểu diễn tự nhiên của chúng: a tương ứng với hệ số bậc cao nhất, b hệ số bậc I, c hệ số tự do. 2. Cấu trúc bên trong Dữ liệu khi được xử lý phải đáp ứng yêu cầu tường minh càng nhiều càng tốt, để người lập trình có thể quản lý ngữ nghĩa của các thao tác dữ liệu. Mặt khác, 5 Hà Nội Nơi nghỉ Vườn thú Địa danh là là là ở GấuSư tử Voi Động vật ở ở ở R1 R1 là là là để thuận tiện và đáp ứng các yêu cầu xử lý dữ liệu ngày càng phức tạp, mỗi đối tượng dữ liệu cần phải có một kiểu nhất định do vậy được tổ chức trong bộ nhớ theo một cấu trúc nào đó. Ví dụ: Họ và tên Ngày sinh Nơi sinh Trình độ văn hóa Ngoại ngữ Là cấu trúc bảng ghi lưu trữ thông tin về một người nào đó. Trường dữ liệu “ngoại ngữ” trong trường hợp này có thể phân tách thành 3. Cấu trúc bên ngoài Cấu trúc bên trong mỗi dữ liệu cho phép trong chừng mực nào đó, “thông báo trước” kích cỡ dữ liệu và các phép toán có thể thao tác trên đó, nhưng không cho phép mô tả mối liên hệ giữa các đối tượng dữ liệu khác nhau. Để làm được điều đó, các đối tượng dữ liệu có thêm một trường dữ liệu đặc biệt chứa tên của các đối tượng dữ liệu khác có liên quan. Mỗi mối liên hệ giữa các đối tượng được gắn với một tên gọi. Tập các đối tượng cùng với các liên hệ giữa chúng tạo nên mạng ngữ nghĩa. 6 Nga Anh Trung Pháp Đức Thời điểm sinh Lê Anh Tuấn 6 8 9 Năm tuổi Hình 3: Một ví dụ đơn giản về mạng ngữ nghĩa Trong đó các đối tượng sư tử, gấu, voi được mô tả bằng cấu trúc Còn các đối tượng vườn thú, Hà Nội được cho bởi Quan hệ R1 ở đây có nghĩa là cả hai đối tượng đều có 4 chân Điều cần chú ý là nhờ các liên kết “là” và ngược lại của nó là “LOẠI CỦA”, các thông tin được nạp đúng một lần. Nghĩa là các đặc tính cơ bản của động vật sẽ được thừa hưởng trong các đối tượng gấu, voi, sư tử ( cách biểu diễn hướng đối tượng). 4. Thang chia Để mô tả các trường dữ liệu và các liên kết giữa các đối tượng, trên thực tế không phải lúc nào cũng có thể lượng hóa hoàn toàn được. Thật vậy, người ta thường sử dụng : Thang chia độ đo (metric). Thang chia thứ bậc (đôi lúc còn gọi là thang chia ngôn ngữ, thang mờ) a. Thang chia độ đo: có hai loại thang chia độ đo: tương đối và tuyệt đối. • Thang chia tuyệt đối Thang chia độ đo tương đối 7 Loài Sống ở đâu Ăn gì …………………. Diện tích Vị trí Đặc điểm …………………. Thời điểm nói Tốt nghiệp ĐH Bảo vệ luận án 3 8 Năm Thang chia thứ bậc Trong các thang chia dữ liệu , 2 thông số cần phải quan tâm là: • Điểm xuất phát • Đơn vị đo Tập các loại thang chia tuyệt đối, tương đối và thứ bậc không vét hết được các loại thang chia được dùng trong thực tế. Có thể kể ra: Thang chia đối lập ví dụ: tốt – xấu, yếu –mạnh,… Thang chia mờ có điểm xuất phát. 5. Nhúng vào không gian độ đo ngữ nghĩa. Các thang chia dù sao cũng mang tính đặc trưng định lượng. Ngay cả với thang chia cấp độ nhờ các biến ngôn ngữ, bao giờ người ta cũng có xu hướng làm rõ các khái niệm mờ thông qua việc sử dụng các khái niệm hàm thuộc. Chẳng hạn, nếu xem rằng tuổi của con người được đo bởi thang chia tuyệt đối từ 1 đến 150 thì khái niệm “trẻ” được cho bởi hàm f, đánh giá độ trẻ của các độ tuổi như sau: Tuy vậy, nội dung thông tin khái niệm “trẻ” cũng bị nghèo đi bởi việc lượng hóa nó. Không gian ngữ nghĩa, các khái niệm các hiện tượng và các sự kiện đóng vai trò các điểm rời rạc. Giữa các điểm có độ đo “ gần gũi về ngữ nghĩa”. Độ đo này tùy thuộc vào hai yếu tố: Độ gần gũi về tình huống Tần xuất xuất hiện của các sự kiện, khái niệm hay hiện tượng trong các tình huống. Xét các khái niệm được sử dụng trong đời sống hàng ngày. Ta sử dụng các cặp đối lập kiểu như: tốt – xấu, mạnh – yếu,… nhờ kết quả xử lý thống kê theo thành phần chính, có thể chia thành 3 trục : 8 Độ tuổi Tương đối giàTrung niên Tương đối trẻRất trẻ E A P Trục E tương ứng với các thang chia kiểu đánh giá như: tốt – xấu, tốt bụng – ác, đẹp – dị dạng… Trục P tương ứng với các thang chia sức mạnh như: mạnh – yếu, to – nhỏ, nặng – nhẹ,… Trục A tương ứng với các thang chia độ năng động như: sắc sảo – dốt, nhanh nhẹn – chậm chạp, ngắn gọn – dài dòng,… Khi đó khài niệm “ một sinh viên nhanh nhẹn đẹp trai, khỏe mạnh” sẽ tương ứng với một điểm trong không gian ngữ nghĩa Hình 4 Không gian ngữ nghĩa Từ những nghiên cứu nhận thức học rút ra rằng các khái niệm được phân bố không đều trong không gian ngữ nghĩa. Các điểm trong không gian gần nhau về ngữ nghĩa tụ lại, tạo thành các lớp (cluster) hay bó (chunk). Khoảng cách giữa các khái niệm trong cùng một lớp bao giờ cũng nhỏ hơn khoảng cách giữa các điểm thuộc về các lớp khác nhau. Về ngữ nghĩa, các điểm trong cùng một lớp tạo nên các khái niệm gần nhau về nội dung. Điều này đưa đến một kết luận rất quan trọng trong thực tiễn xây dựng cấu trúc nhận thức của bộ nhớ các hệ thống thông minh là các thông tin gắn bó với một tình huống điển hình nào đó nhóm lại gần nhau trong không gian. Một trong những tiếp cận để phân lớp các điểm trong không gian là dựa trêm ma trận tương quan giống hoặc khác nhau( +1 khi hai khái niệm hoàn toàn trùng nhau, -1 khi hai khái niệm hoàn toàn khác nhau các giá trị độ đo có thể lấy với bước nhảy 0,1 từ -1 đến +1). 9 I She Cat like like Dựa vào kết quả các phép thử có thể xác định các giá trị trung bình giống khác nhau của các khái niệm ban đầu và trên cơ sở xác định các lớp và độ thuôc của một khái niệm vào một lớp nào đó. Một đặc điểm khác của không gian ngữ nghĩa các khái niệm ở bộ não con người là mỗi tình huống, mỗi khái niệm đều có một vài biểu diễn. Việc lựa chọn một biểu diễn nào đó tùy thuộc vào tần xuất xuất hiện của nó. Các thí nghiệm chứng tỏ rằng khi giao tiếp bằng ngôn ngữ tự nhiên, câu trả lời thường trực cho các câu hỏi hướng tới các khái niệm trừu tượng bao giờ cũng là những hình dung hay cách biểu diễn trực quan nhất hay dùng nhất. Tóm lại trong không gian ngữ nghĩa của con người bao giờ cũng có ít nhất hai cách đánh giá độ gần nhau của các đơn vị thông tin. Đó là độ gần gũi về tình huống và tần xuất xuất hiện các khái niệm, tình huống hay biểu diễn của chúng. 6. Tính chủ động Trong một chương trình phần thao tác xử lý và phần dữ liệu tách rời nhau. Thao tác xử lý có thể xem như một dạng của các tri thức thủ tục. Nói cách khác, chương trình đóng vai trò “chủ động”, kích hoạt dữ liệu bị động. Ngay cả khi có các tri thức khai báo, các tri thức thủ tục vẫn đóng vai trò chủ đạo, tạo những thao tác hướng tới tri thức khai báo. Ngược lại, các nghiên cứu cấu trúc nhận thức trong bộ não người chứng tỏ rằng không phải ri thức thủ tục kích hoạt tri thức khai báo – mà ngược lại chính các tri thức khai báo đóngvai trò đó. Hiện nay người ta sử dụng phương pháp biểu diễn hỗn hợp, trộn lẫn các tri thức thủ tục và các tri thức mô tả với nhau sao cho chúng có thể tác động tương trợ lẫn nhau. Ví dụ: Mô tả hiện tượng như hình vẽ sau: Suy diễn trong mạng ngữ nghĩa 10 [...]... thức biểu diễn bằng logic mệnh đề: Cơ sở tri thức gồm hai phần: 18 • • Các sự kiện Các luật Các sự kiện được cho bởi các luật đặc biệt dạng:  -> q1;  -> q2;  -> qk; Tập F = (q1,…,qk) tạo nên phần giả thiết cho quá trình suy diễn Các luật ở dạng chuẩn Horn 4 Cơ sở tri thức biểu diễn bằng logic vị từ: Cũng như trên cơ sở tri thức được cấu thành bởi hai phần:  Tập các sự kiện F  Tập các luật R Các sự. .. chuẩn Horn được biểu diễn như sau: Trường hợp 1: n=0, m=1, khi đó luật có dạng trong trường hợp đơn giản nhất, F biểu diễn một sự kiện là có một đối tượng với các giá trị thuộc tính t1, … , tk trong cơ sở dữ liệu Ngược lại, nếu ti là biến thì biểu diễn F tương ứng với một tập sự kiện Trường hợp 2: n>=1, m = 0, luật có dạng Dạng biểu diễn này dùng để diễn đạt một khẳng định là các sự kiện p 1,…,pn đúng... đối tượng và cơ chế điều khiển các phương pháp biểu diễn 11 Có các cơ chế biểu diễn các tri thức nhiều tầng và điều khiển các phương pháp biểu diễn 12 Có các phương tiện đánh giá và xử lý các thông tin mờ 15 II Biểu diễn vấn đề nhờ logic hình thức và phương pháp suy diễn logic 1 Biểu diễn tri thức nhờ Logic hình thức a Logic mệnh đề, logic vị từ Một mệnh đề p là một phát biểu chỉ có thể nhận giá trị... một số bài toán, các trạng thái được mô tả qua các biểu thức logic Khi đó bài toán được phát biểu dưới dạng: a Chứng minh : từ GT1 …GTm suy ra một trong các kết luận KL1,…,KLn, ở đây Gti và KLj là các biểu thức logic ( mệnh đề hoặc vị từ) b Tìm phép gán giá trị cho các biến tự do sao cho từ GT1,…,GTm suy ra một trong các kết luận KL1,…,KLn , ở đây GTi, KLj là các biểu thức logic vị từ, tức là: tìm... ra các hệ thống cho phép người sử dụng mô tả bài toán bằng ngôn ngữ mô tả, sau đó giải chúng theo chế độ tương tác và hội thoại cao a Các yêu cầu áp đặtlên ngôn ngữ biểu diễn tri thức từ góc độ giao diện người máy 1 Ngôn ngữ mô tả của người sử dụng là ngôn ngữ kiểu khai bóa mô tả 2 Có khả năng suy diễn 3 Có thể biến đổi về dạng biểu diễn ngoài đối với người sử dụng 4 Có thể biến đổi về dạng biểu diễn. .. ANHEM(x,y)  ANHEM(y,x) Logic vị từ cho phép biểu diễn hâù như tất cả các khái niệm và các phát biểu định lý, định luật trong các bộ môn khoa học Cách biểu diễn này khá trực quan và 19 ưu điểm căn bản của nó là có một cơ sở lý thuyết vững chắc cho những thủ tục suy diễn nhằm tìm kiếm và sản sinh ra những tri thức mới, dựa trên những sự kiện và những luật đã cho Chính lý thuyết suy diễn logic và xử lý danh... biến không phụ thuộc vào tình huống không gian và thời gian Các tri thức phụ thuộc vào không gian và thời gian đòi hỏi những mô hình biểu diễn đặc biệt, cho phép thể hiện các tương quan giữa các sự kiện, quá trình không gian và thời gian Ngoài ra tri thức mô tả còn cho phép miêu tả các mối liên hệ, các ràng buộc giữa các đối tượng, các sự kiện và các quá trình Ví dụ: “Lan thích đọc sách” miêu tả mối quan... khoảng 20 tuổi Cũng có thể xuất hiện các tri thức không đầy đủ trong các phát biểu, các mô tả Nói chung các tri thức bất định, không chính xác và không đầy đủ xuất hiện là do trong các phát biểu người ta sử dụng ngôn ngữ khôngrõ ràng ví dụ: như có thể, khoảng, nói chung …một trong những cách tiếp cận để xử lý các loại tri thức trên là sử dụng cách tiếp cận lý thuyết mờ các lý thuyết lập luận xấp xỉ đã... vậy các tri thức có thể thêm, bớt, sửa đổi khá độc lập với nhau và với cả cơ chế suy diễn Nhưng bên cạnh đó công cụ logic cũng bộc lộ một số yếu điểm:  Mức độ hình thức hóa quá cao, dẫn tới khó hiểu ngữ nghĩa của các vị từ khi xem xét chương trình  Năng xuất xử lý thấp Một trong các khó khăn cơ bản trong quá trình suy diễn là cơ chế hợp và suy diễn vét cạn  Do các tri thức được biểu diễn nhờ các. .. quyết vấn đề nào cũng bao gồm hai thành tố cơ bản: các phương pháp biểu diễn vấn đề và các phương pháp tìm kiếm Heuristic Nếu xem tri thức là phần thông tin biểu diễn vấn đề trong các lĩnh vực khó, đòi hỏi tri thức chuyên gia con người, thì các thủ tục tìm kiếm trong không gian bài toán về thực 13 chất lại là các thủ tục suy diễn, cho phép xuất phát từ những tri thức ban đầu đưa tới những kết luận, . sự kiện trong một hệ phát biểu hình thức nào đó. Hình 1.1 Biến đổi từ các sự kiện sang biểu diễn trong máy. Ví dụ: xét câu “Lan là sinh viên”. Sự kiện biểu thị bởi câu này có thể biểu diễn qua. cho từng lĩnh vực cụ thể. Trong mọi phương pháp biểu diễn tri và xử lý thức chúng ta cần lưu tâm đến hai vấn đề: Các sự kiện (facts): các thông tin về đối tượng. Các phương pháp biểu diễn sự kiện. thống 10. Có các cơ chế biểu diễn nhiều loại hình đối tượng và cơ chế điều khiển các phương pháp biểu diễn. 11. Có các cơ chế biểu diễn các tri thức nhiều tầng và điều khiển các phương pháp biểu diễn. 12.

Ngày đăng: 10/04/2015, 09:58

Tài liệu cùng người dùng

Tài liệu liên quan