Việc ứng dụng trithức nhân loại vào trong ngành công nghệ thông tin để góp phần đưa ra những lờigiải cho nhiều vấn đề khó được xem là một giải pháp và cần thiết và có ý nghĩa.Các tri thứ
Trang 1Trường Đại học Công nghệ thông tin
-o0o -Bài báo cáo môn:
BIỂU DIỄN TRI THỨC & ỨNG DỤNG
Đề tài:
Mạng ngữ nghĩa
và ứng dụng giải một số bài toán phổ thông
GVHD : PGS.TS Đỗ Văn Nhơn Học viên : Bùi Anh Kiệt
MSHV : CH1101018
Trang 3Lời mở đầu
Trong sự nghiệp công nghiệp hoá, hiện đại hoá đất nước, ngành công nghệ thôngtin là một trong những lĩnh vực có được những bước tiến lớn và đạt được nhữngthành tựu đáng kể Cùng với sự phát triển của ngành công nghệ thông tin, các vấn
đề phức tạp trong thực tế được đơn giản đi rất nhiều Nhờ đó mà quá trình pháttriển được thúc đẩy nhanh chóng hơn
Vai trò của của công nghệ thông tin trong thời buổi công nghiệp hoá, hiện đại hoáđất nước là không thể phủ nhận, tuy nhiên việc ứng dụng công nghệ thông tin vàonhững lĩnh vực nào và ứng dụng như thế nào để có thể khai thác hết được thếmạnh của ngành công nghệ thông tin luôn là một câu hỏi lớn Việc ứng dụng trithức nhân loại vào trong ngành công nghệ thông tin để góp phần đưa ra những lờigiải cho nhiều vấn đề khó được xem là một giải pháp và cần thiết và có ý nghĩa.Các tri thức nhân loại đều có thể được xây dựng thành một hệ thống hoàn chỉnh vàứng dụng trong nhiều ngành khác nhau dưới sự hổ trợ của công nghệ thông tin.Việc chuyển đổi tri thức nhân loại thành các hệ thống hay còn được gọi là biểudiễn tri thức vẫn đang được thực hiện, những tri thức đó đã và đang được ứngdụng rộng rãi trong quá trình phát triển của xã hội
Trong bài tiểu luận này, tác giả đưa ra một ví dụng minh hoạ cho việc biểu diễn trithức trong công nghệ thông tin và ứng dụng minh hoạ cho quá trình biểu diễn trithức đó Cho dù phạm vi ứng dụng của hệ thống này còn hạn chế, nhưng đây làmột cơ sở để phát triển các hệ thống chuyên gia
Mạng ngữ nghĩa là một khái niệm tri thức được ứng dụng nhiều trong thực tế nhưcác bài toán về mạng giao thông, luồng việc ứng dụng mạng ngữ nghĩa trong cáclĩnh vực của đời sống xã hội không còn xa lạ với con người Và trong bài tiểu luậnnày, tác giả muốn gửi đến một ứng dụng khác, đó là ứng dụng mạng ngữ nghĩa đểgiải các bài toán phổ thông
Trang 4Mục lục
Lời mở đầu 2
Mục lục 3
1 Mạng ngữ nghĩa 4
1.1 Đặc điểm 4
1.2 Ưu nhược điểm 4
1.3 Cách biểu diễn tri thức 5
2 Ứng dụng mạng ngữ nghĩa trong tin học 9
2.1 Hệ chuyên gia 9
2.1.1 Khái niệm 9
2.1.2 Ưu khuyết điểm 9
2.1.3 Quá trình xây dựng 10
2.1.4 Một số hệ chuyên gia tiêu biểu 10
2.2 Ứng dụng mạng ngữ nghĩa để giải các bài toán 11
2.2.1 Mục tiêu 11
2.2.2 Quá trình xây dựng 11
3 Ứng dụng mạng ngữ nghĩa để giải các bài toán phổ thông 13
3.1 Giới thiệu bài toán 13
3.2 Xây dựng bài toán hình học phẳng 13
3.2.1 Bài toán hình tam giác: 13
3.2.2 Bài toán hình thang 16
3.2.3 Biểu diễn thông tin trên máy 18
4 Kết luận 21
Trang 51 Mạng ngữ nghĩa
1.1 Đặc điểm
Mạng ngữ nghĩa là một phương pháp biểu diễn tri thức, được xây dựng dựa trênphương pháp đồ thị để biểu diễn các mối liên hệ giữa các tri thức tổng quát, cáckhái niệm, các sự việc
Do mạng ngữ nghĩa là một loại đồ thị cho nên ta có thể dùng những thuật toán của
đồ thị trên mạng ngữ nghĩa như thuật toán tìm liên thông, tìm đường đi ngắn nhất,
… để thực hiện các cơ chế suy luận Điểm đặc biệt của mạng ngữ nghĩa so với đồthị thông thường chính là việc gán một ý nghĩa cho các cung Cung nối giữa haiđỉnh cho biết giữa hai khái niệm tương ứng có sự liên hệ như thế nào Việc gánngữ nghĩa vào các cung của đồ thị đã giúp giảm bớt được số lượng đồ thị cần phảidùng để biễu diễn các mối liên hệ giữa các khái niệm
Một đặc điểm quan trọng của mạng ngữ nghĩa là tính kế thừa Chính đặc tính kếthừa của mạng ngữ nghĩa đã cho phép ta có thể thực hiện được rất nhiều phép suydiễn từ những thông tin sẵn có trên mạng
Cơ chế suy diễn áp dụng trong mạng ngữ nghĩa là thực hiện theo thuật toán loangtruyền đơn giản theo hai bước sau:
Kích hoạt các đỉnh đã cho ban đầu (các đỉnh đã có giá trị)
Nếu một đỉnh chưa xác định nối với n đỉnh khác (thông qua những mối liênhệ) Và trong đó có n-1 đỉnh đã xác định thì đỉnh đó cũng được xác định.Lặp lại bước này cho đến khi xác định được tất cả các đỉnh
1.2 Ưu nhược điểm
Trang 6 Mạng ngữ nghĩa cho phép các đỉnh có thể kế thừa các tính chất từ các đỉnh khác thông qua các cung loại “là’ từ đó có thể tạo ra các liên kết “ngầm” giữa những đỉnh không có liên kết trực tiếp với nhau.
Mạng ngữ nghĩa hoạt động khá tự nhiên theo cách thức con người ghi nhận thông tin
Nhược điểm:
Vẫn chưa có một chuẩn nào quy định các giới hạn cho các đỉnh và cung củamạng Điều đó đồng nghĩa với người dùng có thể gắn bất kỳ khái niệm nào cho đỉnh hoặc cung
Tính thừa kế trong mạng có thể dẫn đến khả năng mâu thuẩn tri thức
1.3 Cách biểu diễn tri thức
Khi biểu diễn một mạng ngữ nghĩa, các đỉnh của đồ thị là các đối tượng (kháiniệm, tri thức, sự việc) nào đó, còn các cung giữa các đỉnh thể hiện các mối liên hệgiữa các đối tượng (khái niệm, tri thức, sự việc) này
Trang 7Trong ví dụ trên, các yếu tố như “Xe máy, Xe, Động cơ, Xăng, Đường” được xem
là các đối tượng của mạng ngữ nghĩa Trong khi đó các yếu tố “Là, Di chuyểntrên, chạy bằng hay có” là các mối liên hệ giữa các đối tượng
Hình 1-2 Ví dụ về mạng ngữ nghĩa kế thừa
Trong mạng ngữ nghĩa trên ta có thể thấy được các mối quan hệ như sau:
- Hình vuông là hình chữ nhật + là tứ giác + có 4 góc Từ đó ta có thể suyluận được là hình vuông có 4 góc
- Hình chữ nhật là hình bình hành + hình bình hành có hai cặp cạnh bằngnhau Từ đó có thể suy ra hình chữ nhật có hai cặp cạnh bằng nhau
Dù không có đường liên hệ trực tiếp từ đối tượng “Hình vuông” đến đối tượng “4góc” nhưng thông qua tính chất kế thừa ta có thể xác định được là đối tượng
“Hìnhvuông” có liên hệ “có” với đối tượng “4 góc”
Tương tự với trường hợp của đối tượng “Hình chữ nhật” và đối tượng “Hai cặpcạnh bằng nhau”
Trang 8Tuy mạng ngữ nghĩa là một kiểu biểu diễn trực quan đối với con người nhưng khiđưa vào máy tính, các đối tượng và mối liên hệ giữa chúng thường được biểu diễndưới dạng những phát biểu động từ (như vị từ) Hơn nữa, các thao tác tìm kiếmtrên mạng ngữ nghĩa thường khó khăn (đặc biệt đối với những mạng có kích thướclớn) Do đó, mô hình mạng ngữ nghĩa được dùng chủ yếu để phân tích vấn đề Sau
đó, nó sẽ được chuyển đổi sang dạng luật hoặc frame để thi hành hoặc mạng ngữnghĩa sẽ được dùng kết hợp với một số phương pháp biểu diễn khác.\
Tham khảo:
(1) Logic vị từ:
Khi phát biểu tri thức dưới dạng mệnh đề, có một hạn chế khi triển khai trên máytính là mệnh đề không có cấu túc nên rất khó để suy luận Từ khó khăn đó, haikhái niệm vị từ và lượng từ được cho ra đời để tăng cường tính cấu trúc của mộtmệnh đề
Trong logic vị từ, một mệnh đề được biểu diễn bởi hai thành phần, đó là các đốitượng tri thức và mối liên hệ giữa chúng (hay còn gọi là vị từ)
Ví dụ 1:
Mệnh đề: Mặt trời mọc ở phương đông
Logic vị từ: Mọc (mặt trời, phương đông)
Ví dụ 2: Ta có tri thức như sau;
“A là bố của B nếu như B là anh/em của một người con của A”
Tri thức ở trên được biểu diễn như sau:
Bố (A, B) = Tồn tại C sao cho Bố(A, C) và Anh( B, C)
(2) Frame:
Frame là một cấu trúc dữ liệu chứa đựng tất cả những tri thức liên qua đến một đốitượng cụ thể nào đó
Trang 9Frame có liên hệ chặc chẽ đến khái niệm hướng đối tượng nên nó thường đượcdùng trong các ngôn ngữ lập trình hướng đối tượng phục vụ cho trí tuệ nhân tạo vàcác hệ chuyên gia.
Trang 102 Ứng dụng mạng ngữ nghĩa trong tin học
Mạng ngữ nghĩa mà một cách biểu diễn tri thức dưới dạng đồ thị trực quan Tuynhiên để biểu diễn mạng ngữ nghĩa dưới dạng tri thức trong tin học là một vấn đềphức tạp Sau đây là một số ứng dụng của mạng ngữ nghĩa trong tin học
2.1 Hệ chuyên gia
2.1.1 Khái niệm
Trong cuộc sống có rất nhiều tri thức được hình thành dựa trên nền tảng một hệthống các thông tin riêng biệt tách rời Những thông tin này thường không có cấutrúc, không có tính hệ thống và thường không có quan hệ với nhau Việc tổng hợpcác thông tin tách rời, riêng biệt để hình thành nên một tri thức là việc làm mà cácchuyên gia đã thực hiện được và qua đó họ có thể lý giải được sự việc và có nhữngnhận định chính xác về các hiện tượng xẩy ra Tuy nhiên giới hạn của con ngườitrong việc ghi nhớ và suy luận đã thúc đẩy việc tạo ra các hệ thống mà có thể thaythế các chuyên gia trong việc tổng hợp thông tin và đưa ra những nhận định chínhxác dựa trên các hiện tượng xẩy ra dựa vào những công thức suy luận sẵn có là cầnthiết Những hệ thống đó được gọi là hệ chuyên gia
Yếu tố quan trọng để xây dựng một hệ chuyên gia là thông tin Thông tin có thể làđối tượng, có thể là mối liên hệ giữa các đối tượng đó Thông tin càng nhiều càngchi tiết thì độ chuẩn xác của hệ chuyên gia càng cao
2.1.2 Ưu khuyết điểm
Hệ chuyên gia là một ứng dụng được con người xây dựng nên để phục vụ conngười trong việc tổng hợp thông tin và đưa ra những nhận định dựa vào quá trìnhsuy luận logic Do đó bên cạnh những ưu điểm thì hệ chuyên gia còn tồn tại rấtnhiều khuyết điểm và cần sự khắc phục để các hệ chuyên gia ngày càng trở nênhoàn thiện hơn
Trang 11Ưu điểm:
- Lưu trữ lượng thông tin lớn
- Tốc độ suy luận nhanh, độ chính xác cao
- Dễ tiếp thu thông tin mới
-Khuyết điểm:
- Không có khả năng đánh giá thông tin đầu vào
- Thông tin đầu vào yêu cầu phải đúng chuẩn và rỏ ràng
- Không có khả năng hình thành tri thức mới từ những thông tin đã có
2.1.3 Quá trình xây dựng
Quá trình xây dựng một hệ chuyên gia trải qua các bước sau:
(1) Tiếp nhận thông tin: các thông tin trong quá trình này là các thông tin thô.Được lưu trữ theo một định dạng nhất định (thường là theo định dạng củaLogic vị từ) Thông tin càng phong phú thì hệ thống càng có độ tin cậy cao(2) Phân loại thông tin: đây là quá trình sắp xếp các thông tin theo một quyluật sẵn có Trong quá trình này người xây dựng hệ chuyên gia cần phảithực hiện công việc chính xác, vì nếu như thông tin được chọn lọc và sắpxếp sai lệch thì hệ thống sẽ không có độ tin cây cao
(3) Xây dựng giao diện cho hệ thống Đây là bước không ảnh hưởng đến độ tincậy của hệ thống nhưng là bước quan trong để đưa hệ thống đến với conngười Hệ thống càng thân thiện thì giá trị hệ thống càng cao Trong quátrình xây dựng hệ thống
2.1.4 Một số hệ chuyên gia tiêu biểu
(1) Hệ chuyên gia trong lĩnh vực y tế dùng để chẩn đoán bệnh Thông thườngmột chứng bệnh sẽ có một số lượng triệu chứng nhất định Thông tin đưavào cho hệ thống là các triệu chứng và các mối kết hợp và liên hệ Dựa vàocác mối liên hệ mà hệ thống sẽ sắp xếp các thông tin thành một liên kết các
Trang 12triệu chứng Khi nhận được thông tin đầu vào qua một số triệu chứng, hệchuyên gia sẽ phân tích và tìm kiếm ra kết quả chẩn đoán bệnh.
(2) Hệ chuyên gia trong lĩnh vực kỹ thuật dùng để chẩn đoán hỏng hóc củamáy móc Tương tự như trên, các thông tin sẽ được tiếp nhận và tính toánđánh giá để hình thành nên tri thức
(3) Hệ chuyên gia trong lĩnh vực khoa học tự nhiên dùng để giải đáp các quyluật biến đổi của giới tự nhiên dựa trên những quy luật cố định và bềnvững
2.2 Ứng dụng mạng ngữ nghĩa để giải các bài toán
2.2.1 Mục tiêu
Trong toán học việc tìm hiểu và chứng minh một tiền đề, một định lý, là một quátrình phức tạp với một hệ thống các dẫn chứng, luận chứng, và các luận chứngluận cứ đó lại có quan hệ đến nhau Việc kết hợp các dẫn chứng, luận chứng đó sẽtạo ra được những tri thức khác nhau và hổ trợ cho việc giải quyết bài toán Giảiquyết được vấn đề đó, mạng ngữ nghĩa được xem như một cách thức để giải quyếtcác vấn đề trong toán học
Ứng dụng mạng ngữ nghĩa trong giải quyết các bài toán có ý nghĩa rất lớn vì nókhông chỉ mang tính trực quan mà còn biểu hiện được các mối quan hệ rỏ ràng,qua đó có thể phát hiện được những sai lệch trong quá trình dẫn chứng một cách
Trang 13Từ những thông tin có trước của bài toán, việc xác định các đối tượng và cácmối liên hệ không phức tạp, tuy nhiên mạng ngữ nghĩa cho bài toán có thể đưa
ra được đáp án chính xác hay không phụ thuộc vào mật độ thông tin (số lượngđối tượng và mối liên hệ giữa các đối tượng)
Ví dụ: Khi xây dựng mạng ngữ nghĩa cho bài toán hình học, các đối tượng củamạng ngữ nghĩa là các thông tin liên quan đến cạnh, góc Còn các mối liên hệ
là các thông tin miêu tả tính chất của các đối tượng trong mạng như tổng cácgóc, quy tắc về chiều dài các cạnh tương ứng với các góc,
(2) Loại các đối tượng, các mối liên hệ dư thừa
Trong quá trình thu thập dữ liệu, có nhiều thông tin trùng lặp được biểu diễndưới nhiều dạng khác nhau Việc phân tích các thông tin và biểu diễn trênmạng ngữ nghĩa là cần thiết Với nhiều thông tin trùng lặp, mạng sẽ phình ramột cách không cần thiết Khi đó tốc độ tính toán sẽ bị hạn chế
Ngoài ra, khi thu thập thông tin, có nhiều thông tin sẽ bị sai lệch, gây mâuthuẩn với những thông tin khác, cần xác định và loại bỏ những thông tin này đểđảm bảo tính thống nhất của thông tin
(3) Xây dựng các mối liên hệ giữa các đối tượng
Chọn lọc các mối liên hệ cho từng đối tượng Lưu ý là với n đối tượng thì cầnphải có liên hệ với n-1 đối tượng khác Có nghĩa là để xác định được n yếu tốthì cần phải có n-1 yếu tố đã được xác định
(4) Tối ưu hóa mạng ngữ nghĩa
Vận dụng phương pháp kế thừa để hạn chế các mối liên hệ trong mạng.Các đối tượng kế thừa sẽ có đầy đủ tất cả các thuộc tính của đối tượngđược kế thừa
Trang 14 Giữa hai đối tượng không nên tồn tại quá một mối liên hệ Việc tồn tạihơn một mối liên hệ giữa hai đối tượng không làm giá trị mạng ngữnghĩa sai những sẽ làm mạng phình ra không cần thiết
Trang 153 Ứng dụng mạng ngữ nghĩa để giải các bài toán phổ thông
3.1 Giới thiệu bài toán
Trong chương trình phổ thông có hai dạng bài toán hay gặp đó là bài toán hình học
và bài toán đại số Với hai dạng bài toán này, việc biểu diễn trên mạng ngữ nghĩa
có tác động tích cực đến người học Với tính trực quan của mạng ngữ nghĩa, ngườihọc sẽ dễ dàng tiếp thu và hình thành tri thức nhanh chóng
Có nhiều dạng toán hình học và đại số trong chương trình phổ thông, nhưng vì hạnchế về thời gian nên ở đây xin giới thiệu dạng cơ bản: Mạng ngữ nghĩa cho bàitoán hình học phẳng
3.2 Xây dựng bài toán hình học phẳng
Các bài toán hình học phẳng gồm các dạng toán như giải bài toán hình tam giác,hình vuông, hình thoi,
Các bài toán này được hình thành dựa trên các tính chất và thuộc tính của hình họcphẳng Do đó có thể xác định được các đối tượng trên mạng ngữ nghĩa của nhữngbài toán này là các đỉnh, các cạnh Và mối liên hệ giữa các đối tượng này là tínhchất của các bài toán hình học
3.2.1 Bài toán hình tam giác:
(1) Xác định thông tin
Xét tam giác ABC với các thông tin được biểu diễn như sau:
Trang 16 = sin
c
Trang 17(2) Chọn lọc thông tin :
Trong các thông tin đã cung cấp ở các bài toán trên ta có thể thấy một số thông
tin thừa không cần thiết như: 3 đường trung tuyến i a , i b , i c ở bài toán tam giác
Với các thông tin này hệ thống không bị mất đi độ chính xác nhưng sẽ làm chotốc độ suy luận giảm đi Vậy nên cần được loại bỏ
(3) Biểu diễn thông tin trên mạng ngữ nghĩa :
b
= sin
Trang 18Trong mạng ngữ nghĩa trên, các ô tròn biểu thị cho các đối tượng của bài toán
và các ô vuông thể hiện mối quan hệ giữa các đối tượng
3.2.2 Bài toán hình thang
Trang 20Trong mô tả bên ở trên ta có thể thấy các thông tin về cạnh c1 và c2 là dưthừa, vì chúng không cần thiết trong việc tính toán các giá trị còn lại.
Thông tin về hai cạnh song song, không giúp ta trong việc tính toán
Những thông tin này có thể lượt bỏ trong sơ đồ mạng ngữ nghĩa cho bàitoán hình thang này
(3) Biểu diễn thông tin trên mạng ngữ nghĩa :