1. Trang chủ
  2. » Luận Văn - Báo Cáo

MẠNG NGỮ NGHĨA VÀ GIẢI THUẬT LAN TRUYỀN

21 684 0

Đang tải... (xem toàn văn)

Tài liệu hạn chế xem trước, để xem đầy đủ mời bạn chọn Tải xuống

THÔNG TIN TÀI LIỆU

Thông tin cơ bản

Định dạng
Số trang 21
Dung lượng 262,28 KB

Nội dung

PHẦN I: MỞ ĐẦUSự phát triển vượt bật trong lĩnh vực khoa học và công nghệ đặt biệt trong khoa học trítuệ nhân tạo, để xây dựng các hệ chuyên gia và các hệ giải bài toán dựa trên tri thức

Trang 1

PHẦN I: MỞ ĐẦU

Sự phát triển vượt bật trong lĩnh vực khoa học và công nghệ đặt biệt trong khoa học trítuệ nhân tạo, để xây dựng các hệ chuyên gia và các hệ giải bài toán dựa trên tri thứcngười ta phải thiết kế một cơ sở tri thức cho hệ thống và một động cơ suy diễn để giảiquyết vấn đề dựa trên tri thức, đặt biệt là các hệ giải toán dựa trên tri thức vấn đề làm sao

để thiết kế mô hình nhằm biểu diễn cơ sở tri thức thể hiện đầy đủ miền tri thức và được

mô tả đầy đủ các khía cạnh của tri thức trong lĩnh vực nó cần biểu diễn, mô hình này cònhướng đến việc tạo điều kiện thuận lợi cho việc thiết kế, cài đặt để xây dựng một công cụsuy diễn dễ dàng truy cập phục vụ tốt quá trình suy luận khai thác ứng dụng Vì thế một

hệ giải bài toán dựa trên tri thức phải là một hệ giải toán thông minh có thể giải được cácdạng bài toán tổng quát trong một miền tri thức nào đó, trong đó có một cơ sở tri thức vàmột bộ phận thực hiện suy luận giải bài toán trong phạm vi tri thức của hệ thống [1].Trong khoa học về trí tuệ nhân tạo có nhiều phương pháp để biểu diễn tri thức và phươngpháp cho hiệu quả cao trong viêc biểu diễn và suy luận dựa trên các bài toán tổng quát,mỗi phương pháp điều có ưu, nhược điểm riêng của từng phương pháp trong phần trìnhbày này người viết đề xuất một mô hình biểu diễn tri thức gọi là mạng ngữ nghĩa kết hợp

với một số thuật toán được ứng dụng trong giải “bài toán tam giác” của chương trình

phổ thông

PHẦN II: TỔNG QUAN VỀ BIỂU DIỄN TRI THỨC

Khái niệm biểu diễn tri thức và kỹ nghệ xử lý tri thức được đề cập nhiều trong khoa họctrí tuệ nhân tạo, nhưng chỉ từ khi xuất hiện và ứng dụng thực thế các hệ chuyên gia,chúng mới có được các cơ sở lý luận và thực tiển vững chắc Nói tổng quát biểu diễn trithức là thể hiện các mô tả về thế giới bên ngoài dưới dạng sao cho các máy thông minh

có thể đưa tới những kết luận về môi trường xung quanh nó, trên cơ sở một cách hìnhthức các mô tả này, còn kỹ nghệ tri thức bao gồm trong nó các kỹ thuật cấu trúc tri thức,suy diễn, quản trị tri thức và học tự động Vào những năm đầu thập kỷ 80 sự phát triển

Trang 2

của khoa học tri thức mà các nhà nghiên cứu đã đúc kết lại những điểm khá chung nhau

và các phương pháp biểu diễn tri thức đươc quan tâm chủ yếu là:

- Biểu diễn nhờ lôgic hình thức

- Biểu diễn nhờ hệ sản xuất

- Biểu diễn nhờ mạng ngữ nghĩa

- Biểu diễn nhờ các frame

Trong các phương pháp biểu diễn này là tạo ra cơ sở tri thức tường minh trong các hệthống khoa học trí tuệ nhân tạo dựa trên tri thức, điều đó phải đòi hỏi xây dựng các ngônngữ khoa học trí tuệ biểu diễn tri thức, thêm vào đó các ngôn ngữ này phải cung cấp cáccông cụ truy nhập tới các sự kiện không tường minh có trong cơ sở tri thức, nghĩa là phảibao gồm trong nó cơ chế suy diễn tự động Như vậy trong bất kỳ một hệ thống biểu diễntri thức nào, bao giờ cũng phải chứa ba yếu tố: Ngôn ngữ biểu diễn, cơ chế suy dẫn vàcông cụ lập cơ sở tri thức cho từng lĩnh vực cụ thể

II.1/ Phân loại tri thức

Dựa vào cách thức con người giải quyết vấn đề, các nhà nghiên cứu đã xây dựng các kỹthuật biểu diễn các dạng tri thức khác nhau trên máy tính, mặc dù vậy không có một kỹthuật riêng lẻ nào có thể giải thích đầy đủ cơ chế tổ chức tri thức trong các chương trìnhmáy tính Để giải quyết vấn đề, chúng ta chỉ chọ dạng biểu diễn nào thích hợp nhất, sauđây là các dạng biểu diễn tri thức thường gặp

Tri thức thủ tục mô tả cách thức giải quyết một vấn đề loại tri thức này đưa ra

giải pháp để thực hiện một công việc nào đó Các dạng tri thức thủ tục tiêu biểu thường làcác luật, chiến lược, lịch trình, và thủ tục

Tri thức khai báo cho biết một vấn đề được thấy như thế nào Loại tri thức này

bao gồm các phát biểu đơn giản, dưới dạng các khẳng định logic đúng hoặc sai Tri thứckhai báo cũng có thể là một danh sách các khẳng định nhằm mô tả đầy đủ hơn về đốitượng hay một khái niệm nào đó

Trang 3

Siêu tri thức mô tả tri thức của tri thức Loại tri thức này giúp lựa chọn tri thức

thích hợp nhất trong số các tri thức khi giải quyết một vấn đề Các chuyên gia sử dụng trithức này đề điều chỉnh hiệu quả giải quyết vấn đề bằng cách hướng các lập luận về miềntri thức có khả năng hơn cả

Tri thức heuristic mô tả các “mẹo” để dẫn dắt tiến trình lập luận Tri thức

heuristic còn được gọi là tri thức nông cạn do không bảo đảm hoàn toàn chính xác về kếtquả giải quyết vấn đề, các chuyên gia thường dùng các tri thức khoa học như sự kiện, cácluật… sau đó chuyển chúng thành các tri thức heuristic để thuận tiện hơn trong việc giảiquyết một số bài toán

Tri thức có cấu trúc mô tả tri thức theo cấu trúc Loại tri thức này mô tả mô hình

tổng quan hệ thống theo quan điểm của chuyên gia, bao gồm khái niệm và các đối tượng,diễn tả chức năng và mối liên hệ giữa các tri thức dựa theo cấu trúc xác định

II.2/ Các phương pháp biểu diễn tri thức

Như đã nêu trong mục [II] tương ứng tồn tại các loại tri thức cơ bản sau:

- Tri thức mô tả

- Tri thức thủ tục

- Tri thức điều khiển

Tương ứng với hai loại tri thức mô tả và tri thức thủ tục, có hai loại lớp phương pháp biểudiễn tri thức: biểu diễn mô tả và biểu diễn thủ tục Các cơ chế điều khiển sẽ được lồngtrong bản thân cấu trúc ngôn ngữ biểu diễn tri thức, chẳng hạn trong ngôn ngữ PROLOG

để tỉa bớt một số nhánh tìm kiếm trong không gian bài toán, tránh tìm kiếm vét cạn, if tadùng toán tử cắt tỉa (cut) Có thể phân loại sau:

- Phương pháp biểu diễn tri thức mô tả: logic, mạng ngữ nghĩa, AOV

- Phương pháp biểu diễn tri thức thủ tục: sản xuất

- Phương pháp biểu diễn hổn hợp: Frame

Trang 4

Mong muốn của các chuyên gia về xử lý tri thức là tạo ra được các hệ thống cho phépngười sử dụng mô tả bài toán bằng ngôn ngữ mô tả, sau đó giải chúng theo chế độ tươngtác và hội thoại cao.

II.2.1/ Biểu diễn tri thức nhờ logic

Đây là dạng biểu diễn tri thức cổ điển nhất trong máy tính là logic, với hai dạng phổ biến

là logic mệnh đề và logic vị từ, cả hai kỹ thuật này đều dùng ký hiệu để thể hiện tri thức

và các toán tử áp lên các ký hiệu để suy luận logic Logic đã cung cấp cho nhà nghiêncứu một công cụ hình thức để biểu diễn và suy luận tri thức

Logic mệnh đề biểu diễn và lập luận với các mệnh đề toán học Mệnh đề là một

câu nhận giá trị hoặc đúng hoặc sai giá trị này gọi là chân trị của mệnh đề Logic mệnh đềgán một bước ký hiệu vào một mệnh đề, ví dụ A= “Xe sẽ khởi động”

Khi cần kiểm tra chân trị của câu trên trong bài toán sử dụng logic mệnh đề người takiểm tra giá trị của A Nhiều bài toán sử dụng logic mệnh đề để thể hiện tri thức và giảiquyết vấn đề, bài toán loại này được đưa về bài toán xử lý các luật, mỗi phần giải thiết vàkết luận của luật có thể có nhiều mệnh đề

AND Khoảng cách từ nhà đến chổ làm là xa  B

Luật trên có thể biểu diễn lại như sau: A^B -> C

Các phép toán quen thuộc trên các mệnh đề được cho trong bảng sau:

Trang 5

Bảng chân tri, với các giá trị đúng (True), sai (False)

Logic vị từ là sự mở rộng của logic mệnh đề nhằm cung cấp một cách biễu diễn rõ

hơn về tri thức thì logic vị từ dùng ký hiệu để biểu diễn tri thức Cách biểu diễn này khátrực quan và ưu điểm căn bản của nó là có một cơ sở lý thuyết vững chắc cho những thủtục suy diễn nhằm tìm kiếm và sản sinh ra những tri thức mới, dựa trên các sự kiện và cácluật đã cho Logic vị từ cũng giống như logic mệnh đề, dùng các ký hiệu để thể hiện tri

thức, những ký hiệu này gồm: hằng số, vị từ, biến và hàm.

Hằng số: Các hằng số dùng để đặt tên các đối tượng đặt biệt hay thuộc tính, nhìn

chung các hằng số được ký hiệu bằng chữ viết thường, chẳng hạn An, bình, nhiệt độ.Hằng số An có thể được dùng để thể hiện đối tượng an một người đang xét

Vị Từ: Một mệnh đề hay sự kiện trong logic vị từ được chia thành hai phần vị từ

và tham số Tham số thể hiện một khẳng định về đối tượng, chẳng hạn mệnh đề, chẳnghạn mệnh đề “Nam thích Mai” viết theo vị từ sẽ có dạng: thích (nam, mai) Với cách thểhiện này người ta dùng từ đầu tiên tức “thích” làm vị từ, vị từ cho biết quan hệ giữa cácđối số đặt trong ngoặc, đối số là các ký hiệu thay cho các đối tượng của bài toán

Biến: Các biến dùng để thể hiện các lớp tổng quát của các đối tượng hay thuộc

tính, biến được viết bằng các ký hiệu bắt đầu là chữ in hoa, như vậy có thể dùng vị tự cóbiến để thể hiện nhiều vị từ tương tự

Hàm: Logic vị từ cũng cho phép dùng ký hiệu để biểu diễn hàm, hàm mô tả một

ánh xạ từ các thực thể hay một tập hợp đến một phần tử duy nhất của tập hợp khác

Phép toán: Logic vị từ cũng dùng các phép toán như logic mệnh đề như: thích (X,

Y) AND thích (Z, Y) -> ¬ thích (X, Z), việc lập luận theo cách không hình thức đòi hỏimột khả năng rút ra được kết luận từ các sự kiện đã có, việc lấy ra thông tin mới từ các

Trang 6

thông tin đã biết và các luật là trong tâm của tập luận trong hệ chuyên gia, quá trình lậpluận được hình thức hóa trong bài toán suy luận.

II.2.2/ Bộ ba đối tượng - Thuộc tính – Giá trị

Cơ chế tổ chức nhận thức của con người thường được xây dựng dựa trên các sự kiện

(fact), xem như các đơn vị cơ bản nhất, một sự kiện là một dạng tri thức khai báo Nó

cung cấp một số hiểu biết về một biến cố hay một vấn đề nào đó

Một cách biểu diễn khác là nhờ sử dụng bộ ba đối tượng – thuộc tính – giá trị (Object –Attribute – Value) để chỉ sự kiện rằng “Đối tượng” với “Thuộc tính” đã cho có một “giátrị” nào đó

Màu

Sơ đồ biểu diễn tri thức theo bộ ba (O-A-V)

Trong các sự kiện O – A – V một đối tượng có thể có nhiều thuộc tính với các kiểu giá trịkhác nhau hơn nữa một thuộc tính cũng có thể có một hay nhiều giá trị chúng được gọi làcác sự kiện đơn trị (single-value) hoặc đa trị (multi-value), điều này cho phép các hệ trithức linh động trong việc biểu diễn các tri thức cần thiết, cần phân biệt hai đối tượng: đốitượng tĩnh và đối tượng động các đối tượng tĩnh được lưu trong nội bộ nhớ dài hạn và khicần được đưa vào bộ nhớ làm việc để xử lý, ngược lại trong quá trình làm việc khi cần sẽkhởi tạo các giá trị thuộc tính của các đối tượng động và chúng được lưu ở bộ nhớ trongphục vụ cho việc xử lý tiếp theo

Các sự kiện không phải lúc nào cũng đảm bảo là đúng hay sai với độ chắc chắn hoàntoàn, vì thế khi xem xét các sự kiện người ta còn sử dụng thêm một khái niệm là độ tincậy, phương pháp truyền thống để quản lý thông tin không chắc chắn là sử dụng nhân tốchắc chắn CF (ceratinly factor) được dùng trong hệ MYCIN (khoảng năm 1975)

Ngoài ra, khi các sự kiện mang tính “nhập nhằng” việc biểu diễn tri thức dựa vào một kỹthuật gọi là logic mờ (do Zadeh đưa ra năm 1965) các thuật ngữ nhập nhằng được thểhiện, lượng hóa trong tập mờ

NâuGhế

Trang 7

II.2.3/ Các Luật dẫn

Trong hệ thống dựa trên các luật người ta thu thập các tri thức lĩnh vực trong một tập vàlưu chúng trong cơ sở tri thức của hệ thống Hệ thống dùng các luật này cùng với cácthông tin trong bộ nhớ để giải bài toán việc xử lý các luật trong hệ thống dựa trên các luậtđược quản lý bằng một module gọi là hệ suy diễn, phương pháp này khá trực quan vớingười sử dụng, song chỉ phù hợp khi cơ sở tri thức không có quá nhiều luật suy dẫn và dovậy không chứa nhiều loại vị từ khác nhau

Các luật dẫn cơ bản thể hiện tri thức có thể phân loại theo loại tri thức và như vậy có cáclớp luật tương ứng với dạng tri thức như quan hệ, khuyến cáo, hướng dẫn, chiến lược vàheuristic

IF Xe không khởi động được

THEN Đầu tiên hãy kiểm tra hệ thống nhiên liệu, sau đó kiểm tra hệ

Trang 8

THEN Phát triển bình thường

THEN Lãi suất cao, CF=0,8

Dạng siêu luật một luật với chức năng mô tả cách thức dùng các luật khác sẽ đưa ra chiếnlượt sử dụng các luật theo lĩnh vực chuyên dụng, thay vì đưa ra thông tin mới

AND Hệ thống điện làm việc bình thường

THEN Có thể sử dụng các luật liên quan đến hệ thống điện

Qua thực nghiệm các chuyên gia sẽ đề ra một tập các luật áp dụng cho một bài toán chotrước thí dụ tập luật trong hệ thống chẩn đoán hỏng hóc xe điều này giúp giải quyết cáctrường hợp mà khi chỉ với các luật riêng

Trang 9

II.2.4/ Biểu diễn tri thức bằng Frame

Phương pháp biểu diễn tri thức bằng Frame có tất cả các tính chất vốn có của một ngônngữ biểu diễn tri thức, nó cũng đồng thời cũng là cơ sở cho một phương pháp xử lý thôngtin mới – hướng đối tượng nếu phương pháp biểu diễn nhờ logic và mạng ngữ nghĩa [III]mang đặc trưng mô tả và phương pháp dùng các luật sản xuất dùng để biểu diễn tri thứcthủ tục, thì Frame lại kết hợp được những đặc điểm của cả hai dạng biểu diễn: Mô tả vàthủ tục hệ biểu diễn Frame do M.Minsky đưa ra năm 1975

Frame thực chất là sự tổng quát hóa của cấu trúc bản ghi trong PASCAL hoặc danh sáchbản thể trong LISP và tương tự như cấu trúc đối tượng trong C++, tận dụng được các ưuđiểm của các luật sản xuất và vị từ, cũng như là mạng ngữ nghĩa, một Frame được mô tảbởi cấu trúc

<tên Frame>

<tên slot 1>

<thuộc tính thừa kế> - (như trên, duy nhất, miền)

<Kiểu slot> - (text, integer, real, pointer…)

<Giá trị slot> - (tên, giá trị, thủ tục, pointer)

<tên slot 2>

Cấu trúc Frame này cho ta một “khung dữ liệu” để khoanh vùng các đối tượng, một trongnhững đặc trưng quan trọng của biểu diễn nhờ Frame là khả năng thừa kế các thông tincủa các slot có cùng tên ở đối tượng bậc trên Khi bài toán trở nên phức tạp hơn thì việc

mô tả và điều khiển trong Frame sẽ phức tạp hơn nhiều trong các phương pháp biểu diễnthủ tục khác

Trang 10

PHẦN III: MẠNG NGỮ NGHĨA VÀ GIẢI THUẬT LAN TRUYỀN

Như đã trình bày ở phần mở đầu [I] để máy tính có thể sử dụng được tri thức, có thể xử lýđược tri thức, chúng ta cần phải biểu diễn tri thức dưới dạng thuận tiện cho máy tính, đó

là mục tiêu của biểu diễn tri thức sau nhiều cố gắng các nhà trí tuệ nhân tạo đã phát triển

một số cách biểu diễn (thể hiện) tri thức có hiệu quả trong máy tính đặc biệt một trong số

biểu diễn mà người viết muốn nhắc đến mạng ngữ nghĩa và tính toán lan truyền trongmạng

III.1/ Mạng ngữ nghĩa

Mạng ngữ nghĩa là một công cụ trực quan giúp chúng ta biểu diễn được các mối liên hệgiữa các tri thức tổng quát, khái niệm, các sự việc mà chúng có mối liên hệ Mạng ngữnghĩa là một phương pháp biểu diễn tri thức đầu tiên và cũng là phương pháp dễ hiểu, đểbiểu diễn một mạng ngữ nghĩa thì người ta dùng phương pháp đồ thị, trong đó đỉnh là các

đối tượng (khái niệm, tri thức, sự việc) nào đó, còn các cung giữa các đỉnh nó thể hiện

các mối liên hệ giữa các đối tượng

Người ta có thể nới rộng mạng ngữ nghĩa bằng cách thêm các nút và nối chúng vào đồthị, các nút mới ứng với các đối tượng bổ sung, thông thường có thể nới rộng mạng ngữnghĩa theo ba cách:

- Thêm một đối tượng tương tự

- Thêm một đối tượng đặc biệt hơn

- Thêm một đối tượng tổng quát hơn

Trang 11

Thứ nhất thêm “cách cụt” thể hiện một loại chim mới thứ hai thêm “chip” cũng có nghĩa

nó là con “sẻ” và đồng thời là “chim”, thứ ba có thể đưa ra đối tượng tổng quát như “convật” lúc này không những có thể biết được rằng “chim là con vật” mà còn biết “chip thởbằng không khí”

Tính chất quan trọng của mạng ngữ nghĩa là tính kế thừa, nó cho phép các nút được bổsung sẽ nhận các thông tin của các nút đã có trước, và cho phép mã hóa tri thức một cách

dễ dàng

Để minh họa cho tính kế thừa của mạng ngữ nghĩa hãy xét một câu hỏi trên đồ thị, chẳnghạn tại nút “chim” người ta muốn hỏi con “chip” hoạt động như thế nào ? thông qua cunghoạt động người ta biết được nó bay

Trang 12

III.2/ Giải thuật lan truyền trên mạng ngữ nghĩa

Lan truyền kích hoạt (spreading activation) là một phương pháp để tìm kiếm các mạng lưới liên kết, các mạng thần kinh (neural networks) hoặc mạng ngữ nghĩa (semantic networks), quá trình tìm kiếm được bắt đầu bằng cách ghi nhãn một tập hợp các nút

nguồn [III.1] với kích hoạt hay “activation” và sau đó lặp đi lặp lại các lan truyền hay

“spreading” tiếp tục kích hoạt các nút tiếp theo liên quan đến nút nguồn Trong kích hoạtlan truyền các nút đã được kích hoạt và các nút chưa kích hoạt được lưu lại để phục vụcho việc tìm nút lan truyền tiếp theo hợp lý hơn

Lan truyền kích hoạt được ứng dụng trong truy suất thông tin, bằng việc sử dụng ngữnghĩa của một mạng lưới đại diện cho các nút tài liệu và các từ ngữ có trong văn bản đó.Cho một đồ thị có hướng được thể hiện bởi mảng node [1 n], mỗi kích hoạt liên quanđến giá trị A[i] là một số thực nằm trong khoảng [0.0 1.0], link[i, j] sẽ kết nỗi vớinguồn node[i] với mục tiêu là node[j] Mỗi liên kết có một trọng số là w[i, j] thường làmột số thực nằm trong dãy [0.0 1.0]

Các tham số:

Ngày đăng: 10/04/2015, 17:04

Nguồn tham khảo

Tài liệu tham khảo Loại Chi tiết
[1]. Nguyễn Thanh Thủy. Trí tuệ nhân tao các phương pháp giải quyết vấn đề và kỹ thuật xử lý tri thức. Nhà xuất bản khoa học và kỹ thuật, 1999 Sách, tạp chí
Tiêu đề: Trí tuệ nhân tao các phương pháp giải quyết vấn đề và kỹthuật xử lý tri thức
Nhà XB: Nhà xuất bản khoa học và kỹ thuật
[2]. GS. TSKH Hoàng Kiếm, TS Đỗ Phúc, TS Đỗ Văn Nhơn. Giáo trình các hệ cơ sở tri thức. Nhà xuất bản Đại Học Quốc Gia TP Hồ Chí Minh, 2009 Sách, tạp chí
Tiêu đề: Giáo trình" c"ác hệ cơ sở trithức
Nhà XB: Nhà xuất bản Đại Học Quốc Gia TP Hồ Chí Minh
[3]. GS.TSKH. Hoàng Kiếm, Ths Đinh Nguyễn Anh Dũng. Giáo trình Trí Tuệ Nhân Tạo. Đại học công nghệ thông tin, 2007 Sách, tạp chí
Tiêu đề: Giáo trình Trí Tuệ NhânTạo
[5]. GS.TSKH Hoàng Kiếm, bài giảng công nghệ tri thức và ứng dụng.[6]. Các website tham khảo Sách, tạp chí
Tiêu đề: bài giảng công nghệ tri thức và ứng dụng
[4]. Dragan Gasevic, Dragan Djuric, Vladan Devedzic. Model Driven Architecture and Ontology Development Khác

TỪ KHÓA LIÊN QUAN

TÀI LIỆU CÙNG NGƯỜI DÙNG

TÀI LIỆU LIÊN QUAN

w