Tài liệu hạn chế xem trước, để xem đầy đủ mời bạn chọn Tải xuống
1
/ 24 trang
THÔNG TIN TÀI LIỆU
Thông tin cơ bản
Định dạng
Số trang
24
Dung lượng
310,44 KB
Nội dung
ĐẠI HỌC QUỐC GIA THÀNH PHỐ HỒ CHÍ MINH TRƯỜNG ĐẠI HỌC CÔNG NGHỆ THÔNG TIN Tiểu luận: MÔ HÌNH TRI THỨC CHO CÁC NGHIỆP VỤ QUẢN LÝ VÀ ỨNG DỤNG HVTH: Võ Thành Nhân MSHV: CH1301103 GVPT: GS.TSKH. Hoàng Kiếm Thành phố Hồ Chí Minh 10 – 2014. ĐẠI HỌC QUỐC GIA THÀNH PHỐ HỒ CHÍ MINH TRƯỜNG ĐẠI HỌC CÔNG NGHỆ THÔNG TIN Tiểu luận môn học: Công nghệ tri thức Tiểu luận: MÔ HÌNH TRI THỨC CHO CÁC NGHIỆP VỤ QUẢN LÝ VÀ ỨNG DỤNG HVTH: Võ Thành Nhân MSHV: CH1301103 GVPT: GS.TSKH. Hoàng Kiếm Thành phố Hồ Chí Minh 10 – 2014. Mục lục 2 Tiểu luận môn học: Công nghệ tri thức 1.1 Tại sao phải nghiên cứu bài toán này Công nghệ tri thức đã thâm nhập vào hầu hết các lĩnh vực ứng dụng của công nghệ thông tin. Tuy nhiên, hầu hết các nỗ lực đều tập trung giải quyết các vấn đề cụ thể mà thực tế đòi hỏi. Gần như là chưa có một nỗ lực nào đưa các thành tựu của công nghệ tri thức vào tiến trình xây dựng phần mềm để tạo ra các cách xây dựng phần mềm mới mẻ. Nói riêng trong các phần mềm quản lý, nếu tổ chức, xí nghiệp muốn sử dụng cho phù hợp với nhu cầu của mình thì hoặc là xây dựng mới hoặc là phải chỉnh sửa lại một phần mềm có sẵn. Cả hai việc đó đều rất mất thời gian. Vì vậy, em chọn đề tài này với mong muốn làm tối thiểu chi phí hiệu chỉnh một phần mềm khi áp dụng cho các tổ chức, xí nghiệp khác nhau. 1.2 Các lợi ích của bài toán này Nếu xây dựng thành công một cơ sở tri thức cho các nghiệp vụ quản lý của một lĩnh vực cụ thể sẽ có những lợi ích sau đây: • Tối thiểu nhưng nỗ lực sữa chữa khi đem áp dụng cho những tổ chức, xí nghiệp khác nhau. Thường những tổ chức, xí nghiệp trong cùng một lĩnh vực quản lý sẽ có những đặc trưng giống nhau về cấu trúc tổ chức, nghiệp vụ phổ biến cho lĩnh vực đó. Hơn nữa còn bị chi phối bởi những nghiệp vụ mang tính phổ quát và bắt buộc như: kế toán cho những tố chức có thu/chi. Những khác biệt chủ yếu đến từ cung cách kinh doanh, cách thức thực hiện một nghiệp vụ cụ thể. Và những sự khác biệt này thường nhỏ so với những sự tương đồng. • Giảm chi phí xây dựng phần mềm. Đặc trưng của các hệ thống dựa trên cơ sở tri thức là giải quyết vấn đề dựa trên cơ chế suy luận chứ không mã hóa cứng bằng một ngôn ngữ lập trình cụ thể. Chính điều này cho phép chúng giải một lớp các vấn đề tương tự nhau mà không cần phải lập trình riêng cho mỗi vấn đề cụ thể. Điều này làm giảm đáng kể công sức lập trình khi xây dựng phần mềm. Hệ quả là nếu có một cơ sở tri thức phù hợp cho một lớp vấn đề quản lý nào đó, ta có thể xây dựng một công nghệ tạo lập các phần mềm giải các lớp bài toán đó dựa trên cơ sở tri thức mà gần như không hoặc rất ít mã hóa(coding). Và nếu như làm tốt có thể loại bỏ một chi phí khổng lồ trong xây dựng phần mềm đó là chi phí testing. Bây giờ không còn test cho phần mềm cụ thể nữa mà chỉ cần test cho “công nghệ tạo phần mềm dựa 3 Tiểu luận môn học: Công nghệ tri thức trên tri thức”. Một khi công nghệ đó được test cẩn thận thì có thể yên tâm về chất lượng của phần mềm được tạo ra. • Đưa phần mềm đến với người dùng sớm nhất có thể. Công nghiệp phần mềm đã chứng tỏ lợi ích của điều này bằng sự ra đời của các quy trình phát triển phần mềm XP(Extreme Programing) và các hậu duệ của nó như Agile, Scrum…mà cốt lõi là đưa phần mềm đến user sớm nhất để nhận được phản hồi nhằm giảm tối đa chi phí sửa chữa. Khi chúng ta có một cơ sở tri thức tổng quát, bao trọn những phần cốt lõi chung của tổ chức, xí nghiệp trong một lĩnh vực quản lý, chúng ta sẽ dễ dàng chỉnh sửa cho phù hợp với hiện trạng của từng tổ chức, xí ngiệp và đưa hệ thống đến tay người dùng sớm nhất. • Tăng cường tính hiểu được của phần mềm. Phần lớn các người dùng phần mềm đều không biết và không hiểu được hệ thống thực hiện các logic nghiệp vụ của mình như thế nào, bởi vì các logic nghiệp vụ được mã hóa trong những ngôn ngữ lập trình cụ thể(hoặc các ngôn ngữ phi thủ tục của các hệ quản trị CSDL). Nhưng các dạng biểu diễn của tri thức gần gũi và dễ hiểu hơn rất nhiều so với các ngôn ngữ lập trình vì nó biểu diễn trực tiếp những khái niệm gắn liền với công việc hàng ngày của họ. Nhìn vào cách biểu diễn tri thức người dùng sẽ hình dung ra cách phần mềm thực hiện các logic nghiệp vụ của mình như thế nào. 1.3 Mục tiêu của tiểu luận Tiểu luận sẽ tập trung vào các công việc sau: • Tiến hành khảo sát một số mô hình biểu diễn tri thức thông dụng, hiện hành. • Đề xuất một mô hình biểu diễn tri thức CAFR cho các nghiệp vụ của bài toán quản lý cho các tổ chức, xí nghiệp. • Thảo luận về các vấn đề của mô hình CAFR và đề xuất các thuật toán tương ứng cho các vấn đề đó. • Demo tính năng thực thi cây thuật toán bằng một ngôn ngữ lập trình thông dụng 4 Tiểu luận môn học: Công nghệ tri thức 2. Mô hình tri thức cho các nghiệp vụ quản lý 2.1 Sơ lược một số mô hình biểu diễn tri thức thông dụng 2.1.1 Mô hình logic mệnh đề & logic vị từ Đây là đạng biểu diễn tri thức cổ điển nhất trong máy tính. Cả hai đều sử dụng những phép toán của logic toán(như AND, OR, NOT, Kéo theo ) và các kí hiệu thông dụng của logic toán(như ˄, ˅, ¬, →…) để làm cơ sở cho việc suy luận logic. Một mệnh đề có dạng A→B. Ví dụ câu Nếu trời mưa thì đường ướt có thể biểu diễn thành dạng A→B với A = trời mưa, B = đường ướt. Để có thể suy diễn với các tri thức biểu diễn bằng logic mệnh đề người ta hay sử dụng hai thuật giải thông dụng là thuật giải Vương Hạo và thuật giải Robinson. Vì mệnh đề không có cấu trúc, dẫn đến hạn chế nhiều thao tác suy luận, nên người ta đưa vào đó 2 lượng từ ∀(với mọi) và ∃(tồn tại) để tăng cường tính cấu trúc của một mệnh đề, hình thành nên logic vị từ. Một vị từ thường được biểu diễn dưới dạng sau đây: Vị từ(<đối tượng 1>,<đối tượng 2>, …,<đối tượng n>) Ví dụ để biểu diễn cho các tính chất như: Chanh thì chua, Mật ong thì ngọt ta có thể viết lại như sau: Chua(Chanh), Ngọt(Mật ong). Logic vị từ đã được nghiên cứu và phát triển thành một ngôn ngữ lập trình đặc trưng cho ngành trí tuệ nhân tạo, đó là Prolog. Bảng sau đây tổng kết cách biểu diễn tri thức bằng logic mệnh đề và logic vị từ 5 Tiểu luận môn học: Công nghệ tri thức 2.1.2 Mô hình luật sinh Đây là mô hình biểu diễn tri thức được yêu thích nhất, thậm chí nhiều người còn tìm mọi cách để biểu diễn luật sinh cho mọi miền tri thức dù có những biểu diễn phù hợp hơn. Phương pháp này được phát minh bởi Newell và Simon trong lúc hai ông đang nỗ lực xây dựng hệ giải bài toán tổng quát(các hệ General Problem Solving). Ý tưởng cơ bản của luật sinh là tri thức sẽ được biểu diễn bằng một cặp điều kiện-hành động. Nếu điều kiện được thỏa mãn thì hành động sẽ diễn ra. Ví dụ về các luật sinh được nêu trong bảng sau đây: Một cách tổng quát, 1 luật sinh r có thể biểu diễn như sau: r: P 1 ˄ P 2 ˄ P 3 ˄ … ˄ P n → Q Trong đó các P i và Q là những sự kiện được định nghĩa trước trong tập F(Facts), và r nẳm trong tập R(Rules), định nghĩa các luật áp dụng trên tập sự kiện F. Một cách hình thức thì mô hình biểu diễn tri thức dạng luật sinh là mô hình tri thức 2 thành phần (F, R). Trong đó F là tập chứa các sự kiện, R là tập chứa các luật áp dụng trên tập F. Biểu diễn tri thức bằng luật sinh tương đối đơn giản. Nhưng đối với các cơ sở tri thức lớn, có hàng ngàn luật thì người ta lại đối diện với vấn đề loại bỏ các luật mâu thuẫn và các luật thừa. Đây là bài toán vẫn còn tiếp tục cho đến hiện nay. 2.1.3 Mô hình mạng ngữ nghĩa Mạng ngữ nghĩa là mô hình tri thức dạng đồ thị, trong đó các đỉnh biểu diễn cho các đối tượng, các cung biểu diễn cho một quan hệ giữa các đối tượng. Một ví dụ về mô hình mạng ngữ nghĩa được thể hiện trong hình sau đây: 6 Tiểu luận môn học: Công nghệ tri thức Mạng ngữ nghĩa đặc biệt thích hợp cho các vấn đề biểu diễn mối quan hệ giữa các đối tượng theo một công thức hay một hàm nào đó. Có thể dùng mạng ngữ nghĩa biểu diễn mối quan hệ giữa các yếu tó trong tam giác(bao gồm các cạnh, góc, đỉnh…) với các công thức liên quan. Trong đồ thị này có hai loại đỉnh: đỉnh hình tròn biểu diễn cho các yếu tố của tam giác. Đỉnh hình chữ nhật biểu diễn cho các công thức. Sau đó thực hiện theo co chế suy luận được nêu dưới đây để giải bài toán tam giác. Cơ chế suy diễn trên mạng ngữ nghĩa thực hiện theo thuật toán “loang” đơn giản sau đây B1: Kích hoạt những đỉnh tròn đã cho ban đầu(những yếu tố đã có giá trị. B2: Lặp cho đến khi kích hoạt tất cả các đỉnh hoặc không thể kích hoạt thêm đỉnh nào nữa Nếu một đỉnh hình chữa nhật có cung nối với n đỉnh hình tròn mà n-1 đỉnh hình tròn đã được kích hoạt đỉnh hình tròn còn lại(và tính giá trị cho đỉnh này thông qua công thức hình chữ nhật. Dưới đây là đồ thị cho một mạng ngữ nghĩa giải bài toán tam giác: 7 Tiểu luận môn học: Công nghệ tri thức Mạng ngữ nghĩa biểu diễn rất tốt mối quan hệ của các đối tượng thông qua phương trình. Tuy nhiên với các loại quan hệ không biểu diễn bằng phương trình thì rất khó dùng mạng ngữ nghĩa để biểu diễn. Hơn nữa việc cho phép thêm quan hệ quá dễ dàng có nguy cơ làm xuất hiện những tri thức mâu thuẫn. 2.1.4 Mô hình Frame Frame là một cấu trúc dữ liệu chứa đựng tất cả những tri thức về một đối tượng nào đó trong thế giới thực. Đây chính là tính chất đóng gói(encapsulation) của lập trình hướng đối tượng. Người ta thường dùng FRAME để biễu diễn những tri thức tri thức chuẩn, đã được hiểu biết cặn kẽ. Ý tưởng này mô phỏng cách con người lưu trữ những kinh nghiệm, tri thức đã qua kiểm chứng, được truyền bá rộng rãi. Khi cần vận dụng vào vấn đề thực tế thì chỉ cần lấy ra sửa lại chút ít mà không phải mất quá nhiều công sức. Một ví dụ về thông tin đối tượng và cấu trúc biểu diễn bằng FRAME tương ứng như sau: 2.1.5 Mô hình COKB Mô hình COKB là một mô hình tri thức gồm 6 thành phần : K = (C, H, R, Ops, Funcs, Rules ) C là một tập hợp các khái niệm về các C-Object là những đối tượng có các đặc trưng: • Có các thuộc tính có thể tính giá trị được • Có những quan hệ tính toán bên trong giữa các thuộc tính 8 Tiểu luận môn học: Công nghệ tri thức Nếu cho trước một tập con A của tập thuộc tính thì đối tượng C-Object có thề cho biết những thuộc tính có thể tính toán được từ tập A. Cấu trúc C-Objects có thể được mô hình hóa bằng (Attrs, F, Facts, Rules), với : • Attrs là một tập các thuộc tính • F là một tập hợp các phương trình được gọi là quan hệ tính toán • Facts là tập hợp các thuộc tính hoặc sự kiện của đối tượng. • Rules là tập các quy tắc suy luận dựa trên Facts. Một ví dụ về cấu trúc của đối tượng tam giác như sau: Attrs = {A, B, C, a, b, c, R, S, p, } F = { A+B+C = π; a/sin(A) = 2R; b/sin(B) = 2R; c/sin(C) = 2R; S = (1/2)bcsin(A)…} Facts = {a+b>c; a+c>b; b+c>a ; …} Rules = { {a>b} ⇔ {A>B}; {b>c} ⇔ {B>C}; {c>a} ⇔ {C>A}; {a=b} ⇔ {A=B}; {a^2= b^2+c^2} ⇔ {A=pi/2}, {A=pi/2} ⇔ {a^2 = b^2+c^2, b ⊥ c}, …. }. H: là một tập hợp các quan hệ phân cấp giữa các loại đối tượng. R: là tập hợp các khái niệm về các loại quan hệ trên các C-Object. Ops: là một tập hợp các toán tử. Funcs: là một tập hợp các hàm. Rules: là tập hợp các luật. Mỗi đối tượng thuộc C là một lớp các đối tượng tính toán có cấu trúc nhất định và được phân cấp theo sự thiết lập của cấu trúc các đối tượng. Trong mô hình COKB, ta có 11 loại sự kiện như sau: • Sự kiện loại 1: Sự kiện thông tin về loại của đối tượng. 9 Tiểu luận môn học: Công nghệ tri thức • Sự kiện loại 2: Sự kiện về tính xác định của một đối tượng hay của một thuộc tính của đối tượng. • Sự kiện loại 3: Sự kiện về tính xác định của một đối tượng hay của một thuộc tính của đối tượng thông qua biểu thức hằng. • Sự kiện loại 4: Sự kiện về sự bằng nhau của một đối tượng hay một thuộc tính của đối tượng với một đối tượng hay một thuộc tính khác. • Sự kiện loại 5: Sự kiện về sự phụ thuộc giữa các đối tượng và các thuộc tính của các đối tượng thông qua một công thức tính toán hay một đẳng thức theo các đối tượng hoặc các thuộc tính. • Sự kiện loại 6: Sự kiện về một quan hệ trên các đối tượng hay trên các thuộc tính của các đối tượng. • Sự kiện loại 7: Sự kiện về tính xác định của một hàm. • Sự kiện loại 8: Sự kiện về tính xác định của một hàm thông qua một biểu thức hằng. • Sự kiện loại 9: Sự kiện về sự bằng nhau giữa một đối tượng với một hàm. • Sự kiện loại 10: Sự kiện về sự bằng nhau của một hàm với một hàm khác. • Sự kiện loại 11: Sự kiện về sự phụ thuộc của một hàm theo các hàm hay các đối tượng khác thông qua một công thức tính toán 2.2 Mô hình tri thức CAFR cho các nghiệp vụ quản lý Dựa trên sự tham khảo các mô hình biểu diễn tri thức truyền thống và đặc biệt là mô hình COKB(Computation Object Knowledge Base) với cách tiếp cận hướng đối tượng cho phép biểu diễn những tri thức phức tạp trong thực tế, kết hợp các công cụ biểu diễn khác như FRAME, luật sinh …tiểu luận đề xuất một mô hình biểu diễn tri thức như sau: (C, A, F, R) C: là tập các khái niệm trong lĩnh vực đang xét. Các khái niệm này cho phép kế thừa. Cấu trúc của một khái niệm như sau: (Attributes, Rules, Contraints, Operations). Ví dụ cấu trúc của khái niệm NHAN_VIEN như sau: concept NHAN_VIEN { identification String maNV; String tenNV; 10 [...]... kèm 22 Tiểu luận môn học: Công nghệ tri thức Kết luận Tiểu luận đã đạt được một số công việc sau đây: • Mô tả sơ lược về các mô hình biểu diễn tri thức thông dụng • Trình bày ý nghĩa, giá trị của việc xây dựng hệ cơ sở tri thức cho các phần mềm quản lý • Đề xuất một mô hình biểu diễn tri thức CAFR cho các bài toán quản lý dựa trên mô hình COKB • Nêu ra một số vấn đề trên trên mô hình CAFR và các giải... cơ sở tri thức về Tài chính đề hình thành nên module tài chính, cơ sở tri thức về Bán Hàng & Marketing hình thành nên module Bán hàng & Marketing… • Xây dựng một CASE Study để kiểm chứng mô hình làm việc như thế náo với các ứng dụng thực tế • Xây dựng một công nghệ để tạo lập các phần mềm quản lý theo phương pháp biểu diễn tri thức trên mô hình CAFR bằng các công nghệ lập trình hiện đại, phổ dụng như... toán quản lý 18 Tiểu luận môn học: Công nghệ tri thức Việc làm thế nào để xây dựng cơ chế suy luận có thể tham khảo trong [1] Cách tiếp cận trong mô hình này có thể dùng được phương pháp như trên, bởi vì mô hình CAFR về cơ bản là một thu nhỏ của mô hình COKB sau khi đã bỏ đi một số thành phần chuyên dùng trong lĩnh vực toán học và thêm vào một số tính chất đặc thù cho các hệ thống thông tin quản lý Vấn... hàm khác 14 Tiểu luận môn học: Công nghệ tri thức o (nv is NHAN_VIEN, (lay_so_ngay_lam_viec(nv) < 20) → (nv.phu_cap=0) 3 Một số vấn đề trên mô hình CAFR và các giải pháp 3.1 Phân rã mô hình CAFR thành lược đồ CSDL quan hệ Một trong những vấn đề quan trọng nhất của bất kỳ phần mềm nào là thiết kế cấu trúc lưu trữ dữ liệu ở bộ nhớ ngoài ví dụ như đĩa cứng Riêng trong lĩnh vực các phần mềm quản lý thì hầu... đề phân rã mô hình thành các lược đồ quan hệ, đề xuất cấu trúc biểu diễn thuật toán cho một tính năng của phần mềm bằng một thuật toán được sinh ra nhờ suy luận trên các tri thức trong mô hình và cách thức thực hiện các thuật toán đó • Demo tính năng thực hiện thuật toán bằng một ngôn ngữ lập trình thông dụng như Java để thấy tính khả thi của biểu diễn trên Hướng phát tri n sắp tới của tiểu luận là:... n) max = n return max Phạm vi sử dụng của các hàm là toàn cục Các hàm có thể gọi từ bất cứ nơi nào cấn đến Để đơn giản hóa việc xây dựng các hàm, cần thiết đề xuất một dạng cú pháp đơn giản, dễ viết như các ngôn ngữ scripting như Python chẳng hạn R: tập các luật liên quan đến các quy tắc nghiệp vụ giữa các khái niệm Một luật dạng: 13 Tiểu luận môn học: Công nghệ tri thức IF H1 AND H2 AND…AND Hn THEN... 3.1.2 Một ví dụ cụ thể Xét một mô hình tri thức CAFR cho lĩnh vực ngân hàng như sau: concept KHACH_HANG { identification String maKH; String tenKH; } concept NHAN_VIEN { identification String maNV; String tenNV; } concept KHOAN_VAY concept GIAO_DICH 16 Tiểu luận môn học: Công nghệ tri thức { { identification String maKV; KHACH_HANG kh; Real soTien; identification String maGD; LOAI_GIAO_DICH loaiGD; KHACH_HANG... thêm mô hình CAFR • Giải quyết vấn đề sinh ra thuật toán cho một tính năng của phần mềm quản lý cũng như phân rã thuật toán đó thành biểu diễn dạng cây Đề xuất cấu trúc lưu trữ các cây thuật toán ở bộ nhớ ngoài • Nghiên cứu cách thức cho phép biểu diễn tri thức của từng module phần mềm và tích hợp trong một hệ thống duy nhất Ví dụ ta đã có một cơ sở tri thức cốt lõi, cơ sở cho một tổ chức, xí nghiệp. .. Tất cả các liên kết trong mô hình đế có tối đa 2 ngôi Cấu trúc của một liên kết có dạng sau: [, , ] {, < cơ số 2>} 12 Tiểu luận môn học: Công nghệ tri thức Trong đó các < cơ số 1>, < cơ số 2> là khái niệm cơ số của biểu đồ lớp trong UML dùng để chỉ số đối tượng của một khái niệm tham gia vào liên kết này Các giá trị thường dùng của cơ số là: 1 một và chỉ... sử dụng các tri thức được mô tả trong CSTT để đạt đến mục đích mong muốn Và quá trình này phải được thực hiện với những bộ dữ liệu cụ thể trong thế giới thực Như vậy cái lời giải này có dạng là một thuật toán và với một bộ dữ liệu đầu vào cụ thể, đi theo thuật toán này sẽ có được giá trị cụ thể của các thuộc tính mong muốn Đây chính là mục tiêu chủ chốt việc xây dựng cơ sở tri thức cho các bài toán quản . THÀNH PHỐ HỒ CHÍ MINH TRƯỜNG ĐẠI HỌC CÔNG NGHỆ THÔNG TIN Tiểu luận môn học: Công nghệ tri thức Tiểu luận: MÔ HÌNH TRI THỨC CHO CÁC NGHIỆP VỤ QUẢN LÝ VÀ ỨNG DỤNG HVTH: Võ Thành Nhân MSHV: CH1301103 GVPT:. trình thông dụng 4 Tiểu luận môn học: Công nghệ tri thức 2. Mô hình tri thức cho các nghiệp vụ quản lý 2.1 Sơ lược một số mô hình biểu diễn tri thức thông dụng 2.1.1 Mô hình logic mệnh đề &. vào các công việc sau: • Tiến hành khảo sát một số mô hình biểu diễn tri thức thông dụng, hiện hành. • Đề xuất một mô hình biểu diễn tri thức CAFR cho các nghiệp vụ của bài toán quản lý cho các