PHÁT TRIỂN CÁC MODUL

Một phần của tài liệu Biễu diễn dữ liệu mờ bằng ngôn ngữ XML và ứng dụng (Trang 63 - 75)

Cơ sở dữ liệu sau khi được mờ hĩa sẽ được lưu trữ trong một file xml cĩ cấu trúc như sau:

Hình 3: Cấu trúc một cơ sở dữ liệu mờ lylich đã được mờ hĩa

3.3.2. Modul biểu diễn truy vấn mờ

Để thực hiện các truy vấn trên cơ sở dữ liệu mờ thì câu truy vấn ở dạng SQL phải được chuyển đổi thành file xml hoặc chuỗi theo cấu trúc của file xml. Cơng việc này sẽ được thực hiện thơng qua phương thức ReadSQLXML trong lớp SQL.

Phương thức này cho phép chuyển đổi một câu lệnh SQL thành một file truy vấn biểu diễn bằng XML để cĩ thể thực hiện truy vấn dễ dàng trên cơ sở dữ liệu mờ.

Hình 4: Cấu trúc file lưu trữ câu truy vấn mờ bằng XML

3.4. GIAO DIỆN CHƯƠNG TRÌNH

Dựa trên những phân tích và thiết kế về cơ sở dữ liệu mờ theo lý thuyết về đại số gia tử, chúng tơi đã xây dựng hệ thống “Quản lý thơng tin nhân sự” trong đĩ cĩ thêm các chức năng ứng dụng logic mờ dựa trên lý thuyết về đại số gia tử.

Đầu tiên khi khởi động chương trình thì màn hình giao diện chương trình như sau:

Hình 5: Giao diện chính của chương trình

Từ giao diện chính, người dùng phải thực hiện đăng nhập với tài khoản admin

mới cĩ thể thực hiện các chức năng như: phân quyền, cập nhật lý lịch, cập nhật lý lịch khoa học, cập nhật bảng lương, cập nhật bảng chấm cơng. Ngồi ra những chức năng như thống kê nhân viên theo độ tuổi, theo mức lương, … cĩ thể thực hiện mà khơng cần phải đăng nhập tài khoản.

Sau khi nhập đầy đủ các thơng tin cho nhân viên thì người dùng cĩ thể thực hiện chức năng mờ hĩa cơ sở dữ liệu.

Giao diện này cho phép lựa chọn các trường thuộc tính cần được mờ hĩa, với mỗi trường thuộc tính mờ cần phải xác định các đại lượng như miền giá trị tham chiếu, miền giá trị ngơn ngữ thơng qua hai đại lượng là LDom(H)LDom(E). Chỉ những trường được đánh dấu là is Fuzzy mới cho phép lựa chọn các đại lượng trên và những trường này sẽ được mờ hĩa bằng đại số gia tử. Giao diện lựa chọn các trường cần thực hiện mờ hĩa như sau:

Hình 6: Giao diện chức năng lựa chọn các trường thuộc tính mờ

Thơng qua chức năng này người dùng cĩ thể lựa chọn các thơng tin về tập các phần tử sinh, tập các gia tử cùng với độ thuộc của nĩ sao cho phù hợp với ý kiến của chuyên gia.

Sau khi lựa chọn các trường cần được mờ hĩa thì kết quả thực hiện việc mờ hĩa sẽ cho như sau:

Chúng ta cũng cĩ thể thực hiện việc mờ hĩa với dữ liệu nguồn là kết quả truy vấn bằng câu lệnh SQL chuẩn, từ dữ liệu nguồn này chúng ta cĩ thể thực hiện lựa chọn các trường thuộc tính mờ và thực hiện việc mờ hĩa tương tự như trên.

Sau khi đã thực hiện việc mờ hĩa cơ sở dữ liệu sẵn cĩ, người dùng cĩ thể lưu trữ thành file xml để thực hiện việc khai phá dữ liệu hoặc thực hiện các truy vấn mờ. Ngồi ra hệ thống cịn cho phép người dùng tự tạo cho mình một cơ sở dữ liệu mờ dựa trên lý thuyết về đại số gia tử, cơ sở dữ liệu mờ này cũng được lưu trữ bằng file xml và giống như cấu trúc của file xml đã được mờ hĩa do đĩ nĩ cĩ thể dùng để truy xuất và khai phá dữ liệu.

Dữ liệu sau khi được mờ hĩa cĩ thể được dùng cho các chức năng khai phá dữ liệu tìm ra tri thức cĩ ích, hoặc thực hiện các truy vấn cần thiết để tìm ra những thơng tin cĩ ích cho những dự báo trong tương lai. Người dùng cĩ thể thực hiện các truy vấn mờ bằng các câu lệnh SQL.

3.5. THỬ NGHIỆM VÀ ĐÁNH GIÁ

- Chọn cơ sở dữ liệu nguồn.

- Xác định miền giá trị

Hình 9: Xác định miền giá trị của thuộc tính Lương

- Tập các phần tử sinh

Hình 10: Xác định tập phần tử sinh của thuộc tính Lương

Hình 11: Xác định tập gia tử

- Sau khi mờ hĩa dữ liệu

- Thực hiện truy vấn mờ với câu truy vấn Select SoCM, Hoten, SucKhoe, Tuoi, Luong From BangLuong

Where Tuoi=2 Hơn Già and SucKhoe=2 Khả năng Tốt - Kết quả chuyển câu truy vấn trên về dạng XML

- Kết quả truy vấn (adsbygoogle = window.adsbygoogle || []).push({});

Hình 13: Kết quả sau khi thực hiện truy vấn.

Dựa trên dạng dữ liệu mờ và dữ liệu rõ chương trình đã thực hiện việc mờ hĩa cơ sở dữ liệu nguồn, cho phép biểu diễn nhiều dạng dữ liệu mờ khác nhau khi cập nhật. Việc lưu trữ, truy vấn thực hiện nhanh chĩng và cho kết quả đúng.

Với kết quả này chúng ta cĩ thể sử dụng cho việc mờ hĩa dữ liệu đã cĩ, lưu trữ dữ liệu mờ trong nhiều hệ thống ứng dụng khác: Hệ thống khai phá dữ liệu tri thức bằng các luật kết hợp mờ, Hệ thống hỗ trợ quyết định, …

3.6. TỔNG KẾT CHƯƠNG

Chương này ứng dụng các kết quả đã nghiên cứu vào bài tốn “Quản lý thơng tin nhân sự”: Biểu diễn CSDL mờ bằng ngơn ngữ XML, cài đặt thuật tốn xác định giá trị chân lý của điều kiện mờ để đánh giá truy vấn. Ngồi ra, trong chương ba cũng đưa ra kết quả thử nghiệm và đánh giá hệ thống này.

KẾT LUẬN

Với mục đích tìm ra một phương pháp biểu diễn cơ sở dữ liệu mờ cho phép mờ hĩa cơ sở dữ liệu sẵn cĩ để thu thập, lưu trữ và xử lý được những thơng tin mờ trên máy tính làm nguồn dữ liệu ứng dụng trong các hệ thống khai phá dữ liệu để đưa ra các dự báo cĩ tính chiến lược trong tương lai. Với cách tiếp cận dựa trên những lý thuyết đã cĩ về cơ sở dữ liệu mờ về ngơn ngữ biểu diễn dữ liệu. Luận văn đã trình bày cách biểu diễn dữ liệu mờ đựa trên cấu trúc định lượng ngữ nghĩa của ĐSGT và ngơn ngữ XML.

Nội dung cơ bản của luận văn gồm: tập trung nghiên cứu về cơ sở lỹ thuyết về ĐSGT, cách thức mờ hĩa đữ liệu dựa trên lý thuyết của ĐSGT, cách thức biểu diễn CSDL đã mờ hịa bằng ĐSGT và bằng ngơn ngữ XML. Trên cơ sở đĩ, luận văn đã ứng dụng vào bài tốn “Quản lý thơng tin nhân sự” và thực hiện một số thao tác khai phá dữ liệu.

Trong quá trình xây dựng hệ thống vẫn cịn tồn tại một số vấn đề cần phải được phát triển: Xây dựng thuật tốn xấp xỉ dữ liệu để cĩ thể thực hiện với những câu truy vấn SQL phức tạp, cần đưa ra các thuật tốn để thực hiện truy vấn CSDL nhanh hơn.

Với phương pháp này, bước đầu chúng tơi đã cài đặt dữ liệu mờ dựa trên lý thuyết về đại số gia tử, cho phép mờ hĩa cơ sở dữ liệu đã cĩ, thu thập thơng tin, cập nhật thơng tin và thực hiện một số tính tốn, cũng như truy vấn mờ trên cơ sở dữ liệu đĩ.

Trong quá trình thực hiện khố luận, tơi đã cố gắng tập trung tìm hiểu và tham khảo các tài liệu liên quan. Tuy nhiên, với thời gian và trình độ cĩ hạn nên khơng tránh khỏi những hạn chế và thiếu sĩt. Tơi rất mong được sự nhận xét và gĩp ý của các thầy cơ giáo và bạn bè, đồng nghiệp và những người cùng quan tâm để hồn thiện hơn các kết quả nghiên cứu của mình.

Cuối cùng, một lần nữa tơi xin chân thành bày tỏ lịng biết hơn sâu sắc đến thầy giáo hướng dẫn PGS.TS. Đồn Văn Ban, các thầy giáo, cơ giáo Viện Cơng nghệ thơng tin, Đại học Cơng nghệ Thơng tin và Truyền Thơng – Đại học Thái Nguyên, trường Đại học Khoa học - Đại học Thái Nguyên và các đồng nghiệp đã giúp đỡ tơi hồn thành luận văn này.

TÀI LIỆU THAM KHẢO

[1]. N.C. Ho (2003), “Quantifying Hedge Algebras and Interpolation Methods in Approximate Reasoning”, Proc. of the 5th Inter. Conf. on Fuzzy Information Processing, tr. 105-112.

[2]. N.C. Ho, W. Wechler (1990), “Hedge algebras:An algebraic approach to structure of sets of linguistic truth values”, Fuzzy Set and Systems, 35, tr. 281-293. [3]. N.C. Ho, W. Wechler (1992), “Extended Hedge algebras and their application to fuzzy logic”, Fuzzy Set and Systems, 52, tr. 259-281.

[4]. N.C. Ho, H.V.Nam (2002), “An algebraic approach to linguistic hedge in Zadeh’s fuzzy logic”, Fuzzy Set and Systems, 129, tr. 229-254.

[5]. Z. M. MA and LI YAN (2008), A Literature Overview of Fuzzy Database Models”, Journal Of Information Science And Engineering, 24, tr. 189-202.

[6]. Hồ Thuần, Hồ Cẩm Hà, An approach to extending the relational database model for handing incomplete information and data dependencies, Tạp trí Tin học và Điều khi n học 17 (3) (2001) 41-47.

[7]. E. Petry and P. Bosc (1996), Fuzzy Databases Principles and Applications, Kluwer Academic Publishers.

[8]. Nguyễn Cát Hồ, Nguyễn Cơng Hào, Một cách tiếp cận đ xấp xỉ dữ liệu

trong cơ sở dữ liệu mờ, Tạp chí Tin học và Điều khiển học, T.23, S.2 (2007), 109-

120.

[9]. H. Thuan, T. T. Thanh (2001), “On the Functional Dependencies and Multivalued Dependencies in Fuzzy relational database”, Tạp chí Tin học và Điều khi n học, 17 (2), tr. 13-19.

[10]. H. Thuan, T. T. Thanh (2002), “Fuzzy Functional Dependencies with Linguistic Quantifiers”, Tạp chí Tin học và Điều khi n học, 18 (2), tr. 97-108.

[11]. Kraft D. H., Petry F. E. (2002), “Fuzzy information Systems: managing uncertainly in databases and information retrieval systems”, Tạp chí Tin học và Điều khi n học, 18 (3), tr. 237-252.

[12]. N. C. Hồ, T. T. Sơn, T. Đ. Khang, L. X. Việt, Fuzziness Measure (2002), “Quantified Semantic Mapping And Interpolative Method of Approximate Reasoning in Medical Expert Systems”, Tạp chí Tin học và Điều khi n học, 18 (3), tr. 237-252.

[13]. Nguyễn Cát Hồ, Lê Xuân Vinh, Nguyễn Cơng Hào (2009), “Thống nhất dữ liệu và xây dựng quan hệ tương tự trong cơ sở dữ liệu ngơn ngữ bằng đại số gia tử”,

Tạp chí Tin học và Điều khi n học, 25 (4), tr. 314-332.

[14]. Lê Văn Huy (2010), “Cơ sở dữ liệu mờ và ứng dụng”, Luận văn Thạc sĩ

khoa học Cơng nghệ Thơng tin, Đại học Sư phạm Hà Nội. (adsbygoogle = window.adsbygoogle || []).push({});

[15]. Nguyễn Thị Hồng Cẩm (2009), “Tích hợp các hệ thống cơ sở dữ liệu quan hệ và XML”, Luận văn Thạc sĩ khoa học, Đại học Sư phạm Hà Nội.

Một phần của tài liệu Biễu diễn dữ liệu mờ bằng ngôn ngữ XML và ứng dụng (Trang 63 - 75)