Cơ sở dữ liệu mờ và ứng dụng Phạm Vũ Hoàng Trường Đại học Công nghệ Luận văn ThS chuyên ngành: Công nghệ thông tin; Mã số: 1 01 10 Người hướng dẫn: PGS TS Hồ Thuần Năm bảo vệ: 2006 Abstract: Trình bày các khái niệm cơ bản. Giới thiệu tổng quan về các mô hình cơ sở dữ liệu mờ; Trình bày cách giải quyết các vấn đề khi mở rộng cơ sở dữ liệu quan hệ thành cơ sở dữ liệu mờ: vấn đề phụ thuộc hàm mờ, khóa mờ, các dạng chuẩn mờ, tách lượng đồ quan hệ mờ và dạng chuẩn mờ Boyce Codd, mở rộng cơ sở dữ liệu quan hệ thành cơ sở dữ liệu mờ dựa trên lý thuyết khả năng; Ứng dụng giải quyết mở rộng ngôn ngữ truy vấn dữ liệu truyền thống (SQL) thành ngôn ngữ truy vấn dữ liệu mờ (FSQL) và ứng dụng cách tiếp cận để giải quyết bài toán quản lý cửa hàng bán lẻ xăng dầu Keywords: Công nghệ thông tin, Cơ sở dữ liệu mờ Content MỞ ĐẦU Mô hình cơ sở dữ liệu quan hệ do Codd E.F đề xuất năm 1970 đã đạt được những kết quả hoàn chỉnh về lý thuyết và ứng dụng. Tuy nhiên mô hình này hạn chế trong việc biểu diễn thông tin không đầy đủ, không chắc chắn (gọi chung là dữ liệu mờ), loại dữ liệu này được con người sử dụng thường xuyên trong thực tế. Đã có nhiều cách tiếp cận và đề xuất mô hình cơ sở dữ liệu mờ, những kết quả lý thuyết đã được xây dựng trong mô hình quan hệ truyền thống cũng được kiểm chứng trên các mô hình mới với những mở rộng thích hợp. Do vậy việc tìm hiểu cơ sở dữ liệu mờ và ứng dụng vào giải quyết các bài toán thực tế là một nhu cầu cấp thiết trong thực tiễn. Một trong những cách xây dựng một cơ sở dữ liệu mờ là mở rộng cơ sở dữ liệu quan hệ kinh điển. Có thể mở rộng mô hình quan hệ để đáp ứng nhu cầu lưu trữ và khai thác dữ liệu mờ theo hai hướng, đó là: mở rộng ngữ nghĩa của dữ liệu để khai thác dữ liệu rõ với yếu tố mờ và mở rộng miền trị thuộc tính để biểu diễn được dữ liệu mờ. Hướng mở rộng ngữ nghĩa, dữ liệu vẫn được lưu trữ như mô hình quan hệ, dữ liệu tại các thuộc tính của các bộ vẫn là dữ liệu rõ nhưng cho phép khai thác dữ liệu với ngữ nghĩa rộng hơn (có yếu tố mờ). Cách tiếp cận này sử dụng sử dụng lý thuyết tập mờ để mở rộng bằng cách thêm thuộc tính độ thuộc cho mỗi bộ trong quan hệ vào quan hệ. Ví dụ ta có thể truy xuất một cơ sở dữ liệu nguồn lực của một doanh nghiệp với một câu hỏi như sau: Liệt kê những người trẻ tuổi trong công ty. Thế nào là trẻ tuổi?, ta sẽ phải xây dựng cơ sở logic cho việc xử lý ngữ nghĩa mở rộng của dữ liệu như thế này và lý thuyết tập mờ và logic mờ là cơ sở để thực hiện. Hướng mở rộng ngữ nghĩa có thể vẫn sử dụng các hệ quản trị cơ sở dữ liệu quan hệ sẵn có trong việc lưu trữ dữ liệu, còn những mở rộng cho việc xử lý dữ liệu được xây dựng thành các gói riêng, cài đặt thêm, nhúng vào hệ quản trị đó. Tuy nhiên cách mở rộng này chưa cho phép lưu trữ dữ liệu mờ nên hạn chế nhiều đến khả năng quản lý dữ liệu thực tế. Hướng mở rộng miền trị thuộc tính là cách mở rộng tổng quát hơn, phản ánh đúng bản chất của vấn đề, nó cho phép bổ sung thêm các cú pháp trong biểu diễn dữ liệu nhằm biểu diễn được dữ liệu mờ. Với cách mở rộng này, ngoài việc đưa vào hệ thống ký hiệu còn phải xây dựng được cơ sở logic cho việc lập luận trên các ký hiệu để xử lý, khai thác được dữ liệu. Theo hướng này, để mở rộng cơ sở dữ liệu kinh điển thành cơ sở dữ liệu mờ có hai cách tiếp cận tiêu biểu là mở rộng bằng cách sử dụng quan hệ tương tự và mở rộng theo lý thuyết khả năng. Ở Việt Nam, việc nghiên cứu về cơ sở dữ liệu mờ lần đầu tiên được PGS.TS. Hồ Thuần và PGS.TS. Lê Tiến Vương quan tâm nghiên cứu từ những năm 1985. Các tác giả đã đề xuất một cách mở rộng mô hình quan hệ bằng cách mở rộng miền trị thuộc tính, xem mỗi miền trị thuộc tính là một biến ngôn ngữ. Một số kết quả của mô hình quan hệ cũng được mở rộng trên mô hình này. Năm 1996, Trương Đức Hùng tiếp tục phát triển mô hình này. Năm 2002, Hồ Cẩm Hà đã mở rộng mô hình cơ sở dữ liệu mờ bằng cách sử dụng quan hệ tương tự và phát triển một số kết quả cho mô hình này. Năm 2005, Trần Thiên Thành đã mở rộng mô hình cơ sở dữ liệu mờ dựa trên lý thuyết khả năng, đưa ra được khái niệm phụ thuộc hàm với lượng từ ngôn ngữ, xây dựng được công thức đánh giá độ tin cậy của các dạng luật tổng kết dữ liệu. Những nghiên cứu về cơ sở dữ liệu mờ đang tiếp tục và ngày càng phát triển mạnh mẽ trên thế giới cũng như ở trong nước. Với mong muốn tìm hiểu về một hướng phát triển và ứng dụng nó vào thực tiễn, luận văn đề ra nhiệm vụ như sau: 1. Cách tiếp cận để mở rộng Cơ sở dữ liệu kinh điển thành cơ sở dữ liệu mờ được chọn để nghiên cứu và ứng dụng vào một bài toán cụ thể là cách tiếp cận dựa trên lý thuyết khả năng (Mô hình dựa trên lý thuyết khả năng). 2. Nghiên cứu xem trên mô hình này, cách thức xử lý thông tin không chắc chắn, mở rộng các phép toán, mở rộng ngôn ngữ truy vấn dữ liệu rõ (SQL) thành ngôn ngữ truy vấn dữ liệu mờ (FSQL). 3. Ứng dụng mô hình này vào một bài toán cụ thể. Luận văn gồm phần mở đầu, 4 chương, kết luận và tài liệu tham khảo. Chương 1 trình bày các khái niệm cơ bản. Giới thiệu tổng quan về các mô hình cơ sở dữ liệu mờ. Chương 2 trình bày cách giải quyết các vấn đề khi mở rộng cơ sở dữ liệu quan hệ thành cơ sở dữ liệu mờ: vấn đề phụ thuộc hàm mờ, khóa mờ, các dạng chuẩn mờ, tách lượng đồ quan hệ mờ và dạng chuẩn mờ Boyce Codd. Chương 3 đi sâu về cách tiếp cận mở rộng cơ sở dữ liệu quan hệ thành cơ sở dữ liệu mờ theo lý thuyết khả năng. Các cách thức xử lý thông tin không chắc chắn, mở rộng các phép toán đại số quan hệ trên mô hình mới. Chương 4 ứng dụng một hướng giải quyết mở rộng ngôn ngữ truy vấn dữ liệu truyền thống (SQL) thành ngôn ngữ truy vấn dữ liệu mờ (FSQL) và ứng dụng cách tiếp cận đã trình bày trong chương 3 để giải quyết bài toán quản lý cửa hàng bán lẻ xăng dầu. References Tiếng Việt [1]. Trần Thiên Thành (2002), Phân tách lược đồ cơ sở dữ liệu quan hệ mờ, Trường Đại học sư phạm Quy Nhơn. [2]. Hồ Thuần, Trần Thiên Thành (2001), “Phụ thuộc hàm và phụ thuộc đa trị trong cơ sở dữ liệu quan hệ mờ”, Tạp chí Tin học và điều khiển học, 2001, tập 17 số 2, tr. 13 – 20. [3]. Đỗ Trung Tuấn (1998), Cơ sở dữ liệu, Nhà xuất bản Giáo dục, Hà nội [4]. Nguyễn Anh Vũ (2006), Vấn đề chuẩn hóa và tách lược đồ quan hệ trong cơ sở dữ liệu mờ, Luận văn Thạc sỹ khoa học, Đại học Bách khoa Hà Nội, Hà Nội. [5]. Lê Tiến Vương (1996), Nhập môn cơ sở dữ liệu quan hệ, Nhà xuất bản khoa học và kỹ thuật, Hà Nội. Tiếng Anh [6]. Frederick E. Petry , “Fuzzy databases Principles and Applications”, Tulane University-USA, Kluwer Academic Publisher , Boston, 31-179, (1996). [7]. Ramez Elmasri, Shamkant B. Navathe (2000), Fundamentals of databases systems, Replika Press Pvt. Ltd., India. [8]. Shenoi and A.Melton, “Proximity Relation in Fuzzy Relation Databases”, Int, Jour, Fuzzy Sets and Systems, 31, 287-296, (1989). [9]. Sozat M.I and Yazici A., “A complete axiomatization for fuzzy functional and multivalued dependencies in fuzzy database relations”, Elsevier North- Holland, Inc., Amsterdam, The Netherlands, The Netherlands, 161-181, (2001). [10]. Jose Galindo, Angelica Urrutia, Mario Piattini, Fuzzy Databases: Modeling, Design and Implementation. Eds. Idea Group Publishing Hershey, USA, 24-28, 51-54, 147-152, 154-165, (2006) [11]. Zongming Ma, Fuzzy Database Modeling with XML. Springer, 112-116, (2005) [12]. FSQL (Fuzzy SQL) A Fuzzy Query Language, http://www.lcc.uma.es/~ppgg/FSQL.html . niệm cơ bản. Giới thiệu tổng quan về các mô hình cơ sở dữ liệu mờ; Trình bày cách giải quyết các vấn đề khi mở rộng cơ sở dữ liệu quan hệ thành cơ sở dữ liệu mờ: vấn đề phụ thuộc hàm mờ, khóa mờ, . chuẩn mờ, tách lượng đồ quan hệ mờ và dạng chuẩn mờ Boyce Codd, mở rộng cơ sở dữ liệu quan hệ thành cơ sở dữ liệu mờ dựa trên lý thuyết khả năng; Ứng dụng giải quyết mở rộng ngôn ngữ truy vấn dữ. cơ bản. Giới thiệu tổng quan về các mô hình cơ sở dữ liệu mờ. Chương 2 trình bày cách giải quyết các vấn đề khi mở rộng cơ sở dữ liệu quan hệ thành cơ sở dữ liệu mờ: vấn đề phụ thuộc hàm mờ,