Biễu diễn dữ liệu mờ bằng ngôn ngữ XML và ứng dụng

75 255 0
Biễu diễn dữ liệu mờ bằng ngôn ngữ XML và ứng dụng

Đang tải... (xem toàn văn)

Tài liệu hạn chế xem trước, để xem đầy đủ mời bạn chọn Tải xuống

Thông tin tài liệu

ĐẠI HỌC THÁI NGUN TRƯỜNG ĐẠI HỌC CƠNG NGHỆ THƠNG TIN & TRUYỀN THƠNG NGUYỄN ĐÌNH HUY BIỂU DIỄN DỮ LIỆU MỜ BẰNG NGƠN NGỮ XML VÀ ỨNG DỤNG LUẬN VĂN THẠC SĨ KHOA HỌC MÁY TÍNH Thái Ngun - Năm 2013 Số hóa bởi Trung tâm Học liệu http://lrc.tnu.edu.vn/ ĐẠI HỌC THÁI NGUN TRƯỜNG ĐẠI HỌC CƠNG NGHỆ THƠNG TIN VÀ TRUYỀN THƠNG NGUYỄN ĐÌNH HUY BIỂU DIỄN DỮ LIỆU MỜ BẰNG NGƠN NGỮ XML VÀ ỨNG DỤNG Chun ngành: KHOA HỌC MÁY TÍNH Mã số : 60.48.01 LUẬN VĂN THẠC SĨ KHOA HỌC MÁY TÍNH Người hướng dẫn khoa học: PGS.TS Đồn Văn Ban Thái Ngun - Năm 2013 Số hóa bởi Trung tâm Học liệu http://lrc.tnu.edu.vn/ i LỜI CAM ĐOAN  .     Thái Ngun, ngày tháng 2013 Tác giả Nguyễn Đình Huy Số hóa bởi Trung tâm Học liệu http://lrc.tnu.edu.vn/ ii MỤC LỤC Trang LỜI CAM ĐOAN i MỤC LỤC ii CÁC KÝ HIỆU VÀ CHỮ VIẾT TẮT iv DANH MỤC BẢNG v DANH MỤC HÌNH vi MỞ ĐẦU 1 CHƯƠNG 1. CÁC MƠ HÌNH BIỂU DIỄN CƠ SỞ DỮ LIỆU MỜ 4 1.1. CƠ SỞ DỮ LIỆU MỜ 4 1.1.1. Một số khái niệm 4 1.1.2. Các mơ hình cơ sở dữ liệu mờ 5 1.2. ĐẠI SỐ GIA TỬ 8 1.2.1. Một số khái niệm 8 1.2.2. Các tính chất của độ đo tính mờ trong ĐSGT 11 1.3. MƠ HÌNH BIỂU DIỄN CSDL MỜ THEO CÁCH TIẾP CẬN ĐSGT 12 1.3.1. Ngữ nghĩa dữ liệu dựa trên việc định lượng ĐSGT 13 1.3.2. Xấp xỉ dữ liệu mờ theo cách tiếp cận ĐSGT 16 1.3.3. Ngữ nghĩa dữ liệu dựa trên lân cận tơpơ của ĐSGT 23 1.4. NGƠN NGỮ ĐÁNH DẤU MỞ RỘNG XML 26 1.4.1. Giới thiệu về ngơn ngữ XML 26 1.4.2. Cấu trúc tài liệu XML 28 Số hóa bởi Trung tâm Học liệu http://lrc.tnu.edu.vn/ iii 1.4.3. Các thành phần cơ bản trong tài liệu XML 29 1.4.4. Định nghĩa kiểu tư liệu (DTD) 30 1.5. TỔNG KẾT CHƯƠNG 32 CHƯƠNG 2. BIỂU DIỄN DỮ LIỆU MỜ BẰNG NGƠN NGỮ XML 33 2.1. MƠ HÌNH TỔNG QT 33 2.2. ĐỀ XUẤT GIẢI PHÁP 34 2.2.1. Mờ hóa cơ sở dữ liệu bằng đại số gia tử 34 2.2.2. Biểu diễn dữ liệu mờ hóa bằng XML 36 2.2.3. Truy vấn trên dữ liệu mờ 40 2.3. TỔNG KẾT CHƯƠNG 54 CHƯƠNG 3. XÂY DỰNG ỨNG DỤNG 55 3.1. MƠ TẢ ỨNG DỤNG 55 3.2. CƠNG CỤ LỰA CHỌN 55 3.3. PHÁT TRIỂN CÁC MODUL 55 3.3.1. Modul biểu diễn dữ liệu mờ 55 3.3.2. Modul biểu diễn truy vấn mờ 56 3.4. GIAO DIỆN CHƯƠNG TRÌNH 57 3.5. THỬ NGHIỆM VÀ ĐÁNH GIÁ 60 3.6. TỔNG KẾT CHƯƠNG 64 KẾT LUẬN 65 Số hóa bởi Trung tâm Học liệu http://lrc.tnu.edu.vn/ iv CÁC KÝ HIỆU VÀ CHỮ VIẾT TẮT Tiếng Anh Từ viết tắt Tên đầy đủ Diễn giải DTD Doucument Type Definition Định nghĩa kiểu tài liệu HTML Hypertext markup language Ngơn ngữ đánh dấu siêu văn bản HTTP HyperText Transfer Protocol Giao thức truyền tải siêu văn bản XML eXtensible Markup Language Ngơn ngữ đánh dấu mở rộng SQL Structured Query Language Ngơn ngữ truy vấn có cấu trúc Tiếng Việt CSDL Cơ sở dữ liệu ĐSGT Đại số gia tử Số hóa bởi Trung tâm Học liệu http://lrc.tnu.edu.vn/ v DANH MỤC BẢNG Trang Bảng 1: Quan hệ Lý lịch 38 Bảng 2: Quan hệ Lương Tuổi 52 Bảng 3: Kết quả tìm kiếm của ví dụ (a) 54 Bảng 4: Kết quả tìm kiếm của ví dụ (b) 54 Số hóa bởi Trung tâm Học liệu http://lrc.tnu.edu.vn/ vi DANH MỤC HÌNH Trang Hình 2: Mơ hình tng qt ca h thng 33 Hình 3: Cu trúc mt c s d liu m c m hóa 56 Hình 4: Cu trúc file lu tr câu truy vn m bng XML 57 Hình 5: Giao din chính ca chng trình 58 Hình 6: Giao din cha chn các trng thuc tính m 59 Hình 7: Giao din chp nht tp gia t 59 Hình 8: C s d liu ngun 60 Hình 9: nh min giá tr ca thuc tính Lng 61 Hình 10: nh tp phn t sinh ca thuc tính Lng 61 Hình 11: nh tp gia t 62 Hình 12: Cu trúc ca trng thuc tính m 62 Số hóa bởi Trung tâm Học liệu http://lrc.tnu.edu.vn/ 1 MỞ ĐẦU 1. Lý do chọn đề tài Trong những năm gần đây, việc xây dựng và phát triển các hệ cơ sở dữ liệu (CSDL) mờ phục vụ cho việc thu thập, xử lý và khai thác những dữ liệu với thơng tin khơng chắc chắn, khơng đầy đủ - là những dạng dữ liệu mà con người vẫn thường xun xử lý trong thực tế - được nhiều nhà nghiên cứu quan tâm. Nhiều mơ hình CSDL mờ mở rộng từ mơ hình CSDL quan hệ cổ điển do Codd đề xuất dựa trên cơ sở lý thuyết tập mờ của Zadeh được phát triển, tiêu biểu là mơ hình tập con mờ, mơ hình dựa trên quan hệ tương tự, mơ hình dựa trên lý thuyết khả năng, Song song với việc phát triển các mơ hình, nhiều cơng trình nghiên cứu việc xử lý và khai thác dữ liệu mờ từ các mơ hình CSDL mờ cũng được phát triển, tiêu biểu là các nghiên cứu về các phụ thuộc dữ liệu mờ, các ngơn ngữ hỏi mềm dẻo, khai phá tri thức từ dữ liệu, Những nghiên cứu về CSDL mờ đã và đang được tiếp tục phát triển trong nước và trên thế giới. Trong luận văn này, chúng tơi tập trung nghiên cứu cách biểu diễn dữ liệu mờ bằng ngơn ngữ XML. Mơ hình CSDL mờ được biểu diễn là mơ hình dựa trên lý thuyết của đại số gia tử (ĐSGT). Mục đích nghiên cứu của đề tài là ứng dụng lý thuyết về mơ hình cơ sở dữ liệu mờ, sử dụng ngơn ngữ XML để biểu diễn nhiều dạng dữ liệu mờ khác nhau, cho phép mờ hóa CSDL sẵn có nhằm thu thập, lưu trữ và thực hiện các truy vấn trên cơ sở dữ liệu mờ ứng dụng trong việc khai phá dữ liệu nhằm đưa ra các dự báo trong tương lai. 2. Mục tiêu của đề tài Mục đích nghiên cứu của đề tài là ứng dụng lý thuyết về mơ hình cơ sở dữ liệu mờ, sử dụng ngơn ngữ XML để biểu diễn nhiều dạng dữ liệu mờ khác nhau, cho phép mờ hóa cơ sở dữ liệu sẵn có nhằm thu thập, lưu trữ và thực hiện các truy vấn trên cơ sở dữ liệu mờ ứng dụng trong việc khai phá dữ liệu nhằm đưa ra các dự báo trong tương lai. Số hóa bởi Trung tâm Học liệu http://lrc.tnu.edu.vn/ 2 3. Đối tượng nghiên cứu - Tìm hiểu về mơ hình CSDL mờ. - Tìm hiểu về ngơn ngữ XML. - Tìm hiểu về lý thuyết đại số gia tử - Cách biểu diễn dữ liệu mờ bằng ngơn ngữ XML dựa trên lý thuyết về ĐSGT. 4. Phương pháp nghiên cứu Đề tài thực hiện dựa trên nhiều phương pháp nghiên cứu khác nhau: khảo sát tình hình thực tế về các vấn đề về sử dụng những thơng tin khơng đầy đủ, khơng chắc chắn trong thực tế, vấn đề về lưu trữ và xử lý những thơng tin đó, tìm hiểu về cách xử lý thơng tin nhân sự, nghiên cứu lý thuyết về cơ sở dữ liệu mờ dựa trên lý thuyết về đại số gia tử và ngơn ngữ XML. Từ đó đề xuất giải pháp xây dựng hệ thống  ứng dụng mơ hình cơ sở dữ liệu mờ theo hướng tiếp cận đại số gia tử và sử dụng ngơn ngữ XML để biểu diễn. 5. Ý nghĩa khoa học và thực tiễn của đề tài - Xây dựng chức năng cho phép thu thập, lưu trữ những thơng tin khơng chắc chắn, khơng đầy đủ của hệ thống quản lý nhân viên. - Cho phép lưu trữ, xử lý và thực hiện truy vấn trên những thơng tin khơng chắc chắn, khơng đầy đủ, góp phần quan trọng trong lĩnh vực khai thác thơng tin đặc biệt là những thơng tin mờ. - Kết quả của đề tài còn tiếp tục phát triển cho các tính tốn và khai thác tri thức từ cơ sở dữ liệu mờ. 6. Bố cục của luận văn Cấu trúc của luận văn gồm 3 chương và phần kết luận Chương 1: Trình bày các khái niệm, tính chất về cơ sở dữ liệu mờ, ngơn ngữ XML và Đại số gia tử. Số hóa bởi Trung tâm Học liệu http://lrc.tnu.edu.vn/ [...]... diễn cơ sở dữ liệu mờ theo cách tiếp cận đại số gia tử và ngơn ngữ XML 1.1 CƠ SỞ DỮ LIỆU MỜ 1.1.1 Một số khái niệm 1.1.1.1 Cơ sở dữ liệu quan hệ mờ Mơ hình cơ sở dữ liệu quan hệ (rõ) sử dụng khái niệm lý thuyết tập hợp để biểu diễn và liên kết dữ liệu Trong mơ hình cổ điển này, mỗi giá trị trong quan hệ là giá trị ngun tố Ngoại trừ giá trị null, mỗi thuộc tính phải có một giá trị chính xác và khơng thể... phần và thuộc tính được kết hợp trong tài liệu Phương thức kiểm tra tài liệu này thường được sử dụng trong giao tiếp giữa ứng dụng - ứng dụng, đảm bảo dữ liệu trao đổi hợp lệ tránh dẫn tới những ảnh hưởng của dữ liệu khơng hợp lệ trên tồn hệ thống Tài liệu XML có thể được viết bằng các trình soạn thảo thơng thường như: Notepad,…hay các trình soạn thảo chun dụng của XML như: XML Notepad, XML Writer, XML. .. hiện mờ hóa dữ liệu đã có, thu thập, lưu trữ cơ sở dữ liệu mờ để làm dữ liệu nguồn cho các hệ thống khai phá dữ liệu để đưa ra các dự báo trong tương lai và đừa các truy vấn mờ trên CSDL đã được mờ hóa Kết luận và kiến nghị: Những nội dung đã đạt được trong luận văn và định hướng phát triển Số hóa bởi Trung tâm Học liệu http://lrc.tnu.edu.vn/ 4 CHƯƠNG 1 CÁC MƠ HÌNH BIỂU DIỄN CƠ SỞ DỮ LIỆU MỜ Trong những... dữ liệu bằng XML XML đưa ra một định dạng chuẩn cho cấu trúc của dữ liệu hoặc thơng tin bằng việc tự định nghĩa dạng của tài liệu Bằng cách này, dữ liệu được lưu trữ bằng XML sẽ độc lập với việc xử lý Vì vậy, XML ra đời sẽ đáp ứng được u cầu ngày càng cao của các lập trình trong vấn đề trao đổi và xử lý thơng tin [15] Một tài liệu XML có hai phần: Document prolog: Chứa thơng tin tài liệu XML (metadata)... quyết và đưa ra các mơ hình cơ sở dữ liệu mờ dựa trên lý thuyết về đại số gia tử đã được phân tích để giải quyết các u cầu của hệ thống, đồng thời trình bày phương pháp sử dụng ngơn ngữ XML để biểu diễn cơ sở dữ liệu mờ đó Chương 3: Ứng dụng các kết quả của chương hai để bổ sung thêm chức năng ứng dụng logic mờ trong hệ thống “Quản lý thơng tin học sinh, nhân viên” Chức năng này cho phép thực hiện mờ. .. điển trị ngơn ngữ và một miền giá hay là tập các phần tử của một ĐSGT Xem giá trị ngơn ngữ như là một phần tử của ĐSGT Để bảo đảm tính nhất qn trong xử lý ngữ nghĩa dữ liệu trên cơ sở thống nhất kiểu dữ liệu của thuộc tính mờ, mỗi thuộc tính mờ sẽ được gắn với một ánh xạ định lượng ngữ nghĩa ĐSGT Theo cách tiếp cận này giá trị ngơn ngữ là dữ liệu, khơng phải là nhãn của các tập mờ biểu diễn ngữ nghĩa của... Spy… 1.4.2.2 Cấu trúc của tài liệu XML Tài liệu XML chỉ chứa đựng dữ liệu và cách lưu trữ dữ liệu mà khơng hề đề cập tới cách thức trình bày dữ liệu Một tài liệu XML sẽ chứa những đặc tả về cấu trúc dữ liệu Mỗi cấu trúc gồm nhiều phần tử (element), mỗi thành phần được bắt đầu với một thẻ bắt đầu (Start – tag) và kết thúc với một thẻ kết thúc (End – tag) Giữa Start – tag và End – tag là nội dung của... chính xác và khơng thể có giá trị mờ hoặc khơng chắc chắn Tuy nhiên, theo một số phương pháp tiếp cận được đề xuất để mở rộng mơ hình cơ sở dữ liệu cổ điển sang cơ sở dữ liệu quan hệ mờ, mỗi giá trị trong quan hệ mờ có thể là một tập hợp có hơn 1 phần tử tương tự với nhau (theo một ngưỡng nào đó) Cơ sở dữ liệu quan hệ mờ là cơ cơ dữ liệu có thể lưu trữ, xử lý dữ liệu mờ và khơng chắc chắn [14] 1.1.1.2... Việc dùng lý thuyết mờ để mở rộng mơ hình cơ sở dữ liệu đã được nhiều nhà nghiên cứu quan tâm Kerre E.F và Chen G.Q đã cho Số hóa bởi Trung tâm Học liệu http://lrc.tnu.edu.vn/ 6 rằng có 5 cách tiếp cận trong việc biểu diễn dữ liệu tương ứng với việc làm mờ hóa các mơ hình cơ sở dữ liệu quan hệ để biểu diễn thơng tin khơng chính xác Đó là cách tiếp cận như sau: Mơ hình dựa trên quan hệ mờ (the fuzzy ralation-based... trên miền trị của thuộc tính mờ trong quan hệ của cơ sở dữ liệu mờ Việc đánh giá dữ liệu trên miền trị thuộc tính mờ của quan hệ trong cơ sở dữ liệu mờ theo cách tiếp cận đại số gia tử được xây dựng dựa trên phân hoạch tính mờ của các giá trị trong đại số gia tử (giá trị ngơn ngữ) Như vậy, nếu gọi Dom(Ai) là miền trị tương ứng với thuộc tính mờ Ai và xem như một đại số gia tử thì khi đó Dom(Ai) = Num(Ai) . tài là ứng dụng lý thuyết về mơ hình cơ sở dữ liệu mờ, sử dụng ngơn ngữ XML để biểu diễn nhiều dạng dữ liệu mờ khác nhau, cho phép mờ hóa cơ sở dữ liệu sẵn có nhằm thu thập, lưu trữ và thực. 34 2.2.1. Mờ hóa cơ sở dữ liệu bằng đại số gia tử 34 2.2.2. Biểu diễn dữ liệu mờ hóa bằng XML 36 2.2.3. Truy vấn trên dữ liệu mờ 40 2.3. TỔNG KẾT CHƯƠNG 54 CHƯƠNG 3. XÂY DỰNG ỨNG DỤNG 55 3.1 biểu diễn nhiều dạng dữ liệu mờ khác nhau, cho phép mờ hóa CSDL sẵn có nhằm thu thập, lưu trữ và thực hiện các truy vấn trên cơ sở dữ liệu mờ ứng dụng trong việc khai phá dữ liệu nhằm đưa ra các

Ngày đăng: 19/11/2014, 19:51

Từ khóa liên quan

Tài liệu cùng người dùng

Tài liệu liên quan