Đại Học Quốc Gia Thành Phố Hồ Chí Minh Trường Đại Học Bách Khoa TRẦN ĐỨC TÙNG THIẾT KẾ VÀ HIỆN THỰC KHO DỮ LIỆU ĐA PHIÊN BẢN Chuyên ngành: Khoa học máy tính LUẬN VĂN THẠC SĨ TP HỒ CHÍ MINH, tháng năm 2010 Luận văn thạc sỹ CƠNG TRÌNH ĐƯỢC HỒN THÀNH TẠI TRƯỜNG ĐẠI HỌC BÁCH KHOA ĐẠI HỌC QUỐC GIA TP HỒ CHÍ MINH Cán hướng dẫn khoa học : PGS TS Dương Tuấn Anh TS Võ Thị Ngọc Châu Cán chấm nhận xét : Cán chấm nhận xét : Luận văn thạc sĩ bảo vệ Trường Đại học Bách Khoa, ĐHQG Tp HCM ngày tháng năm 2010 Thành phần Hội đồng đánh giá luận văn thạc sĩ gồm: Xác nhận Chủ tịch Hội đồng đánh giá LV Bộ môn quản lý chuyên ngành sau luận văn sửa chữa (nếu có) Chủ tịch Hội đồng đánh giá LV 07/2010 Bộ môn quản lý chuyên ngành i Luận văn thạc sỹ ĐẠI HỌC QUỐC GIA TP HCM CỘNG HOÀ XÃ HỘI CHỦ NGHIÃ VIỆT NAM TRƯỜNG ĐẠI HỌC BÁCH KHOA Độc Lập - Tự Do - Hạnh Phúc -oOo Tp HCM, ngày tháng năm 2010 NHIỆM VỤ LUẬN VĂN THẠC SĨ Họ tên học viên : Trần Đức Tùng Giới tính : Nam / Nữ - Ngày, tháng, năm sinh :20/01/1979 Nơi sinh : Bình Định MSHV: 00708740 -Chuyên ngành : Khoa học Máy tính Khoá : 2008 1- TÊN ĐỀ TÀI : THIẾT KẾ VÀ HIỆN THỰC KHO DỮ LIỆU ĐA PHIÊN BẢN 2- NHIỆM VỤ LUẬN VĂN : - Tìm hiểu lý thuyết kho liệu cách tiếp cận/giải pháp thiết kế thực kho liệu - Tìm hiểu lý thuyết kho liệu đa phiên - Tìm hiểu vấn đề thiết kế kho liệu đa phiên - Đề xuất giải pháp thiết kế kho liệu đa phiên - Xây dựng chương trình hỗ trợ thiết kế thực kho liệu đa phiên - Phát triển ứng dụng minh họa 3- NGÀY GIAO NHIỆM VỤ : -4- NGÀY HOÀN THÀNH NHIỆM VỤ : 02/07/2010 -5- HỌ VÀ TÊN CÁN BỘ HƯỚNG DẪN : PGS.TS Dương Tuấn Anh -Nội dung đề cương Luận văn thạc sĩ Hội Đồng Chuyên Ngành thông qua CÁN BỘ HƯỚNG DẪN (Họ tên chữ ký) PGS TS Dương Tuấn Anh 07/2010 CHỦ NHIỆM BỘ MÔN QUẢN LÝ CHUYÊN NGÀNH (Họ tên chữ ký) TS Đinh Đức Anh Vũ ii Luận văn thạc sỹ LỜI CAM ĐOAN Tôi cam đoan rằng, ngoại trừ kết tham khảo từ cơng trình khác ghi rõ luận văn, cơng việc trình bày luận văn tơi thực chưa có phần nội dung luận văn nộp để lấy cấp trường trường khác Ngày 02 tháng 07 năm 2010 Trần Đức Tùng 07/2010 iii Luận văn thạc sỹ LỜI CẢM ƠN Tôi xin gởi lời cảm ơn chân thành sâu sắc đến PGS TS Dương Tuấn Anh, TS Võ Thị Ngọc Châu tận tình hướng dẫn, định hướng từ cách đặt vấn đề, phương pháp nghiên cứu khoa học đến công việc cụ thể luận văn Xin chân thành cảm ơn tất quý Thầy Cô Khoa Khoa học Kỹ Thuật Máy Tính tận tình truyền đạt kiến thức q báu cho tơi suốt q trình học tập Tơi xin cảm ơn gia đình, bạn bè động viên tạo điều kiện tốt để tơi hồn thành luận văn 07/2010 iv Luận văn thạc sỹ TĨM TẮT Kho liệu tích hợp liệu từ nguồn liệu khác Các nguồn liệu thường xuyên thay đổi cấu trúc liệu Những thay đổi lan truyền đến kho liệu, dẫn đến q trình tiến hố kho liệu Kho liệu đa phiên giải pháp xử lý thay đổi mặt cấu trúc liệu kho liệu Kho liệu đa phiên bao gồm tập phiên bản, phiên bao gồm lược đồ liệu Phiên lược đồ mô tả cấu trúc kho liệu khoảng thời gian định ngữ cảnh mô định Phiên liệu thể liệu mô tả phiên lược đồ tương ứng Đề tài đề xuất giải pháp thiết kế thực kho liệu đa phiên bản, nhằm đơn giản hoá trình xây dựng kho liệu đa phiên Đối với giải pháp thiết kế, mơ hình ý niệm phương pháp thiết kế ý niệm dựa mơ hình hướng đối tượng, ngôn ngữ UML đề xuất Trong mơ hình này, lược đồ lớp sử dụng để nắm bắt phần tĩnh (phần vốn có từ sở liệu nói chung kho liệu nói riêng) lược đồ trạng thái thái sử dụng để nắm bắt phần động (phần tiến hóa tạo nên phiên bản) Đối với giải pháp thực, hệ thống xây dựng để xử lý thông tin có thiết kế tạo phiên kho liệu tương ứng Ngoài ra, hệ thống cịn có chức quản lý phiên kho liệu, quản lý liệu phiên quản lý q trình tiến hố phiên 07/2010 v Luận văn thạc sỹ MỤC LỤC Chương Phát biểu vấn đề 1.1 Giới thiệu 1.2 Kho liệu đa phiên 1.2.1 Định nghĩa 1.2.2 Các loại phiên kho liệu 1.2.3 Các ràng buộc phiên 1.3 Động đề tài 1.4 Mục tiêu đề tài 1.5 Phạm vi đề tài 1.6 Hướng giải vấn đề đề tài 1.7 Cấu trúc luận văn Chương Những cơng trình liên quan 10 2.1 Tổng quan kho liệu 10 2.1.1 Khái niệm 10 2.1.2 Kiến trúc kho liệu 10 2.1.3 Mơ hình hóa liệu cho kho liệu 14 2.1.4 Phương pháp luận thiết kế 17 2.1.5 Mơ hình ý niệm cho việc thiết kế kho liệu 19 2.1.6 Siêu liệu kho liệu 24 2.1.7 Xử lý phân tích trực tuyến 25 2.2 Tổng quan tiến hóa lược đồ cho sở liệu 27 2.3 Tổng quan tiến hóa lược đồ cho kho liệu 28 2.4 Xử lý tiến hóa lược đồ kho liệu 28 2.5 Mơ hình luận lý 29 2.6 Quản lý siêu liệu 30 2.7 Ngôn ngữ truy vấn kho liệu đa phiên 31 Chương Thiết kế kho liệu đa phiên 32 3.1 Thiết kế ý niệm kho liệu đa phiên 32 3.1.1 Lược đồ lớp kho liệu đa phiên 33 3.1.2 Lược đồ tiến hoá kho liệu đa phiên 36 3.1.3 Các tác vụ sử dụng cho tiến hoá lược đồ kho liệu 37 3.1.4 Đánh giá giải pháp thiết kế ý niệm cho kho liệu đa phiên 43 07/2010 vi Luận văn thạc sỹ 3.1.5 Công cụ Rational Rose 43 3.2 Thiết kế luận lý cho kho liệu đa phiên 47 3.3 Quá trình chuyển đổi từ thiết kế ý niệm sang thiết kế luận lý 47 Chương Hiện thực kho liệu đa phiên 49 4.1 Ứng dụng minh họa 49 4.2 Quản lý siêu liệu kho liệu đa phiên 50 4.3 Mơ hình liệu luận lý 53 4.4 Người sử dụng 53 4.5 Mô tả hệ thống 54 4.6 Hỗ trợ MS SQL SERVER cho việc xây dựng kho liệu 55 4.7 Hiện thực kho liệu đa phiên cho ứng dụng Amadeus Entertainment 55 4.7.1 Thiết kế ý niệm 56 4.7.2 Giao diện chương trình 60 Chương Kết luận 65 5.1 Tổng kết 65 5.2 Đóng góp 65 5.3 Hướng phát triển đề tài 65 Phụ lục A: Hướng dẫn cài đặt chương trình (hệ thống) 71 Phụ lục B: Bảng đối chiếu thuật ngữ Anh – Việt 72 07/2010 vii Luận văn thạc sỹ DANH MỤC HÌNH Hình 1.1 Các thành phần kho liệu [2] Hình 1.2 Kho liệu đa phiên [25] Hình 1.3 Minh họa phiên lược đồ [25] Hình 1.4 Đồ thị dẫn xuất phiên [25] Hình 2.1 Kiến trúc kho liệu hai mức [3] 11 Hình 2.2 Kiến trúc kho liệu data mart độc lập [3] 11 Hình 2.3 Data mart phụ thuộc kho liệu giao tác [3] 12 Hình 2.4 Kiến trúc data mart luận lý kho liệu thời gian thực [3] 13 Hình 2.5 Kiến trúc liệu ba lớp kho liệu [3] 13 Hình 2.6 Lược đồ thực thể quan hệ [4] 14 Hình 2.7 Bảng kiện bán hàng [2] 15 Hình 2.8 Bảng chiều sản phẩm [2] 15 Hình 2.9 Sự kết hợp bảng kiện chiều [2] 16 Hình 2.10 Lược đồ ứng dụng bán hàng [4] 16 Hình 2.11 Mơ hình đa 16 Hình 2.12 Lược đồ tuyết ứng dụng bán hàng [4] 17 Hình 2.13 Phương pháp từ xuống [4] 18 Hình 2.14 Phương pháp lên [4] 19 Hình 2.15 Kí hiệu kiện [5] 19 Hình 2.16 Kí hiệu thực thể [5] 19 Hình 2.17 Mối quan hệ many-to-many [5] 20 Hình 2.18 Các mối quan hệ khác [5] 20 Hình 2.19 Mối quan hệ phân cấp chiều [5] 21 Hình 2.20 Các thuộc tính thực thể, kiện [5] 21 Hình 2.21 Lược đồ starER ứng dụng cho vay chấp [5] 22 Hình 2.22 Ba mức thiết kế lược đồ liệu đa chiều [6] 23 Hình 2.23 Xây dựng star package [6] 23 Hình 2.24 Xây dựng fact package, dimension package [6] 23 Hình 2.25 Chi tiết lớp bên fact/dimension package [6] 24 Hình 2.26 Các stereotype định nghĩa [6] 24 Hình 2.27 Lược đồ siêu liệu kho liệu đa phiên [25] 30 Hình 3.1 Thiết kế ý niệm kho liệu đa phiên 32 Hình 3.2 Các stereotype icon sử dụng lược đồ lớp 33 Hình 3.3 Lược đồ lớp kho liệu đa phiên 33 Hình 3.4 Các phiên kho liệu (mức 1) 34 Hình 3.5 Các star package phiên RV1 (a) RV2 (b) (mức 2) 34 Hình 3.6 Chi tiết Product Sales Schema phiên RV1 (mức 3) 35 Hình 3.7 Chi tiết Product Sales Schema phiên RV2 (mức 3) 35 Hình 3.8 Các stereotype icon đề xuất sử dụng lược đồ trạng thái 36 Hình 3.9 Mơ hình tiến hố kho liệu 36 Hình 3.10 Lược đồ tiến hố từ phiên RV1 sang phiên RV2 42 07/2010 viii Luận văn thạc sỹ Hình 3.11 Giao diện Rational Rose: lược đồ lớp (mức 1) 46 Hình 3.12 Giao diện Rational Rose: lược đồ trạng thái 47 Hình 4.1 Kiến trúc hệ thống kho liệu Amadeus Entertainment [63] 49 Hình 4.2 Siêu liệu kho liệu đa phiên 50 Hình 4.3 Quy trình tạo phiên kho liệu 54 Hình 4.4 Các mơ-đun hệ thống 54 Hình 4.5 Các phiên kho liệu Amadeus Entertainment 56 Hình 4.6 Các lược đồ phiên RV1 (a), RV2 (b), AV2.1(c) 56 Hình 4.7 Chi tiết lược đồ Product Sales Schema phiên RV1 57 Hình 4.8 Chi tiết lược đồ Campaign Result Schema phiên RV1 57 Hình 4.9 Chi tiết lược đồ Product Sales Schema phiên RV2 58 Hình 4.10 Chi tiết lược đồ Campaign Result Schema phiên RV2 58 Hình 4.11 Chi tiết lược đồ Product Sales Schema phiên AV2.1 59 Hình 4.12 Chi tiết lược đồ Campaign Result Schema phiên AV2.1 59 Hình 4.13 Lược đồ tiến hố kho liệu đa phiên 60 Hình 4.14 Form đăng nhập vào hệ thống 60 Hình 4.15 Form hệ thống 61 Hình 4.16 Form thêm phiên 61 Hình 4.17 Form nạp liệu vào bảng kiện/ bảng chiều 62 Hình 4.18 Form thay đổi thuộc tính phiên 62 Hình 4.19 Form phân tích liệu 63 Hình 4.20 Form truy vấn liệu 63 Hình 4.21 Kết thực câu truy vấn phiên RV1, RV2, AV2.1 64 07/2010 ix Luận văn thạc sỹ 4.7.1.2 Lược đồ tiến hoá kho liệu đa phiên Hình 4.13 Lược đồ tiến hố kho liệu đa phiên Phiên RV1 hợp lệ thời khoảng [01/01/2006 – 12/31/2006], RV2 hợp lệ thời khoảng [01/01/2007 – 12/31/2007], AV2.1 hợp lệ thời khoảng [06/01/2007 – 12/31/2007] 4.7.2 Giao diện chương trình • Đăng nhập vào hệ thống Hình 4.14 Form đăng nhập vào hệ thống 07/2010 60 Luận văn thạc sỹ • Nếu đăng nhập thành cơng, giao diện hệ thống hiển thị sau: Hình 4.15 Form hệ thống • Click vào biểu tượng “New Version”, cho phép người dùng tạo phiên Hình 4.16 Form thêm phiên 07/2010 61 Luận văn thạc sỹ • Click chuột vào biểu tượng “Load data”, cho phép người sử dụng nạp liệu vào bảng kiện bảng chiều phiên Hình 4.17 Form nạp liệu vào bảng kiện/ bảng chiều • Click chuột vào nút “Properties”, người sử dụng thay đổi thuộc tính phiên Hình 4.18 Form thay đổi thuộc tính phiên 07/2010 62 Luận văn thạc sỹ • Click chuột vào biểu tượng “OLAP”/nút “OLAP”, người sử dụng thực việc phân tích liệu phiên Hình 4.19 Form phân tích liệu • Click chuột vào biểu tượng “New Query”/nút “Query”, người sử dụng thực việc truy vấn liệu phiên Hình 4.20 Form truy vấn liệu 07/2010 63 Luận văn thạc sỹ • Click chuột nút “Execute”, ta kết thực câu truy vấn: (a) (b) (c) Hình 4.21 Kết thực câu truy vấn phiên RV1, RV2, AV2.1 07/2010 64 Luận văn thạc sỹ Chương Kết luận Chương tổng kết lại kết đạt đề tài, đóng góp đề tài hướng phát triển 5.1 Tổng kết Trong trình xây dựng hồn thiện đề tài, thực cơng việc sau: • Xây dựng phần tử mơ hình, phần tử sử dụng thiết kế ý niệm cho kho liệu đa phiên Các phần tử mơ hình xây dựng là: Version Package, Star Package, Fact Class, Dimension Class, Real Version, Alternative Version, Temporary Version • Xây dựng toán tử tiến hoá, toán tử sử dụng để mơ hình thao tác gây nên q trình tiến hố lược đồ phiên kho liệu • Xây dựng mơ hình ý niệm phương pháp thiết kế ý niệm cho kho liệu đa phiên Mơ hình ý niệm đề xuất dựa mơ hình hướng đối tượng, ngơn ngữ UML Mơ hình nắm bắt phần tĩnh phần động kho liệu Phần tĩnh phần vốn có kho liệu, cịn phần động phần tiến hố phiên kho liệu • Xây dựng hệ thống quản lý phiên (thêm mới, cập nhật xoá phiên ), nạp liệu từ hệ thống giao tác bên vào phiên bản, truy vấn phân tích liệu phiên 5.2 Đóng góp • Xây dựng mơ hình ý niệm phương pháp thiết kế ý niệm cho kho liệu đa phiên • Xây dựng nguyên tắc chuyển đổi từ lược đồ ý niệm sang lược đồ luận lý kho liệu đa phiên • Xây dựng hệ thống giúp đơn giản hoá trình thiết kế thực kho liệu đa phiên 5.3 Hướng phát triển đề tài Đề tài đề xuất giải pháp thiết kế thực kho liệu đa phiên Tuy nhiên, số vấn đề khác cần nghiên cứu thêm để hồn thiện hơn: • Tự động phát thay đổi mặt lược đồ nguồn liệu, tạo phiên kho liệu tương ứng 07/2010 65 Luận văn thạc sỹ • Tạo phiên kho liệu để thích nghi với thay đổi mặt liệu nguồn liệu • Phát triển cơng cụ back-end (ETL) front-end (báo cáo, khai phá, …) cho kho liệu đa phiên 07/2010 66 Luận văn thạc sỹ Thư mục tham khảo [1] W H Inmon Building the Data Warehouse, Fourth Edition Wiley Publishing, 2005 [2] Ralph Kimball, Margy Ross, Warren Thornthwaite The Data Warehouse Toolkit Second Edition: The Complete Guide to Dimensional Modeling Wiley Publishing, 2002 [3] Jeffrey A Hoffer, Mary B Prescott, Fred R McAdden Modern database management, eighth edition Pearson Education, 2007 [4] Chuck Ballard, Dirk Herreman, Don Schau, Rhonda Bell,Eunsaeng Kim, Ann Valencic Data Modeling Techniques for Data Warehousing, 2/1998 IBM Corporation, International technical support organization [5] Nectaria Tryfona, Frank Busborg, and Jens G Borch Christiansen starER: A Conceptual Model for Data Warehouse Design Proceedings of the 2nd ACM international workshop on Data warehousing and OLAP, p 3-8, 1999 [6] Sergio Luján-Mora, Juan Trujillo, Il-Yeol Song Extending the UML for Multidimensional Data Modeling Lecture Notes in Computer Science, Springer Berlin / Heidelberg, p 265-276, 2002 [7] Mathurin Body, Maryvonne Miquel, Yvan Bédard Anne, Tchounikine A multidimensional and multiversion structure for OLAP applications, Proceedings of the 5th ACM international workshop on Data Warehousing and OLAP, p 1-6, 2002 [8] Bogdan Czejdo, Kenneth Messa, Tadeusz Morzy, Mikolaj Morzy, Janusz Czejdo Data Warehouses with Dynamically Changing Schemas and Data Sources, 2003 [9] Bartosz Bębel, Johann Eder, Christian Koncilia Creation and management of versions in multiversion warehouse Proceedings of the 2004 ACM symposium on Applied computing, p 717-723, 2004 [10] Tadeusz Morzy, Robert Wrembel On querying versions of multiversion data warehouse Proceedings of the 7th ACM international workshop on Data warehousing and OLAP, p 92-101, 2004 [11] Hao Fan, Alexandra Poulovassillis Schema evolution in data warehousing environments - A schema transformation-based, 2004 [12] Anne-Muriel Arigon, Anne Tchounikine, Maryvonne Miquel A multiversion model for multimedia data warehouse Proceedings of the 6th international workshop on Multimedia data mining: mining integrated media and complex data, p 7-13, 2005 [13] Renata de Matos Galante, Clesio Saraiva dos Santos,Nina Edelweiss, Alvaro Freitas Moreira Temporal and versioning model for schema evolution in objectoriented databases Data & Knowledge Engineering 53 (2005) 99–128 [14] Shahzad, J.A Nasir and M.A.Pasha CEV-DW - Creation and Evolution of Versions in Data Warehouse Asian Journal of Information Technology (10): 910917, 2005 [15] Franck Ravat, Olivier Teste, Gilles Zurfluh A Multiversion-Based Multidimensional Model Lecture Notes in Computer Science, Springer Berlin / Heidelberg, p 65-74, 2006 [16] Jarernsri L Mitrpanont Somchart Fugkeaw Design and development of a multiversion OLAP application Proceedings of the 2006 ACM symposium on Applied computing, p 493-497, 2006 07/2010 67 Luận văn thạc sỹ [17] Robert Wrembel and Tadeusz Morzy Managing and Querying Versions of Multiversion Data Warehouse Lecture Notes in Computer Science, Springer Berlin / Heidelberg, p 1121-1124, 2006 [18] Matteo Golfarelli, Jens Lechtenborger, Stefano Rizzi, Gottfried Vossen Schema versioning in data warehouses - enabling cross-version querying via schema augmentation Data & Knowledge Engineering, Volume 59, Issue 2, November 2006, Pages 435-459, Including: Sixth ACM International Workshop on Web Information and Data Management [19] B Bebel, Z Królikowski, R Wrembel Formal approach to modelling a multiversion data warehouse Bulletin Of The Polish Academy Of Sciences, Technical Sciences, Vol 54, No 1, 2006 [20] Cécile Favre , Fadila Bentayeb And Omar Boussaid A Knowledge-driven Data Warehouse Model for Analysis Evolution ERIC Laboratory, University of Lyon 2, France, 2006 [21] Dung Nguyen Xuan, Ladjel Bellatreche, and Guy Pierra A Versioning Management Model for Ontology-Based Data Warehouses Lecture Notes in Computer Science, Springer Berlin / Heidelberg, p 195-206, 2006 [22] Bartosz Bebel, Zbyszko Królikowski, and Robert Wrembel Managing Evolution of Data Warehouses by Means of Nested Transactions Lecture Notes in Computer Science, Springer Berlin / Heidelberg, p 119-128, 2006 [23] J.A Nasis, M.K Shahzad and M.A Pasha Transparent Querying Multipleversions of Data Warehouse Information Technology Journal (2): 250-259, 2006 [24] Stefano Rizzi and Matteo Golfarelli What Time Is It in the Data Warehouse Lecture Notes in Computer Science, Springer Berlin / Heidelberg, p 134-144, 2006 [25] Robert Wrembel, Bartosz Bębel Metadata Management in a Multiversion Data Warehouse Lecture Notes in Computer Science, Springer Berlin / Heidelberg, p 118157, 2007 [26] Anne-Muriel Arigon, Maryvonne Miquel, Anne Tchounikine Multimedia data warehouses - a multiversion model and a medical application Journal: Multimedia Tools and Applications, Springer Netherlands, p 91-108, 2007 [27] Darja Solodovnikova Data warehouse evolution framework Department of Computer Science, University of Latvia, 2007 [28] George Papastefanatos, Panos Vassiliadis, Alkis Simitsis, and Yannis Vassiliou What-if analysis for data warehouse evolution Lecture Notes in Computer Science, Springer Berlin / Heidelberg, p 23-33, 2007 [29] Stefano Rizzi, Matteo Golfarelli X-time - Schema versioning and cross-version querying in data warehouses DEIS, University of Bologna, 2007 [30] Cecile Favre, Fadila Bentayeb, Omar Boussaid Dimension Hierarchies Updates In Data Warehouses ERIC Laboratory, University of Lyon, av Pierre MendesFrance, 69676 Bron Cedex, France 2007 [31] M.Khurram.Shahzad, J.A.Nasir, M.A.Pasha Intermingling evolutionary and versioning approach for data warehouse by Versioning-Algebra Innovations and Advanced Techniques in Computer and Information Sciences and Engineering, Springer Netherlands, p 295-300, 2007 07/2010 68 Luận văn thạc sỹ [32] M Khurram Shahzad Version Manager - A step towards Synthetic-WarehouseBuilder extension Innovations and Advanced Techniques in Computer and Information Sciences and Engineering, Springer Netherlands, p 289-293, 2007 [33] E Malinowski, E Zimanyi A conceptual model for temporal data warehouses and its transformation to the ER and the object-relational models Data & Knowledge Engineering, Volume 64, Issue 1, January 2008, Pages 101-133 [34] Emad Saddad, Ali Hamed El-Bastawessy Multiversion Queries in Multidimensional Structures INFOS2008, March 27-29, 2008 Cairo-Egypt, © 2008 Faculty of Computers & Information-Cairo University [35] Anna Rozeva Dimension Updates and Hierarchy Maintenance in OLAP Database International Scientific Conference Computer Science, 2008 [36] George Papastefanatos, Panos Vassiliadis, Alkis Simitsis, Yannis Vassiliou Design Metrics for Data Warehouse Evolution Lecture Notes in Computer Science, Springer Berlin / Heidelberg, p 440-454, 2008 [37] Emad Saddad, Ali Hamed El-Bastawessy Multiversion Queries in Multidimensional Structures INFOS2008, March 27-29, 2008 Cairo-Egypt [38] Khaled Jouini, Geneviève Jomier Design and Analysis of Index Structures in MultiVersion Data Warehouses Annals of Information Systems, Springer US, p 121, 2009 [39] Cecile Favre, Fadila Bentayeb, Omar Boussaid A survey of data warehouse model evolution Handbook of Research on Innovations in Database Technologies and Applications:Current and Future Trends, Copyright © 2009 by IGI Global [40] Elzbieta Malinowski Requirement specification and conceptual modeling for data warehouses Handbook of Research on Innovations in Database Technologies and Applications:Current and Future Trends, Copyright © 2009 by IGI Global [41] Edgard Benitez-Guerrero, Ericka-Janet Rechy-Ramirez Schema evolution models and languages for multidimensional data warehouses Handbook of Research on Innovations in Database Technologies and Applications:Current and Future Trends, Copyright © 2009 by IGI Global [42] Darja Solodovnikova The formal model for multiversion data warehouse evolution Databases and Information Systems V, H.M Haav and A.Kalja, ISO Press, 2009 [43] Darja Solodovnikova Metadata to Support Data Warehouse Evolution Information Systems Development, Springer US, p 627-635, 2009 [44] George Papastefanatos, Panos Vassiliadis, Alkis Simitsis, Timos Sellis, Yannis Vassiliou Rule-based Management of Schema Changes at ETL sources, 2009 [45] Khurram Shahzad From conventional to multiversion data warehouse - practical issues Evolving Application Domains of Data Warehousing and Mining: Trends and Solutions, Copyright © 2009 by IGI Global [46] Kimball, R The Data Warehouse Toolkit John Wiley, 1996 [47] G.V.Post Database Management System Mcgraw-Hill, 2001 [48] Grady Booch, Ivar Jacobson, James Rumbaugh The Unified Modeling Language for Object-Oriented Development Documentation Set Version 0.91Addendum UML Update, Copyright ©1996 Rational Software Corporation [49] Marakas Chapter 10:The Data Warehouse Decision Support Systems, 2nd Edition © 2003, Prentice-Hall 07/2010 69 Luận văn thạc sỹ [50] Codd E.F., Codd S.B., and Salley C.T (1993) "Providing OLAP (On-line Analytical Processing) to User-Analysts: An IT Mandate" Codd & Date, Inc http://www.fpm.com/refer/codd.html Retrieved 2008-03-05 [51] Deepak Pareek (2007) Business Intelligence for Telecommunications CRC Press pp 294 pp ISBN 0849387922 http://books.google.com/books?id=MUOE1Cp9OEC Retrieved 2008-03-18 [52] "OLAP Council White Paper" (PDF) OLAP Council 1997 http://www.symcorp.com/downloads/OLAP_CouncilWhitePaper.pdf Retrieved 200803-18 [53] Hari Mailvaganam (2007) "Introduction to OLAP - Slice, Dice and Drill!" Data Warehousing Review http://www.dwreview.com/OLAP/Introduction_OLAP.html Retrieved 2008-03-18 [54] Nigel Pendse (2006-06-27) "OLAP architectures" OLAP Report http://www.olapreport.com/Architectures.htm Retrieved 2008-03-17 [55] Jose Andany, Michel Leonard, Carole Palisser Management Of Schema Evolution In Database Proceedings of the 17th International Conference on Very Large Data Bases Barcelona, September, 1991 [56] A Gupta and I.S Mumick (eds.), Materialized Views: Techniques, Implementations, and Applications, The MIT Press, ISBN 0-262-57122-6, 1999 [57] P Chamoni and S Stock, “Temporal structures in data warehousing”, Proc DaWaK99, 353–358 (1999) [58] M Blaschka, C Sapia, and G Hofling, “On schema evolution in multidimensional databases”, Proc DaWak99 Conference, 153–164 (1999) [59] C.E Kaas, T.B Pedersen, and B.D Rasmussen, “Schema evolution for stars and snowflakes”, Proc Intern Conf on Enterprise Information Systems (ICEIS2004), 425–433 (2004) [60] J Eder and C Koncilia, “Changes of dimension data in temporal data warehouses”, Proc DaWaK Conference, 284–293 (2001) [61] J Eder, C Koncilia, and T Morzy, “The COMET metamodel for temporal data warehouses”, Proc 14th CAISE02 Conference, 83–99 (2002) [62] A.O Mendelzon and A.A Vaisman, “Temporal queries in OLAP”, Proc VLDB Conference, 242–253 (2000) [63] Vincent Rainardi Building a Data Warehouse With Examples in SQL Server Appress, 2008 [64] T.W.Olle, M.Daya, E.D.Falkenberg, B.Yormark, and R.W.Taylor The conceptual schema controversy In Proceedings of the 1978 ACM SIGMOD International Conference on Management of Data, pages 88-88, Austin, USA, May 31 - June 1978.ACM [65] Inmon, W.H Tech Topic: What is a Data Warehouse? Prism Solutions Volume 1995 07/2010 70 Luận văn thạc sỹ Phụ lục A: Hướng dẫn cài đặt chương trình (hệ thống) u cầu: • NET Framework • MS SQL Server 2008 Cài đặt: • Chạy tập tin setup.exe để tiến hành trình cài đặt • Attach sở liệu: MetaData, AmadeusDW, Jade, Jupiter, WebTower vào máy chủ SQL Server 07/2010 71 Luận văn thạc sỹ Phụ lục B: Bảng đối chiếu thuật ngữ Anh – Việt Thuật ngữ tiếng Anh Data warehouse Multiversion data warehouse Operational source system Data staging area Data presentation area data access tool Extract-Transform-Load Ad hoc query tool Temporal extensions Schema evolution Temporal versioning Fact table Dimension table Level table Hierarchy Attribute Schema Version Conceptual model Logical model Physical model Conceptual design Logical design Physical design Metadata MultiVersion query language Real-world domain Unified Modeling Language tagged value Constraint Subject-oriented Integrated Time-variant Historical data Current data Non-volatile 07/2010 Thuật ngữ tiếng Việt Kho liệu Kho liệu đa phiên Hệ thống giao tác Vùng đệm liệu Vùng hiển thị liệu Công cụ truy xuất liệu Trích rút – biến đổi – nạp liệu Công cụ truy vấn liệu đột xuất Gắn nhãn thời gian Tiến hoá lược đồ Phiên thời gian Bảng kiện Bảng chiều Bảng mức Hệ thống phân cấp Thuộc tính Lược đồ Phiên Mơ hình ý niệm Mơ hình luận lý Mơ hình vật lý Thiết kế ý niệm Thiết kế luận lý Thiết kế vật lý Siêu liệu Ngôn ngữ truy vấn đa phiên Miền giới thực Ngôn ngữ mô hình thống Giá trị đính kèm Ràng buộc Hướng chủ thể Tích hợp Biến đổi theo thời gian Dữ liệu lịch sử Dữ liệu hành Không thay đổi/biến đổi Viết tắt DW MVDW ETL UML 72 Luận văn thạc sỹ Read-only Enterprise data warehouse Factory information corporate Consolidated data Near-real-time Operational data Reconciled data Derived data Entity relationship model Multidimensional model Subject-oriented Integrated Time-variant Non-volatile Entity Entity relationship Measure Grain Hierarchical relationship Star model Multistar model Snowflake model OnLine Analytical Processing Open Database Connectivity Object-oriented Object Constraint Language Multidimensional Online Analytical Processing Relational Online Analytical Processing Hybrid Online Analytical Processing Customize Real version Alternative version Version derivation relationships Version derivation graph 07/2010 Chỉ đọc Kho liệu doanh nghiệp Xí nghiệp thơng tin doanh nghiệp Dữ liệu hợp Gần thời gian thực Dữ liệu giao tác Dữ liệu hịa giải Dữ liệu dẫn xuất Mơ hình thực thể quan hệ Mơ hình đa chiều Hướng chủ thể Tích hợp Biến đổi theo thời gian Khơng thay đổi/biến đổi Thực thể Mối quan hệ thực thể Đơn vị đo Độ mịn Mối quan hệ phân cấp Mơ hình Mơ hình đa Mơ hình bơng tuyết Xử lý phân tích trực tuyến CIF ERM ER OLAP Kết nối sở liệu mở ODBC Hướng đối tượng Ngôn ngữ đặc tả ràng buộc OCL Xử lý phân tích trực tuyến đa chiều Xử lý phân tích trực tuyến quan hệ Xử lý phân tích trực tuyến lai Tuỳ chỉnh Phiên thực Phiên thay Quan hệ dẫn xuất phiên Đồ thị dẫn xuất phiên MOLAP ROLAP HOLAP 73 Luận văn thạc sỹ LÝ LỊCH TRÍCH NGANG Họ tên: TRẦN ĐỨC TÙNG Ngày sinh: 20/01/1979 Nơi sinh: Bình Định Địa liên lạc: 116 Ngơ Mây – Quy Nhơn – Bình Định QUÁ TRÌNH ĐÀO TẠO: Thời gian Trường đào tạo 1997 – 2002 Đại học Bách Khoa, Đại học Quốc gia Tp HCM 2008 – 2010 Đại học Bách Khoa, Đại học Quốc gia Tp HCM Chuyên ngành Khoa học Máy tính Trình độ đào tạo Kỹ sư Khoa học Máy tính Thạc sĩ Q TRÌNH CƠNG TÁC: Thời gian 2002 – 07/2010 Đơn vị công tác Trung Tâm Hỗ Trợ Phát Triển CNTT Bình Định Vị trí cơng tác Chuyên viên 74 ... thuyết kho liệu cách tiếp cận/giải pháp thiết kế thực kho liệu - Tìm hiểu lý thuyết kho liệu đa phiên - Tìm hiểu vấn đề thiết kế kho liệu đa phiên - Đề xuất giải pháp thiết kế kho liệu đa phiên. .. quan đến kho liệu đa phiên • Chương (Thiết kế kho liệu đa phiên bản) trình bày giải pháp thiết kế kho liệu đa phiên 07/2010 Luận văn thạc sỹ • Chương (Hiện thực kho liệu đa phiên bản) trình bày... hố phiên Lược đồ sở liệu giao tác Thiết kế ý niệm kho liệu đa phiên Yê u cầu người sử dụng Lược đồ ý niệm kho liệu đa phiên Hình 3.1 Thiết kế ý niệm kho liệu đa phiên Chúng ta mơ hình hóa kho liệu