Đ Ạ I H Ọ C Q U Ố C G IA IIÀ NỘI KHOA CÔNG NGHỆ -oOo- — NGUYỄN THÊ QUYỂN KHAI THÁC D ữ LIỆU VÀ XỬ LÝ PHÂN TÍCH TRỨC TUYẾN 1AJẬN VÃN THẠC s ĩ KHOA HỌC Chuyên ngành: Công Nghệ Thông Tin Mã số: 010110 Người hướng dẫn khoa học: PGS TS Đoàn Vãn Ban _ — - 0/Y IU_)C - uoc HA NO' Ị TRUNGTẦMTHỎM( TiN niƯVỌỊ Nc V \ữ /M * _ _ _ \ Hà Nội - Năm 2002 MỌC LỤC ■ ■ Trang: Phần m ỏ đầu Chương 1: 01 HỆ TRỢ GIÚP QUYÊT ĐịhH Dựfl VÀO Dữ LIỆU 1.1 H ệ trợ giúp đ ị n h .0 1 Giới t h i ệ u 1 H ệ trợ giúp đ ị n h 1 P h â n loại h ệ trợ giúp q u yết đ ị n h H ệ trợ giúp đ ịn h dựa vào d ữ l i ệ u T iêp c ậ n KDL O L A P 2 T G Q D dựa vào d ữ liệu trê n c sở K D L & O L A P T iến trình T G Q Đ dựa vào d ữ liệu c h o toán cụ t h ể .10 Chương 2: KHO DỮ LIỆU - DflTfl WAREHOUSE 2.1 T h n h p h ầ n cấu th n h m ộ t K D L 13 1 Siêu d ữ liệu - M e ta d a t a 13 C ác n g u n d ữ l i ệ u 14 H ệ th ố n g x lý giao dịch trực tuyến - O L T P N hững đ ặc điểm h ệ th ố n g O L T P 15 C ác cô n g cụ thu th ậ p , làm ch u y ển đổi d ữ liệu n g u n 16 C sở d ữ liệu K D L 18 K h o d ữ liệu - D a ta w a re h o u s e .19 Đ ịn h n g h ĩ a 19 Đ ặc đ iểm d ữ liệu tro n g K D L .2 K ho d ữ liệu c h ủ đ ề - D a t a m a r t 21 S d ụ n g K D L 2 P h n g p h p xây d ự n g K D L T h iế t k ế c sở d ữ liệu ch o K D L G iản đ h ìn h s a o - S t a r G iản đ h ìn h tuyết rơi - S n o w f l a k e G iản đ kết h ợ p 4 N h ữ n g v ấn đề liên q u a n tới thiết k ế g iản đ h ìn h s a o 4 Đ n h s ô C hỉ thị m ứ c N hữ n g n h â n tố thiết k ế c ầ n p h ải c ân n h ắ c Q u ả n lý q u ả n trị K D L Chưởng 3: xđ LÝ PHÂN TÍCH TRựC TUYÊN \lè KHfil THÁC DỮ LIỆU Giới thiệu m ộ t s ố kỹ th u ật khai th ác d ữ l i ệ u 3 1 M ạng n e u r o n .3 3 Giải th u ật di tr u y ề n Tái t o T p lai Đ ột b i ế n .3 O L A P X 10 p h â n tích trực tuyến - O L A P Đ ịnh n ghĩa O L A P N guyên tắc O L A P .4 T iế p c ậ n đ a c h i ề u 3 S ự p h â n tích đa c h i ề u Kiến trúc khối O L A P Giới thiệu kiến trúc k h ố i Khối (C ube) C h iều (D im e n s io n ) C ác đ n vị đ o lường (M e a s u re ) 54 C c p h â n h o c h ( P a rtitio n ) C c p h n g p h p lưu trữ d ữ liệu (MOLAP, R O L A P , H O L A P ) 5 3 T h u ậ t to n s ố h ó a khu n g nhìn xử lý p h â n tích trực tuyến k h o d ữ l i ệ u M ột s ố khái n iệm c b ả n 3 1 C ác khối liệu co n (subcube) C âu hỏi (Q ueries) Chỉ số (Indexes) Q u a n hệ tính to án p h ụ t h u ộ c 3 T h u ật toán c h ọ n view i n d e x 3 Kết l u ậ n 6 Chương 4: THIẼT KÊ HỆ TRỢ GIÚP QUỴÊT ĐỊNH Dựơ VÀO DỮ LIỆU Giới thiệu hệ t h ố n g 1 Mục tiêu hệ t h ố n g T ổ chức hệ t h ố n g Cài đặi hệ t h ố n g .6 Chức n ăn g tạo lập C S D L đa c h i ề u 2 C hức n ăn g p h â n tích, hiển thị l i ệ u C hức n ăn g tạo thực Q u e r y C hư ng trình cài đ ặ t Ví dụ m inh h ọ a Phần kết luận Tài liêu tham khảo 79 82 - PHÂN MỞ Đ â u Đ ăt vấn đề Trong hoạt động sản xuất, kinh doanh ln cần có đáp ứng nhanh nhạy, tức thời thay đổi liên tục môi trường kinh doanh (khách hàng, cạnh tranh, qui luật kinh tế, luật lệ nhà nước, tình hình sản xuất, kinh doanh, tài doanh nghiệp, )• Vì nhà quán lý buộc phải thường xuyên lúc nhiều định dứng đắn (mà chúng ánh hưởng đáng xu hướng hoạt dộng cạng tranh doanh nghiệp) cách nhanh chỏng Do vấn để trợ giúp định trở nên cần thiết Người ta cần phải thu thập, tổng hựp phân tích liệu từ nhiều nguồn khác mội cách nhanh hiệu định nhanh chóng phù hợp Điều dẫn đến việc cẩn phát triển hệ thông tinh thông biết cách làm iliê để nít tía phân tích liệu cho người sử dụng Các nhà quản lý, điểu hành cần biết công việc diễn tổ chức mà cịn cần biết xảy ru sau dó, có nghĩa thơng tin mang tính phân tích hệ thơng dể hỗ trợ định Tuy nhiên việc xây dựng hệ thống vấp phải số hạn chế mặt kỹ thuật, đặc biệt kích thước dộ phức tạp môi trường ứngdụng lăng lên Những hệ thống thông tin xây dựng theo phương pháp truyền lliống khơng cịn đáp ứng u cầu người sử dụng nhà quản lý hệ thịng thơng tin Hiện nay, có nhiều phần mềm cung cấp cho người sử dụng khả truy vấn lập báo cáo thông tin, đặc biệt hệ quản trị CSDL quan hệ Tuy nhiên, CSDL quan hệ, với cấu trúc hai chiều (dòng cột), không thiết kế để cung cấp quan điểm đa chiểu liêu đầu vào phân tích phức tạp Sử dụng hệ thống này, gặp nhiều khó khăn bấl tiện việc tổ chức liệu đa chiều vào bảng hai chiểu, triển khai liệu phân tích với số lượng lớn, cơng cụ phân tích để tạo liệu định khơng mạnh, thuận tiện, linh hoạt, nhanh chóng, không dễ dàng để sử dụng nhà quản lý, người định P h n HÌO íìán - Như vậy, cần thiết phải xây ciựng hệ thống có khả lổ chức liệu đa chiểu có khả phân tích liệu linh hoại dể trả lời truy vấn da chiểu cách dễ dàng, nhanh chóng nhằm hỗ n ợ cho việc quyếl định nhà quản lý Mục tiêu luận văn Luận văn dề cập đến việc xây dựng hệ trợ giúp định dựa vào liệu, sử dụng phương pháp luận xử lý phân tích trực luyến (OLAP) Luận văn tập trung vào hai công việc nghiên cứu vấn đề tổ chức sở liệu đa chiều, phân tích hiển thị clữ liệu để irợ giúp định Hệ trợ giúp định theo tiếp cận này, có ihể giúp cho nhà qn lý thiết lập mơ hình OLAP cho ứng dụng cụ thể việc tổ chức sở liệu đa chiều, giúp cho họ dễ dàng uốn nắn hoạt dộng phân tích, tìm kiếm thơng tin theo khía cạnh khác dĩr liệu, nhằm Ihu Ihập tối đa họ cần hiểu rõ, để (ừ dó dược qui định tốt cách nhanh chóng Khơng giống với hệ trự giúp định truyền thống thường xây dựng với mục đích đưa giải pháp tối ưu cho toán cụ thể, phạm vi ứng dụng hẹp, hệ trợ giúp định dựa vào liệu hướng đến việc giúp người sử dụng khai thác dược tối da khả liềm ẩn khối lượng liệu lớn, nhằm thu thông tin tổng hợp đủ khía cạnh khác liệu, để từ định cách nhanh chóng Do đặc điểm này, phạm vi ứng dụng hệ trự giúp định dựa vào liệu rộng Nó sử dụng để trợ giúp định cho toán khác nhau, lĩnh vực khác B ô cục luận văn Luận văn bao gồm chương C hương 1: Chủ yếu giới thiệu vể hệ trự giúp quyếl định dựa vào liệu (hai thành phần chính: kho liệu (Data Waeihouse - KDL) OLAP) tiến trình trự giúp định dựa vào liệu r i u u i m o (lau - Chương 2: Trình bày lý thuyết chung mó hình KDL, phương pháp xây dựng thiết kế sở liệu cho KDL Chương 3: Giới thiệu sỏ kỹ thuật khai thác liệu, trình bày lý thuyết cư xử lý phân tích trực tuyến, khái niệm đặc trưng liếp cận đa chiểu Chương 4: Thiết kế cài dặt hệ thống, với hai thành phần chức tạo lập sở liệu đa chiều chức phân tích, hiển thị liệu r i i ầ n m dầu - CHƯƠNG Ị ; HỆ TRỢ GIÚP QGỴÊT ĐỊNH DỢ6 VÀO DỬ LIỆU 1.1 HỆ TRỢ GIÚP QUYẾT ĐỊNH 1 Giới thiệu Ngay từ năm 60 việc sử dụng phương tiện tin học để tổ chức khai thác CSDL phát triển Kể từ trở đi, lất nhiều CSDL dược tổ chức, phát triển khai thác qui mô khắp lĩnh vực hoạt động người xã hội Nhiều hệ quản trị CSDL mạnh với công cụ phong phú thuận tiện giúp cho người khai Ihác có hiệu nguồn tài nguyên liệu Mơ hình CSDL quan hệ ngơn ngữ vấn đáp chuẩn (SQL) có vai trị quan trọng việc tổ chức khai thác CSDL Giai đoạn đầu năm 60 thập kỷ kỹ thuậl Ihu thập liệu, tiếp dó thời kỳ kỹ thuật truy nhập liệu, với ứng dụng Hệ thông tin quản lý MIS Ị8 ], 121 ] tập trung xử lý liệu, thông tin Iheo ihủ tục có cấu uúc nhằm hỗ trợ điều khiển, dự báo giám sát công việc Và đáu thập kỷ 70, mội loại hình ứng dụng đời Hệ trợ giúp định DSS 113] nhằm mục đích hỗ trợ nhà quản lý cấp cao định điều hành Khái niệm DSS Scott Morton dưa dầu năm 70 với ihuật ngữ hệ thống hỗ trợ quản lý MSS [8 ], [21) Hệ thống xác định: “Hệ ihơìig dựa tương tác máy tính, giúp người định dùng liệu mơ hình để giải tốn khơng có cấu trúc - nhữns tốn mờ phức tap với lời giải khơng hoàn chỉnh” Theo Gorry Scott Morton (năm 1971), vấn đề xử lý phãn chia thành: có cấu trúc, nửa cấu trúc khơng có cấu trúc [21] Trong hệ thơng tin quản lý MIS dùng để giải loại toán thứ Cịn lớp tốn thứ hai thứ ba phạm vi giải DSS, hệ chuyên gia ES Hệ trợ giúp định hệ ứng dụng xây dựng máy tính nhằm giải tốn, vấn đề có cấu trúc Vui trị hệ trợ giúp định nhằm mục đích giúp nhà định giải vấn đề, l l ẹ tr ợ g iú p quvet (lịnli dựa vùi) dừ lie II - hoàn cảnh chưa dược dịnh nglũa rõ ràng, nhà định chưa biết rõ vấn đề giải pháp, liêu chuẩn đánh giá thành công lựa chọn Sự đời hệ trợ giúp định đánh dấu bước phát Iriển quan trọng lĩnh vực ứng dụng tin học quản lý diều hành cơng việc, kế từ khơng ngừng nghiên cứu phát triển lý thuyết thực tế Iiiến khai ứng dụng DSS tỏ có mạnh trội, cần thiết cho lãnh đạo quản lý khiến nhiều tổ chức quan tâm nghiên cứu đầu tư xây dựng phái triển H ệ trơ giúp đinh Hệ trợ giúp định ban dầu thô sơ, phát triển từ phần mềm bảng tính Hệ trợ giúp định sau sử dụng mơ hình tối ưu việc nghiên cứu hoạt động nghiệp vụ khoa học quản lý (OR/MS), sử dụng kỹ thuật qui hoạch tuyến tính Phân tích “What i f ’ dã trớ nèn dặc biệt phù hợp với mơ hình OR Sử dụng cách tưưng tác fron_ends, người làm định khám phá gợi ý tốt hưu phán đốn cảm tính việc định Hộ trợ giúp định trở nên tinh thơng sử dụng kỹ thuật trí luệ nhân tạo Những hệ thống xem nlnìng hệ thống dựa tri thức (Knovvledege-Based Systems) [15] Với mục đích làm dó dể giúp Mguời sử đụng thực phân lích nhằm đề xuất dược định cần ihiêì, cluing ta quan niệm bấi cú ioại hệ thơng tn thủ mơ hình tổ chức xử lý riêng biệt 11Ó, mà trợ giúp việc định, dều xem mội hệ trợ giúp định Các loại hệ trợ giúp định truyền thống sử dụng báng tính, tối ưu tốn học, phân tích sơ' hay mồ hình mơ vãn tiếp tục phát huy tác dụng việc giải nhiều vấn đé Tuy nhiên người làm công việc sử dụng tri thức doanh nghiệp ngày yêu cầu hệ thống phái biết nhiều hơn, phải làm dược nhiều hưn việc Huy xuất, tống hợp phân tích thông tin Họ lúc phụ thuộc nhiều hưn vào hệ thống để có ihể l i e t r iỉiÚỊ) qiiv (lịnh (lưa VIÌO d lieit - định nhanh chóng, với độ till cậy cao Đày xu hướng phái triển thống thơng tin nói chung hệ irợ giúp định nói riêng P hân loại cá c hệ trợ giú p đinh Hì nh 1-1 Phân loại hệ thông till quán lý Hệ xử lý tác vụ: mục đích hệ xử lý tác vụ giữ cho việc ghi nhận giao tác xác Hệ thống xây dựng để làm định đơn giản việc xác định liệu ghi nhận có hợp lệ hay không Hệ xử lý tác vụ làm công việc hợp lệ hoá trước ghi nhận giao tác để CSDL dưực Hệ t r ợ giúp định: bao gồm hệ thống dược thiết kế để trợ giúp nhà quản lý định Khác với hệ xử lý giao tác phục vụ cho hoạt động hàng ngày, hệ trợ giúp định phục vụ cho mục tiêu dài hạn cần đến vài ý kiến, phán đốn dóng góp từ chun gia Nlui cầu cần thiết thêm phán đoán người nhiều nến tốn đặt kliỏng có cấu trúc chặt chẽ, khiến cho hệ thống khó nấm bất lất sắc thái tình tạo định Hiện hệ trợ giúp định chia thành hai hướng Hướng đầu tiên, dựa vào mơ hình, tiếp tục theo xu hướng hệ trợ giúp định cũ Giá trị hệ thống chất lượng mơ hình I1Ĩ Khả phân tích dựa lý thuyết hay mơ hình mạnh, với giao diện tốt để làm cho mơ hình dễ sử dụng ỉ lẹ trọ ÍỊĨIÌỊỈ (linh (lựu vao tíìi liẹu 68 - Hệ thống cài đặt tập chung vào phần yếu khối chức quan trọng sau: (1) Xây dựng chức tạo lập CSDL đa chiều (Cubes) (2) Xây dựng chức phân tích, hiển thị liệu lên hình Dưới sơ đổ chi tiết hệ thống cài dật: Hình 4.2 Sơ dổ chi liết hộ ilìốiìg cài đặc Cài đặt hệ th ốn g C hức n ăn g tạ o lập CSDL đa chiều Là công cụ giúp tạo lập nên khối cấu trúc chiều, từ mô hình OLAP ứng dụng cụ thể Dữ liệu nguồn chứa bảng Fact T ao khối Chọn bảng Fact cho khối cần tạo Tạo đơn vị đo (measures): chọn cột (có kiểu liệu kiểu số) bảng Fact để làm đơn vị đo, thời gán cơng thức tính tốn cho đơn vị đo (sum, average, max, min, )• Tạo lập chiều liệu: chiều tương ứng với bảng (bảng chiều) sơ đồ hình mà bảng Fact bảng trung tâm Trong bảng chiểu Thiết ke hệ I n / g i ú p (lịnh (lựa rào (lù liệu 69 - chọn cột làm mức (level) chiều Chúng ta cần chọn mức cho đáp ứng việc tham chiếu “ roll up”, “drill clown” theo mức Xử lý khối T ao khối ả o Chức giúp ta tạo khối từ khối dã có cách sử dụng lại đơn vị đo chiều khối cũ mà không cẩn tốn thêm không gian nhớ Chọn khôi mà ta cẩn tạo khối ảo từ Chọn đơn vị cho khối ảo Chọn chiểu cho khối ảo Xử lý khối 2 C hức n ăn g phân tích hiển thi liệu Sau khối tạo, liệu khối phân tích qua thao tác xử lý khối Và sau người sử dụng tham khảo kết phân lích dàng cách thực thao tác “roll cách dẻ up”,“drill down” theo mức chiểu khối chọn Với chức ta có thể: cắt lát khối đa chiều (heo mức, chiểu tùy chọn; Khoan sâu xuống mức liệu chi tiết cần: Cuộn lên mức liệu tổng hợp (theo phân cấp chiểu) muốn Tạo linh hoạt tiện ích cho người sử dụng: dễ dàng mơ tả, thay dổi yêu cầu phân tích liệu C hức n ản g tạ o thực Q uery Microsoft SQL Server OLAP cung cấp trình ứng dụng mẫu này, MDX Sample Application phép thử nhiệm query (MDX) biểu diễn đa chiều dựa vào Server OLAP Với MDX chúng la tạo, thực thi query xem kết cách uyển chuyển C h n g trình cài đặt Hệ thống cài đặt thành chương trình có tên TGQD, viết cơng cụ lập trình VB (Visual Basic) Dưới giao diện chương trình: Th iế t ke hẹ trợ g i ú p (lịnlì (lựa vào (lừ liệu 70 - M àn h ìn h chính: 1* D ata-D riven Decision S u pport S y stem s Cubes Cube Editor MDXSample r * New Database DataSource New Cube * New Virtual Cube Browse Data Exit > * / * LTrợ Gỉúp Quyết Định Dưa Vào Dữ ♦ I L u Ỉ ê u • v tt - ♦ * < , V ( , I ( •V K‘ » ’ i ■ >w -m / « C ác m en u chính: C u b e Editor N ew D a ta b a s e E d it , D a ta S o u r c e 2, Process MDXSample New Cube New Virtual Cube Browse Data Exit M enu “C u b e s” - Lệnh New Database: Tạo Database để lưu, chứa khối - Lệnh DataSource: Tạo nguồn liệu cho khối Database - Lệnh New Cube (tạo khối): + Chọn bảng Fact cho khối Thiết k ế hệ trọ g i ú p quy ết (lịnh d ự a vào (lừ liệu / "v P *• Cubes V r r f ' iu ’ ' l ì % > 71 - *J •ã Create Cube Chọn bảng Fact từ nguồn liêu D an h s c h c c bảng: C ác CỘI liệu c ủ a b ln g chọn: liii! piomotion T én CỘI lĩĩĩl legion iese(ve_em ployee salary ESI s â les_ fact_ l 997 I U product_id m lime_id rrm S I cuỉlom er_id m p(omolion_id m stoie_id H stoie_sales i m stoie_cost HU unit sales ESI ED sa le s_ fa c t_ d e c _ 998 ỉĩĩĩỉ stole tim e_by_day W diehouse w a ie h o u se _ c la ss irm dm ED I ? o D ata S o u ic e m i (Hiển lh| d ữ liệu < Q uây lội I iá p > Ih o ỉt • Chọn bảng Fact nguồn liệu cửa sổ trái (chọn bảng tùy Ihuôc vào yêu cầu truy vấn) Ví dụ chọn bảng Sales_fact_1998 • Cửa sổ phải hiển thị cột (trường liệu) bảng Fact chọn dể tham khảo • Để kiểm tra liệu bảng Fact, kích vào nút • Muốn tạo tạo thêm nguồn liệu cho khơi, kích vào nút + Tạo đơn vị đo, gắn công thức lên đưn vị đo: XJ C r e a t e Cube Chọn cột cho đơn VỊ đo C ác cột d ữ liộu (kiểu sá) c ủ a b ẳ n g Fact: T ên Cột ITãl p[oduct_id ẼD tim e jd custom er_id SU piomotion_id m Kiểu liệu Integei Inlegei Inlegei Inleger Integer C ác đ n V| đ o c ủ a khái: □ >1 T ên đ n V| đ o unil_sales sloie_cosl 5toie_$dles Công thứ c Sum Max 1 Count >> T hiế t kê hệ trọ g i ú p (lịiili dựa vào d liệu JLl Ih o t 72 - • Chọn cột số bảng fact (Sales_facl_1998) cửa sổ trái để làm đơn vị đo nút lênh >, < Ị K iểu d liệu \~f s la te _ p r o v i >> Thiết ke hệ trơ g i ú p (Ịiiyet (linli (lựa vào iỉừ liệu Ị 202 202 202 Ih o t 73- Chọn cột bảng chiều (Customer) cửa sổ bên trái làm mức chiều nút lệnh >, , 26M, thời gian tạo xử lý khối là: 13s Màn hình kết quả: 12 J ^ C họn khố i 1=1 til X Q4 S Q L S o VOI F o o c J M a ii 0 » * £ > /• t: u f t o m t t r L o i A i> g e l AN O L A P _ E K a m p le l- j ÍH l * a lo * p iọ d u c i^ D im n tto n IM u a s u fe sL e v o l p r o d u c t p r o d u c t n a m I un«i_»ãu» Ĩ) A D J R o iy _ S unglasses A k i o n C ity M a p A K io n E y e g J a t* S c i» v M d itv t A m e u c a n B o e l B o lo g n a A m o n c a n C h tc k e o H o4 D o t A m oucan Colo Slaw A in o n e a n C o m o d B e e f A / n a tic a n Foo< L o n g H o i D A m e n c a n L o w F a( B o l o g n a A m c tic a n L o w C o ỉo S la A m o lie ATI P im « r» lo L o a l M in o u c a n h 'o t a i o S a la d A m * n c « n R o a t l o d C h ic k « r A m * f ế c * i S k c * d C h ic K « n A m e iic a n S lic e d H a m A m o u c a n S l i c o d Ĩ U ik o y Am®lie an T uikoy Hoi Oogi AmÍQO Lom Tiếp tục xoay khơi sales theo chiểu sản phẩm, chiều vùng (cố định giá trị Q4 chiều Thời gian, giá trị Los Angeles) có câu trả lời Hoặc thực truy vấn cách sử đụng MDX sau: o5:TMOX S am p le Application - m d xquery.m d K F ile E d it Q u e ry V iew =® = D [jg lg j ife if c M i j ^ JO J X] I H elp E>B; |O L A P _ E x a m p lo ^ I Q u e rie s ; I * s e le c t□ □ C H r M e a s u r e s ].[u n it_ s i s e le c t - { [ M e a s u r e s ] [ u n it _ s a le s ] ) - o n c o lu m n s , to p c o u n t ([ p r o d u c t].[p r o d u c t_ p r o d u c t_ n a m © ].m e m b e r s , 1^ M e a s u r e s ].[u n it_ s a le s ] ) o n ro w s r o m S a le s _d £ u b e : S y n ta x E x a m p le s I s a le s u n it s a le s G re a t E n g lis h M u ffin s 458 Thiết ke he trự g iú p (lịnh (hid vào (lữ lieu CD (A ll) 51C D A rra y (±1Cl D im e n s io n — Ị zI 78 - Như vậy, trường hợp khối Sales có, chúng la sỉr dụng MDX dể truy vấn cho kết lập lức Cịn khối chưa dược xây dựng ta 13s có củu trả lời Với ilìời gian phân tích liệu hồn lồn hồ trợ tốt cho nhà quản lý việc định nhanh chóng hợp lý Tliiet ke liẹ trọ I’in Ị) quyeí (linh (lựa vao (lữ liẹu 80- Với hệ trợ giúp định này, người sử dụng dễ dàng, thuận tiện nhanh chóng việc định cho tốn ứng dụng thực tế cách thực công việc sau: (1) Xác định yêu cầu toán ứng dụng cụ thể (2) Xây dựng mơ hình OLAP cho tốn, hướng đến việc giải yêu cầu này, công việc phụ thuộc chủ yếu vào nội tiling, yêu cầu toán, dễ thực mặt sử dụng hệ thống (3) Thực vài thao tác đơn giản để tạo lập sớ liệu đa chiểu (4) Thực việc phân tích liệu thuận tiện, linh hoạt trực quan Người sử dụng dễ dàng, linh động việc mô tả, thay đổi yêu cầu truy vấn thông tin (trên mức nào, liên khía cạnh liệu chứa khối) thao tác chọn lựa đơn giản hình thân thiện Và họ nhìn thấy kết phân tích mong muốn dạng bảng báo cáo tổng hợp súc tích Với hỗ trợ này, họ tiện lợi linh hoạt việc uốn nắn hoạt động phân tích liệu mình, để làm sáng tỏ dần tất thông tin cẩn thiết, đủ để dẻ dàng định tốt H ướng phát triển Như trình bày, nhiều vấn đề mà luận văn chưa đề cập đến Dưới vài điềm đổ hoàn chỉnh mở rộng luận văn: - Quan tâm đến việc tổ chức quản lý KDL mạng, thực liên kết khối đa chiều với KDL hay trực tiếp đến hệ xử lý tác vụ, để tự động hoá việc cập nhật liệu cấu trúc chiều cho khối đa chiều - Quan tâm sâu đến việc phối hợp chặt chẽ khối đa chiéu để mở rộng việc khai thác tối đa khả nãng khối đa chiều - Mở rộng khả thị kết quả, giúp cho việc mô tả, thay đổi yêu cầu truy vấn thông tin thuận lợi hơn, linh động Phán kết luạn c c THUflT NQỞ VIẾT TflT Cư Sở Dữ Liệu CSDL DM Data Mart Kho liệu chủ đề DSS Decision Support System Hệ trợ giúp định HOLAP Hybrid OLAP OLAP ghép KDL Kho liệu LS Legacy System Hệ thống có trước MIS Management Information System Hệ thông tin quản lý MOLAP Multidimensional OLAP OLAP đa chiểu MSS Management Support System Hệ hỗ trợ quản lý OLAP On-Line Analysis Processing Xử lý phân tích trực tuyến OLTP On-Line Transaction Processing Xử lý giao dịch trực tuyến RDBMS Relational DataBase Management System Hệ quản trị CSDL quan hệ ROLAP Relational OLAP O L A P q uan hệ SA Subject Area TGQĐ Các íhiiạt n g ữ viết lãt Vùng chủ đề Trợ Giúp Quyết Định 82- Tfil LIỆU TH6M K h o [1 ] Business Objects, OLAP for The Masses - 1997 [2J Chaudhuii s., et al., Including Group - by in Query Optimization, Proceedings of 20th VLDB Conference Santiago, Chile, 1994 [3J Ching T.H., et ill., Range Queries in OLAP Data Cubes, Proceedings ACM SIGMOD 1997 [4], Dịch vụ phân tích trực tuyến Microsoft SQL Server, Viện Cơng Nghệ Thơng Tin 2000 [5J Đồn Văn Ban, Phương pháp Ihiết kế khai thác kho liệu, Báo cáo đề tài TT96/97 - 04, Viện Công Nghệ Thông Tin 1997 [6 ] Erik Thomsen, OLAP Solusions: Building Multidimensional Information Systems, Wiley 1997 [7J Hass P J., et ill., Sampling - Based Estimation of ihe Number OÍ' Distinct Values of an Attribute In Proceeding of the 21st International VLDB Conference, pager 311-320, 1995 [ | Hoàng Xuftn Huấn, Các hệ thống lliông tin hỗ trợ quản lý vấn để triển khai ứng dụng, Tài liệu xemina ĐHBK1ỈN [9J Nguyễn Bá Tường, Cơ sở liệu lý thuyết ihực hành, Nhà xuất khoa học kỹ thuật, Hà Nội - 2001 {10] Nguyễn Thanh Thủy, Khai phá liệu kỹ thuật ứng dụng, 2000 [11] O ’Neil P., Quass D., Improved Query Performance with Variant Indexes Proceeding ACM SIGMOD 1997 [12] Phan Đình Diệu, Phát tri thức khai phá liệu, 1998 [13], Ralph H Sprague, Jr., Hugh J Watson: Decision support systems - Pulling theory into practice, Prentice Hall, 1986 [14] Raph Kimball, Dealing with dirty data, BBMS Online Magazine S e p 1996 [15], Robert J Mocker, Knowledge-Based Systems for Management Decisions, Prentice-Hall Editions Tài liệu tham khlio [16] Springer Verlag, Introduction to Genetic Algorithm s - Data structures + Geneti Algorithms = Evolution Program, 1994 [17] Stephen G s., The Data Base Factory, John Wiley & Sons, 1994 [18] Surajit Chaudhuri - Misrosoft Reseach, An Overview of Data warehouse and OLAPTechnology, http://www.acm.org [19] Tài liệu Data Warehouse Viện Công Nghệ Thông Tin, 1997 [20] Vidette Poe, Building A Data Warehouse for Decision Support, Prentice Ha!! PTR, 1996 [21J Vũ Văn Tới, Làm liệu phục vụ trợ giúp định, Luận văn thạc sĩ - 2000 [22], Windon J., Research Problem ill Data Warehousing Proc O f 4th Int Confer On Information and Knowledge Management, Nov 1995 Tài liệu tliaiii kliao