Lập các Views tính toán các Facts trên CSDL ngu n liên quan thành ph n DWH ồ ầ tuyển sinh đại học .... Mô tả hệ thống các Dim = Tiêu chí phân tích đánh giá của thành phần đăng ký dự thi
Trang 1TRƯỜNG ĐẠI HỌC SƯ PHẠM KỸ THUẬT TP HCM KHOA CÔNG NGH THÔNG TIN Ệ
ĐỒ ÁN H C PHẦN Ọ TÊN HỌC PH N: Ầ Kho dữ liệu (DWH)
MÃ SỐ L P HP:Ớ DAWH430784_010
Tên đề tài Nhóm: PHÁT TRI N MÔ HÌNH KHO DỂ Ữ LIỆU TUYỂN SINH ĐẠI HỌC KHAI THÁC S DỬ ỤNG TẠI TRƯỜNG ĐẠI HỌC C A VI T NAMỦ Ệ
Trang 22 Nguy n Thanh Sang ễ [44] Thành phần đăng ký d ự thi theo nhóm ngành nghề 3 Lê Th Nhung [38] Thành phị ần đăng ký dự thi theo khối thi
4 Nguy n Hoài Nam [33] Thành phễ ần đăng ký dự thi theo phương thức 5 Nguyễn Vũ Lực [30] Thành phần đăng ký dự thi theo dạng trường ph ổ thông 6 Lưu Gia Bảo [01] Thành phần đăng ký dự thi theo cơ sở đào tạo
7 Nguy n Qu c Vi t [63] Thành phễ ố ệ ần đăng ký dự thi theo nhóm tư vấn tuy n sinh cể ủa cơ sở đào tạo
8 Lê Phương Nam [32] Thành phần đăng ký dự thi theo đối tượng ưu tiên
9 Nguy n Ph m Duy Khiêm [24] Thành phễ ạ ần đăng ký dự thi theo k t quế ả trúng tuy n và ể nhập học
Trang 36 Lưu Gia Bảo [01]:………….(………)………
7 Nguyễn Quốc Việt [63]:………….(………)………
8 Lê Phương Nam [32]:………….(………)………
9 Nguyễn Phạm Duy Khiêm [24]:………….(………)………
Ngày 30/05/2022
Giảng viên
Ký tên
Trang 4- 4 -
TRƯỜNG ĐẠI HỌC SƯ PHẠM KỸ THUẬT TP.HCM KHOA CÔNG NGH THÔNG TIN Ệ
ĐỀTÀI ĐỒ ÁN HỌC PHẦN
TÊN HỌC PH N: Ầ Kho dữ liệu (DWH)
MÃ SỐ L P HP:Ớ DAWH430784_01
Tên đề tài Nhóm: PHÁT TRI N MÔ HÌNH KHO DỂ Ữ LIỆU TUYỂN SINH ĐẠI HỌC KHAI THÁC S DỬ ỤNG TẠI TRƯỜNG ĐẠI HỌC C A VI T NAM Ủ Ệ
Giảng viên gi ng d y: VÕ XUÂN TH _ Gi ng viên chính ả ạ Ể ả
Trang 5- 5 - LỜI CẢM ƠN
Ban giám hiệu trường Đại Học Sư phạm kỹ thuật Thành phố ồ Chí Minh vì đã tạo điề H u kiện về cơ sở vật chất với hệ thống thư viện hiện đại, đa dạng các loại sách, tài liệu thuận lợi cho việc tìm kiếm, nghiên c u thông tin ứ
Xin cảm ơn giảng viên bộ môn Thầ- y Võ Xuân Thể đã giảng d y t n tình, chi tiạ ậ ết để chúng em có đủ kiến thức và v n d ng chúng vào bài tiậ ụ ểu lu n này ậ
luận ch c chắ ắn sẽ không tránh kh i nh ng thi u sót R t mong nhỏ ữ ế ấ ận đượ ực s nh n xét, ý ki n ậ ế đóng góp, phê bình từ phía Thầy để bài tiểu luận được hoàn thiện hơn.
Lời cuối cùng, chúng em xin kính chúc th y nhi u sầ ề ức khỏe, thành công và hạnh phúc.”
Trang 6Công c hụ ỗ trợ ổ chứ t c, qu n lý và khai thác kho dả ữ liệu (H ệ thống tổ chức dữ ệu thông minh cho các doanh nghi p): li ệ Business Intelligence Development Studio của Microsoft DWH Kho dữ u (Nhà kho dliệ ữ liệu): Data WareHouse ERD Sơ đồ thực thể kết hợp: Entity Relationship Diagram
NF Dạng chu n c a CSDL: Normal Form ẩ ủ
SQL Ngôn ngữ v n tin có c u trúc: Structured Query Language ấ ấ
Trang 7Tài khoản (Account)
Là m t quy n làm vi c trên h ộ ề ệ ệ thống ph n mầ ềm được cấp phát cho một cá nhân thông qua tên tài kho n (username) và m t kh u ả ậ ẩ (password)
BigData Dữ liệu l n: là m t t p h p dxử lý dữ liệu bớ ằng các phương pháp truyềộ ậ ợ ữ liệu r t l n và ph c t p, không th ấ ớn thống ứ ạ ể
Trang 81.6 Bố cục của báo cáo 14
Chương 2 CƠ SỞ LÝ THUY T CẾ ỦA H C PHỌ ẦN 16
2.1 Tổng quan v kho dề ữ liệu (DWH) 16
2.1.1 Các khái niệm cơ bản về Kho dữ liệ u 16
2.1.1.1 Kho dữ liệu (DWH)? 16 2.1.1.2 Nguyên lý hình thành DWH 16 2.1.1.3 Các đặc điểm cơ bản của DWH 16 2.1.1.4 Phân bi t [SS] DWH vệ ới CSDL truy n th ng ề ố 16 2.1.2 Kiến trúc cơ bản của kho dữ liệu: 18
2.1.2.1 Tầng đáy: nạp dữ liệu 18 2.1.2.2 Tầng gi a: OLAP (OLAP server): x lý DWH ữ ử 18 2.1.2.3 Tầng trên cùng: ng d ng = khai thác s d ng DWH ứ ụ ử ụ 18 2.1.3 Mô hình CSDL đa chiều (Dimensional Modeling) 18
2.2 Phân tích và thiết kế Kho d u 18ữ liệ 2.2.1 Phân tích và thiết kế kho d ữ liệu theo hướng mô hình hóa nhi u chi u (Dimensional ề ề Modeling) 18
Trang 9- 9 -
2.2.2 Các dạng (phương pháp) tích hợp d u 19ữ liệ 2.2.3 Các bước cơ bản trong tiến trình tích hợp dữ liệu 20 2.2.4 Các công cụ tích hợp d u: 20ữ liệ 2.2.5 Lập các lu ng công viồ ệc tích hợp d u (Data Integration Workflows) 20ữ liệ 2.2.6 Hệ thống OLTP (On-Line Transaction Processing = X l giao dử ý ịch trực tuyến) 20 2.3 Vấn tin khai thác s d ng Kho d u 21ử ụ ữ liệ 2.3.1 Vấn tin với các phép toán tổng hợp c a SQL trên kho dủ ữ liệu 21 2.3.2 Vấn tin với các hàm phân tích của SQL trên kho d u 21ữ liệ 2.3.3 Vấn tin dùng Materialized View để phân tích trên kho dữ liệu 21 2.3.4 Hệ thống OLAP 22 Chương 3 TỔNG QUAN VỀ KHO D Ữ LIỆU TUYỂN SINH ĐẠI HỌC SỬ DỤNG TẠI TRƯỜNG ĐẠI HỌC VIỆT NAM 23 3.1 Ý tưởng hình thành DWH Tuyển sinh Đại học sử dụng tại trường Đại học Việt Nam:
23
3.2 Giới thiệu chung v Kho d ề ữ liệu 24 3.2.1 Mô tả t ng quan v DWH 24ổ ề 3.2.2 Các d u nguữ liệ ồn hình thành DWH 24 3.3 Xác định nhu c n t ầ ổ chức và phân tích dữ liệu của toàn bộ DWH 25 3.4 Các thành ph n thành ph n Kho d u phân công các cá nhân ph trách 25ầ ầ ữ liệ ụ Chương 4 PHÂN TÍCH, THI T K VÀ KHAI THÁC S D NG CÁC THÀNH Ế Ế Ử Ụ PHẦN KHO DỮ LIỆU TUYỂN SINH ĐẠI HỌC SỬ Ụ D NG TẠI TRƯỜNG ĐẠI HỌC 4.1.2 Xác định ngu n dồ ữ liệu tích hợp thành ph n Kho d u 27ầ ữ liệ 4.1.3 Thiết lập CSDL ngu n cồ ủa thành phần c a Kho dủ ữ liệu 28 4.1.4 Mô tả các Dim = Tiêu chí phân tích 30
Trang 10- 10 -
4.1.5 Mô tả cá Facts = S u phân tích c a thành ph n 31ố liệ ủ ầ 4.1.6 Lập các Views tính toán các Facts trên CSDL ngu n liên quan thành ph n DWH ồ ầ tuyển sinh đại học 32 4.1.7 Phân phân tích các DB gốc xác định yêu c u phân tích DWH c a thành ph n 34ầ ủ ầ 4.1.8 Triển khai thành ph n DWH lên BIDS 36ầ 4.2 44_Nguyễn Thanh Sang _Thành phần đăng ký dự thi theo nhóm ngành nghề 40 4.2.1 Mô tả t ng quan v thành phổ ề ần DWH đăng ký dự thi theo nhóm ngành ngh 40ề 4.2.2 Xác định ngu n dồ ữ liệu tích hợp thành ph n Kho d u 40ầ ữ liệ 4.2.3 Xác định ý tưởng hình thành thành phần của Kho dữ liệu 41 4.2.4 Mô tả các DIM = tiêu chí phân tích 42 4.2.5 Mô tả cá Facts = S u phân tích c a thành ph n 43ố liệ ủ ầ 4.2.6 Lập các View tính toán 43 4.2.7 Thiết kế DB mới tổ chức phân tích Kho dữ liệ u cho thành ph n 44ầ 4.2.8 Triển khai thành ph n DWH trên BIDS 46ầ 4.3 38_ Lê Thị Nhung _ Thành phần đăng ký dự thi theo khối thi 47 4.3.1 Mô tả t ng quan v thành ph n DWH : Thành phổ ề ầ ần đăng ký dự thi theo khối thi 47 4.3.2 Xác định ngu n dồ ữ liệu tích hợp thành ph n Kho d u 47ầ ữ liệ 4.3.3 Thiết lập CSDL ngu n cồ ủa thành phần c a Kho dủ ữ liệu 48 4.3.4 Mô tả hệ thống các Dim = Tiêu chí phân tích (đánh giá) của thành phần đăng ký dự thi theo khối thi 49 4.3.5 Mô tả cá Facts = S u phân tích c a thành ph n 49ố liệ ủ ầ 4.3.6 Thiết kế DB mới tổ chức phân tích Kho dữ liệ u cho thành ph n 49ầ 4.3.7 Phân phân tích các DB gốc xác định yêu c u phân tích DWH c a thành ph n khầ ủ ầ ối thi
50
4.3.8 Triển khai thành ph n DWH lên BIDS 51ầ 4.4 33_ Nguy n Hoài Nam _ Thành Phễ ần Đăng Ký Dự Thi Theo Phương Thức 52 4.4.1 Mô tả t ng quan v thành ph n DWH : Thành phổ ề ầ ần đăng ký dự thi theo phương thức :
52
4.4.2 Xác định ngu n dồ ữ liệu tích hợp thành ph n Kho d u 53ầ ữ liệ
Trang 11- 11 -
4.4.3 Xác định ý tưởng hình thành thành phần của Kho dữ liệu 54 4.4.4 Mô tả các Dim = Tiêu chí phân tích 54 4.4.5 Mô tả cá Facts = S u phân tích c a thành ph n 55ố liệ ủ ầ 4.4.6 Lập các Views tính toán các Facts trên CSDL ngu n liên quan thành ph n DWH ồ ầ tuyển sinh đại học 55 4.4.7 Phân phân tích các DB gốc xác định yêu c u phân tích DWH c a thành ph n 56ầ ủ ầ 4.4.8 Triển khai thành ph n DWH lên BIDS 56ầ 4.5 30 _ Nguyễn Vũ Lực _ Thành phần đăng ký dự thi theo dạng trường phổ thông (trường chuyên, phổ thông, quố ế, GDTX , ) 57 c t 4.5.1 Mô tả t ng quan v thành phổ ề ần DWH đăng ký dự thi theo dạng trường phổ thông (trường chuyên, phổ thông, quốc tế, GDTX , ) 57 4.5.2 Xác định ngu n dồ ữ liệu tích hợp thành ph n Kho d u 58ầ ữ liệ 4.5.3 Thiết lập CSDL ngu n cồ ủa thành phần c a Kho dủ ữ liệu 58 4.5.4 Mô tả các Dim = Tiêu chí phân tích 60 4.5.5 Mô tả cá Facts = S u phân tích c a thành ph n 61ố liệ ủ ầ 4.5.6 Lập các Views tính toán các Facts trên CSDL ngu n liên quan thành ph n DWH ồ ầ tuyển sinh đại học 63 4.5.7 Phân tích các DB gốc xác định yêu c u phân tích DWH cầ ủa thành phần 65 4.5.8 Triển khai thành ph n DWH lên BIDS 65ầ 4.6 01 _ Lưu Gia Bảo _ Thành phần đăng ký dự thi theo cơ sở đào tạo 68 4.6.1 Mô tả t ng quan v thành ph n DWH ổ ề ầ thành phần đăng ký dự thi theo cơ sở đào tạo68 4.6.2 Xác định ngu n dồ ữ liệu tích hợp thành ph n Kho d u tuyầ ữ liệ ển sinh đại học khai thác sử d ng tụ ại trường đạ ọc c a Vii h ủ ệt Nam 68 4.6.3 Thiết lập CSDL nguồn của thành phần của Kho dữ liệu tuyển sinh đạ ọc khai thác i h sử d ng tụ ại trường đạ ọc c a Vii h ủ ệt Nam 70 4.6.4 Mô tả các Dim = tiêu chí phân tích (đáng giá) của thành phần đăng ký dư thi theo cơ sở đào tạo 70 4.6.5 Mô tả các Facts 71 4.6.6 Lập các Views tính toán các Facts trên CSDL nguồn liên quan thành phần DWH 72 4.6.7 Phân phân tích các DB gốc xác định yêu cầu phân tích DWH của thành phần 73
Trang 12- 12 -
4.6.8 Triển khai thành ph n DWH lên BIDS 74ầ 4.7 63_ NGUY N QU C VI T_ Thành phỄ Ố Ệ ần đăng ký dự thi theo nhóm tư vấn tuy n sinh ể của cơ sở đào tạo 75 4.7.1 Mô tả t ng quan v thành ph n DWH: Thành phổ ề ầ ần đăng ký dự thi theo nhóm tư vấn tuyển sinh của cơ sở đào tạo 75 4.7.2 Xác định ngu n dồ ữ liệu tích hợp thành ph n Kho d u 75ầ ữ liệ 4.7.3 Thiết lập CSDL ngu n cồ ủa thành phần c a Kho dủ ữ liệu 76 4.7.4 Mô tả hệ thống các Dim = Tiêu chí phân tích 77 4.7.5 Mô tả các Facts = S u phân tích c a thành ph n 78ố liệ ủ ầ 4.7.6 Lập các Views tính toán các Facts trên CSDL nguồn liên quan thành phần DWH 79 4.7.7 Phân phân tích các DB gốc xác định yêu cầu phân tích DWH của thành phần 83 4.8 32_ Lê Phương Nam_ Thành Phần Đăng Ký Dự Thi Theo Đối Tượng Ưu Tiên 84 4.8.1 Mô tả t ng quan v thành phổ ề ần DWH đăng ký dự thi theo đ i tưố ợng ưu tiên 84 4.8.2 Xác định ngu n dồ ữ liệu tích hợp thành ph n Kho d u 85ầ ữ liệ 4.8.3 Xác định ý tưởng hình thành thành phần của Kho dữ liệu 86 4.8.4 Mô tả các Dim = tiêu chí phân tích 86 4.8.5 Mô tả các Fact = số liệu phân tích c a thành ph n 86ủ ầ 4.8.6 Lập các Views tính toán các Facts trên CSDL nguồn liên quan thành phần DWH tuyển sinh đại học 87 4.8.7 Phân phân tích các DB gốc xác định yêu c u phân tích DWH c a thành ph n 89ầ ủ ầ 4.8.8 Triển khai thành ph n DWH lên BIDS 89ầ 4.9 24_ Nguyễn Phạm Duy Khiêm_ Thành phần đăng ký dự thi theo kết quả trúng tuyển và nhập học 90
4.9.1 Mô tả t ng quan v thành phổ ề ần DWH đăng ký dự thi theo kết qu trúng tuy n và nh p ả ể ậ học 90
4.9.2 Xác định ngu n dồ ữ liệu tích hợp thành ph n Kho d u 90ầ ữ liệ 4.9.3 Thiết lập CSDL ngu n cồ ủa thành phần kho d ữ liệu 91 4.9.4 Mô tả các Dim = Tiêu chí phân tích 92 4.9.5 Mô tả cá Facts = S u phân tích c a thành ph n 93ố liệ ủ ầ
Trang 13- 13 -
4.9.6 Thiết lập các Views tính toán c n thiầ ết để ạ n p d ữ liệu t ừ DB gốc vào các Factors của thành phần DWH 93 4.9.7 Phân phân tích các DB gốc xác định yêu c u phân tích DWH c a thành ph n 96ầ ủ ầ 4.9.8 Triển khai thành ph n DWH lên BIDS 96ầ Chương 5 KẾT LUẬN VÀ HƯỚNG PHÁT TRIỂN CỦA ĐỒ ÁN HỌC PHẦN 97
Trang 14- 14 -
Chương 1 GIỚI THIỆU VỀ ĐỒ ÁN HỌC PHẦN 1.1 Tổng quan về ĐỒ ÁN HỌC PHẦN
Đồ án H c phần DAWH430784 ọ
1.2 Nội dung chuyên môn chính của ĐỒ ÁN HỌC PHẦN
Môn học cung c p nh ng ki n thấ ữ ế ức cơ bản v kho d u, ki n trúc kho d u và các ề ữ liệ ế ữ liệ mô hình đa chiều Thực hành về thi t kế kho dữ liệu và sử dụng các công cụ phổ biến tạo các ế luồng công vi c tích h p dệ ợ ữ ệu Bên cli ạnh đó, cung cấp ki n th c v ph n m r ng c a SQL ế ứ ề ầ ở ộ ủ được h ỗ trợ b i các h qu n tr ở ệ ả ị cơ sở d ữ liệu quan h ệ để trả lời các câu h i phân tích trong kinh ỏ doanh
1.3 Mục tiêu của ĐỒ ÁN HỌC PHẦN
- Trình bày được các khái ni m và thu t ngệ ậ ữ cơ bản c a kho dủ ữ liệu và phân tích đượ ầm c t quan tr ng cọ ủa nó.
- Khả năng phân tích, thiết kế ộ m t kho d u cho m t yêu c u c ữ liệ ộ ầ ụ thể
- Khả năng sử ụ d ng công c tích h p dụ ợ ữ liệu để triển khai vi c tích h p dệ ợ ữ liệu cho m t kho ộ dữ liệu c ụ thể
- Khả năng sử ụ d ng ph n m r ng cầ ở ộ ủa SQL để trả ờ l i các câu h i v phân tích kinh doanh ỏ ề - Khả năng thuyết trình và làm vi c nhóm ệ
1.4 Công cụ và nền tảng kỹ thuật thực hiện ĐỒ ÁN HỌC PHẦN Các công c chính s dụ ử ụng trong đồ án này là
+ Microsoft SQL Server + Microsoft Visual Studio 2019 + BIDS
1.5 Sản phẩm của ĐỒ ÁN HỌC PHẦN - Tuyển Sinh Đại Học
1.6 Bố cục của báo cáo
Báo cáo gồm những nội dung như sau: Chương 1: Giới thiệu đồ án của h c phần DWH ọ
Chương 2: Các cơ sở lý thuyết của HP phục việc thực hiện đề tài HP
Trang 15- 15 -
Chương 3: Giới thiệu tổng quan về Kho dữ liệu (DWH) Kho dữ liệu Tuyển sinh Đại Học tại các trường đại học
Chương 4: Phân tích, thiết kế và tổ chức khai thác sử dụng từng thành phần của Kho dữ liệu Chương 5: Tổng kết các kết quản đạt được và còn hạn chế của đ ồán, đồng thời đề xuất
hướng khắc phục hạn chế và phát triển Đồ án.
Trang 16- 16 -
Chương 2 CƠ SỞ LÝ THUYẾT CỦA HỌC PHẦN 2.1 Tổng quan về kho dữ liệu (DWH)
2.1.1 Các khái niệm cơ bản về Kho dữ liệu 2.1.1.1 Kho dữ liệu (DWH)?
Kho d ữ liệu (data warehouse), g i mọ ột cách chính xác hơn là kho thông tin (information warehouse), là một cơ sở dữ liệu hướng đối tượng được thiết kế với việc tiếp cận các ý kiến trong mọi lĩnh vực đặc biệt là trong lĩnh vực kinh doanh Nó cung c p các công c ấ ụ để đáp ứng thông tin c n thi t cho các nhà qu n tr kinh doanh t i m i cầ ế ả ị ạ ọ ấp độ ổ chức t - không nh ng là ữ những yêu c u d ầ ữ liệu ph c hứ ợp, mà còn là điều ki n thu n ti n nhệ ậ ệ ất để đạt được vi c l y thông ệ ấ tin nhanh, chính xác M t kho dộ ữ liệu được thiế ế t k để ngườ ử d ng có th nh n ra thông tin i s ụ ể ậ mà họ muốn có và truy cập đến b ng nh ng công cằ ữ ụ đơn giản
2.1.1.2 Nguyên lý hình thành DWH
Một kho dữ liệu là một s pha trự ộn của nhiều công ngh , bao gệ ồm các cơ sở ữ liệu đa d chiều và m i quan hố ệ giữa chúng, ki n trúc ch khách, giao diế ủ ện người dùng đồ ọ h a và nhi u ề nữa Nguyên nhân chính cho s phát tri n m t kho dự ể ộ ữ liệu là hoạt động tích hợp dữ liệu từ nhiều nguồn khác nhau vào m t kho dộ ữ liệu đơn lẻ và dày đặc mà kho này cung c p cho viấ ệc phân tích và ra quyết định trong công vi c kinh doanh, qu n lý ệ ả
2.1.1.3 Các đặc điểm cơ bản của DWH
*Tính hướng chủ đề (Object Oriented): Dữ liệu được tập hợp, phân lớp, lưu trữ và x ử lý theo t ng ch ừ ủ đề, để ễ dàng xác đị d nh được nh ng thông tin c n thi t trong t ng hoữ ầ ế ừ ạt động Các dữ liệu c a m i chủ ỗ ủ đề chính trong tổ chức được liên k t vế ới các khóa đại diện và đưa vào cùng một vị trí
*Tính tích h p (Integration); Dợ ữ liệ ậu t p h p t nhi u nguợ ừ ề ồn khác nhau Điều này s ẽ dẫn đến việc quá trình tập hợp phải thực hiện việc làm s ch, xắp xếp, rút gọn dữ liệu ạ
*Dữ liệu g n thắ ời gian và có tính lịch s Các dử ữ liệu đế ừn t quá trình kinh doanh của công ty có th có tể ừ nhiều năm trướ c
*Dữ liệu có tính ổn định (non volatility): Khi m t Transaction hoàn ch nh, d ộ ỉ ữ liệu không thể t o thêm hay sạ ửa đổ i.
2.1.1.4 Phân biệt [SS] DWH v i CSDL truy n thớ ề ống
Trang 17- 17 -
Mục đích Được thiết kế lưu lại bản ghi Đượđể c thiế ết k phân tích để
Xử lý Online Transactional Processing tạp, m i quan h , chu n hóa ố ệ ẩ
Không được chuẩn hóa
Được làm m i khi cần thiết từ nhiều nguồn ớ khác nhau, c n thì phầ ải đợi hệ thống ch y t o ạ ạ lại dữ liệu định kì cần thiết
Sử dụng Kỹ thuật mô hình ER được sử
dụng Kỹ thuật mô hình dữ liệu được sử d ng ụ Kỹ thuật Capture dữ liệu Analyze dữ liệu
Sử dụng phương pháp tiếp cận đa chiều và chuẩn hóa cho c u trúc d u Ví dấ ữ liệ ụ: Lược đồ sao và bông tuyết
Trang 32- 32 -
- Từ hai b ng này kả ết v i bớ ảng ThiSinh để ấ l y thông tin thí sinh
- Thông qua hàm aggr count để đếm số lượng thí sinh thông qua groupby maKhuVuc Tổng thí sinh đăng ký theo Tỉnh:
- Xuất phát từ table T nh ỉ
- Kết với bảng địa phương thông qua maTinh
- Từ hai b ng này kả ết v i bớ ảng ThiSinh để ấ l y thông tin thí sinh
- Thông qua hàm aggr count để đếm số lượng thí sinh thông qua groupby maTinh
4.1.6 Lập các Views tính toán các Facts trên CSDL ngu n liên quan thành ph n DWH ồ ầ tuyển sinh đại học
VIEW: Thống kê số lượng thí sinh theo khu vực ưu tiên
CREATE VIEW view_ThongKeKV_TS ([Mã Khu Vực],[Số lượng thí sinh])AS SELECT k.maKhuVuc as [Mã Khu V c], ự COUNT(t.maThiSinh) as [Số lượng thí sinh]
Trang 33- 33 - FROM dbo.ThiSinh as t INNER JOIN
dbo.DiaPhuong as d ON t.maDiaPhuong = d.maDiaPhuong INNER JOIN dbo.KhuVucUuTien ask ON d.maKhuvuc = k.maKhuVuc
GROUP BY k.maKhuVuc;
View: Thống kê số lượng thí sinh theo tỉnh
CREATE VIEW view_ThongKeTinh_TS ([Tỉnh], [Số lượng thí sinh]) AS SELECT k.tenTinh as [Tỉnh], COUNT(t.maThiSinh) as [Số lượng thí sinh] FROM dbo.ThiSinh as t INNER JOIN
dbo.DiaPhuong as d ON t.maDiaPhuong = d.maDiaPhuong INNER JOIN dbo.Tinh ask ON d.maTinh = k.maTinh
GROUP BY k.tenTinh;
View: thống kê số lượng phiếu đăng ký theo khu vực
CREATE VIEW view_ThongKeKV_PhieuDK ([Mã Khu Vực],[S lượng phiếu])AS ố SELECT k.maKhuVuc as [Mã Khu V c], ự COUNT(p.maPhieu) as [Số lượng phiế u] FROM dbo.ThiSinh as t INNER JOIN
dbo.DiaPhuong as d ON t.maDiaPhuong = d.maDiaPhuong INNER JOIN dbo.KhuVucUuTien ask ON d.maKhuvuc = k.maKhuVuc INNER JOIN dbo.PhieuDangKy as p ON t.maThiSinh = p.maThiSinh
Trang 34- 34 - GROUP BY k.maKhuVuc;
GO
View: Thống kê số lượng phiếu đăng ký theo tỉnh
CREATE VIEW view_ThongKeTinh_PhieuDK ([Tỉnh], [Số lượng phi u]) ế AS SELECT k.tenTinh as [Tỉnh], COUNT(p.maPhieu) as [Số lượng thí sinh] FROM dbo.ThiSinh as t INNER JOIN
dbo.DiaPhuong as d ON t.maDiaPhuong = d.maDiaPhuong INNER JOIN dbo.Tinh ask ON d.maTinh = k.maTinh INNER JOIN
dbo.PhieuDangKy as p ON t.maThiSinh = p.maThiSinh GROUP BY k.tenTinh;
4.1.7 Phân phân tích các DB gốc xác định yêu c u phân tích DWH cầ ủa thành phần
+ Tỉnh
Trang 35- 35 - + DiaPhuong
+ KhuVucUuTien
Trang 36- 36 -
4.1.8 Triển khai thành phần DWH lên BIDS
- Triển khai view lên DWH + View Số lượng thí sinh theo t nh ỉ
+ View số lượng thí sinh theo khu vực ưu tiên
Trang 37- 37 - + View Số lượng thí sinh theo t nh ỉ
+ View Số lượng phiếu đăng ký:
Trang 38- 38 - - Triển khai tính toán theo measure + Measure Phiếu đăng ký theo Tỉnh
+ Measure Thi Sinh theo mã Tỉnh
Trang 39- 39 -
Trang 40- 40 -
4.2 44_Nguyễn Thanh Sang _Thành phần đăng k dự thi theo nhóm ngành nghề
4.2.1 Mô tả tổng quan về thành phần DWH đăng k dự thi theo nhóm ngành nghề
Fact: FACT theo t ng sổ ố lượng đơn dự tuyển theo nhóm ngành Nguồn: Cơ sở đào tạo đại học
4.2.2 Xác định nguồn dữ liệu tích hợp thành phần Kho dữ liệu
Thành phần đăng ký dự thi theo nhóm ngành nghề (Công nghệ thông tin, Sư phạm, ): CSDL đăng ký dự thi do trường đại học quản lý:
- Lưu thông tin thí sinh, ngành và nhóm ngành