Lập các Views tính toán các Facts trên CSDL ngu n liên quan thành ph n DWH ồ ầ tuyển sinh đại học .... Mô tả hệ thống các Dim = Tiêu chí phân tích đánh giá của thành phần đăng ký dự thi
Trang 1TRƯỜNG ĐẠ I HỌC SƯ PHẠM KỸ THUẬT TP HCM
KHOA CÔNG NGH THÔNG TIN Ệ
ĐỒ ÁN H C PHẦN ỌTÊN HỌC PH N: Ầ Kho d ữ liệ u (DWH)
Trang 22 Nguy n Thanh Sang ễ [44] Thành phần đăng ký d ự thi theo nhóm ngành nghề
3 Lê Th Nhung [38] Thành phị ần đăng ký dự thi theo khối thi
4 Nguy n Hoài Nam [33] Thành phễ ần đăng ký dự thi theo phương thức
5 Nguyễn Vũ Lực [30] Thành phần đăng ký dự thi theo dạng trường ph ổ thông
6 Lưu Gia Bảo [01] Thành phần đăng ký dự thi theo cơ sở đào tạo
7 Nguy n Qu c Vi t [63] Thành phễ ố ệ ần đăng ký dự thi theo nhóm tư vấn tuy n sinh cể ủa cơ sởđào tạo
8 Lê Phương Nam [32] Thành phần đăng ký dự thi theo đối tượng ưu tiên
9 Nguy n Ph m Duy Khiêm [24] Thành phễ ạ ần đăng ký dự thi theo k t quế ả trúng tuy n và ểnhập học
Trang 3- 3 -
ĐIỂM ĐÁNH GIÁ
NHÓM: 02
1 Vũ Văn Phước[42]:………….(………)………
2 Nguyễn Thanh Sang[44]:………….(………)…………
3 Lê Thị Nhung [38]:………….(………)………
4 Nguyễn Hoài Nam [33]:………….(………)………
5 Nguyễn Vũ Lực [30]:………….(………)………
6 Lưu Gia Bảo [01]:………….(………)………
7 Nguyễn Quốc Việt [63]:………….(………)………
8 Lê Phương Nam [32]:………….(………)………
9 Nguyễn Phạm Duy Khiêm [24]:………….(………)………
Ngày 30/05/2022
Giảng viên
Ký tên
Trang 4- 4 -
TRƯỜNG ĐẠI HỌC SƯ PHẠM KỸ THUẬT TP.HCM
KHOA CÔNG NGH THÔNG TIN Ệ
Trang 5- 5 -
LỜI CẢM ƠN
Ban giám hiệu trường Đại Học Sư phạm kỹ thuật Thành phố ồ Chí Minh vì đã tạo điề H u kiện
về cơ sở vật chất với hệ thống thư viện hiện đại, đa dạng các loại sách, tài liệu thuận lợi cho việc tìm kiếm, nghiên c u thông tin ứ
Xin cảm ơn giảng viên bộ môn Thầ- y Võ Xuân Thể đã giảng d y t n tình, chi tiạ ậ ết để chúng
em có đủ kiến thức và v n d ng chúng vào bài tiậ ụ ểu lu n này ậ
luận ch c chắ ắn sẽ không tránh kh i nh ng thi u sót R t mong nhỏ ữ ế ấ ận đượ ực s nh n xét, ý ki n ậ ếđóng góp, phê bình từ phía Thầy để bài tiểu luận được hoàn thiện hơn
Lời cuối cùng, chúng em xin kính chúc th y nhi u sầ ề ức khỏe, thành công và hạnh phúc.”
Trang 6- 6 -
DANH MỤC CÁC TỪ VIẾT TẮT CSDL hoặc DB Cơ sở dữ liệu: DataBase
Công c hụ ỗ trợ ổ chứ t c, qu n lý và khai thác kho dả ữ liệu (H ệ
thống tổ chức dữ ệu thông minh cho các doanh nghi p): li ệBusiness Intelligence Development Studio của MicrosoftDWH Kho dữ u (Nhà kho dliệ ữ liệu): Data WareHouse
ERD Sơ đồ thực thể kết hợp: Entity Relationship Diagram
NF Dạng chu n c a CSDL: Normal Form ẩ ủ
SQL Ngôn ngữ v n tin có c u trúc: Structured Query Language ấ ấ
Trang 7Người dùng (User):
Tài khoản (Account)
Là m t quy n làm vi c trên h ộ ề ệ ệ thống ph n mầ ềm được cấp phát cho một cá nhân thông qua tên tài kho n (username) và m t kh u ả ậ ẩ(password)
BigData Dữ liệu l n: là m t t p h p dxử lý dữ liệu bớ ằng các phương pháp truyềộ ậ ợ ữ liệu r t l n và ph c t p, không th ấ ớn thống ứ ạ ể
Trang 8- 8 -
MỤC LỤC
LỜI CẢM ƠN 5
DANH MỤC CÁC T Ừ VIẾT T T 6Ắ DANH MỤC CÁC THU T NG 7Ậ Ữ MỤC LỤC 8 Chương 1 GIỚI THIỆU VỀ ĐỒ ÁN HỌC PH N 14Ầ 1.1 Tổng quan về ĐỒ ÁN HỌC PHẦN 14
1.2 Nội dung chuyên môn chính của ĐỒ ÁN HỌC PHẦN 14
1.3 Mục tiêu của ĐỒ ÁN HỌC PHẦN 14
1.4 Công cụ và n n t ng kề ả ỹ thuật thực hiện ĐỒ ÁN HỌC PHẦN 14
1.5 Sản phẩm của ĐỒ ÁN HỌC PHẦN 14
1.6 Bố cục của báo cáo 14
Chương 2 CƠ SỞ LÝ THUY T CẾ ỦA H C PHỌ ẦN 16
2.1 Tổng quan v kho dề ữ liệu (DWH) 16
2.1.1 Các khái niệm cơ bản về Kho dữ liệ u 16
2.1.1.1 Kho dữ liệu (DWH)? 16 2.1.1.2 Nguyên lý hình thành DWH 16 2.1.1.3 Các đặc điểm cơ bản của DWH 16 2.1.1.4 Phân bi t [SS] DWH vệ ới CSDL truy n th ng ề ố 16 2.1.2 Kiến trúc cơ bản của kho dữ liệu: 18
2.1.2.1 Tầng đáy: nạp dữ liệu 18 2.1.2.2 Tầng gi a: OLAP (OLAP server): x lý DWH ữ ử 18 2.1.2.3 Tầng trên cùng: ng d ng = khai thác s d ng DWH ứ ụ ử ụ 18 2.1.3 Mô hình CSDL đa chiều (Dimensional Modeling) 18
2.2 Phân tích và thiết kế Kho d u 18ữ liệ 2.2.1 Phân tích và thiết kế kho d ữ liệu theo hướng mô hình hóa nhi u chi u (Dimensional ề ề Modeling) 18
Trang 9- 9 -
2.2.2 Các dạng (phương pháp) tích hợp d u 19ữ liệ2.2.3 Các bước cơ bản trong tiến trình tích hợp dữ liệu 20 2.2.4 Các công cụ tích hợp d u: 20ữ liệ2.2.5 Lập các lu ng công viồ ệc tích hợp d u (Data Integration Workflows) 20ữ liệ2.2.6 Hệ thống OLTP (On-Line Transaction Processing = X l giao dử ý ịch trực tuyến) 202.3 Vấn tin khai thác s d ng Kho d u 21ử ụ ữ liệ2.3.1 Vấn tin với các phép toán tổng hợp c a SQL trên kho dủ ữ liệu 212.3.2 Vấn tin với các hàm phân tích của SQL trên kho d u 21ữ liệ2.3.3 Vấn tin dùng Materialized View để phân tích trên kho dữ liệu 21 2.3.4 Hệ thống OLAP 22Chương 3 TỔNG QUAN VỀ KHO D Ữ LIỆU TUYỂN SINH ĐẠI HỌC SỬ DỤNG TẠI TRƯỜNG ĐẠI HỌC VIỆT NAM 23 3.1 Ý tưởng hình thành DWH Tuyển sinh Đạ i học sử dụng tại trường Đại học Việt Nam:
23
3.2 Giới thiệu chung v Kho d ề ữ liệu 24 3.2.1 Mô tả t ng quan v DWH 24ổ ề3.2.2 Các d u nguữ liệ ồn hình thành DWH 24 3.3 Xác định nhu c n t ầ ổ chức và phân tích dữ liệu của toàn bộ DWH 25 3.4 Các thành ph n thành ph n Kho d u phân công các cá nhân ph trách 25ầ ầ ữ liệ ụChương 4 PHÂN TÍCH, THI T K VÀ KHAI THÁC S D NG CÁC THÀNH Ế Ế Ử ỤPHẦN KHO DỮ LIỆU TUYỂN SINH ĐẠI HỌC SỬ Ụ D NG TẠI TRƯỜNG ĐẠI HỌC VIỆT NAM 27 4.1 42_ Vũ Văn Phước _ Thành phần đăng ký dự thi theo tỉnh hoặc vùng mi n và khu ềvực ưu tiên 27 4.1.1 Mô tả t ng quan v thành ph n ổ ề ầ DWH đăng ký dự thi theo tỉnh ho c vùng mi n và khu ặ ềvực ưu tiên 27 4.1.2 Xác định ngu n dồ ữ liệu tích hợp thành ph n Kho d u 27ầ ữ liệ4.1.3 Thiết lập CSDL ngu n cồ ủa thành phần c a Kho dủ ữ liệu 28 4.1.4 Mô tả các Dim = Tiêu chí phân tích 30
Trang 10- 10 -
4.1.5 Mô tả cá Facts = S u phân tích c a thành ph n 31ố liệ ủ ầ4.1.6 Lập các Views tính toán các Facts trên CSDL ngu n liên quan thành ph n DWH ồ ầtuyển sinh đại học 32 4.1.7 Phân phân tích các DB gốc xác định yêu c u phân tích DWH c a thành ph n 34ầ ủ ầ4.1.8 Triển khai thành ph n DWH lên BIDS 36ầ4.2 44_Nguyễn Thanh Sang _Thành phần đăng ký dự thi theo nhóm ngành nghề 404.2.1 Mô tả t ng quan v thành phổ ề ần DWH đăng ký dự thi theo nhóm ngành ngh 40ề4.2.2 Xác định ngu n dồ ữ liệu tích hợp thành ph n Kho d u 40ầ ữ liệ4.2.3 Xác định ý tưởng hình thành thành phần của Kho dữ liệu 41 4.2.4 Mô tả các DIM = tiêu chí phân tích 42 4.2.5 Mô tả cá Facts = S u phân tích c a thành ph n 43ố liệ ủ ầ4.2.6 Lập các View tính toán 43 4.2.7 Thiết kế DB mới tổ chức phân tích Kho dữ liệ u cho thành ph n 44ầ4.2.8 Triển khai thành ph n DWH trên BIDS 46ầ4.3 38_ Lê Thị Nhung _ Thành phần đăng ký dự thi theo khối thi 474.3.1 Mô tả t ng quan v thành ph n DWH : Thành phổ ề ầ ần đăng ký dự thi theo khối thi 474.3.2 Xác định ngu n dồ ữ liệu tích hợp thành ph n Kho d u 47ầ ữ liệ4.3.3 Thiết lập CSDL ngu n cồ ủa thành phần c a Kho dủ ữ liệu 48 4.3.4 Mô tả hệ thống các Dim = Tiêu chí phân tích (đánh giá) của thành phần đăng ký dự thi theo khối thi 49 4.3.5 Mô tả cá Facts = S u phân tích c a thành ph n 49ố liệ ủ ầ4.3.6 Thiết kế DB mới tổ chức phân tích Kho dữ liệ u cho thành ph n 49ầ4.3.7 Phân phân tích các DB gốc xác định yêu c u phân tích DWH c a thành ph n khầ ủ ầ ối thi
50
4.3.8 Triển khai thành ph n DWH lên BIDS 51ầ4.4 33_ Nguy n Hoài Nam _ Thành Phễ ần Đăng Ký Dự Thi Theo Phương Thức 524.4.1 Mô tả t ng quan v thành ph n DWH : Thành phổ ề ầ ần đăng ký dự thi theo phương thức :
52
4.4.2 Xác định ngu n dồ ữ liệu tích hợp thành ph n Kho d u 53ầ ữ liệ
Trang 11- 11 -
4.4.3 Xác định ý tưởng hình thành thành phần của Kho dữ liệu 54 4.4.4 Mô tả các Dim = Tiêu chí phân tích 54 4.4.5 Mô tả cá Facts = S u phân tích c a thành ph n 55ố liệ ủ ầ4.4.6 Lập các Views tính toán các Facts trên CSDL ngu n liên quan thành ph n DWH ồ ầtuyển sinh đại học 55 4.4.7 Phân phân tích các DB gốc xác định yêu c u phân tích DWH c a thành ph n 56ầ ủ ầ4.4.8 Triển khai thành ph n DWH lên BIDS 56ầ4.5 30 _ Nguyễn Vũ Lực _ Thành phần đăng ký dự thi theo dạng trường phổ thông (trường chuyên, phổ thông, quố ế, GDTX , ) 57 c t4.5.1 Mô tả t ng quan v thành phổ ề ần DWH đăng ký dự thi theo dạng trường phổ thông (trường chuyên, phổ thông, quốc tế, GDTX , ) 57 4.5.2 Xác định ngu n dồ ữ liệu tích hợp thành ph n Kho d u 58ầ ữ liệ4.5.3 Thiết lập CSDL ngu n cồ ủa thành phần c a Kho dủ ữ liệu 58 4.5.4 Mô tả các Dim = Tiêu chí phân tích 60 4.5.5 Mô tả cá Facts = S u phân tích c a thành ph n 61ố liệ ủ ầ4.5.6 Lập các Views tính toán các Facts trên CSDL ngu n liên quan thành ph n DWH ồ ầtuyển sinh đại học 63 4.5.7 Phân tích các DB gốc xác định yêu c u phân tích DWH cầ ủa thành phần 654.5.8 Triển khai thành ph n DWH lên BIDS 65ầ4.6 01 _ Lưu Gia Bảo _ Thành phần đăng ký dự thi theo cơ sở đào tạo 68 4.6.1 Mô tả t ng quan v thành ph n DWH ổ ề ầ thành phần đăng ký dự thi theo cơ sở đào tạo684.6.2 Xác định ngu n dồ ữ liệu tích hợp thành ph n Kho d u tuyầ ữ liệ ển sinh đại học khai thác
sử d ng tụ ại trường đạ ọc c a Vii h ủ ệt Nam 684.6.3 Thiết lập CSDL nguồn của thành phần của Kho dữ liệu tuyển sinh đạ ọc khai thác i h
sử d ng tụ ại trường đạ ọc c a Vii h ủ ệt Nam 704.6.4 Mô tả các Dim = tiêu chí phân tích (đáng giá) của thành phần đăng ký dư thi theo cơ
sở đào tạo 70 4.6.5 Mô tả các Facts 71 4.6.6 Lập các Views tính toán các Facts trên CSDL nguồn liên quan thành phần DWH 72 4.6.7 Phân phân tích các DB gốc xác định yêu cầu phân tích DWH của thành phần 73
Trang 12- 12 -
4.6.8 Triển khai thành ph n DWH lên BIDS 74ầ4.7 63_ NGUY N QU C VI T_ Thành phỄ Ố Ệ ần đăng ký dự thi theo nhóm tư vấn tuy n sinh ểcủa cơ sở đào tạo 75 4.7.1 Mô tả t ng quan v thành ph n DWH: Thành phổ ề ầ ần đăng ký dự thi theo nhóm tư vấn tuyển sinh của cơ sở đào tạo 754.7.2 Xác định ngu n dồ ữ liệu tích hợp thành ph n Kho d u 75ầ ữ liệ4.7.3 Thiết lập CSDL ngu n cồ ủa thành phần c a Kho dủ ữ liệu 76 4.7.4 Mô tả hệ thống các Dim = Tiêu chí phân tích 77 4.7.5 Mô tả các Facts = S u phân tích c a thành ph n 78ố liệ ủ ầ4.7.6 Lập các Views tính toán các Facts trên CSDL nguồn liên quan thành phần DWH 79 4.7.7 Phân phân tích các DB gốc xác định yêu cầu phân tích DWH của thành phần 83 4.8 32_ Lê Phương Nam_ Thành Phần Đăng Ký Dự Thi Theo Đối Tượng Ưu Tiên 84 4.8.1 Mô tả t ng quan v thành phổ ề ần DWH đăng ký dự thi theo đ i tưố ợng ưu tiên 844.8.2 Xác định ngu n dồ ữ liệu tích hợp thành ph n Kho d u 85ầ ữ liệ4.8.3 Xác định ý tưởng hình thành thành phần của Kho dữ liệu 86 4.8.4 Mô tả các Dim = tiêu chí phân tích 86 4.8.5 Mô tả các Fact = số liệu phân tích c a thành ph n 86ủ ầ4.8.6 Lập các Views tính toán các Facts trên CSDL nguồn liên quan thành phần DWH tuyển sinh đại học 87 4.8.7 Phân phân tích các DB gốc xác định yêu c u phân tích DWH c a thành ph n 89ầ ủ ầ4.8.8 Triển khai thành ph n DWH lên BIDS 89ầ4.9 24_ Nguyễn Phạm Duy Khiêm_ Thành phần đăng ký dự thi theo k ết quả trúng tuyển và nhập học 90
4.9.1 Mô tả t ng quan v thành phổ ề ần DWH đăng ký dự thi theo kết qu trúng tuy n và nh p ả ể ậhọc 90
4.9.2 Xác định ngu n dồ ữ liệu tích hợp thành ph n Kho d u 90ầ ữ liệ4.9.3 Thiết lập CSDL ngu n cồ ủa thành phần kho d ữ liệu 91 4.9.4 Mô tả các Dim = Tiêu chí phân tích 92 4.9.5 Mô tả cá Facts = S u phân tích c a thành ph n 93ố liệ ủ ầ
Trang 13- 13 -
4.9.6 Thiết lập các Views tính toán c n thiầ ết để ạ n p d ữ liệu t ừ DB gốc vào các Factors của thành phần DWH 93 4.9.7 Phân phân tích các DB gốc xác định yêu c u phân tích DWH c a thành ph n 96ầ ủ ầ4.9.8 Triển khai thành ph n DWH lên BIDS 96ầChương 5 KẾT LUẬN VÀ HƯỚNG PHÁT TRIỂN CỦA ĐỒ ÁN HỌC PHẦN 97 5.1 Kết luận 97 5.1.1 Những kết quả đạt được 97 5.1.2 Hạn ch 97ế5.2 Hướng phát tri n 97ể5.2.1 Hướng kh c ph c các h n ch 97ắ ụ ạ ế5.2.2 Hướng mở rộng ĐỒ ÁN H C PH N 97Ọ ẦDANH MỤC TÀI LI U THAM KH O 98Ệ ẢĐÁNH GIÁ KẾT QUẢ HỌC TẬP HỌC PHẦN 99
Trang 14- 14 -
Chương 1 GIỚI THIỆU VỀ ĐỒ ÁN HỌC PHẦN
1.1 Tổng quan về ĐỒ ÁN HỌC PHẦN
Đồ án H c phần DAWH430784 ọ
1.2 Nội dung chuyên môn chính của ĐỒ ÁN HỌC PHẦN
Môn học cung c p nh ng ki n thấ ữ ế ức cơ bản v kho d u, ki n trúc kho d u và các ề ữ liệ ế ữ liệ
mô hình đa chiều Thực hành về thi t kế kho dữ liệu và sử dụng các công cụ phổ biến tạo các ế
luồng công vi c tích h p dệ ợ ữ ệu Bên cli ạnh đó, cung cấp ki n th c v ph n m r ng c a SQL ế ứ ề ầ ở ộ ủđược h ỗ trợ b i các h qu n tr ở ệ ả ị cơ sở d ữ liệu quan h ệ để trả lời các câu h i phân tích trong kinh ỏdoanh
1.3 Mục tiêu của ĐỒ ÁN HỌC PHẦN
- Trình bày được các khái ni m và thu t ngệ ậ ữ cơ bản c a kho dủ ữ liệu và phân tích đượ ầm c tquan tr ng cọ ủa nó
- Khả năng phân tích, thiết kế ộ m t kho d u cho m t yêu c u c ữ liệ ộ ầ ụ thể
- Khả năng sử ụ d ng công c tích h p dụ ợ ữ liệu để triển khai vi c tích h p dệ ợ ữ liệu cho m t kho ộ
dữ liệu c ụ thể
- Khả năng sử ụ d ng ph n m r ng cầ ở ộ ủa SQL để trả ờ l i các câu h i v phân tích kinh doanh ỏ ề
- Khả năng thuyết trình và làm vi c nhóm ệ
1.4 Công cụ và nền tảng kỹ thuật thực hiện ĐỒ ÁN HỌC PHẦN
Các công c chính s dụ ử ụng trong đồ án này là
+ Microsoft SQL Server
+ Microsoft Visual Studio 2019
+ BIDS
1.5 Sản phẩm của ĐỒ ÁN HỌC PHẦN
- Tuyển Sinh Đại Học
1.6 Bố cục của báo cáo
Báo cáo gồm những nội dung như sau:
Chương 1: Giới thiệu đồ án của h c phần DWH ọ
Chương 2: Các cơ sở lý thuyết của HP phục việc thực hiện đề tài HP
Trang 16- 16 -
Chương 2 CƠ SỞ LÝ THUYẾT CỦA HỌC PHẦN
2.1 Tổng quan về kho dữ liệu (DWH)
2.1.1 Các khái niệm cơ bản về Kho dữ liệu
2.1.1.1 Kho dữ liệu (DWH)?
Kho d ữ liệu (data warehouse), g i mọ ột cách chính xác hơn là kho thông tin (information warehouse), là một cơ sở dữ liệu hướng đối tượng được thiết kế với việc tiếp cận các ý kiến trong mọi lĩnh vực đặc biệt là trong lĩnh vực kinh doanh Nó cung c p các công c ấ ụ để đáp ứng thông tin c n thi t cho các nhà qu n tr kinh doanh t i m i cầ ế ả ị ạ ọ ấp độ ổ chức t - không nh ng là ữnhững yêu c u d ầ ữ liệu ph c hứ ợp, mà còn là điều ki n thu n ti n nhệ ậ ệ ất để đạt được vi c l y thông ệ ấtin nhanh, chính xác M t kho dộ ữ liệu được thiế ế t k để ngườ ử d ng có th nh n ra thông tin i s ụ ể ậ
mà họ muốn có và truy cập đến b ng nh ng công cằ ữ ụ đơn giản
2.1.1.2 Nguyên lý hình thành DWH
Một kho dữ liệu là một s pha trự ộn của nhiều công ngh , bao gệ ồm các cơ sở ữ liệu đa d chiều và m i quan hố ệ giữa chúng, ki n trúc ch khách, giao diế ủ ện người dùng đồ ọ h a và nhi u ềnữa Nguyên nhân chính cho s phát tri n m t kho dự ể ộ ữ liệu là hoạt động tích hợp dữ liệu từ nhiều nguồn khác nhau vào m t kho dộ ữ liệu đơn lẻ và dày đặc mà kho này cung c p cho viấ ệc phân tích và ra quyết định trong công vi c kinh doanh, qu n lý ệ ả
2.1.1.3 Các đặc điểm cơ bản của DWH
*Tính hướng chủ đề (Object Oriented): Dữ liệu được tập hợp, phân lớp, lưu trữ và x ử
lý theo t ng ch ừ ủ đề, để ễ dàng xác đị d nh được nh ng thông tin c n thi t trong t ng hoữ ầ ế ừ ạt động Các dữ liệu c a m i chủ ỗ ủ đề chính trong tổ chức được liên k t vế ới các khóa đại diện và đưa vào cùng một vị trí
*Tính tích h p (Integration); Dợ ữ liệ ậu t p h p t nhi u nguợ ừ ề ồn khác nhau Điều này s ẽdẫn đến việc quá trình tập hợp phải thực hiện việc làm s ch, xắp xếp, rút gọn dữ liệu ạ
*Dữ liệu g n thắ ời gian và có tính lịch s Các dử ữ liệu đế ừn t quá trình kinh doanh của công ty có th có tể ừ nhiều năm trướ c
*Dữ liệu có tính ổn định (non volatility): Khi m t Transaction hoàn ch nh, d ộ ỉ ữ liệu không
thể t o thêm hay sạ ửa đổ i
2.1.1.4 Phân biệt [SS] DWH v i CSDL truy n thớ ề ống
Trang 17- 17 -
Mục đích Được thiết kế lưu lại bản ghi Đượđể c thiế ết k phân tích để
Xử lý Online Transactional Processing
tạp, m i quan h , chu n hóa ố ệ ẩ
Không được chuẩn hóa
Sử dụng Kỹ thuật mô hình ER được sử
dụng Kỹ thuật mô hình dữ liệu được sử d ng ụ
Kỹ thuật Capture dữ liệu Analyze dữ liệu
Trang 32- 32 -
- Từ hai b ng này kả ết v i bớ ảng ThiSinh để ấ l y thông tin thí sinh
- Thông qua hàm aggr count để đếm số lượng thí sinh thông qua groupby maKhuVuc
Tổng thí sinh đăng ký theo Tỉnh:
- Xuất phát từ table T nh ỉ
- Kết với bảng địa phương thông qua maTinh
- Từ hai b ng này kả ết v i bớ ảng ThiSinh để ấ l y thông tin thí sinh
- Thông qua hàm aggr count để đếm số lượng thí sinh thông qua groupby maTinh
VIEW: Thống kê số lượng thí sinh theo khu vực ưu tiên
CREATE VIEW view_ThongKeKV_TS ([Mã Khu Vực],[Số lượng thí sinh])AS
SELECT k.maKhuVuc as [Mã Khu V c], ự COUNT(t.maThiSinh) as [Số lượng thí
sinh]
Trang 33- 33 -
FROM dbo.ThiSinh as t INNER JOIN
dbo.DiaPhuong as d ON t.maDiaPhuong = d.maDiaPhuong INNER JOIN dbo.KhuVucUuTien ask ON d.maKhuvuc = k.maKhuVuc
GROUP BY k.maKhuVuc;
View: Thống kê số lượng thí sinh theo tỉnh
CREATE VIEW view_ThongKeTinh_TS ([Tỉnh], [Số lượng thí sinh]) AS
SELECT k.tenTinh as [Tỉnh], COUNT(t.maThiSinh) as [Số lượng thí sinh] FROM dbo.ThiSinh as t INNER JOIN
dbo.DiaPhuong as d ON t.maDiaPhuong = d.maDiaPhuong INNER JOIN dbo.Tinh ask ON d.maTinh = k.maTinh
GROUP BY k.tenTinh;
View: thống kê số lượng phiếu đăng ký theo khu vực
CREATE VIEW view_ThongKeKV_PhieuDK ([Mã Khu Vực],[S lượng phiếu])AS ốSELECT k.maKhuVuc as [Mã Khu V c], ự COUNT(p.maPhieu) as [Số lượng phiế u]FROM dbo.ThiSinh as t INNER JOIN
dbo.DiaPhuong as d ON t.maDiaPhuong = d.maDiaPhuong INNER JOIN dbo.KhuVucUuTien ask ON d.maKhuvuc = k.maKhuVuc INNER JOINdbo.PhieuDangKy as p ON t.maThiSinh = p.maThiSinh
Trang 34- 34 -
GROUP BY k.maKhuVuc;
GO
View: Thống kê số lượng phiếu đăng ký theo tỉnh
CREATE VIEW view_ThongKeTinh_PhieuDK ([Tỉnh], [Số lượng phi u]) ế AS
SELECT k.tenTinh as [Tỉnh], COUNT(p.maPhieu) as [Số lượng thí sinh]
FROM dbo.ThiSinh as t INNER JOIN
dbo.DiaPhuong as d ON t.maDiaPhuong = d.maDiaPhuong INNER JOIN dbo.Tinh ask ON d.maTinh = k.maTinh INNER JOIN
dbo.PhieuDangKy as p ON t.maThiSinh = p.maThiSinh
GROUP BY k.tenTinh;
4.1.7 Phân phân tích các DB gốc xác định yêu c u phân tích DWH cầ ủa thành phần
+ Tỉnh
Trang 35- 35 - + DiaPhuong
+ KhuVucUuTien
Trang 36- 36 -
4.1.8 Triển khai thành phần DWH lên BIDS
- Triển khai view lên DWH
+ View Số lượng thí sinh theo t nh ỉ
+ View số lượng thí sinh theo khu vực ưu tiên
Trang 37- 37 - + View Số lượng thí sinh theo t nh ỉ
+ View Số lượng phiếu đăng ký:
Trang 38- 38 -
- Triển khai tính toán theo measure
+ Measure Phiếu đăng ký theo Tỉnh
+ Measure Thi Sinh theo mã Tỉnh
Trang 39- 39 -
Trang 40- 40 -
4.2 44_Nguyễn Thanh Sang _Thành phần đăng k dự thi theo nhóm ngành nghề
4.2.1 Mô tả tổng quan về thành phần DWH đăng k dự thi theo nhóm ngành nghề
Fact: FACT theo t ng sổ ố lượng đơn dự tuyển theo nhóm ngành
Nguồn: Cơ sở đào tạo đại học
4.2.2 Xác định nguồn dữ liệu tích hợp thành phần Kho dữ liệu
Thành phần đăng ký dự thi theo nhóm ngành nghề (Công nghệ thông tin, Sư phạm, ): CSDL đăng ký dự thi do trường đại học quản lý:
- Lưu thông tin thí sinh, ngành và nhóm ngành