1. Trang chủ
  2. » Luận Văn - Báo Cáo

Phát triển mô hình kho dữ liệu tuyển sinh đại học khai thác sử dụng tại trường đại học của việt nam

100 0 0

Đang tải... (xem toàn văn)

Tài liệu hạn chế xem trước, để xem đầy đủ mời bạn chọn Tải xuống

THÔNG TIN TÀI LIỆU

Thông tin cơ bản

Tiêu đề Phát Triển Mô Hình Kho Dữ Liệu Tuyển Sinh Đại Học Khai Thác Sử Dụng Tại Trường Đại Học Của Việt Nam
Tác giả Vũ Văn Phước, Nguyễn Thanh Sang, Lê Thị Nhung, Nguyễn Hoài Nam, Nguyễn Vũ Lực, Lưu Gia Bảo, Nguyễn Quốc Việt, Lê Phương Nam, Nguyễn Phạm Duy Khiêm
Người hướng dẫn Võ Xuân Thể, Giảng Viên Chính
Trường học Trường Đại Học Sư Phạm Kỹ Thuật Tp. Hcm
Chuyên ngành Công Nghệ Thông Tin
Thể loại Đồ Án Học Phần
Năm xuất bản 2022
Thành phố Tp.Hcm
Định dạng
Số trang 100
Dung lượng 11,93 MB

Nội dung

Lập các Views tính toán các Facts trên CSDL ngu n liên quan thành ph n DWH ồ ầ tuyển sinh đại học .... Mô tả hệ thống các Dim = Tiêu chí phân tích đánh giá của thành phần đăng ký dự thi

Trang 1

TRƯỜNG ĐẠ I HỌC SƯ PHẠM KỸ THUẬT TP HCM

KHOA CÔNG NGH THÔNG TIN

ĐỒ ÁN H C PHẦN ỌTÊN HỌC PH N: Ầ Kho d ữ liệ u (DWH)

Trang 2

2 Nguy n Thanh Sang ễ [44] Thành phần đăng ký d ự thi theo nhóm ngành nghề

3 Lê Th Nhung [38] Thành phị ần đăng ký dự thi theo khối thi

4 Nguy n Hoài Nam [33] Thành phễ ần đăng ký dự thi theo phương thức

5 Nguyễn Vũ Lực [30] Thành phần đăng ký dự thi theo dạng trường ph ổ thông

6 Lưu Gia Bảo [01] Thành phần đăng ký dự thi theo cơ sở đào tạo

7 Nguy n Qu c Vi t [63] Thành phễ ố ệ ần đăng ký dự thi theo nhóm tư vấn tuy n sinh cể ủa cơ sởđào tạo

8 Lê Phương Nam [32] Thành phần đăng ký dự thi theo đối tượng ưu tiên

9 Nguy n Ph m Duy Khiêm [24] Thành phễ ạ ần đăng ký dự thi theo k t quế ả trúng tuy n và ểnhập học

Trang 3

- 3 -

ĐIỂM ĐÁNH GIÁ

NHÓM: 02

1 Vũ Văn Phước[42]:………….(………)………

2 Nguyễn Thanh Sang[44]:………….(………)…………

3 Lê Thị Nhung [38]:………….(………)………

4 Nguyễn Hoài Nam [33]:………….(………)………

5 Nguyễn Vũ Lực [30]:………….(………)………

6 Lưu Gia Bảo [01]:………….(………)………

7 Nguyễn Quốc Việt [63]:………….(………)………

8 Lê Phương Nam [32]:………….(………)………

9 Nguyễn Phạm Duy Khiêm [24]:………….(………)………

Ngày 30/05/2022

Giảng viên

Ký tên

Trang 4

- 4 -

TRƯỜNG ĐẠI HỌC SƯ PHẠM KỸ THUẬT TP.HCM

KHOA CÔNG NGH THÔNG TIN

Trang 5

- 5 -

LỜI CẢM ƠN

Ban giám hiệu trường Đại Học Sư phạm kỹ thuật Thành phố ồ Chí Minh vì đã tạo điề H u kiện

về cơ sở vật chất với hệ thống thư viện hiện đại, đa dạng các loại sách, tài liệu thuận lợi cho việc tìm kiếm, nghiên c u thông tin ứ

Xin cảm ơn giảng viên bộ môn Thầ- y Võ Xuân Thể đã giảng d y t n tình, chi tiạ ậ ết để chúng

em có đủ kiến thức và v n d ng chúng vào bài tiậ ụ ểu lu n này ậ

luận ch c chắ ắn sẽ không tránh kh i nh ng thi u sót R t mong nhỏ ữ ế ấ ận đượ ực s nh n xét, ý ki n ậ ếđóng góp, phê bình từ phía Thầy để bài tiểu luận được hoàn thiện hơn

Lời cuối cùng, chúng em xin kính chúc th y nhi u sầ ề ức khỏe, thành công và hạnh phúc.”

Trang 6

- 6 -

DANH MỤC CÁC TỪ VIẾT TẮT CSDL hoặc DB Cơ sở dữ liệu: DataBase

Công c hụ ỗ trợ ổ chứ t c, qu n lý và khai thác kho dả ữ liệu (H ệ

thống tổ chức dữ ệu thông minh cho các doanh nghi p): li ệBusiness Intelligence Development Studio của MicrosoftDWH Kho dữ u (Nhà kho dliệ ữ liệu): Data WareHouse

ERD Sơ đồ thực thể kết hợp: Entity Relationship Diagram

NF Dạng chu n c a CSDL: Normal Form ẩ ủ

SQL Ngôn ngữ v n tin có c u trúc: Structured Query Language ấ ấ

Trang 7

Người dùng (User):

Tài khoản (Account)

Là m t quy n làm vi c trên h ộ ề ệ ệ thống ph n mầ ềm được cấp phát cho một cá nhân thông qua tên tài kho n (username) và m t kh u ả ậ ẩ(password)

BigData Dữ liệu l n: là m t t p h p dxử lý dữ liệu bớ ằng các phương pháp truyềộ ậ ợ ữ liệu r t l n và ph c t p, không th ấ ớn thống ứ ạ ể

Trang 8

- 8 -

MỤC LỤC

LỜI CẢM ƠN 5

DANH MỤC CÁC T Ừ VIẾT T T 6Ắ DANH MỤC CÁC THU T NG 7Ậ Ữ MỤC LỤC 8 Chương 1 GIỚI THIỆU VỀ ĐỒ ÁN HỌC PH N 14Ầ 1.1 Tổng quan về ĐỒ ÁN HỌC PHẦN 14

1.2 Nội dung chuyên môn chính của ĐỒ ÁN HỌC PHẦN 14

1.3 Mục tiêu của ĐỒ ÁN HỌC PHẦN 14

1.4 Công cụ và n n t ng kề ả ỹ thuật thực hiện ĐỒ ÁN HỌC PHẦN 14

1.5 Sản phẩm của ĐỒ ÁN HỌC PHẦN 14

1.6 Bố cục của báo cáo 14

Chương 2 CƠ SỞ LÝ THUY T CẾ ỦA H C PHỌ ẦN 16

2.1 Tổng quan v kho dề ữ liệu (DWH) 16

2.1.1 Các khái niệm cơ bản về Kho dữ liệ u 16

2.1.1.1 Kho dữ liệu (DWH)? 16 2.1.1.2 Nguyên lý hình thành DWH 16 2.1.1.3 Các đặc điểm cơ bản của DWH 16 2.1.1.4 Phân bi t [SS] DWH vệ ới CSDL truy n th ng ề ố 16 2.1.2 Kiến trúc cơ bản của kho dữ liệu: 18

2.1.2.1 Tầng đáy: nạp dữ liệu 18 2.1.2.2 Tầng gi a: OLAP (OLAP server): x lý DWH ữ ử 18 2.1.2.3 Tầng trên cùng: ng d ng = khai thác s d ng DWH ứ ụ ử ụ 18 2.1.3 Mô hình CSDL đa chiều (Dimensional Modeling) 18

2.2 Phân tích và thiết kế Kho d u 18ữ liệ 2.2.1 Phân tích và thiết kế kho d ữ liệu theo hướng mô hình hóa nhi u chi u (Dimensional ề ề Modeling) 18

Trang 9

- 9 -

2.2.2 Các dạng (phương pháp) tích hợp d u 19ữ liệ2.2.3 Các bước cơ bản trong tiến trình tích hợp dữ liệu 20 2.2.4 Các công cụ tích hợp d u: 20ữ liệ2.2.5 Lập các lu ng công viồ ệc tích hợp d u (Data Integration Workflows) 20ữ liệ2.2.6 Hệ thống OLTP (On-Line Transaction Processing = X l giao dử ý ịch trực tuyến) 202.3 Vấn tin khai thác s d ng Kho d u 21ử ụ ữ liệ2.3.1 Vấn tin với các phép toán tổng hợp c a SQL trên kho dủ ữ liệu 212.3.2 Vấn tin với các hàm phân tích của SQL trên kho d u 21ữ liệ2.3.3 Vấn tin dùng Materialized View để phân tích trên kho dữ liệu 21 2.3.4 Hệ thống OLAP 22Chương 3 TỔNG QUAN VỀ KHO D Ữ LIỆU TUYỂN SINH ĐẠI HỌC SỬ DỤNG TẠI TRƯỜNG ĐẠI HỌC VIỆT NAM 23 3.1 Ý tưởng hình thành DWH Tuyển sinh Đạ i học sử dụng tại trường Đại học Việt Nam:

23

3.2 Giới thiệu chung v Kho d ề ữ liệu 24 3.2.1 Mô tả t ng quan v DWH 24ổ ề3.2.2 Các d u nguữ liệ ồn hình thành DWH 24 3.3 Xác định nhu c n t ầ ổ chức và phân tích dữ liệu của toàn bộ DWH 25 3.4 Các thành ph n thành ph n Kho d u phân công các cá nhân ph trách 25ầ ầ ữ liệ ụChương 4 PHÂN TÍCH, THI T K VÀ KHAI THÁC S D NG CÁC THÀNH Ế Ế Ử ỤPHẦN KHO DỮ LIỆU TUYỂN SINH ĐẠI HỌC SỬ Ụ D NG TẠI TRƯỜNG ĐẠI HỌC VIỆT NAM 27 4.1 42_ Vũ Văn Phước _ Thành phần đăng ký dự thi theo tỉnh hoặc vùng mi n và khu ềvực ưu tiên 27 4.1.1 Mô tả t ng quan v thành ph n ổ ề ầ DWH đăng ký dự thi theo tỉnh ho c vùng mi n và khu ặ ềvực ưu tiên 27 4.1.2 Xác định ngu n dồ ữ liệu tích hợp thành ph n Kho d u 27ầ ữ liệ4.1.3 Thiết lập CSDL ngu n cồ ủa thành phần c a Kho dủ ữ liệu 28 4.1.4 Mô tả các Dim = Tiêu chí phân tích 30

Trang 10

- 10 -

4.1.5 Mô tả cá Facts = S u phân tích c a thành ph n 31ố liệ ủ ầ4.1.6 Lập các Views tính toán các Facts trên CSDL ngu n liên quan thành ph n DWH ồ ầtuyển sinh đại học 32 4.1.7 Phân phân tích các DB gốc xác định yêu c u phân tích DWH c a thành ph n 34ầ ủ ầ4.1.8 Triển khai thành ph n DWH lên BIDS 36ầ4.2 44_Nguyễn Thanh Sang _Thành phần đăng ký dự thi theo nhóm ngành nghề 404.2.1 Mô tả t ng quan v thành phổ ề ần DWH đăng ký dự thi theo nhóm ngành ngh 40ề4.2.2 Xác định ngu n dồ ữ liệu tích hợp thành ph n Kho d u 40ầ ữ liệ4.2.3 Xác định ý tưởng hình thành thành phần của Kho dữ liệu 41 4.2.4 Mô tả các DIM = tiêu chí phân tích 42 4.2.5 Mô tả cá Facts = S u phân tích c a thành ph n 43ố liệ ủ ầ4.2.6 Lập các View tính toán 43 4.2.7 Thiết kế DB mới tổ chức phân tích Kho dữ liệ u cho thành ph n 44ầ4.2.8 Triển khai thành ph n DWH trên BIDS 46ầ4.3 38_ Lê Thị Nhung _ Thành phần đăng ký dự thi theo khối thi 474.3.1 Mô tả t ng quan v thành ph n DWH : Thành phổ ề ầ ần đăng ký dự thi theo khối thi 474.3.2 Xác định ngu n dồ ữ liệu tích hợp thành ph n Kho d u 47ầ ữ liệ4.3.3 Thiết lập CSDL ngu n cồ ủa thành phần c a Kho dủ ữ liệu 48 4.3.4 Mô tả hệ thống các Dim = Tiêu chí phân tích (đánh giá) của thành phần đăng ký dự thi theo khối thi 49 4.3.5 Mô tả cá Facts = S u phân tích c a thành ph n 49ố liệ ủ ầ4.3.6 Thiết kế DB mới tổ chức phân tích Kho dữ liệ u cho thành ph n 49ầ4.3.7 Phân phân tích các DB gốc xác định yêu c u phân tích DWH c a thành ph n khầ ủ ầ ối thi

50

4.3.8 Triển khai thành ph n DWH lên BIDS 51ầ4.4 33_ Nguy n Hoài Nam _ Thành Phễ ần Đăng Ký Dự Thi Theo Phương Thức 524.4.1 Mô tả t ng quan v thành ph n DWH : Thành phổ ề ầ ần đăng ký dự thi theo phương thức :

52

4.4.2 Xác định ngu n dồ ữ liệu tích hợp thành ph n Kho d u 53ầ ữ liệ

Trang 11

- 11 -

4.4.3 Xác định ý tưởng hình thành thành phần của Kho dữ liệu 54 4.4.4 Mô tả các Dim = Tiêu chí phân tích 54 4.4.5 Mô tả cá Facts = S u phân tích c a thành ph n 55ố liệ ủ ầ4.4.6 Lập các Views tính toán các Facts trên CSDL ngu n liên quan thành ph n DWH ồ ầtuyển sinh đại học 55 4.4.7 Phân phân tích các DB gốc xác định yêu c u phân tích DWH c a thành ph n 56ầ ủ ầ4.4.8 Triển khai thành ph n DWH lên BIDS 56ầ4.5 30 _ Nguyễn Vũ Lực _ Thành phần đăng ký dự thi theo dạng trường phổ thông (trường chuyên, phổ thông, quố ế, GDTX , ) 57 c t4.5.1 Mô tả t ng quan v thành phổ ề ần DWH đăng ký dự thi theo dạng trường phổ thông (trường chuyên, phổ thông, quốc tế, GDTX , ) 57 4.5.2 Xác định ngu n dồ ữ liệu tích hợp thành ph n Kho d u 58ầ ữ liệ4.5.3 Thiết lập CSDL ngu n cồ ủa thành phần c a Kho dủ ữ liệu 58 4.5.4 Mô tả các Dim = Tiêu chí phân tích 60 4.5.5 Mô tả cá Facts = S u phân tích c a thành ph n 61ố liệ ủ ầ4.5.6 Lập các Views tính toán các Facts trên CSDL ngu n liên quan thành ph n DWH ồ ầtuyển sinh đại học 63 4.5.7 Phân tích các DB gốc xác định yêu c u phân tích DWH cầ ủa thành phần 654.5.8 Triển khai thành ph n DWH lên BIDS 65ầ4.6 01 _ Lưu Gia Bảo _ Thành phần đăng ký dự thi theo cơ sở đào tạo 68 4.6.1 Mô tả t ng quan v thành ph n DWH ổ ề ầ thành phần đăng ký dự thi theo cơ sở đào tạo684.6.2 Xác định ngu n dồ ữ liệu tích hợp thành ph n Kho d u tuyầ ữ liệ ển sinh đại học khai thác

sử d ng tụ ại trường đạ ọc c a Vii h ủ ệt Nam 684.6.3 Thiết lập CSDL nguồn của thành phần của Kho dữ liệu tuyển sinh đạ ọc khai thác i h

sử d ng tụ ại trường đạ ọc c a Vii h ủ ệt Nam 704.6.4 Mô tả các Dim = tiêu chí phân tích (đáng giá) của thành phần đăng ký dư thi theo cơ

sở đào tạo 70 4.6.5 Mô tả các Facts 71 4.6.6 Lập các Views tính toán các Facts trên CSDL nguồn liên quan thành phần DWH 72 4.6.7 Phân phân tích các DB gốc xác định yêu cầu phân tích DWH của thành phần 73

Trang 12

- 12 -

4.6.8 Triển khai thành ph n DWH lên BIDS 74ầ4.7 63_ NGUY N QU C VI T_ Thành phỄ Ố Ệ ần đăng ký dự thi theo nhóm tư vấn tuy n sinh ểcủa cơ sở đào tạo 75 4.7.1 Mô tả t ng quan v thành ph n DWH: Thành phổ ề ầ ần đăng ký dự thi theo nhóm tư vấn tuyển sinh của cơ sở đào tạo 754.7.2 Xác định ngu n dồ ữ liệu tích hợp thành ph n Kho d u 75ầ ữ liệ4.7.3 Thiết lập CSDL ngu n cồ ủa thành phần c a Kho dủ ữ liệu 76 4.7.4 Mô tả hệ thống các Dim = Tiêu chí phân tích 77 4.7.5 Mô tả các Facts = S u phân tích c a thành ph n 78ố liệ ủ ầ4.7.6 Lập các Views tính toán các Facts trên CSDL nguồn liên quan thành phần DWH 79 4.7.7 Phân phân tích các DB gốc xác định yêu cầu phân tích DWH của thành phần 83 4.8 32_ Lê Phương Nam_ Thành Phần Đăng Ký Dự Thi Theo Đối Tượng Ưu Tiên 84 4.8.1 Mô tả t ng quan v thành phổ ề ần DWH đăng ký dự thi theo đ i tưố ợng ưu tiên 844.8.2 Xác định ngu n dồ ữ liệu tích hợp thành ph n Kho d u 85ầ ữ liệ4.8.3 Xác định ý tưởng hình thành thành phần của Kho dữ liệu 86 4.8.4 Mô tả các Dim = tiêu chí phân tích 86 4.8.5 Mô tả các Fact = số liệu phân tích c a thành ph n 86ủ ầ4.8.6 Lập các Views tính toán các Facts trên CSDL nguồn liên quan thành phần DWH tuyển sinh đại học 87 4.8.7 Phân phân tích các DB gốc xác định yêu c u phân tích DWH c a thành ph n 89ầ ủ ầ4.8.8 Triển khai thành ph n DWH lên BIDS 89ầ4.9 24_ Nguyễn Phạm Duy Khiêm_ Thành phần đăng ký dự thi theo k ết quả trúng tuyển và nhập học 90

4.9.1 Mô tả t ng quan v thành phổ ề ần DWH đăng ký dự thi theo kết qu trúng tuy n và nh p ả ể ậhọc 90

4.9.2 Xác định ngu n dồ ữ liệu tích hợp thành ph n Kho d u 90ầ ữ liệ4.9.3 Thiết lập CSDL ngu n cồ ủa thành phần kho d ữ liệu 91 4.9.4 Mô tả các Dim = Tiêu chí phân tích 92 4.9.5 Mô tả cá Facts = S u phân tích c a thành ph n 93ố liệ ủ ầ

Trang 13

- 13 -

4.9.6 Thiết lập các Views tính toán c n thiầ ết để ạ n p d ữ liệu t ừ DB gốc vào các Factors của thành phần DWH 93 4.9.7 Phân phân tích các DB gốc xác định yêu c u phân tích DWH c a thành ph n 96ầ ủ ầ4.9.8 Triển khai thành ph n DWH lên BIDS 96ầChương 5 KẾT LUẬN VÀ HƯỚNG PHÁT TRIỂN CỦA ĐỒ ÁN HỌC PHẦN 97 5.1 Kết luận 97 5.1.1 Những kết quả đạt được 97 5.1.2 Hạn ch 97ế5.2 Hướng phát tri n 97ể5.2.1 Hướng kh c ph c các h n ch 97ắ ụ ạ ế5.2.2 Hướng mở rộng ĐỒ ÁN H C PH N 97Ọ ẦDANH MỤC TÀI LI U THAM KH O 98Ệ ẢĐÁNH GIÁ KẾT QUẢ HỌC TẬP HỌC PHẦN 99

Trang 14

- 14 -

Chương 1 GIỚI THIỆU VỀ ĐỒ ÁN HỌC PHẦN

1.1 Tổng quan về ĐỒ ÁN HỌC PHẦN

Đồ án H c phần DAWH430784 ọ

1.2 Nội dung chuyên môn chính của ĐỒ ÁN HỌC PHẦN

Môn học cung c p nh ng ki n thấ ữ ế ức cơ bản v kho d u, ki n trúc kho d u và các ề ữ liệ ế ữ liệ

mô hình đa chiều Thực hành về thi t kế kho dữ liệu và sử dụng các công cụ phổ biến tạo các ế

luồng công vi c tích h p dệ ợ ữ ệu Bên cli ạnh đó, cung cấp ki n th c v ph n m r ng c a SQL ế ứ ề ầ ở ộ ủđược h ỗ trợ b i các h qu n tr ở ệ ả ị cơ sở d ữ liệu quan h ệ để trả lời các câu h i phân tích trong kinh ỏdoanh

1.3 Mục tiêu của ĐỒ ÁN HỌC PHẦN

- Trình bày được các khái ni m và thu t ngệ ậ ữ cơ bản c a kho dủ ữ liệu và phân tích đượ ầm c tquan tr ng cọ ủa nó

- Khả năng phân tích, thiết kế ộ m t kho d u cho m t yêu c u c ữ liệ ộ ầ ụ thể

- Khả năng sử ụ d ng công c tích h p dụ ợ ữ liệu để triển khai vi c tích h p dệ ợ ữ liệu cho m t kho ộ

dữ liệu c ụ thể

- Khả năng sử ụ d ng ph n m r ng cầ ở ộ ủa SQL để trả ờ l i các câu h i v phân tích kinh doanh ỏ ề

- Khả năng thuyết trình và làm vi c nhóm ệ

1.4 Công cụ và nền tảng kỹ thuật thực hiện ĐỒ ÁN HỌC PHẦN

Các công c chính s dụ ử ụng trong đồ án này là

+ Microsoft SQL Server

+ Microsoft Visual Studio 2019

+ BIDS

1.5 Sản phẩm của ĐỒ ÁN HỌC PHẦN

- Tuyển Sinh Đại Học

1.6 Bố cục của báo cáo

Báo cáo gồm những nội dung như sau:

Chương 1: Giới thiệu đồ án của h c phần DWH ọ

Chương 2: Các cơ sở lý thuyết của HP phục việc thực hiện đề tài HP

Trang 16

- 16 -

Chương 2 CƠ SỞ LÝ THUYẾT CỦA HỌC PHẦN

2.1 Tổng quan về kho dữ liệu (DWH)

2.1.1 Các khái niệm cơ bản về Kho dữ liệu

2.1.1.1 Kho dữ liệu (DWH)?

Kho d ữ liệu (data warehouse), g i mọ ột cách chính xác hơn là kho thông tin (information warehouse), là một cơ sở dữ liệu hướng đối tượng được thiết kế với việc tiếp cận các ý kiến trong mọi lĩnh vực đặc biệt là trong lĩnh vực kinh doanh Nó cung c p các công c ấ ụ để đáp ứng thông tin c n thi t cho các nhà qu n tr kinh doanh t i m i cầ ế ả ị ạ ọ ấp độ ổ chức t - không nh ng là ữnhững yêu c u d ầ ữ liệu ph c hứ ợp, mà còn là điều ki n thu n ti n nhệ ậ ệ ất để đạt được vi c l y thông ệ ấtin nhanh, chính xác M t kho dộ ữ liệu được thiế ế t k để ngườ ử d ng có th nh n ra thông tin i s ụ ể ậ

mà họ muốn có và truy cập đến b ng nh ng công cằ ữ ụ đơn giản

2.1.1.2 Nguyên lý hình thành DWH

Một kho dữ liệu là một s pha trự ộn của nhiều công ngh , bao gệ ồm các cơ sở ữ liệu đa d chiều và m i quan hố ệ giữa chúng, ki n trúc ch khách, giao diế ủ ện người dùng đồ ọ h a và nhi u ềnữa Nguyên nhân chính cho s phát tri n m t kho dự ể ộ ữ liệu là hoạt động tích hợp dữ liệu từ nhiều nguồn khác nhau vào m t kho dộ ữ liệu đơn lẻ và dày đặc mà kho này cung c p cho viấ ệc phân tích và ra quyết định trong công vi c kinh doanh, qu n lý ệ ả

2.1.1.3 Các đặc điểm cơ bản của DWH

*Tính hướng chủ đề (Object Oriented): Dữ liệu được tập hợp, phân lớp, lưu trữ và x ử

lý theo t ng ch ừ ủ đề, để ễ dàng xác đị d nh được nh ng thông tin c n thi t trong t ng hoữ ầ ế ừ ạt động Các dữ liệu c a m i chủ ỗ ủ đề chính trong tổ chức được liên k t vế ới các khóa đại diện và đưa vào cùng một vị trí

*Tính tích h p (Integration); Dợ ữ liệ ậu t p h p t nhi u nguợ ừ ề ồn khác nhau Điều này s ẽdẫn đến việc quá trình tập hợp phải thực hiện việc làm s ch, xắp xếp, rút gọn dữ liệu ạ

*Dữ liệu g n thắ ời gian và có tính lịch s Các dử ữ liệu đế ừn t quá trình kinh doanh của công ty có th có tể ừ nhiều năm trướ c

*Dữ liệu có tính ổn định (non volatility): Khi m t Transaction hoàn ch nh, d ộ ỉ ữ liệu không

thể t o thêm hay sạ ửa đổ i

2.1.1.4 Phân biệt [SS] DWH v i CSDL truy n thớ ề ống

Trang 17

- 17 -

Mục đích Được thiết kế lưu lại bản ghi Đượđể c thiế ết k phân tích để

Xử lý Online Transactional Processing

tạp, m i quan h , chu n hóa ố ệ ẩ

Không được chuẩn hóa

Sử dụng Kỹ thuật mô hình ER được sử

dụng Kỹ thuật mô hình dữ liệu được sử d ng ụ

Kỹ thuật Capture dữ liệu Analyze dữ liệu

Trang 32

- 32 -

- Từ hai b ng này kả ết v i bớ ảng ThiSinh để ấ l y thông tin thí sinh

- Thông qua hàm aggr count để đếm số lượng thí sinh thông qua groupby maKhuVuc

Tổng thí sinh đăng ký theo Tỉnh:

- Xuất phát từ table T nh ỉ

- Kết với bảng địa phương thông qua maTinh

- Từ hai b ng này kả ết v i bớ ảng ThiSinh để ấ l y thông tin thí sinh

- Thông qua hàm aggr count để đếm số lượng thí sinh thông qua groupby maTinh

VIEW: Thống kê số lượng thí sinh theo khu vực ưu tiên

CREATE VIEW view_ThongKeKV_TS ([Mã Khu Vực],[Số lượng thí sinh])AS

SELECT k.maKhuVuc as [Mã Khu V c], ự COUNT(t.maThiSinh) as [Số lượng thí

sinh]

Trang 33

- 33 -

FROM dbo.ThiSinh as t INNER JOIN

dbo.DiaPhuong as d ON t.maDiaPhuong = d.maDiaPhuong INNER JOIN dbo.KhuVucUuTien ask ON d.maKhuvuc = k.maKhuVuc

GROUP BY k.maKhuVuc;

View: Thống kê số lượng thí sinh theo tỉnh

CREATE VIEW view_ThongKeTinh_TS ([Tỉnh], [Số lượng thí sinh]) AS

SELECT k.tenTinh as [Tỉnh], COUNT(t.maThiSinh) as [Số lượng thí sinh] FROM dbo.ThiSinh as t INNER JOIN

dbo.DiaPhuong as d ON t.maDiaPhuong = d.maDiaPhuong INNER JOIN dbo.Tinh ask ON d.maTinh = k.maTinh

GROUP BY k.tenTinh;

View: thống kê số lượng phiếu đăng ký theo khu vực

CREATE VIEW view_ThongKeKV_PhieuDK ([Mã Khu Vực],[S lượng phiếu])AS ốSELECT k.maKhuVuc as [Mã Khu V c], ự COUNT(p.maPhieu) as [Số lượng phiế u]FROM dbo.ThiSinh as t INNER JOIN

dbo.DiaPhuong as d ON t.maDiaPhuong = d.maDiaPhuong INNER JOIN dbo.KhuVucUuTien ask ON d.maKhuvuc = k.maKhuVuc INNER JOINdbo.PhieuDangKy as p ON t.maThiSinh = p.maThiSinh

Trang 34

- 34 -

GROUP BY k.maKhuVuc;

GO

View: Thống kê số lượng phiếu đăng ký theo tỉnh

CREATE VIEW view_ThongKeTinh_PhieuDK ([Tỉnh], [Số lượng phi u]) ế AS

SELECT k.tenTinh as [Tỉnh], COUNT(p.maPhieu) as [Số lượng thí sinh]

FROM dbo.ThiSinh as t INNER JOIN

dbo.DiaPhuong as d ON t.maDiaPhuong = d.maDiaPhuong INNER JOIN dbo.Tinh ask ON d.maTinh = k.maTinh INNER JOIN

dbo.PhieuDangKy as p ON t.maThiSinh = p.maThiSinh

GROUP BY k.tenTinh;

4.1.7 Phân phân tích các DB gốc xác định yêu c u phân tích DWH cầ ủa thành phần

+ Tỉnh

Trang 35

- 35 - + DiaPhuong

+ KhuVucUuTien

Trang 36

- 36 -

4.1.8 Triển khai thành phần DWH lên BIDS

- Triển khai view lên DWH

+ View Số lượng thí sinh theo t nh ỉ

+ View số lượng thí sinh theo khu vực ưu tiên

Trang 37

- 37 - + View Số lượng thí sinh theo t nh ỉ

+ View Số lượng phiếu đăng ký:

Trang 38

- 38 -

- Triển khai tính toán theo measure

+ Measure Phiếu đăng ký theo Tỉnh

+ Measure Thi Sinh theo mã Tỉnh

Trang 39

- 39 -

Trang 40

- 40 -

4.2 44_Nguyễn Thanh Sang _Thành phần đăng k dự thi theo nhóm ngành nghề

4.2.1 Mô tả tổng quan về thành phần DWH đăng k dự thi theo nhóm ngành nghề

Fact: FACT theo t ng sổ ố lượng đơn dự tuyển theo nhóm ngành

Nguồn: Cơ sở đào tạo đại học

4.2.2 Xác định nguồn dữ liệu tích hợp thành phần Kho dữ liệu

Thành phần đăng ký dự thi theo nhóm ngành nghề (Công nghệ thông tin, Sư phạm, ): CSDL đăng ký dự thi do trường đại học quản lý:

- Lưu thông tin thí sinh, ngành và nhóm ngành

Ngày đăng: 09/04/2024, 16:11

TÀI LIỆU CÙNG NGƯỜI DÙNG

TÀI LIỆU LIÊN QUAN

w