1. Trang chủ
  2. » Luận Văn - Báo Cáo

MÔ HÌNH CƠ SỞ DỮ LIỆU PHÂN TÁN VÀ ỨNG DỤNG

108 2,5K 3

Đang tải... (xem toàn văn)

Tài liệu hạn chế xem trước, để xem đầy đủ mời bạn chọn Tải xuống

THÔNG TIN TÀI LIỆU

Thông tin cơ bản

Định dạng
Số trang 108
Dung lượng 2,57 MB

Nội dung

MÔ HÌNH CƠ SỞ DỮ LIỆU PHÂN TÁN VÀ ỨNG DỤNG

Trang 1

TRƯỜNG ĐẠI HỌC BÁCH KHOA HÀ NỘI KHOA CÔNG NGHỆ THÔNG TIN

Trang 2

PHIẾU GIAO NHIỆM VỤ ĐỒ ÁN TỐT NGHIỆP

1 Mục đích nội dung của ĐATN

- Nghiên cứu về Cơ sở dữ liệu phân tán

- Tìm hiểu về hệ Cơ sở dữ liệu quốc gia về Kinh tế - Xã hội

- Tìm hiểu khả năng áp dụng mô hình cơ sở dữ liệu phân tán vào hệ Cơ sở dữ liệu quốc gia về Kinh tế- Xã hội

2 Các nhiệm vụ cụ thể của ĐATN

- Tìm hiểu lý thuyết về Cơ sở dữ liệu phân tán

- Khảo sát, tìm hiểu về hệ Cơ sở dữ liệu quốc gia về Kinh tế -Xã hội

- Tìm hiểu công nghệ áp dụng để thực hiện nhân bản dữ liệu

- Viết chương trình ứng dụng minh họa

3 Lời cam đoan của sinh viên:

Tôi – Trần Minh Tuấn - cam kết ĐATN là công trình nghiên cứu của bản thân tôi dưới sự hướng dẫn của ThS Thạc Bình Cường

Các kết quả nêu trong ĐATN là trung thực, không phải là sao chép toàn văn của bất

Hà Nội, ngày 23 tháng 5 năm 2008

Giáo viên hướng dẫn

ThS Thạc Bình Cường

Trang 3

TÓM TẮT NỘI DUNG ĐỒ ÁN TỐT NGHIỆP

Nội dung của đồ án trình bày bao gồm các phần trình bày về lý thuyết cơ sở dữ liệuphân tán, phần về hệ cơ sở dữ liệu quốc gia về Kinh tế- Xã hội và phần xây dựng ứng dụngminh họa

Phần lý thuyết cơ sở dữ liệu phân tán trình bày những lý thuyết về hệ cơ sở dữ liệuphân tán bao gồm: khái niệm, đặc trưng, ưu, nhược điểm, các kiến trúc cơ bản, cũng nhưcác vấn đề liên quan khi thiết kế hệ cơ sở dữ liệu phân tán

Phần về cơ sở dữ liệu quốc gia về Kinh tế- Xã hội mô tả về các mục tiêu, yêu cầu của

hệ thống, trình bày về các mô hình chức năng và chi tiết các bảng trong cơ sở dữ liệuPhần xây dựng ứng dụng minh họa thực hiện minh họa cho cơ chế nhân bản dữ liệu

Trang 4

ABSTRACT OF THESIS

The thesis includes parts which present the thesis of distributed database, thedescription about the National Socio-Economic Database, and the development of theillustrative application

The thesis of distributed database presents the definition, characteristics, advantagesand disadvantages, models, and some relating problems when designing distributeddatabase system

The part written about the National Socio-Economic Database depicts the objectives,requirements, functional models and detailed design of tables in the system

The illustrative application illustrates the replication mechanism

Trang 5

LỜI CẢM ƠN

Em xin chân thành cảm ơn thầy giáo, ThS Thạc Bình Cường, bộ môn Côngnghệ phần mềm, khoa Công nghệ thông tin, trường Đại học Bách Khoa Hà Nội, đãtận tình hướng dẫn, giúp đỡ, chỉ bảo, cung cấp nhiều tài liệu tham khảo và tạo mọiđiều kiện thuận lợi cho em hoàn thành tốt đồ án tốt nghiệp này

Em cũng xin bày tỏ lòng biết ơn sâu sắc tới tập thể các thầy, cô giáo trườngĐại học Bách Khoa Hà Nội nói chung và Khoa Công nghệ thông tin nói riêng đãtận tình giảng dạy, truyền đạt cho em những kiến thức, kinh nghiệm quý báu trongsuốt những năm học vừa qua

Cuối cùng, em xin gửi lời cảm ơn đến gia đình và bạn bè, đã giúp đỡ và tạođiều kiện cho em trong suốt quá trình thực hiện đồ án

Hà nội ngày 23 tháng 05 năm 2008

Sinh viên: Trần Minh Tuấn

Lớp : CNPM-K48

Trang 6

LỜI MỞ ĐẦU

Bước sang thế kỷ 21, nhân loại đã chuyển từ xã hội công nghiệp sang xã hội thôngtin Với mạng Internet tốc độ cao ngày càng được mở rộng trên toàn thế giới, vớiviệc ứng dụng Công nghệ thông tin ngày càng sâu hơn trong nhiều lĩnh vực, nhucầu và khả năng kết nối, chia sẻ thông tin của con người đang trở nên lớn hơn baogiờ hết Để không bị tụt hậu lại phía sau, mọi quốc gia, mọi tổ chức kinh tế xã hộiđều nhận thức được vai trò quan trọng không thể thiếu của công nghệ thông tintrong việc nâng cao hiệu quả hoạt động, thúc đẩy sự phát triển của quốc gia, tổ chứcmình Tuy nhiên vấn đề khó khăn đặt ra ở đây là khối lượng công việc cần thựchiện ngày càng lớn, lượng dữ liệu cần lưu trữ và các thao tác xử lý chúng ngày càngtăng trong khi do các đặc điểm về qui mô, tổ chức và nghiệp vụ, các kho dữ liệu lạiđược phân bố trải rộng ở nhiều nơi khác nhau, sử dụng những công nghệ khác nhau,khả năng liên kết là rất hạn chế Trong những trường hợp như vậy, các tổ chức phảitiến hành xây dựng các ứng dụng trên hệ cơ sở dữ liệu phân tán Công nghệ phântán đã được nghiên cứu khá lâu và ngày càng trở nên ổn định, hoàn thiện hơn Nócung cấp khả năng kết nối, chia sẻ dữ liệu gần như không có giới hạn, nâng caohiệu quả hoạt động và khả năng mở rộng của hệ thống, tăng tính tin cậy và tính sẵnsàng cho người sử dụng

Ở Việt Nam, việc ứng dụng Công nghệ thông tin nói chung và cơ sở dữ liệu phântán nói riêng vẫn còn hạn chế, lý do chủ yếu có thể là do hạ tầng mạng, công nghệcủa Việt Nam còn chưa thực sự phát triển Tuy nhiên trong những năm trở lại đâytình hình đã được cải thiện rất tích cực Trong khối các cơ quan Nhà nước, Chínhphủ cũng thể hiện quyết tâm rất cao về việc tin học hóa công tác quản lý, cải cáchthủ tục hành chính, tăng cường trao đổi và chia sẻ thông tin, giúp nâng cao hiệu quảđiều hành, tiết kiệm chi phí, từng bước tiến đến mục tiêu Chính phủ điện tử

Nằm trong khuôn khổ của chương trình hỗ trợ kĩ thuật của Ủy ban Châu Âu choViệt Nam, dự án xây dựng cơ sở dữ liệu quốc gia về Kinh tế-Xã hội đã và đangđược triển khai tại Bộ Kế hoạch và Đầu tư nhằm lưu trữ các thông tin, dữ liệu, cácbáo cáo về tình hình phát triển kinh tế xã hội quốc gia qua các năm, phục vụ choquá trình điều hành của Chính phủ cũng như công tác dự báo, lập kế hoạch địnhhướng phát triển đất nước

Qua một thời gian tìm hiểu, em quyết định chọn đề tài cho đồ án tốt nghiệp củamình là:

“Mô hình Cơ sở dữ liệu phân tán và ứng dụng vào hệ cơ sở dữ liệu quốc gia về Kinh tế-Xã hội”

Đồ án tập trung tìm hiểu về lý thuyết, một số kĩ thuật liên quan đến cơ sở dữliệu phân tán và ứng dụng những lý thuyết và kỹ thuật đó vào quá trình kết nối, traođổi dữ liệu trong hệ cơ sở dữ liệu quốc gia về Kinh tế-Xã hội

Trang 7

Đồ án gồm 5 chương như sau:

Chương I: Tổng quan về hệ cơ sở dữ liệu quốc gia về Kinh tế-Xã hội

Chương này trình bày chung về hệ thống cần xây dựng, các mục tiêu, yêu cầucủa hệ thống, và đưa ra mô hình tổng thể cho hệ thống

Chương II: Lý thuyết cơ sở dữ liệu phân tán

Chương này trình bày những lý thuyết về hệ cơ sở dữ liệu phân tán, bao gồmkhái niệm, đặc trưng, ưu, nhược điểm, các kiến trúc cơ bản, cũng như các vấn đềliên quan khi thiết kế hệ cơ sở dữ liệu phân tán

Chương III: Phân tích hệ cơ sở dữ liệu quốc gia về Kinh tế-Xã hội

Chương này trình bày về các mô hình chức năng của hệ cơ sở dữ liệu quốc gia

về Kinh tế-Xã hội

Chương IV: Thiết kế hệ cơ sở dữ liệu quốc gia về Kinh tế-Xã hội

Chương này trình bày về thiết kế chi tiết các bảng trong cơ sở dữ liệu quốc gia

về Kinh tế-Xã hội

Chương V: Xây dựng ứng dụng

Chương này trình bày về giải pháp tự động cập nhật và đồng bộ dữ liệu cho hệthống, viết chương trình ứng dụng thử nghiệm để minh họa cho giải pháp này.Phần cuối là đánh giá về các kết quả đã đạt được và hướng phát triển tiếp theo của

đề tài

Trang 8

Mục lục

I Tính cần thiết phải xây dựng hệ CSDL quốc gia về KT-XH 13

II Mục tiêu của hệ thống 14

III Một số khái niệm 14

III.1 Báo cáo kế hoạch 15

III.2 Báo cáo sơ bộ tình hình thực hiện 15

III.3 Báo cáo tình hình thực hiện 15

III.4 Các chỉ tiêu kinh tế xã hội 15

III.5 Báo cáo chuyên đề 16

IV Quan hệ với hệ thống báo cáo định kỳ 16

IV.1 Hệ thống báo cáo định kỳ 16

IV.2 Hệ thống CSDL quốc gia về Kinh tế - Xã hội 17

V Quan hệ với các hệ CSDL chuyên ngành 17

VI Các đơn vị vận hành hệ thống 19

VII Mô hình hệ thống 19

VII.1 Nguồn dữ liệu đầu vào 19

VII.2 Phương thức lưu trữ 20

VII.3 Phương thức khai thác 20

VII.4 Mô hình tổng thể 22

Chương 2: Lý thuyết CSDL phân tán 23

I Khái niệm 23

II Đặc trưng cơ bản của hệ thống phân tán 27

II.1 Chia sẻ tài nguyên 27

II.2 Xử lý đồng thời 27

II.3 Tính trong suốt 27

II.4 Khả năng mở rộng qui mô 28

II.5 Tính mở 29

IV Các kiến trúc cơ bản của hệ CSDL phân tán 30

IV.1 Kiến trúc client/server 30

IV.2 Kiến trúc ngang hàng peer – to – peer 30

IV.3 Kiến trúc đa hệ quản trị CSDL 31

V.1 Khung thiết kế CSDL phân tán 33

V.1.1 Đối tượng thiết kế của CSDL phân tán 34

V.1.2 Hướng thiết kế Top-Down và Bottom-Up 35

V.2 Thiết kế phân đoạn CSDL 37

I Mô hình chức năng mức đỉnh 46

II Mô hình chức năng quản lý danh mục 48

II.1 Mô hình chức năng quản lý các danh mục 51

II.2 Mô hình chức năng quản lý các BMSL 52

III Mô hình chức năng quản lý số liệu 52

III.1 Mô hình chức năng cập nhật số liệu 53

III.2 Mô hình chức năng duyệt số liệu 54

Trang 9

IV Mô hình chức năng trao đổi dữ liệu 55

V Mô hình chức năng tổng hợp báo cáo 56

VI Mô hình chức năng cập nhật văn bản báo cáo 56

VI.1 Mô hình chức năng cập nhật văn bản báo cáo chính thức 57

VI.2 Mô hình chức năng duyệt báo cáo 58

VII Mô hình chức năng khai thác thông tin 59

VIII Mô hình chức năng quản trị hệ thống 60

VIII.1 Mô hình chức năng bảo mật 61

VIII.2 Mô hình chức năng quản trị 61

I Danh sách các thực thể dữ liệu 63

I.1 Một số quy ước viết tắt trong CSDL 63

I.2 Thông tin danh mục 63

I.3 Dữ liệu 64

I.4 Quản trị và bảo mật 64

II Mô tả chi tiết các bảng 65

II.1 Một số quy ước 65

II.2 Thông tin danh mục 65

II.3 Dữ liệu 74

II.4 Quản trị và bảo mật 89

96

Chương 5 Xây dựng ứng dụng 97

V.1 Tạo Publication 102

V.2 Tạo Subscription 104

V.3 Kết quả 104

Trang 10

Danh mục các hình vẽ

Hình 1.1 Quan hệ giữa hệ thống báo cáo tháng và hệ CSDL QG về KTXH.18

Hình 1.2 Mô hình tổng thể của hệ CSDL quốc gia về KTXH 22

Hình 2.1: Mô hình của hệ thống CSDL phân tán 23

Hình 2.2: Sơ đồ kiến trúc tham chiếu của hệ CSDL phân tán thuần nhất 26

Hình 2.3: Kiến trúc tham chiếu CSDL phân tán 31

Hình 2.4: Kiến trúc hệ đa quản trị CSDL với một mô hình quan niệm toàn cục 32

Hình 2.5: Hệ đa quản trị CSDL không sử dụng mô hình quan niệm toàn cục33 Hình 2.6 : Quy trình thiết kế Top-Down 36

Hình 2.7 Phân đoạn hỗn hợp của quan hệ PROJ 43

Hình 3.1 Mô hình chức năng mức đỉnh 46

Hình 3.2 Mô hình chức năng quản lý danh mục 48

Hình 3.3 Mô hình chức năng quản lý các danh mục 51

Hình 3.4 Mô hình chức năng quản lý các BMSL 52

Hình 3.5 Mô hình chức năng quản lý số liệu 52

Hình 3.6 Mô hình chức năng cập nhật số liệu 53

Hình 3.7 Mô hình chức năng duyệt số liệu 54

Hình 3.8 Mô hình chức năng trao đổi dữ liệu 55

Hình 3.9 Mô hình chức năng tổng hợp báo cáo 56

Hình 3.10 Mô hình chức năng cập nhật văn bản báo cáo 56

Hình 3.11 Mô hình chức năng cập nhật văn bản báo cáo chính thức 57

Hình 3.12 Mô hình chức năng duyệt báo cáo 58

Hình 3.13 Mô hình chức năng khai thác thông tin 59

Hình 3.14 Mô hình chức năng quản trị hệ thống 60

Hình 3.15 Mô hình chức năng bảo mật 61

Hình 3.16 Mô hình chức năng quản trị 62

Hình 5.1 Mô hình nhân bản dữ liệu 98

Hình 5.2: Các thành phần trong Replication 99

Hình 5.3 Giao diện chương trình 102

Hình 5.4 Tạo Publisher 102

Hình 5.5 Tạo Publication 103

Hình 5.6 Tạo Article 103

Hình 5.7 Tạo Subscription 104

Hình 5.8 Kết quả thực hiện 105

Trang 11

Danh mục các bảng

Bảng 2.1 Quan hệ PROJ 38

Bảng 2.2 Quan hệ PROJ 1 39

Bảng 2.3 Quan hệ PROJ 2 39

Bảng 2.4 Quan hệ PROJ 1 39

Bảng 2.5 Quan hệ PROJ 2 39

Bảng 2.6 Quan hệ PROJ 3 39

Bảng 2.7 Quan hệ EMP và PAY 40

Bảng 2.8 Quan hệ EMP1 và EMP2 41

Bảng 2.9 Quan hệ PROJ1 và PROJ2 42

Bảng 4.1 DMCapCT (Cấp chỉ tiêu) 65

Bảng 4.2 DMChiTieu (Hệ thống chỉ tiêu chung) 66

Bảng 4.3 DMChiTieu_CQ (Danh mục chỉ tiêu của cơ quan) 67

Bảng 4.4 DMLoaiSL (Danh mục loại số liệu) 67

Bảng 4.5 DMDinhKy (Danh mục Định kỳ BC) 68

Bảng 4.6 QH_DinhKy_LoaiSL (Các loại SL phù hợp với định kỳ BC) 69

Bảng 4.7.DMCapDB (Danh mục cấp địa bàn) 70

Bảng 4.8 DMDiaBan (Danh mục địa bàn) 70

Bảng 4.9 DMCapCQ (Danh mục cấp cơ quan) 71

Bảng 4.10 DMCoQuan (Danh mục cơ quan) 72

Bảng 4.11 DMDonVi (Danh mục đơn vị) 73

Bảng 4.12 SLCT (Số liệu chỉ tiêu) 74

Bảng 4.13 SLCT_KDK (Số liệu chỉ tiêu không định kỳ) 76

Bảng 4.14 DMBMSL (Biểu mẫu số liệu) 78

Bảng 4.15 QH_BMSL_CT (Danh sách các chỉ tiêu của BMSL) 79

Bảng 4.16 QH_BMSL_LoaiSL (Danh sách các loại số liệu của BMSL) 80

Bảng 4.17 QH_BMSL_Ky (Danh sách các định kỳ sử dụng BMSL) 81

Bảng 4.18 DMLoaiBC (Loại báo cáo) 81

Bảng 4.19 QH_LoaiBC_BMSL (Danh sách BMSL của loại BC) 83

Bảng 4.20 QH_LoaiBC_CQ (Danh sách các cơ quan nhận của loại BC) 83

Bảng 4.21 DMBC (Báo cáo) 84

Bảng 4.22 QH_BC_BMSL (Danh sách BMSL của BC) 86

Bảng 4.23 QH_BC_CQNhan(Danh sách các cơ quan nhận BC) 87

Bảng 4.24 QH_BC_File (Danh sách các tệp dữ liệu kèm theo BC) 88

Bảng 4.25 QTDMTSo (Tham số hệ thống) 89

Bảng 4.26 QTDMMucTN (Mức truy nhập) 89

Bảng 4.27 QTDMQuyenTN (Quyền truy nhập) 90

Bảng 4.28 QTDMNhom (Nhóm người sử dụng) 91

Bảng 4.29 QTDMNSD (Người sử dụng) 91

Bảng 4.30 QTPQNhom (Danh sách các quyền truy nhập của nhóm NSD) 92

Bảng 4.31 QTPQNSD (Danh sách các quyền truy nhập của NSD) 93

Bảng 4.32 QTNhomNSD (Danh sách các NSD thuộc Nhóm) 94

Trang 12

Bảng 4.33 QTNSDNSD (Danh sách các quyền thao tác dữ liệu của NSD) .95 Bảng 4.34 QTSLNK (Nhật ký hệ thống ) 95

Trang 13

Chương 1: Tổng quan về hệ CSDL quốc gia về KTXH

I Tính cần thiết phải xây dựng hệ CSDL quốc gia về XH

KT-Để đảm bảo sự phát triển KT-XH của đất nước theo đúng định hướng, hàng nămQuốc hội ban hành Nghị quyết về nhiệm vụ hàng năm để đưa ra mục tiêu tổng quátthực hiện trong năm và các chỉ tiêu chủ yếu cần đạt được như:

− Tốc độ tăng GDP, giá trị tăng thêm của ngành nông, lâm, ngư nghiệp, côngnghiệp, dịch vụ…

− Tốc độ tăng kim ngạch xuất khẩu;

− Tổng vốn đầu tư phát triển toàn xã hội/GDP;

− Tốc độ tăng giá tiêu dùng;

− Số việc làm mới tạo ra trong năm; trong đó: xuất khẩu lao động và chuyên gia;

− Giảm tỷ lệ hộ nghèo, tỉ lệ sinh, trẻ em suy dinh dưỡng…

− Phổ cập giáo dục, đào tạo, dạy nghề…

− Tỷ lệ che phủ rừng, cung cấp nước sạch, bảo vệ môi trường…

Để thực hiện tốt mục tiêu và hoàn thành các chỉ tiêu cũng như nhiệm vụ đề ra trongNghị quyết và phục vụ cho việc chỉ đạo điều hành, Bộ Kế hoạch và Đầu tư đượcChính phủ giao nhiệm vụ chuẩn bị báo cáo hàng tháng, hàng quý, 6 tháng và báocáo năm Vụ Tổng hợp Kinh tế quốc dân là đơn vị chủ trì tổng hợp, biên tập vàhoàn thành báo cáo để trình lãnh đạo Bộ Kế hoạch và Đầu tư báo cáo trong cáccuộc họp thường kỳ của Chính phủ

Các báo cáo này phản ánh tình hình phát triển KT-XH trong thời gian đó, phát hiện

và nêu ra những khó khăn, tồn tại và nguyên nhân gây ra những vướng mắc đó,đồng thời đề xuất các giải pháp cần thực hiện để tháo gỡ những khó khăn, tồn tại.Ngoài ra, các báo cáo này còn giúp thấy được mức độ hoàn thành nhiệm vụ, mụctiêu của kế hoạch năm, từ đó đề ra các giải pháp, phương hướng nhằm đạt đượcnhiệm vụ về KT-XH các tháng, quý còn lại trong năm

Song song với những báo cáo phản ánh tình hình và cập nhật các thông tin về

KT-XH để phục vụ công tác điều hành của Chính phủ, Bộ Kế hoạch và Đầu tư phảithực hiện một công việc khác là chuẩn bị các báo cáo kế hoạch cho năm tiếp theo,

kế hoạch 5 năm Do đó, việc chuẩn bị tốt hệ thống số liệu, cũng như phần đánh giátình hình tổng hợp KT-XH hàng tháng, hàng quý, 6 tháng, cả năm là vô cùng quantrọng

Trang 14

Nhận thấy được tính quan trọng của các báo cáo và độ phức tạp của công việc,trong thời qua Bộ Kế hoạch và Đầu tư đang từng bước xây dựng hệ thống dữ liệu

về KT-XH

Tuy nhiên với cách lưu trữ dưới dạng văn bản phi cấu trúc, khả năng khai thác để cóđược các phân tích, dự báo tầm chiến lược, trợ giúp hình thành các quyết sách làhầu như không thể thực hiện được

Vì vậy yêu cầu chính đối với hệ thống là trích lọc các dữ liệu từ các dạng báo cáothành các dạng dữ liệu có cấu trúc, tiến tới hình thành một kho dữ liệu tri thức, trợgiúp khai thác triệt để các thông tin, hỗ trợ cho công tác phân tích, dự báo, lập kếhoạch, ra quyết định trước hết là trong ngành kế hoạch, sau đó là cho cộng đồng,toàn xã hội

II Mục tiêu của hệ thống

Hệ thống CSDL quốc gia về Kinh tế - Xã hội được xây dựng với mục đích lưu trữ cácthông tin / dữ liệu về tình hình phát triển kinh tế xã hội quốc gia qua các năm

Nội dung dữ liệu chủ yếu được lưu trữ trong hệ thống là các báo cáo chính thức từ

Bộ Kế hoạch Đầu tư lên cấp Chính phủ

Các báo cáo thể hiện các số liệu sau:

− Kế hoạch phát triển từng lĩnh vực hàng năm

− Báo cáo sơ bộ tình hình thực hiện theo định kỳ thời gian

− Báo cáo thực hiện

Dữ liệu – báo cáo được lưu dưới hai dạng:

− Dạng báo cáo toàn văn có thể tra cứu thông qua hệ thống từ khoá và

− Dạng chỉ tiêu kinh tế xã hội, cho phép thực hiện các phân tích, so sánh và dựbáo xu hướng phát triển

Một nội dung dữ liệu cũng sẽ được định hướng lưu trữ trong hệ thống là các báocáo chính thức từ các Bộ, ngành, địa phương lên Bộ Kế hoạch Đầu tư; các báo cáochuyên đề Đầu tư phát triển của các vụ chuyên ngành, bán tổng hợp về một lĩnh vựcchuyên ngành kinh tế-xã hội cụ thể

III Một số khái niệm

Bộ số liệu 3 loại báo cáo thể hiện quá trình điều khiển hoạt động kinh tế-xã hội củaChính phủ Bắt đầu từ định hướng phát triển (số liệu kế hoạch), theo dõi tình hìnhthực hiện kế hoạch (số liệu thực hiện sơ bộ) và kết quả thực hiện (số liệu kết quảthực hiện)

Các báo cáo bao gồm hai dạng số liệu: Số liệu chỉ tiêu và phần lời văn Số liệu chỉtiêu có dạng bảng biểu, có tính chất định lượng Phần lời văn thể hiện các ý kiếnchuyên gia đánh giá xu hướng và các điểm cần đặc biệt lưu ý trong quá trình thựchiện Phần lời văn thường chỉ tập trung đánh giá các điểm đáng chú ý nhất so với kế

Trang 15

hoạch đề ra Thông tin trong phần lời văn là các thông tin định tính và là các thôngtin quan trọng nhất trong một báo cáo

III.1 Báo cáo kế hoạch

Công tác lập kế hoạch được thực hiện hàng năm, do các đơn vị phòng ban của BộKHĐT thực hiện trên cơ sở định hướng phát triển của Nhà nước và xu thế phát triểnchung Kế hoạch được xác định cụ thể cho từng chỉ tiêu kinh tế-xã hội

Kế hoạch gồm có kế hoạch 5 năm và kế hoạch hàng năm

Báo cáo kế hoạch được Vụ Tổng hợp, Bộ KHĐT tổng hợp, hoàn chỉnh và trìnhChính phủ vào tháng 11 hàng năm, Kế hoạch được Chính phủ duyệt chính thức vàotháng 12 hàng năm Tài liệu này có tính pháp lệnh đối với toàn bộ hệ thống Nhànước

III.2 Báo cáo sơ bộ tình hình thực hiện

Căn cứ trên kế hoạch hàng năm được Chính phủ duyệt, và được giao tới từng địaphương, bộ ngành, các đơn vị định kỳ báo cáo tình hình thực hiện Báo cáo này do

Vụ Tổng hợp, Bộ KHĐT tổng hợp, hoàn chỉnh và trình Chính phủ

Báo cáo sơ bộ tình hình thực hiện thông thường bao gồm phần số liệu tình hìnhthực hiện của kỳ trước và số ước thực hiện của kỳ này Đây là một căn cứ, cơ sởquan trọng để Chính phủ thực hiện công tác điều hành, có các biện pháp, điều chỉnhkịp thời đối với các biến động xảy ra trong quá trình thực hiện kế hoạch Nhà nước.Phần số liệu tình hình thực hiện của kỳ trước được tổng hợp từ số liệu báo cáo từTổng cục thống kê được gửi cho Vụ Tổng hợp Bộ KHĐT hàng tháng Số ước thựchiện trong kỳ, do chính Vụ Tổng hợp ước tính, căn cứ trên số liệu báo cáo ước tínhcủa các Vụ chuyên ngành và các Vụ bán tổng hợp Công tác ước thực hiện đượcthực hiện dựa trên các số liệu tình hình thực hiện của các kỳ trước, xu hướng pháttriển, biến động và các phương pháp chuyên gia khác

Báo cáo sơ bộ tình hình thực hiện được báo cáo hàng tháng (gọi tắt là báo cáotháng) và báo cáo hàng năm (gọi tắt là báo cáo năm) Hai loại báo cáo này có quitrình và đơn vị chịu trách nhiệm tổng hợp hoàn toàn khác nhau

Báo cáo tháng được gửi trình Chính phủ vào ngày 27-28 hàng tháng Báo cáo nămđược gửi trình Chính phủ vào tháng 12 hàng năm

III.3 Báo cáo tình hình thực hiện

Số liệu có cấu trúc

Sau một năm thực hiện, Tổng cục thống kê tập hợp các số liệu thống kê, lập báo cáotình hình thực hiện và gửi Bộ Kế hoạch và Đầu tư trình Chính phủ

Báo cáo được tổng hợp trình Chính phủ vào cuối quí II năm sau

III.4 Các chỉ tiêu kinh tế xã hội

Các báo cáo bao gồm hai dạng số liệu: Số liệu chỉ tiêu và phần lời văn

Số liệu chỉ tiêu được thu thập trên nền hệ thống chỉ tiêu kinh tế xã hội, bao gồm vàitrăm chỉ tiêu được phân loại theo các lĩnh vực kinh tế - xã hội chính yếu

Trang 16

Hệ thống chỉ tiêu chính thức được dùng là do Tổng cục Thống kê ban hành, thường

ít thay đổi Các giá trị chỉ tiêu do Tổng cục Thống kê thu thập qua mạng lưới thống

kê toàn quốc của mình thể hiện một cách định lượng tình hình phát triển của đấtnước thông qua giá trị của các chỉ tiêu

Trên nền hệ thống các chỉ tiêu được qui định chính thức (do Tổng cục Thống kêcông bố), Bộ KHĐT lập kế hoạch phát triển và ước tình hình thực hiện, cụ thể là thểhiện thông qua con số định lượng của từng chỉ tiêu

Ngoài hệ thống chỉ tiêu được qui định bởi Tổng cục Thống kê, Bộ KHĐT còn sửdụng một số chỉ tiêu phục vụ công tác dự toán

Công tác dự báo chiến lược cũng được thực hiện trên nền hệ thống các chỉ tiêu kinh

tế xã hội

Mỗi chỉ tiêu kinh tế xã hội đều có định kỳ báo cáo riêng của mình: hàng tháng, hàngquý, hàng năm, 5 năm

III.5 Báo cáo chuyên đề

Báo cáo chuyên đề có thể gọi là dạng báo cáo đột xuất (không định kỳ) trong mộtlĩnh vực kinh tế - xã hội rộng hoặc hẹp nào đó

Báo cáo chuyên đề thường được lập theo một nhu cầu nghiên cứu chuyên sâu củamột tổ chức, cơ quan nào đó Thông thường là xuất phát từ một đề nghị tập trungphát triển hoặc vực một lĩnh vực kinh tế - xã hội nào đó, đơn vị , tổ chức đề nghịcần có thông tin làm căn cứ để giải trình đề xuất kế hoạch và dự trù của mình Báo cáo chuyên đề thường do đơn vị chuyên ngành tập hợp Có thể là căn cứ trêncác số liệu thường xuyên có tại đơn vị chuyên ngành, có thể là các ý kiến đánh giáchuyên gia, căn cứ trên các hiểu biết chuyên sâu của các cán bộ trong lĩnh vực.Cũng có thể là kết quả của một cuộc điều tra chuyên đề nói trên

IV Quan hệ với hệ thống báo cáo định kỳ

Hệ thống báo cáo định kỳ (tháng/năm) và hệ thống CSDL quốc gia về Kinh tế - Xãhội có mục đích phục vụ hoàn toàn khác nhau

IV.1 Hệ thống báo cáo định kỳ

Hệ thống báo cáo định kỳ có mục đích chủ yếu là hỗ trợ tổng hợp thông tin từ cácđơn vị để lập các loại báo cáo định kỳ, báo cáo chuyên đề Qui trình tổng hợp báocáo bao gồm cả các trao đổi giữa các đơn vị, phòng ban, bộ ngành, các sửa đổi điềuchỉnh theo yêu cầu từ cấp trên hoặc các đơn vị chuyên ngành

Các loại báo cáo khác nhau có định kỳ tổng hợp, đơn vị chịu trách nhiệm báo cáo,tổng hợp và qui trình tổng hợp hoàn toàn khác nhau

Có thể chia thành 3 loại hình báo cáo chính: Báo cáo năm, báo cáo tháng và báo cáochuyên đề

Trang 17

IV.2 Hệ thống CSDL quốc gia về Kinh tế - Xã hội

Hệ thống CSDL quốc gia về Kinh tế - Xã hội lại có mục đích chủ yếu là lưu trữ các

số liệu chính thức và trợ giúp các nhu cầu tra cứu, hỏi đáp cũng như phân tích sốliệu lịch sử về tình hình phát triển kinh tế xã hội

Số liệu được lưu trữ bao gồm cả mảng kế hoạch, báo cáo sơ bộ tình hình thực hiện

và báo cáo chính thức tình hình thực hiện Tuy nhiên các số liệu trong quá trìnhsoạn thảo, số liệu không chính thức không được lưu trong hệ thống này

Ngoài các báo cáo chính thức đã được Chính phủ phê duyệt, hệ còn có thể lưu trữcác báo cáo chuyên đề chính thức được thu thập từ các bộ ngành, vụ chuyên ngành

V Quan hệ với các hệ CSDL chuyên ngành

Các hệ thống CSDL chuyên ngành được thiết lập để phục vụ cho các nhu cầu quản

lý, phân tích chuyên ngành Các hệ thống này có thể hỗ trợ cho công tác tổng hợpbáo cáo từ các bộ ngành, lĩnh vực chuyên ngành lên Chính phủ thông qua báo cáotháng và báo cáo của Bộ Kế hoạch và Đầu tư Hệ thống này cũng cho phép tổnghợp các báo cáo chuyên đề của từng lĩnh vực

Báo cáo chuyên đề, các báo cáo định kỳ của các chuyên ngành đều có thể là các sốliệu quan trọng trong tương lai sẽ cần được lưu trữ và khai thác trong hệ CSDLquốc gia về kinh tế - xã hội Hơn nữa các số liệu này tuy cũng là số liệu chính thức,nhưng không có được từ nguồn Tổng cục Thống kê Các số liệu này một mặt có thểtrợ giúp cho các phân tích vĩ mô toàn xã hội, còn có thể trợ giúp cho các phân tíchmang tính chuyên ngành chuyên sâu

Tóm lại giữa CSDL chuyên ngành và CSDL quốc gia về kinh tế - xã hội, trước mắt

sẽ tiến tới có các quan hệ cung cấp thông tin đầu vào một cách gián tiếp (các báocáo chuyên đề chính thức sẽ được gửi vào CSDL quốc gia)

Trong tương lai sẽ thiết lập các đầu vào trực tiếp từ các CSDL chuyên ngành vàoCSDL quốc gia Có nghĩa là các số liệu chuyên ngành sẽ được định kỳ cập nhật từCSDL chuyên ngành lên CSDL quốc gia ít nhất là trên một số chỉ tiêu quan trọng.Một đặc thù cần nhắc tới là quan hệ giữa CSDL chuyên ngành và CSDL quốc gia

về Kinh tế-Xã hội được xây dựng, trao đổi trên nền các chỉ tiêu chuyên ngành Cácchỉ tiêu này có thể phần lớn trùng với các chỉ tiêu Kinh tế-Xã hội do Tổng cụcThống kê ban hành, nhưng được báo cáo, theo dõi chi tiết hơn trên các phân loại.Cũng có một số chỉ tiêu hoàn toàn không có trong hệ thống chính thức do Tổng cụcThống kê ban hành phục vụ các theo dõi chuyên sâu của ngành, lĩnh vực Một sốchỉ tiêu khác xuất hiện do nhu cầu của các dạng nghiên cứu chuyên đề

Trang 18

Hình 1.1 Quan hệ giữa hệ thống báo cáo tháng và hệ CSDL QG về KTXH

CÁC CƠ QUAN

BỘ NGÀNH

Trang 19

Bộ Kế hoạch Đầu tư đảm nhiệm

Các đầu báo cáo chính thức sẽ được cập nhật tự động vào hệ thống CSDL quốc gia,như một đầu vào từ hệ thống báo cáo định kỳ Hệ thống cũng sẽ được trang bị các công

cụ chuyển đổi từ các môi trường office thông dụng (Microsoft Word, Excel ) để phục

vụ nhu cầu chuyển đổi số liệu trước mắt Trong tương lai việc cập nhật sẽ phải là cácthao tác tự động

Khi có thay đổi về hệ thống chỉ tiêu kinh tế - xã hội Các thay đổi này sẽ do bộ phậncông nghệ thông tin đảm nhiệm, bằng cách cập nhật danh mục các chỉ tiêu và mẫu đầuvào - ra

Để truyền các số liệu chính thức từ Tổng cục Thống kê hệ thống cũng sẽ được trang bịcác kênh nạp thông tin tự động, trong thời gian trước mắt là các công cụ chuyển đổi từdạng số liệu mềm (soft)

Một kênh số liệu tự động khác là từ các CSDL chuyên ngành Số liệu báo cáo chuyên ngànhchính thức và các dạng báo cáo chuyên đề

VII Mô hình hệ thống

VII.1 Nguồn dữ liệu đầu vào

Dữ liệu đầu vào là các báo cáo chính thức sau đây:

− Báo cáo năm (Bộ Kế hoạch và Đầu tư gửi Chính phủ, sau khi Chính phủ phêduyệt)

− Báo cáo tháng (Bộ Kế hoạch và Đầu tư gửi Chính phủ, sau khi Chính phủ phêduyệt)

− Báo cáo thống kế chính thức định kỳ (tháng, quí, năm) Tổng cục Thống kê banhành

− Báo cáo chuyên đề chính thức

Hình thức cập nhật

− Cập nhật tự động từ các nguồn xuất bản báo cáo

− Cập nhật qua các môi trường chuyển đổi số liệu

Trang 20

− Cập nhật bằng tay, gõ qua bàn phím

VII.2 Phương thức lưu trữ

Lưu trữ văn bản toàn văn

Văn bản toàn văn, dạng ký tự là thông tin định tính Đó là kiến thức chuyên gia, thểhiện các đánh giá của các nhà chuyên môn về tình hình Kinh tế - Xã hội, dự báo cácbiến động, có thể có cả các đề xuất giải pháp cho các vấn đề phát sinh nổi cộm Dạng

dữ liệu này, trước khi đưa vào hệ thống cần được phân loại, bằng các chủ đề, bằng các

từ khoá để có thể tìm kiếm, tra cứu sử dụng về sau

Việc phân loại cũng có thể tiến hành tự động bằng các công cụ xử lý số liệu văn bản

Lưu trữ bảng dữ liệu

Các bảng dữ liệu là một phần của các báo cáo, thể hiện các thông tin định tính, trong

hệ thống sẽ được lưu trữ dưới dạng dữ liệu có cấu trúc

Dữ liệu cấu trúc này chính là hệ thống CSDL chỉ tiêu kinh tế xã hội thể hiện địnhlượng tình hình, xu hướng phát triển của nền kinh tế xã hội và các định hướng chiếnlược quốc gia (kế hoạch phát triển)

Gốc của phần dữ liệu có cấu trúc là danh mục các chỉ tiêu kinh tế xã hội

− Các chỉ tiêu này phần lớn là các chỉ tiêu chính thức do Tổng cục Thống kê công

bố Việc thay đổi cập nhật diễn ra không thường xuyên

− Một số chỉ tiêu khác do Bộ Kế hoạch và Đầu tư ban bố thể hiện dự toán quốc giacho các định hướng phát triển

− Một số chỉ tiêu khác là các chỉ tiêu chuyên ngành, thể hiện chi tiết hơn tình hìnhphát triển ở các ngành chuyên sâu

Mỗi chỉ tiêu được ứng với bảng số liệu được cập nhật theo thời gian, theo địa phương với 3 mảng số liệu chính thức:

VII.3 Phương thức khai thác

Khác với hệ thống báo cáo định kỳ, Hệ thống CSDL quốc gia về kinh tế xã hội có mụcđích sử dụng chủ yếu là trợ giúp cho các nghiên cứu, phân tích, dự đoán xu hướng trênkho các số liệu lịch sử với một quá trình theo dõi nhiều năm

Trang 21

Hệ thống sẽ được trang bị các công cụ trợ giúp khai thác sau:

− Các công cụ cho phép tìm kiếm tới một văn bản toàn văn (một văn bản cụ thể nào

đó, theo từ khoá, theo chủ đề, theo cấp ban hành, theo thời gian )

− Các công cụ cho phép phân tích số liệu dạng công cụ kho dữ liệu

− Các công cụ cho phép dự đoán xu hướng phát triển căn cứ trên các số liệu lịch sử

− Các công cụ giải đáp thông minh, cho phép dịch câu hỏi bất kỳ của người sử dụng,

sử dụng từ điển đồng nghĩa qui về các tri thức tương ứng có trong CSDL và cungcấp các tài liệu có liên quan cho người hỏi

Hệ thống được khai thác chủ yếu trên môi trường web-based thông qua mạng internet

Trang 22

VII.4 Mô hình tổng thể

Hình 1.2 Mô hình tổng thể của hệ CSDL quốc gia về KTXH

Cấp quận huyện Cấp tỉnh

KHO DỮ LIỆU CẤP TW

HỆ B C THÁNG NĂM

Giá trị chỉ tiêu

CSDL

QG

VỀ KTXH

BC toàn văn

Trung tâm khai thác

Hệ phân tích

Cấp tỉnh, Bộ ngành

CSDL CHUYÊN NGÀNH

Cấp quận huyện, cơ sở

Internet

Trang 23

Chương 2: Lý thuyết CSDL phân tán

I Khái niệm

I.1 Định nghĩa CSDL phân tán

Cơ sở dữ liệu phân tán là tập hợp dữ liệu mà về mặt logic thuộc về cùng một hệ thốngnhưng được trải rộng ở nhiều vị trí khác nhau trong một mạng máy tính

Có 2 điểm quan trọng được nêu ra trong định nghĩa trên:

- Phân tán: dữ liệu không đặt trên cùng một vị trí, điều này giúp chúng ta có thể

phân biệt một CSDL phân tán với một CSDL tập trung, đơn lẻ

- Tương quan logic: Dữ liệu có một số các thuộc tính ràng buộc chúng với nhau,

điều này giúp chúng ta có thể phân biệt một CSDL phân tán với một tập hợpCSDL cục bộ hoặc các tệp cư trú tại các vị trí khác nhau trong một mạng máytính

Hình 2.1: Mô hình của hệ thống CSDL phân tán

Trang 24

I.2 So sánh CSDL phân tán và CSDL tập trung

Đặc trưng mô tả CSDL tập trung là điều khiển tập trung, độc lập dữ liệu, giảm bớt dưthừa, cơ cấu vật lý phức tạp đối với khả năng truy cập, toàn vẹn, hồi phục, điều khiểntương tranh, biệt lập và an toàn dữ liệu

Điều khiển tập trung: Trong CSDL tập trung, điều khiển tập trung các nguồn thông

tin của công việc hay tổ chức Có người quản trị đảm bảo an toàn dữ liệu

Trong CSDL phân tán: không đề cập đến vấn đề điều khiển tập trung Người quản trịCSDL chung phân quyền cho người quản trị CSDL địa phương

Độc lập dữ liệu: là một trong những nhân tố tác động đến cấu trúc CSDL để tổ chức

dữ liệu chuyển cho chương trình ứng dụng Tiện lợi chính của độc lập dữ liệu là cácchương trình ứng dụng không bị ảnh hưởng khi thay đổi cấu trúc vật lý của dữ liệu Trong CSDL phân tán, độc lập dữ liệu có tầm quan trọng cũng như trong CSDL truyềnthống Khái niệm CSDL trong suốt thể hiện rằng hoạt động của chương trình trênCSDL phân tán được viết như làm việc trên CSDL tập trung Hay nói cách khác tínhđúng đắn của chương trình không bị ảnh hưởng bởi việc di chuyển dữ liệu từ nơi nàysang nơi khác trong mạng máy tính Tuy nhiên tốc độ làm việc bị ảnh hưởng do có thờigian di chuyển dữ liệu

Giảm dư thừa dữ liệu: Trong CSDL tập trung, tính dư thừa hạn chế được càng nhiều

càng tốt vì:

- Dữ liệu không đồng nhất khi có vài bản sao của cùng CSDL logic; để tránh được

nhược điểm này giải pháp là chỉ có một bản sao duy nhất

- Giảm không gian lưu trữ Giảm dư thừa có nghĩa là cho phép nhiều ứng dụng

cùng truy cập đến một CSDL mà không cần đến nhiều bản sao ở những nơichương trình ứng dụng cần

CSDL phân tán chia dữ liệu ra thành nhiều phần nhỏ và được thể hiện như một bản saologic tổng thể duy nhất để tiện cho việc truy cập dữ liệu

Cấu trúc vật lý và khả năng truy cập: Trong CSDL phân tán, hiệu quả của truy cập

thể hiện ở thời gian tìm kiếm và chuyển dữ liệu nhỏ nhất, chi phí truyền thông thấpnhất Công việc viết ra cách thức truy cập CSDL phân tán cũng giống như viết chươngtrình duyệt trong các CSDL tập trung

Tính toàn vẹn, hồi phục và điều khiển tương tranh: Trong CSDL phân tán, vấn đề

điều khiển giao tác tự trị có ý nghĩa quan trọng: hệ thống điều phối phải chuyển đổi cácquỹ thời gian cho các giao tác liên tiếp Như vậy giao tác tự trị là phương tiện đạt được

sự toàn vẹn trong CSDL Có hai mối nguy hiểm của giao tác tự trị là lỗi và tương tranh

Tính biệt lập và an toàn: trong CSDL truyền thống, người quản trị hệ thống có quyền

điều khiển tập trung, người sử dụng được phân quyền mới truy cập vào được dữ liệu.Trong cách tiếp cận CSDL tập trung, không cần thủ tục điều khiển chuyên biệt

Trang 25

Trong CSDL phân tán, những người quản trị địa phương cũng phải giải quyết vấn đềtương tự như người quản trị CSDL truyền thống Tuy nhiên, với cấp độ tự trị cao ở mỗiđiểm, người có dữ liệu địa phương sẽ cảm thấy an toàn hơn vì họ có thể tự bảo vệ dữliệu của mình thay vì phụ thuộc vào người quản trị hệ thống tập trung Ngoài ra, vấn đề

an toàn với hệ phân tán còn liên quan đến an toàn trong mạng truyền thông, hệ thống

có tính mở và nhiều người dùng sử dụng nhiều CSDL, do đó đòi hỏi nhiều kỹ thuật bảo

Các điều kiện sau cần được thoả mãn:

- Các hệ điều hành mày tính tại mỗi vị trí địa lý là như nhau hay ít nhất chúng có

khả năng tương thích cao

- Các mô hình dữ liệu được sử dụng tại mỗi vị trí địa lý là như nhau (mô hình

quan hệ được sử dụng chung nhất đối với các hệ CSDL phân tán ngày nay)

- Các hệ CSDL được sử dụng tại mỗi vị trí địa lý là như nhau hay ít nhất chúng

có khả năng tương thích cao

- Dữ liệu tại các vị trí khác nhau có thể có các định nghĩa và khuôn dạng chung.

Các hệ CSDL phân tán thuần nhất thể hiện một mục đích thiết kế đối với các CSDLphân tán Cụ thể, các CSDL phân tán thuần nhất được thiết kế bằng cách chia nhỏ mộtCSDL xí nghiệp thành nhiều CSDL địa phương, các CSDL địa phương định vị trên cáctrạm làm việc khác nhau nhưng chúng được biểu diễn bởi cùng một mô hình dữ liệu vàđược quản trị bởi cùng một hệ quản trị CSDL địa phương

Trang 26

Hình 2.2: Sơ đồ kiến trúc tham chiếu của hệ CSDL phân tán thuần nhất

- Sơ đồ quan niệm tổng thể: Định nghĩa tất cả các dữ liệu sẽ được lưu trữ trong CSDL

phân tán Trong mô hình quan hệ, sơ đồ tổng thể bao gồm định nghĩa của tập các quan

hệ tổng thể

- Sơ đồ phân đoạn: Mỗi quan hệ tổng thể có thể chia thành một vài phần không gối lên

nhau được gọi là đoạn Sơ đồ tổng thể mô tả các ánh xạ giữa các quan hệ tổng thể vàcác đoạn được định nghĩa trong sơ đồ phân đoạn Ánh xạ này là một chiều Có thể cónhiều đoạn liên kết tới một quan hệ tổng thể, nhưng mỗi đoạn chỉ liên kết tới nhiềunhất là một quan hệ tổng thể Các đoạn được chỉ ra bằng tên của quan hệ tổng thể cùngvới tên của mục đoạn

- Sơ đồ sắp chỗ: các đoạn là các phần logic của quan hệ tổng thể được định vị vật lý

trên một hoặc nhiều vị trí trên mạng Sơ đồ sắp chỗ định nghĩa đoạn nào định vị tại các

vị trí nào Kiểu ánh xạ được định nghĩa trong sơ đồ sắp chỗ quyết định CSDL phân tán

là dư thừa hay không

- Sơ đồ ánh xạ địa phương: ánh xạ các ảnh vật lý và các đối tượng được lưu trữ tại một

trạm (tất cả các đoạn của một quan hệ tổng thể trên cùng một vị trí tạo ra một ảnh vậtlý)

Hệ CSDL phân tán không thuần nhất.

Trong hầu hết các tổ chức, các hệ CSDL liên quan đến một chu kì dài không đượcchỉ đạo và lập kế hoạch cẩn thận Các máy tính khác nhau và các hệ điều hành khác

Trang 27

nhau có thể được sử dụng tại mỗi một vị trí địa lý Các mô hình dữ liệu khác nhau vàcác hệ quản trị CSDL khác nhau cũng có thể được lựa chọn sử dụng Ví dụ, một ví trí

có thể sử dụng công nghệ cơ sở dữ hiệu quan hệ mới nhất, trong khi một vị trí khác cóthể lưu trữ dữ liệu sử dụng các tệp truyền thống hay các CSDL mạng, phân cấp cũ hơn.Phức tạp hơn nữa, dữ liệu trên các vị trí thường không tương thích Các mâu thuẫnđiển hình bao gồm các khác biệt về cú pháp (sự biểu diễn khác nhau các khoản mục dữliệu tại hai vị trí) và các khác biệt về ngữ nghĩa (các ngữ nghĩa khác nhau đối với cùngmột khoản mục dữ liệu tại các vị trí khác nhau

Sớm hay muộn thì những người sử dụng tại các vị trí khác nhau sẽ phát hiện ra rằng

họ cần chia sẻ dữ liệu cho dù có sự không tương thích Một giải pháp là phát triển mộtCSDL mới hoàn toàn mà hợp nhất tất cả các hệ đang tồn tại Tuy nhiên, đây thường làmột giải pháp không dễ thực hiện về mặt kĩ thuật hay về mặt kinh tế Thay vào đó, đôikhi các CSDL được móc nối với nhau và kết quả là tạo ra một tập các CSDL khôngthuần nhất (đôi khi còn được gọi là các CSDL liên hiệp) Một hệ thống nhất như vậynói chung hạn chế các kiểu xử lý mà những người sử dụng có thể thực hiện Ví dụ mộtngười sử dụng tại một ví trí có thể đọc nhưng không thể cập nhật dữ liệu tại một vị tríkhác

II Đặc trưng cơ bản của hệ thống phân tán

II.1 Chia sẻ tài nguyên

Trong hệ thống phân tán, các máy tính độc lập được kết nối và giao tiếp với nhau, do

đó tài nguyên trên mỗi máy có thể chia sẻ, trở thành tài nguyên dùng chung Nhữngmáy tính có nhu cầu sử dụng tài nguyên có thể truy cập và sử dụng tài nguyên trên máytính khác Những tài nguyên này có thể là phần mềm, phần cứng hay dữ liệu Như vậy,các tài nguyên sẽ được sử dụng hiệu quả hơn

II.2 Xử lý đồng thời

Các máy tính trong hệ thống phân tán đều có bộ xử lý và bộ nhớ riêng, nhờ vậy chúng

có thể xử lý công việc song song Một công việc có thể được chia nhỏ và chuyển chotừng máy xử lý đồng thời, giúp tăng tốc độ xử lý đối với những việc có lượng tính toánlớn đòi hỏi nhiều thời gian Kết quả cuối cùng được tổng hợp dựa trên kết quả xử lý ởtừng máy

II.3 Tính trong suốt

II.3.1 Trong suốt phân tán:

Cho phép xử lý dữ liệu trên CSDL phân tán giống như CSDL tập trung Người sửdụng không cần biết dữ liệu đã được phân đoạn như thế nào, các bản sao dữ liệu đặt ởđâu, vị trí vật lý lưu trữ đặt như thế nào

- Trong suốt địa điểm: Người dùng không cần biết vị trí vật lý của dữ liệu đặt ở đâu

Trang 28

Trong truy vấn chỉ cần đưa ra tên đoạn mà không cần chỉ ra vị trí

- Trong suốt tên: khi một đối tượng đã được đặt tên thì có thể truy nhập chính xáckhông cần đặc tả thêm

- Trong suốt bản sao: Sự nhân bản là quá trình sao chép và duy trì dữ liệu trong hệCSDL phân tán Cùng một dữ liệu (được lưu trữ vật lý tại một vị trí) có thể sử dụngđược trên nhiều vị trí khác nhau Các bản sao có thể được lưu trữ trên nhiều trạmlàm tăng hiệu suất, độ tin cậy và tính sẵn sàng của hệ thống Các ứng dụng có thểtruy nhập dữ liệu tại các trạm mà không phải truy cập từ xa giảm tải trên trạm lớn

Hệ thống cho phép tiếp tục thực hiện nếu như các trạm từ xa có sự cố Trong suốtbản sao đảm bảo người dùng không biết đó là các bản sao vì dữ liệu luôn được cậpnhật và đồng bộ với dữ liệu gốc

- Trong suốt phân đoạn: Một quan hệ trong CSDL phân tán có thể phân đoạn nganghoặc phân đoạn dọc nghĩa là tách thành các bộ dữ liệu hoặc các quan hệ con và lưutrữ trên nhiều trạm khác nhau Trong suốt phân đoạn cho phép người sử dụngkhông cần biết có sự phân đoạn, các truy vấn dữ liệu vẫn được viết như CSDL tậptrung

II.3.2 Trong suốt giao dịch:

CSDL phân tán cho phép một giao dịch có thể cập nhật, sửa đổi dữ liệu trên các trạmkhác nhau Để đảm bảo dữ liệu nhất quán trên toàn hệ thống, các trạm trong giao dịchchỉ được hoàn thành khi tất cả các trạm đã thực hiện thành công

II.3.3 Trong suốt sự cố

Đảm bảo tại một trạm của hệ thống bị hỏng thì hệ thống vẫn làm việc bình thường (do

cơ chế tạo bản sao hoặc làm việc trên các trạm không bị sự cố) Nếu mạng hoặc hệthống có sự cố trong khi tiến hành giao dịch CSDL phân tán thì giao dịch đó được giảiquyết tự động và trong suốt theo nghĩa khi mạng hoặc hệ thống khôi phục thì tất cả cáctrạm này hoặc là hoàn thành giao dịch đó, hoặc là quay lại trạng thái trước giao dịch

II.3.4 Trong suốt thao tác

Cho phép các câu lệnh thao tác dữ liệu đơn giản để truy nhập được các CSDL tại trạmcục bộ hoặc trạm từ xa Các thao tác xử lý dữ liệu từ xa không phức tạp và vẫn đảmbảo giống như khi thao tác dữ liệu trên hệ CSDL không phân tán

II.3.5 Trong suốt tính không thuần nhất

Cho phép hỗn hợp nhiều hệ quản trị CSDL khác nhau với các khả năng trao đổi dữliệu, xử lý cập nhật dữ liệu, xử lý giao tác phân tán trên toàn hệ thống

II.4 Khả năng mở rộng qui mô

Là khả năng mở rộng qui mô hệ thống khi có các máy tính mới hay các thành phầnkhác của hệ thống được thêm vào, trong khi đó vẫn đảm bảo rằng hệ thống hoạt độngbình thường

Trang 29

II.5 Tính mở

Là khả năng mở rộng tài nguyên của hệ thống Tài nguyên của hệ thống phải được đảmbảo mở rộng một cách dễ dàng, theo nhiều cách Hệ thống có thể sử dụng các tàinguyên được cung cấp trên các hệ thống khác hoặc thêm mới tài nguyên Tính mở cònthể hiện ở khả năng cung cấp các dịch vụ theo các quy tắc chuẩn mô tả cú pháp và ngữnghĩa của dịch vụ đó, thường được đặc tả bằng ngôn ngữ đặc tả giao diện

III Ưu và nhược điểm của CSDL phân tán

III.1 Ưu điểm:

- Về tổ chức và tính kinh tế: phù hợp với các tổ chức phân tán nhiều chi nhánh, hoạtđộng trải rộng ở các vùng, các quốc gia khác nhau

- Tận dụng những CSDL sẵn có: hình thành CSDL phân tán từ các CSDL tập trung cósẵn ở các vị trí địa phương

- Khả năng mở rộng: CSDL phân tán cung cấp khả năng phát triển thuận lợi hơn vàgiảm được xung đột về chức năng giữa các đơn vị đã tồn tại và giảm được xung độtgiữa các chương trình ứng dụng khi truy cập đến CSDL

- Giảm chi phí truyền thông: Trong CSDL phân tán chương trình ứng dụng đặt ở địaphương có thể giảm bớt được chi phí truyền thông bằng cách khai thác ngay CSDL tạichỗ

- Tăng hiệu suất thực hiện công việc: nhờ chia nhỏ công việc ra các trạm, thực hiện xử

lý song song

- Tính tin cậy và sẵn sàng: do CSDL được phân tán trên nhiều trạm, khi một trạm gặp

sự cố, các trạm khác vẫn có thể hoạt động hoặc sử dụng các thành phần khác củaCSDL Để nâng cao độ tin cậy và tính sẵn sàng, có thể áp dụng cơ chế tạo bản sao trênnhiều trạm

III.2 Nhược điểm

- Độ phức tạp thiết kế và cài đặt hệ thống tăng: do phải phân tán dữ liệu và điều khiểntrên các trạm, phải giải bài toán phân đoạn, sắp chỗ sao cho tối ưu, phải giải quyết cácvấn đề về đồng bộ, chia sẻ dữ liệu, tránh xung đột giữa các trạm, đảm bảo tính toàn vẹncủa CSDL, tính đúng đắn của các giao dịch trong hệ thống …

- Hệ quản trị CSDL phân tán phải bổ sung thêm nhiều chức năng như: Theo dõi dấuvết dữ liệu, xử lý các truy vấn phân tán, quản lý các giao dịch phân tán, phục hồiCSDL phân tán, quản lý các bản sao, …

- Hệ thống phần cứng cũng phức tạp hơn vì cần có nhiều trạm và các trạm cần phảiđược duy trì kết nối với nhau

- Các phần mềm hệ thống phải đảm bảo quản trị, duy trì kết nối, trao đổi dữ liệu trênmạng

- Bảo mật khó khăn, phức tạp: không chỉ bảo mật trên từng máy mà phải trên toàn bộ

Trang 30

hệ thống, bảo mật trên đường truyền dữ liệu, nếu tồn tại điểm hở ở bất cứ một trạm nàocũng tạo ra mối đe dọa cho cả hệ thống.

IV Các kiến trúc cơ bản của hệ CSDL phân tán

IV.1 Kiến trúc client/server

Phân chia các chức năng của một hệ thống thành 2 lớp: lớp server và lớp client Serverthực hiện hầu hết các công việc quản lý dữ liệu Điều này có nghĩa là tất cả các côngviệc: xử lý truy vấn, tối ưu hóa truy vấn, quản lý giao dịch, quản lý thiết bị lưu trữ đềuđược thực hiện ở phía server Phía client sẽ gồm các công việc: giao tiếp với ngườidùng, đệm và quản lý bộ đệm dữ liệu, kiểm tra tính nhất quán, tính phù hợp, bảo mậtcủa các truy vấn người dùng tạo ra

Có một số kiểu kiến trúc client/server khác nhau Kiểu đơn giản nhất – đơn server, đaclient – chỉ có một server và nhiều client truy vấn vào server Nói chung, kiểu nàykhông khác nhiều so với hệ tập trung ngoài việc phân tán một số chức năng cho client

và thậm chí dành phần đệm dữ liệu cho phía client Một loại kiến trúc phức tạp hơn, đó

là kiến trúc đa server – đa client Trong kiến trúc này có hai hướng quản lý được đềcập:

• Mỗi client quản lý một kết nối của nó tới một server phù hợp

• Mỗi client có một “home” server, server này sẽ chịu trách nhiệm giao tiếpvới các server khác

IV.2 Kiến trúc ngang hàng peer – to – peer

Kiến trúc này được coi thật sự là kiến trúc hệ CSDL phân tán Chúng ta bắt đầu

mô tả kiến trúc này bằng việc xem xét việc tổ chức dữ liệu Chúng ta phải chú ý rằng tổchức dữ liệu vật lý ở các nút khác nhau có thể khác nhau Điều này có nghĩa là cầnphải có lược đồ trong địa phương (local internal schema) Mô hình dữ liệu của cả tổchức được biểu diễn bởi lược đồ quan niệm toàn cục (global conceptual schema)

Dữ liệu trong một hệ CSDL phân tán thường được phân đoạn và nhân bản, nhưvậy chúng ta cũng cần mô tả cách tổ chức dữ liệu logic ở các site, chúng ta sẽ xây dựngthêm tầng thứ ba trong kiến trúc đó là lược đồ quan niệm địa phương (local conceptualschema) Trong kiến trúc này, lược đồ quan niệm toàn cục sẽ là hợp của các lược đồquan niệm địa phương Cuối cùng, những ứng dụng của người sử dụng được hỗ trợthông qua lược đồ ngoài, được định nghĩa ở mức trên lược đồ quan niệm toàn cục

Trang 31

Hình 2.3: Kiến trúc tham chiếu CSDL phân tán

IV.3 Kiến trúc đa hệ quản trị CSDL

Sự khác nhau giữa kiến trúc đa CSDL và kiến trúc ngang hàng được quyết địnhbởi mức độ tự trị Sự khác nhau cơ bản nằm ở định nghĩa lược đồ quan niệm toàn cục.Trong kiến trúc ngang hàng, lược đồ quan niệm toàn cục là mô hình dữ liệu cho toàn

bộ hệ thống CSDL còn trong kiến trúc đa CSDL, lược đồ quan niệm toàn cục chỉ làmột tập hợp của một vài CSDL mà các hệ quản trị CSDL địa phương muốn chia sẻ.Kiến trúc này có hai mô hình

Mô hình sử dụng một lược đồ quan niệm toàn cục:

Lược đồ quan niệm toàn cục được xây dựng bằng cách tích hợp những lược đồngoài hay một phần của những lược đồ quan niệm địa phương Ngoài ra, người dùng ởnhững CSDL địa phương vẫn có thể sử dụng những ứng dụng cũ để truy nhập vàoCSDL đã có bên cạnh những người dùng toàn cục truy nhập vào nhiều CSDL

Trang 32

Hình 2.4: Kiến trúc hệ đa quản trị CSDL với một mô hình quan niệm toàn cục

Sự khác nhau trong thiết kế lược đồ quan niệm toàn cục giữa hệ quản trị CSDLphân tán và hệ đa quản trị CSDL là trong hệ đa quản trị CSDL, lược đồ toàn cục đượcxây dựng từ ánh xạ các lược đồ quan niệm địa phương thành lược đồ quan niệm toàncục, còn trong hệ quản trị CSDL phân tán thì làm theo chiều ngược lại Trong phần cácquy trình thiết kế ở phần sau, ta sẽ thấy thiết kế hệ quản trị CSDL phân tán theo hướngtop – down, còn thiết kế hệ đa hệ quản trị theo hướng bottom – up

Mô hình không sử dụng một lược đồ quan niệm toàn cục:

Sự tồn tại của một lược đồ quan niệm toàn cục trong hệ đa quản trị vẫn còn là vấn đềgây tranh cãi Một số nhà nghiên cứu đã xây dựng mô hình CSDL không sử dụng môhình quan niệm toàn cục, và họ coi đây là một ưu điểm so với các hệ CSDL phân tánthuần túy

Mô hình kiến trúc này gồm 2 tầng: Tầng hệ thống địa phương và tầng đa CSDL Tầng

hệ thống địa phương bao gồm một số DBMS Những hệ quản trị này sẽ đem đến chotầng trên những phần CSDL mà chúng muốn chia sẻ Những dữ liệu được chia sẻ này

ở dạng lược đồ quan niệm địa phương thực sự hay một lược đồ ngoài địa phương

Trang 33

Hình 2.5: Hệ đa quản trị CSDL không sử dụng mô hình quan niệm toàn cục

V Thiết kế CSDL phân tán

Hai điểm cần chú ý khi thiết kế CSDL phân tán:

- Về mặt kỹ thuật là việc nối liền các điểm làm việc với nhau qua mạng máy tính và tối

ưu hoá việc phân tán dữ liệu cũng như ứng dụng để tối ưu công việc thực hiện

- Về mặt tổ chức: vấn đề phân quyền rất quan trọng khi hệ thống phân tán thay thế cho

hệ thống tập trung, có thể xung đột về phía công tác tổ chức

V.1 Khung thiết kế CSDL phân tán

Thiết kế CSDL tập trung gồm có các công việc sau:

- Thiết kế sơ đồ khái niệm: mô tả CSDL đã hợp nhất (mọi dữ liệu được sử dụng bởi

ứng dụng CSDL)

- Thiết kế CSDL vật lý: tham chiếu từ lược đồ khái niệm tới vùng lưu trữ và xác

định các cách thức truy cập khác nhau

Trong CSDL phân tán bổ sung vào hai vấn đề nữa:

-Thiết kế phân đoạn: xác định cách thức phân chia những quan hệ toàn bộ thành những

đoạn dữ liệu theo chiều dọc, chiều ngang và kiểu hỗn hợp

-Thiết kế cấp phát đoạn dữ liệu: xác định cách thức đoạn dữ liệu tham khảo đến ảnh

vật lý nào và cũng xác định các bản sao của đoạn dữ liệu

Trong quá trình thiết kế CSDL phân tán, cũng cần hiểu biết rõ ràng và đầy đủ về yêucầu của chương trình ứng dụng:

- Vị trí nơi chương trình ứng dụng được đưa ra (cũng gọi là vị trí cơ sở của chươngtrình ứng dụng )

Trang 34

- Tính thường xuyên hoạt động của chương trình ứng dụng: số lần yêu cầu củachương trình ứng dụng trong một khoảng thời gian Trường hợp thông thườngchương trình ứng dụng có thể được đưa ra ở nhiều vị trí khác nhau vì vậy phải biếttần suất hoạt động của chương trình ứng dụng tại mỗi vị trí.

- Số lượng, kiểu và thống kê các lần truy cập đối với mỗi đối tượng dữ liệu được yêucầu bởi các chương trình ứng dụng

V.1.1 Đối tượng thiết kế của CSDL phân tán

Trong thiết phân tán dữ liệu, những đối tượng sau đây được quan tâm:

Tiến trình địa phương: phân tán dữ liệu để cực đại hoá tiến trình địa phương hay tăng

thời gian bộ xử lý trung tâm cho tiến trình địa phương tương ứng với nguyên tắc là đơngiản hoá công việc: đặt dữ liệu gần chương trình ứng dụng thường xuyên sử dụng dữliệu đó Cách đơn giản nhất để mô tả tiến trình địa phương là chú ý đến hai loại thamchiếu tới dữ liệu: tham chiếu địa phương và tham chiếu từ xa Khi vị trí cơ sở củachương trình ứng dụng đã xác định thì tính địa phương và tính biệt lập của công việctham chiếu của chương trình đó chỉ phụ thuộc vào việc phân tán dữ liệu

Thiết kế phân tán dữ liệu để cực đại hoá tiến trình ở địa phương có thể thực hiện quaviệc thêm vào một số tham chiếu địa phương và tham chiếu từ xa tương ứng với mỗiphân đoạn.Tiện lợi chính của tính địa phương không chỉ hoàn toàn là việc giảm côngviệc truy cập từ xa mà bên cạnh đó cũng làm tăng tính đơn giản trong điều khiển thựchiện chương trình ứng dụng

Tính sẵn có và an toàn của dữ liệu phân tán: Tính sẵn có đối với chương trình ứng

dụng có thuộc tính chỉ đọc đạt được qua việc lưu trữ các bản sao của cùng một thôngtin Hệ thống có thể chuyển sang một bản sao khác khi một bản sao nào đó truy cập ởđiều kiện không bình thường hay bản sao đó không có sẵn

Tính an toàn cũng đạt được khi lưu trữ nhiều bản sao của cùng một thông tin, qua đócho phép khôi phục những dữ liệu bị hỏng hóc hay bị phá hủy về mặt vật lý từ một bảnsao khác (nếu có)

Phân chia khối lượng công việc: Phân tán công việc cho những vị trí là đặc điểm quan

trọng của hệ thống máy tính phân tán Việc phân chia công việc cũng nhằm mục đíchđạt được tiện lợi về khả năng của máy tính ở mỗi vị trí trên mạng và cũng để tăng cấp

độ thực hiện song song của chương trình ứng dụng Khi phân chia khối lượng côngviệc có thể ảnh hưởng xấu đến tiến trình xử lý địa phương và cần thiết cân nhắc đến lợihại trong thiết kế dữ liệu phân tán

Giá cả thiết bị lưu trữ và tính sẵn có: Phân tán dữ liệu có thể phản ánh giá cả và tính

sẵn có của thiết bị lưu trữ ở các vị trí khác nhau, có thể có những điểm đặc biệt trongmạng để lưu trữ dữ liệu hoặc có những điểm làm việc không cung cấp kho dữ liệu

Trang 35

V.1.2 Hướng thiết kế Top-Down và Bottom-Up

Hướng thiết kế Top-Down

Hướng thiết kế Top-Down bắt đầu bởi việc thiết kế sơ đồ tổng thể, tiếp tục thiết kếphân đoạn CSDL và sau đó cấp phát các đoạn này cho các vị trí, tạo hình ảnh vật lýcủa dữ liệu

Sơ đồ tổng thể và cấu trúc vật lý được thiết kế bằng cách sử dụng phương pháp nhưthiết kế sơ đồ quan niệm và sơ đồ vật lý trong CSDL tập trung Vì vậy, vấn đề quantrọng nhất của CSDL phân tán là thiết kế phân đoạn và thiết kế sắp chỗ

Thiết kế phân đoạn là vấn đề đầu tiên cần giải quyết khi thiết kế phân tán dữ liệuTrên - Xuống Mục đích của thiết kế phân đoạn là xác định các đoạn không gối lênnhau, chúng là “các đơn vị sắp chỗ logic”, nghĩa là, chúng là điểm xuất phát cho sắpchỗ dữ liệu tiếp theo Thiết kế phân đoạn bao gồ nhóm các bộ (hay các bản ghi, trongtrường hợp phân đoạn ngang) hoặc các thuộc tính (trong trường hợp phân đoạn dọc) cócùng tính chất từ khung nhìn sắp chỗ của chúng Mỗi nhóm các bộ hợp thành các thuộctính có “cùng tính chất” sẽ tạo thành một đoạn Ý tưởng cơ bản là, nếu hai phần tử bất

kỳ của cùng một đoạn có cùng tính chất từ khung nhìn sắp chỗ thì sử dụng phươngpháp bất kỳ để gộp chúng lại với nhau Như vậy, trong trường hợp này, các đoạn thuđược theo cách này chính là đơn vị sắp chỗ

Trạm gốc của mỗi ứng dụng liên quan đến việc xác định các tính chất địa phươngcủa xác định các phân đoạn thích hợp Ta quan tâm đến các ứng dụng khác nhau ngay

cả nêu chúng cùng thực hiện một chức năng

Trang 36

Hình 2.6 : Quy trình thiết kế Top-Down

Trong việc sắp chỗ đoạn, điều quan trọng là phân biệt việc thiết kế sắp chỗ không

dư thừa hay dư thừa:

• Việc xác định sắp chỗ không dư thừa thường sử dụng phương pháp đơn giản

là tiếp cận “best - fit” Có thể một độ đo được gán cho mỗi sắp chỗ, và trạmnào có giá trị độ đo tốt nhất được chọn Cách này không để ý đến hiệu quảtương tác của sắp chỗ một đoạn trên mỗi trạm nếu đoạn liên quan cũng ởtrạm đó

• Sắp chỗ dư thừa cho các đoạn có thể sử dụng hai phương pháp sau:

Trang 37

- Xác định một trạm mà ở đó việc sắp chỗ cho một bản sao đoạn là lợihơn so với chi phí, và sắp chỗ một bản sao đoạn ở từng phần tử của tậpnày Phương pháp này là chọn tất cả các trạm có lợi (All beneficialsites).

- Đầu tiên xác định giải pháp không lặp lại, sau đó đưa ra các bản sao lặplại bắt đầu từ trạm có lợi nhất Quá trình này dừng khi không có sự lặplại cần thiết nữa (Additional replication)

Xác định phân đoạn ngang chính dựa trên việc xác định một tập tối ưu đầy đủcác tiêu chuẩn Xác định phân đoạn ngang suy diễn yêu cầu xác định các thao tác kếtnối quan trọng nhất mà các ứng dụng thực hiện Thiết kế phân đoạn dọc yêu cầu chúng

ta xác định các ứng dụng khác nhau truy cập đến các tệp, các thuộc tính như thế nào.Cuối cùng việc sắp chỗ đoạn có mục đích chính là tối thiểu số các truy nhập từ xa màcác ứng dụng thực hiện

Hướng thiết kế Bottom-Up

Dùng thiết kế Bottom-Up khi CSDL phân tán được phát triển qua việc liên kết CSDL

đã có sẵn Thực tế, trong trường hợp này sơ đồ toàn thể được tạo ra bởi sự thoả hiệpgiữa các loại mô tả dữ liệu có sẵn

Khi CSDL có sẵn được liên kết với nhau thành CSDL phân tán, các CSDL này có thểdùng hệ quản trị CSDL địa phương ở vị trí đó Để hệ thống đồng bộ cần có thêm một

số việc phức tạp như đồng bộ giữa các mẫu CSDL khác nhau Trong trường hợp này

có thể tạo bản tham chiếu 1:1 giữa hai hệ quản trị CSDL địa phương Trong thực tế hầuhết các hệ thống đồng bộ đều sử dụng hướng thiết kế này

Nói chung các yêu cầu của thiết kế Bottom-Up gồm:

- Chọn mô hình CSDL thông thường để thiết kế lược đồ toàn bộ của CSDL

- Dịch chuyển mỗi lược đồ địa phương sang mô hình dữ liệu thông thường

- Tích hợp sơ đồ địa phương sang sơ đồ toàn bộ thông thường

V.2 Thiết kế phân đoạn CSDL

Mục đích của việc phân đoạn để nhận ra những đoạn không trùng nhau (đoạn như vậyđược gọi là đơn vị cấp phát logic)

Rõ ràng, các bộ hoặc các thuộc tính của quan hệ không thể được xem như một đơn vịcấp phát vì sẽ làm cho việc cấp phát trở lên phức tạp hơn Thiết kế phân đoạn bao gồmcông việc nhóm các bộ trong trường hợp phân đoạn ngang hay nhóm các thuộc tínhtrong trường hợp phân đoạn dọc có cùng đặc tính theo quan điểm cấp phát để thành lậpmột đoạn Mỗi cách thức dùng để cấp phát dữ liệu sẽ chọn lựa các đoạn này với nhau

Vì vậy các đoạn hình thành nhờ các phương pháp này tạo ra các đơn vị cấp phát khácnhau

Trang 38

Điểm chú ý ở trong công việc phân đoạn là vị trí cơ sở của mỗi chương trình ứng dụngphải thích hợp để nhận biết đặc tính địa phương đối với công việc Vì vậy cần quanniệm rằng chương trình ứng dụng thực hiện ở nhiều vị trí khác nhau có vai trò như cácchương trình ứng dụng khác nhau thậm chí ngay cả khi chúng thực hiện cùng chứcnăng.

Khi phân đoạn một quan hệ phải tuân thủ các quy tắc sau để đảm bảo CSDL không bịthay đổi về ngữ nghĩa sau khi phân đoạn:

- Tính đầy đủ: Nếu một quan hệ R được phân thành các đoạn R1, R2,…, Rn thì mỗi

mục dữ liệu có trong R phải có mặt trong một hoặc các đoạn Ri

- Tính tái thiết được: Nếu một quan hệ R được phân thành các đoạn R1, R2,…, Rn thì

cần phải tồn tại một phép toán ω sao cho có thể tái thiết quan hệ gốc R từ các quan hệphân rã Ri thông qua phép toán ω: R = ω Ri

- Tính tách biệt: Nếu một quan hệ R được phân đoạn ngang thành các quan hệ R1, R2,

…, Rn và mục dữ liệu ti nằm trên ti nằm trong đoạn Ri thì nó sẽ không nằm trong mộtđoạn Rk nào nữa Tiêu chuẩn này đảm bảo các đoạn tách rời nhau Nếu quan hệ đượcphân rã dọc thì khóa chính phải được lặp lại trong mỗi đoạn

V.2.1 Phân đoạn ngang

Phân đoạn ngang là chia các bản ghi của quan hệ gốc thành các tập con thỏa mãn cácđiều kiện nào đó Có hai phương pháp chính là phân đoạn ngang cơ sở và phân đoạnngang dẫn xuất Phân đoạn ngang cơ sở của một quan hệ được thực hiện dựa trên các

vị từ được định nghĩa trên quan hệ đó Phân đoạn ngang dẫn xuất lại dựa trên các vị từđược định nghĩa trên một quan hệ khác đã phân đoạn

Phân đoạn ngang cơ sở

Phân đoạn ngang cơ sở của một quan hệ được phân đoạn ngang cơ sở được tìm ra khi

sử dụng phép chọn trên quan hệ Tính đúng đắn của phân đoạn ngang cơ sở đòi hỏimỗi bộ của quan hệ được chọn vào một và chỉ một đoạn

Cho một quan hệ R, E là tập các điều kiện chọn, khi đó các đoạn ngang của R là Ri =R(Ei) trong đó Ei là công thức chọn được dùng để có được đoạn Ri

VD Cho quan hệ PROJ(PNO, PNAME, BUDGET, LOC)

Bảng 2.1 Quan hệ PROJ

Trang 39

PROJ có thể được phân thành các đoạn ngang như sau:

PROJ 1 = SL BUDGET <= 200000 PROJ

PROJ 2 = SL BUDGET >200000 PROJ

Với quan hệ PROJ ở trên ta cũng có thể phân đoạn ngang thành 3 mảnh theo cách khácnhư sau:

PROJ 1 = SL LOC = “Montreal” PROJ

PROJ 2 = SL LOC = “New York” PROJ

PROJ 3 = SL LOC = “Paris” PROJ

Bảng 2.4 Quan hệ PROJ 1

Bảng 2.5 Quan hệ PROJ 2

Bảng 2.6 Quan hệ PROJ 3

Trang 40

Việc phân đoạn quan hệ gốc dựa trên một tập các vị từ hội sơ cấp, vì vậy bước đầu tiêncủa việc phân đoạn là xác định tập các vị từ đơn giản sẽ tọa ra các vị từ hội sơ cấp Đểphân đoạn ngang đảm tính đầy đủ, tái thiết được và tính tách biệt thì tập các vị từ hội

sơ cấp phải là đầy đủ và tối thiểu

Xét quan hệ PROJ cho như trên thì nếu tập vị từ Pr = {LOC = “Montreal”, LOC =

“New York”, LOC = “Paris”, BUDGET <= 200000} thì Pr là không đầy đủ vì có một

số bộ không được truy xuất bởi vị từ BUDGET <= 200000, để cho tập đầy đủ ta phảithêm vào vị từ BUDGET > 200000 Vậy Pr = {LOC = “Montreal”, LOC = “NewYork”, LOC = “Paris”, BUDGET <= 200000, BUDGET > 200000} là đầy đủ

Nếu thêm vị từ PNAME = “CAD/CAM” vào Pr thì Pr không còn cực tiểu nữa vì vị từmới thêm vào không chia thêm đoạn nào nữa trong các đoạn đã được tạo ra

Phân đoạn ngang dẫn xuất

Phân đoạn ngang dẫn xuất là phân đoạn một quan hệ là thành viên của một đường nối,dựa theo phép chọn trên quan hệ chủ nhân của đường nối đó Cho đường nối L cóowner(L) = S và member(L) = R, khi đó phân đoạn ngang dẫn xuất trên R được địnhnghĩa như sau: Ri = R |>< Si , 1<= i <= w

Trong đó w là số lượng các đoạn được định nghĩa trên R, Si = S(Ei) với Ei là công thứcđịnh nghĩa đoạn ngang cơ sở Si

VD: Cho hai quan hệ EMP và PAY như sau:

Ngày đăng: 01/04/2014, 20:09

HÌNH ẢNH LIÊN QUAN

Hình 1.1. Quan hệ giữa hệ thống báo cáo tháng và hệ CSDL QG về KTXH - MÔ HÌNH CƠ SỞ DỮ LIỆU PHÂN TÁN VÀ ỨNG DỤNG
Hình 1.1. Quan hệ giữa hệ thống báo cáo tháng và hệ CSDL QG về KTXH (Trang 18)
Hình 1.2. Mô hình tổng thể của hệ CSDL quốc gia về KTXH - MÔ HÌNH CƠ SỞ DỮ LIỆU PHÂN TÁN VÀ ỨNG DỤNG
Hình 1.2. Mô hình tổng thể của hệ CSDL quốc gia về KTXH (Trang 22)
Hình 2.1: Mô hình của hệ thống CSDL phân tán - MÔ HÌNH CƠ SỞ DỮ LIỆU PHÂN TÁN VÀ ỨNG DỤNG
Hình 2.1 Mô hình của hệ thống CSDL phân tán (Trang 23)
Hình 2.3: Kiến trúc tham chiếu CSDL phân tán - MÔ HÌNH CƠ SỞ DỮ LIỆU PHÂN TÁN VÀ ỨNG DỤNG
Hình 2.3 Kiến trúc tham chiếu CSDL phân tán (Trang 31)
Hình 2.4: Kiến trúc hệ đa quản trị CSDL với một mô hình quan niệm toàn cục - MÔ HÌNH CƠ SỞ DỮ LIỆU PHÂN TÁN VÀ ỨNG DỤNG
Hình 2.4 Kiến trúc hệ đa quản trị CSDL với một mô hình quan niệm toàn cục (Trang 32)
Hình 2.5: Hệ đa quản trị CSDL không sử dụng mô hình quan niệm toàn cục - MÔ HÌNH CƠ SỞ DỮ LIỆU PHÂN TÁN VÀ ỨNG DỤNG
Hình 2.5 Hệ đa quản trị CSDL không sử dụng mô hình quan niệm toàn cục (Trang 33)
Hình 2.6 : Quy trình thiết kế Top-Down - MÔ HÌNH CƠ SỞ DỮ LIỆU PHÂN TÁN VÀ ỨNG DỤNG
Hình 2.6 Quy trình thiết kế Top-Down (Trang 36)
Hình 3.12. Mô hình chức năng duyệt báo cáo - MÔ HÌNH CƠ SỞ DỮ LIỆU PHÂN TÁN VÀ ỨNG DỤNG
Hình 3.12. Mô hình chức năng duyệt báo cáo (Trang 58)
Bảng 4.1. DMCapCT (Cấp chỉ tiêu) Field Name Data Type - MÔ HÌNH CƠ SỞ DỮ LIỆU PHÂN TÁN VÀ ỨNG DỤNG
Bảng 4.1. DMCapCT (Cấp chỉ tiêu) Field Name Data Type (Trang 65)
Bảng 4.2. DMChiTieu (Hệ thống chỉ tiêu chung) Field Name Data - MÔ HÌNH CƠ SỞ DỮ LIỆU PHÂN TÁN VÀ ỨNG DỤNG
Bảng 4.2. DMChiTieu (Hệ thống chỉ tiêu chung) Field Name Data (Trang 66)
Bảng 4.3. DMChiTieu_CQ (Danh mục chỉ tiêu của cơ quan) Field Name Data - MÔ HÌNH CƠ SỞ DỮ LIỆU PHÂN TÁN VÀ ỨNG DỤNG
Bảng 4.3. DMChiTieu_CQ (Danh mục chỉ tiêu của cơ quan) Field Name Data (Trang 67)
Bảng 4.5. DMDinhKy (Danh mục Định kỳ BC) Field Name Data - MÔ HÌNH CƠ SỞ DỮ LIỆU PHÂN TÁN VÀ ỨNG DỤNG
Bảng 4.5. DMDinhKy (Danh mục Định kỳ BC) Field Name Data (Trang 68)
Bảng 4.6. QH_DinhKy_LoaiSL (Các loại SL phù hợp với định kỳ BC) Field Name Data - MÔ HÌNH CƠ SỞ DỮ LIỆU PHÂN TÁN VÀ ỨNG DỤNG
Bảng 4.6. QH_DinhKy_LoaiSL (Các loại SL phù hợp với định kỳ BC) Field Name Data (Trang 69)
Bảng 4.10. DMCoQuan (Danh mục cơ quan) Field Name Data - MÔ HÌNH CƠ SỞ DỮ LIỆU PHÂN TÁN VÀ ỨNG DỤNG
Bảng 4.10. DMCoQuan (Danh mục cơ quan) Field Name Data (Trang 72)
Bảng 4.11. DMDonVi (Danh mục đơn vị) Field Name Data - MÔ HÌNH CƠ SỞ DỮ LIỆU PHÂN TÁN VÀ ỨNG DỤNG
Bảng 4.11. DMDonVi (Danh mục đơn vị) Field Name Data (Trang 73)
Bảng 4.12. SLCT (Số liệu chỉ tiêu) Field Name Data - MÔ HÌNH CƠ SỞ DỮ LIỆU PHÂN TÁN VÀ ỨNG DỤNG
Bảng 4.12. SLCT (Số liệu chỉ tiêu) Field Name Data (Trang 74)
Bảng 4.14. DMBMSL (Biểu mẫu số liệu) Field Name Data - MÔ HÌNH CƠ SỞ DỮ LIỆU PHÂN TÁN VÀ ỨNG DỤNG
Bảng 4.14. DMBMSL (Biểu mẫu số liệu) Field Name Data (Trang 78)
Bảng 4.15. QH_BMSL_CT (Danh sách các chỉ tiêu của BMSL) Field Name Data - MÔ HÌNH CƠ SỞ DỮ LIỆU PHÂN TÁN VÀ ỨNG DỤNG
Bảng 4.15. QH_BMSL_CT (Danh sách các chỉ tiêu của BMSL) Field Name Data (Trang 79)
Bảng 4.18. DMLoaiBC (Loại báo cáo) - MÔ HÌNH CƠ SỞ DỮ LIỆU PHÂN TÁN VÀ ỨNG DỤNG
Bảng 4.18. DMLoaiBC (Loại báo cáo) (Trang 81)
Bảng 4.19. QH_LoaiBC_BMSL (Danh sách BMSL của loại BC) Field Name Data - MÔ HÌNH CƠ SỞ DỮ LIỆU PHÂN TÁN VÀ ỨNG DỤNG
Bảng 4.19. QH_LoaiBC_BMSL (Danh sách BMSL của loại BC) Field Name Data (Trang 83)
Bảng 4.21. DMBC (Báo cáo) - MÔ HÌNH CƠ SỞ DỮ LIỆU PHÂN TÁN VÀ ỨNG DỤNG
Bảng 4.21. DMBC (Báo cáo) (Trang 84)
Bảng 4.23. QH_BC_CQNhan(Danh sách các cơ quan nhận BC) Field Name Data - MÔ HÌNH CƠ SỞ DỮ LIỆU PHÂN TÁN VÀ ỨNG DỤNG
Bảng 4.23. QH_BC_CQNhan(Danh sách các cơ quan nhận BC) Field Name Data (Trang 87)
Bảng 4.24. QH_BC_File (Danh sách các tệp dữ liệu kèm theo BC) Field Name Data - MÔ HÌNH CƠ SỞ DỮ LIỆU PHÂN TÁN VÀ ỨNG DỤNG
Bảng 4.24. QH_BC_File (Danh sách các tệp dữ liệu kèm theo BC) Field Name Data (Trang 88)
Bảng 4.25. QTDMTSo (Tham số hệ thống) Field Name Data - MÔ HÌNH CƠ SỞ DỮ LIỆU PHÂN TÁN VÀ ỨNG DỤNG
Bảng 4.25. QTDMTSo (Tham số hệ thống) Field Name Data (Trang 89)
Bảng 4.27. QTDMQuyenTN (Quyền truy nhập) Field Name Data - MÔ HÌNH CƠ SỞ DỮ LIỆU PHÂN TÁN VÀ ỨNG DỤNG
Bảng 4.27. QTDMQuyenTN (Quyền truy nhập) Field Name Data (Trang 90)
Bảng 4.28. QTDMNhom (Nhóm người sử dụng) Field Name Data - MÔ HÌNH CƠ SỞ DỮ LIỆU PHÂN TÁN VÀ ỨNG DỤNG
Bảng 4.28. QTDMNhom (Nhóm người sử dụng) Field Name Data (Trang 91)
Bảng 4.30. QTPQNhom (Danh sách các quyền truy nhập của nhóm NSD) Field Name Data - MÔ HÌNH CƠ SỞ DỮ LIỆU PHÂN TÁN VÀ ỨNG DỤNG
Bảng 4.30. QTPQNhom (Danh sách các quyền truy nhập của nhóm NSD) Field Name Data (Trang 92)
Hình 5.1. Mô hình nhân bản dữ liệu - MÔ HÌNH CƠ SỞ DỮ LIỆU PHÂN TÁN VÀ ỨNG DỤNG
Hình 5.1. Mô hình nhân bản dữ liệu (Trang 98)
Hình 5.3. Giao diện chương trình - MÔ HÌNH CƠ SỞ DỮ LIỆU PHÂN TÁN VÀ ỨNG DỤNG
Hình 5.3. Giao diện chương trình (Trang 102)
Hình 5.7. Tạo Subscription - MÔ HÌNH CƠ SỞ DỮ LIỆU PHÂN TÁN VÀ ỨNG DỤNG
Hình 5.7. Tạo Subscription (Trang 104)

TỪ KHÓA LIÊN QUAN

TÀI LIỆU CÙNG NGƯỜI DÙNG

TÀI LIỆU LIÊN QUAN

w