Trong cơ sở dữ liệu phân tán các tập tin dữ liệu được lưu trữ độc lập trêncác nút của mạng máy tính và có liên quan đến nhau về mặt logic và còn hơn thế nữacòn đòi hỏi chúng phải được tr
Trang 1LỜI MỞ ĐẦU
Bước sang thế kỷ 21, nhân loại đã chuyển từ xã hội công nghiệp sang xã hộithông tin Với mạng Internet tốc độ cao ngày càng được mở rộng trên toàn thế giới,với việc ứng dụng Công nghệ thông tin ngày càng sâu hơn trong nhiều lĩnh vực, nhucầu và khả năng kết nối, chia sẻ thông tin của con người đang trở nên lớn hơn bao giờhết Để không bị tụt hậu lại phía sau, mọi quốc gia, mọi tổ chức kinh tế xã hội đềunhận thức được vai trò quan trọng không thể thiếu của công nghệ thông tin trong việcnâng cao hiệu quả hoạt động, thúc đẩy sự phát triển của quốc gia, tổ chức mình Tuynhiên vấn đề khó khăn đặt ra ở đây là khối lượng công việc cần thực hiện ngày cànglớn, lượng dữ liệu cần lưu trữ và các thao tác xử lý chúng ngày càng tăng trong khi docác đặc điểm về qui mô, tổ chức và nghiệp vụ, các kho dữ liệu lại được phân bố trảirộng ở nhiều nơi khác nhau, sử dụng những công nghệ khác nhau, khả năng liên kết làrất hạn chế Trong những trường hợp như vậy, các tổ chức phải tiến hành xây dựng cácứng dụng trên hệ cơ sở dữ liệu phân tán Công nghệ phân tán đã được nghiên cứu khálâu và ngày càng trở nên ổn định, hoàn thiện hơn Nó cung cấp khả năng kết nối, chia
sẻ dữ liệu gần như không có giới hạn, nâng cao hiệu quả hoạt động và khả năng mởrộng của hệ thống, tăng tính tin cậy và tính sẵn sàng cho người sử dụng
Ở Việt Nam, việc ứng dụng Công nghệ thông tin nói chung và cơ sở dữ liệu phântán nói riêng vẫn còn hạn chế, lý do chủ yếu có thể là do hạ tầng mạng, công nghệ củaViệt Nam còn chưa thực sự phát triển Tuy nhiên trong những năm trở lại đây tìnhhình đã được cải thiện rất tích cực Trong khối các cơ quan Nhà nước, Chính phủ cũngthể hiện quyết tâm rất cao về việc tin học hóa công tác quản lý, cải cách thủ tục hànhchính, tăng cường trao đổi và chia sẻ thông tin, giúp nâng cao hiệu quả điều hành, tiếtkiệm chi phí, từng bước tiến đến mục tiêu Chính phủ điện tử
Trang 2YÊU CẦU CỦA ĐỀ TÀI
KHẢO SÁT, PHÂN TÍCH THIẾT KẾ CSDL PHÂN TÁN
QUẢN LÝ NHÂN SỰ TIỀN LƯƠNG
1 Cơ sở dữ liệu: 3 5 quan hệ ở dạng chuẩn Boyce-Codd, đảm bảo các ràng buộc toàn vẹn dữ liệu, mỗi quan hệ có 20 30 bản ghi
2 Vị trí: 3 5, có chi phí lưu trữ, xử lí và truyền số liệu giống nhau Mỗi vị trí đều có lưu dữ liệu
3 Chương trình ứng dụng: 3 5 câu vấn tin SQL, được thực hiện tại tất cả vị trí với tần suất khác nhau
Trang 3Hệ thống phân tán là tập hợp các máy tính độc lập kết nối với nhau thành mộtmạng máy tính được cài đặt các hệ cơ sở dữ liệu và các p
hần mềm hệ thống phân tán tạo khả năng cho nhiều người sử dụng truy nhập chia
sẻ nguồn thông tin chung Các máy tính trong hệ thống phân tán có kết nối phần cứnglỏng lẻo, có nghĩa là không chia sẻ bộ nhớ, chỉ có một hệ điều hành cho toàn bộ hệthống phân tán
Các mạng máy tính được xây dựng dựa trên kỹ thuật Web, ví dụ như mạnginternet,… là các mạng phân tán
II Cơ sở dữ liệu phân tán
1 Khái niệm cơ sở dữ liệu phân tán
Cơ sở dữ liệu phân tán là tập hợp dữ liệu logic thuộc về cùng một hệ thốngnhưng trải rộng ra nhiều điểm trên mạng máy tính Trong khái niệm mô tả về cơ sở dữliệu phân tán trên có hai đặc tính cơ bản là “liên quan logic” và “phân bố trên mạngmáy tính” Trong cơ sở dữ liệu phân tán các tập tin dữ liệu được lưu trữ độc lập trêncác nút của mạng máy tính và có liên quan đến nhau về mặt logic và còn hơn thế nữacòn đòi hỏi chúng phải được truy xuất đến qua một giao diện chung, thống nhất
Hệ quản trị CSDL phân tán (Distributed Database Management System DBMS) được định nghĩa là một hệ thống phần mềm cho phép quản lý các hệ CSDLphân tán và làm cho sự phân tán trở nên “trong suốt” đối với người sử dụng
Trang 4D-Khái niệm “trong suốt” để chỉ sự tách biệt ở cấp độ cao của hệ thống với các vấn
đề cài đặt ở cấp độ thấp của hệ thống Có các dạng “trong suốt” như sau:
- “Trong suốt” về phân tán Do tính chất phân tán của hệ thống nên các dữ liệuđược lưu trữ tại các nút có vị trí địa lý khác nhau, phần mềm sẽ đáp ứng các yêu cầucủa người sử dụng sao cho người sử dụng không cần biết vị trí địa lý của dữ liệu
- “Trong suốt” về phân hoạch Do dữ liệu phân tán và do nhu cầu cảu công việc,
dữ liệu cần được phân hoạch và mỗi phân hoạch được lưu trữ tại một nút khác nhau(đây gọi là quá trình phân mảnh) Quá trình phân mãnh hoàn toàn tự động bởi hệ thống
và người sử dụng không cần phải can thiệp
- “Trong suốt” về nhân bản Vì lý do hiệu năng, tin cậy nên dữ liệu còn được saochép một phần ở những vị trí khác nhau
- “Trong suốt” về độc lập dữ liệu
- “Trong suốt” về kết nối mạng Người sử dụng không cần biết về sự có mặt củagiao tiếp mạng
Các tầng trong suốt của hệ thống
2 Cấu trúc chung của một cơ sở dữ liệu phân tán
Cấu trúc mẫu của một cơ sở dữ liệu phân tán có dạng:
Trang 5- Lược đồ toàn cục:
Định nghĩa tất cả các dữ liệu sẽ được lưu trữ trong CSDL phân tán Vì vậy, lược
đồ toàn cục được định nghĩa chính xác như định nghĩa lược đồ CSDL tập trung
- Lược đồ phân đoạn:
Mỗi quan hệ tổng thể có thể chia thành nhiều phần không chồng lặp lên nhauđược gọi là đoạn (fragments) Ánh xạ giữa các quan hệ toàn cục và phân đoạn đượcgọi là lược đồ phân đoạn Ánh xạ này là mối quan hệ một – nhiều Ví dụ, nhiều phânđoạn tương ứng với một quan hệ toàn cục, nhưng chỉ một quan hệ toàn cục tương ứngvới một phân đoạn Các phân đoạn được chỉ ra bằng tên của quan hệ toàn cục với mộtchỉ số (chỉ số phân đoạn)
Các phân đoạn dữ liệu bao gồm phân đoạn ngang và phân đoạn dọc và một kiểuphân đoạn phức tạp hơn là sự kết hợp của hai loại trên
- Lược đồ định vị:
Các đoạn là các phần logic của quan hệ toàn cục được định vị vật lý trên mộthoặc nhiều vị trí trên mạng Lược đồ định vị xác định các phân đoạn được định vị tạicác vị trí nào Lưu ý rằng kiểu ánh xạ được định nghĩa trong sơ đồ định vị quyết địnhCSDL phân tán là dư thừa hay không
- Lược đồ ánh xạ địa phương:
Do ba mức đầu là độc lập, do đó chúng không phụ thuộc vào mô hình dữ liệu củaCSDL cục bộ Ở mức thấp hơn, nó cần phải ánh xạ mô hình vật lý thành các đối tượngđược thao tác bới hệ quản trị CSDL cục bộ Ánh xạ này được gọi là lược đồ ánh xạ địaphương và phụ thuộc vào kiểu của hệ quản trị CSDL cục bộ
Trang 6- Tận dụng những cơ sở dữ liệu có sẵn: Hình thàng cơ sở dữ liệu phân tán từ các
cơ sở dữ liệu tập trung có sẵn ở các chi nhánh địa phương Trong trường hợp này cơ sở
dữ liệu phân tán được tạo theo tiến trình từ dưới lên dựa trên nền tảng cơ sở dữ liệuđang tồn tại
- Thuận lợi cho nhu cầu phát triển: Các tổ chức có thể phát triển mở rộng bằngcách thành lập thêm các đơn vị mới, vừa có tính tự trị, vừa có quan hệ với các đơn vị
tổ chức khác
- Giảm chi phí truyền thông: Tăng ứng dụng cục bộ làm giảm chi phí truyềnthông Trong cơ sở dữ liệu phân tán, chương trình ứng dụng đặt tại địa phương có thểgiảm bớt chi phí truyền thông khi thực hiện bằng cách khai thác cơ sở dữ liệu tại chỗ
- Nâng cao hiệu suất: Có cơ chế xử lý song song và phân mảnh dữ liệu theo ứngdụng làm cực đại hóa tính cục bộ của ứng dụng
- Tăng độ tin cậy và tính sẵn sàng: Nếu có một thành phần nào đó của hệ thống bịhỏng, hệ thống vẫn có thể duy trì hoạt động
4 So sánh CSDL phân tán và CSDL tập trung
Đặc trưng mô tả CSDL tập trung là điều khiển tập trung, độc lập dữ liệu, giảmbớt dư thừa, cơ cấu vật lý phức tạp đối với khả năng truy cập, toàn vẹn, hồi phục, điềukhiển tương tranh, biệt lập và an toàn dữ liệu
- Điều khiển tập trung:
Trong CSDL tập trung, điều khiển tập trung các nguồn thông tin của công việchay tổ chức Có người quản trị đảm bảo an toàn dữ liệu
Trong CSDL phân tán: không đề cập đến vấn đề điều khiển tập trung Ngườiquản trị CSDL chung phân quyền cho người quản trị CSDL địa phương
- Độc lập dữ liệu: là một trong những nhân tố tác động đến cấu trúc CSDL để tổchức dữ liệu chuyển cho chương trình ứng dụng Tiện lợi chính của độc lập dữ liệu làcác chương trình ứng dụng không bị ảnh hưởng khi thay đổi cấu trúc vật lý của dữliệu
Trong CSDL phân tán, độc lập dữ liệu có tầm quan trọng cũng như trong CSDLtruyền thống Khái niệm CSDL trong suốt thể hiện rằng hoạt động của chương trìnhtrên CSDL phân tán được viết như làm việc trên CSDL tập trung Hay nói cách kháctính đúng đắn của chương trình không bị ảnh hưởng bởi việc di chuyển dữ liệu từ nơi
Trang 7này sang nơi khác trong mạng máy tính Tuy nhiên tốc độ làm việc bị ảnh hưởng do cóthời gian di chuyển dữ liệu.
- Giảm dư thừa dữ liệu: Trong CSDL tập trung, tính dư thừa hạn chế được càngnhiều càng tốt vì:
+ Dữ liệu không đồng nhất khi có vài bản sao của cùng CSDL logic; để tránhđược nhược điểm này giải pháp là chỉ có một bản sao duy nhất
+ Giảm không gian lưu trữ Giảm dư thừa có nghĩa là cho phép nhiều ứng dụngcùng truy cập đến một CSDL mà không cần đến nhiều bản sao ở những nơi chươngtrình ứng dụng cần
CSDL phân tán chia dữ liệu ra thành nhiều phần nhỏ và được thể hiện như mộtbản sao logic tổng thể duy nhất để tiện cho việc truy cập dữ liệu
- Cấu trúc vật lý và khả năng truy cập: Trong CSDL phân tán, hiệu quả của truycập thể hiện ở thời gian tìm kiếm và chuyển dữ liệu nhỏ nhất, chi phí truyền thôngthấp nhất Công việc viết ra cách thức truy cập CSDL phân tán cũng giống như viếtchương trình duyệt trong các CSDL tập trung
- Tính toàn vẹn, hồi phục và điều khiển tương tranh: Trong CSDL phân tán, vấn
đề điều khiển giao tác tự trị có ý nghĩa quan trọng: hệ thống điều phối phải chuyển đổicác quỹ thời gian cho các giao tác liên tiếp Như vậy giao tác tự trị là phương tiện đạtđược sự toàn vẹn trong CSDL Có hai mối nguy hiểm của giao tác tự trị là lỗi và tươngtranh
- Tính biệt lập và an toàn: trong CSDL truyền thống, người quản trị hệ thống cóquyền điều khiển tập trung, người sử dụng được phân quyền mới truy cập vào được dữliệu Trong cách tiếp cận CSDL tập trung, không cần thủ tục điều khiển chuyên biệt.Trong CSDL phân tán, những người quản trị địa phương cũng phải giải quyếtvấn đề tương tự như người quản trị CSDL truyền thống Tuy nhiên, với cấp độ tự trịcao ở mỗi điểm, người có dữ liệu địa phương sẽ cảm thấy an toàn hơn vì họ có thể tựbảo vệ dữ liệu của mình thay vì phụ thuộc vào người quản trị hệ thống tập trung.Ngoài ra, vấn đề an toàn với hệ phân tán còn liên quan đến an toàn trong mạng truyềnthông, hệ thống có tính mở và nhiều người dùng sử dụng nhiều CSDL, do đó đòi hỏinhiều kỹ thuật bảo vệ phức tạp hơn
III Hệ quản trị cơ sở dữ liệu phân tán
1 Khái niệm hệ quản trị cơ sở dữ liệu phân tán
Hệ quản trị cơ sở dữ liệu phân tán là hệ thống phần mềm cho phép quản trịCSDL phân tán và làm cho sự phân tán đó là trong suốt đối với người sử dụng Nóicách khác, CSDL phân tán là CSDL được phân tán một cách vật lý nhưng được thốngnhất tổ chức như một CSDL duy nhất
Trang 8Các hệ quản trị CSDL phân tán thường hỗ trợ về điều khiển tương tranh và khôiphục các tiến trình phân tán Khả năng truy cập từ xa có thể thực hiện được bằng 2cách Cách thứ nhất: Trình ứng dụng yêu cầu truy cập từ xa Yêu cầu này được địnhtuyến tự động bởi hệ quản trị CSDL phân tán tới máy chủ chứa dữ liệu Được thựchiện tại máy chủ chứa dữ liệu và gửi lại kết quả về máy trạm yêu cầu Cách thứ hai:Chương trình phụ thực hiện tại các máy trạm ở xa (người lập trình phải tự lập), các kếtquả trả lại cho chương trình ứng dụng.
2 Phân loại hệ quản tri cơ sở dữ liệu phân tán
- Hệ quản trị cơ sở dữ liệu phân tán thuần nhất
Khi áp dụng đối với các hệ quản trị CSDL, thuật ngữ thuần nhất có nghĩa là côngnghệ CSDL là như nhau (hay ít nhất là có thể tương thích) tại mỗi vị trí địa lý và dữliệu tại các vị trí địa lý khác nhau cũng có thể tương thích Các hệ quản trị CSDL phântán thuần nhất đơn giản hoá việc chia sẻ dữ liệu giữa những người sử dụng khác nhau.Các điều kiện sau cần được thoả mãn:
- Các hệ điều hành mày tính tại mỗi vị trí địa lý là như nhau hay ít nhất chúng cókhả năng tương thích cao
- Các mô hình dữ liệu được sử dụng tại mỗi vị trí địa lý là như nhau (mô hìnhquan hệ được sử dụng chung nhất đối với các hệ quản trị CSDL phân tán ngày nay)
- Các hệ quản trị CSDL được sử dụng tại mỗi vị trí địa lý là như nhau hay ít nhấtchúng có khả năng tương thích cao
- Dữ liệu tại các vị trí khác nhau có thể có các định nghĩa và khuôn dạng chung.Các hệ quản trị CSDL phân tán thuần nhất thể hiện một mục đích thiết kế đối vớicác CSDL phân tán Cụ thể, các CSDL phân tán thuần nhất được thiết kế bằng cáchchia nhỏ một CSDL thành nhiều CSDL địa phương, các CSDL địa phương định vị trêncác trạm làm việc khác nhau nhưng chúng được biểu diễn bởi cùng một mô hình dữliệu và được quản trị bởi cùng một hệ quản trị CSDL địa phương
Hình: Hệ quản trị cơ sở dữ liệu phân tán thuần nhất
Trang 9- Hệ quản trị cơ sở dữ liệu phân tán không thuần nhất
Trong hầu hết các tổ chức, các hệ quản trị CSDL liên quan đến một chu kì dàikhông được chỉ đạo và lập kế hoạch cẩn thận Các máy tính khác nhau và các hệ điềuhành khác nhau có thể được sử dụng tại mỗi một vị trí địa lý Các mô hình dữ liệukhác nhau và các hệ quản trị CSDL khác nhau cũng có thể được lựa chọn sử dụng Ví
dụ, một ví trí có thể sử dụng công nghệ cơ sở dữ hiệu quan hệ mới nhất, trong khi một
vị trí khác có thể lưu trữ dữ liệu sử dụng các tệp truyền thống hay các CSDL mạng,phân cấp cũ hơn
Phức tạp hơn nữa, dữ liệu trên các vị trí thường không tương thích Các mâuthuẫn điển hình bao gồm các khác biệt về cú pháp (sự biểu diễn khác nhau các khoảnmục dữ liệu tại hai vị trí) và các khác biệt về ngữ nghĩa (các ngữ nghĩa khác nhau đốivới cùng một khoản mục dữ liệu tại các vị trí khác nhau
Sớm hay muộn thì những người sử dụng tại các vị trí khác nhau sẽ phát hiện rarằng họ cần chia sẻ dữ liệu cho dù có sự không tương thích Một giải pháp là phát triểnmột CSDL mới hoàn toàn mà hợp nhất tất cả các hệ đang tồn tại Tuy nhiên, đâythường là một giải pháp không dễ thực hiện về mặt kĩ thuật hay về mặt kinh tế Thayvào đó, đôi khi các CSDL được móc nối với nhau và kết quả là tạo ra một tập cácCSDL không thuần nhất (đôi khi còn được gọi là các CSDL liên hiệp) Một hệ thốngnhất như vậy nói chung hạn chế các kiểu xử lý mà những người sử dụng có thể thựchiện Ví dụ một người sử dụng tại một ví trí có thể đọc nhưng không thể cập nhật dữliệu tại một vị trí khác
Hình: Hệ quản trị cơ sở dữ liệu không thuần nhất
III Cơ sở lý thuyết thiết kế cơ sở dữ liệu phân tán
Thiết kế cơ sở dữ liệu phân tán cũng thực hiện các công việc giống như trongthiết kế cơ sở dữ liệu tập trung, gồm có các công việc sau:
- Thiết kế sơ đồ khái niệm: mô tả cơ sở dữ liệu hợp nhất
- Thiết kế cơ sở dữ liệu vật lý: tham chiếu từ lược đồ khái niệm tới vùng lưu trữ
Trang 10- Thiết kế phân đoạn: xác định cách thức phân chia những quan hệ toàn bộ thànhnhững đoạn dữ liệu theo chiều dọc, theo chiều ngang hay kiểu hỗn hợp.
- Thiết kế định vị đoạn dữ liệu: xác định cách thức đoạn dữ liệu tham khảo đếnảnh vật lý nào và cũng xác định các bản sao của đoạn dữ liệu
1 Các chiến lược thiết kế
Hai chiến lược chính trong việc thiết kế cơ sở dữ liệu phân tán là tiếp cận từ trênxuống và tiếp cận từ dưới lên Trong thực tế rất hiếm các ứng dụng đơn giản để chỉ sửdụng một cách tiếp cận, vì vậy trong phần lớn thiết kế cả hai cách tiếp cần đều được ápdụng bổ sung cho nhau
a) Quá trình thiết kế từ trên xuống
Việc phân tích yêu cầu nhằm định nghĩa môi trường hệ thống và thu nhập cácnhu cầu xử lý của tất cả người dùng, đồng thời cũng xác định yêu cầu hệ thống
Hồ sơ ghi chép các yêu cầu là nguyên liệu cho hai hoạt động song song: Thiết kếkhung nhìn (view design) và Thiết kế khái niệm (conceptual design)
Thiết kế khung nhìn định nghĩa các giao diện cho người dùng đầu cuối
Thiết kế khái niệm là quá trình xem xét tổng thể đối tượng xí nghiệp, nhằm xácđịnh các loại thực thể và mối liên hệ giữa chúng với nhau Ta có thể chia quá trình nàythành 2 nhóm bao gồm các hoạt động liên quan tới nhau: Phân tích thực thể (entityanalysis) và Phân tích chức năng (functional analysis) Phân tích thực thể có liên quanđến việc xác định các thực thể, các thuộc tính và các mối liên hệ giữa chúng Phân tíchchức năng đề cập đến việc xác định các chức năng cơ bản có liên quan đến xí nghiệpcần được mô hình hoá Kết quả của hai quá trình này cần được đối chiếu qua lại, giúpchúng ta biết được chức năng nào sẽ hoạt tác trên những thực thể nào
Có sự liên hệ khăng khít giữa thiết kế khái niệm và thiết kế khung nhìn Theonghĩa nào đó thiết kế khái niệm được coi như là sự tích hợp các khung nhìn Tuy nhiên
mô hình khái niệm cần phải hỗ trợ không chỉ những ứng dụng hiện có mà còn cảnhững ứng dụng trong tương lai Tích hợp khung nhìn nhằm đảm bảo các yêu cầu vềthực thể và các mối liên hệ giữa các khung nhìn đều phải được bao quát trong lược đồkhái niệm
Trong các hoạt động thiết kế khái niệm và thiết kế khung nhìn, người thiết kế cầnphải đặc tả các thực thể dữ liệu và phải xác định các ứng dụng chạy trên cơ sở dữ liệucũng như các thông tin thống kê về những ứng dụng này Thông tin thống kê bao gồmđặc tả về tần số ứng dụng, khối lượng thông tin khác nhau,
Lược đồ khái niệm toàn cục GCS và thông tin về kiểu mẫu truy xuất thu đượctrong thiết kế khung nhìn sẽ là nguyên liệu cho bước thiết kế phân tán Mục tiêu củagiai đoạn này là thiết kế các lược đồ khái niệm cục bộ LCS bằng cách phân tán cácthực thể cho các vị trí của hệ thống phân tán
Trang 11Ta chia quan hệ thành nhiều quan hệ nhỏ hơn gọi là các đoạn và phân tán cácmảnh này Hoạt động thiết kế phân tán gồm hai bước: Phân đoạn và định vị.
Thiết kế vật lý là ánh xạ lược đồ khái niệm cục bộ sang các thiết bị lưu trữ vật lý
có sẵn tại các vị trí tương ứng Nguyên liệu cho quá trình này là lược đồ khái niệm cục
bộ và thông tin về kiểu mẫu truy xuất các đoạn
Hoạt động phát triển và thiết kế luôn là quá trình liên tục, đòi hỏi theo dõi hiệuchỉnh thường xuyên Vì thế chúng ta đưa vấn đề quan sát và theo dõi như một hoạtđộng chính trong qua trình này Cần chú ý rằng chúng ta không chỉ theo dõi vấn đề càiđặt cơ sở dữ liệu, mà còn quan sát theo dõi tính thích hợp của các khung nhìn củangười dùng Kết quả này có tác dụng phản hồi, tạo cơ sở cho việc tái thiết kế về sau.b) Quá trình thiết kế từ dưới lên
Thiết kế từ trên xuống thích hợp cho những cơ sở dữ liệu được thiết kế từ đầu.Tuy nhiên trong thực tế cũng có khi đã có sẵn một số cơ sở dữ liệu, và chúng ta phảitích hợp chúng thành một cơ sở dữ liệu chung Tiếp cận từ dưới lên sẽ thích hợp chotình huống này Khởi điểm của thiết kế từ dưới lên là các lược đồ khái niệm cục bộ, sẽphải được tích hợp thành lược đồ khái niệm toàn cục
2 Phân đoạn dữ liệu
- Phân đoạn ngang: Phân đoạn ngang một quan hệ tổng thể n bộ R là tách Rthành các quan hệ con n bộ R1, R2, …, Rk sao cho quan hệ R có thể được khôi phụclại từ các quan hệ còn bằng phép hợp
k R R
R
R 1 2
Có hai loại phân đoạn ngang:
Phân đoạn nganh nguyên thủy: phân đoạn ngang nguyên thủy của một quan hệđược thực hiện dựa trên các vị từ được định nghĩa trên quan hệ đó
Phân đoạn ngang dẫn xuất: Phân đoạn ngang dẫn xuất của một quan hệ đượcthực hiện dựa trên các vị từ được định nghĩa trên quan hệ khác
- Phân đoạn dọc: Một phân đoạn dọc một quan hệ tổng thể n bộ R là tách R thànhtập các quan hệ con R1, , Rk sao cho quan hệ R có thể được khôi phục lại từ các quan
hệ con này bằng phép nối
Trang 12Phần 2 THIẾT KẾ CƠ SỞ DỮ LIỆU
I Mô tả bài toán
Công ty TNHH Tin học HTP là một công ty chuyên cung cấp các sản phẩm liênquan đến phần cứng, phần mềm máy tính và các dịch vụ hỗ trợ khách hàng Công ty
có trụ sở chính đặt tại Hà nội, hai chi nhánh đặt tại thành phố Hồ Chí Minh và ĐàNẵng Tổng số nhân viên của công ty lên đến 500 người Với mô hình hoạt động kháphức tạp, số lượng nhân viên đông, phân bố nhân viên tại nhiều chi nhánh, công typhải có mô hình quản lý chặt chẽ để có thể mang lại hiệu quả Vấn đề đặt ra ở đây làcông ty cần có hệ thống quản lý nhân sự và tiền lương hợp lý, chặt chẽ
Trách nhiệm quản lý nhân sự tiền lương:
- Phòng hành chính nhân sự chịu trách nhiệm quản lý các công việc cập nhật: Hồ
sơ nhân viên, Bảng hệ số lương, Quá trình công tác, Hồ sơ khen thưởng kỷ luật
- Phòng tài chính kế toán chịu trách nhiệm với công việc tính lương hàng thángtheo khung lương đối với từng bộ phận và từng chức vụ cho nhân viên
- Phòng ban liên quan chịu trách nhiệm với công việc: Yêu cầu khen thưởng – kỷluật nhân viên, Chấm công hàng tháng cho nhân viên
Mức lương của nhân viên tùy thuộc vào chức vụ và ngày công của nhân viên.Nhân viên ở chức vụ nào sẽ nhận được mức lương ứng với từng chức vụ đó
Những việc được khen thưởng và hình thức khen thưởng tương ứng do giám đốccông ty quy định Khi các phòng ban liên quan có yêu cầu khen thưởng nhân viên, bộphận tài chính kế toán quản lí lương có trách nhiệm tạo ra bảng khen thưởng trong đó
có tên loại khen thưởng và hình thức khen thưởng tương ứng Quản lí nhân sự dựa vàobảng đó mà thực hiện khen thưởng cho nhân viên
Những việc bị kỉ luật và hình thức kỉ luật tương ứng do giám đốc công ty quyđịnh Khi các phòng ban liên quan có yêu cầu kỷ luật nhân viên Bộ phận quản lílương có trách nhiệm tạo ra bảng kỉ luật trong đó có tên loại kỉ luật và hình thức kỉ luậttương ứng Quản lí nhân sự dựa vào bảng đó mà thực hiện kỉ luật cho nhân viên theobảng trên
Chú ý: Các hình thức khen thưởng hay kỷ luật đều sử dụng các biện pháp về tàichính (thưởng tiền hay trừ lương)
Quy trình quản lý nhân sự, tiền lương được thực hiện như sau:
- Quy trình quản lý quá trình công tác: Phòng hành chính nhân sự quản lý chi tiếtquá trình công tác của nhân viên trước khi vào làm việc trong công ty: khi bắt đầu vào
Trang 13làm việc, khi được thăng chức, khi thuyên chuyển giữa các phòng ban Quản lý thôngtin về các quyết định khen thưởng, kỷ luật liên quan đến nhân viên
- Quy trình quản lý lương: Phòng tài chính kế toán cập nhật bảng hệ số lươngcho các nhân viên, gồm các thông số như: mức lương tối thiểu theo quy định của nhànước, mức lương được hưởng khi làm thêm ngoài giờ, hệ số lương, hệ số phụ cấp ,tính lương theo từng tháng cho các nhân viên
II Phân tích
1 Mô hình thực thể mối quan hệ
NHANVIEN (MaNV, HoNV, TenNV, Gioitinh, Ngaysinh, Noisinh, Quequan,
Diachi, Dienthoai, Maphongban, Machucvu, Noilam)
PHONGBAN (Maphongban, Tenphongban, Diachiphongban)
CHUCVU (MaCV, Chucvu, Phucap)
BANGLUONG (MaNV, Luongcoban, Hesoluong, Songaylamviec, MaKT,
Makyluat, Lamthemgio, Luongthemgia)
KHENTHUONG (MaKT, LoaiKT, MucKT)
KYLUAT (Makyluat, Loaikyluat, Muckyluat)
Mối quan hệ
3 Chuẩn hóa các lược đồ quan hệ
Ta thiết kế các lược đồ quan hệ của cơ sở dữ liệu đạt chuẩn 1NF, 2NF, 3NF,BCNF sao cho chúng không còn các phụ thuộc bộ phận và các phụ thuộc bắc cầu bởi
vì các kiểu phụ thuộc này gây ra các sửa đổi bất thường dữ liệu
- Định nghĩa dạng chuẩn Boyce - Codd:
Bảng lương
Khen thưởng
Kỷ luật
Trang 14Một lược đồ quan hệ ở dạng chuẩn Boyce – Codd (BCNF) nếu khi một phụ thuộchàm X A thỏa mãn trong R thì X là một siêu khóa của R.
Xét chuẩn Boyce – Codd của các lược đồ quan hệ:
a) NHANVIEN (MaNV, HoNV, TenNV, Gioitinh, Ngaysinh, Quequan,
Maphongban, Machucvu, Noilam)
Có:
- Tập thuộc tính: MaNV, HoNV, TenNV, Gioitinh, Ngaysinh, Quequan,Maphongban, Machucvu, Noilam
- Thuộc tính khóa chính là MaNV, lược đồ chỉ có 1 khóa
- Phụ thuộc hàm: MaNV → HoNV, TenNV, Gioitinh, Ngaysinh, Quequan,Maphongban, Machucvu, Noilam
Quan hệ trên chỉ có một phụ thuộc hàm, không có một phụ thuộc hàm nào khác,
vế trái của phụ thuộc hàm là thuộc tính khóa Vậy lược đồ quan hệ NHANVIEN đạtchuẩn dạng BCNF
b) PHONGBAN (Maphongban, Tenphongban, Diachiphongban)
Có:
- Tập thuộc tính: Maphongban, Tenphongban, Diachiphongban
- Thuộc tính khóa chính là Maphongban, lược đồ chỉ có một khóa
- Phụ thuộc hàm: Maphongban → Tenphongban, Diachiphongban
Quan hệ chỉ có một phụ thuộc hàm trên, không có phục thuộc hàm nào khác, vềtrái của phụ thuộc hàm là thuộc tính khóa Vậy lược đồ quan hệ PHONGBAN đạtchuẩn dạng BCNF
c) CHUCVU (MaCV, Chucvu, Phucap)
Có:
- Tập thuộc tính: MaCV, Chucvu, Phucap
- Thuộc tính khóa chính là MaCV, lược đồ chỉ có một khóa
- Phụ thuộc hàm: MaCV → Chucvu, Phucap
Quan hệ chỉ có một phụ thuộc hàm trên, không có phục thuộc hàm nào khác, vềtrái của phụ thuộc hàm là thuộc tính khóa Vậy lược đồ quan hệ CHUCVU đạt chuẩndạng BCNF
d) BANGLUONG (MaNV, Luongcoban, Hesoluong, Songaylamviec, MaKT,
Makyluat, Lamthemgio, Luongthemgia)