Định nghĩa CSDL phân tán Cơ sở dữ liệu phân tán Distributed Database System - DDBS là một kiểu cơ sở dữ liệu trong đó dữ liệu được phân tán trên nhiều vị trí vật lý khác nhau và đượcquản
Trang 1BỘ GIÁO DỤC VÀ ĐÀO TẠO
TRƯỜNG ĐẠI HỌC HÒA BÌNH
BÀI TIỂU LUẬN MÔN AN TOÀN CƠ SỞ DỮ LIỆU
Đề tài: An toàn Cơ sở dữ liệu trong Cơ sở dữ liệu phân tán
Giáo viên: PGS.TS Đỗ Trung Tuấn Lớp: CNTT 2023
Học viên: Trần Trọng Hoàn
Hà Nội, tháng 03/2024
Trang 1 / 25
Trang 2Mục lục
LỜI CẢM ƠN 4
I Cơ sở dữ liệu phân tán – Khái niệm, ưu nhược điểm và các ứng dụng CSDL phân tán trong thực tế 6
1 Định nghĩa CSDL phân tán 6
2 Các dạng CSDL phân tán 6
2.1 CSDL phân tán đồng nhất 6
2.2 CSDL phân tán không đồng nhất 6
2.3 Hình thức lưu trữ của CSDL phân tán 7
3 Ưu điểm của CSDL phân tán 8
4 Những hạn chế của CSDL phân tán 9
5 Những lĩnh vực chính sử dụng DDBS 10
II Những vấn đề mất an toàn CSDL khi sử dụng DDBS 11
1 Rủi ro mạng 11
2 Quản lý quyền truy cập không đủ 11
3 Xung đột dữ liệu 11
4 Thiếu tính nhất quán 11
5 Sự thiếu hiểu biết về mạng 11
6 Lỗi phần mềm 12
7 Sự cố vận hành 12
8 Sự thiếu hiểu biết về bảo mật 12
III Các biện pháp nâng cao an toàn CSDL khi sử dụng DDBS 12
1 Xác thực và Quản lý Quyền truy cập 12
2 Mã hóa Dữ liệu 14
2.1 Tầm quan trọng của việc mã hoá dữ liệu 14
2.2 Một số giải pháp về mã hoá dữ liệu 15
3 Bảo mật Mạng 16
4 Sao lưu và Khôi phục 17
5 Kiểm tra An ninh Đồng thời 17
6 Đào tạo và Nhận thức về Bảo mật 17
Trang 2 / 25
Trang 37 Kiểm tra An toàn Định kỳ 17
IV Nhận xét và đánh giá 18
V Tài liệu tham khảo 18
Danh mục hình ảnh Hình 1: Sơ đồ ví dụ về cơ sở dữ liệu đồng nhất 6
Hình 2: Mô hình ví dụ về cơ sở dữ liệu không đồng nhất 7
Hình 3: Mô hình lưu trữ CSDL phân tán theo hình thức nhân rộng 7
Hình 4: Mô hình mô tả Phân mảnh CSDL phân tán theo chiều ngang 8
Hình 5: Mô hình mô tả Phân mảnh CSDL phân tán theo chiều dọc 9
Hình 6: Hình ảnh minh hoạ Xác thực quyền truy cập 13
Hình 7: Hình ảnh Quản lý Quyền truy cập 14
Hình 8: Hình ảnh mô tả Mã hoá dữ liệu 16
Hình 9: Hình ảnh thể hiện sự an toàn dữ liệu trong quá trình truyền dữ liệu 17
Hình 10: Mô hình minh hoạ bảo mật mạng 18
Hình 11: Minh hoạ sao lưu và khôi phục dữ liệu 19
Hình 12: Hình ảnh minh hoạ cho tính năng kiểm tra an ninh đồng thời 20
Trang 3 / 25
Trang 4LỜI CẢM ƠN
Đầu tiên, em xin gửi lời cảm ơn chân thành đến Trường Đại học Hoà Bình đãđưa môn học An toàn Cơ sở dữ liệu vào trương trình giảng dạy Đặc biệt, em xingửi lời cảm ơn sâu sắc đến giảng viên bộ môn - thầy PGS.TS Đỗ Trung Tuấn đãdạy dỗ, truyền đạt những kiến thức quý báu cho em trong suốt thời gian học tậpvừa qua
Trong thời gian tham gia lớp học thầy, em đã có thêm cho mình nhiều kiếnthức bổ ích, tinh thần học tập hiệu quả, nghiêm túc Đây chắc chắn sẽ là nhữngkiến thức quý báu, là hành trang để em có thể vững bước sau này
Bộ môn An toàn Cơ sở dữ liệu là môn học thú vị, vô cùng bổ ích và có tínhthực tế cao Đảm bảo cung cấp đủ kiến thức, gắn liền với nhu cầu thực tiễn của họcviên Tuy nhiên, do vốn kiến thức còn nhiều hạn chế và khả năng tiếp thu thực tếcòn nhiều bỡ ngỡ
Mặc dù em đã cố gắng hết sức nhưng chắc chắn bài tiểu luận khó có thể tránhkhỏi những thiếu sót và nhiều chỗ còn chưa chính xác, kính mong thầy/cô xem xét
và góp ý để bài tiểu luận của em được hoàn thiện hơn
Trang 4 / 25
Trang 5Bảng giải nghĩa từ viết tắt
HTTPS Hypertext Transfer Protocol Security
Trang 5 / 25
Trang 6I Cơ sở dữ liệu phân tán – Khái niệm, ưu nhược điểm và các ứng dụng CSDL phân tán trong thực tế.
1 Định nghĩa CSDL phân tán
Cơ sở dữ liệu phân tán (Distributed Database System - DDBS) là một kiểu cơ
sở dữ liệu trong đó dữ liệu được phân tán trên nhiều vị trí vật lý khác nhau và đượcquản lý bởi một hệ thống quản lý cơ sở dữ liệu (DBMS) phân tán
2 Các dạng CSDL phân tán
2.1 CSDL phân tán đồng nhất
Cơ sở dữ liệu phân tán đồng nhất là một mạng gồm các cơ sở dữ liệu giốnghệt nhau được lưu trữ trên nhiều máy chủ Các máy chủ này có cùng hệ điều hành,DDBMS và cấu trúc dữ liệu, giúp chúng dễ dàng quản lý
Cơ sở dữ liệu đồng nhất cho phép người dùng truy cập dữ liệu từ mỗi cơ sở
Trang 6 / 25
Trang 72.3 Hình thức lưu trữ của CSDL phân tán
Lưu trữ cơ sở dữ liệu phân tán được quản lý theo hai cách:
- Nhân rộng
- Phân mảnh
2.3.1 Lưu trữ CSDL phân tán theo hình thức nhân rộng
Trong sao chép cơ sở dữ liệu, hệ thống lưu trữ các bản sao dữ liệu trên cáctrang web khác nhau Nếu toàn bộ cơ sở dữ liệu có sẵn trên nhiều trang thì đó là cơ
sở dữ liệu dự phòng hoàn toàn
Ưu điểm của việc sao chép cơ sở dữ liệu là nó làm tăng tính khả dụng của dữliệu trên các trang khác nhau và cho phép xử lý các yêu cầu truy vấn song song
Hình 3: Mô hình lưu trữ CSDL phân tán theo hình thức nhân rộng
Trang 7 / 25
Trang 8Tuy nhiên, sao chép cơ sở dữ liệu có nghĩa là dữ liệu yêu cầu cập nhật vàđồng bộ hóa liên tục với các trang khác để duy trì bản sao cơ sở dữ liệu chính xác.Mọi thay đổi được thực hiện trên một trang web phải được ghi lại trên các trangweb khác, nếu không sẽ xảy ra mâu thuẫn.
Các bản cập nhật liên tục gây ra nhiều chi phí cho máy chủ và làm phức tạpviệc kiểm soát đồng thời, vì nhiều truy vấn đồng thời phải được kiểm tra trên tất cảcác trang web có sẵn
2.3.2 Lưu trữ CSDL phân tán theo hình thức Phân mảnh
Khi nói đến sự phân mảnh của việc lưu trữ cơ sở dữ liệu phân tán, các mốiquan hệ bị phân mảnh, có nghĩa là chúng được chia thành các phần nhỏ hơn Mỗimảnh được lưu trữ trên một trang web khác nhau, nơi cần thiết
Điều kiện tiên quyết cho việc phân mảnh là đảm bảo rằng các mảnh sau đó cóthể được xây dựng lại thành quan hệ ban đầu mà không làm mất dữ liệu
Ưu điểm của phân mảnh là không có bản sao dữ liệu, điều này ngăn ngừa sựkhông nhất quán của dữ liệu
Có hai loại phân mảnh:
Phân mảnh theo chiều ngang - Lược đồ quan hệ được phân mảnh thành cácnhóm hàng và mỗi nhóm (bộ) được gán cho một phân đoạn
Hình 4: Mô hình mô tả Phân mảnh CSDL phân tán theo chiều ngang
Trang 8 / 25
Trang 9Phân mảnh theo chiều dọc - Lược đồ quan hệ được phân mảnh thành các lược
đồ nhỏ hơn và mỗi đoạn chứa một khóa ứng viên chung để đảm bảo phép nốikhông mất dữ liệu
Hình 5: Mô hình mô tả Phân mảnh CSDL phân tán theo chiều dọc
3 Ưu điểm của CSDL phân tán
Phân phối và Mở rộng: DDBS cho phép phân phối dữ liệu trên nhiều nút
hoặc máy chủ, giúp mở rộng khả năng lưu trữ và xử lý dữ liệu một cách linh hoạt.Khi nhu cầu về lưu trữ và xử lý dữ liệu tăng lên, bạn có thể thêm các nút mới vào
hệ thống một cách dễ dàng
Khả năng Chịu lỗi: Một trong những ưu điểm lớn của DDBS là khả năng
chịu lỗi cao Nếu một nút hoặc máy chủ gặp sự cố, các nút còn lại vẫn có thể tiếptục hoạt động và cung cấp dịch vụ cho người dùng
Tính Đồng nhất và Nhất quán: DDBS cung cấp các cơ chế để đảm bảo tính
nhất quán của dữ liệu Bằng cách sử dụng giao thức đồng thuận và các kỹ thuậtđồng bộ hóa dữ liệu, DDBS đảm bảo rằng mọi thay đổi dữ liệu được áp dụng mộtcách nhất quán trên toàn bộ hệ thống
Tính Khả dụng và Đáng Tin Cậy: DDBS cung cấp tính khả dụng cao bằng
cách phân phối dữ liệu trên nhiều nút Nếu một nút gặp sự cố, các nút khác vẫn có
Trang 9 / 25
Trang 10thể tiếp tục hoạt động, đảm bảo rằng dữ liệu luôn sẵn sàng và dịch vụ không bịgián đoạn.
Hiệu suất và Tính Dễ Mở Rộng: DDBS cho phép tăng cường hiệu suất
bằng cách phân tán các truy vấn và xử lý dữ liệu trên nhiều nút Bằng cách thêmnút mới vào hệ thống, bạn có thể mở rộng cơ sở dữ liệu một cách dễ dàng để đápứng nhu cầu tăng trưởng
Bảo mật và Quản lý Quyền Truy cập: DDBS cung cấp các cơ chế bảo mật
để bảo vệ dữ liệu khỏi sự truy cập trái phép Bằng cách sử dụng các phương pháp
mã hóa và kiểm soát quyền truy cập, bạn có thể đảm bảo rằng dữ liệu chỉ được truycập bởi những người được phép
Tóm lại, DDBS là một giải pháp mạnh mẽ cho việc quản lý dữ liệu trong môitrường phân tán và có thể cung cấp tính linh hoạt, khả năng chịu lỗi, và hiệu suấtcao cho các ứng dụng và hệ thống đòi hỏi sự phân phối và mở rộng
4 Những hạn chế của CSDL phân tán
Việc quản lý và triển khai cơ sở dữ liệu phân tán có thể phức tạp hơn so với
cơ sở dữ liệu tập trung do cần phải xử lý các vấn đề như đồng bộ hóa dữ liệu, bảomật, và quản lý khối lượng lớn các truy vấn trên mạng
Mặc dù có nhiều ưu điểm và tính linh hoạt, cơ sở dữ liệu phân tán(Distributed Database Systems - DDBS) cũng đối diện với một số hạn chế:
Phức tạp trong Thiết kế: Thiết kế cơ sở dữ liệu phân tán đòi hỏi kiến thức
sâu rộng về mạng máy tính, phân phối dữ liệu và đồng bộ hóa Việc quản lý cácyếu tố như phân phối dữ liệu, đồng bộ hóa và bảo mật trở nên phức tạp hơn so với
cơ sở dữ liệu tập trung
Chi phí cao: Triển khai và duy trì một hệ thống cơ sở dữ liệu phân tán có thể
tốn kém về mặt tài chính Cần phải đầu tư vào cơ sở hạ tầng mạng, phần cứng vàphần mềm đặc biệt để hỗ trợ việc phân phối dữ liệu và quản lý hệ thống
Khả năng xử lý Transaction phức tạp: Đồng bộ hóa Transaction (Giao
dịch) trên các nút khác nhau có thể gây ra hiệu suất kém và độ trễ Việc đảm bảotính nhất quán của dữ liệu trong các transaction phức tạp trên mạng có thể là mộtthách thức
Rủi ro về Bảo mật: Một hệ thống cơ sở dữ liệu phân tán đặt ra nhiều thách
thức về bảo mật Dữ liệu được phân tán trên nhiều nút và di chuyển qua mạng,tăng cường nguy cơ bị tấn công từ bên ngoài hoặc bên trong hệ thống
Trang 10 / 25
Trang 11Quản lý Dữ liệu Phức tạp: Quản lý và duy trì dữ liệu phân tán cũng là một
thách thức Cần phải đảm bảo rằng dữ liệu được sao lưu đúng cách và cập nhậtmột cách nhất quán trên các nút khác nhau
Hiệu suất và Độ trễ: Truy cập dữ liệu từ xa và đồng bộ hóa dữ liệu giữa các
nút có thể gây ra độ trễ và làm giảm hiệu suất so với cơ sở dữ liệu tập trung
Khó khăn trong Quản lý Tính nhất quán: Đảm bảo tính nhất quán của dữ
liệu trên các nút khác nhau có thể là một thách thức Việc xử lý xung đột dữ liệu vàđồng bộ hóa thông tin giữa các nút yêu cầu các phương pháp và công nghệ đặcbiệt
Vấn đề Tích cực và Mất mát Dữ liệu: Trong một môi trường phân tán, có
nguy cơ cao hơn về mất mát dữ liệu hoặc sự phân tán không đồng đều của dữ liệu.Điều này có thể xảy ra do sự cố hệ thống, lỗi quản lý hoặc lỗi người dùng.Tóm lại, cơ sở dữ liệu phân tán mang lại nhiều lợi ích nhưng cũng đồng thờiđối mặt với nhiều thách thức và hạn chế, đặc biệt là trong việc quản lý, bảo mật vàhiệu suất Để thành công với một hệ thống cơ sở dữ liệu phân tán, cần phải đảmbảo sự hiểu biết sâu rộng về kiến thức kỹ thuật và kỹ năng quản lý hệ thống phứctạp này
5 Những lĩnh vực chính sử dụng DDBS
Trên thực tế, cơ sở dữ liệu phân tán có thể được áp dụng trong hầu hết cáclĩnh vực nơi cần quản lý dữ liệu từ nhiều nguồn và nhiều vị trí khác nhau Điều nàycho thấy sự linh hoạt và ứng dụng rộng rãi của công nghệ này trong nhiều ngữcảnh khác nhau
Cơ sở dữ liệu phân tán (Distributed Database Systems - DDBS) được sử dụngrộng rãi trong nhiều lĩnh vực khác nhau do khả năng mở rộng, tính linh hoạt và khảnăng chịu lỗi Dưới đây là một số lĩnh vực chính sử dụng DDBS:
Hệ thống Ngân hàng và Tài chính: Trong ngành ngân hàng và tài chính,
DDBS được sử dụng để quản lý dữ liệu về khách hàng, giao dịch tài chính, lịch sửgiao dịch và các thông tin quan trọng khác DDBS cho phép các ngân hàng và tổchức tài chính phân phối dữ liệu trên nhiều chi nhánh và vị trí, giúp cải thiện khảnăng mở rộng và hiệu suất
Công nghệ Thông tin và Truyền thông: Trong lĩnh vực công nghệ thông
tin và truyền thông, DDBS được sử dụng để lưu trữ và quản lý dữ liệu của các ứngdụng web, dịch vụ trực tuyến và hệ thống phân phối nội dung Việc sử dụngDDBS giúp tăng cường khả năng mở rộng, tính sẵn sàng và khả năng chịu lỗi củacác ứng dụng trực tuyến
Trang 11 / 25
Trang 12Quản lý Chuỗi cung ứng: Trong các doanh nghiệp quản lý chuỗi cung ứng,
DDBS được sử dụng để quản lý thông tin về sản phẩm, kho hàng, vận chuyển và
dữ liệu liên quan đến quy trình sản xuất và phân phối DDBS cho phép các doanhnghiệp quản lý dữ liệu phân tán trên nhiều cơ sở, kho hàng và vị trí, giúp tối ưuhóa quy trình chuỗi cung ứng
Y tế và Chăm sóc sức khỏe: Trong ngành y tế và chăm sóc sức khỏe, DDBS
được sử dụng để quản lý dữ liệu bệnh nhân, lịch sử bệnh án, dữ liệu y tế và thôngtin liên quan đến quản lý bệnh viện và các cơ sở y tế DDBS giúp tối ưu hóa quản
lý thông tin và tăng cường tính sẵn sàng và khả năng chịu lỗi của hệ thống y tế
Giáo dục và Nghiên cứu: Trong lĩnh vực giáo dục và nghiên cứu, DDBS
được sử dụng để quản lý dữ liệu về học viên, đào tạo, nghiên cứu và thông tin liênquan đến quản lý học viện và các tổ chức nghiên cứu DDBS giúp tối ưu hóa quản
lý dữ liệu và cung cấp thông tin chính xác và đáng tin cậy cho các tổ chức giáo dục
và nghiên cứu
II Những vấn đề mất an toàn CSDL khi sử dụng DDBS
Khi sử dụng cơ sở dữ liệu phân tán (Distributed Database Systems - DDBS),
có rất nhiều vấn đề gây mất an toàn dữ liệu, sau đây là một số vấn đề mất an toàn
dữ liệu mà người quản trị cần phải quan tâm và giải quyết:
1 Rủi ro mạng
Các hệ thống phân tán thường phải hoạt động trên môi trường mạng, và do đó
dễ bị tấn công từ bên ngoài Các mối đe dọa bảo mật như tấn công từ chối dịch vụ(DDoS), tấn công mã độc, và các phương pháp tấn công khác có thể gây ra rủi romất dữ liệu và sự kiểm soát của hệ thống
2 Quản lý quyền truy cập không đủ
Một vấn đề phổ biến khi triển khai DDBS là quản lý quyền truy cập không
đủ Nếu không có các cơ chế chính xác để quản lý và kiểm soát quyền truy cập vào
dữ liệu, có nguy cơ cao về lạm dụng thông tin hoặc truy cập trái phép
3 Xung đột dữ liệu
Trong một môi trường phân tán, xung đột dữ liệu có thể xảy ra khi nhiềunguồn cố gắng thay đổi cùng một dữ liệu Điều này có thể gây ra mất mát hoặc sựmâu thuẫn của dữ liệu
4 Thiếu tính nhất quán
Việc đảm bảo tính nhất quán của dữ liệu trên các nút khác nhau trong một hệthống phân tán là một thách thức Các lỗi đồng bộ hóa có thể dẫn đến sự khôngnhất quán và mất dữ liệu
Trang 12 / 25
Trang 135 Sự thiếu hiểu biết về mạng
Người quản trị hệ thống cần có hiểu biết sâu rộng về cả mạng lẫn cơ sở dữliệu Thiếu hiểu biết về mạng có thể gây ra các lỗ hổng bảo mật hoặc không thể tối
Vận hành hệ thống DDBS đôi khi gặp sự cố, có thể là do mất kết nối mạng,
sự cố phần cứng, hoặc các lỗi hệ thống khác Những sự cố này có thể gây ra mất
dữ liệu hoặc làm gián đoạn quá trình hoạt động kinh doanh
8 Sự thiếu hiểu biết về bảo mật
Thiếu hiểu biết về các vấn đề bảo mật cơ bản có thể khiến cho hệ thốngDDBS trở nên dễ bị tấn công hoặc lộ thông tin nhạy cảm
III Các biện pháp nâng cao an toàn CSDL khi sử dụng DDBS
Để nâng cao an toàn của cơ sở dữ liệu phân tán (Distributed DatabaseSystems - DDBS) và giảm thiểu các rủi ro liên quan, có một số biện pháp màngười quản trị hệ thống có thể triển khai
1 Xác thực và Quản lý Quyền truy cập
Áp dụng các biện pháp xác thực mạnh mẽ để đảm bảo rằng chỉ những ngườidùng được ủy quyền mới có thể truy cập vào hệ thống
Quản lý quyền truy cập một cách chính xác, cấp quyền truy cập dựa trênnguyên tắc của nguyên tắc ít đặc quyền (Principle of Least Privilege), chỉ cấpquyền cần thiết cho từng người dùng
Trang 13 / 25
Trang 14Hình 7: Hình ảnh Quản lý Quyền truy cập
Xác thực và Quản lý Quyền truy cập là hai yếu tố cực kỳ quan trọng trong cơ
sở dữ liệu phân tán (Distributed Database Systems - DDBS) vì chúng giúp đảmbảo rằng chỉ những người dùng được ủy quyền mới có thể truy cập vào hệ thống
và dữ liệu của nó Dưới đây là một số điểm quan trọng về tầm quan trọng của Xácthực và Quản lý Quyền truy cập trong DDBS:
Bảo vệ Dữ liệu Nhạy Cảm: Xác thực và Quản lý Quyền truy cập giúp bảo
vệ dữ liệu nhạy cảm và quan trọng khỏi việc truy cập trái phép hoặc lạm dụngthông tin
Trang 14 / 25