Giới thiệu An toàn cơ sở đữ liệu trong môi trường đám mây là một lĩnh vực quan trọng và ngày càng trở nên phức tạp trong thế giới công nghệ hiện đại.. Với sự phát triển mạnh mẽ của công
Trang 1
TRƯỜNG ĐẠI HỌC HÒA BÌNH KHOA CONG NGHE THONG TIN - ĐIỆN TỬ VIỄN THÔNG
*ÈJz
ĐẠI HỌC
HOA BINH
AN TOÀN CƠ SỞ DỮ LIỆU
AN TOÀN CƠ SỞ DỮ LIỆU TRONG MÔI TRUONG DAM MAY
Sinh viên thực hiện: Cầm Bá Thắng Giáng viên: PGS Đỗ Trung Tuấn
Hà Nội, năm 2023
LỜI CÁM ƠN
Loi cam ơn chân thành đến thầy Đỗ Trung Tuấn,
Trang 2Chúng tôi xin gửi lời biết ơn sâu sắc đến thầy Đỗ Trung Tuần, người đã dành thời gian và tâm huyết đề dạy chúng tôi môn An toàn cơ sở đữ liệu Nhờ sự hướng dẫn và kiến thức sâu rộng của thầy, chúng tôi đã có cơ hội hiểu rõ hơn về các nguyên lý cơ bản và phương pháp bảo vệ dữ liệu quan trọng
Thây đã không chỉ cung cấp cho chúng tôi kiến thức chuyên môn mà còn truyền đạt những giá trị và tư duy logic trong quá trình học tập Sự nhiệt huyết và tận tâm của thầy đã là nguồn động viên lớn lao giúp chúng tôi vượt qua những thách thức trong quá trỉnh học tập và nâng cao kỹ năng của mình
Chúng tôi rất biết ơn vì sự hiểu biết sâu sắc và cách thức giảng đạy tận tình của
thầy Đã Trung Tuấn Lời khuyên và sự hỗ trợ của thầy sẽ luôn là nguồn động viên lớn lao
cho chúng tôi trong tương lai
Xin chân thành cam on thay! Tran trong,
Ngày 20 tháng 03 năm 2024 Người việt
Cam Ba Thang
Trang 3LỜI CÁM ƠN
1
2
H
2.3 Rủi ro từ lỗ hồng bảo mật phần mềm
MỤC LỤC
AN TOAN CO SO DU LIEU LON TRONG MOI TRUONG DAM MAY
GIG HhiGU eo cece ccc cece cccceccecesseccesssseessscesssecssssesesseesessescessesensesstaaees Mỗi đe dọa về An toàn cơ sở đữ liệu trong môi trường đảm mây 2.1 Nguy cơ đe dọa an toàn từ bên trong cc c2 22211 như 2.2 Tấn công người dùng từ bên ngoài - - 5s ng ng ra
2.4, Mất hoặc bị lộ c2 222 2221122211212 111 re
2.5 Chậm trong phát hiện và phản ứng L0 1 2212221112112 2122k rey
AN TOÀN CHO DỮ LIỆU LỚN
An toờn cao đối với dữ //278/7,NREEREEEREE HH
I Bùng nỗ đữ liệu c s HT HH HH He HH HH re
2 Thu thập dữ liệu L 22 2221122111121 112 11 2111812 nay
3 _ Tích hợp dữ liệu -.L Q22 121122112212 211111222 xà he
4 — Phân tích dữ liệu Q.1 S111 g g2 1 1k ngan ng
5 Ước lượng mối đe đọa 1c t2 121211 1121 tE HH HH Hung 8
"Ax.‹ na
7 _ Tương quan thống kê - ST 1 11E11211111121111 EE1 1tr, 8
8 Giám sat va tra LOL cece ccc cece cecceceseeseseesesecsessecsecssnseesscsesssesiseeseeseens 8
HI._ XÂY DỰNG CHIẾN LƯỢC AN TOÀN CƠ SỞ DỮ LIỆU -
Mười cách đề xây dựng chiến lược an toàn cơ sở dữ liệu lớn c co: 9
1 — Chính sách - ST L 12L S1 1111 1 11011011101 101 101118 11H nh Hư kg 9
2 Tình huống xấu và sẵn sàng đối phó 5c SE E11 11212 rcrke 9
3 _ Hiện trạng đối với đữ liệu đám MAY ooo cece ccceccccccee eects eeeceeeeeteecntseeeeies 9
4 Ké hoach trong tuong lai c.cceccccccccescescssessesesseesesesssesesesstevsvsvsesevsseees 10
5 Thao tác an tOảH - L c1 11 1 111011111111 11111111011 1111111181 HH ch 10
6 — Phát hiện đe dọa, tấn công và thu thập đữ liệu cc 52555: 10
7 _ Phân tích an toàn cơ sở đữ liệu lớn cccccccccceseeesentetttascecens 10
Trang 49
10
Dữ liệu ngầm - S1 T12 1212111121122 11 22111 12111 này 10 Chuân hóa và phân tích s- SE E1 1121111 21121111 11 211 tư 11
1
2
3
4
KET L
DANH
Quan ly van dé hiéu nang va m6i nguy hie ccc eesee cesses II
Quản lý nhật kí đối với việc thu thập dữ liệu, gộp lớn, phân tích dữ liệu
12
Quản lý nhật kí và các thao tác công nghệ thông tm - 13 Trường hợp của khách hang - 2L 2 2222222111122 11s nhe 13
Trang 5I AN TOÀN CƠ SỞ DỮ LIỆU LỚN TRONG MÔI TRƯỜNG ĐÁM MÂY
1 Giới thiệu
An toàn cơ sở đữ liệu trong môi trường đám mây là một lĩnh vực quan trọng và ngày càng trở nên phức tạp trong thế giới công nghệ hiện đại Với sự phát triển mạnh
mẽ của công nghệ đám mây, các tổ chức và doanh nghiệp đang dần chuyên đổi hệ thống lưu trữ và xử lý đữ liệu của mình từ môi trường truyền thống sang môi trường
đám mây để tận dụng các lợi ích về tính linh hoạt, khả năng mở rộng và hiệu quả chị
phí
Tuy nhiên, việc chuyên đổi sang môi trường đám mây không chỉ đem lại những lợi ích mà còn mang đến những thách thức lớn đối với an ninh và an toàn đữ liệu Trong môi trường dam may, dit liệu của tô chức được lưu trữ và xử lý trên các hạ tầng điện toán phân tán và chia sẻ, điều này tạo ra các điểm yêu tiềm ẩn và làm tăng nguy cơ về việc tiết lộ thông tin nhạy cảm, vị phạm quyền riêng tư, hoặc thậm chí là mat mat dit
liệu Do đó, việc thực hiện các biện pháp bảo mật va an toàn cơ sở dữ liệu đúng đắn
trở nên cực kỳ quan trọng Các biện pháp này bao gồm, nhưng không giới hạn, mã hóa đữ liệu, quản lý danh sách kiêm soát truy cập, giám sát hệ thông, sao lưu và phục hồi dữ liệu định kỳ, cùng với việc thực hiện các chính sách và quy trình an toàn cứng
z
Tan
Ngoài ra, việc duy trì sự tuân thủ các quy định pháp lý và tiêu chuẩn an ninh thông tin cũng đóng vai trò quan trọng trong việc bảo vệ dữ liệu của tổ chức trong môi trường đám mây Điều này bao gồm việc tuân thủ các quy định như GDPR, HIPAA,
PCI DSS, và các tiêu chuẩn bảo mật khác liên quan đến lĩnh vực hoạt động của tô
chức Tóm lại, an toàn cơ sở dữ liệu lớn trong môi trường đám mây không chỉ là một
thách thức mà còn là một cơ hội để các tổ chức tăng cường bảo vệ đữ liệu của mình
và xây dựng một môi trường an toản và đáng tin cậy hơn cho khách hàng và đối tác kinh doanh
Môi trường đám mây (Cloud Computing) đã thay đổi cách mà chúng ta lưu trữ và quan lý dữ liệu Với công nghệ đám mây, dữ liệu không còn phải được lưu trữ trên các máy chủ cục bộ mà được chuyên đến các trung tâm đữ liệu của nhà cung cấp dịch vụ đám mây Điều này mang lại nhiều lợi ích về mặt ch phí, quản lý và tính linh hoạt Cũng có những rủi ro liên quan đến việc lưu trữ dữ liệu trong môi trường đám mây, bao gồm rủi ro về an ninh và an toàn thông tin Các nhà cung cấp dịch vụ đám mây cung cấp các biện pháp bảo mật đề bảo vệ dữ liệu của khách hàng, nhưng việc duy trì
an toàn đữ liệu cũng là trách nhiệm của từng tổ chức và doanh nghiệp
An toàn cơ sở đữ liệu lớn trong môi trường đám mây là một mảng lớn trong lĩnh
Trang 6ữ liệu Để đảm bảo an toàn cho đữ liệu của mình, các tổ chức cần thực hiện các biện pháp bảo mật chặt chẽ, bao gồm việc mã hóa đữ liệu, quản lý danh sách kiểm
soát truy cập, giám sát hệ thong, sao lưu dữ liệu định kỳ va phục hồi đữ liệu sau sự cố
Một trong những yếu tố quan trọng nhất trong an toàn cơ sở dữ liệu lớn trong môi trường đám mây là quản lý danh sách kiêm soát truy cập Việc này đảm bảo rằng chỉ những người có quyền truy cập được phép truy cập vào đữ liệu nhạy cảm Các tô chức cũng cần đảm bảo rằng họ có các biện pháp phòng ngừa và phản ứng để ngăn chặn và
giảm thiểu thiệt hại từ các cuộc tắn công mạng
Bên cạnh việc thực hiện các biện pháp bảo mật kỹ thuật, các tô chức cũng cần chú
ý đến các quy định pháp lý và tiêu chuân an ninh thông tin Các quy định như GDPR
(Nghị định Bảo vệ Dữ liệu Châu Âu), HIPAA (Luật Báo vệ Dữ liệu Y Tế) và PCI DSS
(Tiêu chuẩn Bảo mật Dữ liệu Thẻ Thanh toán) đặt ra các yêu cầu cụ thê về bảo vệ dữ
liệu và yêu cầu phải tuân thủ
Trong khi môi trường đám mây mang lại nhiều lợi ích cho việc lưu trữ và quản lý
dữ liệu, nhưng cũng mang lại nhiều thách thức liên quan đến an ninh và an toàn thông tin Đề đảm bảo an toàn cho đữ liệu của mình, các tô chức cần phải thực hiện các biện pháp bảo mật kỹ thuật, tuân thủ các quy định pháp lý và tiêu chuẩn an ninh thông tin,
và có một chiến lược toàn diện đề bảo vệ dữ liệu của mình khỏi các mỗi đe đọa mạng
2 Mối đe dọa về An toàn cơ sở đữ liệu trong môi trường đám mây
Năm 2016, Imperva - một trong những công ty hàng đầu về an ninh mạng và bảo mật đữ liệu - đã phân tích và đưa ra một sô môi đe dọa chính doi vol an toàn cơ so dtr liệu lớn trong môi trường đám mây Dưới đây là một tóm tắt về các mối đe dọa theo Imperva trong nam 2016:
2.1 Nguy cơ de dọa an toàn từ bên trong
Trang 7chức Nhân viên không tinh tế về an ninh thông tin hoặc có ý định gian lận có thê tiết
lộ thông tin nhạy cảm hoặc thực hiện các hành động không đúng đắn Điều này đặc biệt đứng trong môi trường đám mây, nơi mà quản lý danh sách kiêm soát truy cập
cần phải được thực hiện một cách cân thận Một khi mắt nguy cơ an toàn tăng do
nhiêu tấn công, cùng với bảo vệ gia tăng chậm, thì người dùng dễ bị thiệt hại 2.2 _ Tần công người dùng từ bên ngoài
Môi trường đám mây cung cấp một bề mặt tấn công lớn cho các hacker và kẻ tấn công mạng Các môi đe dọa bảo mật mạng bao gôm tần công DDoS, tân công nhân danh và việc khai thác lỗ hông bao mật trong hệ thông đảm mây
2.3 Rủi ro từ lỗ hông báo mật phần mềm
Lỗ hông bảo mật trong phần mềm là một mối đe đọa lớn đến an toàn cơ sở đữ liệu Trong môi trường đám mây, các nhà cung cấp dịch vụ cung cấp các bản cập nhật và
vá lỗi thường xuyên đề giữ cho hệ thống của họ an toàn Tuy nhiên, nêu các bản cập
nhật không được triển khai đúng cách hoặc không được triển khai kịp thời, có thể tạo
ra các cơ hội cho kẻ tấn công tận dụng
2.4 Mất hoặc bị lộ
Mất mát hoặc bị 16 đữ liệu có thê xảy ra thông qua việc tấn công từ bên ngoài, lỗi người dùng hoặc sự có kỹ thuật trong hạ tầng đám mây Điều này có thê gây ra hậu quả nghiêm trọng đối với tổ chức, bao gồm thiệt hại về uy tín và pháp lý
2.5 Cham trong phat hién và phản ứng
Trong môi trường đám mây, có thể mất thời gian đề phát hiện và phản ứng lại các mỗi đe đọa an ninh Điều này là do sự phân tán của đữ liệu và sự phức tạp của hạ tầng đám mây, khiến cho việc giám sát và phát hiện các hành vi bất thường trở nên khó khăn hơn
I AN TOAN CHO DU LIEU LỚN
An toàn cao đối với dữ liệu lớn
Người ta truy cập thông tin qua các ứng dụng, thiết bị di động, để ra quyết định theo thời gian thực Thông tin trở nên phổ biến đến mức các hoạt động kinh doanh cần
nắm được đữ liệu đề phân tích theo cách thông minh
1 Bùng nỗ dữ liệu
Nhiều thiết bị công nghệ thông tin và truyền thông đối mặt với đữ liệu khối lượng lớn; có vận tốc; đa dạng Các tô chức cân có cách đề bảo vệ, sử dụng, gia tăng thời gian theo dữ liệu lớn Y thức này không chỉ có giá trị đôi với kinh doanh và khách
Trang 8hàng, mà tin tặc cũng muốn lợi dụng Thông tin bên vững càng cấp thiết khi tin tặc bán thông tin về thẻ tín dụng, tên tài khoản, mật khâu Vấn đề đặt ra là cách bảo vệ thông tin nhạy cảm trước tần công của tin tặc Thông tin trong môi trường mạng kết nội rộng cũng là môi trường dễ mắt an toàn Đề đáp ứng vấn đề an toàn hiện tai, cần
có khung tham chiếu đề các tô chức có khả năng an toàn, thu thập đỡ liệu và tạo dạng theo cách thông minh, và có khả năng cảnh báo thời gian thực Vấn đề hiện thị dữ liệu
đề giám sát cũng được đặt ra Tổ chức cần hiểu ngữ cảnh, để xác định tài nguyên nhạy
cảm, quan trọng
2 Thu thập dữ liệu
Công việc đầu tiên là gộp tất cả thông tin từ mọi thiết bị vào một nơi Điêu này có
nghĩa thông tin được thu thập từ đám mây, những người dùng thực hay áo Nhờ dịch
vụ phần mềm SaaS' trên đám mây, người ta có thê thu được thông tin từ quản trị nguồn nhân lực đên thông tin khách hàng Vấn đề là thu thập được cả những mẫu sử
dụng và tìm các dẫu hiệu của hành vi ranh ma
Điền hình kẻ ăn trộm dữ liệu thực hiện năm bước tin tặc tìm kiểm đích, dé tim
thấy cách xâm nhập mạng: sau khi vào mạng, họ cài đặt tác nhân; nằm im cho đến khi khám phá ra nơi quan trọng, xác định cách thức lay thong tin; lây thông tm ra khỏi mạng Hầu hết các quá trình tấn công đều như vậy: người ta cần quan sát nhật kí đề phát hiện tình huống mắt thông tin
3 Tích hợp dữ liệu
Một khi được thu thập, đữ liệu được phân tích để rut ra tn thức, từ các thông báo nhật kí Việc tự động hóa và xử lí dựa trên luật là cần thiết, do công việc theo dõi thủ công khó mà phát hiện ra các tấn công từ các nhật kí bình thường
Giải pháp là chuẩn hóa nhật kí, để các câu hỏi có thể kéo thông tin ngữ cảnh từ đữ liệu nhật kí Chăng hạn HP ArcSight chuẩn hóa và tạo phạm trù cho trên 400 trường Khi được chuẩn hóa, các nhật kí để sử dụng hơn, không cần chuyên gia phân tích
4 Phân tích dữ liệu
Các nhật kí chuẩn hóa được đánh chỉ mục và chia theo các phạm trù đề thuận tiện
cho máy lập tương quan, để xử lí và xác định các mẫu dựa trên kinh nghiệm và các
luật an toàn
Cũng có thê kết hợp nhiều nhật kí từ nhiều nguồn, để nhanh có cảnh báo an toàn Việc tiền xử lí cũng làm tăng tốc độ tương quan hóa và giúp người phân tích có báo cáo và lọc đối với các cầu hỏi dữ liệu
5 Ước lượng mối đe dọa
HP ArcSight str dụng thông tin về các vai như các biến theo dạng đe dọa, cho phép thu thập thông tin liên quan đến định danh các vai người dùng, tài nguyên quan trọng, đữ liệu bị hư hại, danh sách cần theo dõi theo thời gian thực, và dùng thông tin này để giảm tỉ lệ cảnh báo nhằm và giám sát các hạ tầng quan trọng
6 Khớp mẫu
Bộ phat hiện đe dọa cho phép khách hàng đào sâu trong dữ liệu lưu trữ dé tim các môi quan hệ giữa các sự kiện, có thê chưa xuất hiện trong tương quan thời gian
Trang 9dùng
Tm tặc có thê thực hiện việc thử mật khẩu nhiều lần, và nguoi ta cần có biện pháp phát hiện các hiện tượng này, và cho phép khách hàng bô sung các luật ngăn chặn
7 Tương quan thống kê
Máy tương quan đa chiều cua HP ArcSight két hợp theo thời gian thực trong bộ nhớ các dữ liệu nhật kí vỀ sự kiện, các hư hại về tài nguyên và xác định tương quan, nhằm phát hiện tức khắc các mối đe dọa
Các sự kiện quan trọng được đánh ưu tiên, dé người quan tri an toan có thể rà soát các
sự kiện cần chủ ý Với tài nguyên trên mạng và các mô hình người dùng, HP ArcSipht
có thê khả năng nhận biết người dùng trên mạng, đữ liệu họ thấy, và các hành động trên dữ liệu đó Bộ quản trị an toàn xí nghiệp ESM sử dụng mô hình phân tích may rủi
dé giữ nên cho các hoạt động từ các sự kiện nhận được từ ESm và giảm sát mọi gia
tăng về tấn công, đích, giao thức, hay hoạt động của người dùng theo ngưỡng xác định Ngưỡng này cũng dùng trong hoạt động phát hiện người dùng bất thường, hành
vi người dùng
8 Giám sát và trả lời
Các hoạt động danh ma cần được cảnh báo và ghi nhận chủ động trong môi
trường Khi nhận đạng được tấn công, người fa bắt đầu phân tích và điều tra môi trường, theo khả năng trên đữ liệu đễ sử dụng Người ta sử dụng bảng hiền thị dữ liệu
và vị trí, đánh giá được mức độ nguy hại và tấn công đối với kinh doanh Năng lực hiển thị có vai trò trợ giúp cho phân tích rủi ro Từ đó người ta đề ra các chính sách tăng cường an toan toan
Bộ phát hiện đe dọa của HP ArcSighe tuân theo phương pháp luận 3 bước sau:
- Kham phá hệ thống trên mạng;
- _ Phân tích các hoạt động có thê và xem hoạt động nào sẽ cho kết luận tốt hơn;
- _ Cung cấp xử lý tinh huong
Khi sử dụng bộ phát hiện môi đe dọa này, người ta có thê giảm thời gian đáp ứng
sự cố, mô phỏng hoạt động trả lời trước khi thực hiện các thay đôi, loại bỏ các đe dọa
tại điểm gay go nhất, tự động làm tư liệu về tất cả những thay đôi, để kiểm tra lại hay
khôi phục hoạt động
Ill XÂY DỰNG CHIẾN LƯỢC AN TOÀN CƠ SỞ DỮ LIỆU
Mười cách đề xây dựng chiến lược an toàn cơ sở dữ liệu lớn
Các xí nghiệp với mọi kích cỡ đều ngập lụt trong việc xếp hạng đữ liệu, từ các cơ
sở dữ liệu bình thường đến dữ liệu phi cấu trúc, chẳng hạn dòng các phương tiện xã hội, phương tiện lần lượt Dữ liệu nhật kí theo vết cả những thao tác công nghệ thông tin và các sự kiện an toàn trên hệ thông và mạng, đều được nhập lại Do vậy sẽ
có nhiều đữ liệu, trở nên đữ liệu lớn, không chỉ vì khối lượng, mà còn về tính đa dạng
và vận tốc thu thập và theo vết dữ liệu Tức là đó không chỉ là kho lưu trữ nhiều đữ
liệu
Trang 10Trong kỉ nguyên day quyền lực của thông tin, vấn đề là cách thức đê tổ chức đám bảo
có những bước cân thiết đề không chỉ tuân thủ điều lệnh, mà còn giữ an toàn trước đe dọa trong hay ngoài tổ chức
Theo tài liệu của những nhà quản lý công nghệ thông tin năm
2016, người ta đã nêu ra L0 kinh nghiệm có the ap dung trong đời sống, theo đữ liệu lớn và cho thấy cách thức mà đữ liệu lớn là vấn dé, đồng thời là giải pháp Ngoài ra, can biết tư liệu hướng dẫn đưa đữ liệu lớn vào tô chức, như một phần của giải pháp an toàn xí nghiệp toàn diện
1 Chính sách
Thiết lập các chính sách tuân thủ đữ liệu lớn là việc khó thiết lập dữ liệu Khối
lượng lớn các đữ liệu sẽ ảnh hưởng đến công nghệ thông tin của tổ chức, và việc
dùng thư mục đữ liệu lớn có thé dan đến thành công hay thất bại cho công việc
Trước khi bắt đầu, cần xác định đữ liệu ra sao, phần kế hoạch giữ lại và cách duy trì
tạm thời các đữ liệu
2 Tình huống xấu và sẵn sảng đôi phó
Khung cảnh đe dọa thường tiến triển, không thể tốt hơn Các khu vưc công hay từ nhân đều có kinh nghiệm đôi với môi trường đây đe dọa, trong lịch sử phát triển của công nghệ thông tin
Xu thế tăng nhanh về đữ liệu lớn trên di động, tăng tính linh hoạt cho sản phẩm,
nhưng cũng chấp nhận thách thức và rủi ro Tin tặc cũng hoạt động theo nghiệp đoàn có tô chức, gây tồn hại cho thông tin mạng
3 Hiện trạng đối với dữ liệu đám mây
Nhiều nguồn tài nguyên đã đặt trên đám mây Thê giới đám mây, với các giải pháp tính toán đám mây, chăng hạn SaaS, PaaS, LaaS, có thê không cần lấy đữ liệu ngoài, từ các máy chủ trung tâm Nếu có cơ hội lưu trữ dữ liệu lớn ngoài trên đám mây, đữ liệu này xuất phát từ nguồn tin cậy
Người ta làm việc với đám mây, và chấp nhận những thứ xảy ra với đám mây, như băng thông Internet chăng hạn
4 Kế hoạch trong tương lai
Không khăng định được khi nào người ta chắc chắn về an toàn đữ liệu Đối với
hầu hết xí nghiệp, kế hoạch hiện tại được thiết kế trong thê giới trước khi có đám
mây, trong các cơ sở đữ liệu trước đây
Số lượng đữ liệu phi cầu trúc không nhiều và người ta chưa có ý niệm về sử dụng dữ liệu ngoài, trên đảm mây Với hầu hết các kế hoạch về an toàn đữ liệu đã thiết kế, cần tính đến làm phù hợp với di động và hạ tầng đám mây, tính đến nhân
tố rủi ro với hạ tầng nay
5 Thao tac an toan
Trong nhiều tổ chức, đội công tác về an toàn và công nghệ thông tin làm việc hoàn
toàn độc lập Đó là thách thức đối với cả tính an toàn và tính hiệu quả của hạ tầng
công nghệ thông tin và ứng dụng
Không có liên kết an toàn với các thao tác công nghệ thông tin, cả hai nhiệm vụ cùng đều mắc chung phải một vấn đề Tổ chức phải mắt thời gian đề giải quyết 6 Phát hiện đe dọa, tấn công và thu thập đữ liệu