Nghiên cứu và phát triển hệ thống điều khiển truy xuất bảo vệ tính riêng tư cho cơ sở dữ liệu nosql mongodb

44 1.3K 2
Nghiên cứu và phát triển hệ thống điều khiển truy xuất bảo vệ tính riêng tư cho cơ sở dữ liệu nosql mongodb

Đang tải... (xem toàn văn)

Tài liệu hạn chế xem trước, để xem đầy đủ mời bạn chọn Tải xuống

Thông tin tài liệu

Ngày nay, dữ liệu có cấu trúc, bán cấu trúc (XML), phi cấu trúc (video, hình ảnh, âm thanh) tăng lên nhanh chóng. IBM ước lượng, có 2.5 nhân 10 mũ 18 bytes (2,500,000,000,000,000,000) dữ liệu được tạo ra mỗi ngày 1. Cơ sỡ dữ liệu quan hệ (RDBMS) khó có thể đáp ứng nhu cầu lưu trữ khi cấu trúc dữ liệu thường xuyên thay đổi 2. Big Data ra đời để đáp ứng nhu cầu đó. Khái niệm Big Data được định nghĩa là sự thu thập, quản lỹ và phân tích dữ liệu 1. Big data được ứng dụng trong nhiều lĩnh vực như phân tích thị trường chứng khoán, phân loại ảnh Picasa, khai phá dữ liệu trên Pandora, Netflix, Amazon, phân tích dựa trên khách hàng hoặc mạng xã hội (Facebook, Twitter),...1. Sự bùng nổ thông tin và dữ liệu cá nhân cần được thu thập, sử dụng đúng mục đích. Việc lạm dụng có thể làm lộ thông tin cá nhân. Ví dụ chương trình nghe lén điện thoại của Cơ quan An ninh Quốc Gia Mỹ đã làm giảm lòng tin nhân dân Mỹ. Vì vậy, vấn đề riêng tư và an toàn thông tin được quan tâm hơn bao giờ hết.

ĐẠI HỌC QUỐC GIA TP.HCM TRƯỜNG ĐẠI HỌC BÁCH KHOA KHOA KHOA HỌC & KỸ THUẬT MÁY TÍNH LUẬN VĂN TỐT NGHIỆP NGHIÊN CỨU VÀ PHÁT TRIỂN HỆ THỐNG ĐIỀU KHIỂN TRUY XUẤT BẢO VỆ TÍNH RIÊNG TƯ CHO CƠ SỞ DỮ LIỆU NOSQL MONGODB GVHD: ThS TRẦN THỊ QUẾ NGUYỆT GVPB: ThS LÊ THỊ KIM TUYẾN ==================== SVTH 1: ĐINH TRẦN VIỆT HOÀNG (51104451) SVTH 2: NGUYỄN ANH KIỆT TP HỒ CHÍ MINH, 5/2016 (50901314) Chương 1: GIỚI THIỆU 1.1 M ô tả vấn đề Ngày nay, liệu có cấu trúc, bán cấu trúc (XML), phi cấu trúc (video, hình ảnh, âm thanh) tăng lên nhanh chóng IBM ước lượng, có 2.5 nhân 10 mũ 18 bytes (2,500,000,000,000,000,000) liệu tạo ngày [1] Cơ sỡ liệu quan hệ (RDBMS) khó đáp ứng nhu cầu lưu trữ cấu trúc liệu thường xuyên thay đổi [2] Big Data đời để đáp ứng nhu cầu Khái niệm Big Data định nghĩa thu thập, quản lỹ phân tích liệu [1] Big data ứng dụng nhiều lĩnh vực phân tích thị trường chứng khoán, phân loại ảnh Picasa, khai phá liệu Pandora, Netflix, Amazon, phân tích dựa khách hàng mạng xã hội (Facebook, Twitter), [1] Sự bùng nổ thông tin liệu cá nhân cần thu thập, sử dụng mục đích Việc lạm dụng làm lộ thông tin cá nhân Ví dụ chương trình nghe điện thoại Cơ quan An ninh Quốc Gia Mỹ làm giảm lòng tin nhân dân Mỹ Vì vậy, vấn đề riêng tư an toàn thông tin quan tâm hết Sau thời gian tìm hiểu, nhóm chọn đề tài “PHÁT TRIỂN FRAMEWORK ĐIỀU KHIỂN TRUY XUẤT CHO HỆ THỐNG CƠ SỞ DỮ LIỆU NOSQL” 1.2 M ục tiêu đề tài • • • • • • Các mục tiêu nhiệm vụ đặt ra: Tìm hiểu mô hình điều khiển truy xuất, phân tích ưu nhược điểm mô hình Tìm hiểu sở liệu lớn, đặc biệt sở liệu NoSQL MongoDB Đề xuất mô hình điều khiển truy xuất MongoDB Xây dựng Mongo Proxy Xây dựng ứng dụng với chức áp dụng hệ thống điều khiển truy cập bảo vệ tính riêng tư dựa mục đích ngữ cảnh Xây dựng framework điều khiển truy cập bảo vệ tính riêng tư dựa mục đích ngữ cảnh 1.3 Ý nghĩ a Xây dựng framework điều khiển truy xuất dựa vai trò ngữ cảnh ứng dụng vào thực tế quản lý giáo dục, thông tin bệnh viện Chương 2: KIẾN THỨC NỀN TẢNG Trong chương này, đề cập đến vấn đề Big Data, hệ sở liệu không quan hệ (NoSQL) ngôn ngữ lập trình NODE.JS 2.1 B ig Data 2.1.1 Định nghĩa Big Data Trong năm gần đây, bước vào kỷ nguyên Big Data, kỷ nguyên bùng nổ thông tin, làm thay đổi cách sống, làm việc, suy nghĩ [3] Thuật ngữ Big Data bao gồm thu thập, quản lý, phân tích liệu có cấu trúc (dữ liệu quan hệ), liệu bán cấu trúc (XML), liệu phi cấu trúc (video, hình ảnh) Dữ liệu lớn có nguồn mới, máy tính (vd: file log nhật ký hay mạng cảm biến), thiết bị di động (video, hình ảnh, tin nhắn), thiết bị máy móc kết nối với (vd xe, máy bay thiết bị giám sát từ xa) nhằm mục đích lên kế hoạch bảo trì kịp thời [1] 2.1.2 Đặc điểm Big Data Big Data có năm đặc điểm [3],[4]: Volume (khối lượng liệu lớn): số lượng data khổng lồ tạo giây, tính đơn vị Terabyte mà tính Zettabyte hay Brontobyte Cứ ngày, facebook có 10 tỷ tin nhắn, 4,5 tỷ lần “like”, 350 triệu hình upload, Sự gia tăng liệu khổng lồ không khả thi việc lưu trữ sử dụng công nghệ lưu trữ truyền thống với sở liệu quan hệ Big Data lưu trữ dễ dàng lượng thông tin dùng cho hệ thống phân tán (distributed system) [4] Velocity (tốc độ cao) : Big Data technology cho phép xử lý liệu chúng tạo ra, liệu chưa đưa vào database Như message mạng xã hội lan truyền vài giây, tốc độ kiểm tra gian lận giao dịch thẻ tín dụng, hay tốc độ tính mili giây để định mua bán cổ phiếu dựa vào phân tích mạng xã hội [4] Variety (đa dạng loại liệu) : Trong khứ, liệu cấu trúc dùng nhiều phù hợp với table sở liệu quan hệ, ví dụ liệu tài Như ngày nay, 80% liệu giới không cấu trúc, không dễ để đưa vào table (ví dụ hình ảnh, video) Với Big Data, sử dụng nhiều loại liệu khác nhau: bán cấu trúc, không cấu trúc liệu truyền thống liệu có cấu trúc [4] Value (giá trị liệu cao): cho phép người hiểu rõ dự đoán trước tương lai [3] Các công ty bắt đầu tạo giá trị to lớn từ việc sử dụng Big Data [4] Việc kinh doanh không quan tâm đặc biệt tới Big Data bị bỏ lại phía sau [4] Veracity (tính xác thực thấp) : uncertainties in the data (không chắn liệu) [3] Với nhiều loại liệu, chất lượng độ xác kiểm soát làm tính xác thực thấp Nhưng liệu lớn công nghệ phân tích cho phép bù đắp cho thiếu xác thực [4] 2.1.3 Những ứng dụng Big Data [1] • • • • • • • Phân tích tâm lý thị trường chứng khoán Phân loại hình ảnh Picasa Google Phân tích khách hàng (Facebook, Twitter) Phân tích liệu hệ thống mạng báo hiệu (đèn giao thông, sở hạ tầng) Hệ thống đặt chỗ du lịch kết hợp sở thích khách hàng Giải trí mạng xã hội Hệ thống chuẩn đoán y học 2.1.4 Tính riêng tư Big Data [1] Việc tích hợp phân tích liệu lớn với thông tin công cộng (hoặc thông tin riêng tư cung cấp cách tự nguyện người giám sát ủy thác thông tin đó) giúp tìm kiếm nhanh liệu lớn phim ảnh, giọng nói, liệu cảm biến, văn thư điện tử để cải thiện độ an toàn chung cho phục hồi sau cố, để ngăn ngừa mối đe dọa khủng bố, để hiểu mối quan tâm cộng đồng Người ta nghĩ tới điều phản hồi so sánh với hệ thống phát cảnh báo khẩn cấp Tất nhiên, mối quan tâm mảng đen tối tiềm tàng hữu liệu lớn phân tích phim ảnh, giọng nói, thư điện tử trở thành truy cập trái phép vào thông tin cá nhân Những hệ thống đòi hỏi phải sử dụng cách có trách nhiệm, hoàn toàn kín đáo, phải kiểm duyệt thông tin thu thập từ nguồn công cộng mạng máy tính 2.2 N oSQ L Các sở liệu quan hệ lưu trữ liệu cách quán chất liệu hay ứng dụng gặp khó khăn vấn đề mở rộng thay đổi cấu trúc Hiện nay, development platforms web scale không network scale, nhiều ứng dụng chạy phân tán nhiều server khác đòi hỏi dynamic scaled Bên cạnh phát triển nhanh chóng computing bùng nổ thông tin yêu cầu việc lưu trữ liệu phải nhanh mở rộng nhanh để đáp ứng ứng dụng xử dụng sở liệu Cơ sở liệu quan hệ làm ảnh hưởng xấu đến hiệu suất, tốc độ hệ thống web scale nên không phù hợp Để giải vấn đề trên, nhiều loại sở liệu không sử dụng mô hình liệu quan hệ (non-relational database) đưa vào sử dụng năm gần đây, gọi NoSQL database NoSQL có ưu điểm dễ mở rộng theo chiều ngang (horizontal scaling), tính sẳn sàng cao (high available), giá thành thấp (low cost), hiệu suất cao (high performance) [5] NoSQL bước phát triển hệ sở liệu : phân tán (distributed) không ràng buộc (non-relational) [7] NoSQL thường dùng để lưu trữ liệu lớn, phù hợp với Big Data Kiến trúc NoSQL database có lợi cho phát triển tự liệu traffic Do đó, tạo thuận lợi cho việc phát triển giải thuật song song (như MapReduce) giúp hệ thống phân tán hoạt động hiệu NoSQL dẫn đầu phương pháp lưu trữ phân tích thông tin liệu người dùng Hệ thống liệu quan hệ sử dụng metadata để kiểm soát chặt chẽ việc xử lý đồng để trì quán liệu Nhưng việc phân tán liệu nhiều hệ thống NoSQL làm lỏng lẻo việc xử lý đồng Do đó, tính quán toàn vẹn không đảm bảo Một điểm yếu khác NoSQL hỗ trợ security cho lớp database [5] 2.2.1 Các loại NoSQL Bảng 1: Các loại NoSQL Database tương ứng [5] Bảng 2: Bảng so sánh loại database NoSQL [5] Trong đó: Key-Value: loại NoSQL đơn giản nhất, gọi Row Store [5] Column-Oriented: lưu trữ theo kiểu cột, tối ưu hóa cho truy vấn liệu lớn [5] Document-Oriented: khóa kết hợp với liệu phức tạp bán cấu trúc, phi câu trúc; không cần schema chặt chẽ Nên việc dùng Document-Oriented làm tăng hiệu suất dễ sử dụng cho hệ thống lưu trữ phân tán dùng sở liệu quan hệ truyền thống [5] Graph database: dùng để lưu trữ thông tin mạng mạng xã hội, đồ, 2.2.2 Lợi ích dùng NoSQL [6] NoSQL cung cấp khả mở rộng hiệu suất cao sở liệu quan hệ truyền thống: Đáp ứng thay đổi nhanh chóng liệu lớn, có cấu trúc,bán cấu trúc phi cấu trúc • Schema liệu thêm vào không ảnh hướng đến liệu cũ • Hỗ trợ lập trình hướng đối tượng, dễ sử dụng linh hoạt • Kiến trúc hiệu quả, tăng khả mở rộng, xây dựng sở phân tán, linh động thay nguyên khối, cứng nhắc kiến trúc cũ • 2.2.3 Các đặc điểm NoSQL [6] Dynamic Schema : (Schema động) Cơ sở liệu quan hệ (RDBMS yêu cầu phải khai báo Schema trước thêm liệu vào Việc không phù hợp với phát triển nhanh chóng Có liệu có tính chất khác, schema database phải thay đổi lại Nếu database lớn, việc thay đổi diễn chậm đáng kể Vì sử dụng RDBMS cho liệu có schema động không thích hợp Các NoSQL database xây dựng phép thêm liệu mà không cần khai báo schema trước, làm giảm thời gian chờ, không cần quan tâm đến service interruption Do việc phát triển ứng dụng nhanh hơn, lập trình quản lý liệu đơn giản Auto - sharding : chế tự động MongoDB dùng để chia tách liệu kích thước lớn cho nhiều server (cluster) [7] Do đó, MongoDB hỗ trợ việc định hình theo chiều ngang Dữ liệu câu truy vấn phân bố server Khi server bị hư hại có server khác thực công việc thay [6] Auto – Sharding phục vụ mục tiêu [7]: Làm cho cluster suốt với người dùng Làm cho cluster sẵn sàng để đọc ghi Làm cho cluster phát triển tự nhiên Replication : Hầu hết NoSQL hỗ trợ nhân rộng liệu để trì tính sẵn sàng trường hợp có cố hay bảo trì hệ thống, NoSQL hỗ trợ khả chuyển đổi dự phòng phục hồi hệ thống Integrated Caching : Các NoSQL hỗ trợ khả caching tốt cho tác vụ đọc ghi Thích hợp cho ứng dụng đòi hỏi băng thông cao độ trễ thấp, điều mà RDBMS khó đáp ứng Với đặc điểm lợi ích NoSQL, nhóm định chọn MongoDB để thực đề tài 2.3 M ongo DB 2.3.1 Giới thiệu mô hình liệu MongoDB MongoDB schema-free document database viết C++ dự án mở 10gen Inc Mục đích MongoDB để rút ngắn khoảng cách mô hình key-value RDBMS [5] MongoDB NoSQL theo kiểu document store, lưu trữ dạng BSON (một dạng tương tự JSON), có khả đánh mục index Dữ liệu MongoDB có schema linh hoạt [8], không cần phải khai báo schema thêm liệu a Document Structure Thiết kế mô hình liệu cho ứng dụng MongoDB tập trung vào cấu trúc document làm ứng dụng biểu diễn quan hệ liệu Hai cách để biểu diễn quan hệ: tham khảo (references) nhúm document (embedded documents) Kiểu biểu diễn tham khảo Tham khảo lưu mối quan hệ liệu đường link từ document tới document khác Ứng dụng lưu tham khảo truy xuất liệu liên quan Đó chuẩn hóa mô hình liệu Hình :Mô hình liệu sử dụng tham khảo để liên kết document Cả contact document access document chứa tham khảo đến user document Dữ liệu nhúng (embedded data) Dữ liệu nhúng lưu liệu liên quan document MongoDB document cho phép nhúng document vào trường mảng document cha Sự không chuẩn hóa cho phép ứng dụng truy xuất xử lí liệu có liên quan thao tác sở liệu Table minh họa vài liệu ảo intended purpose lưu trữ concept data base relation Trong đó, phần tử liệu lưu với ba mục đích khác nhau, mục đích tương ứng với intended purpose cụ thể Như thảo luận trước đó, thiết kế intended purpose tác giả Kabir hỗ trợ sách bảo vệ riêng tư cho phép, cấm có điều kiện, cho phép sách nén lại (squash) linh động (flexible) mô hình tác giả Hơn nữa, việc sử dụng CIP PIP, đảm bảo liệu cho mục đích cụ thể cho phép với số điều kiện không cho phép Quyết định truy cập (access decision) thực dựa mối quan hệ access purpose intended purpose liệu Access chấp nhận access purpose bao gồm việc thực intended purpose, trường hợp access purpose gọi phù hợp (compliant) với intended purpose Access chấp nhận có điều kiện việc thực intended purpose bao gồm access purpose với điều kiện Một ví dụ minh hoạ: Ví dụ: Một truy vấn sau: SELECT name, income FROM Table FOR Marketing Purpose Sẽ kết trả về: Trong Table 5, name income Ron thị Ron cho phép tiết lộ name income cho mục đích Marketing Trong Bob Jak cho phép mục đích Marketing sử dụng name, sử dụng có điều kiện income, nên income tổng quát hóa Điều cho thấy rõ tiện ích sử dụng mô hình Nó minh chứng trích xuất nhiều thông tin từ nhà cung cấp liệu Trong mô hình đề xuất tác giả, liệu thu thập dùng cho nhiều mục đích khác dựa tảng yêu cầu nhà cung cấp liệu Bằng việc dùng CIP, tính riêng tư hiệu sử dụng liệu đạt b Access control Có nhiều kỹ thuật để xác định purpose, báo này, tác giả trình bày phương pháp người dùng yêu cầu phải xác access purpose thực truy vấn liệu Đó user phải cung cấp access purpose cho truy vấn Compliance check kiểm tra xem access purpose có tuân theo intended purpose hay không Xem xét purpose tree Figure 2, mã hóa thành bảng quan hệ (relation pt-table) Table Cột p_id đại diện cho identification purpose node, p_name name purpose node, parent biểu thị quan hệ phân cấp purpose node Cột code số nhị phân mã hóa cho purose node Ví dụ purpose B mã hóa biểu diễn dạng hexa ‘0x100’ Ba cột cuối aip, pip, cip mã hóa tính trước purpose implications Theo định nghĩa, purpose node chọn AIP, tất cháu cho phép, đó, aip_code tính tổng code node Ví dụ D, có cháu G, H, I, J nên aip_code D bằng: 0x040+0x008+0x004+0x002+0x001 = 0x04F Mặt khác, cip_code aip_code có cách tính giống nên chúng Lại có purpose node chọn PIP tất purpose cháu, tổ tiên cho phép Ví dụ pip_code node P tổng code node A, D, G, H, I, J 0x24F Một access purpose xem compliant với intended purpose không bị cấm PIP, cho phép AIP CIP Vì vậy, purpose compliance kiểm tra hai phép bitwise AND Một access compliant thỏa mãn: ∧ ∨ Trong đó: & phép bitwise AND, phép AND logic, phép OR logic Xung đột AIP, CIP PIP cho data element giải sách sau: PIP ghi đè lên AIP CIP, CIP ghi đè lên AIP Hàng thứ biểu thị ap thuộc AIP không thuộc CIP, hàng biểu thị ap thuộc AIP không thuộc PIP; hàng biểu thị ap thuộc CIP không thuộc PIP c Query Modification Một kỳ vọng tự nhiên kỹ thuật điều khiển truy vấn bảo vệ riêng tư phải đảm bảo kết truy vấn chứa data element cho phép, cho phép có điều kiện bị cấm mục đích xác định Kỳ vọng thực báo việc dùng sửa đổi truy vấn query modification Stonebraker & Wong (1974) Một ý quan trọng query modification cho phép điều khiển cách mạnh mẽ (powerful) linh động (flexible) mà không yêu cầu thay đổi chế hỗ trợ hệ quản trị sở liệu thương mại (major commercial Data Base Management System) Độ phức tạp query modification báo O(n), với n số thuộc tính truy cập query (the number of attributes accessed by a given query) Phương thức Modification_Query gọi access purpose truy vấn xác minh chấp nhận Nếu access purpose không chấp nhận truy vấn query bị từ chối mà không cần thực tiếp Thuật toán query modification kiểm tra thuộc tính tham chiếu danh sách dự đoán (projection list) thuộc tính tham chiếu xác định (predicates) Bởi thuộc tính projection list xác định data element nằm kết trả (the result relation) truy vấn, đủ để thực thi sách riêng tư dựa thuộc tính projection list Tuy nhiên, kết truy vấn phụ thuộc vào predicate, sách bắt buộc không thực thi predicate ảnh hưởng đến kết Ví dụ, có truy vấn sau: SELECT name, income, address FROM Table FOR Marketing purpose Giả sử có liệu khách hàng đó, với mục đích Marketing, name cho phép, address bị cấm, income cho phép có điều kiện Thì giải thuật query modification loại bỏ adress khỏi kết truy vấn, income trả có điều kiện (ví dụ khái quát hóa) Vì vậy, theo mô hình tác giả đề xuất, thông tin income khách hàng sử dụng, đảm bảo tính riêng tư mà không bị loại bỏ hoàn toàn Ví dụ thể cách mà thuật toán chỉnh sửa truy vấn Ví dụ sửa lại từ ví dụ Byun (2008) Giả sử purpose Marketing có code ‘0x200’ Với truy vấn: SELECT name, income FROM Table FOR Marketing purpose Truy vấn chỉnh sửa trở thành: SELECT name, income, address FROM Table WHERE Comp_Check(‘0x200’, name_aip, name_cip, name_pip) AND Comp_Check(‘0x200’, income_aip, income_cip, income_pip) d Nhận xét Nghiên cứu Byun (2008) Purpose Based Access Control cung cấp framework toàn diện cho purpose quản lý liệu, ông cho purpose phải đóng vai trò mô hình điều khiển truy cập Do đó, Byun đề xuất hướng tiếp cận dựa intended purpose, dự định sử dụng liệu, access purpose, mục đích truy cập vào liệu Ông cho mô hình điều khiển truy cập truyền thống tập trung vào “user thực hành động liệu nào” sách riêng tư tập trung vào data object sử dụng cho purpose Byun đề xuất mô hình purpose based access control model (PBAC) cho phép nhiều purpose gán vào data element hỗ trợ cấm Mặc dù, mô hình thiết kế dựa yêu cầu người dùng khách hàng không vi phạm riêng tư, hạn chế mô hình mát liệu Trong mô hình PBAC, khách hàng có hai lựa chọn cho phép cấm mục đích xác định, thay cho phép nhiều lựa chọn Dựa nghiên cứu Byun, Kabir cho rằng, việc có thêm nhiều lựa chọn dễ dàng đạt mục đích trích xuất thêm nhiều thông tin từ khách hàng để doanh nghiệp sử dụng Do đó, mô hình Conditional Purpose Based Access Control cung cấp nhiều ba lựa chọn, giúp doanh nghiệp trích xuất thêm thông tin từ người dùng, đồng thời đảm bảo tính riêng tư cho họ 3.3.5 CÁC HƯỚNG TIẾP CẬN MỚI CỦA FERRARI MONITOR PREFILTERING QUERY REWRITING Chương 4: MÔ HÌNH ĐỀ XUẤT 4.1 T HU ẬT TO ÁN CO MP LIA NCE CH EC K 4.2 C Ơ CH Ế CỦA FER RA RI 4.2.1 PREFILTERING 4.2.2 REWRITING 4.3 P RO XY CÓ CH ỨC NĂ NG MO NIT OR Chương 5: KIẾN TRÚC HỆ THỐNG 5.1 T HU ẬT TO ÁN CO MP LIA NCE CH EC K 5.2 D ATA BAS E DÙ NG DE MO 5.3 C ÁC KH ỐI VÀ CH ỨC NĂ NG 5.3.1 FONT-END 5.3.2 WEB-SERVER 5.3.3 PROXY 5.3.4 MONGODB-SERVER 5.4 H IỆN TH ỰC HỆ TH ỐN G Chương 6: ĐÁNH GIÁ HIỆU NĂNG 6.1 S Ử DỤ NG PRO XY 6.2 K HÔ NG SỬ DỤ NG PRO XY 6.3 Đ ÁN H GIÁ Chương 7: KẾT LUẬN 7.1 C ÔN G VIỆ C ĐÃ LÀ M ĐƯ ỢC 7.2 C ÔN G VIỆ C TƯ ƠN G LAI Chương 8: TÀI LIỆU THAM KHẢO [1] Big data công nghệ đám mây http://www.ibm.com/developerworks/vn/library/data/2013Q3/bdbigdatacloud/#resources [2] So sánh phương pháp tiếp cận sở liệu XML https://www.ibm.com/developerworks/vn/library/x-comparexmldb/ [3] Pietro Colombo, Elena Ferrari: Privacy Aware Access Control for Big Data: A Research Roadmap [4] Bernard MarrBernard Marr : Big Data: The Vs Everyone Must Know https://www.linkedin.com/pulse/20140306073407-64875646-big-data-the-5-vseveryone-must-know [5] Motahera Shermin: An Access Control Model for NoSQL Databases [6] NoSQL Databases Explained https://www.mongodb.com/nosql-explained [7] Tổng quan MongoDB http://bigsonata.com/mongodb/ [8] Data Model Design for MongoDB, Release 3.0.8 [9] Capped Collections https://docs.mongodb.org/manual/core/capped-collections/ [10] Node.js https://en.wikipedia.org/wiki/Node.js [11] Node.js w/1M concurrent connections! http://blog.caustik.com/2012/08/19/node-js-w1m-concurrent-connections/ [12] Proposed NIST Standard for Role-Based Access Control, DAVID F FERRAIOLO, RAVI SANDHU, SERBAN GAVRILA, D RICHARD KUHN and RAMASWAMY CHANDRAMOULI [13] The NIST Model Role-Based Access Control Towards A Unified Standard, Ravi Sandhu, David Ferraiolo and Richard Kuhn [14] Purpose based access control for privacy protection in relational database systems, Ji-Won Byun, Ninghui Li [15] A Unified Attribute-Based Access Control Model Covering DAC, MAC and RBAC, Xin Jin, Ram Krishnan, and Ravi Sandhu [16] The UCONABC Usage Control Model, Jeahong Park, Ravi Sandhu [17] Enhancing MongoDB with Purpose-based Access Control, Pietro Colombo Elena Ferrari [18] The NIST Model for Role-Based Access Control: Towards A Unified Standard, Ravi Sandhu, David Ferraiolot, Richard Kuhn [19] Guide to Attribute Based Access Control (ABAC) Definition and Considerations, Vincent C Hu, David Ferraiolo, Rick Kuhn [...]... clientside cần nhiều truy vấn hơn cho tham khảo Nói cách khác, mô hình chuẩn hóa làm tăng số kết nối với server 2.4.2 Operational Factors và mô hình dữ liệu Mô hình hóa dữ liệu cho MongoDB phụ thuộc vào đặc tính của dữ liệu và đặc tính của MongoDB Những mô hình dữ liệu khác nhau có thể cho phép ứng dụng sử dụng các lệnh truy vấn hiệu quả hơn, hoặc tăng băng thông cho thao tác insert và truy vấn, hoặc hỗ... và độ phân cấp Thuộc tính hệ thống: xác định môi trường của hệ thống, sử dụng cho nhu cầu ứng dụng 3.3.4 MÔ HÌNH ĐIỀU KHIỂN TRUY CẬP CỦA KABIR Với mô hình đề xuất PBAC của Ji-Won Byun và Ninghui Li đã giải quyết cơ bản vấn đề điều khiển truy cập bảo vệ riêng tư cho người dùng Tuy nhiên, cơ chế này vẫn có khuyết điểm là có khả năng mất thông tin để khai thác, do người cung cấp dữ liệu đa phần không muốn... xét Nghiên cứu của Byun (2008) về Purpose Based Access Control cung cấp một framework toàn diện cho purpose và quản lý dữ liệu, ông cho rằng purpose phải đóng vai trò chính trong mô hình điều khiển truy cập Do đó, Byun đề xuất hướng tiếp cận dựa trên intended purpose, chỉ các dự định sử dụng dữ liệu, và access purpose, chỉ mục đích truy cập vào dữ liệu Ông cũng cho rằng các mô hình điều khiển truy. .. cấp dữ liệu Với việc sử dụng khái niệm condition, người cung cấp dữ liệu sẽ cảm thấy thoải mái hơn để phát hành dữ liệu của họ Theo cách tiếp cận này, doanh nghiệp có thể thiết lập chính sách bảo vệ riêng tư hấp dẫn và nó có thể trích xuất dữ liệu hơn từ người dùng Table 4 minh họa một vài dữ liệu ảo và intended purpose được lưu trữ trong một concept data base relation Trong đó, mỗi phần tử dữ liệu. .. Byun và Ninghui Li đã đề xuất mô hình PRBAC Mô hình này điều khiển truy cập dựa trên mục đích sử dụng của người dùng để bảo đảm quyền riêng tư a Purpose W3C's platform for privacy preference (P3P) định nghĩa "purpose là những lý do cho việc thu thập và sử dụng dữ liệu" Mô hình này tập trung vào dữ liệu nào được sử dụng cho mục đích nào Do đó, việc truy cập dữ liệu phải tuân theo các chính sách riêng tư. .. thuộc tính và các thành phần mới đã tạo sự đa dạng cho UCON Bảng 5: 16 mô hình UCON cơ bản 3.3.3 MÔ HÌNH ĐIỀU KHIỂN DỰA TRÊN MỤC ĐÍCH – PURPOSEBASED ACCESS CONTROL MODEL (PRBAC)[14] Khái niệm mục đích (purpose) là nền tảng cơ bản của các đề xuất và các công trình nghiên cứu về các mô hình điều khiển truy cập tiên tiến, bảo vệ riêng tư người dùng Để giải quyết thiếu sót của các mô hình RBAC truy n thống, ... PayPal, Voxer và GoDaddy [11] Chương 3: CÁC MÔ HÌNH ĐIỀU KHIỂN TRUY CẬP 3.1 M Ô HÌN H TRU YỀN TH ỐN G Discretionary Access Controls (DAC) – truy cập tùy quyền là cơ chế điều khiển truy cập đươc ra đời vào những năm 1960, được nghiên cứu và ứng dụng rộng rãi Đặc điểm chính của DAC là chủ của dữ liệu có toàn quyền trên dữ liệu đó, có quyền định nghĩa các loại tri cập đọc/ghi/thực thi và gán hoặc thu... sử dụng cho (các) mục đích xác định nào Intended purpose được gán cho data để điều tiết việc truy cập Theo cách tiếp cận của tác giả, intended purpose gồm ba phần: Allowable Intended Purpose (AIP): các purpose cụ thể mà người cung cấp dữ liệu cho phép được truy cập vào dữ liệu • Conditional Intended Purpose (CIP) : nhà cung cấp dữ liệu cho phép các mục đích cụ thể được phép truy cập vào dữ liệu nhưng... mục đích tư ng ứng với một intended purpose cụ thể Như đã thảo luận trước đó, thiết kế intended purpose của tác giả Kabir hỗ trợ chính sách bảo vệ riêng tư có thể cho phép, cấm và có điều kiện, do đó cho phép chính sách nén lại (squash) và linh động (flexible) trong mô hình của tác giả Hơn nữa, bằng việc sử dụng CIP và PIP, có thể đảm bảo dữ liệu cho các mục đích cụ thể được cho phép với một số điều kiện... nhúng các dữ liệu liên quan vào một document là một dạng atomic Nếu dùng mô hình chuẩn hóa để lưu trữ các reference giữa các dữ liệu liên quan, ứng dụng phải dùng thao tác đọc và ghi riêng biệt khi thay đổi các dữ liệu liên quan c Sharding MongoDB dùng sharding để phát triển theo chiều ngang Những cluster hỗ trợ triển khai với những tập dữ liệu lớn và các thao tác yêu cầu băng thông cao Sharding cho phép

Ngày đăng: 27/06/2016, 17:00

Từ khóa liên quan

Mục lục

  • Chương 1: GIỚI THIỆU

    • 1.1 Mô tả vấn đề

    • 1.2 Mục tiêu đề tài

    • 1.3 Ý nghĩa

    • Chương 2: KIẾN THỨC NỀN TẢNG

      • 2.1 Big Data

        • 2.1.1 Định nghĩa Big Data

        • 2.1.2 Đặc điểm Big Data

        • 2.1.3 Những ứng dụng Big Data [1]

        • 2.1.4 Tính riêng tư trong Big Data [1]

        • 2.2 NoSQL

          • 2.2.1 Các loại NoSQL

          • 2.2.2 Lợi ích khi dùng NoSQL [6]

          • 2.2.3 Các đặc điểm của NoSQL [6]

          • 2.3 MongoDB

            • 2.3.1 Giới thiệu mô hình dữ liệu MongoDB

              • a. Document Structure

              • b. Tính nguyên tố (không thể chia, giãn lược) của tác vụ ghi (Atomicity of Write Operations)

              • c. Sự phát triển của document

              • d. Sử dụng dữ liệu và performance

              • 2.4 Các khái niệm mô hình hóa dữ liệu trong MongoDB

                • 2.4.1 Thiết kế mô hình dữ liệu (Data Model Design)

                  • a. Mô hình nhúng (Embedded Data Models)

                  • b. Mô hình chuẩn hóa dữ liệu (Normalized Data Models)

                  • 2.4.2 Operational Factors và mô hình dữ liệu

                    • a. Document Growth

                    • b. Atomicity

                    • c. Sharding

                    • d. Indexes

Tài liệu cùng người dùng

Tài liệu liên quan