Tài liệu hạn chế xem trước, để xem đầy đủ mời bạn chọn Tải xuống
1
/ 71 trang
THÔNG TIN TÀI LIỆU
Thông tin cơ bản
Định dạng
Số trang
71
Dung lượng
1,43 MB
Nội dung
ĐẠI HỌC QUỐC GIA HÀ NỘI TRƯỜNG ĐẠI HỌC CÔNG NGHỆ Nguyễn Văn Định ĐÁNH GIÁ HIỆU NĂNG MỘT SỐ HỆ QUẢN TRỊ CƠ SỞ DỮ LIỆU NOSQL LUẬN VĂN THẠC SĨ KHOA HỌC MÁY TÍNH HÀ NỘI - 2020 ĐẠI HỌC QUỐC GIA HÀ NỘI TRƯỜNG ĐẠI HỌC CÔNG NGHỆ Nguyễn Văn Định ĐÁNH GIÁ HIỆU NĂNG MỘT SỐ HỆ QUẢN TRỊ CƠ SỞ DỮ LIỆU NOSQL Ngành: Công Nghệ Thơng Tin Chun ngành: Khoa Học Máy Tính Mã số: 8480101.01 LUẬN VĂN THẠC SĨ KHOA HỌC MÁY TÍNH NGƯỜI HƯỚNG DẪN KHOA HỌC: PGS.TS Nguyễn Hoài Sơn TS Phạm Mạnh Linh HÀ NỘI - 2020 LỜI CAM ĐOAN Những nội dung trình bày luận văn kiến thức riêng cá nhân tơi tích lũy q trình học tập, nghiên cứu, khơng chép lại cơng trình nghiên cứu hay luận văn tác giả khác Trong nội dung nội dung luận văn, phần nghiên cứu, trích dẫn nêu phần tài liệu tham khảo, có nguồn gốc, xuất xứ, tên tuổi tác giả, nhà xuất rõ ràng Những điều tơi cam kết hồn tồn thật, sai, tơi xin chịu hình thức xử lý kỷ luật theo quy định Hà Nội, Ngày tháng năm 2020 Tác giả luận văn Nguyễn Văn Định i LỜI CẢM ƠN Em xin bày tỏ lòng biết ơn chân thành sâu sắc đến PGS.TS Nguyễn Hoài Sơn TS Phạm Mạnh Linh, khoa Công nghệ thông tin - Trường Đại học Công nghệ - Đại học Quốc gia Hà Nội, thầy dành nhiều thời gian tận tình bảo, hướng dẫn em suốt trình tìm hiểu, triển khai nghiên cứu đề tài Hai thầy người định hướng đưa nhiều góp ý q báu q trình em thực luận văn Em xin chân thành cảm ơn chân thành tới tồn thể thầy giáo, giáo khoa Công nghệ thông tin - Trường Đại học Công nghệ Hà Nội - Đại học Quốc gia Hà Nội dạy bảo tận tình, trang bị cho em kiến thức quý báu, bổ ích tạo điều kiện thuận lợi suốt trình em học tập nghiên cứu trường Do có nhiều hạn chế thời gian kiến thức nên luận văn không tránh khỏi thiếu sót, mong nhận ý kiến đóng góp q báu q thầy bạn quan tâm Luận văn tài trợ Học viện Khoa học Công nghệ Viện Công nghệ thông tin, Viện hàn lâm Khoa học Công nghệ Việt Nam từ đề tài mã số GUST.STS.ĐT2019-TT02 Cuối em xin gửi lời chúc sức khỏe thành đạt tới tất quý thầy cô, quý đồng nghiệp tồn thể gia đình bạn bè Xin chân thành cảm ơn! ii DANH MỤC CÁC THUẬT NGỮ, CHỮ VIẾT TẮT ACID AI API Atomicity, Consistency, Isolation, and durability Artificial Intelligence Application Programming Interface AWS Amazon Web Services BLOB Binary large object BSON Binary JSON CAP Consistency, Availability and Partition Tolerance CPU Platform as a Service CQL Cassandra Query Language CRUD Create, Read, Update, Delete EBS Elastic Block EC2 Elastic Compute Cloud FTP File Transfer Protocol HDFS Hadoop Distributed File System IBM International Business Machines IoMT Internet of Medical Things IoT Internet of Things iii JSON JavaScript Object Notation NIST National Institute of Standards and Technology OLTP On-line Transactional Processing OLTP On-line transactional processing RDBMS Relational Database Management System Rhino DHT Lưu trữ liên tục & phân tán RM Readmodify-write RPC Remote Procedure Calls TPC Transaction Processing Performance Council TPS transaction per second URI Uniform Resource Identifier VM Virtual machine XML eXtensible Markup Language YAML YAML Ain't Markup Language YCSB Yahoo Cloud Serving Benchmark iv DANH SÁCH CÁC BẢNG Bảng 2.1: Phân loại hệ quản trị sở liệu NoSQL Bảng 3.1: Bảng thông số cấu hình máy tính Bảng 3.2: Bảng thơng số phiên NoSQL Bảng 4.1: Các ứng dụng sộ hệ quản trị liệu NoSQL v DANH SÁCH CÁC HÌNH VẼ Hình 1.2 Cảm biến Hình 1.3 Lưới điện thơng minh Hình 1.4 Y tế thơng minh Hình 1.5 Đầu đọc mã vạch thơng minh Hình 2.1 Suy giảm thống trị SQL Hình 2.2 So sánh ACID BASE Hình 2.3 Nguyên lý định lý CAP Hình 2.4 Loại sở liệu Khóa – giá trị Hình 2.5 Loại sở liệu Cột quan hệ Hình 2.6 Loại sở liệu Siêu cột Hình 2.7 Loại sở liệu đồ thị Hình 2.8 Ví dụ nút hệ quản trị sở liệu đồ thị Hình 3.1.1 Kiến trúc YCSB Hình 3.1.2 Kết chạy thử ngiệm Hình 3.2.1 Kết chạy hoạt động đọc chèn MongoDB Hình 3.2.2 Kết hoạt động đọc đọc sửa ghi MongoDB Hình 3.2.3 Kết hoạt động đọc – cập nhật MongoDB Hình 3.2.4 Kết hoạt động quét - chèn MongoDB Hình 3.2.5 Kết chạy hoạt động đọc chèn OrientDB Hình 3.2.6 Kết chạy hoạt động đọc đọc sửa ghi OrientDB Hình 3.2.7 Kết hoạt động đọc cập nhật OrientDB Hình 3.2.8 Kết hoạt động quét chèn OrientDB Hình 3.2.9 Kết hoạt động đọc chèn Redis Hình 3.2.10 Kết hoạt động đọc đọc sửa ghi Redis Hình 3.2.11 Kết hoạt động đọc cập nhật Redis Hình 3.2.12 Kết hoạt động quét chèn Redis Hình 3.2.13 Kết hoạt động đọc chèn Cassandra Hình 3.2.14 Kết hoạt động đọc đọc sửa ghi Cassandra vi Hình 3.2.15 Kết hoạt động đọc cập nhật Cassandra Hình 3.2.16 Kết hoạt động quét chèn Cassandra Hình 3.3.1 Kết thời gian chèn Hình 3.3.2 Thơng lượng hoạt động chèn Hình 3.3.3 Kết thời gian chạy hoạt động đọc Hình 3.3.4 Kết thơng lượng hoạt động đọc Hình 3.3.5 Kết thời gian chạy 10% đọc - 90%-chèn Hình 3.3.6 Kết thơng lượng 10% đọc - 90% chèn Hình 3.3.7 Kết thời gian chạy 50% đọc - 50% chèn Hình 3.3.8 Kết thơng lượng 50% đọc - 50% chèn Hình 3.3.9 Kết thời gian chạy 90% đọc - 10% chèn Hình 3.3.10 Kết thông lượng 90% đọc - 10% chèn Hình 3.3.11 Kết thời gian chạy 10% đọc 90% cập nhật Hình 3.3.12 Kết thơng lượng 10% đọc - 90% cập nhật Hình 3.3.13 Thơi gian chạy 50% đọc - 50% cập nhật Hình 3.3.14 thơng lượng 50% đọc - 50% cập nhật Hình 3.3.15 Thời gian chạy 10% đọc - 90% cập nhật Hình 3.3.16 Thơng lượng 10% đọc - 90% cập nhật Hình 3.3.17 Kết thời gian chạy 10% quét - 90% chèn Hình 3.3.18 Kết thơng lượng 10% qt 90% chèn Hình 3.3.19 Kết thời gian chạy: 50% quét 50% chèn Hình 3.3.20 Kết thơng lượng 50% qt 50% chèn Hình 3.3.20 Kết thơng lượng 50% qt 50% chèn Hình 3.3.21 Kết thời gian chạy: 10% quét 90% chèn Hình 3.3.22 Kết thơng lượng: 10%qt 90%chèn vii MỤC LỤC LỜI CAM ĐOAN i LỜI CẢM ƠN ii DANH MỤC CÁC THUẬT NGỮ, CHỮ VIẾT TẮT iii DANH SÁCH CÁC BẢNG v DANH SÁCH CÁC HÌNH VẼ vi MỤC LỤC viii LỜI MỞ ĐẦU CHƯƠNG 1: DỮ LIỆU LỚN VÀ CÁC CÔNG CỤ ĐÁNH GIÁ HIÊU NĂNG 1.1 Dữ liệu lớn 1.2 Internet of Things (IoT) 1.3 Các công đánh giá hiệu 1.3.1 Các công cụ đánh giá hiệu truyền thống 1.3.2 Các công cụ đánh giá hiệu NoSQL 10 CHƯƠNG 2: MỘT SỐ HỆ QUẢN TRỊ CƠ SỞ DỮ LIỆU NOSQL 14 2.1 Phân loại sở liệu NoSQL 19 2.1.1 Loại sở liệu khóa – giá trị 19 2.1.2 Loại sở liệu cột 20 2.1.3 Loại sở liệu tài liệu 21 2.1.4 Loại sở liệu đồ thị 23 2.2 Một số hệ quản trị sở liệu NoSQL phổ biến 25 2.2.1 Hệ quản trị sở liệu Cassandra 25 2.2.2 Hệ quản trị sở liệu MongoDB 26 2.2.3 Hệ quản trị sở liệu Redis 27 2.2.4 Hệ quản trị sở liệu OrientDB 28 CHƯƠNG ĐÁNH GIÁ HIỆU NĂNG CỦA CSDL NOSQL 30 3.1 Cài đặt môi trường 30 3.1.1 Tổng quan Yahoo! Cloud Serving Benchmark (YCSB) 30 3.1.2 Thông số kỹ thuật 31 3.1.3 Định nghĩa kịch kiểm thử 31 3.2 Hiệu suất hệ thống NoSQL 33 3.2.1 MongoDB 34 3.2.2 OrientDB 36 3.2.3 Redis 38 viii 35000 Thời gian chạy (ms) 30000 25000 20000 Cassandra 15000 MongoDB Redis 10000 OrientDB 5000 A1000 A10000 A100000 Số lượng hoạt động Hình 3.3.5 Kết thời gian chạy 10% đọc - 90%-chèn 9000 Throughput (ops/ms) 8000 7000 6000 5000 Cassandra 4000 MongoDB 3000 Redis 2000 OrientDB 1000 A1000 A10000 A100000 Số lượng hoạt động Hình 3.3.6 Kết thơng lượng 10% đọc - 90% chèn 46 60000 Thời gian chạy (ms) 50000 40000 Cassandra 30000 MongoDB Redis 20000 OrientDB 10000 A1000 A10000 A100000 Số lượng hoạt động Hình 3.3.7 Kết thời gian chạy 50% đọc - 50% chèn 12000 Throughput (ops/ms) 10000 8000 Cassandra MongoDB 6000 Redis 4000 OrientDB 2000 A1000 A10000 A100000 Số lượng hoạt động Hình 3.3.8 Kết thông lượng 50% đọc - 50% chèn 47 60000 Thời gian chạy (ms) 50000 40000 Cassandra 30000 MongoDB Redis 20000 OrientDB 10000 A1000 A10000 A100000 Số lượng hoạt động Hình 3.3.9 Kết thời gian chạy 90% đọc - 10% chèn 14000 Throughput (ops/ms) 12000 10000 8000 Cassandra 6000 MongoDB Redis 4000 OrientDB 2000 A1000 A10000 A100000 Số lượng hoạt động Hình 3.3.10 Kết thơng lượng 90% đọc - 10% chèn 3.3.3 Đọc cập nhật với khối lượng công việc khác Tôi thay đổi tỷ lệ Đọc Cập nhật phần Trục y biểu thị số lượng hoạt động Tôi ghi lại thời gian chạy tốc độ xử lý cho số thao tác = 1000, 10000 100000 ghi Từ Hình 3.3.11 đến 3.3.14, tơi thấy tỷ lệ đọc cập nhật thay đổi, hiệu suất hệ thống NoSQL thay đổi 48 35000 Thời gian chạy (ms) 30000 25000 Cassandra 20000 MongoDB 15000 Redis OrientDB 10000 5000 A1000 A10000 A100000 Hình 3.3.11 Kết thời gian chạy 10% đọc 90% cập nhật 12000 Throughput (ops/ms) 10000 8000 Cassandra MongoDB 6000 Redis 4000 OrientDB 2000 A1000 A10000 A100000 Hình 3.3.12 Kết thông lượng 10% đọc - 90% cập nhật 49 80000 70000 Thời gian chạy (ms) 60000 50000 Cassandra 40000 MongoDB Redis 30000 OrientDB 20000 10000 A1000 A10000 A100000 Hình 3.3.13 Thơi gian chạy 50% đọc - 50% cập nhật 12000 Throughput (ops/ms) 10000 8000 Cassandra MongoDB 6000 Redis 4000 OrientDB 2000 A1000 A10000 A100000 Hình 3.3.14 thơng lượng 50% đọc - 50% cập nhật Đối với khối lượng công việc lớn, Redis thực tốt tỷ lệ cập nhật tăng lên, hiệu suất MongoDB OrientDB cải thiện thấy Hình 3.3.15 3.3.16, hiệu suất OrientDB tốt tỷ lệ cập nhật 90% Vì vậy, khối lượng cơng việc có kết hợp hoạt động Đọc Cập nhật, Redis khuyến khích cho tỷ lệ cập nhật thấp cho tỷ lệ cập nhật cao chọn OrientDB MongoDB Cassandra 50 nhiều thời gian để chạy thơng lượng thấp cho tất tỷ lệ hoạt động đọc cập nhật 35000 Thời gian chạy (ms) 30000 25000 Cassandra 20000 MongoDB 15000 Redis OrientDB 10000 5000 A1000 A10000 A100000 Hình 3.3.15 Thời gian chạy 10% đọc - 90% cập nhật 14000 Throughput (ops/ms) 12000 10000 Cassandra 8000 MongoDB 6000 Redis OrientDB 4000 2000 A1000 A10000 A100000 Hình 3.3.16 Thơng lượng 10% đọc - 90% cập nhật 3.3.4 Quét chèn với khối lượng công việc khác Hiệu suất bốn hệ thống NoSQL thay đổi tỷ lệ Quét Cập nhật tăng số lượng hoạt động báo cáo Hình 3.3.17 đến 3.3.22 Trái ngược hoàn toàn với khối lượng cơng việc có kết hợp hoạt động đọc chèn hoạt động đọc cập nhật, quan sát 51 Redis thực tỷ lệ Quét Chèn Dựa liệu thị, tơi kết luận Redis không khuyến nghị sử dụng trường hợp OrientDB tốt việc xử lý loại khối lượng công việc thể rõ Hình 3.3.17 đến 3.3.22 MongoDB hoạt động tốt so sánh với hệ quản trị sở liệu khác 300000 Thời gian chạy (ms) 250000 200000 Cassandra MongoDB 150000 Redis OrientDB 100000 50000 A1000 A10000 A100000 Hình 3.3.17 Kết thời gian chạy 10% quét - 90% chèn 1200 Throughput (ops/ms) 1000 800 Cassandra MongoDB 600 Redis OrientDB 400 200 A1000 A10000 A100000 Hình 3.3.18 Kết thông lượng 10% quét 90% chèn 52 2500000 Thời gian chạy (ms) 2000000 Cassandra 1500000 MongoDB Redis 1000000 OrientDB 500000 A1000 A10000 A100000 Hình 3.3.19 Kết thời gian chạy: 50% quét 50% chèn 2500 2000 Cassandra 1500 MongoDB Redis 1000 OrientDB 500 A1000 A10000 A100000 Hình 3.3.20 Kết thơng lượng 50% qt 50% chèn 53 450000 400000 Thời gian chạy (ms) 350000 300000 Cassandra 250000 MongoDB 200000 Redis 150000 OrientDB 100000 50000 A1000 A10000 A100000 Hình 3.3.21 Kết thời gian chạy: 10% quét 90% chèn 1400 Throughput (ops/ms) 1200 1000 Cassandra 800 MongoDB 600 Redis OrientDB 400 200 A1000 A10000 A100000 Hình 3.3.22 Kết thơng lượng: 10%qt 90%chèn Như chương chạy kịch để đo lường hiệu suất hệ quản trị sở liệu NoSQL đưa thông tin đánh giá hiệu suất hệ quản trị sở liệu 54 Chương 4: Kết luận Việc so sánh hệ quản trị sở liệu NoSQL khác mạng lại giá trị thực tiễn giúp làm rõ ưu nhược điểm giải pháp cơng nghệ Mục đích nghiên cứu đo lường so sánh hiệu suát bốn hệ quản trị sở liệu: Redis, MongoDB, Cassandra, OrientDB Đây đại diện chọn từ họ sở liệu khác Dựa kết đánh giá hệ thống sở liệu NoSQL phổ biến Với tính lưu trữ tệp, MongoDB sử dụng hệ thống tệp (GridFS) giúp cân tải chép liệu nhiều máy tính để lưu trữ tệp Trong đó, GridFS chia tệp thành phần đoạn lưu trữ thành tài liệu riêng biệt Bạn truy cập GridFS tiện ích Mongofiles plugin cho Nginx Lighttpd Truy vấn ad hoc tính tốt chương trình Nó hỗ trợ trường, truy vấn phạm vi tìm kiếm biểu thức để trả trường tài liệu cụ thể bao gồm hàm JavaScript người dùng xác định truy vấn cấu hình trả mẫu kết ngẫu nhiên có kích thước định Bên cạnh đó, trường MongoDB dùng để lập mục mục phụ Cassandra hệ quản trị sở liệu sử dụng nhật ký để lưu trữ tất thay đổi thực hiện, ghi lưu trữ nhớ cho lần xả đĩa Việc sử dụng chế sau ghi vào đĩa làm giảm số lượng hoạt động đĩa đặc trưng tốc độ thấp so với tốc độ nhớ dễ bay Do đó, hệ quản trị sở liệu đặc biệt tối ưu hóa để thực cập nhật, việc đọc tốn nhiều thời gian so sánh với hệ quản trị sở liệu nhớ OrientDB có hỗ trợ cho lược đồ đầy đủ, lược đồ mơ hình lược đồ hỗn hợp OrientDB sử dụng thuật toán lập mục có tên MVRB-Tree, xuất phát từ Cây Đỏ-Đen từ Cây B +; điều báo cáo có lợi ích việc có chèn nhanh tra cứu nhanh Phân tích kết đo lường cho thấy thời gian xử lý thông lượng MongoDB có nhiều lợi so với hệ quản sở liệu NoSQL khác Tuy nhiên, kết luận áp dụng cho việc so sánh trực tiếp bốn hệ quản trị sở liệu chọn trường hợp mô tả nghiên cứu 55 Các ứng dụng số hệ quản trị sở liệu NoSQL: Stt NoSQL Loại Ứng dụng Redis Key-Value Database - làm cache cho ứng dụng - dùng để lưu thông tin sessions, profiles/preferences user… MongoDB Document - ứng dụng big data, e-commerce, CMS - lưu log history… Cassandra Column-Family - ứng dụng số CMS ứng dụng e-commerce… OrientDB Graph - Ứng dụng hệ thống mạng nơ ron, chuyển tiền bạc, mạng xã hội (tìm bạn bè), giới thiệu sản phẩm (dựa theo sở thích/lịch sử mua sắm người dùng) Bảng 4.1: Các ứng dụng sộ hệ quản trị liệu NoSQL Kết luận văn phát triển phương pháp luận để đo lường hiệu suất hệ quản trị sở liệu kịch đại diện Điều mang lại lợi ích to lớn cho nhà nghiên cứu chủ đề Kỹ thuật nghiên cứu áp dụng cho hệ quản trị sở liệu kết cung cấp giá trị cho trường hợp sử dụng định Điều chắn tiết kiệm thời gian nghiên cứu cho phép so sánh hệ quản trị sở liệu nhanh chóng có ý nghĩa Phương pháp có lợi xem xét đặc điểm hệ quản trị sở liệu ảnh hưởng đến hiệu suất Các vấn đề xem xét đưa vào nghiên cứu luận văn Các nhà nghiên cứu chủ để có lợi từ việc xem xét phương pháp đo lường hiệu suất số hệ sở liệu thực chương Danh sách cơng cụ kỹ thuật định cách tiếp cận tốt để xác định hiệu suất hệ quản trị sở liệu nghiên cứu tương lai 56 Kết tổng thể luận văn đưa câu trả lời việc so sánh bốn hệ quản trị sở liệu phổ biến từ hệ sở liệu phi quan hệ Điều chắn mang lại giá trị cho học viên lĩnh vực CNTT đặc biệt lĩnh vực kỹ thuật phần mềm Kết nghiên cứu giúp đưa định lựa chọn hệ quản trị sở liệu tốt dự án cho chuyên gia thiết kế hệ thống, chủ sở hữu sản phẩm, chủ dự án chuyên gia kỹ thuật phần mềm khác Thiết kế kiến trúc tổng quan sản phẩm thảo luận lựa chọn hệ quản trị sở liệu dự án dựa nhiều vào hiệu suất hoạt động quan trọng kỹ sư phần mềm Việc lựa chọn công nghệ, bao gồm hệ thống quản lý sở liệu, ảnh hưởng đến toàn vịng đời sản phẩm để chọn hệ quản trị sở lệu tốt định đầy thách thức Các kết trình bày luận văn cung cấp liệu hữu ích để đưa định Tuy nhiên, hiệu suất khía cạnh ảnh hưởng đến lựa chọn sở liệu với chi phí mua, chi phí bảo trì, dịch vụ bổ sung, tính ổn định quyền truy cập vào mã nguồn ví dụ tiêu chí khác ảnh hưởng đến việc lựa chọn Việc mở rộng nghiên cứu với phân tích so sánh hiệu suất công cụ sở liệu khác có khả làm tăng giá trị nghiên cứu Cụ thể hơn, tương lai, tiếp tục nghiên cứu vấn đề sau: làm để cân hiệu chi phí lựa chọn NoSQL; so sánh NoSQL khía cạnh khác, chẳng hạn độ trễ hoạt động, hiệu mở rộng theo chiều ngang, v.v Tơi có kế hoạch thực nghiên cứu cách tối ưu hóa sau so sánh chọn NoSQL ứng dụng cụ thể 57 Tài liệu tham khảo [1] Abubakar, Y., T Adeyi, and I.G Auta, Performance evaluation of nosql systems using ycsb in a resource austere environment Performance Evaluation, 2014 7(8) [2] Amazon Web Services http://aws.amazon.com/ [3] Andrew Pavlo, Erik Paulson, Alexander Rasin, Daniel J Abadi, David J DeWitt, Samuel Madden, and Michael Stonebraker A comparison of approaches to large-scale data analysis In Proceedings of the 2009 ACM SIGMOD International Conference on Management of data, pages 165–178 ACM, 2009 [4] Brian F Cooper, Adam Silberstein, Erwin Tam, Raghu Ramakrishnan, and Russell Sears Benchmarking cloud serving systems with ycsb In Proceedings of the 1st ACM symposium on Cloud computing, pages 143–154 ACM, 2010 [5] Carsten Binnig, Donald Kossmann, Tim Kraska, and Simon Loesing How is the weather tomorrow?: towards a benchmark for the cloud In Proceedings of the Second International Workshop on Testing Database Systems, page ACM, 2009 [6] Cooper, B., Silberstein, A., Tam, E., Ramakrishnan, R., and Sears, R.: Benchmarking cloud serving systems with YCSB In Proceedings of the 1st ACM Symposium on Cloud Computing (SoCC '10) ACM, New York, NY, USA, 143-154, 2010 [24] "Couchbase." Internet: http://www.couchbase.com [25] "Cassandra." Internet: http://cassandra.apache.org [7] David J DeWitt The wisconsin benchmark: Past, present, and future., 1993 Dede, E., et al., An Evaluation of Cassandra for Hadoop IEEE CLOUD, 2013 2013: p 494-501 [8] Dhruba Borthakur Facebook has the world’s largest hadoop cluster! http://hadoopblog blogspot.co.uk/2010/05/facebook-has-worlds-largesthadoop.html, May 2010 Last Accessed: 2014.07.19 [9] Eben Hewitt Cassandra: the definitive guide O’Reilly Media Inc., 2010 Erinle, B., Performance Testing with JMeter 2.9 2013: Packt Publishing Ltd 58 [10] Falko Bause Queueing petri nets-a formalism for the combined qualitative and quantitative analysis of systems In Petri Nets and Performance Models, 1993 Proceedings., 5th International Workshop on, pages 14–23 IEEE, 1993 [11] Ghazal, A., et al BigBench: towards an industry standard benchmark for big data analytics in Proceedings of the 2013 ACM SIGMOD international conference on Management of data 2013 ACM [12] Jeffrey Dean and Sanjay Ghemawat Mapreduce: simplified data processing on large clusters Communications of the ACM, 51(1):107–113, 2008 [13] Michael Stonebraker and Rick Cattell 10 rules for scalable performance in’simple operation’datastores Communications of the ACM, 54(6):72–80, 2011 Pirzadeh, P., et al., Performance evaluation of range queries in key value stores Journal of Grid Computing, 2012 10(1): p 109-132 [23] "MongoDB." Internet: http://www.mongodb.org [14] Rackspace http://www.rackspace.co.uk/ [22] "Redis." Internet: http://redis.io [15] Seth Gilbert and Nancy Lynch Brewer’s conjecture and the feasibility of consistent, available, partition-tolerant web services ACM SIGACT News, 33(2):51–59, 2002 [16] Evans, D., The internet of things How the Next Evolution of the Internet is Changing Everything, Whitepaper, Cisco Internet Business Solutions Group (IBSG), 2011 1: p 1-12 [17] Tang, E., & Fan, Y (2016) Performance Comparison between Five NoSQL Databases 2016 7th International Conference on Cloud Computing and Big) [18] Slideshare HBase Vs Cassandra Vs MongoDB - Choosing the right NoSQL database slideshare 2014 [cited 2016 20 Oct]; Available from: http://www.slideshare.net/EdurekaIN/no-sqldatabases-35591065 [19] M Löffler, Chui, M., and R Roberts, The internet of things McKinsey Quarterly, 2010 2(2010): p 1-9 [20] TCP Benchmarks http://www.tpc.org/information/about/history5.asp 59 [26] Wang, L., et al Bigdatabench: A big data benchmark suite from internet services in 2014 IEEE 20th International Symposium on High Performance Computer Architecture (HPCA) 2014 IEEE [27] www.softwaretestinghelp.com/best-iot-examples/ [28] www.technologymag.net/hoa-ky-tai-tro-giai-phap-luoi-dien-thong-minhcho-viet-nam/ [29] Yuri Gurevich Comparative Survey of NoSQL/ NewSQL DB Systems 60 ... Loại sở liệu tài liệu 21 2.1.4 Loại sở liệu đồ thị 23 2.2 Một số hệ quản trị sở liệu NoSQL phổ biến 25 2.2.1 Hệ quản trị sở liệu Cassandra 25 2.2.2 Hệ quản trị sở liệu. .. thức triển khai lưu trữ liệu lớn Luận văn giới thiệu số công cụng đo hiệu hệ quản trị có sở liệu truyền thống hệ quản trị sở liệu NoSQL 13 Chương 2: Một số hệ quản trị sở liệu NoSQL Nội dung chương... Wisconsin đánh giá thành phần hệ quản trị sở liệu quan hệ, cách để so sánh hệ quản trị sở liệu khác Mặc dù không cịn phổ biến trước đây, đánh giá mạnh mẽ người dùng hoạt động mà hệ quản trị sở liệu