1. Trang chủ
  2. » Luận Văn - Báo Cáo

Luận văn ThS Đánh giá hiệu năng một số hệ quản trị cơ sở dữ liệu NOSQL

67 19 0

Đang tải... (xem toàn văn)

Tài liệu hạn chế xem trước, để xem đầy đủ mời bạn chọn Tải xuống

THÔNG TIN TÀI LIỆU

Nội dung

DANH MỤC CÁC THUẬT NGỮ, CHỮ VIẾT TẮT ACID AI Atomicity, Consistency, Isolation, and durability Artificial Intelligence API Application Programming Interface AWS Amazon Web Services BLOB Binary large object BSON Binary JSON CAP Consistency, Availability and Partition Tolerance CPU Platform as a Service CQL Cassandra Query Language CRUD Create, Read, Update, Delete EBS Elastic Block EC2 Elastic Compute Cloud FTP File Transfer Protocol HDFS Hadoop Distributed File System IBM International Business Machines IoMT Internet of Medical Things IoT Internet of Things iii JSON JavaScript Object Notation NIST National Institute of Standards and Technology OLTP On-line Transactional Processing OLTP On-line transactional processing RDBMS Relational Database Management System Rhino DHT Lưu trữ liên tục & phân tán RM Readmodify-write RPC Remote Procedure Calls TPC Transaction Processing Performance Council TPS transaction per second URI Uniform Resource Identifier VM Virtual machine XML eXtensible Markup Language YAML YAML Ain't Markup Language YCSB Yahoo Cloud Serving Benchmark iv DANH SÁCH CÁC BẢNG Bảng 2.1: Phân loại hệ quản trị sở liệu NoSQL Bảng 3.1: Bảng thơng số cấu hình máy tính Bảng 3.2: Bảng thông số phiên NoSQL Bảng 4.1: Các ứng dụng sộ hệ quản trị liệu NoSQL v DANH SÁCH CÁC HÌNH VẼ Hình 1.2 Cảm biến Hình 1.3 Lưới điện thơng minh Hình 1.4 Y tế thơng minh Hình 1.5 Đầu đọc mã vạch thơng minh Hình 2.1 Suy giảm thống trị SQL Hình 2.2 So sánh ACID BASE Hình 2.3 Nguyên lý định lý CAP Hình 2.4 Loại sở liệu Khóa – giá trị Hình 2.5 Loại sở liệu Cột quan hệ Hình 2.6 Loại sở liệu Siêu cột Hình 2.7 Loại sở liệu đồ thị Hình 2.8 Ví dụ nút hệ quản trị sở liệu đồ thị Hình 3.1.1 Kiến trúc YCSB Hình 3.1.2 Kết chạy thử ngiệm Hình 3.2.1 Kết chạy hoạt động đọc chèn MongoDB Hình 3.2.2 Kết hoạt động đọc đọc sửa ghi MongoDB Hình 3.2.3 Kết hoạt động đọc – cập nhật MongoDB Hình 3.2.4 Kết hoạt động quét - chèn MongoDB Hình 3.2.5 Kết chạy hoạt động đọc chèn OrientDB Hình 3.2.6 Kết chạy hoạt động đọc đọc sửa ghi OrientDB Hình 3.2.7 Kết hoạt động đọc cập nhật OrientDB Hình 3.2.8 Kết hoạt động quét chèn OrientDB Hình 3.2.9 Kết hoạt động đọc chèn Redis Hình 3.2.10 Kết hoạt động đọc đọc sửa ghi Redis Hình 3.2.11 Kết hoạt động đọc cập nhật Redis Hình 3.2.12 Kết hoạt động quét chèn Redis Hình 3.2.13 Kết hoạt động đọc chèn Cassandra Hình 3.2.14 Kết hoạt động đọc đọc sửa ghi Cassandra vi Hình 3.2.15 Kết hoạt động đọc cập nhật Cassandra Hình 3.2.16 Kết hoạt động quét chèn Cassandra Hình 3.3.1 Kết thời gian chèn Hình 3.3.2 Thơng lượng hoạt động chèn Hình 3.3.3 Kết thời gian chạy hoạt động đọc Hình 3.3.4 Kết thơng lượng hoạt động đọc Hình 3.3.5 Kết thời gian chạy 10% đọc - 90%-chèn Hình 3.3.6 Kết thơng lượng 10% đọc - 90% chèn Hình 3.3.7 Kết thời gian chạy 50% đọc - 50% chèn Hình 3.3.8 Kết thơng lượng 50% đọc - 50% chèn Hình 3.3.9 Kết thời gian chạy 90% đọc - 10% chèn Hình 3.3.10 Kết thơng lượng 90% đọc - 10% chèn Hình 3.3.11 Kết thời gian chạy 10% đọc 90% cập nhật Hình 3.3.12 Kết thơng lượng 10% đọc - 90% cập nhật Hình 3.3.13 Thơi gian chạy 50% đọc - 50% cập nhật Hình 3.3.14 thơng lượng 50% đọc - 50% cập nhật Hình 3.3.15 Thời gian chạy 10% đọc - 90% cập nhật Hình 3.3.16 Thơng lượng 10% đọc - 90% cập nhật Hình 3.3.17 Kết thời gian chạy 10% quét - 90% chèn Hình 3.3.18 Kết thơng lượng 10% quét 90% chèn Hình 3.3.19 Kết thời gian chạy: 50% qt 50% chèn Hình 3.3.20 Kết thơng lượng 50% qt 50% chèn Hình 3.3.20 Kết thơng lượng 50% quét 50% chèn Hình 3.3.21 Kết thời gian chạy: 10% qt 90% chèn Hình 3.3.22 Kết thơng lượng: 10%quét 90%chèn vii MỤC LỤC LỜI CAM ĐOAN i LỜI CẢM ƠN ii DANH MỤC CÁC THUẬT NGỮ, CHỮ VIẾT TẮT iii DANH SÁCH CÁC BẢNG v DANH SÁCH CÁC HÌNH VẼ vi MỤC LỤC viii LỜI MỞ ĐẦU CHƯƠNG 1: DỮ LIỆU LỚN VÀ CÁC CÔNG CỤ ĐÁNH GIÁ HIÊU NĂNG .4 1.1 Dữ liệu lớn 1.2 Internet of Things (IoT) .5 1.3 Các công đánh giá hiệu .9 1.3.1 Các công cụ đánh giá hiệu truyền thống .9 1.3.2 Các công cụ đánh giá hiệu NoSQL 10 CHƯƠNG 2: MỘT SỐ HỆ QUẢN TRỊ CƠ SỞ DỮ LIỆU NOSQL 14 2.1 Phân loại sở liệu NoSQL .19 2.1.1 Loại sở liệu khóa – giá trị 19 2.1.2 Loại sở liệu cột 20 2.1.3 Loại sở liệu tài liệu 21 2.1.4 Loại sở liệu đồ thị 23 2.2 Một số hệ quản trị sở liệu NoSQL phổ biến 25 2.2.1 Hệ quản trị sở liệu Cassandra 25 2.2.2 Hệ quản trị sở liệu MongoDB 26 2.2.3 Hệ quản trị sở liệu Redis 27 2.2.4 Hệ quản trị sở liệu OrientDB 28 CHƯƠNG ĐÁNH GIÁ HIỆU NĂNG CỦA CSDL NOSQL .30 3.1 Cài đặt môi trường 30 3.1.1 Tổng quan Yahoo! Cloud Serving Benchmark (YCSB) 30 3.1.2 Thông số kỹ thuật 31 3.1.3 Định nghĩa kịch kiểm thử 31 3.2 Hiệu suất hệ thống NoSQL 33 3.2.1 MongoDB 34 3.2.2 OrientDB 36 3.2.3 Redis 38 viii 3.2.4 Cassandra 40 3.3 Đánh giá hiệu suất 42 3.3.1 Đọc chèn với khối lượng 100% 43 3.3.2 Đọc chèn với khối lượng công việc khác .45 3.3.3 Đọc cập nhật với khối lượng công việc khác .48 3.3.4 Quét chèn với khối lượng công việc khác 51 CHƯƠNG 4: KẾT LUẬN 55 TÀI LIỆU THAM KHẢO 58 ix LỜI MỞ ĐẦU Hệ quản trị sở liệu quan hệ truyền thống năm 1970 thiết kế để phù hợp với yêu cầu ứng dụng xử lý giao dịch trực tuyến (OLTP) giải pháp “một kích thước phù hợp với tất cả”[13] Các hệ thống thường lưu trữ máy chủ nhất, nơi quản trị sở liệu đáp ứng với tăng trưởng liệu cách tăng tốc độc xử lý CPU, dung lượng nhớ tốc độ đĩa cứng máy chủ đó, tức cách mở rộng theo chiều dọc Hệ quản trị sở liệu quan hệ cịn phù hợp mơi trường máy tính đại ngày nay, nhiên, hạn chế khả mở rộng theo chiều dọc mối quan tâm lớn Khối lượng liệu sử dụng nhiều tổ chức năm gần lớn dung lượng máy chủ nhất, bùng nổ web Do đó, cơng nghệ kỹ thuật phát triển để giải vấn đề liệu Năm 2010, người ta tuyên bố Facebook lưu trữ kho liệu lớn giới lưu trữ HDFS (hệ thống phân tán Hadoop), bao gồm 2000 máy chủ, tiêu thụ 21 Petabyte (PB) dung lượng lưu trữ [15], nhanh chóng tăng lên 100 PB vào đầu năm 2012 [3] Tình hình cịn phức tạp thực tế ứng dụng OLTP truyền thống tập hợp trường hợp sử dụng mà công nghệ phải tạo điều kiện thuận lợi loạt yêu cầu ứng dụng đại ngành công nghiệp [10] Do đó, cơng nghệ liệu lớn yêu cầu mở rộng quy mô theo cách khác để khắc phục hạn chế tốc độ xử lý, dung lượng nhớ tốc độ ghi đĩa Khả mở rộng theo chiều ngang trở thành trọng tâm cho hệ thống lưu trữ liệu; cung cấp khả truyền liệu từ nhiều máy chủ Độ co giãn thuộc tính khả mở rộng theo chiều ngang, cho phép tăng thơng lượng tuyến tính nhiều máy thêm vào cụm Mơi trường điện tốn đại chứng kiến gia tăng số lượng nhà cung cấp dịch vụ điện toán đám mây Nhiều số vốn có tính đàn hồi, ví dụ AWS Amazon [2] Rackspace [14], cung cấp khả mở rộng theo chiều ngang cách dễ dàng với chi phí thấp cho người dùng Nhiều kho liệu thiết kế với suy nghĩ thay đổi cảnh quan này, số số chí cịn thiết kế để hoạt động độc lập điện tốn đám mây, ví dụ PNUTS Yahoo, BigTable Google Amazon DynamoDB Các hệ thống lưu trữ liệu thường gọi kho liệu NoSQL, viết tắt “Not Only SQL”; chúng khơng sử dụng ngơn ngữ truy vấn có cấu trúc (SQL) có mơ hình quan hệ Hewitt [9] đề xuất thuật ngữ có nghĩa hệ thống truyền thống khơng nên lựa chọn để lưu trữ liệu Hiện nay, có nhiều giải pháp lưu trữ liệu NoSQL số công ty sử dụng giải pháp để giải với thách thức khả mở rộng liệu chọn giải pháp tốt cho trường hợp sử dụng cụ thể Dữ liệu mà cơng ty thu thập có giá trị cao việc truy vấn liệu cần có tính sẵn sàng cao [15] Nhu cầu tính khả dụng cao liệu trở nên đặc biệt rõ ràng ứng dụng Web mà thân chúng quen với việc tương tác hàng ngày, ví dụ tảng truyền thơng xã hội Facebook Twitter Một tính khả mở rộng theo chiều ngang thêm máy chủ tạo thành cụm Số lượng máy chủ lớn làm tăng tần suất nút gặp cố Cơ chế mà liệu NoSQL lưu trữ mức độ sẵn sàng cao để khắc phục tỷ lệ lỗi cao đáp ứng kỳ vọng thông qua việc mở rộng Việc chép không mang lại khả dự phòng cao trường hợp hỏng hóc mà cịn giúp tránh liệu (bằng cách khôi phục liệu bị từ sao) cải thiện hiệu suất (bằng cách dàn trải tải nhiều sao) [4] Như đề cập nhiều tính lợi việc sử dụng số hệ quản trị sở liệu NoSQL điều khơng có nghĩa phù hợp với loại ứng dụng NoSQL có số nhược điểm, việc lựa chọn số hệ quản trị sở liệu phù hợp tùy thuộc vào loại ứng dụng chất liệu Một số dự án phù hợp với việc sử dụng hệ quản trị sở liệu SQL, dự án khác hoạt động tốt với NoSQL Một số sử dụng thay hai Nếu ứng dụng lưu trữ liệu giao dịch SQL lựa chọn tốt Hệ quản trị sở liệu quan hệ tạo để xử lý giao dịch chúng hoạt động tốt với điều Nếu liệu phân tích nghĩ NoSQL, SQL khơng dành cho phân tích liệu với lượng lớn liệu trở thành vấn đề Trong luận văn này, đánh giá hiệu suất bốn hệ quản trị sở liệu NoSQL khác MongoDB, Cassandra, Redis OrientDB cách chạy loạt kịch tùy chỉnh để mơ hình hóa khối lượng truy vấn CURD giới thực khác Tôi so sánh hiệu suất hệ quản trị sở liệu NoSQL liên quan đến hiệu suất truy vấn, dựa kịch đọc, chèn, quét cập nhật cách chạy kịch công cụ Yahoo! Cloud Serving Benchmark (YCSB) đưa nhận xét bốn hệ quản trị sở liệu 35000 Thời gian chạy (ms) 30000 25000 20000 Cassandra 15000 MongoDB Redis 10000 OrientDB 5000 A1000 A10000 A100000 Số lượng hoạt động Hình 3.3.5 Kết thời gian chạy 10% đọc - 90%-chèn 9000 Throughput (ops/ms) 8000 7000 6000 5000 Cassandra 4000 MongoDB 3000 Redis 2000 OrientDB 1000 A1000 A10000 A100000 Số lượng hoạt động Hình 3.3.6 Kết thơng lượng 10% đọc - 90% chèn 46 60000 Thời gian chạy (ms) 50000 40000 Cassandra 30000 MongoDB Redis 20000 OrientDB 10000 A1000 A10000 A100000 Số lượng hoạt động Hình 3.3.7 Kết thời gian chạy 50% đọc - 50% chèn 12000 Throughput (ops/ms) 10000 8000 Cassandra MongoDB 6000 Redis 4000 OrientDB 2000 A1000 A10000 A100000 Số lượng hoạt động Hình 3.3.8 Kết thông lượng 50% đọc - 50% chèn 47 60000 Thời gian chạy (ms) 50000 40000 Cassandra 30000 MongoDB Redis 20000 OrientDB 10000 A1000 A10000 A100000 Số lượng hoạt động Hình 3.3.9 Kết thời gian chạy 90% đọc - 10% chèn 14000 Throughput (ops/ms) 12000 10000 8000 Cassandra 6000 MongoDB Redis 4000 OrientDB 2000 A1000 A10000 A100000 Số lượng hoạt động Hình 3.3.10 Kết thông lượng 90% đọc - 10% chèn 3.3.3 Đọc cập nhật với khối lượng công việc khác Tôi thay đổi tỷ lệ Đọc Cập nhật phần Trục y biểu thị số lượng hoạt động Tôi ghi lại thời gian chạy tốc độ xử lý cho số thao tác = 1000, 10000 100000 ghi Từ Hình 3.3.11 đến 3.3.14, tơi thấy tỷ lệ đọc cập nhật thay đổi, hiệu suất hệ thống NoSQL thay đổi 48 35000 Thời gian chạy (ms) 30000 25000 Cassandra 20000 MongoDB 15000 Redis OrientDB 10000 5000 A1000 A10000 A100000 Hình 3.3.11 Kết thời gian chạy 10% đọc 90% cập nhật 12000 Throughput (ops/ms) 10000 8000 Cassandra MongoDB 6000 Redis 4000 OrientDB 2000 A1000 A10000 A100000 Hình 3.3.12 Kết thông lượng 10% đọc - 90% cập nhật 49 80000 70000 Thời gian chạy (ms) 60000 50000 Cassandra 40000 MongoDB Redis 30000 OrientDB 20000 10000 A1000 A10000 A100000 Hình 3.3.13 Thơi gian chạy 50% đọc - 50% cập nhật 12000 Throughput (ops/ms) 10000 8000 Cassandra MongoDB 6000 Redis 4000 OrientDB 2000 A1000 A10000 A100000 Hình 3.3.14 thơng lượng 50% đọc - 50% cập nhật Đối với khối lượng công việc lớn, Redis thực tốt tỷ lệ cập nhật tăng lên, hiệu suất MongoDB OrientDB cải thiện thấy Hình 3.3.15 3.3.16, hiệu suất OrientDB tốt tỷ lệ cập nhật 90% Vì vậy, khối lượng cơng việc có kết hợp hoạt động Đọc Cập nhật, Redis khuyến khích cho tỷ lệ cập nhật thấp cho tỷ lệ cập nhật cao chọn OrientDB MongoDB Cassandra 50 nhiều thời gian để chạy thơng lượng thấp cho tất tỷ lệ hoạt động đọc cập nhật 35000 Thời gian chạy (ms) 30000 25000 Cassandra 20000 MongoDB 15000 Redis OrientDB 10000 5000 A1000 A10000 A100000 Hình 3.3.15 Thời gian chạy 10% đọc - 90% cập nhật 14000 Throughput (ops/ms) 12000 10000 Cassandra 8000 MongoDB 6000 Redis OrientDB 4000 2000 A1000 A10000 A100000 Hình 3.3.16 Thơng lượng 10% đọc - 90% cập nhật 3.3.4 Quét chèn với khối lượng công việc khác Hiệu suất bốn hệ thống NoSQL thay đổi tỷ lệ Quét Cập nhật tăng số lượng hoạt động báo cáo Hình 3.3.17 đến 3.3.22 Trái ngược hồn tồn với khối lượng cơng việc có kết hợp hoạt động đọc chèn hoạt động đọc cập nhật, quan sát 51 Redis thực tỷ lệ Quét Chèn Dựa liệu thị, tơi kết luận Redis không khuyến nghị sử dụng trường hợp OrientDB tốt việc xử lý loại khối lượng công việc thể rõ Hình 3.3.17 đến 3.3.22 MongoDB hoạt động tốt so sánh với hệ quản trị sở liệu khác 300000 Thời gian chạy (ms) 250000 200000 Cassandra MongoDB 150000 Redis OrientDB 100000 50000 A1000 A10000 A100000 Hình 3.3.17 Kết thời gian chạy 10% quét - 90% chèn 1200 Throughput (ops/ms) 1000 800 Cassandra MongoDB 600 Redis OrientDB 400 200 A1000 A10000 A100000 Hình 3.3.18 Kết thông lượng 10% quét 90% chèn 52 2500000 Thời gian chạy (ms) 2000000 Cassandra 1500000 MongoDB Redis 1000000 OrientDB 500000 A1000 A10000 A100000 Hình 3.3.19 Kết thời gian chạy: 50% quét 50% chèn 2500 2000 Cassandra 1500 MongoDB Redis 1000 OrientDB 500 A1000 A10000 A100000 Hình 3.3.20 Kết thơng lượng 50% qt 50% chèn 53 450000 400000 Thời gian chạy (ms) 350000 300000 Cassandra 250000 MongoDB 200000 Redis 150000 OrientDB 100000 50000 A1000 A10000 A100000 Hình 3.3.21 Kết thời gian chạy: 10% quét 90% chèn 1400 Throughput (ops/ms) 1200 1000 Cassandra 800 MongoDB 600 Redis OrientDB 400 200 A1000 A10000 A100000 Hình 3.3.22 Kết thơng lượng: 10%qt 90%chèn Như chương chạy kịch để đo lường hiệu suất hệ quản trị sở liệu NoSQL đưa thông tin đánh giá hiệu suất hệ quản trị sở liệu 54 Chương 4: Kết luận Việc so sánh hệ quản trị sở liệu NoSQL khác mạng lại giá trị thực tiễn giúp làm rõ ưu nhược điểm giải pháp cơng nghệ Mục đích nghiên cứu đo lường so sánh hiệu suát bốn hệ quản trị sở liệu: Redis, MongoDB, Cassandra, OrientDB Đây đại diện chọn từ họ sở liệu khác Dựa kết đánh giá hệ thống sở liệu NoSQL phổ biến Với tính lưu trữ tệp, MongoDB sử dụng hệ thống tệp (GridFS) giúp cân tải chép liệu nhiều máy tính để lưu trữ tệp Trong đó, GridFS chia tệp thành phần đoạn lưu trữ thành tài liệu riêng biệt Bạn truy cập GridFS tiện ích Mongofiles plugin cho Nginx Lighttpd Truy vấn ad hoc tính tốt chương trình Nó hỗ trợ trường, truy vấn phạm vi tìm kiếm biểu thức để trả trường tài liệu cụ thể bao gồm hàm JavaScript người dùng xác định truy vấn cấu hình trả mẫu kết ngẫu nhiên có kích thước định Bên cạnh đó, trường MongoDB dùng để lập mục mục phụ Cassandra hệ quản trị sở liệu sử dụng nhật ký để lưu trữ tất thay đổi thực hiện, ghi lưu trữ nhớ cho lần xả đĩa Việc sử dụng chế sau ghi vào đĩa làm giảm số lượng hoạt động đĩa đặc trưng tốc độ thấp so với tốc độ nhớ dễ bay Do đó, hệ quản trị sở liệu đặc biệt tối ưu hóa để thực cập nhật, việc đọc tốn nhiều thời gian so sánh với hệ quản trị sở liệu nhớ OrientDB có hỗ trợ cho lược đồ đầy đủ, lược đồ mơ hình lược đồ hỗn hợp OrientDB sử dụng thuật tốn lập mục có tên MVRB-Tree, xuất phát từ Cây Đỏ-Đen từ Cây B +; điều báo cáo có lợi ích việc có chèn nhanh tra cứu nhanh Phân tích kết đo lường cho thấy thời gian xử lý thông lượng MongoDB có nhiều lợi so với hệ quản sở liệu NoSQL khác Tuy nhiên, kết luận áp dụng cho việc so sánh trực tiếp bốn hệ quản trị sở liệu chọn trường hợp mô tả nghiên cứu 55 Các ứng dụng số hệ quản trị sở liệu NoSQL: Stt NoSQL Loại Ứng dụng Redis Key-Value Database - làm cache cho ứng dụng Document - ứng dụng big data, e-commerce, CMS MongoDB - dùng để lưu thông tin sessions, profiles/preferences user… - lưu log history… Cassandra Column-Family - ứng dụng số CMS ứng dụng e-commerce… OrientDB Graph - Ứng dụng hệ thống mạng nơ ron, chuyển tiền bạc, mạng xã hội (tìm bạn bè), giới thiệu sản phẩm (dựa theo sở thích/lịch sử mua sắm người dùng) Bảng 4.1: Các ứng dụng sộ hệ quản trị liệu NoSQL Kết luận văn phát triển phương pháp luận để đo lường hiệu suất hệ quản trị sở liệu kịch đại diện Điều mang lại lợi ích to lớn cho nhà nghiên cứu chủ đề Kỹ thuật nghiên cứu áp dụng cho hệ quản trị sở liệu kết cung cấp giá trị cho trường hợp sử dụng định Điều chắn tiết kiệm thời gian nghiên cứu cho phép so sánh hệ quản trị sở liệu nhanh chóng có ý nghĩa Phương pháp có lợi xem xét đặc điểm hệ quản trị sở liệu ảnh hưởng đến hiệu suất Các vấn đề xem xét đưa vào nghiên cứu luận văn Các nhà nghiên cứu chủ để có lợi từ việc xem xét phương pháp đo lường hiệu suất số hệ sở liệu thực chương Danh sách cơng cụ kỹ thuật định cách tiếp cận tốt để xác định hiệu suất hệ quản trị sở liệu nghiên cứu tương lai 56 Kết tổng thể luận văn đưa câu trả lời việc so sánh bốn hệ quản trị sở liệu phổ biến từ hệ sở liệu phi quan hệ Điều chắn mang lại giá trị cho học viên lĩnh vực CNTT đặc biệt lĩnh vực kỹ thuật phần mềm Kết nghiên cứu giúp đưa định lựa chọn hệ quản trị sở liệu tốt dự án cho chuyên gia thiết kế hệ thống, chủ sở hữu sản phẩm, chủ dự án chuyên gia kỹ thuật phần mềm khác Thiết kế kiến trúc tổng quan sản phẩm thảo luận lựa chọn hệ quản trị sở liệu dự án dựa nhiều vào hiệu suất hoạt động quan trọng kỹ sư phần mềm Việc lựa chọn công nghệ, bao gồm hệ thống quản lý sở liệu, ảnh hưởng đến tồn vịng đời sản phẩm để chọn hệ quản trị sở lệu tốt định đầy thách thức Các kết trình bày luận văn cung cấp liệu hữu ích để đưa định Tuy nhiên, hiệu suất khía cạnh ảnh hưởng đến lựa chọn sở liệu với chi phí mua, chi phí bảo trì, dịch vụ bổ sung, tính ổn định quyền truy cập vào mã nguồn ví dụ tiêu chí khác ảnh hưởng đến việc lựa chọn Việc mở rộng nghiên cứu với phân tích so sánh hiệu suất công cụ sở liệu khác có khả làm tăng giá trị nghiên cứu Cụ thể hơn, tương lai, tiếp tục nghiên cứu vấn đề sau: làm để cân hiệu chi phí lựa chọn NoSQL; so sánh NoSQL khía cạnh khác, chẳng hạn độ trễ hoạt động, hiệu mở rộng theo chiều ngang, v.v Tơi có kế hoạch thực nghiên cứu cách tối ưu hóa sau so sánh chọn NoSQL ứng dụng cụ thể 57 Tài liệu tham khảo [1] Abubakar, Y., T Adeyi, and I.G Auta, Performance evaluation of nosql systems using ycsb in a resource austere environment Performance Evaluation, 2014 7(8) [2] Amazon Web Services http://aws.amazon.com/ [3] Andrew Pavlo, Erik Paulson, Alexander Rasin, Daniel J Abadi, David J DeWitt, Samuel Madden, and Michael Stonebraker A comparison of approaches to large-scale data analysis In Proceedings of the 2009 ACM SIGMOD International Conference on Management of data, pages 165–178 ACM, 2009 [4] Brian F Cooper, Adam Silberstein, Erwin Tam, Raghu Ramakrishnan, and Russell Sears Benchmarking cloud serving systems with ycsb In Proceedings of the 1st ACM symposium on Cloud computing, pages 143–154 ACM, 2010 [5] Carsten Binnig, Donald Kossmann, Tim Kraska, and Simon Loesing How is the weather tomorrow?: towards a benchmark for the cloud In Proceedings of the Second International Workshop on Testing Database Systems, page ACM, 2009 [6] Cooper, B., Silberstein, A., Tam, E., Ramakrishnan, R., and Sears, R.: Benchmarking cloud serving systems with YCSB In Proceedings of the 1st ACM Symposium on Cloud Computing (SoCC '10) ACM, New York, NY, USA, 143-154, 2010 [24] "Couchbase." Internet: http://www.couchbase.com [25] "Cassandra." Internet: http://cassandra.apache.org [7] David J DeWitt The wisconsin benchmark: Past, present, and future., 1993 Dede, E., et al., An Evaluation of Cassandra for Hadoop IEEE CLOUD, 2013 2013: p 494-501 [8] Dhruba Borthakur Facebook has the world’s largest hadoop cluster! http://hadoopblog blogspot.co.uk/2010/05/facebook-has-worlds-largesthadoop.html, May 2010 Last Accessed: 2014.07.19 [9] Eben Hewitt Cassandra: the definitive guide O’Reilly Media Inc., 2010 Erinle, B., Performance Testing with JMeter 2.9 2013: Packt Publishing Ltd 58 [10] Falko Bause Queueing petri nets-a formalism for the combined qualitative and quantitative analysis of systems In Petri Nets and Performance Models, 1993 Proceedings., 5th International Workshop on, pages 14–23 IEEE, 1993 [11] Ghazal, A., et al BigBench: towards an industry standard benchmark for big data analytics in Proceedings of the 2013 ACM SIGMOD international conference on Management of data 2013 ACM [12] Jeffrey Dean and Sanjay Ghemawat Mapreduce: simplified data processing on large clusters Communications of the ACM, 51(1):107–113, 2008 [13] Michael Stonebraker and Rick Cattell 10 rules for scalable performance in’simple operation’datastores Communications of the ACM, 54(6):72–80, 2011 Pirzadeh, P., et al., Performance evaluation of range queries in key value stores Journal of Grid Computing, 2012 10(1): p 109-132 [23] "MongoDB." Internet: http://www.mongodb.org [14] Rackspace http://www.rackspace.co.uk/ [22] "Redis." Internet: http://redis.io [15] Seth Gilbert and Nancy Lynch Brewer’s conjecture and the feasibility of consistent, available, partition-tolerant web services ACM SIGACT News, 33(2):51–59, 2002 [16] Evans, D., The internet of things How the Next Evolution of the Internet is Changing Everything, Whitepaper, Cisco Internet Business Solutions Group (IBSG), 2011 1: p 1-12 [17] Tang, E., & Fan, Y (2016) Performance Comparison between Five NoSQL Databases 2016 7th International Conference on Cloud Computing and Big) [18] Slideshare HBase Vs Cassandra Vs MongoDB - Choosing the right NoSQL database slideshare 2014 [cited 2016 20 Oct]; Available from: http://www.slideshare.net/EdurekaIN/no-sqldatabases-35591065 [19] M Löffler, Chui, M., and R Roberts, The internet of things McKinsey Quarterly, 2010 2(2010): p 1-9 [20] TCP Benchmarks http://www.tpc.org/information/about/history5.asp 59 [26] Wang, L., et al Bigdatabench: A big data benchmark suite from internet services in 2014 IEEE 20th International Symposium on High Performance Computer Architecture (HPCA) 2014 IEEE [27] www.softwaretestinghelp.com/best-iot-examples/ [28] www.technologymag.net/hoa-ky-tai-tro-giai-phap-luoi-dien-thong-minhcho-viet-nam/ [29] Yuri Gurevich Comparative Survey of NoSQL/ NewSQL DB Systems 60 ... triển khai lưu trữ liệu lớn Luận văn giới thiệu số công cụng đo hiệu hệ quản trị có sở liệu truyền thống hệ quản trị sở liệu NoSQL 13 Chương 2: Một số hệ quản trị sở liệu NoSQL Nội dung chương... Loại sở liệu tài liệu 21 2.1.4 Loại sở liệu đồ thị 23 2.2 Một số hệ quản trị sở liệu NoSQL phổ biến 25 2.2.1 Hệ quản trị sở liệu Cassandra 25 2.2.2 Hệ quản trị sở liệu. .. công cụ đánh giá hiệu NoSQL 10 CHƯƠNG 2: MỘT SỐ HỆ QUẢN TRỊ CƠ SỞ DỮ LIỆU NOSQL 14 2.1 Phân loại sở liệu NoSQL .19 2.1.1 Loại sở liệu khóa – giá trị 19 2.1.2 Loại sở liệu

Ngày đăng: 09/08/2021, 11:48

HÌNH ẢNH LIÊN QUAN

Hình 1.3 Lưới điện thông minh [27] - Luận văn ThS Đánh giá hiệu năng một số hệ quản trị cơ sở dữ liệu NOSQL
Hình 1.3 Lưới điện thông minh [27] (Trang 14)
Hình 1.4 Y tế thông minh [27] - Luận văn ThS Đánh giá hiệu năng một số hệ quản trị cơ sở dữ liệu NOSQL
Hình 1.4 Y tế thông minh [27] (Trang 15)
Hình 1.5 Đầu đọc mã vạch thông minh [27] - Luận văn ThS Đánh giá hiệu năng một số hệ quản trị cơ sở dữ liệu NOSQL
Hình 1.5 Đầu đọc mã vạch thông minh [27] (Trang 16)
Hình 2.5: Loại cơ sở dữ liệu cột - Luận văn ThS Đánh giá hiệu năng một số hệ quản trị cơ sở dữ liệu NOSQL
Hình 2.5 Loại cơ sở dữ liệu cột (Trang 27)
Hình 2.6: Loại cơ sở dữ liệu siêu cột - Luận văn ThS Đánh giá hiệu năng một số hệ quản trị cơ sở dữ liệu NOSQL
Hình 2.6 Loại cơ sở dữ liệu siêu cột (Trang 28)
Hình 3.1.1 Kiến trúc YCSB [17] - Luận văn ThS Đánh giá hiệu năng một số hệ quản trị cơ sở dữ liệu NOSQL
Hình 3.1.1 Kiến trúc YCSB [17] (Trang 37)
Hình 3.2 Kết quả chạy thử ngiệm - Luận văn ThS Đánh giá hiệu năng một số hệ quản trị cơ sở dữ liệu NOSQL
Hình 3.2 Kết quả chạy thử ngiệm (Trang 40)
Hình 3.2.1 và 3.2.3. Hình 3.2.2 cho thấy xu hướng thông lượng của hiệu suất - Luận văn ThS Đánh giá hiệu năng một số hệ quản trị cơ sở dữ liệu NOSQL
Hình 3.2.1 và 3.2.3. Hình 3.2.2 cho thấy xu hướng thông lượng của hiệu suất (Trang 41)
Hình 3.2.2 Kết quả của hoạt động đọc đọc và sửa ghi của MongoDB - Luận văn ThS Đánh giá hiệu năng một số hệ quản trị cơ sở dữ liệu NOSQL
Hình 3.2.2 Kết quả của hoạt động đọc đọc và sửa ghi của MongoDB (Trang 42)
Hình 3.2.3 Kết quả hoạt động đọc – cập nhật MongoDB - Luận văn ThS Đánh giá hiệu năng một số hệ quản trị cơ sở dữ liệu NOSQL
Hình 3.2.3 Kết quả hoạt động đọc – cập nhật MongoDB (Trang 42)
Hình 3.2.4 Kết quả hoạt động quét-chèn MongoDB - Luận văn ThS Đánh giá hiệu năng một số hệ quản trị cơ sở dữ liệu NOSQL
Hình 3.2.4 Kết quả hoạt động quét-chèn MongoDB (Trang 43)
Hình 3.2.5 Kết quả chạy hoạt động đọc và chèn của OrientDB - Luận văn ThS Đánh giá hiệu năng một số hệ quản trị cơ sở dữ liệu NOSQL
Hình 3.2.5 Kết quả chạy hoạt động đọc và chèn của OrientDB (Trang 44)
Hình 3.2.6 Kết quả chạy của hoạt động đọc đọc và sửa ghi của OrientDB - Luận văn ThS Đánh giá hiệu năng một số hệ quản trị cơ sở dữ liệu NOSQL
Hình 3.2.6 Kết quả chạy của hoạt động đọc đọc và sửa ghi của OrientDB (Trang 44)
Hình 3.2.7 Kết quả hoạt động đọc và cập nhật OrientDB - Luận văn ThS Đánh giá hiệu năng một số hệ quản trị cơ sở dữ liệu NOSQL
Hình 3.2.7 Kết quả hoạt động đọc và cập nhật OrientDB (Trang 45)
trong Hình 3.2.11. Ngoài ra, chúng ta có thể thấy rằng hiệu suất giảm khi tỷ lệ - Luận văn ThS Đánh giá hiệu năng một số hệ quản trị cơ sở dữ liệu NOSQL
trong Hình 3.2.11. Ngoài ra, chúng ta có thể thấy rằng hiệu suất giảm khi tỷ lệ (Trang 46)
quét được tăng lên và tỷ lệ chèn giảm như chúng ta có thể thấy trong Hình 3.2.12.  - Luận văn ThS Đánh giá hiệu năng một số hệ quản trị cơ sở dữ liệu NOSQL
qu ét được tăng lên và tỷ lệ chèn giảm như chúng ta có thể thấy trong Hình 3.2.12. (Trang 46)
Hình 3.2.15 Kết quả hoạt động đọc và cập nhật của Cassandra - Luận văn ThS Đánh giá hiệu năng một số hệ quản trị cơ sở dữ liệu NOSQL
Hình 3.2.15 Kết quả hoạt động đọc và cập nhật của Cassandra (Trang 49)
Hình 3.3.1 và 3.3.2 cho thấy hiệu năng của bốn hệ thống NoSQL cho các - Luận văn ThS Đánh giá hiệu năng một số hệ quản trị cơ sở dữ liệu NOSQL
Hình 3.3.1 và 3.3.2 cho thấy hiệu năng của bốn hệ thống NoSQL cho các (Trang 50)
Hình 3.3.2 Thông lượng hoạt động chèn - Luận văn ThS Đánh giá hiệu năng một số hệ quản trị cơ sở dữ liệu NOSQL
Hình 3.3.2 Thông lượng hoạt động chèn (Trang 51)
Hình 3.3.4 Kết quả thông lượng của hoạt động đọc - Luận văn ThS Đánh giá hiệu năng một số hệ quản trị cơ sở dữ liệu NOSQL
Hình 3.3.4 Kết quả thông lượng của hoạt động đọc (Trang 52)
Hình 3.3.5 Kết quả thời gian chạy 10% đọc- 90%-chèn - Luận văn ThS Đánh giá hiệu năng một số hệ quản trị cơ sở dữ liệu NOSQL
Hình 3.3.5 Kết quả thời gian chạy 10% đọc- 90%-chèn (Trang 53)
Hình 3.3.6 Kết quả thông lượng 10% đọc- 90%chèn - Luận văn ThS Đánh giá hiệu năng một số hệ quản trị cơ sở dữ liệu NOSQL
Hình 3.3.6 Kết quả thông lượng 10% đọc- 90%chèn (Trang 53)
Hình 3.3.7 Kết quả thời gian chạy 50% đọc- 50% chèn - Luận văn ThS Đánh giá hiệu năng một số hệ quản trị cơ sở dữ liệu NOSQL
Hình 3.3.7 Kết quả thời gian chạy 50% đọc- 50% chèn (Trang 54)
Hình 3.3.9 Kết quả thời gian chạy 90% đọc- 10% chèn - Luận văn ThS Đánh giá hiệu năng một số hệ quản trị cơ sở dữ liệu NOSQL
Hình 3.3.9 Kết quả thời gian chạy 90% đọc- 10% chèn (Trang 55)
Hình 3.3.11 Kết quả thời gian chạy 10% đọc và 90% cập nhật - Luận văn ThS Đánh giá hiệu năng một số hệ quản trị cơ sở dữ liệu NOSQL
Hình 3.3.11 Kết quả thời gian chạy 10% đọc và 90% cập nhật (Trang 56)
Hình 3.3.13 Thơi gian chạy 50% đọc- 50% cập nhật - Luận văn ThS Đánh giá hiệu năng một số hệ quản trị cơ sở dữ liệu NOSQL
Hình 3.3.13 Thơi gian chạy 50% đọc- 50% cập nhật (Trang 57)
Hình 3.3.15 Thời gian chạy 10% đọc- 90% cập nhật - Luận văn ThS Đánh giá hiệu năng một số hệ quản trị cơ sở dữ liệu NOSQL
Hình 3.3.15 Thời gian chạy 10% đọc- 90% cập nhật (Trang 58)
rõ trong Hình 3.3.17 đến 3.3.22. MongoDB hoạt động tốt khi so sánh với những - Luận văn ThS Đánh giá hiệu năng một số hệ quản trị cơ sở dữ liệu NOSQL
r õ trong Hình 3.3.17 đến 3.3.22. MongoDB hoạt động tốt khi so sánh với những (Trang 59)
Hình 3.3.20 Kết quả thông lượng 50% quét 50% chèn - Luận văn ThS Đánh giá hiệu năng một số hệ quản trị cơ sở dữ liệu NOSQL
Hình 3.3.20 Kết quả thông lượng 50% quét 50% chèn (Trang 60)
Hình 3.3.19 Kết quả thời gian chạy: 50% quét 50% chèn - Luận văn ThS Đánh giá hiệu năng một số hệ quản trị cơ sở dữ liệu NOSQL
Hình 3.3.19 Kết quả thời gian chạy: 50% quét 50% chèn (Trang 60)

TÀI LIỆU CÙNG NGƯỜI DÙNG

TÀI LIỆU LIÊN QUAN

w