1. Trang chủ
  2. » Công Nghệ Thông Tin

Co so du lieu nang cao

18 20 0

Đang tải... (xem toàn văn)

Tài liệu hạn chế xem trước, để xem đầy đủ mời bạn chọn Tải xuống

THÔNG TIN TÀI LIỆU

Thông tin cơ bản

Định dạng
Số trang 18
Dung lượng 587,6 KB

Nội dung

TRƯỜNG ĐẠI HỌC KHOA CÔNG NGHỆ THÔNG TIN TÊN ĐỀ TÀI: HỆ QUẢN TRỊ CSDL NEWSQL TIỂU LUẬN MÔN HỌC CƠ SỞ DỮ LIỆU NÂNG CAO Nhóm học viên thực hiện: Lớp: Khoa học máy tính , 10/2019 Mơn học: Cơ sở liệu nâng cao MỤC LỤC Chương I: Tổng Quan 1.1 Tổng quan hệ quản trị sở liệu NewSQL: 1.2 Nhiệm vụ tiểu luận: CHƯƠNG TỔNG QUAN VỀ NOSQL VÀ NEWSQL 2.1 NoSQL 2.1.1 Khái niệm 2.1.2 Phân loại 2.2 NewSQL 10 2.2.1 Khái niệm 10 2.2.2 Kiến trúc NewSQL 10 2.2.3 Đặc điểm sở liệu NewSQL 12 2.2.4 Phân loại 13 CHƯƠNG SO SÁNH GIỮA RDBMS, NOSQL VÀ NEWSQL 14 CHƯƠNG KẾT LUẬN 17 Môn học: Cơ sở liệu nâng cao CHƯƠNG I: TỔNG QUAN Các hạn chế khả mở rộng hệ thống quản lý sở liệu truyền thống truyền cảm hứng cho phát triển công nghệ sở liệu thay SQL (NoQuery) NewQuery NewQuery lớp hệ thống sở liệu cung cấp hiệu khả mở rộng tương tự hệ thống NoQuery cho khối lượng công việc OLTP (On-line transactional processing) trì thuộc tính ACID (atomicity, consistency, isolation, durability) DBMS (Database Management System) truyền thống NewQuery cung cấp tính sẵn sàng hiệu suất cao cho liệu đại mà khơng phải hy sinh u cầu tính quán khả giao dịch mạnh mẽ mà NoQuery giữ lại 1.1 Tổng quan hệ quản trị sở liệu NewSQL: Lịch sử đời: Các kích thước, khả hiệu suất sở liệu DBMS tương ứng chúng tăng dần theo nhu cầu sử dụng người Những gia tăng hiệu suất phát triển tiến công nghệ lĩnh vực xử lý, nhớ máy tính, lưu trữ máy tính mạng máy tính Sự phát triển cơng nghệ sở liệu chia thành ba thời đại dựa mơ hình cấu trúc liệu: mơ hình điều hướng, mơ hình quan hệ mơ hình hậu quan hệ Hai mơ hình liệu điều hướng ban đầu mơ hình phân cấp mơ hình CODASYL (mơ hình mạng) Mơ hình quan hệ, lần Edgar F Codd đề xuất vào năm 1970, thoát ly khỏi truyền thống cách nhấn mạnh ứng dụng nên tìm kiếm liệu theo nội dung, thay theo liên kết Mơ hình quan hệ sử dụng tập hợp bảng kiểu sổ cái, bảng sử dụng cho loại thực thể khác Chỉ vào năm 1980, phần cứng máy tính trở nên đủ mạnh phép triển khai rộng rãi hệ thống quan hệ (DBMS cộng với ứng dụng) Tuy nhiên, vào đầu năm 1990, hệ thống quan hệ chiếm ưu tất ứng dụng xử lý liệu quy mô lớn Tính đến năm 2018 chúng chiếm ưu thế: IBM DB2, Oracle, MySQL Microsoft SQL Server DBMS tìm kiếm nhiều Ngơn ngữ sở liệu SQL tiêu chuẩn Môn học: Cơ sở liệu nâng cao hóa cho mơ hình quan hệ, ảnh hưởng đến ngôn ngữ sở liệu cho mơ hình liệu khác Thế hệ sở liệu hậu quan hệ vào cuối năm 2000 gọi sở liệu NoQuery, giới thiệu kho lưu trữ khóa giá trị nhanh sở liệu định hướng tài liệu Một hệ cạnh tranh gọi sở liệu NewQuery thử triển khai mơ hình giữ lại mơ hình quan hệ / SQL hướng đến việc phù hợp với hiệu suất cao NoQuery so với DBMS quan hệ có sẵn thị trường Hệ quản trị CSDL gì?: (Database Management System - DBMS) phần mềm tương tác với người dùng cuối, ứng dụng sở liệu để thu thập phân tích liệu Phần mềm DBMS bao gồm tiện ích cốt lõi cung cấp để quản trị sở liệu Tổng cộng sở liệu, DBMS ứng dụng liên quan gọi "hệ thống sở liệu" Thông thường thuật ngữ "cơ sở liệu" sử dụng để nói đến DBMS, hệ thống sở liệu ứng dụng liên kết với sở liệu Các nhà khoa học máy tính phân loại hệ thống quản lý sở liệu theo mơ hình sở liệu mà họ hỗ trợ Cơ sở liệu quan hệ trở nên thống trị năm 1980 Những liệu mơ hình dạng hàng cột loạt bảng phần lớn sử dụng SQL (Structured Query Language - ngôn ngữ truy vấn cấu trúc) để ghi truy vấn liệu Vào năm 2000, sở liệu phi quan hệ trở nên phổ biến, gọi NoSQL chúng sử dụng ngôn ngữ truy vấn khác 1.2 Nhiệm vụ tiểu luận: Trọng tâm đồ án thảo luận hệ thống quản lý liệu NewSQL, so sánh với NoSQL với hệ thống sở liệu truyền thống Bài đồ án bao gồm kiến trúc, đặc điểm, phân loại sở liệu NewSQL xử lý giao dịch trực tuyến (OLTP) cho quản lý Big data Môn học: Cơ sở liệu nâng cao CHƯƠNG TỔNG QUAN VỀ NOSQL VÀ NEWSQL 2.1 NoSQL 2.1.1 Khái niệm NoSQL viết tắt “not only SQL” Thuật ngữ NoSQL giới thiệu lần đầu vào năm 1998 sử dụng làm tên gọi chung cho lightweight open source relational database (cơ sở liệu quan hệ nguồn mở nhỏ) không sử dụng SQL cho truy vấn Trái ngược với giao dịch RDBMS phù hợp với ACID Hình 2.1 Các thuộc tính ACID, CAP, BASE DMS hỗ trợ ACID từ viết tắt chữ đầu bốn từ tiếng Anh atomicity, consistency, isolation, durability Chúng coi bốn thuộc tính quan trọng hệ quản trị sở liệu xử lý giao dịch Nếu thiếu thuộc tính tính tồn vẹn sở liệu khó đảm bảo Trong hệ quản trị sở dư liệu, giao dịch đơn vị logic thao tác liệu, bao gồm nhiều thao tác Chẳng hạn việc chuyển tiền từ tài khoản sang tài khoản khác giao dịch, bao gồm thao tác trừ tiền tài khoản cộng tiền vào tài khoản Các tính chất ACID trường hợp đảm bảo giao dịch thực cách đáng tin cậy: • Tính ngun tố (Atomicity): giao dịch có nhiều thao tác khác biệt tồn thao tác khơng thao tác hoàn thành Chẳng hạn việc chuyển tiền thành cơng hay trục trặc nhiều lý tính nguyên tố bảo đảm tài khoản không bị trừ tiền tài khoản chưa cộng số tiền tương ứng Mơn học: Cơ sở liệu nâng cao • Tính quán (Consistency): giao dịch tạo trạng thái hợp lệ cho liệu, trường hợp có lỗi chuyển toàn liệu trạng thái trước thực thi giao dịch • Tính độc lập (Isolation): giao dịch thực thi chưa xác nhận phải bảo đảm tách biệt khỏi giao dịch khác • Tính bền vững (Durability): liệu xác nhận hệ thống lưu lại cho trường hợp hỏng hóc có lỗi hệ thống, liệu đảm bảo trạng thái chuẩn xác Vào năm 2009, Eric Evans, nhân viên Rackspace giới thiệu lại thuật ngữ NoSQL hội thảo sở liệu nguồn mở phân tán Thuật ngữ NoSQL đánh dấu bước phát triển hệ database mới: distributed (phân tán) + non-relational (không ràng buộc) Tuy nhiên, việc mở rộng theo chiều ngang (scale out) hệ thống tuân thủ theo ACID thể số vấn đề Những xung đột phát sinh khía cạnh khác tính sẵn sàng cao hệ thống phân tán mà giải hoàn toàn được, điều biết với định lý CAP: ▪ Strong Consistency (tính quán mạnh mẽ): nghĩa cách mà hệ thống trạng thái thống sau thực thao tác Một hệ thống phân tán thường coi quán sau cập nhật hoạt động vài thao tác ghi tất thao tác đọc liệu thấy liệu cập nhật ▪ High Availability (tính sẵn sàng cao): nghĩa hệ thống thiết kế thực cho có vấn đề xảy với node cụm (cluster) chẳng hạn bị hư hỏng hay tạm ngưng để nâng cấp theo tác đọc ghi liệu cho phép tiếp tục thực ▪ Partition Tolerance: nghĩa hệ thống cụm hoạt động bình thường đường truyền hai node bị ngắt không liên lạc Các CSDL NoSQL nới lỏng yêu cầu tính quán (consistency) nhằm để tính sẵn sàng (Availability) phân vùng (Partition) tốt Điều dẫn đến hệ thống biết BASE: Môn học: Cơ sở liệu nâng cao ▪ Basically Available: bản, hệ thống đảm bảo tính sẵn sàng hầu hết trường hợp ▪ Soft-state: trạng thái hệ thống thay đổi theo thời gian dù có đầu vào hay không ▪ Eventually consistent: hệ thống trở nên quán theo thời gian dù hệ thống có nhận đầu vào thời gian hay khơng Hình 2.2 Định lý CAP Cấu trúc liệu NoSQL lưu trữ dạng: key-value stores, document database (or stores), Wide-Column (or Column Family) stores graph database khác với cách lưu trữ mà RDBMS sử dụng Tính chất lưu trữ đơn giản, khơng ràng buộc hiệu suất hoạt động NoSQL nhanh RDBMS nhiều 2.1.2 Phân loại Ngày có hàng trăm sở liệu NoSQL khác nhau, loại có mạnh phục vụ cho mục đích riêng Tuy nhiên dựa vào đặc điểm NoSQL mà người ta chia NoSQL làm loại: ❖ Key-value stores: Mơ hình lưu trữ liệu dạng cặp giá trị key-value việc truy suất, xóa, cập nhật giá trị thực thơng qua key tương ứng.Với hỗ trợ kĩ thuật Btree, B+Tree, Hash,… liệu tồn RAM ổ cứng, phân tán không phân tán Hầu hết cá NoSql Database key-value store Môn học: Cơ sở liệu nâng cao ❖ Document database/Srore: với Document NoSQL ta sử dụng truy vấn để truy xuất tất hay phần liệu Một điển hình sở liệu hướng văn MongoDB Trong MongoDB sở liệu tập hợp sưu tập (collection) Định dạng tập tin lưu trữ sở liệu có dạng ns, x (với x = 1, 2, 3, 4, 5,…) Mỗi sưu tập bao gồm văn (document), văn khác ❖ Wide-Column (or Column Family) stores: hệ sở liệu cho phép truy xuất ngẫu nhiên/tức thời với khả lưu trước lượng lớn liệu có cấu trúc Dữ liệu tồn dạng bảng với hàng tỷ ghi ghi chứa hàng triệu cột Hệ thống triển khai từ vài trăm hàng nghìn thiết bị dẫn đến khả lưu trữ hàng petabytes đảm bảo hiệu cao ❖ Graph database: bao gồm nút, mối quan hệ (Relationships) hay cạnh (edges) thuộc tính (properties).Một sở liệu hướng đồ thị đơn giản có nút Các nút tương tự đối tượng lập trình hướng đối tượng Một nút chứa thuộc tính dạng văn chứa cặp khóa – giá trị Khóa có kiểu liệu String giá trị có kiểu liệu tùy ý Các cặp giá trị khóa – giá trị chứa thơng tin cần thiết nút chứa Các mối quan hệ (hay cạnh) đường kết nối đại diện cho mối quan hệ nút nút với thuộc tính Giống nút, mối quan hệ hay cạnh chứa thuộc tính Việc thêm thuộc tính vào mối quan hệ (hay cạnh) làm tăng tính ngữ nghĩa, giúp bổ sung thêm siêu liệu cho thuật toán đồ thị hạn chế truy vấn thực thi Một số DBMS NoSQL phổ biến liệt kê bảng 01 dựa loại chúng NoSQL Database phổ biến Key-value stores Redis Document Wide-Column (or database/Srore Column Family) stores MongoDB DynamoDB (Amazon) Môn học: Cơ sở liệu nâng cao Graph database Neo4j Riak ChuchDB Cassandra (Fackbook) SimpleDB Accumulo Dynamo Hbase (Apache) (Amazon) Voldmort Big Table (Google) (LinkedIn) BerkeleyDB Hypertable (Oracle) PUNTS (Yahoo) Bảng Một số DBMS NoSQL phổ biến dựa loại chúng Nhìn qua, có nhiều đóng góp thực sở liệu NoSQL; có số nút thắt cổ chai cho hệ thống quản lý liệu quy mô lớn Hệ thống NoSQL DBMS không hỗ trợ hiệu cho ứng dụng viết cho hệ DBMS trước Để di chuyển ứng dụng có để thích ứng với xu hướng tăng trưởng liệu; để phát triển ứng dụng hệ thống OLTP có khả mở rộng cao dựa vào kiến thức có việc sử dụng OLTP - hệ thống quản lý thông tin mới, gọi hệ thống NewSQL Để giải kịch kinh doanh OLTP liệu quy mơ lớn mà khơng có hệ thống OLTP truyền thống hay hệ thống NoSQL, hệ thống sở liệu thay phát triển, gọi chung hệ thống NewSQL Đối với môi trường Big Data, hỗ trợ nhiều khách hàng lưu lượng cao yêu cầu nâng cấp máy chủ lớn Cho đến gần điều có nghĩa thực kiến trúc Scale-out u cầu mơ hình lập trình non-SQL dựa vào sharding nhân rộng Khơng có giải pháp cung cấp ngữ nghĩa ACID hoàn chỉnh Sự thẳng cảm hứng cho phong trào NewSQL Môn học: Cơ sở liệu nâng cao 2.2 NewSQL 2.2.1 Khái niệm NewSQL hệ thống quản lý sở liệu quan hệ hệ mở rộng (RDBMS) để xử lý giao dịch trực tuyến (OLTP) cung cấp khả mở rộng hệ thống NoSQL cho khối lượng cơng việc đọc-ghi, trì đảm bảo ACID hệ thống sở liệu truyền thống Các hệ thống vượt qua giới hạn hiệu suất RDBMS thông thường cách sử dụng tính theo kiểu NoSQL lưu trữ liệu theo cột kiến trúc phân tán cách sử dụng công nghệ xử lý nhớ, xử lý đa hợp đối xứng (SMP) tính tiến trình xữ lý song song (MPP) tích hợp thành phần NoSQL Search, thiết kế để xử lý khối lượng, đa dạng, tốc độ thách thức biến đổi Big Data Nói cách khác, NewSQL kết hợp NoSQL SQL, thừa hưởng tính ưu việt hệ quản trị trước NewSQL kết hợp khái niệm nguyên tắc của Structured Query Language (SQL) ngơn ngữ NoSQL Nó kết hợp độ tin cậy SQL với tốc độ hiệu suất NoSQL NewSQL sử dụng nhiều công ty lớn giới Thuật ngữ NewSQL gọi lần tổ chức the 451 Group vào năm 2011 2.2.2 Kiến trúc NewSQL Cơ sở liệu truyền thống (RDBMS) cung cấp theo khả nhà phát triển ứng dụng nhu cầu, bị cản trở tất công việc cần thiết để làm quy mô sở liệu Để khắc phục thách thức khả mở rộng, nhà phát triển thêm kỷ thuật mở rộng phân vùng, chia sẻ, phân tán Cách tiếp cận phổ biến khác thêm máy lớn với chi phí cao Một DBMS lý tưởng nên có tính co dãn, cho phép máy đưa vào sở liệu chạy có hiệu lực Do đó, để áp dụng hiệu mở rộng, DBMS xác định lại công nghệ sở liệu quan hệ triển khai công nghệ sở liệu phân tán web để giải nhiều thách thức liên quan đến điện toán đám mây gia tăng triển khai ứng dụng toàn cầu Môn học: Cơ sở liệu nâng cao 10 Hình 2.3 Cơ sở liệu phân tán quy mơ web cho triển khai ứng dụng web Các sở liệu thường phân phối kiến trúc theo tự nhiên theo mơ hình tầng chia thành lớp: tầng quản lý, tầng giao dịch tầng lưu trữ Thông thường, sở liệu quan hệ thiết kế cho kiến trúc mở rộng Trong mơ hình NewSQL sở liệu lưu trữ trung tâm liệu phân tán trì kiến trúc ngữ nghĩa ACID Các tính then chốt quan trọng sở liệu liên quan đến mơ hình đám mây dễ dàng điều khiển quản lý, bảo mật, nhanh khối lượng công việc lớn lỗi hỗ trợ cho ứng dụng phân tán rộng rãi vịng u cầu dịch vụ phân phối có tính sẳn sàng cao cung cấp độ trễ thấp Môn học: Cơ sở liệu nâng cao 11 Hình 2.4 Kiến trúc sở liệu NewSQL phổ biến NueDB Mặc dù, hệ thống NewSQL khác nhiều kiến trúc bên trong, hai tính phân biệt chung chúng tất hổ trợ mơ hình liệu quan hệ sử dụng SQL làm giao diện chúng Các ứng dụng nhắm mục tiêu hệ thống NewSQL đặc trưng có số lượng lớn giao dịch Các hệ thống NewSQL đạt hiệu cao khả mở rộng cách tránh kiến trúc thừa khôi phục nặng thuật toán điều khiển đồng thời 2.2.3 Đặc điểm sở liệu NewSQL Đặc điểm kỹ thuật giải pháp NewSQL liệt kê bảng sau: Đặc điểm sở liệu NewSQL STT SQL chế cho tương tác ứng dụng Đảm bảo giao dịch thực cách đáng tin cậy Cơ chế kiểm soát đồng thời khơng khóa để đọc theo thời gian thực không xung đột với ghi Môn học: Cơ sở liệu nâng cao 12 Một kiến trúc cung cấp hiệu suất cao cho nút so với giải pháp RDBMS truyền thống Kiến trúc phân tán Cấu trúc chia nhỏ, kiến trúc shared-nothing, có khả chạy số lượng lớn nút mà không bị tắc nghẽn Cơ sở liệu nhớ Kiến trúc shared-nothing Bảng Đặc điểm sở liệu NewSQL 2.2.4 Phân loại Phân loại dựa phương pháp khác nhà cung cấp sử dụng để trì giao diện SQL giải vấn đề khả mở rộng hiệu giải pháp OLTP truyền thống Các hệ thống NewSQL phân loại thành ba loại: ❖ New Architecture: tảng này, node sở hữu tập liệu câu truy vấn chia thành câu truy vấn nhỏ để gởi đến nodes để xử lý ❖ MySQL Engines – Công cụ lưu trữ tối ưu hóa cao cho SQL với giao diện MySQ Lare ❖ Transparent Sharding – Hệ thống tự động chia CSDL nhiều nodes Một số DBMS NewSQL phổ biến: • NuoDB: thiết kế sở liệu phân tán, hỗ trợ ngôn ngữ chuẩn SQL quan hệ logic NuoDB sỡ liệu phân bố quy mô web cung cấp thực SQL phong phú giao dịch ACID thực Nó củng thiết kế từ đầu với tư cách hệ thống phân phối làm cân bằng, cung cấp dịch vụ đám mây mang lại tính sẳn sàng khả phục hồi cao Khác với kiến trúc chia đĩa truyền thống kiến trúc không dùng chung, NuoDB trình bày mơ hình peer-to-peer mới, theo yêu cầu, cung cấp khả sẳn sàng cao, độ trể thấp mơ trình triển khai dể quản lý Được thiết kế cho trung Môn học: Cơ sở liệu nâng cao 13 tâm liệu đại, sở liệu đám mây mở rộng, NuoDB giải pháp NewSQL bạn cần để đơn giản hóa việc triển khai ứng dụng • ClustrixDB sở liệu SQL xây dựng cho ứng dụng quy mô lớn phát triển nhanh, sở liệu NewSQL mở rộng cho đám mây ClustrixDB cho phép phân tích thời gian thực liệu hoạt động trực tiếp bạn với xử lý song song • VoltDB sở liệu nhanh sở liệu với tốc độ đọc viết cao Cơ sở liệu NewSQL hỗ trợ JSON, kiện cấp độ giao dịch • Xeround cung cấp sở hạ tầng điện tốn đám mở rộng để quản lý liệu liên kết liệu qua đám mây Giải pháp cung cấp từ CrunchBase • MemSQL phân tích thời gian thực giúp cơng ty truy vấn liệu lớn cách nhanh chóng thích ứng với điều kiện kinh doanh thay đổi NewSQL Databases New Architecture New MySQL Transparent database Storage Engines Clustering/sharding NouDB InnoDB dbShards (commercial) Clustrix Akiban ScaleBase (commercial) VoltDB TokuDB (commercial) ScalArc Drizzle InfiniDB Schooner MySQL MenSQL Xeround Continuent Tungsten GenieDB (open source) Bảng Một số NewSQL dựa loại chúng CHƯƠNG SO SÁNH GIỮA RDBMS, NOSQL VÀ NEWSQL Cơ sở liệu truyền thống (RDBMS) tồn hàng thập kỉ có mặt gần app sử dụng ngày Nếu bạn triển khai app với hiệu suất tương đối điều Môn học: Cơ sở liệu nâng cao 14 tuyệt vời, khỏi phải thay CSDL Việc thay đổi CSDL khơng tốn cơng sức mà cịn thể có nhiều rủi ro RDBMS Điểm mạnh: ✓ SQL quy chuẩn chung chứng minh tính ổn định vài chục năm ✓ Tích hợp với lớp ORM Hibernate ActiveRecord ✓ Hỗ trợ tốt giao tác phía client ✓ Sử dụng query report Thị phần lớn thị trường Điểm yếu: ✓ Rất khó để mở rộng (kiến trúc không hướng mở rộng) ✓ SQL truyền thống xây dựng ý tưởng "one size fit all", application thơng thường sử dụng tốt gặp vấn đề CSDL phình to ✓ Điều chỉnh tham số phức tạp thường yêu cầu chuyên gia để cân hiệu năng, an toàn liệu lượng liệu sử dụng NoSQL Điểm mạnh: ✓ Thuật tốn eventual-consistency đảm bảo tính sẵn sàng CSDL ✓ Khả mở rộng tốt SQL truyền thống ✓ Rất nhiều hệ thống NoSQL tối ưu để hỗ trợ data khơng quan hệ ví dụ log message, XML JSON document khơng có kiến trúc cụ thể nên bạn khơng cần quan tâm schema viết mà cần xem schema đọc Điểm yếu: ✓ Hệ thống dạng không hỗ trợ giao tác (ACID) ✓ OLAP query yêu cầu lượng code lớn để thực Do dễ đọc (readability) giảm CSDL phình to NewSQL Mơn học: Cơ sở liệu nâng cao 15 Loại CSDL chưa gây tiếng vang NoSQL Các hệ thống NewSQL thường CSDL quan hệ ngôn ngữ SQL query chúng muốn giải vấn đề khả mở rộng, tính bất động thiếu tính tập trung mà đảm bảo tính quán Điểm mạnh: ✓ Giảm độ phức tạp cho app nhờ tính quán ✓ Tính SQL quen thuộc ✓ Phục vụ phân tích tốt khả mở rộng tốt SQL ✓ Nhiều hệ thống cung cấp phân kiểu NoSQL theo kiểu data truyền thống query model Điểm yếu: ✓ NewSQL thường phục vụ mục tiêu định không chung chung SQL ✓ Kiến trúc nhớ vào nhớ không phù hợp cho khối lượng liệu nhiều terabytes Dựa vào tảng SQL để so sánh RDBMS, NoSQL NewSQL với số liệu Do hiệu suất ưu tiên hàng đầu, sở liệu NoSQL NewSQL có khuynh hướng có khoảng cách an toàn sở liệu SQL truyền thống Tính Traditional RBDMS NoSQL NewSQL SQL Hỗ trợ Khơng hỗ trợ Hỗ trợ Tính phụ thuộc vào Một máy Đa máy/phân tán Đa máy / máy phân tán Kiểu DBMS Quan hệ Không quan hệ Quan hệ Schema Bảng Key-value, column Cả hai store, document store Lưu trữ Trên đĩa nhớ Trên đĩa nhớ Trên đĩa cache cache nhớ cache Môn học: Cơ sở liệu nâng cao 16 Hỗ trợ tính ACID CAP through BASE ACID Khả mở rộng Không hỗ trợ Hỗ trợ Hỗ trợ Truy vấn phức tạp Thấp Cao Rất cao Vấn đề quan tâm Rất cao Thấp Thấp Big volume Hiệu suất thấp Hỗ trợ đầy đủ Hỗ trợ đầy đủ OLTP (Xử lý giao Không hỗ trợ đầy đủ Được hổ trợ Hỗ trợ đầy đủ Không hỗ trợ đầy đủ Được hổ trợ Hỗ trợ đầy đủ theo chiều ngang đến bảo mật dịch trực tuyến) Hỗ trợ liệu đám mây Bảng So sánh sở liệu RDBMS SQL, NoSQL NewSQL CHƯƠNG KẾT LUẬN SQL trở lại lợi hại hết, áp đảo NoSQL Doanh nghiệp phải lựa chọn SQL truyền thống NoSQL hay chí NewSQL Database? Mike Stonebraker, người thắng giải Turing Award 2015, nói "one size Mơn học: Cơ sở liệu nâng cao 17 does not fit all" (tạm dịch kích cỡ khơng thể vừa với tất thứ được) Ý tưởng sử dụng database phục vụ cho trường hợp khơng cịn thực tế Đương nhiên, giải pháp có ưu khuyết điểm Để giải kịch kinh doanh OLTP liệu lớn mà hệ thống OLTP truyền thống hay hệ thống NoSQL, hệ thống sở liệu thay phát triển, gọi chung hệ thống NewSQL NewSQL hệ thống quản lý sở liệu quan hệ đại (RDBMS) cung cấp khả mở rộng tương tự hệ thống NoSQL cho xử lý giao dịch trực tuyến (OLTP) trì đảm bảo ACID hệ thống sở liệu truyền thống Do hiệu suất ưu tiên đầu nên sở liệu NoSQL NewSQL có khuynh hướng có khoảng cách an tồn so với sở liệu truyền thống Những vấn đề cần nghiên cứu sâu hơn, sở liệu NewSQL cần phải Benchmarking, điều quan trọng đánh giá "kiểm tra tải" "khả mở rộng thử nghiệm " số sở liệu NoSQL NewSQL phổ biến so sánh sở liệu việc phân tích liệu lớn Để so sánh hiệu suất; cần mô xác điều kiện khối lượng cơng việc để xử lý yêu cầu nhỏ thường xuyên tập trung vào việc cung cấp thời gian đáp ứng nhanh Môn học: Cơ sở liệu nâng cao 18 ... InnoDB dbShards (commercial) Clustrix Akiban ScaleBase (commercial) VoltDB TokuDB (commercial) ScalArc Drizzle InfiniDB Schooner MySQL MenSQL Xeround Continuent Tungsten GenieDB (open source) Bảng... ACID, CAP, BASE DMS hỗ trợ ACID từ viết tắt chữ đầu bốn từ tiếng Anh atomicity, consistency, isolation, durability Chúng coi bốn thuộc tính quan trọng hệ quản trị sở liệu xử lý giao dịch Nếu thiếu... thời gian thực liệu hoạt động trực tiếp bạn với xử lý song song • VoltDB sở liệu nhanh sở liệu với tốc độ đọc viết cao Cơ sở liệu NewSQL hỗ trợ JSON, kiện cấp độ giao dịch • Xeround cung cấp sở hạ

Ngày đăng: 04/05/2021, 13:58

TỪ KHÓA LIÊN QUAN

w