1. Trang chủ
  2. » Công Nghệ Thông Tin

NewSQL database system

24 743 5

Đang tải... (xem toàn văn)

Tài liệu hạn chế xem trước, để xem đầy đủ mời bạn chọn Tải xuống

THÔNG TIN TÀI LIỆU

ĐẠI HỌC QUỐC GIA TP HỒ CHÍ MINH TRƯỜNG ĐẠI HỌC KHOA HỌC TỰ NHIÊN LÊ HỒNG DANH MSHV: 16C12005 ĐỒ ÁN MÔN HỌC CƠ SỞ DỮ LIỆU NÂNG CAO ĐỀ TÀI: HỆ THỐNG QUẢN LÝ CƠ SỞ DỮ LIỆU QUAN HỆ HIỆN ĐẠI DỰA TRÊN TÀI LIỆU: NewSQL: Towards Next-Generation Scalable RDBMS for Online Transaction Processing (OLTP) for Big Data Management TP HỒ CHÍ MINH - 2017 ĐẠI HỌC QUỐC GIA TP HỒ CHÍ MINH TRƯỜNG ĐẠI HỌC KHOA HỌC TỰ NHIÊN ĐỒ ÁN MÔN HỌC CƠ SỞ DỮ LIỆU NÂNG CAO ĐỀ TÀI: HỆ THỐNG QUẢN LÝ CƠ SỞ DỮ LIỆU QUAN HỆ HIỆN ĐẠI DỰA TRÊN TÀI LIỆU: NewSQL: Towards Next-Generation Scalable RDBMS for Online Transaction Processing (OLTP) for Big Data Management LÊ HỒNG DANH MSHV: 16C12005 TP HỒ CHÍ MINH - 2017 LỜI CẢM ƠN -o0o Tôi xin gửi lời cảm ơn chân thành tri ân sâu sắc Thầy/cô Trường Đại học Khoa học Tự nhiên TP Hồ Chí Minh, đặc biệt Thầy/cô Khoa Công Nghệ Thông tin phòng Sau Đại học tạo điều kiện cho học môn “Cơ Sở Dữ Liệu Nâng Cao” xin chân thành cảm ơn Cô TS Nguyễn Trần Minh Thư tận tâm truyền đạt kiến thức quý báu sở liệu nâng cao Trong trình học tập, q trình làm đồ án, khó tránh khỏi sai sót, mong Thầy/cơ bỏ qua Đồng thời trình độ lý luận kinh nghiệm thực tiễn hạn chế nên đồ án khơng thể tránh khỏi thiếu sót, tơi mong nhận ý kiến đóng góp Thầy/cơ để tơi học thêm nhiều kinh nghiệm hoàn thành tốt đồ án tới MỤC LỤC -o0o TÓM LƯỢC CHƯƠNG GIỚI THIỆU CHƯƠNG NỀN TẢNG CỦA CƠ SỞ DỮ LIỆU HIỆN ĐẠI CHƯƠNG TỔNG QUAN VỀ NOSQL VÀ NEWSQL 3.1 NoSQL 3.1.1 Khái niệm 3.1.2 Phân loại 3.2 NewSQL 3.2.1 Khái niệm 3.2.2 Kiến trúc NewSQL 10 3.2.3 Đặc điểm sở liệu NewSQL 12 3.2.4 Phân loại 13 CHƯƠNG SO SÁNH GIỮA RDBMS, NOSQL VÀ NEWSQL 15 CHƯƠNG KẾT LUẬN 18 TÀI LIỆU THAM KHẢO 20 TÓM LƯỢC -o0o Mặc dù sở liệu quan hệ truyền thống sử dụng phạm vi lớn ứng dụng, gần chứng kiến bùng nổ số lượng sở liệu phát triển đặc biệt cho việc phục vụ liệu lớn Hiện giải pháp thay cho RDMBS sở liệu NoSQL NewSQL Trọng tâm đồ án thảo luận hệ thống quản lý liệu NewSQL, so sánh với NoSQL với hệ thống sở liệu truyền thống Bài đồ án bao gồm kiến trúc, đặc điểm, phân loại sở liệu NewSQL xử lý giao dịch trực tuyến (OLTP) cho quản lý Big data 2 CHƯƠNG GIỚI THIỆU Trong thập kỷ qua, chứng kiến gia tăng nhanh chóng số loại khác sở liệu Nó liên quan đến phát triển Internet, thiết bị di động điện tốn đám mây Tất mơi trường áp đặt yêu cầu cho việc lưu trữ có hiệu xử lý liệu Để đối phó với thách thức này, số cơng ty trì trung tâm liệu có cụm với hàng ngàn máy móc thiết bị Các sở liệu quan hệ cũ không cung cấp giải pháp tốt tình này, đến mơ hình liệu chuẩn hóa hỗ trợ đầy đủ ACID Ngồi ra cách tiếp cận phổ biến "một kích thước phù hợp với tất cả" khơng giá trị cho kịch ứng dụng Ngược lại, thực tế thích hợp nhiều để thiết kế hệ thống dựa tính chất ứng dụng liệu Do đó, nhiều giải pháp sở liệu thay thiết kế đặc biệt để đáp ứng nhu cầu đa dạng Nhiều sở liệu thuộc lớp NoSQL NewSQL DBMS Trong đó, có khái niệm liệu nhắc đến nhiều năm 2014 NewSQL NewSQL hệ thống quản lý sở liệu quan hệ đại, nhằm cung cấp hiệu khả thi tương tự cho hệ thống NoSQL để xử lý giao dịch trực tuyến (OLTP) trì bảo đảm ACID hệ thống sở liệu truyền thống Trong đồ án trình bày sau: chương giới thiệu, chương tìm hiểu tảng sở liệu Chương giới thiệu tổng quan hệ thống sở liệu NoSQL NewSQL Chương so sánh RDBMS, NoSQL NewSQL Và cuối chương trình bày kết luận 3 CHƯƠNG NỀN TẢNG CỦA CƠ SỞ DỮ LIỆU HIỆN ĐẠI “Big Data” thuật ngữ dùng để tập hợp liệu lớn phức tạp công cụ, ứng dụng xử lí liệu truyền thống khơng thể đảm đương Tuy nhiên, Big Data lại chứa nhiều thơng tin q trích xuất thành cơng, giúp nhiều cho việc kinh doanh, nghiên cứu khoa học, dự đoán dịch bệnh phát sinh chí việc xác định điều kiện giao thơng theo thời gian thực Chính thế, liệu phải thu thập, tổ chức, lưu trữ, tìm kiếm, chia sẻ theo cách khác so với bình thường Một bước tiến quan trọng việc giải vấn đề "Big Data" lên công nghệ sở liệu thay Điều mở rộng khác biệt đáng kể mơ hình RDBMS cổ điển mơ hình DBMS thay Các kho liệu không yêu cầu lược đồ cố định theo bảng, thường tránh hoạt động nối thường quy mô theo chiều ngang, nơi liệu lưu trữ theo cách phân tán, truy cập phân tích từ ứng dụng Hình 2.1 Cơ sở liệu phân tán OTLP - viết tắt OnLine Transaction Processing (Xử lý giao dịch trực tuyến) Gần hết "giao dịch trực tuyến" dựa Từ việc bạn vào facebook, xem blog, việc bạn mua hàng trực tuyến hay giao dịch ATM, quy chung khái niệm OLTP Trong xử lý giao dịch trực tuyến (OLTP), đặc trưng khối lượng cơng việc nhỏ đòi hỏi tốc độ phản ứng nhanh, cao xữ lý đồng thời yêu cầu hệ thống OLTP Xu hướng tiếp tục tăng trưởng liệu lưu lượng truy cập lớn hệ thống OLTP để đáp ứng tỷ lệ sẵn sàng cao, đáp ứng cao hệ giải pháp cần thiết để phục vụ cho Do đó, DBMS phải tái kiến trúc để đáp ứng nhu cầu CHƯƠNG TỔNG QUAN VỀ NOSQL VÀ NEWSQL 3.1 NoSQL 3.1.1 Khái niệm NoSQL viết tắt “not only SQL” Thuật ngữ NoSQL giới thiệu lần đầu vào năm 1998 sử dụng làm tên gọi chung cho lightweight open source relational database (cơ sở liệu quan hệ nguồn mở nhỏ) không sử dụng SQL cho truy vấn Trái ngược với giao dịch RDBMS phù hợp với ACID Hình 3.1 Các thuộc tính ACID, CAP, BASE DMS hỗ trợ ACID từ viết tắt chữ đầu bốn từ tiếng Anh atomicity, consistency, isolation, durability Chúng coi bốn thuộc tính quan trọng hệ quản trị sở liệu xử lý giao dịch Nếu thiếu thuộc tính tính tồn vẹn sở liệu khó đảm bảo Trong hệ quản trị sở dư liệu, giao dịch đơn vị logic thao tác liệu, bao gồm nhiều thao tác Chẳng hạn việc chuyển tiền từ tài khoản sang tài khoản khác giao dịch, bao gồm thao tác trừ tiền tài khoản cộng tiền vào tài khoản Các tính chất ACID trường hợp đảm bảo giao dịch thực cách đáng tin cậy:  Tính nguyên tố (Atomicity): giao dịch có nhiều thao tác khác biệt tồn thao tác khơng thao tác hồn thành Chẳng hạn việc chuyển tiền thành cơng hay trục trặc nhiều lý tính ngun tố bảo đảm tài khoản không bị trừ tiền tài khoản chưa cộng số tiền tương ứng  Tính quán (Consistency): giao dịch tạo trạng thái hợp lệ cho liệu, trường hợp có lỗi chuyển toàn liệu trạng thái trước thực thi giao dịch  Tính độc lập (Isolation): giao dịch thực thi chưa xác nhận phải bảo đảm tách biệt khỏi giao dịch khác  Tính bền vững (Durability): liệu xác nhận hệ thống lưu lại cho trường hợp hỏng hóc có lỗi hệ thống, liệu đảm bảo trạng thái chuẩn xác Vào năm 2009, Eric Evans, nhân viên Rackspace giới thiệu lại thuật ngữ NoSQL hội thảo sở liệu nguồn mở phân tán Thuật ngữ NoSQL đánh dấu bước phát triển hệ database mới: distributed (phân tán) + non-relational (không ràng buộc) Tuy nhiên, việc mở rộng theo chiều ngang (scale out) hệ thống tuân thủ theo ACID thể số vấn đề Những xung đột phát sinh khía cạnh khác tính sẵn sàng cao hệ thống phân tán mà khơng thể giải hồn tồn được, điều biết với định lý CAP:  Strong Consistency (tính quán mạnh mẽ): nghĩa cách mà hệ thống trạng thái thống sau thực thao tác Một hệ thống phân tán thường coi quán sau cập nhật hoạt động vài thao tác ghi tất thao tác đọc liệu thấy liệu cập nhật  High Availability (tính sẵn sàng cao): nghĩa hệ thống thiết kế thực cho có vấn đề xảy với node cụm (cluster) chẳng hạn bị hư hỏng hay tạm ngưng để nâng cấp theo tác đọc ghi liệu cho phép tiếp tục thực  Partition Tolerance: nghĩa hệ thống cụm hoạt động bình thường đường truyền hai node bị ngắt không liên lạc Các CSDL NoSQL nới lỏng yêu cầu tính quán (consistency) nhằm để tính sẵn sàng (Availability) phân vùng (Partition) tốt Điều dẫn đến hệ thống biết BASE:  Basically Available: bản, hệ thống đảm bảo tính sẵn sàng hầu hết trường hợp  Soft-state: trạng thái hệ thống thay đổi theo thời gian dù có đầu vào hay khơng  Eventually consistent: hệ thống trở nên quán theo thời gian dù hệ thống có nhận đầu vào thời gian hay khơng 7 Hình 3.2 Định lý CAP Cấu trúc liệu NoSQL lưu trữ dạng: key-value stores, document database (or stores), Wide-Column (or Column Family) stores graph database khác với cách lưu trữ mà RDBMS sử dụng Tính chất lưu trữ đơn giản, khơng ràng buộc hiệu suất hoạt động NoSQL nhanh RDBMS nhiều 3.1.2 Phân loại Ngày có hàng trăm sở liệu NoSQL khác nhau, loại có mạnh phục vụ cho mục đích riêng Tuy nhiên dựa vào đặc điểm NoSQL mà người ta chia NoSQL làm loại:  Key-value stores: Mơ hình lưu trữ liệu dạng cặp giá trị key-value việc truy suất, xóa, cập nhật giá trị thực thông qua key tương ứng.Với hỗ trợ kĩ thuật Btree, B+Tree, Hash,… liệu tồn RAM ổ cứng, phân tán không phân tán Hầu hết cá NoSql Database key-value store  Document database/Srore: với Document NoSQL ta sử dụng truy vấn để truy xuất tất hay phần liệu Một điển hình sở liệu hướng văn MongoDB Trong MongoDB sở liệu tập hợp sưu tập (collection) Định dạng tập tin lưu trữ sở liệu có dạng ns, x (với x = 1, 2, 3, 4, 5,…) Mỗi sưu tập bao gồm văn (document), văn khác  Wide-Column (or Column Family) stores: hệ sở liệu cho phép truy xuất ngẫu nhiên/tức thời với khả lưu trước lượng lớn liệu có cấu trúc Dữ liệu tồn dạng bảng với hàng tỷ ghi ghi chứa hàng triệu cột Hệ thống triển khai từ vài trăm hàng nghìn thiết bị dẫn đến khả lưu trữ hàng petabytes đảm bảo hiệu cao  Graph database: bao gồm nút, mối quan hệ (Relationships) hay cạnh (edges) thuộc tính (properties).Một sở liệu hướng đồ thị đơn giản có nút Các nút tương tự đối tượng lập trình hướng đối tượng Một nút chứa thuộc tính dạng văn chứa cặp khóa – giá trị Khóa có kiểu liệu String giá trị có kiểu liệu tùy ý Các cặp giá trị khóa – giá trị chứa thơng tin cần thiết nút chứa Các mối quan hệ (hay cạnh) đường kết nối đại diện cho mối quan hệ nút nút với thuộc tính Giống nút, mối quan hệ hay cạnh chứa thuộc tính Việc thêm thuộc tính vào mối quan hệ (hay cạnh) làm tăng tính ngữ nghĩa, giúp bổ sung thêm siêu liệu cho thuật toán đồ thị hạn chế truy vấn thực thi Một số DBMS NoSQL phổ biến liệt kê bảng 01 dựa loại chúng Key-value stores Redis Riak SimpleDB Dynamo (Amazon) Voldmort (LinkedIn) NoSQL Database phổ biến Document Wide-Column (or Graph database database/Srore Column Family) stores MongoDB DynamoDB (Amazon) Neo4j ChuchDB Cassandra (Fackbook) Accumulo Hbase (Apache) Big Table (Google) BerkeleyDB (Oracle) Hypertable PUNTS (Yahoo) Bảng Một số DBMS NoSQL phổ biến dựa loại chúng Nhìn qua, có nhiều đóng góp thực sở liệu NoSQL; có số nút thắt cổ chai cho hệ thống quản lý liệu quy mô lớn Hệ thống NoSQL DBMS không hỗ trợ hiệu cho ứng dụng viết cho hệ DBMS trước Để di chuyển ứng dụng có để thích ứng với xu hướng tăng trưởng liệu; để phát triển ứng dụng hệ thống OLTP có khả mở rộng cao dựa vào kiến thức có việc sử dụng OLTP - hệ thống quản lý thông tin mới, gọi hệ thống NewSQL Để giải kịch kinh doanh OLTP liệu quy mơ lớn mà khơng có hệ thống OLTP truyền thống hay hệ thống NoSQL, hệ thống sở liệu thay phát triển, gọi chung hệ thống NewSQL Đối với môi trường Big Data, hỗ trợ nhiều khách hàng lưu lượng cao yêu cầu nâng cấp máy chủ lớn Cho đến gần điều có nghĩa thực kiến trúc Scale-out u cầu mơ hình lập trình non-SQL dựa vào sharding nhân rộng Khơng có giải pháp cung cấp ngữ nghĩa ACID hoàn chỉnh Sự thẳng cảm hứng cho phong trào NewSQL 3.2 NewSQL 3.2.1 Khái niệm NewSQL hệ thống quản lý sở liệu quan hệ hệ mở rộng (RDBMS) để xử lý giao dịch trực tuyến (OLTP) cung cấp khả mở rộng hệ thống NoSQL cho khối lượng cơng việc đọc-ghi, trì đảm bảo ACID hệ thống sở liệu truyền thống Các hệ thống vượt qua giới hạn hiệu suất RDBMS thông thường cách sử dụng tính theo kiểu NoSQL 10 lưu trữ liệu theo cột kiến trúc phân tán cách sử dụng công nghệ xử lý nhớ, xử lý đa hợp đối xứng (SMP) tính tiến trình xữ lý song song (MPP) tích hợp thành phần NoSQL Search, thiết kế để xử lý khối lượng, đa dạng, tốc độ thách thức biến đổi Big Data Nói cách khác, NewSQL kết hợp NoSQL SQL, thừa hưởng tính ưu việt hệ quản trị trước NewSQL kết hợp khái niệm nguyên tắc của Structured Query Language (SQL) ngôn ngữ NoSQL Nó kết hợp độ tin cậy SQL với tốc độ hiệu suất NoSQL NewSQL sử dụng nhiều công ty lớn giới Thuật ngữ NewSQL gọi lần tổ chức the 451 Group vào năm 2011 3.2.2 Kiến trúc NewSQL Cơ sở liệu truyền thống (RDBMS) cung cấp theo khả nhà phát triển ứng dụng nhu cầu, bị cản trở tất công việc cần thiết để làm quy mô sở liệu Để khắc phục thách thức khả mở rộng, nhà phát triển thêm kỷ thuật mở rộng phân vùng, chia sẻ, phân tán Cách tiếp cận phổ biến khác thêm máy lớn với chi phí cao Một DBMS lý tưởng nên có tính co dãn, cho phép máy đưa vào sở liệu chạy có hiệu lực Do đó, để áp dụng hiệu mở rộng, DBMS xác định lại công nghệ sở liệu quan hệ triển khai công nghệ sở liệu phân tán web để giải nhiều thách thức liên quan đến điện toán đám mây gia tăng triển khai ứng dụng tồn cầu 11 Hình 3.3 Cơ sở liệu phân tán quy mô web cho triển khai ứng dụng web Các sở liệu thường phân phối kiến trúc theo tự nhiên theo mơ hình tầng chia thành lớp: tầng quản lý, tầng giao dịch tầng lưu trữ Thông thường, sở liệu quan hệ thiết kế cho kiến trúc mở rộng Trong mơ hình NewSQL sở liệu lưu trữ trung tâm liệu phân tán trì kiến trúc ngữ nghĩa ACID Các tính then chốt quan trọng sở liệu liên quan đến mô hình đám mây dễ dàng điều khiển quản lý, bảo mật, nhanh khối lượng công việc lớn lỗi hỗ trợ cho ứng dụng phân tán rộng rãi vòng u cầu dịch vụ phân phối có tính sẳn sàng cao cung cấp độ trễ thấp 12 Hình 3.4 Kiến trúc sở liệu NewSQL phổ biến NueDB Mặc dù, hệ thống NewSQL khác nhiều kiến trúc bên trong, hai tính phân biệt chung chúng tất hổ trợ mô hình liệu quan hệ sử dụng SQL làm giao diện chúng Các ứng dụng nhắm mục tiêu hệ thống NewSQL đặc trưng có số lượng lớn giao dịch Các hệ thống NewSQL đạt hiệu cao khả mở rộng cách tránh kiến trúc thừa khơi phục nặng thuật tốn điều khiển đồng thời 3.2.3 Đặc điểm sở liệu NewSQL Đặc điểm kỹ thuật giải pháp NewSQL liệt kê bảng sau: Đặc điểm sở liệu NewSQL STT SQL chế cho tương tác ứng dụng Đảm bảo giao dịch thực cách đáng tin cậy Cơ chế kiểm sốt đồng thời khơng khóa để đọc theo thời gian thực không xung đột với ghi 13 Một kiến trúc cung cấp hiệu suất cao cho nút so với giải pháp RDBMS truyền thống Kiến trúc phân tán Cấu trúc chia nhỏ, kiến trúc shared-nothing, có khả chạy số lượng lớn nút mà không bị tắc nghẽn Cơ sở liệu nhớ Kiến trúc shared-nothing Bảng Đặc điểm sở liệu NewSQL 3.2.4 Phân loại Phân loại dựa phương pháp khác nhà cung cấp sử dụng để trì giao diện SQL giải vấn đề khả mở rộng hiệu giải pháp OLTP truyền thống Các hệ thống NewSQL phân loại thành ba loại:  New Architecture: tảng này, node sở hữu tập liệu câu truy vấn chia thành câu truy vấn nhỏ để gởi đến nodes để xử lý  MySQL Engines – Công cụ lưu trữ tối ưu hóa cao cho SQL với giao diện MySQ Lare  Transparent Sharding – Hệ thống tự động chia CSDL nhiều nodes Một số DBMS NewSQL phổ biến:  NuoDB: thiết kế sở liệu phân tán, hỗ trợ ngôn ngữ chuẩn SQL quan hệ logic NuoDB sỡ liệu phân bố quy mô web cung cấp thực SQL phong phú giao dịch ACID thực Nó củng thiết kế từ đầu với tư cách hệ thống phân phối làm cân bằng, cung cấp dịch vụ đám mây mang lại tính sẳn sàng khả phục hồi cao Khác với kiến trúc chia đĩa truyền thống 14 kiến trúc không dùng chung, NuoDB trình bày mơ hình peer-to-peer mới, theo yêu cầu, cung cấp khả sẳn sàng cao, độ trể thấp mơ trình triển khai dể quản lý Được thiết kế cho trung tâm liệu đại, sở liệu đám mây mở rộng, NuoDB giải pháp NewSQL bạn cần để đơn giản hóa việc triển khai ứng dụng  ClustrixDB sở liệu SQL xây dựng cho ứng dụng quy mô lớn phát triển nhanh, sở liệu NewSQL mở rộng cho đám mây ClustrixDB cho phép phân tích thời gian thực liệu hoạt động trực tiếp bạn với xử lý song song  VoltDB sở liệu nhanh sở liệu với tốc độ đọc viết cao Cơ sở liệu NewSQL hỗ trợ JSON, kiện cấp độ giao dịch  Xeround cung cấp sở hạ tầng điện tốn đám mở rộng để quản lý liệu liên kết liệu qua đám mây Giải pháp cung cấp từ CrunchBase  MemSQL phân tích thời gian thực giúp cơng ty truy vấn liệu lớn cách nhanh chóng thích ứng với điều kiện kinh doanh thay đổi NewSQL Databases New Architecture New MySQL Transparent database Storage Engines Clustering/sharding NouDB InnoDB dbShards (commercial) Clustrix Akiban ScaleBase (commercial) VoltDB TokuDB (commercial) ScalArc Drizzle InfiniDB Schooner MySQL MenSQL Xeround Continuent Tungsten GenieDB (open source) Bảng Một số NewSQL dựa loại chúng 15 CHƯƠNG SO SÁNH GIỮA RDBMS, NOSQL VÀ NEWSQL Cơ sở liệu truyền thống (RDBMS) tồn hàng thập kỉ có mặt gần app sử dụng ngày Nếu bạn triển khai app với hiệu suất tương đối điều tuyệt vời, khỏi phải thay CSDL Việc thay đổi CSDL không tốn công sức mà thể có nhiều rủi ro RDBMS  Điểm mạnh:  SQL quy chuẩn chung chứng minh tính ổn định vài chục năm  Tích hợp với lớp ORM Hibernate ActiveRecord  Hỗ trợ tốt giao tác phía client  Sử dụng query report  Thị phần lớn thị trường  Điểm yếu:  Rất khó để mở rộng (kiến trúc không hướng mở rộng)  SQL truyền thống xây dựng ý tưởng "one size fit all", application thông thường sử dụng tốt gặp vấn đề CSDL phình to  Điều chỉnh tham số phức tạp thường yêu cầu chuyên gia để cân hiệu năng, an toàn liệu lượng liệu sử dụng NoSQL  Điểm mạnh:  Thuật tốn eventual-consistency đảm bảo tính sẵn sàng CSDL  Khả mở rộng tốt SQL truyền thống  Rất nhiều hệ thống NoSQL tối ưu để hỗ trợ data khơng quan hệ ví dụ log message, XML JSON document khơng có kiến trúc cụ thể nên bạn không cần quan tâm schema viết mà cần xem schema đọc  Điểm yếu:  Hệ thống dạng không hỗ trợ giao tác (ACID) 16  OLAP query yêu cầu lượng code lớn để thực Do dễ đọc (readability) giảm CSDL phình to NewSQL Loại CSDL chưa gây tiếng vang NoSQL Các hệ thống NewSQL thường CSDL quan hệ ngôn ngữ SQL query chúng muốn giải vấn đề khả mở rộng, tính bất động thiếu tính tập trung mà đảm bảo tính quán  Điểm mạnh:  Giảm độ phức tạp cho app nhờ tính quán  Tính SQL quen thuộc  Phục vụ phân tích tốt khả mở rộng tốt SQL  Nhiều hệ thống cung cấp phân kiểu NoSQL theo kiểu data truyền thống query model  Điểm yếu:  NewSQL thường phục vụ mục tiêu định không chung chung SQL  Kiến trúc nhớ vào nhớ khơng phù hợp cho khối lượng liệu nhiều terabytes Dựa vào tảng SQL để so sánh RDBMS, NoSQL NewSQL với số liệu Do hiệu suất ưu tiên hàng đầu, sở liệu NoSQL NewSQL có khuynh hướng có khoảng cách an toàn sở liệu SQL truyền thống Tính Traditional RBDMS NoSQL NewSQL SQL Hỗ trợ Khơng hỗ trợ Hỗ trợ Tính phụ thuộc vào Một máy Đa máy/phân tán Đa máy / máy Kiểu DBMS phân tán Quan hệ Không quan hệ Quan hệ 17 Schema Bảng Key-value, column Cả hai store, document store Lưu trữ Trên đĩa nhớ Trên đĩa nhớ Trên đĩa cache cache nhớ cache Hỗ trợ tính ACID CAP through BASE ACID Khả mở rộng Không hỗ trợ Hỗ trợ Hỗ trợ Truy vấn phức tạp Thấp Cao Rất cao Vấn đề quan tâm Rất cao Thấp Thấp Big volume Hiệu suất thấp Hỗ trợ đầy đủ Hỗ trợ đầy đủ OLTP (Xử lý giao Không hỗ trợ đầy đủ Được hổ trợ Hỗ trợ đầy đủ Không hỗ trợ đầy đủ Được hổ trợ Hỗ trợ đầy đủ theo chiều ngang đến bảo mật dịch trực tuyến) Hỗ trợ liệu đám mây Bảng So sánh sở liệu RDBMS SQL, NoSQL NewSQL 18 CHƯƠNG KẾT LUẬN SQL trở lại lợi hại hết, áp đảo NoSQL Doanh nghiệp phải lựa chọn SQL truyền thống NoSQL hay chí NewSQL Database? Mike Stonebraker, người thắng giải Turing Award 2015, nói "one size does not fit all" (tạm dịch kích cỡ khơng thể vừa với tất thứ được) Ý tưởng sử dụng database phục vụ cho trường hợp khơng thực tế Đương nhiên, giải pháp có ưu khuyết điểm Để giải kịch kinh doanh OLTP liệu lớn mà khơng có hệ thống OLTP truyền thống hay hệ thống NoSQL, hệ thống sở liệu thay phát triển, gọi chung hệ thống NewSQL NewSQL hệ thống quản lý sở liệu quan hệ đại (RDBMS) cung cấp khả mở rộng tương tự hệ thống NoSQL cho xử lý giao dịch trực tuyến (OLTP) trì đảm bảo ACID hệ thống sở liệu truyền thống Do hiệu suất ưu tiên đầu nên sở liệu NoSQL NewSQL có khuynh hướng có khoảng cách an toàn so với sở liệu truyền thống Những vấn đề cần nghiên cứu sâu hơn, sở liệu NewSQL cần phải Benchmarking, điều quan trọng đánh giá "kiểm tra tải" "khả mở rộng thử nghiệm " số sở liệu NoSQL NewSQL phổ biến so sánh sở liệu việc 19 phân tích liệu lớn Để so sánh hiệu suất; cần mơ xác điều kiện khối lượng công việc để xử lý yêu cầu nhỏ thường xuyên tập trung vào việc cung cấp thời gian đáp ứng nhanh 20 TÀI LIỆU THAM KHẢO -o0o [1] A B M Moniruzzaman, “NewSQL: Towards Next-Generation Scalable RDBMS for Online Transaction Processing (OLTP) for Big Data Management”; [2] Duy Luân, 21/11/2013, “Big Data người ta khai thác, ứng dụng vào sống nào?”, TinhTe, lấy từ https://tinhte.vn/threads/big-data-la-gi-vanguoi-ta-khai-thac-ung-dung-no-vao-cuoc-song-nhu-the-nao.2210939/ , ngày 12/10/2013; [3] John piekos, 17/08/2015, “Sql vs Nosql vs Newsql: finding the right solution”, Dataconomy, lấy từ http://dataconomy.com/2015/08/sql-vs-nosql-vs-newsql-findingthe-right-solution/ , 17/08/2013 [4] https://en.wikipedia.org/wiki/Relational_database_management_system [5] https://en.wikipedia.org/wiki/NoSQL [6] https://en.wikipedia.org/wiki/NewSQL ... VỀ NOSQL VÀ NEWSQL 3.1 NoSQL 3.1.1 Khái niệm 3.1.2 Phân loại 3.2 NewSQL 3.2.1 Khái niệm 3.2.2 Kiến trúc NewSQL ... liệu NoSQL NewSQL Trọng tâm đồ án thảo luận hệ thống quản lý liệu NewSQL, so sánh với NoSQL với hệ thống sở liệu truyền thống Bài đồ án bao gồm kiến trúc, đặc điểm, phân loại sở liệu NewSQL xử... biệt để đáp ứng nhu cầu đa dạng Nhiều sở liệu thuộc lớp NoSQL NewSQL DBMS Trong đó, có khái niệm liệu nhắc đến nhiều năm 2014 NewSQL NewSQL hệ thống quản lý sở liệu quan hệ đại, nhằm cung cấp hiệu

Ngày đăng: 10/12/2017, 08:37

Xem thêm:

TỪ KHÓA LIÊN QUAN

w