(Nguồn: http://orientdb. com )
OrientDB là cơ sở dữ liệu đồ thị phân tán thế hệ thứ 2 (the 2nd Generation Distributed Graph Database) kết hợp sự linh hoạt của các tài liệu trong một sản phẩm. Nó là một hệ quản trị cơ sở dữ liệu độc đáo, đa mơ hình thật sự, được trang bị để giải quyết những thách thức của Big Data ngày nay và cung cấp khả năng nhân bản multi-master5, sharding6 cũng như sự linh hoạt hơn cho những trường hợp sử dụng phức tạp, hiện đại. Người dùng có thể sử dụng OrientDB bằng giấy phép mã nguồn mở Apache 2.
OrientDB hoạt động cực kỳ nhanh chóng, lưu trữ lên tới 120.000 records trên giây (On Intel i7 8 core CPU, 16 GB RAM, SSD RPM, Multi-threads, No indexes, PLocal
5Multi-master cho phép lưu trữ cơ sở dữ liệu trong nhiều server, server nào cũng có thể làm master.
6Sharding là kỹ thuật phân hoạch cơ sở dữ liệu. Kỹ thuật này chia các cơ sở dữ liệu rất lớn thành các phần nhỏ hơn,
truy cập nhanh hơn và dễ quản lý hơn được gọi là các mảnh dữ liệu (data shards).
access). Nó hỗ trợ các chế độ schema-less, schema-full và schema-
mixed và dùng ngôn
ngữ truy vấn dựa trên SQL giúp những người mới đối với OrientDB tiếp cận dễ
dàng hơn
(Tesoriero, 2013).
Hiện tại trên thế giới nhiều tổ chức lớn, nổi tiếng đang sử dụng OrientDB để giải quyết các vấn đề của họ. Hình 2.7 trình bày một số tổ chức tiêu biểu đang sử dụng OrientDB. Còn ở Việt Nam, việc khai thác Big Data còn hạn chế, hiện tại chưa thấy tổ chức nào sử dụng OrientDB.
2.2.5. Lý do chọn OrientDB
2.2.5.I. So sánh OrientDB và Neo4j
Bảng 3 so sánh một số đặc điểm quan trọng giữa OrientDB và Neo4j.
Bảng 2.2 - So sánh OrientDB và Neo4j
(Nguồn: http://db-engines.com/en/svstem/Neo4i%3BOrientDB và
http://vschart.com/compare/neo4i/vs/orientdb )
Name OrientDB Neo4j
Description Multi-model DBMS (Document, Graph, Key/Value)
Open source graph database
Database model Document store Graph DBMS Key-value store Graph DBMS Impleimentation language Java Java Server operating
systems All OS with a Java VM LinuxOS X Windows
APIs and other
access methods Java APIRESTful HTTP/JSON API Tinkerpop technology stack
Cypher query language Java API
Name OrientDB Neo4j
with Blueprints, Gremlin, Pipes Supported programming languages .Net C C# C++ Clojure Java JavaScript JavaScript (Node.js) PHP Python Ruby Scala .Net Clojure Go Groovy Java JavaScript Perl PHP Python Ruby Scala
Triggers Hooks yes
Partitioning methods
Sharding none
Replication methods
Master-master replication Master-slave replication
Transaction concepts
ACID ACID
2.2.5.2. Một số đặc điểm nổi trội của OrientDB so với Neo4j 1. Hệ quản trị cơ sở dữ liệu đa mơ hình (Multi-model DBMS)
OrientDB là hệ quản trị cơ sở dữ liệu đa mơ hình, tận dụng sức mạnh của mơ hình đồ thị và được làm phong phú bằng dữ liệu văn bản, không gian, key/values, đối tượng và tài liệu. Tất cả các mơ hình này được quản lý bởi phần core của OrientDB. Điều này khác với các hệ quản trị cơ sở dữ liệu khác là thêm các tầng quản lý cho các mơ hình bổ sung, dẫn đến hiệu suất giảm.
OrientDB có thể được sử dụng như Graph Databases thuần túy hoặc như Multi- Models, giúp tránh sử dụng nhiều loại cơ sở dữ liệu cho cùng một ứng dụng.
2. Phương pháp phân mảnh (Partitioning methods)
Neo4j không hỗ trợ phân mảnh dữ liệu mà chỉ nhân bản toàn bộ cơ sở dữ liệu sang nhiều server. Trong khi đó OrientDB hỗ trợ cơ chế phân mảnh dữ liệu ở mức class
gọi là sharding. Một class có thể được chia thành nhiều cluster và một cluster có thể lưu
đồng thời trên nhiều server.
Ta có thể gán mỗi cluster cho một hoặc nhiều server. Khi gán một cluster cho nhiều server thì các record thuộc cluster đó sẽ được sao chép lên tất cả các server được gán. Điều này cũng tương tự như những gì RAID làm trên các đĩa. Server đầu tiên trong danh sách sẽ là Master Server cho cluster đó.