File định nghĩa dự án được sử dụng để tạo hồ sơ thời gian chạy định nghĩa cách cơ sở dữ liệu được thiết kế logic : Bảng nào được tạo, Bảng nào được phân vùng, và cách truy cập dữ liệu. Một khía cạnh quan trọng khác của cơ sở dữ liệu đang chạy là tầng vật lý của Cluster. Các thông tin như :
• Số node trên Cluster
• Số phân vùng (hoặc sites) trên node
• Địa chỉ (hostname hoặc IP address) của node chủ (node dẫn đầu) • Giá trị K-safety để thiết lập sự bền vững
Thiết lập cấu hình Cluster trong file cấu hình triển khai (deployment file). Định dạng là XML.
<?xml version="1.0"?> <deployment>
<cluster hostcount="n" sitesperhost="n" leader="ip-address" kfactor="n" /> </deployment>
2.5.1.1. Xác định số phân vùng cần sử dụng
Nhìn chung, số lượng phân vùng trên 1 node liên quan tới số bộ vi xử lý mà hệ thống có, giá trị tối ưu sấp xỉ 3/4 số bộ vi xử lý mà hệ điều hành support. Ví dụ, nếu sử dụng cluster là quad-core processors (nghĩa là, 8 cores per node), thì giá trị tối ưu sẽ là 6 hoặc 7 phân vùng trên node.
Đối với hệ thống hỗ trợ siêu phân luồng (số lượng core vật lý hỗ trợ gấp 2 số luồng), hệ điều hành sẽ thông báo gấp 2 số lượng core vật lý. Hay nói một cách khác,
một hệ thống dual quad-core system sẽ thông báo 16 virtual CPUs. Tuy nhiên, mỗi phân vùng sẽ không quá hiệu quả như trên hệ thống không siêu phân luồng. Do đó, giá trị tối ưu trong trường hợp này sẽ là từ 10 đến 12 trên node.
2.5.1.2. Cấu hình đƣờng dẫn cho tính năng thời gian chạy
Ngoài việc cấu hình số bộ xử lý trên mỗi node, file cấu hình triển khai cũng cho phép kích hoạt và cấu hình tính năng trong VoltDB (Export, automatic snapshots, và phát hiện phân mảnh mạng ).
Có thể chỉ ra các đường dẫn cụ thể cho mỗi tính năng hoặc chỉ ra thư mục gốc nơi VoltDB sẽ tạo các thư mục con cho mỗi tính năng khi cần thiết. Để chỉ ra thư mục gốc chung, sử dụng thẻ <voltdbroot>. Ví dụ : <paths> <voltdbroot path="/tmp" /> <snapshots path="/opt/voltdbsaves" /> </paths> 2.5.1.3. Thẩm định cấu hình phần cứng
Rất nhiều khía cạnh quan trọng của cấu hình phần cứng và hệ điều hành cần nhận thức trước khi chạy VoltDB:
• VoltDB có thể hoạt động trên hệ cluster không đồng nhất. Tuy nhiên, hiệu năng tốt nhất khi chạy Cluster với cùng kiến trúc vật lý : Kiểu vi xử lý, số lượng vi xử lý và bộ nhớ trên mỗi node là như nhau.
• Tất cả các node phải phân giải được địa chỉ IP và hostname của các node khác trên cluster.
• Phải chạy NTP trên tất cả các node để đồng bộ thời gian lẫn nhau, Nếu thời gian giữa các node lệch lớn hơn 100 milliseconds, VoltDB không thể khởi động.