Sự hoạt động của dữ liệu

Một phần của tài liệu Tính toán lưới trên Oracle (Trang 26 - 28)

Oracle RDBMS có nhiều file để lưu trữ các dữ liệu khác nhau, chẳng hạn như bảng dữ liệu, chỉ mục, dữ liệu làm lại,…và một số dạng thao tác như: INSERT, UPDATE, DELETE, và SELECT để thao tác với dữ liệu. Tùy thuộc vào tính chất của ứng dụng, những thao tác này có thể ảnh hưởng rất nhỏ hoặc rất lớn đến dữ liệu. Dựa vào cấu hình, dữ liệu có thể được lấy bằng cách sử dụng công nghệ truy vấn song song của Oracle. Khi dữ liệu được lấy ra, nó có thể là một chỉ mục có sẵn và Oracle sẽ tiến hành việc thu hồi chỉ mục này. Bây giờ, bên cạnh các hành động DML và câu lệnh SELECT, phương thức quản lý redo và undo của Oracle cũng khác nhau. Redo là mở lại bản ghi cuối, còn undo là một hành động INSERT.

Cở sở dữ liệu Oracle hỗ trợ một loạt các hành động truy cập dữ liệu, một trong số đó khá đơn giản, trong khi những hành động khác thì tương đối phức

tạp.Vấn đề đặt ra là thiết lập một hệ thống lưu trữ dễ dàng quản lý và có khả năng xử lý một loạt các yêu cầu truy cập dữ liệu.

2.7.4. SAME (Stripe and Mirror Everything)

Mục đích của cấu hình SAME là làm cho việc cấu hình và quản lý đĩa càng đơn giản càng tốt. Có 4 quy tắc quản lý:

- Chia tất cả các tập tin trên ổ đĩa bằng cách giới hạn dung lượng cho

phép là 1Mb: Ngoài những lợi ích chính thu được mà không phải di chuyển file

xung quanh cho các hàng đợi, các phân vùng file, các đoạn dữ liệu trên đĩa được cân bằng tải, loại bỏ, giảm thiểu các điểm nóng và cung cấp đầy đủ băng thông cho bất kỳ hoạt động nào. Loại bỏ các điểm nóng cải thiện thời gian xử lý bằng cách rút ngắn hàng đợi đĩa. Một dung lượng giới hạn 1Mb là tốt cho các truy cập tuần tự. Nếu như kích thước nhỏ hơn có thể làm tăng thời gian tìm kiếm và tăng thời gian truy xuất vào/ra.

- Cung cấp sự dư thừa trên đĩa bằng cách nhân đôi: Việc tạo một bản sao

của dữ liệu cung cấp cho hệ thống để tránh thất thoát dữ liệu khi ổ đĩa bị lỗi. Cách duy nhất để mất dữ liệu là tạo bản sao dự phòng khi các đĩa lỗi. Với công nghệ ngày nay, xác suất để các đĩa này lỗi là tương đối thấp.

- Vùng dữ liệu thường xuyên truy cập đặt trên nửa ngoài của đĩa: Các

sector ở bên ngoài có đường kính lớn có thể lưu trữ nhiều dữ liệu hơn so với các sector bên trong. Với những đĩa tốc độ cao có dung lượng lớn thì lưu trữ các dữ liệu thường xuyên sử dụng ở các sector bên ngoài, thậm chí các sector bên trong có thể bỏ trống hoặc có chứa dữ liệu ít phải sử dụng như dữ liệu sao lưu, các bản ghi lưu trữ…

- Tập hợp dữ liệu bằng các phân vùng: Cấu hình RAID trong các tập tin

được phân vùng trên nhiều đĩa. Các phân vùng hay các đoạn dữ liệu được tạo ra trên tất cả các đĩa, với vị trí logic tách biệt với các tập tin khác khi vị trí vật lý của chúng là giống nhau trên tất cả các đĩa.

các đĩa đã tồn tại với công nghệ hiện có. Ngay cả khi dùng phương pháp SAME thì việc thêm đĩa vào một nhóm đã tồn tại thì không hề dễ dàng, trừ phi nhóm đó được làm lại. Hiện tại, các nhóm đĩa sẽ cung cấp cơ sử dữ liệu hoặc bảng để thực hiện ở chế độ offline, dữ liệu được sao chép sang vùng lưu trữ thứ 2, các ổ đĩa sẽ được thêm vào và định dạng, dữ liệu sẽ phục hồi lại ở vị trí này. Với khối lượng dữ liệu lớn và thời gian chết yêu cầu thấp, thì điều này là không khả thi.

Một phần của tài liệu Tính toán lưới trên Oracle (Trang 26 - 28)