Tính tốn trong bộ nhớ (In-Memory Computing)

Một phần của tài liệu TÀI LIỆU THAM KHẢO Hệ thống hoạch định nguồn lực doanh nghiệp (ERP) 2250_011003 (Trang 175 - 176)

Cho đến gần đây, các hệ thống BI thường truy cập dữ liệu được lưu trữ trên các máy chủ kho dữ liệu, sử dụng công nghệ đĩa cứng để lưu trữ dữ liệu. Dữ liệu được lưu trữ trong máy chủ kho dữ liệu thường bao gồm dữ liệu tổng hợp từ hệ thống ERP hoặc các nguồn khác. Để tăng tốc độ truy cập vào dữ liệu này, dữ liệu trong kho dữ liệu được cấu trúc dưới dạng các khối dữ liệu đa chiều, cho phép phân tích các mối quan hệ trong dữ liệu một cách nhanh chóng. Ví dụ: một cơng ty có thể muốn xem xét doanh số bán hàng theo thời gian, theo cửa hàng và theo sản phẩm. Điều này có nghĩa là phân tích doanh số bán hàng theo ba chiều và dữ liệu bán hàng sẽ cần được cấu trúc như một khối lập phương ba chiều. Nếu công ty cũng quan tâm đến việc xem xét doanh số bán hàng này theo khu vực địa lý, thì cơng ty sẽ cần một khối dữ liệu bốn chiều.

Có hai thách thức chính khi sử dụng cấu trúc hình khối đa chiều. Đầu tiên, cần phải có một trình độ chuyên môn kỹ thuật đáng kể để xây dựng một khối lập phương, có nghĩa là một chuyên gia CNTT thay vì một người dùng cuối thường phải hồn thành nhiệm vụ này. Thứ hai, khối lập phương đa chiều là một cấu trúc nhất thiết hạn chế cách dữ liệu có thể được phân tích.

Cơng nghệ điện tốn trong bộ nhớ cho phép khách hàng phân tích một lượng lớn dữ liệu ngay lập tức. Mấu chốt của công nghệ này là dữ liệu được lưu trữ trong bộ nhớ máy tính chứ khơng phải trên máy chủ đĩa cứng. Thời gian cần thiết để truy cập dữ liệu từ bộ nhớ là một phần nhỏ thời gian cần thiết để truy cập dữ liệu từ đĩa cứng. Thước đo hiệu suất chính cho hệ thống lưu trữ dữ liệu là độ trễ, là thời gian từ khi yêu cầu dữ liệu

176 / 189 từ thiết bị lưu trữ đến khi dữ liệu được phân phối. Đối với lưu trữ trên đĩa cứng, độ trễ điển hình hiện là khoảng 13 mili giây. Đối với bộ nhớ, độ trễ là khoảng 83 nano giây.

Với sự khác biệt đáng kể về tốc độ, câu hỏi rõ ràng là tại sao các kho dữ liệu lại sử dụng bộ nhớ đĩa? Câu trả lời là dung lượng lưu trữ. Dung lượng lưu trữ trên đĩa cứng hiện được đo bằng terabyte, trong khi dung lượng tối đa của chip nhớ vẫn tính bằng gigabyte nên đĩa cứng có thể lưu trữ dữ liệu nhiều hơn một nghìn lần so với bộ nhớ với một chi phí tương đương. Trong khi đĩa cứng có thể lưu trữ nhiều dữ liệu hơn đáng kể so với chip nhớ, chi phí và dung lượng của bộ nhớ trong máy tính đã đạt đến mức mà BI trong bộ nhớ đang trở nên khả thi hơn.

Nén dữ liệu là một công nghệ khác giúp BI trong bộ nhớ khả thi. Bằng cách lưu trữ dữ liệu dưới dạng cột chứ khơng phải hàng, hệ thống trong bộ nhớ có thể giảm kích thước của dữ liệu bằng cách loại bỏ số lượng lớn các giá trị trống hoặc 0 bằng cách chỉ ghi nhận vị trí của chúng trong bảng. Với tính năng nén dữ liệu được cung cấp bởi lưu trữ cột, giờ đây việc lưu trữ khối lượng lớn dữ liệu trong bộ nhớ mà không cần tổng hợp là hồn tồn khả thi. Điều này có nghĩa là khơng bắt buộc phải có hình khối đa chiều. Người dùng cuối có thể phân tích dữ liệu BI “nhanh chóng” mà khơng cần chuyên gia CNTT để dịch dữ liệu thành các khối đa chiều.

Cả hai giải pháp tính tốn trong bộ nhớ của SAP và Oracle đều được thiết kế để phân tích dữ liệu lớn. Dữ liệu lớn đề cập đến lượng dữ liệu khổng lồ hiện có sẵn để sử dụng BI từ tất cả các nguồn sẵn có, bao gồm hệ thống ERP, các trang web, cơ sở dữ liệu công ty, nghiên cứu khoa học, Twitter và các ứng dụng mạng xã hội khác. Dữ liệu lớn cần tính tốn nhanh để có thể sử dụng được và tính tốn trong bộ nhớ cho phép xử lý nhanh chóng. Các thiết kế chip mới như chip làm từ carbon chứ không phải silicon, có thể là câu trả lời cho việc tạo ra những cỗ máy thậm chí cịn nhanh hơn.

Một phần của tài liệu TÀI LIỆU THAM KHẢO Hệ thống hoạch định nguồn lực doanh nghiệp (ERP) 2250_011003 (Trang 175 - 176)

Tải bản đầy đủ (PDF)

(189 trang)