BÀI 3 THIẾT KẾ CƠ SỞ DỮ LIỆU BÀI 3 HỆ THỐNG THÔNG TIN QUẢN LÝ THIẾT KẾ CƠ SỞ DỮ LIỆU 1 TÌNH HUỐNG DẪN NHẬP HỆ THỐNG THÔNG TIN QUẢN LÝ 2 • EBay có khoảng 6,5 petabytes dữ liệu, chạy trên Greenplum và một 2,5 petabytes dữ liệu kinh doanh trong một data warehouse chạy Teradata Greenplum là một hệ thống CSDL song song khổng lồ (MPP DBMS hay massively parallel processing DBMS) dựa trên nền PostgreSQL Gần đây Greenplum còn thêm vào các mở rộng dựa trên MapReduce Bài tới chúng ta sẽ tìm hiểu về MapRedu.
BÀI THIẾT KẾ CƠ SỞ DỮ LIỆU HỆ THỐNG THƠNG TIN QUẢN LÝ TÌNH HUỐNG DẪN NHẬP • EBay có khoảng 6,5 petabytes liệu, chạy Greenplum 2,5 petabytes liệu kinh doanh data warehouse chạy Teradata Greenplum hệ thống CSDL song song khổng lồ (MPP-DBMS hay massively parallel processing DBMS) dựa PostgreSQL Gần Greenplum thêm vào mở rộng dựa MapReduce Bài tới tìm hiểu MapReduce Teradata MPP-DBMS khác • Facebook có datawarehouse cỡ 2,5 petabytes chạy Hadoop/Hive Hadoop implementation MapReduce • Wal-Mart, Bank of America, cơng ty dịch vụ tài khác, Dell có CSDL lớn chạy chạy Teradata • CSDL chứa web/network events Yahoo chạy hệ thống họ tự phát triển, có lẽ khoảng 1/6 kích thước hệ thống Greenplum eBay Vậy database gì? Ứng dụng làm để xây dựng quản lý hệ thống sở liệu? HỆ THỐNG THÔNG TIN QUẢN LÝ MỤC TIÊU BÀI HỌC Học viên cần nắm rõ vấn đề về: Tệp sở liệu; Mơ hình sở dữliệu; Thiết kế sở dữliệu; Kỹ thuật thiết kế; Các dạng sở liệu HỆ THỐNG THÔNG TIN QUẢN LÝ HƯỚNG DẪN HỌC • Học viên tham khảo số tài liệu Hệ quản trị sở liệu, là: ➢ Các giáo trình hệ quản trị sở liệu SQL, Oracle, Access; ➢ Các giáo trình phân tích thiết kế hệ thống thơng tin • Thảo luận với giảng viên HỆ THỐNG THÔNG TIN QUẢN LÝ NỘI DUNG Tệp sở liệu; Mơ hình sở liệu; Thiết kế sở liệu; Kỹ thuật thiết kế sở liệu HỆ THỐNG THÔNG TIN QUẢN LÝ TỆP VÀ CƠ SỞ DỮ LIỆU HỆ THỐNG THÔNG TIN QUẢN LÝ TỆP VÀ CƠ SỞ DỮ LIỆU • Tệp hệ thống tệp liệu; • Hệ thống quản lý sở liệu HỆ THỐNG THÔNG TIN QUẢN LÝ TỆP VÀ CƠ SỞ DỮ LIỆU 1.1 TỆP VÀ HỆ THỐNG TỆP DỮ LIỆU • • • • Thơng tin ghi lại tệp tin máy tính Các phần mềm giúp cho việc lấy thông tin, tổng hợp phân tích thơng tin xác, dễ dàng, nhanh hiệu Hệ thống tệp tập hợp tệp liệu có mối liên hệ với Một số thuật ngữ ➢ Dữ liệu: Là kiện thực tế tổ chức lưu máy tính ➢ Trường: Là một nhóm ký tự sử dụng để làm tiêu đề cho ➢ nhóm liệu lưu lại ➢ Biểu ghi: Một tập trường liên kết lại với liên quan tới người, nơi chốn, vật kiện ➢ Tệp: Một nhiều biểu ghi ghi theo tiêu chuẩn thống nghĩa tổ chức theo số trường định HỆ THỐNG THÔNG TIN QUẢN LÝ TỆP VÀ CƠ SỞ DỮ LIỆU 1.2 HỆ THỐNG QUẢN LÝ CƠ SỞ DỮ LIỆU Phòng nhân Phòng bán hàng Cơ sở liệu Hệ thống quản lý sở liệu Phịng kế tốn HỒ SƠ NHÂN SỰ HỒ SƠ KHÁCH HÀNG CSDL BÁN HÀNG HỆ THỐNG HÀNG TỒN KHO HỆ THỐNG TÀI KHOẢN Hệ thống sở liệu Phòng nhân Hồ sơ nhân Hồ sơ khách hàng Phòng bán hàng CSDL bán hàng Hệ thống hàng tồnkho Phịng kế tốn Hệ thống tài khoản Hệ thống tệp HỆ THỐNG THÔNG TIN QUẢN LÝ TỆP VÀ CƠ SỞ DỮ LIỆU 1.2 HỆ THỐNG QUẢN LÝ CƠ SỞ DỮ LIỆU Thành phần hệ thống quản lý liệu: • Ngơn ngữ định nghĩa liệu: Là ngơn ngữ thức mà lập trình viên sử dụng để định nội Ngôn ngữ định nghĩa dữliệu dung cấu trúc liệu • Ngơn ngữ xử lý liệu: Là ngôn ngữ chuyên dụng kết hợp với ngơn ngữ lập trình ứng dụng thơng Ngơn ngữ xử lý liệu thường khác để xử lý liệu sở liệu • Từ điển liệu: Là tệp tin viết tay tự Từ điển liệu động chứa định nghĩa phần tử liệu đặc điểm liệu cách sử dụng, trình bày vật lý, quyền sở hữu, giấy phép tính bảo mật HỆ THỐNG THƠNG TIN QUẢN LÝ 10 THIẾT KẾ CƠ SỞ DỮ LIỆU 3.2 CHU KỲ PHÁT TRIỂN CƠ SỞ DỮ LIỆU 3.2.6 DUY TRÌ VÀ PHÁT TRIỂN CƠ SỞ DỮ LIỆU Hoạt động trì sở liệu bao gồm: • Bảo quản phịng ngừa; • Bảo quản để hiệu chỉnh; • Bảo quản để thích ứng; • Bảo quản việc cho phép truy cập liệu cho • người sử dụng cũ mới; • Tạo báo cáo thống kê liệu truy cập để tăng tính hiệu ứng dụng, điều khiển việc vận hành; • Lập tóm tắt sử dụng hệ thống giai đoạn HỆ THỐNG THÔNG TIN QUẢN LÝ 35 THIẾT KẾ CƠ SỞ DỮ LIỆU 3.3 CÁC YÊU CẦU ĐỐI VỚI NHÀ QUẢN TRỊ CƠ SỞ DỮ LIỆU • Quản trị sở liệu: Nguyên tắc quản trị sở liệu phải coi Công nghệ quản lý CSDL liệu tài sản doanh nghiệp Do vậy, cần đề sách chia sẻ, phổ biến, tiếp nhận, chuẩn hóa, phân loại lưu trữ thông tin xuyên Quản trị liệu Hệ thống quản lý sở liệu Người sử dụng suốt doanh nghiệp; • Hoạch định liệu phương pháp luận nhằm xác định thực thể cốt yếu, thuộc tính mối quan hệ cấu Hoạch định thiết kế thành nên liệu HỆ THỐNG THÔNG TIN QUẢN LÝ 36 KỸ THUẬT THIẾT KẾ CƠ SỞ DỮ LIỆU HỆ THỐNG THÔNG TIN QUẢN LÝ 37 KỸ THUẬT THIẾT KẾ CƠ SỞ DỮ LIỆU • Kỹ thuật khách chủ; • Kho liệu khai phá liệu; • Liên kết công nghệ website với siêu sở liệu; • Các dạng sở liệu thường gặp HỆ THỐNG THÔNG TIN QUẢN LÝ 38 KỸ THUẬT THIẾT KẾ CƠ SỞ DỮ LIỆU 4.1 KỸ THUẬT KHÁCH/CHỦ Yêu cầu trình xử lý liệu theo kỹ thuật khách/chủ: • Máy chủ máy khách phải có khả truyền thơng với nhau; • Máy khách chủ động tạo thiết lập đường chuyền tới máy chủ; • Máy chủ phải có đủ liệu dịch vụ nhằm đáp ứng yêu cầu máy khách có khả giao quyền tới cho máy khách HỆ THỐNG THÔNG TIN QUẢN LÝ 39 KỸ THUẬT THIẾT KẾ CƠ SỞ DỮ LIỆU 4.1 KỸ THUẬT KHÁCH/CHỦ • Ưu điểm: ➢ Chi phí thấp; ➢ Giảm nhu cầu máy tính có nhớ lớn; ➢ Tăng bảo vệ cho việc kiểm tra tích hợp cân đối liệu; ➢ Giảm thời gian phí tổn sử dụng phần mềm; ➢ Giảm thời gian đáp ứng yêu cầu, tối ưu hóa nguồn lực mạng; ➢ Nâng cao tính linh hoạt • Nhược điểm: ➢ Giải pháp mang tính phịng ban; ➢ Các ứng dụng máy tính linh hoạt; ➢ Cơng nghệ ứng dụng khó hốn chuyển cho HỆ THỐNG THÔNG TIN QUẢN LÝ 40 KỸ THUẬT THIẾT KẾ CƠ SỞ DỮ LIỆU 4.2 KHO DỮ LIỆU VÀ KHAI PHÁ DỮ LIỆU • Kho liệu (data warehouse); • Khai phá liệu (datamining) HỆ THỐNG THÔNG TIN QUẢN LÝ 41 KỸ THUẬT THIẾT KẾ CƠ SỞ DỮ LIỆU 4.2 KHO DỮ LIỆU VÀ KHAI PHÁ DỮ LIỆU 4.2.1 KHO DỮ LIỆU (DATA WAREHOUSE) • Là sở liệu, với công cụ báo cáo, truy vấn, lưu trữ liệu thời trước lĩnh vực cơng ty mà nhà quản lý quan tâm • Dữ liệu tập hợp, chuẩn hóa, hợp để phục vụ phân tích định doanh nghiệp HỆ THỐNG THÔNG TIN QUẢN LÝ 42 KỸ THUẬT THIẾT KẾ CƠ SỞ DỮ LIỆU 4.2 KHO DỮ LIỆU VÀ KHAI PHÁ DỮ LIỆU 4.2.2 KHAI PHÁ DỮ LIỆU (DATAMINING) Là kho liệu cung cấp loạt công cụ truy vấn, phân tích HỆ THỐNG THƠNG TIN QUẢN LÝ 43 KỸ THUẬT THIẾT KẾ CƠ SỞ DỮ LIỆU 4.3 LIÊN KẾT CƠNG NGHỆ WEBSITE VỚI CÁC SIÊU CSDL • Là xu cho hệ thống quản lý đại Dễ sử dụng khơng địi hỏi sở liệu nội thay đổi, có hiệu tốn so với tái thiết lập hệ thống để tăng khả truy cập • Phương thức làm việc: lấy nội dung từ CSDL hiển thị lên trang web trình duyệt • Thành phần: máy chủ CSDL, máy chủ ứng dụng, máy trạm truy cập vào máy chủ CSDL HỆ THỐNG THÔNG TIN QUẢN LÝ 44 KỸ THUẬT THIẾT KẾ CƠ SỞ DỮ LIỆU 4.4 CÁC DẠNG CƠ SỞ DỮ LIỆU THƯỜNG GẶP • Cơ sở liệu dạng file: Dữ liệu lưu trữ dạng file text, ascii, *.dbf Tiêu biểu cho sở liệu dạng file *.mbd Foxpro; • Cơ sở liệu quan hệ: Dữ liệu lưu trữ bảng liệu gọi thực thể, thực thể có mối liên hệ với gọi quan hệ, quan hệ có thuộc tính, có thuộc tính khóa Các hệ quản trị hỗ trợ sở liệu quan hệ như: MS SQL server, Oracle, MySQL • Cơ sở liệu hướng đối tượng: Dữ liệu lưu trữ bảng liệu bảng có bổ sung thêm tính hướng đối tượng lưu trữ thêm hành vi, nhằm thể hành vi đối tượng Mỗi bảng xem lớp liệu, dòng liệu bảng đối tượng Các hệ quản trị có hỗ trợ sở liệu quan hệ như: MS SQL server, Oracle, Postgres HỆ THỐNG THÔNG TIN QUẢN LÝ 45 KỸ THUẬT THIẾT KẾ CƠ SỞ DỮ LIỆU 4.4 CÁC DẠNG CƠ SỞ DỮ LIỆU THƯỜNG GẶP • Cơ sở liệu bán cấu trúc: Dữ liệu lưu dạng XML, với định dạng thông tin mô tả đối tượng thể tag Đây sở liệu có nhiều ưu điểm lưu trữ hầu hết loại liệu khác nên sở liệu bán cấu trúc hướng nghiên cứu ứng dụng; • Cơ sở liệu tập trung; • Cơ sở liệu phân tán: Hệ quản trị cần phải đảm bảo thống vẹn toàn liệu, đảm bảo việc truy xuất liệu CSDL HỆ THỐNG THƠNG TIN QUẢN LÝ 46 TĨM LƯỢC CUỐI BÀI • Bài học trình bày nội dung về: ➢ Các khái niệm sở liệu; ➢ Mơ hình sở liệu; ➢ Thiết kế sở liệu; ➢ Kỹ thuật thiết kế sở liệu dạng sở liệu thông dụng HỆ THỐNG THÔNG TIN QUẢN LÝ 47 CÂU HỎI THẢO LUẬN Câu 1: Cơ sở liệu gì? HỆ THỐNG THÔNG TIN QUẢN LÝ 48 CÂU HỎI THẢO LUẬN Câu 2: Các mơ hình sở liệu thường gặp? HỆ THỐNG THÔNG TIN QUẢN LÝ 49 ... THƠNG TIN QUẢN LÝ Cơ sở liệu chung 30 THIẾT KẾ CƠ SỞ DỮ LIỆU 3. 2 CHU KỲ PHÁT TRIỂN CƠ SỞ DỮ LIỆU 3. 2.2 QUÁ TRÌNH THIẾT KẾ CƠ SỞ DỮ LIỆU Quá trình thiết kế sở liệu: Phân tích liệu nhu cầu Mơ hình... Tệp sở liệu; Mơ hình sở liệu; Thiết kế sở liệu; Kỹ thuật thiết kế sở liệu HỆ THỐNG THÔNG TIN QUẢN LÝ TỆP VÀ CƠ SỞ DỮ LIỆU HỆ THỐNG THÔNG TIN QUẢN LÝ TỆP VÀ CƠ SỞ DỮ LIỆU • Tệp hệ thống tệp liệu; ... Kiểm tra mơ hình liệu Lựa chọn phần mềm quản lý sở liệu Thiết kế logic Thiết kế vật lý HỆ THỐNG THÔNG TIN QUẢN LÝ 31 THIẾT KẾ CƠ SỞ DỮ LIỆU 3. 2 CHU KỲ PHÁT TRIỂN CƠ SỞ DỮ LIỆU 3. 2 .3 THỰC HIỆN •