Bài giảng Hệ thống thông tin quản lý - Bài 3: Thiết kế cơ sở dữ liệu được biên soạn với các nội dung tệp và cơ sở dữ liệu; mô hình cơ sở dữ liệu; thiết kế cơ sở dữ liệu; kỹ thuật thiết kế; các dạng cơ sở dữ liệu.
BÀI 3: THIẾT KẾ CƠ SỞ DỮ LIỆU Giảng viên: Ths Trần Quang Diệu v0.1 TÌNH HUỐNG DẪN NHẬP • EBay có khoảng 6,5 petabytes liệu, chạy Greenplum 2,5 petabytes liệu kinh doanh data warehouse chạy Teradata Greenplum hệ thống CSDL song song khổng lồ (MPP-DBMS hay massively parallel processing DBMS) dựa PostgreSQL Gần Greenplum thêm vào mở rộng dựa MapReduce Bài tới tìm hiểu MapReduce Teradata MPP-DBMS khác • Facebook có datawarehouse cỡ 2,5 petabytes chạy Hadoop/Hive Hadoop implementation MapReduce • Wal-Mart, Bank of America, cơng ty dịch vụ tài khác, Dell có CSDL lớn chạy chạy Teradata • CSDL chứa web/network events Yahoo chạy hệ thống họ tự phát triển, có lẽ khoảng 1/6 kích thước hệ thống Greenplum eBay v0.1 Vậy database gì? Ứng dụng làm để xây dựng quản lý hệ thống sở liệu? MỤC TIÊU BÀI HỌC Học viên cần nắm rõ vấn đề về: Tệp sở liệu; Mô hình sở liệu; Thiết kế sở liệu; Kỹ thuật thiết kế; Các dạng sở liệu v0.1 HƯỚNG DẪN HỌC • Học viên tham khảo số tài liệu Hệ quản trị sở liệu, là: Các giáo trình hệ quản trị sở liệu SQL, Oracle, Access; Các giáo trình phân tích thiết kế hệ thống thơng tin • v0.1 Thảo luận với giảng viên NỘI DUNG Tệp sở liệu; Mơ hình sở liệu; Thiết kế sở liệu; Kỹ thuật thiết kế sở liệu v0.1 TỆP VÀ CƠ SỞ DỮ LIỆU • Tệp hệ thống tệp liệu; • Hệ thống quản lý sở liệu v0.1 1.1 TỆP VÀ HỆ THỐNG TỆP DỮ LIỆU • Thơng tin ghi lại tệp tin máy tính Các phần mềm giúp cho việc lấy thông tin, tổng hợp phân tích thơng tin xác, dễ dàng, nhanh hiệu • Hệ thống tệp tập hợp tệp liệu có mối liên hệ với • Một số thuật ngữ Dữ liệu: Là kiện thực tế tổ chức lưu máy tính Trường: Là một nhóm ký tự sử dụng để làm tiêu đề cho nhóm liệu lưu lại Biểu ghi: Một tập trường liên kết lại với liên quan tới người, nơi chốn, vật kiện Tệp: Một nhiều biểu ghi ghi theo tiêu chuẩn thống nghĩa tổ chức theo số trường định v0.1 1.2 HỆ THỐNG QUẢN LÝ CƠ SỞ DỮ LIỆU Cơ sở liệu Phòng nhân Phòng bán hàng Hệ thống quản lý sở liệu Phịng kế tốn HỒ SƠ NHÂN SỰ HỒ SƠ KHÁCH HÀNG CSDL BÁN HÀNG HỆ THỐNG HÀNG TỒN KHO HỆ THỐNG TÀI KHOẢN Hệ thống sở liệu Hồ sơ nhân Phòng nhân Hồ sơ khách hàng Phòng bán hàng CSDL bán hàng Hệ thống hàng tồn kho Phòng kế toán Hệ thống tài khoản Hệ thống tệp v0.1 1.2 HỆ THỐNG QUẢN LÝ CƠ SỞ DỮ LIỆU (TIẾP THEO) Thành phần hệ thống quản lý liệu: • Ngơn ngữ định nghĩa liệu: Là ngơn ngữ thức mà lập trình viên sử dụng để định nội dung cấu trúc liệu • Ngôn ngữ xử lý liệu: Là ngôn ngữ chuyên dụng kết hợp với ngơn ngữ lập trình ứng dụng thông thường khác để xử lý liệu sở liệu • Từ điển liệu: Là tệp tin viết tay tự động chứa định nghĩa phần tử liệu đặc điểm liệu cách sử dụng, trình bày vật lý, quyền sở hữu, giấy phép tính bảo mật Ngơn ngữ định nghĩa liệu Ngôn ngữ xử lý liệu Từ điển liệu v0.1 1.2 HỆ THỐNG QUẢN LÝ CƠ SỞ DỮ LIỆU (TIẾP THEO) Chức hệ quản lý sở liệu: v0.1 • Thiết lập từ điển sở liệu; • Quản lý việc lưu trữ liệu; • Chuyển đổi hiển thị thơng tin; • Bảo đảm độ an tồn liệu; • Khơi phục lại liệu; • Tính tồn vẹn liệu; • Giao diện sở viễn thông sở liệu 10 MƠ HÌNH CƠ SỞ DỮ LIỆU • Các loại mơ hình sở liệu; Mơ hình khái niệm; Mơ hình thực • Mơ hình sở liệu: Là tập hợp cấu trúc logic sử dụng để diễn tả cấu trúc liệu mối quan hệ liệu tìm thấy sở liệu 11 v0.1 2.1 MƠ HÌNH KHÁI NIỆM • Mơ hình khái niệm tập trung vào chất logic việc biểu diễn liệu • Bao gồm dạng quan hệ mơ tả liên hệ liệu: Quan hệ – một; Quan hệ – nhiều; Quan hệ nhiều – nhiều v0.1 12 2.1.1 MƠ HÌNH MỘT – MỘT Mơ hình – một: Là mối quan hệ Ổ khóa tồn hai thực thể Từ thực thể có đường dẫn tới thực thể ngược lại Chìa khóa Một – 13 v0.1 2.1.2 MƠ HÌNH MỘT – NHIỀU Mơ hình – nhiều: Là mối quan hệ mà từ Khách hàng gốc tới nhiều điểm mới, điểm có gốc Đơn đặt hàng Một – nhiều v0.1 14 2.1.3 MƠ HÌNH NHIỀU – NHIỀU Mơ hình nhiều – nhiều: Là dạng quan hệ mà gốc có quan hệ đa phương Sinh viên Môn học Nhiều – nhiều 15 v0.1 2.2 MƠ HÌNH THỰC HIỆN • Chỉ quan tâm tới vấn đề làm để biểu diễn liệu sở liệu • Các loại mơ hình thực hiện: Mơ hình sở liệu thứ bậc; Mơ hình sở liệu mạng; Mơ hình sở liệu quan hệ v0.1 16 2.2.1 MƠ HÌNH CƠ SỞ DỮ LIỆU THỨ BẬC Mơ hình sở liệu thứ bậc: • Tạo lập nên sở cho phát triển mơ hình sở liệu khác sau • Ra đời năm 1969 nhằm giải vấn đề trùng lặp liệu hệ thống; • Được coi mơ hình có tính thương mại dành cho sở liệu lớn; • Cấu trúc bản: A Tầng gốc B Tầng thứ Tầng thứ D Tầng thứ I C E F J G H K 17 v0.1 2.2.1 MƠ HÌNH CƠ SỞ DỮ LIỆU THỨ BẬC (TIẾP THEO) • Nhược điểm: Việc thiết kế phức tạp; Khó áp dụng cho thực thể có mối quan hệ nhiều nhiều; Phức tạp, khó quản lý linh hoạt; Địi hỏi hiểu biết sâu liệu người lập trình • Ưu điểm: Đảm bảo độ an toàn liệu; Đảm bảo tính độc lập liệu, làm tăng tính hiệu chương trình xử lý; Phù hợp với sở liệu chứa số lượng lớn liệu có quan hệ – nhiều cố định thời gian dài; Cơ sở liệu thiết lập từ đầu lớn giúp người lập trình thiết lập chương trình cách có hiệu Tính ứng dụng doanh nghiệp cao v0.1 A B D E C F G 18 2.2.2 MƠ HÌNH CƠ SỞ DỮ LIỆU MẠNG Mơ hình sở liệu mạng: • Được thiết lập để biểu thị liệu có mối quan hệ phức tạp; • Hỗ trợ cho việc thiết lập sở liệu lập trình tạo chương trình ứng dụng sở liệu; • Cấu trúc như: Phịng bán hàng Sản phẩm Khách hàng Đơn đặt hàng Chi trả Chuỗi đơn đặt hàng 19 v0.1 2.2.2 MƠ HÌNH CƠ SỞ DỮ LIỆU MẠNG (TIẾP THEO) • • v0.1 Ưu điểm: Mối quan hệ nhiều – nhiều biểu diễn dễ dàng hơn; Phòng bán Khách Việc truy cập độ linh hoạt cao hàng hàng sở liệu thứ bậc; Nâng cao tính bảo tồn liệu; Đơn đặt Đảm bảo tính độc lập liệu Sản phẩm Chi trả hàng cách cao Nhược điểm: Khó thiết kế sử dụng; Chuỗi đơn Khó thay đổi sở liệu; đặt hàng Việc lập trình trở nên phức tạp hơn; Việc truy cập sở liệu thực theo dịng thống nhất; mơ hình tạo hệ thống không thân thiện với người sử dụng 20 10 2.2.3 MƠ HÌNH CƠ SỞ DỮ LIỆU QUAN HỆ • Được phát minh E.F.Codd vào năm 1970 • Được tạo nhờ thuật toán tự động, bước ngoặt cho cách mạng sở liệu • Cấu trúc bản: Được thực thông qua hệ thống sở liệu quan hệ; Là tập hợp bảng biểu lưu trữ liệu; Mỗi bảng ma trận gồm chuỗi hàng cột giao nhau; Các bảng biểu có mối quan hệ, liên kết với tính chất chung Bảng: Khách hàng TT khách hàng Tên khách hàng Số TT đại lý chung Số điện thoại TT đại lý Bảng: Đại lý TT đại lý Tên đại lý 100123 Nguyễn Văn H 8615121 1435 1121 Phùng K 100124 Hà Thị M 8903133 1121 1258 Lê Quang 100125 Lê Thị D 8615823 1258 1435 Tạ Thu H 100126 Nguyễn Đức T 8901889 1435 100127 Phạn Thị M 8901511 1435 21 v0.1 2.2.3 MƠ HÌNH CƠ SỞ DỮ LIỆU QUAN HỆ (TIẾP THEO) • Ưu điểm: Là kho liệu riêng biệt; Tính độc lập cấu trúc cao; Giải phóng mối bận tâm mối quan hệ khía cạnh vật lý sở liệu; Khả linh hoạt cao, dễ đưa giao diện thích hợp với người sử dụng • v0.1 Nhược điểm: địi hỏi hệ thống máy tính mạnh mẽ hỗ trợ sở liệu che hết toàn cấu trúc vật lý sở liệu 22 11 THIẾT KẾ CƠ SỞ DỮ LIỆU • Chuyển đổi thơng tin; • Chu kỳ phát triển sở liệu; • Các yêu cầu nhà quản trị sở liệu 23 v0.1 3.1 CHUYỂN ĐỔI THƠNG TIN • Dữ liệu tất xuất cách tự nhiên sống • Dữ liệu thu thập lưu trữ hệ sở liệu • Để sử dụng người ta cần chuyển đổi liệu thành thông tin cần thiết v0.1 24 12 3.2 CHU KỲ PHÁT TRIỂN CƠ SỞ DỮ LIỆU Nghiên cứu ban đầu sở liệu Thiết kế sở liệu Thực Kiểm tra đánh giá Vận hành sở liệu Duy trì phát triển sở liệu 25 v0.1 3.2.1 NGHIÊN CỨU BAN ĐẦU VỀ CƠ SỞ DỮ LIỆU Phân tích tình trạng doanh nghiệp Mục tiêu doanh nghiệp v0.1 Quá trình điều hành doanh nghiệp Cấu trúc tổ chức doanh nghiệp 26 13 3.2.2 QUÁ TRÌNH THIẾT KẾ CƠ SỞ DỮ LIỆU Các quan điểm tính chất liệu: Quan điểm doanh nghiệp: Doanh nghiệp Vấn đề tồn gì? Giải pháp Đơn vị kinh doanh Đơn vị kinh doanh Đơn vị kinh doanh Thông tin cần để thực giải pháp Dữ liệu cần có để tạo thông tin Phân phối thông tin Quan điểm người thiêt kế: Dữ liệu cần phải tổ chức nào? Cơ sở liệu chung Dữ liệu truy cập nào? Làm để chuyển liệu thành thông tin? 27 v0.1 3.2.2 QUÁ TRÌNH THIẾT KẾ CƠ SỞ DỮ LIỆU (TIẾP THEO) Quá trình thiết kế sở liệu: Phân tích liệu nhu cầu Mơ hình hóa chuẩn hóa mối quan hệ thực thể Kiểm tra mơ hình liệu Lựa chọn phần mềm quản lý sở liệu Thiết kế logic Thiết kế vật lý v0.1 28 14 3.2.3 THỰC HIỆN • • Là giai đoạn giai đoạn thiết kế sở liệu chức năng: Đưa liệu vào sở liệu Những điều cần lưu ý: Thực hiện: Hệ quản trị không lưu hết tất thao tác công cụ điều khiển việc thực chương trình Độ an tồn: Dữ liệu phải ngăn chặn không bị sử dụng người khơng có quyền hạn Độ an tồn vật lý; Bảo vệ mã khóa; Quyền truy nhập… Khôi phục liệu… 29 v0.1 3.2.4 KIỂM TRA VÀ ĐÁNH GIÁ • Dữ liệu hệ quản trị kiểm tra khả thực tính tồn vẹn, khả truy cập đồng thời, độ an tồn • Các cách khắc phục liệu bị lỗi không đạt tiêu chuẩn đánh giá: Lỗi xảy trình thưc hiện: Xác định hệ thống điều chỉnh đúng; Các tham số cấu hình hệ CSDL Sửa chữa thiết kế vật lý; Sửa chữa thiết kế logic; Cập nhật thay đổi phần mềm quản lý hệ thống phần cứng v0.1 30 15 3.2.5 VẬN HÀNH CƠ SỞ DỮ LIỆU • Được thực sau CSDL qua bước đánh giá • Người sử dụng bắt đầu tham gia vào trình truy cập liệu để kiểm tra chương trình ứng dụng • Những sai sót bộc lộ có ảnh hưởng nghiêm trọng sửa chữa nâng cấp giai đoạn trì phát triển 31 v0.1 3.2.6 DUY TRÌ VÀ PHÁT TRIỂN CƠ SỞ DỮ LIỆU Hoạt động trì sở liệu bao gồm: • Bảo quản phịng ngừa; • Bảo quản để hiệu chỉnh; • Bảo quản để thích ứng; • Bảo quản việc cho phép truy cập liệu cho người sử dụng cũ mới; • Tạo báo cáo thống kê liệu truy cập để tăng tính hiệu ứng dụng, điều khiển việc vận hành; • Lập tóm tắt sử dụng hệ thống giai đoạn v0.1 32 16 3.3 CÁC YÊU CẦU ĐỐI VỚI NHÀ QUẢN TRỊ CƠ SỞ DỮ LIỆU • Quản trị sở liệu: Nguyên tắc quản trị sở liệu phải coi liệu tài sản doanh nghiệp Do vậy, cần đề sách chia sẻ, phổ biến, tiếp nhận, chuẩn hóa, phân loại lưu trữ thơng tin xun suốt doanh nghiệp; • Hoạch định liệu phương pháp luận nhằm xác định thực thể cốt yếu, thuộc tính mối quan hệ cấu thành nên liệu 33 v0.1 KỸ THUẬT THIẾT KẾ CƠ SỞ DỮ LIỆU • Kỹ thuật khách chủ; • Kho liệu khai phá liệu; • Liên kết công nghệ website với siêu sở liệu; • Các dạng sở liệu thường gặp v0.1 34 17 4.1 KỸ THUẬT KHÁCH/CHỦ Yêu cầu trình xử lý liệu theo kỹ thuật khách/chủ: • Máy chủ máy khách phải có khả truyền thơng với nhau; • Máy khách chủ động tạo thiết lập đường chuyền tới máy chủ; • Máy chủ phải có đủ liệu dịch vụ nhằm đáp ứng yêu cầu máy khách có khả giao quyền tới cho máy khách 35 v0.1 4.1 KỸ THUẬT KHÁCH/CHỦ (TIẾP THEO) • • v0.1 Ưu điểm: Chi phí thấp; Giảm nhu cầu máy tính có nhớ lớn; Tăng bảo vệ cho việc kiểm tra tích hợp cân đối liệu; Giảm thời gian phí tổn sử dụng phần mềm; Giảm thời gian đáp ứng yêu cầu, tối ưu hóa nguồn lực mạng; Nâng cao tính linh hoạt Nhược điểm: Giải pháp mang tính phịng ban; Các ứng dụng máy tính linh hoạt; Cơng nghệ ứng dụng khó hoán chuyển cho 36 18 4.2 KHO DỮ LIỆU VÀ KHAI PHÁ DỮ LIỆU • Kho liệu (data warehouse); • Khai phá liệu (datamining) 37 v0.1 4.2.1 KHO DỮ LIỆU (DATA WAREHOUSE) • Là sở liệu, với công cụ báo cáo, truy vấn, lưu trữ liệu thời trước lĩnh vực công ty mà nhà quản lý quan tâm • Dữ liệu tập hợp, chuẩn hóa, hợp để phục vụ phân tích định doanh nghiệp v0.1 38 19 4.2.2 KHAI PHÁ DỮ LIỆU (DATAMINING) Là kho liệu cung cấp loạt cơng cụ truy vấn, phân tích 39 v0.1 4.3 LIÊN KẾT CÔNG NGHỆ WEBSITE VỚI CÁC SIÊU CSDL • Là xu cho hệ thống quản lý đại Dễ sử dụng khơng địi hỏi sở liệu nội thay đổi, có hiệu tốn so với tái thiết lập hệ thống để tăng khả truy cập • Phương thức làm việc: lấy nội dung từ CSDL hiển thị lên trang web trình duyệt • Thành phần: máy chủ CSDL, máy chủ ứng dụng, máy trạm truy cập vào máy chủ CSDL v0.1 40 20 4.4 CÁC DẠNG CƠ SỞ DỮ LIỆU THƯỜNG GẶP • Cơ sở liệu dạng file: Dữ liệu lưu trữ dạng file text, ascii, *.dbf Tiêu biểu cho sở liệu dạng file *.mbd Foxpro; • Cơ sở liệu quan hệ: Dữ liệu lưu trữ bảng liệu gọi thực thể, thực thể có mối liên hệ với gọi quan hệ, quan hệ có thuộc tính, có thuộc tính khóa Các hệ quản trị hỗ trợ sở liệu quan hệ như: MS SQL server, Oracle, MySQL • Cơ sở liệu hướng đối tượng: Dữ liệu lưu trữ bảng liệu bảng có bổ sung thêm tính hướng đối tượng lưu trữ thêm hành vi, nhằm thể hành vi đối tượng Mỗi bảng xem lớp liệu, dòng liệu bảng đối tượng Các hệ quản trị có hỗ trợ sở liệu quan hệ như: MS SQL server, Oracle, Postgres 41 v0.1 4.4 CÁC DẠNG CƠ SỞ DỮ LIỆU THƯỜNG GẶP (TIẾP THEO) • Cơ sở liệu bán cấu trúc: Dữ liệu lưu dạng XML, với định dạng thông tin mô tả đối tượng thể tag Đây sở liệu có nhiều ưu điểm lưu trữ hầu hết loại liệu khác nên sở liệu bán cấu trúc hướng nghiên cứu ứng dụng; • Cơ sở liệu tập trung; • Cơ sở liệu phân tán: Hệ quản trị cần phải đảm bảo thống vẹn toàn liệu, đảm bảo việc truy xuất liệu CSDL v0.1 42 21 TÓM LƯỢC CUỐI BÀI • Bài học trình bày nội dung về: Các khái niệm sở liệu; Mơ hình sở liệu; Thiết kế sở liệu; Kỹ thuật thiết kế sở liệu dạng sở liệu thông dụng 43 v0.1 CÂU HỎI THẢO LUẬN Câu 1: Cơ sở liệu gì? v0.1 44 22 CÂU HỎI THẢO LUẬN Câu 2: Các mơ hình sở liệu thường gặp? v0.1 45 23 ... Tệp hệ thống tệp liệu; • Hệ thống quản lý sở liệu v0.1 1.1 TỆP VÀ HỆ THỐNG TỆP DỮ LIỆU • Thơng tin ghi lại tệp tin máy tính Các phần mềm giúp cho việc lấy thông tin, tổng hợp phân tích thơng tin. .. HÀNG HỆ THỐNG HÀNG TỒN KHO HỆ THỐNG TÀI KHOẢN Hệ thống sở liệu Hồ sơ nhân Phòng nhân Hồ sơ khách hàng Phòng bán hàng CSDL bán hàng Hệ thống hàng tồn kho Phòng kế toán Hệ thống tài khoản Hệ thống. .. 1001 23 Nguyễn Văn H 8615121 1 435 1121 Phùng K 100124 Hà Thị M 89 031 33 1121 1258 Lê Quang 100125 Lê Thị D 86158 23 1258 1 435 Tạ Thu H 100126 Nguyễn Đức T 8901889 1 435 100127 Phạn Thị M 8901511 1 435