Tài liệu tham khảo về Quản lý nguồn dữ liệu
Mục đích Chương Thơng tin ý nghĩa thông tin tốt, kịp thời hoạt động doanh nghiệp Quản lý ý nguồn g liệu ệ Cá Các nguồn gây â tá tác động độ xấu ấ tới chất hất lượng l thơng thơ ti tin gì? 3.1 Thơng tin cách phân loại thông tin Thông tin nên lưu trữ nào? 3.2 Cơ sở liệu khái niệm liên quan 3.3 Bảo vệ nguồn liệu Hệ thống quản trị sở liệu gì? Được sử dụng để làm gì? 3.4 Nguyên tắc quản lý nguồn liệu Những ý để ể khai thác thông tin tốt ố gì? 3.5 Quy trình quản lý nguồn liệu MIS © 2008, TS Phạm Thị Thanh Hồng Các dạng thông tin 3.1 Thông tin dạng thông tin Dạng thơng tin Phạm vi Ví dụ Cấp thơng tin Cá nhân Tri thức cá nhân, mục tiêu, chiến lược cá nhân Phòng ban Mục tiêu phịng ban, doanh thu, chi phí, quy trình, chiến lược phịng ban ■ Thơng tin có nơi doanh nghiệp ■ Nhân viên cần phải nhận xử lý nhiều dạng liệu thông tin mức độ, dạng thức, tính chi tiết khác để đưa định Kiểu thông tin ■ Thu thập, thập xử lý lý, xêp xêp, phân tích thơng tin thành cơng giúp nhận diện rõ hoạt động doanh nghiệp MIS © 2008, TS Phạm Thị Thanh Hồng Introduction to MIS Mức độ chi tiết 3 2 oa nghiệp g ệp Doanh Doanh oa thu, u, chi c p phí,, quy trình cchiến ế lược ược DN Văn Thư, ghi nhớ, fax, e-mail, báo cáo, tài liệu Marketing, tài liệu đào tạo Trình diễn Trình bày SP, chiến lược, quy trình, tài chính, khách hàng, đối thủ cạnh tranh Bảng tính Bảng liệu doanh thu, đối thủ cạnh tranh, tình hình tài chính, tình hình đặt hàng CSDL CSDL khách hàng, nhân viên, doanh thu, đơn đặt hàng, nhà cung cấp, cấp nhà sản xuất Chi tiết Báo cáo doanh thu nhân viên bán hàng, sản phẩm, phận Tóm lược Báo cáo doanh thu tồn phịng bán hàng, tồn sản phẩm, tất phận Tổng hợp Báo cáo phịng ban, tổ chức MIS © 2008, TS Phạm Thị Thanh Hồng 4 Thông tin giao dịch thơng tin phân tích ■ Tính kịp thời phản ánh tình sử dụng thơng tin ■ Thơng tin giao dịch – Thơng tin chứa quy trình nghiệp vụ đơn lẻ đơn vị công tác,, mục ụ đích hỗ trợ ợ việc ệ thực ự ệ nhiệm vụ tác nghiệp hàng ngày ■ Thông tin thời gian thực – thơng tin cập nhật, có tức ■ Hệ thống thời gian thực – cung cấp thông tin thời gian thực theo yêu cầu ■ Thông tin phân tích – thơng tin tổ chức hình thành với mục đích trước để hỗ trợ việc thực nhiệm vụ phân tích cho nhà quản lý MIS © 2008, TS Phạm Thị Thanh Hồng 5 ■ Các định kinh doanh tốt hay không phụ thuộc vào chất lượng thông tin sử dụng cho việc q y định ị ■ Chính xác ■ Đầy đủ ■ Thống ■ Tính đơn ■ Kịp thời Introduction to MIS ■ Mọi hệ thống có cần thiết kế thành hệ thống thời gian thực khơng? MIS © 2008, TS Phạm Thị Thanh Hồng 6 Các đặc tính thơng tin có chất lượng ■ Năm thuộc tính thơng tin có chất lượng tốt là: 7 ■ Hệ thống thời gian thực giúp doanh nghiệp định kịp thời Giá trị chất lượng thông tin Giá trị chất lượng thơng tin MIS © 2008, TS Phạm Thị Thanh Hồng Giá trị thời gian thơng tin Chính xác Mọi giá trị có xác khơng? Đầy đủ Có giá trị bị khơng? VD, địa có đầy đủ tên đường phố, quận/huyện, thành phố/tỉnh không? Thống Các thông tin tổng hợp có thống với thơng tin chi tiết khơng? Ví dụ tổng số tiền có tổng khoản tiền chi tiết cộng lại không? Đơn Mỗi giao dịch, thực thể, kiện có biểu diễn thông tin không? VD, khách hàng có ghi cho mã số KH khơng? Kịp thời Thơng tin có phản ánh nhu cầu doanh nghiệp không? VD, thông tin cập nhật hàng tuần, hàng ngày, hay hàng không? MIS © 2008, TS Phạm Thị Thanh Hồng 8 Thông tin chất lượng kém? ? Mất thơng tin (khơng có tên KH) Thơng tin khơng đầy đủ (khơng có tên phố) Giá trị chất lượng thơng tin ■ Thơng tin khơng xác (sai địa e-mail) Nguyên nhân gây thông tin có chất lượng kém: Khách hàng trực tuyến có xu hướng nhập thơng tin khơng xác để bảo vệ quyền riêng tư họ Thông tin từ hệ thống khác có dạng nhập chuẩn nhập thông tin khác Thông tin bị lặp (trùng tên địa chỉ, tên KH, số điện thoại) Thơng tin bị sai (số điện thoại số fax trùng hay nhập sai?) MIS © 2008, TS Phạm Thị Thanh Hồng Những người điều hành trung tâm dịch vụ khách hàng bị phân tán nhập thông tin sai Thông tin không đầy đủ (thiếu mã vùng) Thông tin bên ngồi thơng tin từ đối tác khác thường khơng phù hợp, thiếu xác có lỗi 9 MIS © 2008, TS Phạm Thị Thanh Hồng 10 10 Chi phí cho thơng tin có chất lượng ■ Những ảnh hưởng xấu doanh nghiệp có thơng tin chất lượng ■ Khơng có khả bám sát khách hàng ■ Khó xác định khách hàng có giá trị ■ Khơng có khả xác định hội bán hàng ■ Marketing tới khách hàng khơng tồn ■ Khó giám sát doanh thu đơn đặt hàng khơng xác 3.2 CƠ SỞ Ở DỮ Ữ LIỆU Ệ VÀ À CÁC Á KHÁI NIỆM LIÊN QUAN ■ Khơng có khả xây dựng quan hệ chặt chẽ với khách hàng => tăng áp lực khách hàng MIS © 2008, TS Phạm Thị Thanh Hồng Introduction to MIS 11 11 MIS © 2008, TS Phạm Thị Thanh Hồng 12 12 Ta lưu trữ tổ chức thơng tin nào? ? Cấu trúc liệu ■ Bit: ■ Byte ■ Thông tin khắp nơi doanh nghiệp ■ bits (số (số, ký tự tự, tín hiệu) ■ Trường/ thuộc tính ■ Thơng tin lưu trữ sở liệu (CSDL) ■ CSDL – tập hợp liệu có tổ chức sử dụng phục vụ cho nhiều trình ứng dụng thời điểm ■ Nhóm ký tự tổ chức nhằm mục đích lưu trữ xử lý ■ Biểu ghi/ Thực thể ■ Nhóm trường có liên quan tới ■ Tập DL/ Tập thực thể ■ Một nhóm biểu ghi có cấu trúc giống ■ Cơ sở liệu (CSDL) ■ Một nhóm tập liệu có liên quan MIS © 2008, TS Phạm Thị Thanh Hồng 13 13 Các mơ hình liệu MIS © 2008, TS Phạm Thị Thanh Hồng 14 14 Trường khóa mối quan hệ ■ Mơ hình sở liệu phân cấp ■ Trường khóa trường khóa ngoại xác định thực thể tập thực thể ■ Mơ hình sở liệu ệ mạng g ■ Trường khóa – trường (hoặc nhóm trường) có giá trị cho thực thể tập thực thể ■ Mơ hình sở liệu quan hệ ■ Trường khóa ngoại – trường khóa tập thực thể xuất thuộc tính tập thực thể khác giúp tạo quan hệ logic hai tập thực thể MIS © 2008, TS Phạm Thị Thanh Hồng Introduction to MIS 16 16 MIS © 2008, TS Phạm Thị Thanh Hồng 20 20 Ưu điểm CSDL quan hệ Hệ quản trị sở liệu ■ Tăng tính linh hoạt ■ Hệ quản trị CSDL (Database Management System) ■ Tăng khả thực ■ Tập hợp chương trình cho phép người sử dụng tạo duyy trì CSDL ■ Giảm Giả lặp lặ lại l i ủ thông thô ti tin ■ Một phần mềm hệ thống cho phép định nghĩa, xây dựng xử lý liệu ■ Tăng chất lượng thông tin ■ Định nghĩa – khai báo khung liệu với mô tả chi tiết liệu ■ Tăng độ an tồn cho thơng tin ■ Xây dựng – lưu trữ liệu lên nhớ phụ ■ Xử lý – truy vấn vấn, cập nhật phát sinh báo cáo MIS © 2008, TS Phạm Thị Thanh Hồng 22 22 Thành phần DBMS MIS © 2008, TS Phạm Thị Thanh Hồng 23 23 Thành phần DBMS ((tt tt)) • Ngơn ngữ định nghĩa liệu: xác định nội dung cấu trúc CSDL xác định thành phần liệu • Từ điển liệu: Lưu định nghĩa thành phần liệu đặc tính liệu ■ Có bảng liệu nào? ■ Tạo ứng dụng – gồm công cụ cho phép tạo ứng dụng cách dễ dàng hiển thị ■ Quản trị liệu – cung cấp công cụ quản lý liệu nói chung ■ Có trường nào? ■ Số, ký tự, văn bản, hình ảnh, …? ■ Độ dài trường? ■ Có thể có số hay không? ■ Các chuyên y g gia CNTT thường g người g làm việc ệ với thành phần giá trịị đúng/sai g ■ Hayy có g ■ Trường khóa? • Ngơn ngữ thao tác liệu: cho phép truy xuất, thêm, xóa, sửa chữa, xếp liệu CSDL MIS © 2008, TS Phạm Thị Thanh Hồng Introduction to MIS 25 25 MIS © 2008, TS Phạm Thị Thanh Hồng 29 29 Tích hợp thơng tin nhiều CSDL Tích hợp thơng tin CSDL ■ Các tổ chức thường có nhiều hệ thống, hệ thống lại có CSDL riêng ■ Xây dựng hệ thống xử lý trung tâm để tích hợp liệu ■ Tích hợp – cho phép hệ thống riêng rẽ trao đổi với hệ thống khác MIS © 2008, TS Phạm Thị Thanh Hồng 30 30 3.3 Tổ chức CSDL MIS © 2008, TS Phạm Thị Thanh Hồng 31 31 Hai xu hướng chính: chính: tập trung phân tán Cấu trúc ■ Tập trung – tất file có liên quan vị trí Cơ sở liệu phân tán ■ Phân tán – toàn gp phần CSDL lưu trữ nhiều vị trí ■ Lặp – tồn CSDL lưu nhiều vị trí Máy tính Trung tâm CSDL Vị trí C ■ Phi tập trung – phần khác CSDL lưu trữ nhiều vị trí Vị trí B Máy tính Máy tính Máy tính Cơ sở liệu tập trung MIS © 2008, TS Phạm Thị Thanh Hồng Introduction to MIS 32 32 MIS © 2008, TS Phạm Thị Thanh Hồng Các sở liệu tương tự 33 33 Các xu hướng xây dựng CSDL Kho liệu ■ Kho liệu (Data Warehouse) kỹ thuật khai thác liệu (Datamining) ■ Siêu CSDL liên kết mạng ■ Kho liệu – tập hợp logic thông tin – sinh từ nhiều CSDL điều hành khác – sử g để tạo trí tuệ doanh nghiệp g p hỗ trợ cho việc p phân dụng tích kinh doanh hoạt động định ■ Mơ hình liệu đa hướng ■ OLAP ■ Data Marts – phần nhỏ kho liệu ■ Khai thác liệu (Data Mining) – tìm kiếm xu hướng kiểu liệu chưa lộ rõ MIS © 2008, TS Phạm Thị Thanh Hồng 34 34 Phân tích đa hướng MIS © 2008, TS Phạm Thị Thanh Hồng 35 35 Khai thác liệu (data mining) ■ Được sử dụng hãng lớn ■ CSDL chứa thông tin với nhiều hướng ■ Cho phép từ liệu khái quát đến liệu chi tiết, xếp trích lọc liệu theo tiêu chuẩn thực nhiều phương án p phân tích thống g kê phân p tích xu thế, phân p tích tương gq quan, dự ự báo, phân tích phương sai ■ T Trong ột kho kh liệ liệu khối liệ liệu, thơ thơng ti tin có ó nhiều hiề hướng, bao gồm lớp cột hàng ■ Các hoạt động ■ Hướng – thuộc tính thơng tin ■ Trực tiếp ■ Phân loại ■ Ước tính ■ Dự báo ■ Gián tiếp ■ Xâu chuỗi ■ Luật liên hệ ■ Mô tả minh họa MIS © 2008, TS Phạm Thị Thanh Hồng Introduction to MIS 37 37 MIS © 2008, TS Phạm Thị Thanh Hồng 39 39 Tại phải sử dụng kho liệu liệu? ? Tại khơng sử dụng kho liệu liệu? ? ■ Có thể truy vấn lập báo cáo mà không cần sử dụng hệ thống xử lý giao dịch (TPS) ■ Khi TPS lưu tồn liệu thực truy vấn cách nhanh chóng ■ Có thể làm tăng tốc độ truy vấn lập báo cáo cách sử dụng lược đồ ■ Một số tổ chức không muốn người sử dụng tự tạo truy vấn ấ riêng ■ Những người chuyên gia CNTT viết đoạn truy vấn đơn giản ■ Một kho liệu địi hỏi: ■ Có thể xóa liệu mà khơng cần phải can thiệp vào TPS ■ Có số giới hạn chuyên gia tham gia vào tồn chu trình thành lập kho liệu đầy đủ MIS © 2008, TS Phạm Thị Thanh Hồng 42 42 ■ Bảo trì tốt MIS © 2008, TS Phạm Thị Thanh Hồng Tại không sử dụng kho liệu (tt tt)? )? ■ Nhiều ứng dụng chiến lược có thời gian sử dụng ngắn hồn tn khơng có tác dụng người sử dụng HTTT dẫn tới việc tạo hệ thống không thực hiệu 43 43 Siêu sở liệu ■ Liên kết ứng dụng website với siêu CSDL ■ Siêu CSDL CSDL sử dụng liên kết siêu văn để tổ chức ■ Các tệp tài liệu ■ Các tệp thực ■ Quy trình xử lý báo cáo ể nhanh chóng thêm clutter vào q trình điều hành kinh doanh M¸y chđ WEB (WEB Server) HTML ■ Giá trị nhiều liệu bị giới hạn Internet ■ Chi phí vượt q li ớch Trình duyệt WEB Máy chủ ứng dụng (Application server) Các chơng trình tùy chỉnh Máy chủ sở liệu (Database Server) Cơ sở liệu (Databases) Các dẫn cấu tìm kiếm ■ Các dẫn (directories): danh sách có cấu trúc xác định vị trí trang văn mạng có liên quan đến vấn đề xác định ■ Cơ cấu tìm kiếm (search engine): chương trình giúp xác định vị trí trang mạng phù hợp với từ khóa tìm kiếm người sử dụng MIS © 2008, TS Phạm Thị Thanh Hồng Introduction to MIS 44 44 MIS © 2008, TS Phạm Thị Thanh Hồng 45 45 CSDL phù hợp? hợp? 3.4 Bảo vệ liệu ■ Lựa chọn phụ thuộc vào: ■ Các tổ chức phải bảo vệ nguồn liệu họ chống lại xâm nhập bất hợp pháp phá hỏng liệu ■ Ba bước mà tổ chức thực để bảo vệ liệu là: ■ Tầm cỡ ứng dụng ■ Hệ thống phần cứng hệ điều hành sử dụng cho CSDL ■ Trình độ nhân viên ■ Hỗ trợ chương trình ■ Chi phí/ tính linh hoạt vận hành ■ Ngân sách System (producer)Platform SQL ODBC Scaling Price Access ((Microsoft)) FoxPro (Microsoft) FileMaker (FileMaker) Excel (Microsoft) W indows W indows, Mac W indows, Mac W indows, Mac Yes Yes No No Yes Yes No Yes SQL Server SQL Server FileMaker Server Convert to Acces ~$200 $ ~$200 ~$200 ~$200 Files (owner) W indows, Mac No No Import into DB ? MIS © 2008, TS Phạm Thị Thanh Hồng 46 46 Phát triển chiến lược phục hồi lưu liệu thích hợp Lập kế hoạch khắc phục cố Xây dựng hệ thống kinh doanh có khả thích ứng MIS © 2008, TS Phạm Thị Thanh Hồng Chiến lược lưu phục hồi liệu ■ ■ Sao lưu – Tạo xác tồn hệ thống thơng tin MIS © 2008, TS Phạm Thị Thanh Hồng Introduction to MIS 48 48 Kế hoạch khắc phục cố ■ Phục hồi – khả đưa hệ thống trở hoạt động lại hệ thống bị xâm nhập bị phá hỏng 47 47 Kế hoạch khắc phục cố – quy trình chi hi tiết để phục h hồi thô thông ti tin h ặ ột hệ thống ứng dụng CNTT trường hợp xẩy cố ■ Vùng nóng (hot site) – vùng phương tiện riêng trang bị đầy đủ mà cơng ty đưa vào sử dụng sau cố ■ Vùng lạnh (Cold site) – vùng tách biệt không trang bị sẵn thiết bị máy tính, nơi mà nhân viên chuyển tới sau xẩy cố MIS © 2008, TS Phạm Thị Thanh Hồng 49 49 Các hệ thống có khả thích ứng Kế hoạch khắc phục cố ■ Biểu đồ chi phí khắc phục cố: Chi phí mà tổ chức phải chịu khơng có thơng tin cơng nghệ cần thiết Chi phí mà tổ chức phải chịu để khắc phục thảm họa Kế hoạch khắc phục cố tối ưu chi phí thời gian Chi phí mà tổ chức phải chịu khơng có thơng tin cơng nghệ cần thiết Chi phí mà tổ chức phải chịu để khắc phục cố Linh hoạt – Hệ thống phải đáp ứng thay đổi kinh doanh Đo lường – hệ thống thích ứng với nhu cầu tăng lên tới mức Đáng tin cậy – đảm bảo hệ thống thực chức cung cấp thơng tin xác Sẵn sàng – điểm mà nhân viên, khách hàng, đối tác tiếp cận hệ thống Vận hành – xác định xem hệ thống thực quy trình giao dịch cụ thể nhanh tới mức Thời gian từ cố xẩy khắc phục MIS © 2008, TS Phạm Thị Thanh Hồng 50 50 MIS © 2008, TS Phạm Thị Thanh Hồng 51 51 3.4 Các nguyên tắc quản lý CSDL ■ Nhu cầu quản lý liệu ln tồn ■ Dữ liệu trích xuất nhiều cấp ■ Phần mềm ứng g dụng ụ gp phải ợ tách riêng g khỏi sở liệu ■ Phần mềm ứng dụng nên phân loại theo cách mà xử lý liệu ■ Phần mềm ứng dụng nên thiết kế độc lập ■ Dữ liệu nên nhập vào hệ thống lần ■ Cầ có Cần ó chuẩn h ẩ liệ liệu MIS © 2008, TS Phạm Thị Thanh Hồng Introduction to MIS 52 52 10 ... tắc quản lý CSDL ■ Nhu cầu quản lý liệu tồn ■ Dữ liệu trích xuất nhiều cấp ■ Phần mềm ứng g dụng ụ gp phải ợ tách riêng g khỏi sở liệu ■ Phần mềm ứng dụng nên phân loại theo cách mà xử lý liệu. .. ((tt tt)) • Ngơn ngữ định nghĩa liệu: xác định nội dung cấu trúc CSDL xác định thành phần liệu • Từ điển liệu: Lưu định nghĩa thành phần liệu đặc tính liệu ■ Có bảng liệu nào? ■ Tạo ứng dụng – gồm... Tại phải sử dụng kho liệu liệu? ? Tại không sử dụng kho liệu liệu? ? ■ Có thể truy vấn lập báo cáo mà không cần sử dụng hệ thống xử lý giao dịch (TPS) ■ Khi TPS lưu tồn liệu thực truy vấn cách