Hiện tại công ty đang sử dụng hệ CSDL tập trung để quản lý dữ liệu của công ty,Tổng Giám đốc là người quản lý tất cả các dữ liệu Server tổng và phân quyền cho nhânviên được quyền với CSD
Trang 1Mặc dù đã có nhiều cố gắng, nhưng do trình độ và thời gian có hạn nên bài khóaluận của em còn nhiều thiết sót Em rất mong được những ý kiến đóng góp của quý thầy
cô và các bạn để bài khóa luận của em được hoàn thiện hơn nữa
Xin chân thành cảm ơn!
Hà Nội, ngày 30 tháng 04 năm 2013
Cù Thị Tuyền
Trang 2MỤC LỤC
LỜI CẢM ƠN i
MỤC LỤC ii
DANH MỤC BẢNG BIỂU, SƠ ĐỒ, HÌNH VẼ iv
DANH MỤC TỪ VIẾT TẮT v
PHẦN I: TỔNG QUAN NGHIÊN CỨU ĐỀ TÀI 1
1.1 Tầm quan trọng và ý nghĩa của việc xây dựng Cơ sở dữ liệu 1
1.2 Tổng quan về vấn đề nghiên cứu 2
1.3 Mục tiêu nghiên cứu đề tài 3
1.4 Đối tượng và phạm vi nghiên cứu 3
1.5 Phương pháp nghiên cứu và thực hiện đề tài 4
1.5.1 Phương pháp thu thập số liệu 4
1.5.2 Phương pháp phân tích và xử lý dữ liệu 4
1.5.2.1 Phương pháp định lượng 4
1.5.2.2 Phương pháp định tính 5
1.5.3 Công cụ sử dụng để thực hiện đề tài 5
1.6 Kế cấu khóa luận tốt nghiệp 6
PHẦN II: CƠ SỞ LÝ LUẬN CƠ SỞ DỮ LIỆU PHÂN TÁN VÀ THỰC TRẠNG CƠ SỞ DỮ LIỆU CỦA CÔNG TY CỔ PHẦN PHÁT TRIỂN VÀ ỨNG DỤNG CÔNG NGHỆ AIT 7
2.1 Cơ sở lý luận 7
2.1.1 Một số định nghĩa, khái niệm cơ bản 7
2.1.1.1 Dữ liệu, kho dữ liệu cục bộ 7
2.1.1.2 Cơ sở dữ liệu (CSDL) 8
2.1.2 Cơ sở dữ liệu tập trung 8
2.1.3 Cơ sở dữ liệu phân tán 9
2.1.3.1 CSDL phân tán 9
2.1.3.2 Kiến trúc cơ bản của CSDL phân tán 10
Trang 32.1.3.3 Các đặc điểm chính của cơ sở dữ liệu phân tán 11
2.1.3.4 Mục đích của việc sử dụng CSDL phân tán 14
2.1.3.5 Ưu điểm của CSDL phân tán 14
2.1.3.6 Nhược điểm của CSDL phân tán 17
2.1.3.7 Hệ quản trị CSDL phân tán(Distributed DBMS) 18
2.1.3.8 Mô hình kiến trúc của hệ quản trị CSDL phân tán 19
2.2 Tổng quan về công ty cổ phần phát triển và ứng dụng công nghệ AIT 24
2.2.1 Giới thiệu về AIT 24
2.2.2 Thực trạng tình hình ứng dụng công nghệ thông tin tại Công ty Cổ phần Phát triển và Ứng dụng Công nghệ AIT 24
2.2.3 Đánh giá tình hình ứng dụng Hệ thống thông tin 27
2.3 Thực trạng CSDL của Công ty Cổ phần Phát triển và Ứng dụng Công nghệ AIT33 2.3.1 Những thành công mang lại cho AIT khi ứng dụng CSDL tập trung 33
2.3.2 Những mặt hạn chế trong việc ứng dụng CSDL tập trung AIT 34
PHẦN III: ĐỀ XUẤT CÁC GIẢI PHÁP CHO VIỆC QUẢN LÝ CSDL CỦA CÔNG TY CỔ PHẦN PHÁT TRIỂN VÀ ỨNG DỤNG CÔNG NGHỆ AIT 37
3.1 Đặt bài toán 37
3.2 Xây dựng CSDL phân tán 38
3.2.1 Lựa chọn mô hình kiến trúc của hệ quản trị CSDL phân tán 38
3.2 2 Lựa chọn phương pháp phân tán 38
3.2.3 Xây dựng mô hình CSDL phân tán cho Công ty Cổ phần Phát triển và Ứng dụng Công nghệ AIT 40
3.2.3.1 Phân tích chức năng quản trị kho dữ liệu phục vụ quản lý dự án 41
3.2.3.2 Xây dựng kho DL phân tán 42
PHẦN IV: KẾT LUẬN VÀ KIẾN NGHỊ 56
4.1 Kết luận chung 56
4.2 Kiến nghị 57
4.3 Hướng phát triển 58
TÀI LIỆU THAM KHẢO 60
Trang 4PHỤ LỤC 61
DANH MỤC BẢNG BIỂU, SƠ ĐỒ, HÌNH VẼ Hình 2 1: Môi trường Hệ CSDL phân tán 10
Hình 2 2: Kiến trúc cơ bản của CSDL phân tán 11
Hình 2 3: Sơ đồ hệ phân tán client/ server 21
Hình 2 4: Sơ đồ kiến trúc của hệ phân tán hàng ngang 22
Hình 2 5: Sơ đồ kiến trúc của hệ phân tán phức hợp 23
Hình 2 6 Mô hình mạng nội bộ của công ty 26
Hình 2 7: Quy trình hoạt động của công ty AIT 27
Hình 2 8 Mô hình kho dữ liệu tập trung Công ty AIT 32
Hình 2 9 Mô hình dữ liệu quan hệ của Công ty AIT 33
Hình 3.1.Quá trình thiết kế từ trên xuống……… 39
Hình 3.2 Sơ đồ luồng dữ liệu luân chuyển trong các chi nhánh 40
Hình 3.3: Mô hình dữ liệu phân tán tổng quát của công ty AIT 43
Hình 3.4: Mô hình dữ liệu phân tán chi nhánh của công ty AIT 43
Hình 3.5: Mô hình dữ liệu quan hệ mới Công ty AIT 45
Hình 3.6: Mô hình đăng nhập hệ thống 48
Hình 3.7: Giao diện hệ thống 48
Hình 3.8: From giao diện quản lý phòng ban 49
Hình 3.9: From giao diện quản lý nhân viên 49
Hình 3.10: From giao diện quản lý khách hàng 50
Hình 3.11: From giao diện quản lý dự án 50
Hình 3.12: From giao diện quản lý báo cáo 51
Hình 3.13: From giao diện quản lý báo cáo 51
Hình 3.14: From giao diện danh sách truyền dữ liệu phòng ban 52
Hình 3.15: From giao diện truyền dữ liệu phòng ban giữa các Server 52
Hình 3.16: From giao diện danh sách truyền dữ liệu nhân viên 52
Hình 3.17: From giao diện truyền dữ liệu nhân viên giữa các Server 53
Hình 3.18: From giao diện danh sách truyền dữ liệu nhân viên 53
Hình 3.19: From giao diện truyền dữ liệu nhân viên giữa các Server 54
Hình 3.20: From giao diện danh sách truyền dữ liệu nhân viên 54
Hình 3.21: From giao diện truyền dữ liệu nhân viên giữa các Server 54
Trang 5Hình 3.22: From giao diện danh sách truyền dữ liệu báo cáo 55Hình 3.23: From giao diện truyền dữ liệu báo cáo giữa các Server 55
Trang 6PHẦN I: TỔNG QUAN NGHIÊN CỨU ĐỀ TÀI
1.1 Tầm quan trọng và ý nghĩa của việc xây dựng Cơ sở dữ liệu
Trong thời đại của xã hội thông tin và nền kinh tế trí thức, mọi hoạt động của các
tổ chức muốn đạt hiệu quả cao, giành được thắng lợi trong thế cạnh tranh gay gắt thì nhấtthiết phải có những phương pháp để có được những thông tin, tri thức cần thiết một cáchnhanh và chính xác Ngày nay, để tồn tại và phát triển đòi hỏi các công ty không ngừngđổi mới và nâng cao trình độ quản lý, trong đó đổi mới và hoàn thiện công tác xây dựng
hệ thống thông tin quản lý CSDL là một vấn đề vô cùng quan trọng trong bất kỳ mộtcông ty nào dù lớn hay nhỏ Tuy nhiên, để xây dựng một hệ CSDL quản lý phù hợp cho
cơ cấu tổ chức, quy mô hoạt động của công ty là công việc không dễ dàng thực hiện.Hiện nay, các công ty đã và đang có cho mình một hệ CSDL để quản lý nhưng chưa thật
sự tối ưu Vấn đề đặt ra là làm thế nào để công ty là phải xây dựng Hệ CSDL tốt hơn, vừa
dễ dàng quản lý vừa có thể khai thác được những khối lượng dữ liệu khổng lồ, lưu trữnhiều nơi, ở nhiều dạng dữ liệu khác nhau đó một cách hiệu quả trong các hệ thống thôngtin lớn
Công ty Cổ phần Phát triển và Ứng dụng Công nghệ AIT là công ty cung cấp cácsản phẩm dịch vụ phần mềm tin học, cung cấp các thiết bị tin học, điện tử, viễn thông; tưvấn và chuyển giao các giải pháp về công nghệ, dịch vụ khoa học kĩ thuật, kinh doanh dựán; tư vấn đầu tư phát triển Công ty có một số chi nhánh phân bổ trên địa bàn thành phố
Hà Nội Hiện tại công ty đang sử dụng hệ CSDL tập trung để quản lý dữ liệu của công ty,Tổng Giám đốc là người quản lý tất cả các dữ liệu (Server tổng) và phân quyền cho nhânviên được quyền với CSDL nào, điều hành mọi hoạt động của công ty tất cả dữ liệu điềutập trung hết vào Server tổng này Qua thời gian thực tập tại Công ty Cổ phần Phát triển
và Ứng dụng Công nghệ AIT, với những kết quả điều tra sơ bộ và tổng hợp phiếu điềutra, em nhận thấy vấn đề mà công ty cần giải quyết đó là cần thiết thay đổi việc thu thập,
xử lý, lưu trữ và truyền các thông tin liên quan đến việc quản lý CSDL Hệ CSDL tậptrung mà công ty sử dụng còn nhiều khuyết điểm không đáp ứng được yêu cầu đổi mớiphát triển của công ty và từ yêu cầu xây dựng một hệ CSDL phù hợp với hoạt động của
Trang 7công ty đó là hệ CSDL phân tán, nên tôi đã chọn đề tài “Xây dựng CSDL phân tán choCông ty Cổ phần Phát triển và Ứng dụng Công nghệ AIT ”
1.2 Tổng quan về vấn đề nghiên cứu
Trước những cấp thiết đã nêu trên, đã có rất nhiều công trình nghiên cứu của cácgiáo sư, tiến sĩ, đề tài luận văn của các sinh viên trong và ngoài nước về cơ sở dữ liệunhằm nâng cao hiệu quả hoạt động kinh doanh cho các doanh nghiệp
Về vấn đề này cũng đã có nhiều đề tài nghiên cứu và đã triển khai như:
- Đồ án tốt nghiệp “ Mô hình cơ sở dữ liệu phân tán và ứng dụng” tác giả Trần MinhTuấn – ĐH Bách Khoa Hà Nội với mục đích của đề tài Hệ thống CSDL quốc gia vềKinh tế - Xã hội được xây dựng với mục đích lưu trữ các thông tin/dữ liệu về tình hìnhphát triển kinh tế xã hội quốc gia qua các năm Ưu điểm của đề tài là đưa ra giải phápthực hiện cơ chế nhân bản dữ liệu ứng dụng vào hệ CSDL quốc gia về KT-XH giúptăng cường khả năng trao đối, cập nhập thông tin Nhược điểm của đề tài là do CSDLquốc gia về KT-XH vẫn còn đang trong quá trình thiết kế và phát triển, có nhiều vấn
đề còn chưa được quyết định, nhiều công việc chưa hoàn thành nên chương trình ứngdụng vẫn còn đơn giản, chủ yếu mang tính minh họa chứ chưa hoàn thành một hệthống hoàn chỉnh Có nhiều vấn đề trong quản trị và khai thác CSDL phân tán mà phảisau một thời gian triển khai mới bộc lộ ra được, đòi hỏi phải có kinh nghiệm thực tế,
có quá trình theo dõi để đưa ra các phương án bảo mật, toàn vẹn dữ liệu, nâng cao hiệunăng tốt hơn
- Công trình nghiên cứu “Xây dựng mô hình Cơ sở dữ liệu phân tán cho Hệ thống thôngtin đất đai cấp tỉnh và giải pháp đồng bộ hóa Cơ sở dữ liệu trên Oracle” tác giả BùiVăn Dũng – Trung tâm Công nghệ thông tin, Sở Tài nguyên và Môi trường Đồng Nai
Ưu điểm việc ứng dụng mô hình CSDL phân tán cho hệ thống thông tin đất đai cấptỉnh sẽ đem lại hiệu quả thực cho công tác quản lý nhà nước về đất đai, đặc biệt làđồng bộ dữ liệu quản lý các cấp Nhược điểm của mô hình CSDL phân tán này chỉ ápdụng được các cấp có Công nghệ thông tin tiên tiến và người quản lý đòi hỏi phải cónhiều kinh nghiệm mới có thể quản lý tốt mà hiện nay các cấp tỉnh việc ứng dụng
Trang 8công nghệ thông tin rất kém việc ứng dụng nên việc triển khai mô hình rộng rãi chotoàn cả nước là việc kém khả thi và cần nguồn ngân sách đầu tư rất lớn.
Hiện nay, ở nước ta có rất ít công ty sử dụng mô hình quản lý này vì trình độ kĩthuật còn hạn chế, không đủ kinh phí, ngại thay đổi,… Công ty Cổ phần Phát triển vàỨng dụng Công nghệ AIT có chủ trương đầu tư mở rộng thêm công ty yêu cầu hệ quản trịCSDL hiệu quả giúp việc khai thác CSDL nhanh và hiệu quả phục vụ yêu cầu công việccủa công ty Công ty AIT là công ty chuyên thực hiện các dự án lập trình phần mềm, xâydựng và nâng cấp website nên việc quản lý dự án là vô cùng quan trọng và cần thiết Nêntrong bài khóa luận em xây dựng CSDL phân tán trong việc quản lý các dự án của công tyAIT còn các phần quản lý nhân sự, quản lý tiền lương vẫn sử dụng CSDL tập trung vì vấn
đề này chưa thật sự cần thiết đối với hoạt động công ty Sau khi xây dựng và triển khaithành công mô hình CSDL phân tán cho việc quản lý dự án của công ty sẽ triển khai ápdụng triển khai quản lý nhân sự và quản ly tiền lương,… của công ty giúp công ty quản lý
và sử dụng tài nguyên dữ liệu hiểu quả mang lại hiệu quả làm việc tốt nhất
1.3 Mục tiêu nghiên cứu đề tài
Trong thời đại ngày nay thông tin kinh tế là vấn đề sống còn với các đơn vị kinhdoanh Đơn vị nào làm chủ được thông tin sẽ có ưu thế tuyệt đối trong hoạt động kinhdoanh Hơn nữa chỉ thu nhập thông tin tốt thì vẫn chưa đủ, mà phải biết bảo quản giữ gìnthông tin về hoạt động kinh doanh của đơn vị một cách chặt chẽ Do đó hệ thống mới phải
có cơ chế kiểm soát chặt chẽ, bảo đảm an toàn, bảo mật cơ sở dữ liệu
Mục tiêu cuối cùng của đề tài là:
- Hệ thống hoá những vấn đề lý luận về CSDL phân tán và mô tả một cách có hệthống nhằm đánh giá khái lược và nhận diện các vấn đề tồn tại trong công tác quản lýCSDL của Công ty Cổ phần Phát triển và Ứng dụng Công nghệ AIT
- Dựa trên cơ cấu quản lý CSDL của Công ty Cổ phần Phát triển và Ứng dụngCông nghệ AIT để xây dựng hệ CSDL phân tán cho Công ty nhằm nâng cao hiệu quảcông tác quản lý và khai thác dữ liệu của công ty
1.4 Đối tượng và phạm vi nghiên cứu
Về chủ thể nghiên cứu: Công ty Cổ phần Phát triển và Ứng dụng Công nghệ AIT
Trang 9Về đối tượng nghiên cứu: CSDL tại Công ty Cổ phần Phát triển và Ứng dụng Công
nghệ AIT
Về nội dung: Nghiên cứu thực trạng quản lý CSDL tập chung tại công ty từ đó nắm
rõ quy trình làm việc giữa các phòng ban để đưa khắc phục những bất cập của quản lýCSDL tập chung nhằm nâng cao hiệu quả kinh doanh cho công ty
Phạm vi nghiên cứu: Nhằm giới hạn phạm vi nghiên cứu theo các mục tiêu đã đề
ra, khóa luận tập trung xem xét các CSDL tại công ty bao gồm việc khai thác và quản lýCSDL
1.5. Phương pháp nghiên cứu và thực hiện đề tài
1.5.1 Phương pháp thu thập số liệu
Thu thập thông tin là công đoạn đầu tiên trong quá trình phân tích hệ thống Mụctiêu của công đoạn này đó là có được các thông tin liên quan đến mục tiêu đã đề ra với độtin cậy và chính xác cao Phương pháp thu thập thông tin trong giai đoạn này bao gồm:nghiên cứu tài liệu, phỏng vấn, phiếu điều tra và quan sát trực tiếp
- Nghiên cứu tài liệu: tài liệu thu thập được trong quá trình thực tập, các tài liệu liênquan về CSDL phân tán
- Phỏng vấn những người có tương tác với hệ thống đó là trưởng phòng kĩ thuật, cácnhân viên phòng kĩ thuật, nhân viên hành chính và Giám đốc điều hành để thu đượcnhững thông tin xác thực nhất về vấn đề đang nghiên cứu
- Phương pháp quan sát giúp các phân tích và thu thập được những thông tin không cótrong tài liệu và không thu thập được qua quá trình phỏng vấn, có được một bứctranh khái quát về tổ chức và cách quản lý các hoạt động của tổ chức
- Các dữ liệu thứ cấp bao gồm CSDL tại các phòng ban và một số nguồn tài liệu từInternet
1.5.2 Phương pháp phân tích và xử lý dữ liệu
Trang 101.5.2.1 Phương pháp định lượng
Dữ liệu sau khi thu thập sẽ được đưa ra phân tích thông qua việc sử dụng phầnmềm Excel để xử lý thông tin sơ cấp thông qua bảng câu hỏi được thiết kế sẵn, đánh giácác dữ liệu thu thập được, có thể rút ra một số đánh giá về thực trạng CSDL và hệ CSDLcủa công ty
1.5.2.2 Phương pháp định tính
Tiến hành chọn lọc, phân tích, tổng hợp các dữ liệu thu thập được thông qua cáccâu hỏi phỏng vấn chuyên sâu và các dữ liệu, thông tin được thu thập từ các nguồn khác(như Internet ) nhằm chọn được thông tin phù hợp với mục đích sử dụng và nội dungnghiên cứu
1.5.3 Công cụ sử dụng để thực hiện đề tài
Hiện tại công ty AIT đang sử dụng Hệ quản trị Oracle quản lý và khai thác CSDLcủa công ty Qua quá trình tìm hiểu MS SQL Server em thấy những ưu điểm của phầnmềm là:
- Nền tảng cho các nhiệm vụ then chốt: MS SQL Server cho phép các tổ chức chạyhầu hết các ứng dụng phức tạp trên một nền tảng an toàn, tin cậy và có khả năng
mở rộng, bên cạnh đó còn giảm được sự phức tập trong việc quản lý cơ sở hạ tầng
dữ liệu
- Sự phát triển động: MS SQL Server cùng với NET Frame work đã giảm được sựphức tạp trong việc phát triển các ứng dụng mới ADO.NET Entity Frame workcho phép các chuyên gia phát triển có thể nâng cao năng suất làm việc với các thựcthể dữ liệu logic đáp ứng được các yêu cầu của doanh nghiệp thay vì lập trình trựctiếp với các bảng và cột
- Dữ liệu quan hệ mở rộng: MS SQL Server cho phép các chuyên gia phát triển, khaithác triệt để và quản lý bất kì kiểu dữ liệu nào từ các kiểu dữ liệu truyền thống đến
dữ liệu không gian địa lý mới
- Thông tin trong toàn bộ doanh nghiệp: MS SQL Server cung cấp một cơ sở hạ tầng
có thể mở rộng, cho phép quản lý các báo cáo, phân tích với bất kỳ kích thước và
Trang 11sự phức tạp nào, bên cạnh đó cho phép người dung dễ dàng hơn trong việc truy cậpthông tin thông qua sự tích hợp sâu với Microsoft Ofice
Dựa trên những ưu điểm của Hệ quản trị MS SQL Server và cách quản lý lưu trữ
dữ liệu của hiện tại của công ty lưu trữ dưới dạng database và các kho dữ liệu, cũng nhưmong muốn convert dữ liệu từ hệ thống cũ sang hệ thống mới sao cho nhanh và có hiệuquả nhất em sử dụng Hệ quản trị MS SQL Server để xây dựng CSDL cho công ty AIT
1.6. Kế cấu khóa luận tốt nghiệp
Đề tài nghiên cứu được chia làm 3 phần:
Phần I: Tổng quan nghiên cứu về quản lý CSDL tại Công ty Cổ phần Phát triển
và Ứng dụng Công nghệ AIT Nêu tầm quan trọng của vấn đề cần nghiên cứu, nếu tổng
quan vấn đề, đối tượng, mục tiêu cần nghiên cứu và phương pháp sử dụng trong quá trìnhthu thập, phân tích hoàn thành bài khóa luận
Phần II: Cơ sở lý luận CSDL phân tán và thực trạng CSDL của Công ty Cổ phần
Phát triển và Ứng dụng Công nghệ AIT Phân tích những nhược điểm của CSDL tập trung
trong công tác quản lý trong công ty AIT, cũng như trong nhiều ngành khác nữa Bàinghiên cứu xây dựng CSDL phân tán áp dụng cho công ty AIT khắc phục các nhược điểmcủa hệ CSDL mà công ty đang sử dụng, rộng hơn nữa là từ việc áp dụng thành công chocông ty AIT chúng ta có thể ứng dụng cho các công ty hoặc các doanh nghiệp khác cũngnhư trong bộ máy nhà nước
Phần III: Đề xuất các giải pháp cho việc quản lý CSDL của Công ty Cổ phần
Phát triển và Ứng dụng Công nghệ AIT Từ kết quả phân tích, đánh giá ở Phần II đưa ra
giải pháp nâng cao CSDL của công ty AIT, xây dựng CSDL phân tán cho Công ty Cổphần Phát triển và Ứng dụng Công nghệ AIT
Phần IV: Kết Luận và kiến nghị Đưa ra các kết luận cho cho việc xây dựng CSDL
cho Công ty Cổ phần Phát triển và Ứng dụng Công nghệ AIT nói riêng và Các kết luậnchung và kiến nghị
Trang 12PHẦN II: CƠ SỞ LÝ LUẬN CƠ SỞ DỮ LIỆU PHÂN TÁN VÀ THỰC TRẠNG CƠ
SỞ DỮ LIỆU CỦA CÔNG TY CỔ PHẦN PHÁT TRIỂN VÀ ỨNG DỤNG CÔNG
NGHỆ AIT 2.1 Cơ sở lý luận
2.1.1 Một số định nghĩa, khái niệm cơ bản
2.1.1.1 Dữ liệu, kho dữ liệu cục bộ
Kho dữ liệu là tuyển tập các CSDL tích hợp, hướng chủ đề, được thiết kế để hỗ trợ
cho chức năng trợ giúp quyết định Kho dữ liệu thường rất lớn tới hàng trăm GB hay thậmchí hàng Terabyte Kho dữ liệu được xây dựng để tiện lợi cho việc truy cập theo nhiềunguồn, nhiều kiểu dữ liệu khác nhau sao cho có thể kết hợp được cả những ứng dụng củacác công nghệ hiện đại và kế thừa được từ những hệ thống đã có sẵn từ trước
Mục tiêu chính của kho dữ liệu là nhằm đáp ứng các tiêu chuẩn cơ bản sau:
Phải có khả năng đáp ứng mọi yêu cầu về thông tin của người sử dụng
Hỗ trợ để các nhân viên của tổ chức thực hiện tốt, hiệu quả công việc của mình,như có những quyết định hợp lý, nhanh và bán được nhiều hàng hơn, năng suất caohơn, thu được lợi nhuận cao hơn, v.v
Giúp cho tổ chức, xác định, quản lý và điều hành các dự án, các nghiệp vụ mộtcách hiệu quả và chính xác
Tích hợp dữ liệu và các siêu dữ liệu từ nhiều nguồn khác nhau
Những đặc điểm cơ bản của Kho dữ liệu (DW) là một tập hợp dữ liệu có tính chất sau:Tính tích hợp (Integration), Dữ liệu gắn thời gian và có tính lịch sử, Dữ liệu có tính ổnđịnh (nonvolatility), Dữ liệu không biến động, Dữ liệu tổng hợp
Trang 13Kho dữ liệu cục bộ (Data Mart - DM) là CSDL có những đặc điểm giống với kho
dữ liệu nhưng với quy mô nhỏ hơn và lưu trữ dữ liệu về một lĩnh vực, một chuyên ngành.Datamart là kho dữ liệu hướng chủ đề Các DM có thể được hình thành từ một tập con dữliệu của kho dữ liệu hoặc cũng có thể được xây dựng độc lập và sau khi xây dựng xong,các DM có thể được kết nối tích hợp lại với nhau tạo thành kho dữ liệu Vì vậy có thể xâydựng kho dữ liệu bắt đầu bằng việc xây dựng các DM hay ngược lại xây dựng kho dữ liệutrước sau đó tạo ra các DM
- Data mart phụ thuộc (Dependent Data Mart): Chứa những dữ liệu được lấy từ DW
và những dữ liệu này sẽ được trích lọc và tinh chế, tích hợp lại ở mức cao hơn đểphục vụ một chủ đề nhất định của Datamart
- Data mart độc lập (Independent Data Marts): Không giống như Data mart phụ
thuộc, Data mart độc lập được xây dựng trước DW và dữ liệu được trực tiếp lấy từcác nguồn khác nhau
2.1.1.2 Cơ sở dữ liệu (CSDL)
Về cơ bản CSDL (Database) là tập hợp dữ liệu được lưu trữ một cách có tổ chức
để phục vụ cho công việc sử dụng thuận tiện nhất Dữ liệu là số liệu, hình ảnh cần đượclưu trữ dưới dạng file, record tiện lợi cho người dùng đối với việc tham khảo, xử lý
Mỗi CSDL cần có chương trình quản lý, xắp xếp, duy trì dữ liệu gọi là hệ quảntrị CSDL (DBMS - Database Management System) Hệ quản trị CSDL được coi là bộdiễn dịch ngôn ngữ bậc cao để dịch các công việc người sử dụng thao tác trên dữ liệu màngười dùng không cần quan tâm đến thuật toán
Về mặt kiến trúc, CSDL được phân chia thành các mức khác nhau Một CSDL cơbản có ba phần chính là mức vật lý, mức khái niệm và mức thể hiện Tuy nhiên với CSDLcấp cao thì có thể có nhiều mức phân hoá hơn
- Mức vật lý: là mức thấp nhất của kiến trúc hệ cơ sở dữ liệu, ở mức này dữ liệu
được tổ chức dưới nhiều cấp khác nhau như bản ghi, file
- Mức khái niệm: là sự biểu diễn trừu tượng của CSDL vật lý và có thể nói mức vật
lý là sự cài đặt cụ thể của CSDL ở mức khái niệm
Trang 14- Mức thể hiện: Khi CSDL được thiết kế, những gì thể hiện (giao diện, chương trình
quản lý, bảng ) gần gũi với người sử dụng với CSDL ở mức khái niệm gọi làkhung nhìn Như vậy sự khác nhau giữa khung nhìn và mức khái niệm không lớn
2.1.2 Cơ sở dữ liệu tập trung
Toàn bộ dữ liệu được lưu trữ tại một máy hoặc nhiều máy, người dùng từ xa có thểtruy cập vào CSDL thông qua các phương tiện truyền thông dữ liệu Với một hệ CSDLtập trung, tất cả các dữ liệu được định vị tại một trạm đơn lẻ Những người sử dụng tạicác trạm từ xa nói chung có thể truy nhập CSDL thông qua các công cụ truyền thông dữliệu
Hệ CSDL cá nhân: Các hệ CSDL cá nhân thường một người sử dụng đơn lẻ mà họ
vừa thiết kế và tạo lập cơ sở dữ liệu, vừa cập nhật CSDL và bảo trì cơ sở dữ liệu Nóicách khác, họ là vừa người quản trị CSDL đồng thời là người viết chương trình, đồng thờicũng là người sử dụng cuối của hệ
Hệ CSDL sở dữ liệu trung tâm: Trong các tổ chức lớn, dữ liệu mà hầu hết các ứng
dụng có thể truy nhập được lưu trữ trên một máy tính trung tâm Trong nhiều hệ thống,những người sử dụng từ xa có thể truy nhập CSDL này thông qua các thiết bị đầu cuối vàcác móc nối truyền dữ liệu Tuỳ thuộc vào qui mô tổ chức, máy tính trung tâm này thường
là một dàn hay một máy vi tính Các hệ CSDL trung tâm thường lưu trữ các CSDL tíchhợp rất lớn và được nhiều người sử dụng truy nhập Các ứng dụng điển hình như hệ thốngbán vé máy bay, hệ thống tàu hoả
Hệ CSDL khách/chủ : Một kiến trúc khách/chủ được thiết kế với sự phân tải công
việc trên một mạng máy tính trong đó các máy khách có thể chia sẽ các dịch vụ của mộtmáy chủ đơn lẻ Một máy chủ là một ứng dụng phần mềm cung cấp các dịch vụ quản lýtệp hay cơ sở dữ liệu, quản lý truyền thông đối với các máy khách đang yêu cầu Mộtmáy khách là một ứng dụng phần mềm yêu cầu các dịch vụ từ một hay nhiều máy chủ.Thông thường, ứng dụng máy chủ (máy chủ CSDL) được định vị trên một máy tính riêngtrong mạng cục bộ
2.1.3 Cơ sở dữ liệu phân tán
Trang 152.1.3.1 CSDL phân tán
Một CSDL Phân tán là sự tập hợp dữ liệu phân tán về mặt luận lý chúng cùng một
hệ thống nhưng được trải rộng ở nhiều nơi (site) của một mạng máy tính.
Một CSDL phân tán là một tập hợp nhiều CSDL có liên đới logic và được phân bốtrên một mạng máy tính
- Tính chất phân tán: Toàn bộ dữ liệu của CSDL phân tán không được cư trú ở một
nơi mà cư trú ra trên nhiều trạm thuộc mạng máy tính, điều này giúp chúng ta phânbiệt CSDL phân tán với CSDL tập trung đơn lẻ
- Tương quan logic: Toàn bộ dữ liệu của CSDL phân tán có một số các thuộc tính
ràng buộc chúng với nhau, điều này giúp chúng ta có thể phân biệt một CSDLphân tán với một tập hợp CSDL cục bộ hoặc các tệp cư trú tại các vị trí khác nhautrong một mạng máy tính
Hình 2 1: Môi trường Hệ CSDL phân tán
Trong hệ thống CSDL phân tán gồm nhiều trạm, mỗi trạm có thể khai thác cácgiao tác truy nhập dữ liệu trên nhiều trạm khác Đặc điểm chính của CSDL phân tán làchia sẻ tài nguyên, tính mở, khả năng song song, khả năng mở rộng, khả năng thứ lỗi, tínhtrong suốt, đảm bảo tin cậy và nhất quán
2.1.3.2 Kiến trúc cơ bản của CSDL phân tán
Đây không là kiến trúc tường minh cho tất cả các CSDL phân tán, tuy vậy kiếntrúc này thể hiện tổ chức của bất kỳ một CSDL phân tán nào
Trạm 1
Trạm 2
Trạm 3Trạm 4
Trạm 5
Mạng truyền dữ liệu
Trang 16- Sơ đồ tổng thể: Định nghĩa tất cả các dữ liệu sẽ được lưu trữ trong CSDL phân tán.
Trong mô hình quan hệ, sơ đồ tổng thể bao gồm định nghĩa của các tập quan hệtổng thể
- Sơ đồ phân đoạn: Mỗi quan hệ tổng thể có thể chia thành một vài phần không gối
lên nhau được gọi là đoạn (fragments) Có nhiều cách khác nhau để thực hiện việcphân chia này Ánh xạ (một - nhiều) giữa sơ đồ tổng thể và các đoạn được địnhnghĩa trong sơ đồ phân đoạn
- Sơ đồ định vị: Các đoạn là các phần logic của quan hệ tổng thể được định vị vật lý
trên một hoặc nhiều vị trí trên mạng Sơ đồ định vị định nghĩa đoạn nào định vị tạicác vị trí nào Lưu ý rằng kiểu ánh xạ được định nghĩa trong sơ đồ định vị quyếtđịnh CSDL phân tán là dư thừa hay không
- Sơ đồ ánh xạ địa phương: Ánh xạ các ảnh vật lý và các đối tượng được lưu trữ tại
một trạm (tất cả các đoạn của một quan hệ tổng thể trên cùng một vị trí tạo ra mộtảnh vật lý)
Hình 2 2: Kiến trúc cơ bản của CSDL phân tán
2.1.3.3 Các đặc điểm chính của cơ sở dữ liệu phân tán
(1) Chia sẻ tài nguyên
Việc chia sẻ tài nguyên của hệ phân tán được thực hiện thông qua mạng truyềnthông Để chia sẻ tài nguyên một cách có hiệu quả thì mỗi tài nguyên cần được quản lýbởi một chương trình có giao diện truyền thông, các tài nguyên có thể được truy cập, cập
Trang 17nhật một cách tin cậy và nhất quán Quản lý tài nguyên ở đây là lập kế hoạch dự phòng,đặt tên cho các lớp tài nguyên, cho phép tài nguyên được truy cập từ nơi này đến nơikhác, ánh xạ lên tài nguyên vào địa chỉ truyền thông,
(2) Tính mở
Tính mở của hệ thống máy tính là dễ dàng mở rộng phần cứng (thêm các thiết bịngoại vi, bộ nhớ, các giao diện truyền thông ) và các phần mềm (các mô hình hệ điềuhành, các giao thức truyền tin, các dịch vụ chung tài nguyên, ) Một hệ phân tán có tính
mở là hệ có thể được tạo từ nhiều loại phần cứng và phần mềm của nhiều nhà cung cấpkhác nhau với điều kiện là các thành phần này phải theo một tiêu chuẩn chung
Tính mở của hệ phân tán được xem xét thao mức độ bổ sung vào các dịch vụ dùngchung tài nguyên mà không phá hỏng hay nhân đôi các dịch vụ đang tồn tại Tính mởđược hoàn thiện bằng cách xác định hay phân định rõ các giao diện chính của một hệ vàlàm cho nó tương thích với các nhà phát triển phần mềm Tính mở của hệ phân tán dựatrên việc cung cấp cơ chế truyền thông giữa các tiến trình và công khai các giao diện dùng
để truy cập các tài nguyên chung
(3) Khả năng song song
Hệ phân tán hoạt động trên một mạng truyền thông có nhiều máy tính, mỗi máy cóthể có một hay nhiều CPU Trong cùng một thời điểm nếu có N tiến trình cùng tồn tại, tanói chúng thực hiện đồng thời Việc thực hiện tiến trình theo cơ chế phân chia thời gian(một CPU) hay song song (nhiều CPU)
Khả năng làm việc song song trong hệ phân tán được thực hiện do hai tình huống sau:
- Nhiều người sử dụng đồng thời ra các lệnh hay các tương tác với các chương trình ứngdụng
- Nhiều tiến trình Server chạy đồng thời, mỗi tiến trình đáp ứng các yêu cầu từ các tiếntrình Client khác
(4) Khả năng mở rộng
Hệ phân tán có khả năng hoạt động tốt và hiệu quả ở nhiều mức khác nhau Một hệphân tán nhỏ nhất có thể hoạt động chỉ cần hai trạm làm việc và một File Server Các hệlớn hơn tới hàng nghìn máy tính Khả năng mở rộng được đặc trưng bởi tính không thay
Trang 18đổi phần mềm hệ thống và phần mềm ứng dụng khi hệ được mở rộng Điều này chỉ đạtđược mức độ nào đó với hệ phân tán hiện tại Yêu cầu việc mở rộng không chỉ là sự mởrộng về phần cứng, về mạng mà nó trải trên các khía cạnh khi thiết kế hệ phân tán.
(5) Khả năng thứ lỗi
Việc thiết kế khả năng thứ lỗi của các hệ thống máy tính dựa trên hai giải pháp:
- Dùng khả năng thay thế để đảm bảo sự hoạt động liên tục và hiệu quả
- Dùng các chương trình hồi phục khi xảy ra sự cố
Xây dựng một hệ thống có thể khắc phục sự cố theo cách thứ nhất thì người ta nốihai máy tính với nhau để thực hiện cùng một chương trình, một trong hai máy chạy ở chế
độ Standby (không tải hay chờ) Giải pháp này tốn kém vì phải nhân đôi phần cứng của
hệ thống Một giải pháp để giảm phí tổn là các Server riêng lẻ được cung cấp các ứngdụng quan trọng để có thể thay thế nhau khi có sự cố xuất hiện Khi không có các sự cốcác Server hoạt động bình thường, khi có sự cố trên một Server nào đó, các ứng dụngClient tự chuyển hướng sang các Server còn lại Cách hai thì các phần mềm hồi phụcđược thiết kế sao cho trạng thái dữ liệu hiện thời (trạng thái trước khi xảy ra sự cố) có thểđược khôi phục khi lỗi được phát hiện Các hệ phân tán cung cấp khả năng sẵn sàng cao đểđối phó với các sai hỏng phần cứng
(6) Tính trong suốt
Tính trong suốt của một hệ phân tán được hiểu như là việc che khuất đi các thànhphần riêng biệt của hệ đối với người sử dụng và những người lập trình ứng dụng
Tính trong suốt về vị trí: Người sử dụng không cần biết vị trí vật lý của dữ liệu.
Người sử dụng có quyền truy cập tới đến cơ sở dữ liệu nằm bất kỳ tại vị trí nào Các thaotác lấy, cập nhật dữ liệu tại một điểm dữ liệu ở xa được tự động thực hiện bởi hệ thống tạiđiểm đưa ra yêu cầu, người sử dụng không cần biết đến sự phân tán của cơ sở dữ liệu trênmạng
Tính trong suốt trong việc sử dụng: Việc chuyển đổi của một phần hay toàn bộ cơ
sở dữ liệu do thay đổi về tổ chức hay quản lý, không ảnh hưởng tới thao tác người sửdụng
Trang 19Tính trong suốt của việc phân chia: Nếu dữ liệu được phân chia do tăng tải, nó
không được ảnh hưởng tới người sử dụng
Tính trong suốt của sự trùng lặp: Nếu dữ liệu trùng lặp để giảm chi phí truyền
thông với cơ sở dữ liệu hoặc nâng cao độ tin cậy, người sử dụng không cần biết đến điềuđó
(7) Đảm bảo tin cậy và nhất quán
Hệ thống yêu cầu độ tin cậy cao: Sự bí mật của dữ liệu phải được bảo vệ, các chứcnăng khôi phục hư hỏng phải được đảm bảo Ngoài ra yêu cầu của hệ thống về tính nhấtquán cũng rất quan trọng trong thể hiện: Không được có mâu thuẫn trong nội dung dữ liệu.Khi các thuộc tính dữ liệu là khác nhau thì các thao tác vẫn phải nhất quán
2.1.3.4 Mục đích của việc sử dụng CSDL phân tán
Xuất phát từ yêu cầu thực tế về tổ chức và kinh tế: Trong thực tế nhiều tổ chức là
không tập trung, dữ liệu ngày càng lớn và phục vụ cho đa người dùng nằm phân tán, vìvậy CSDL phân tán là con đường thích hợp với cấu trúc tự nhiên của các tổ chức đó Đây
là một trong những yếu tố quan trọng thúc đẩy việc phát triển CSDL phân tán
Sự liên kết các CSDL địa phương đang tồn tại: CSDL phân tán là giải pháp tự
nhiên khi có các CSDL đang tồn tại và sự cần thiết xây dựng một ứng dụng toàn cục.Trong trường hợp này CSDL phân tán được tạo từ dưới lên dựa trên nền tảng CSDL đangtồn tại Tiến trình này đòi hỏi cấu trúc lại các CSDL cục bộ ở một mức nhất định Dù sao,những sửa đổi này vẫn là nhỏ hơn rất nhiều so với việc tạo lập một cở sở dữ liệu tập trunghoàn toàn mới
Làm giảm tổng chi phí tìm kiếm: Việc phân tán dữ liệu cho phép các nhóm làm
việc cục bộ có thể kiểm soát được toàn bộ dữ liệu của họ Tuy vậy, tại cùng thời điểmngười sử dụng có thể truy cập đến dữ liệu ở xa nếu cần thiết Tại các vị trí cục bộ, thiết bịphần cứng có thể chọn sao cho phù hợp với công việc xử lý dữ liệu cục bộ tại điểm đó
Sự phát triển mở rộng: Các tổ chức có thể phát triển mở rộng bằng cách thêm các
đơn vị mới, vừa có tính tự trị, vừa có quan hệ tương đối với các đơn vị tổ chức khác Khi
Trang 20đó giải pháp CSDL phân tán hỗ trợ một sự mở rộng uyển chuyển với một mức độ ảnhhưởng tối thiểu tới các đơn vị đang tồn tại
Trả lời truy vấn nhanh: Hầu hết các yêu cầu truy vấn dữ liệu từ người sử dụng tại
bất kỳ vị trí cục bộ nào đều thoả mãn dữ liệu ngay tại thời điểm đó
Độ tin cậy và khả năng sử dụng nâng cao: Nếu có một thành phần nào đó của hệ
thống bị hỏng, hệ thống vẫn có thể duy trì hoạt động
Khả năng phục hồi nhanh chóng: Việc truy nhập dữ liệu không phụ thuộc vào một
máy hay một đường nối trên mạng Nếu có bất kỳ một lỗi nào hệ thống có thể tự độngchọn đường lại qua các đường nối khác
2.1.3.5 Ưu điểm của CSDL phân tán
CSDL tập trung cùng với CSDL không qua thiết kế hình thành trước khi có CSDLphân tán Hai hình thức này phát triển trên cơ sở tự phát và hệ thống tập trung Như vậyhai hình thức này không đáp ứng được yêu cầu tổ chức và công việc trên phạm vi lớn.CSDL phân tán được thiết kế khác CSDL tập trung Do đó các đặc trưng của cơ sở dữ liệuphân tán ta thấy được lợi ích của CSDL phân tán
Đầu tư cho từng bộ phận là nhỏ, có thể vừa vận hành vừa đầu tư thêm dần
Các bộ phận chỉ ảnh hưởng nhau một cách hạn chế, nếu một bộ phận gặp vấn đề thìchỉ ảnh hưởng một cụm xung quanh nó, còn các nơi khác vẫn tiếp tục hoạt độngbình thường
Xử lí công việc đơn giản, không đòi hỏi nhiều năng lực ( trình độ đầu óc, cơ sở hạtầng)
Lợi điểm về tổ chức và tính kinh tế: Tổ chức phân tán nhiều chi nhánh và dùng cơ
sở dữ liệu phân tán phù hợp với các tổ chức kiểu này Với vai trò là động lực thúcđẩy kinh tế thương mại phát triển rộng hơn, thì việc phát triển các trung tâm máytính phân tán ở nhiều vị trí trở thành nhu cầu cần thiết
Tận dụng những cơ sở dữ liệu sẵn có: Hình thành cơ sở dữ liệu phân tán từ các cơ
sở dữ liệu tập trung có sẵn ở các vị trí địa phương
Thuận lợi cho nhu cầu phát triển: Xu hướng dùng cơ sở dữ liệu phân tán sẽ cung
cấp khả năng phát triển thuận lợi hơn và giảm được xung đột về chức năng giữa
Trang 21các đơn vị đã tồn tại và giảm được xung đột giữa các chương trình ứng dụng khitruy cập đến cơ sở dữ liệu Với hướng tập trung hoá, nhu cầu phát triển trong tươnglai sẽ gặp khó khăn
Giảm chi phí truyền thông: Trong cơ sở dữ liệu phân tán chương trình ứng dụng đặt
ở địa phương có thể giảm bớt được chi phí truyền thông khi thực hiện bằng cáchkhai thác cơ sở dữ liệu tại chỗ
Tăng số công việc thực hiện: Hệ cơ sở dữ liệu phân tán có thể tăng số lượng công
việc thực hiện qua áp dụng nguyên lý xử lý song song với hệ thống xử lý đa nhiệm.Tuy nhiên cơ sở dữ liệu phân tán cũng có tiện lợi trong việc phân tán dữ liệu nhưtạo ra các chương trình ứng dụng phụ thuộc vào tiêu chuẩn mở rộng vị trí làm chocác nơi xử lý có thể hỗ trợ lẫn nhau Do đó tránh được hiện tượng tắc nghẽn cổchai trong mạng truyền thông hoặc trong các dịch vụ thông thường của toàn bộ hệthống
Tính dễ hiểu và sẵn sàng: Hướng phát triển cơ sở dữ liệu phân tán cũng nhằm đạt
được tính dễ hiểu và tính sẵn sàng cao hơn Tuy nhiên để đạt được mục tiêu nàykhông phải là dễ làm và đòi hỏi sử dụng kỹ thuật phức tạp Khả năng xử lý tự trịcủa các điểm làm việc khác nhau không đảm bảo tính dễ sử dụng
Dữ liệu có tính tin cậy cao vì khi một nút gặp sự cố, có thể khôi phục được dữ liệu
tại đây do bản sao của nó có thể được lưu trữ tại một trạm khác nữa
Cho phép mở rộng các tổ chức một cách linh hoạt Có thể thêm nút mới vào mạng
máy tính mà không ảnh hưởng tới hoạt động của các nút sẵn có
Giảm dư thừa dữ liệu: Trong CSDL tập trung, tính dư thừa hạn chế được càng
Trong CSDL truyền thống tính dư thừa dữ liệu cũng cần quan tâm vì:
Trang 22- Tính cục bộ của chương trình ứng dụng sẽ tăng nếu dữ liệu đặt ở mọi nơi màchương trình ứng dụng cần.
- Khả năng sẵn sàng của hệ thống cao bởi vì khi có lỗi ở một nơi nào đó trong hệthống thì không cản trở hoạt động của chương trình ứng dụng Nói chung,nguyên nhân đối lập với tính dư thừa đưa ra trong môi trường truyền thống vẫncòn đúng cho hệ thống phân tán và vì vậy công việc định giá mức độ tốt củatính dư thừa đòi hỏi định giá lại công việc lựa chọn mức độ dư thừa dữ liệu.CSDL phân tán khắc phục được hai nhược điểm này vì dữ liệu được chia rathành nhiều phần nhỏ và chỉ có một bản sao logic tổng thể duy nhất để tiện choviệc truy cập dữ liệu
Cấu trúc vật lý và khả năng truy cập: Người sử dụng truy cập đến CSDL tập trung
phải thông qua cấu trúc truy cập phức tạp: định vị cơ sở dữ liệu, thiết lập đườngtruyền Trong CSDL phân tán, cấu trúc truy cập phức tạp không phải là công cụchính để truy cập hiệu quả đến cơ sở dữ liệu Hiệu quả có nghĩa là thời gian tìmkiếm và chuyển dữ liệu nhỏ nhất, chi phí truyền thông thấp nhất Mỗi cách thứctruy cập CSDL phân tán viết bởi người lập trình hoặc tạo ra bởi một bộ tối ưu.Công việc viết ra một cách thức truy cập CSDL phân tán cũng giống như viếtchương trình duyệt trong CSDL tập trung Công việc mà chương trình duyệt nàylàm là xác định xem có thể truy cập đến được bao nhiêu cơ sở dữ liệu
Hai nguyên nhân về mặt kỹ thuật đáp ứng cho sự phát triển hệ cơ sở dữ liệu phân tán:
- Công nghệ tạo ra máy tính nhỏ và nền tảng phần cứng có khả năng phục vụ xâydựng hệ thống thông tin phân tán
- Kỹ thuật thiết kế hệ cơ sở dữ liệu phân tán được phát triển vững chắc dựa trên hai
kỹ thuật thiết kế chính là Top-down và Bottom-up từ những năm thập kỷ 60
- Kỹ thuật thiết kế cơ sở dữ liệu phân tán phức tạp nhưng hệ cơ sở dữ liệu phân táncũng cần thiết cho xu hướng phát triển kinh tế hiện nay
Công ty tận dụng được mọi ưu thế của công ty, phát triển của công ty một cách toàn diện,
từ tổng công ty đến các chi nhánh Công ty có thể đáp ứng được tất cả các hợp đồng củakhách hàng trên tất cả các vùng miền mà không sợ quá tải, doanh thu của công ty ngày
Trang 23càng tăng Công ty phát triển rộng trên các vùng miền, công ty có thể mở thêm các chinhánh trên các vùng, miền khác nhau để thực hiện các hợp đồng một cách nhanh và tốtnhất Mà sự điều hành của tổng công ty với các chi nhánh gần như là một cách độc lập,làm cho việc thực hiện ngày càng có hiệu quả hơn.
2.1.3.6 Nhược điểm của CSDL phân tán
Chỉ áp dụng cho những công ty có nhiều chi nhánh và chuỗi các nhà hàng
Việc thiết kế CSDL phân tán phức tạp hơn việc thiết kế CSDL tập trung
Mô hình phân tán tiềm tàng các mô thuẫn nội bộ: Có khi thông tin từ các bộ phận
không khớp nhau hoặc nhiều bộ phận cùng làm một việc và bị thừa, trùng lặp
Tính biệt lập và an toàn: trong CSDL truyền thống, người quản trị hệ thống có
quyền điều khiển tập trung, người sử dụng có chắc chắn được phân quyền mới truycập vào được dữ liệu Điểm quan trọng là trong cách tiếp cận CSDL tập trung,không cần thủ tục điều khiển chuyên biệt Trong CSDL phân tán, những người quảntrị địa phương cũng phải giải quyết vấn đề tương tự như người quản trị CSDL truyềnthống
Tuy nhiên, hai vấn đề đặc biệt sau đây của CSDL phân tán có ý nghĩa quan trọng khi
đề cập đến:
- Thứ nhất trong CSDL phân tán với cấp độ tự trị cao ở mỗi điểm, người có dữ liệuđịa phương sẽ cảm thấy an toàn hơn vì họ có thể tự bảo vệ dữ liệu của mình thay
vì phụ thuộc vào người quản trị hệ thống tập trung
- Thứ hai, vấn đề an toàn thực chất với hệ thống phân tán không giống như các hệthống thông thường khác mà còn liên quan đến mạng truyền thông
Như vậy trong CSDL phân tán vấn đề an toàn CSDL phức tạp hơn và đòi hỏi nhiều
kỹ thuật bảo vệ Nguyên nhân gây ra là hệ thống này có tính mở và nhiều ngườidùng trong cùng hệ thống sử dụng nhiều cơ sở dữ liệu
Tính toàn vẹn, hồi phục và điều khiển tương tranh: Mặc dù trong cơ sở dữ liệu, tính
toàn vẹn, hồi phục và điều khiển đồng thời liên quan nhiều vấn đề liên quan lẫnnhau Mở rộng hơn vấn đề này là việc cung cấp các giao tác Giao tác là đơn vị cơ
Trang 24bản của việc thực hiện: giao tác cụ thể là bó công việc được thực hiện toàn bộ hoặckhông được thực hiện.
Trong CSDL phân tán, vấn đề điều khiển giao tác tự trị có ý nghĩa quan trọng: hệ
thống điều phối phải chuyển đổi các quỹ thời gian cho các giao tác liên tiếp Nhưvậy giao tác tự trị là phương tiện đạt được sự toàn vẹn trong CSDL Có hai mối nguyhiểm của giao tác tự trị là lỗi và tương tranh
Từ kết quả nghiên cứu về thực trạng quản trị CSDL tập trung của Công ty Cổ phầnPhát triển và Ứng dụng Công nghệ AIT, để khắc phục những hạn chế của hệ quản trịCSDL tập trung, ta có thể chuyển đổi sang hệ quản trị CSDL phân tán, tối ưu nhất là sửdụng mô hình kiến trúc của hệ phân tán khách/đại lý
2.1.3.7 Hệ quản trị CSDL phân tán(Distributed DBMS)
Hệ quản trị CSDL phân tán (Distributed Database Management System-DBMS)được định nghĩa là một hệ thống phần mềm cho phép quản lý các hệ CSDL (tạo lập vàđiều khiển các truy nhập cho các hệ CSDL phân tán) và làm cho việc phân tán trở nêntrong suốt với người sử dụng Đặc tính vô hình muốn nói đến sự tách biệt về ngữ nghĩa ởcấp độ cao của một hệ thống với các vấn đề cài đặt ở cấp độ thấp Sự phân tán dữ liệuđược che dấu với người sử dụng làm cho người sử dụng truy nhập vào CSDL phân tánnhư hệ CSDL tập trung Sự thay đổi việc quản trị không ảnh hưởng tới người sử dụng
Hệ quản trị CSDL phân tán gồm 1 tập các phần mềm (chương trình) sau đây:
- Các chương trình quản trị các dữ liệu phân tán
- Chứa các chương trình để quản trị việc truyền thông dữ liệu
- Các chương trình để quản trị các CSDL địa phương
- Các chương trình quản trị từ điển dữ liệu
Để tạo ra một hệ CSDL phân tán (Distributed Database System-DDBS) các tập tinkhông chỉ có liên đới logic chúng còn phải có cấu trúc và được truy xuất qua một giaodiện chung Môi trường hệ CSDL phân tán là môi trường trong đó dữ liệu được phân tántrên một số vị trí
2.1.3.8 Mô hình kiến trúc của hệ quản trị CSDL phân tán
Mô hình kiến trúc của hệ phân tán khách/ Đại lý – Client/server
Trang 25Các hệ quản trị CSDL khách / đại lý xuất hiện vào đầu những năm 90 và có ảnhhưởng rất lớn đến công nghệ DBMS và phương thức xử lý tính toán.
Đặc trưng của hệ này là chức năng của hệ thống được chia làm 2 lớp:
- Chức năng đại lí – server function
- Chức năng khách hàng – client function
Nó cung cấp kiến trúc hai cấp, tạo dễ dàng cho việc quản lý mức độ phức tạp củacác DBMS hiện đại và độ phức tạp của việc phân tán dữ liệu
Đại lý thực hiện phần lớn công việc quản lý dữ liệu Điều này có nghĩa là tất cảmọi việc xử lý và tối ưu hoá vấn tin, quản lý giao dịch và quản lý thiết bị lưu trữ đượcthực hiện tại đại lý Khách hàng, ngoài ứng dụng và giao diện sẽ có modun DBMS kháchchịu trách nhiệm quản lý dữ liệu được gửi đến cho bên khách và đôi khi việc quản lý cáckhoá chốt giao dịch cũng có thể giao cho nó Kiến trúc được mô tả bởi hình dưới rất thôngdụng trong các hệ thống quan hệ, ở đó việc giao tiếp giữa khách và đại lý nằm tại mứccâu lệnh SQL Nói cách khác, khách hàng sẽ chuyển các câu vấn tin SQL cho đại lý màkhông tìm hiểu và tối ưu hoá chúng Đại lý thực hiện hầu hết công việc và trả quan hệ kếtquả về cho khách hàng
Có một số loại kiến trúc khách/ đại lý khác nhau Loại đơn giản nhất là trường hợp
có một đại lý được nhiều khách hàng truy xuất Chúng ta gọi loại này là nhiều khách mộtđại lý Một kiến trúc khách/ đại lý phức tạp hơn là kiến trúc có nhiều đại lý trong hệ thống(được gọi là nhiều khách nhiều đại lý) Trong trường hợp này chúng ta có hai chiến lượcquản lý: hoặc mỗi khách hàng tự quản lý nối kết của nó với đại lý hoặc mỗi khách hàngchỉ biết đại lý “ruột” của nó và giao tiếp với các đại lý khác qua đại lý đó khi cần Lối tiếpcận thứ nhất làm đơn giản cho các chương trình đại lý nhưng lại đặt gánh nặng lên cácmáy khách cùng với nhiều trách nhiệm khác Điều này dẫn đến tình huống được gọi là các
hệ thống khách tự phục vụ Lối tiếp cận sau tập trung chức năng quản lý dữ liệu tại đại lý
Vì thế sự vô hình của truy xuất dữ liệu được cung cấp qua giao diện của đại lý
Từ góc độ tính logíc cả dữ liệu, DBMS khách/ đại lý cung cấp cùng một hình ảnh
dữ liệu như các hệ ngang hàng sẽ được thảo luận ở phần tiếp theo Nghĩa là chúng chongười sử dụng thấy một hình ảnh về một CSDL logic duy nhất, còn tại mức vật lý nó có
Trang 26thể phân tán Vì thế sự phân biệt chủ yếu giữa các hệ khách/đại lý và ngang hàng khôngphải ở mức vô hình được cung cấp cho người dùng và cho ứng dụng mà ở mô hình kiếntrúc được dùng để nhận ra mức độ vô hình này.
Trong hệ thống khách/ đại lý các thao tác xử lý dữ liệu đáp ứng yêu cầu của kháchhàng đều được thực hiện bởi chức năng đại lý, chỉ có kết quả được gửi trả cho kháchhàng
Hệ khách có các tầng:
- Giao diện tương tác với người sử dụng ( User Interface), các chương trình ứngdụng ( Application Program),
- Hệ quản trị cơ sở dữ liệu khách hàng( Client DBMS)
- Các phần mềm mạng có chức năng truyền tin( Communication Software)
Hệ đại lý có các tầng:
- Các phần mềm mạng có chức năng truyền tin
- Tầng kiểm soát ngữ nghĩa của dữ liệu( Semantic Data Controller)
- Tầng tối ưu hóa câu hỏi( Query Optimizer)
- Tầng quản lý các giao tác (Transaction Manager)
- Tầng quản lý khôi phục( Recovery Manager )
- Tầng hỗ trợ thực thi( Run – time Support Processor)
- Hệ điều hành quản lý chung và giao tiếp với cơ sở dữ liệu vật lý
Hình 2 3: Sơ đồ hệ phân tán client/ server
Trang 27Ưu điểm của hệ client/ server là xử lý dữ liệu tập trung, trên đường truyền chỉ cócác gói tin yêu cầu( câu hỏi) và các kết quả đáp ứng câu hỏi, giảm tải được khối lượngtruyền tin trên mạng kết hợp với thiết bị tại đại lý rất mạnh sẽ tăng tốc độ xử lý dứ liệucủa hệ thống
Mô hình hệ phân tán hàng ngang
Mô hình client / server phân biệt client (nơi yêu cầu dịch vụ) và server (nơi phục
vụ các yêu cầu) Nhưng mô hình xử lý ngang hàng, các hệ thống tham gia có vai trò nhưnhau Chúng có thể yêu cầu vừa dịch vụ từ một hệ thống khác hoặc vừa trở thành nơicung cấp dịch vụ Một cách lý tưởng, mô hình tính toán ngang hàng cung cấp cho xử lýhợp tác giữa các ứng dụng có thể nằm trên các phần cứng hoặc hệ điều hành khác nhau
Mục đích của môi trường xử lý ngang hàng là để hỗ trợ các CSDL được nối mạng.Như vậy người sử dụng DBMS sẽ có thể truy cập tới nhiều CSDL không đồng nhất
Hình 2 4: Sơ đồ kiến trúc của hệ phân tán hàng ngang
Đặc điểm nổi bật của hệ thống này dữ liệu được tổ chức ở các nút có chức năngnhư nhau, đồng thời sự tổ chức dữ liệu ở các nút này lại có thể rất khác nhau, từ đó cầnphải có:
Trang 28- Định nghĩa dữ liệu tại mỗi vị trí: tại mỗi nút phải xây dựng lược đồ dữ liệu cục bộLIS ( Local Internal Schema)
- Mô tả cấu trúc logic toàn cục tại mỗi vị trí, điều này xảy ra do nhân bản và phânmảnh, gọi là lược đồ khái niệm cục bộ LC (Local Conceptual Schema)
- Mô tả cấu trúc dữ liệu của các ứng dụng gọi là lược đồ ngoại giới ES (ExternalSchema)
Cấu trúc hệ thống gồm 2 thành phần chính: Bộ tiếp nhận người dùng (User Processor ) và
Bộ phận xử lý dữ liệu (Data Processor) Hai modun này được đặt chung trên mỗi máy chứkhông tách biệt như hệ thống khách/ đại lý
Các chức năng cơ bản của từng modun như sau:
- User Interface Handler – Giao tiếp người sử dụng: Diễn dịch yêu cầu định dạng kếtquả
- Semantic Data Controler – Kiểm soát dữ liệu ngữ nghĩa: Dựa vào lược đồ kháiniệm toàn cục để kiểm tra câu vấn tin có thực hiện hay không
- Global Query Optimizer – Tối ưu hóa câu hỏi toàn cục: Định ra chiến lược thực thitốt nhất trên các nút
- Global Execution Monitor – Điều khiển thực thi câu vấn tin toàn cục
- Lobal Query Pocessor – Xử lý câu hởi cục bộ
- Local Recovery manager – Quản lý khôi phục cục bộ: Quản lý sự nhất quán khi có
Trang 29Hình 2 5: Sơ đồ kiến trúc của hệ phân tán phức hợp
2.2 Tổng quan về công ty cổ phần phát triển và ứng dụng công nghệ AIT.
2.2.1 Giới thiệu về AIT
- Địa chỉ giao dịch
Địa chỉ: Số 6, Ngách 80/48 Phố Hoàng Đạo Thành, Quận Thanh Xuân, Hà Nội Văn Phòng đại diện: P705 CT4-5, Khu Đô Thị Yên Hòa, Cầu Giấy, Hà Nội
Tell: 84-43-7822526, Fax: 84-43-7822599
Email: office@aitc.vn, Website: www.aitc.vn
Giấy phép kinh doanh số 0103012247 do Sở Kế hoạch Đầu tư Hà Nội cấp ngày15/5/2006
Công ty có liên kết với các chi nhánh ASP và ADK để thực hiện dự án
- Ngành , nghề kinh doanh:
+ Nghiên cứu, sản xuất phần mềm tin học, phần mềm chuyên dụng
+ Nghiên cứu, sản xuất và lắp ráp máy tính, thiết bị mạng, thiết bị bảo vệ, thiết bịkiểm tra, giám sát, thiết bị thu thập dữ liệu, thiết bị an toàn, bảo mật thông tin vàcác thiết bị điều khiển khác
Trang 30+ Tư vấn thiết kế hệ thống, chuyển giao công nghệ và giải pháp trong lĩnh vực:khoa học kỹ thuật; công nghệ thông tin; tự động hoá; điện, điện tử, điện lạnh; giáodục và đào tạo (Không bao gồm thiết kế công trình xây dựng)
+ Buôn bán các sản phẩm phần mềm, máy tính, thiết bị mạng, thiết bị bảo vệ,thiết bị kiểm tra, giám sát, thiết bị thu thập dữ liệu, thiết bị an toàn , bảo mật thôngtin, thiết bị văn phòng và các thiết bị điều khiển khác và các vật tư, thiết bị, máymóc thuộc các lĩnh vực: khoa học kỹ thuật; công nghệ thông tin; viễn thông, tựđộng hoá; điện, điện tử, điện lạnh; y tế, dầu khí, năng lượng, công nghiệp, giáo dụcđào tạo, ngành nước và môi trường
- Đào tạo nhân lực về công nghệ thông tin, viễn thông, tự động hoá
2.2.2 Thực trạng tình hình ứng dụng công nghệ thông tin tại Công ty Cổ phần Phát triển và Ứng dụng Công nghệ AIT.
Phần cứng
Về trang thiết bị phần cứng tại công ty: Công ty có 2 máy chủ, 1 máy được đặt ởtổng công ty và 1 máy ở văn phòng đại diện Mỗi phòng ban được trang bị máy tính bàncho nhân viên Tất cả đều được kết nối trực tiếp vào mạng internet thông qua các cổngmạng đã lắp đặt sẵn Công ty rất chú trọng đầu tư cở sở hạ tầng CNTT, cụ thể là tỷ lệ sốmáy tính/tổng số nhân viên, công chức = 45/45
- Số máy tính kết nối vào mạng nội bộ: 45 máy
- Số máy tính kết nối Internet: 45 máy
- Số phòng ban được kết nối vào mạng nội bộ: tất cả các phòng
Hệ thống phần cứng mạng: card mạng, modem, thiết bị mạng (hub, switch ), cápmạng kết nối tới các máy tính trong công ty Các trang thiết bị liên quan dùng cho hoạtđộng kinh doanh như: máy in, máy fax, máy photo…
Phần mềm
Công ty đã và đang sử dụng một số phần mềm như:
- Hệ điều hành máy chủ: Microsoft Windows Server 2003, Windows 2000Advanced Server…
Trang 31- Hệ điều hành máy khách: Windows 98, Windows 2000 Professional, Windows
2007 các phiên bản,…
- Hệ quản trị Web server: Apache Web Server hoặc Internet Information Server
- Hệ quản trị Cơ sở dữ liệu: Oracle và Microsoft visual studio
Về các phần mềm ứng dụng thì bao gồm các phần mềm quản lý văn phòng cơ bảnnhư word 2003, excel, powerpoint phần mềm chuyên dụng của công ty được cài đặt chomỗi máy tính để quản lý các báo cáo từ kế toán, tình hình hoạt động kinh doanh,…
Phần mềm ứng dụng chuyên biệt: Phần mềm MySQL, Microsoft visual studio,Ration Rose,…lập kế hoạch, phân tích thiết kế, lập trình và kiểm thử các chương trình của
dự án Phần mềm Kế toán Doanh nghiệp vừa và nhỏ MISA SME.NET 2010 là phần mềm
kế toán hỗ trợ đắc lực trong nghiệp vụ kế toán cũng như quản lý doanh nghiệp, phần mềmtuân thủ theo đúng chế độ kế toán, tự động hóa toàn bộ các khâu kế toán từ khâu lậpchứng từ, hạch toán, báo cáo Ngoài ra, các phần mềm có tính an toàn và bảo mật tốt, đơngiản, dễ sử dụng
Về website của đơn vị Website được ra đời vào năm 2006 do công ty tự xây dựng.Website cung cấp tất cả các tính năng giúp các nhà lãnh đạo điều hành công việc, nhânviên có thể tìm hiểu thông tin khách hàng, khách hàng tìm hiểu và giao dịch với công ty…Website còn cung cấp tính năng chăm sóc khách hàng, tư vấn cho khách hàng khi họ yêucầu Chưa có giao dịch trực tuyến giữa khách hàng và công ty qua website, khách hàngchỉ có thể tìm hiểu thông tin về doanh nghiệp
Việc ứng dụng công nghệ thông tin đã mang lại bước đột phá mới cho công tácquản lý tài chính- kế toán, giúp công ty nắm bắt thông tin về tài chính, ngân sách, quỹ tổchức… một cách chính xác và kịp thời Từ đó bộ phận kế toán có thể đưa ra các kế hoạch
và quyết định đúng đắn, giảm chi phí và tăng khả năng cạnh tranh, nâng cao kết quả hoạtđộng nhờ dự đoán được hướng sản xuất kinh doanh Cũng như việc thực hiện các dự ánnhanh gọn, hiệu quả, tiết kiệm được nhiều thời gian công sức mang lại hiệu quả cho việckinh doanh của công ty
Trang 32 Mạng truyền thông và an toàn bảo mật trên mạng.
Hệ thống thông tin được xây dựng trên cơ sở dịch vụ truyền thông LAN (LocalArea Network) làm nền tảng cho các ứng dụng như dịch vụ truyền thông điệp, dịch vụlưu trữ, xử lý, tra cứu thông tin (hệ cơ sở dữ liệu - CSDL) và các ứng dụng chuyên ngành.Toàn bộ hệ thống mạng được kết nối Internet
Mạng LAN trong công ty kết nối tới tất cả các phòng ban và từ đó nối tới tất cả các
máy tính trong phòng ban Một mạng LAN tối thiểu cần có máy chủ (server), các thiết bị ghép nối (Repeater, Hub, Switch, Bridge), máy tính con (client), card mạng (Network Interface Card – NIC) và dây cáp (cable) để kết nối các máy tính lại với nhau.
Hình 2 6 Mô hình mạng nội bộ của công ty
Dữ liệu
Các dữ liệu về tài chính, nhân sự, khách hàng đều được lưu trên máy chủ PC servercủa công ty Nhờ vậy đảm bảo phần lưu trữ thông tin đầy đủ đáp ứng nhu cầu sử dụngthông tin của từng phòng ban và ban giám đốc Các nhân viên cũng có thể truy cập, sửdụng, cập nhật thông tin từ cơ sở dữ liệu của công ty tùy theo quyền hạn của mình
Ứng dụng thương mại điện tử
Công ty có trang web giới thiệu các sản phẩm và khách hàng có thể liên lạc tới chocông ty theo thông tin đã được ghi trên website Trang web của công ty: http://aitc.vngồm:
- Giới thiệu về công ty: quá trình thành lập và phát triển của công ty
Trang 33- Cung cấp các thông tin về sản phầm: các dự án mà công ty đã và đang thực hiện,
…
Khách hàng có thể xem thông tin của sản phẩm và đặt hàng qua mạng một cách nhanhchóng mà không cần tốn thời gian
2.2.3 Đánh giá tình hình ứng dụng Hệ thống thông tin
Hình 2 7: Quy trình hoạt động của công ty AIT
Phòng kinh doanh có nhiệm vụ tìm kiếm khách hàng Khách hàng gửi yêu cầu đặthàng tới phòng kinh doanh của công ty, sau đó phòng kinh doanh liên hệ tìm hiểu sơ bộ
về yêu cầu của khách hàng, sau khi tìm hiểu khách hàng gửi đến phòng kinh doanh biênbản làm việc sơ bộ Phòng kinh doanh gửi yêu cầu của khách hàng tới bộ kĩ thuật Bộphận kĩ thuật sẽ cử nhân viên đi khảo sát nghiệp vụ tìm hiểu ưu, nhược điểm của hệ thống
cũ để nâng cấp hoặc xây dựng một phần mềm mới đáp ứng yêu cầu của khách hàng.Khách hàng sẽ cho phòng kĩ thuật biên bản khảo sát, phòng kĩ thuật đưa ra phương ántriển khai sơ bộ để đưa lên phòng kế toán để tính chi phí hợp đồng sau đó gửi lên kháchhàng chi phí hợp đồng để thoả thuận Nếu khách hàng đồng ý thì sẽ thực hiện kí kết hợpđồng với phòng kinh doanh, xong khách hàng mang hợp đồng đến phòng kế toán để thanh
Trang 34toán hợp đồng Sau đó phòng kế toán gửi hợp đồng đã được thanh toán cho phòng kĩthuật, phòng kĩ thuật bắt đầu triển khai thực hiện xậy dựng hệ thống cho khách hàng
Phương pháp triển khai này gồm 05 giai đoạn: phân tích và lập kế hoạch, thiết kế,chuyển đổi dữ liệu, chạy thử, chuyển giao Đầu tiên, phân tích và lập kế hoạch mục tiêu,đưa ra và thống nhất với khách hàng tài liệu yêu cầu của công ty Một tình hình phổ biến
ở nước ta là các công ty (thành công) đều phát triển nhanh và rất năng động, mô hình hoạtđộng, sản phẩm và cơ cấu tổ chức của công ty biến đổi từng ngày Khi đưa ra và thốngnhất về yêu cầu của công ty nói chung công ty đều cố gắng tiên liệu những phát triển của
họ trong thời gian một vài năm tới, nhưng thực tế cho thấy nhiều khi những tiên liệu nàycũng thay đổi liên tục Trong những dự án tương đối dài (trên sáu tháng) một vấn đề xảy
ra là khi dự án đến những giai đoạn cuối công ty lại yêu cầu thay đổi lớn về chức năng hệthống dẫn đến kết quả là phải làm lại, dự án không kết thúc được
- Cài đặt hệ thống lên hệ thống máy chủ và các máy trạm
- Thiết kế các mẫu thử cho các nghiệp vụ chính
Bước 2: Thiết kế Các công đoạn gồm:
- Đưa ra các quy trình nghiệp vụ
- Thiết kế các đầu vào, ra của dữ liệu và các giao diện
- Thiết lập và thử cấu hình hệ thống
- Huấn luyện người dùng
Bước 3 Chuyển đối dữ liệu Các công đoạn gồm:
- Định nghĩa yêu cầu về chuyển đổi dữ liệu
- Đưa ra phương pháp và thủ tục chuyển đối
- Chuyển đổi dữ liệu từ hệ thống cũ sang hệ thống mới
Trang 35- Kiểm tra xác nhận dữ liệu trên hệ thống.
Bước 4 Chạy thử Các công đoạn gồm:
- Chạy thử để kiểm tra
- Điều chỉnh lần cuối
Bước 5 Bàn giao Công đoạn gồm:
- Chạy chính thức
- Kiểm toán hệ thống và đánh giá chất lượng
- Chuyển sang cho bộ phận hỗ trợ
Sau khi cài đặt và triển khai hệ thống nếu khách hàng hài lòng và không có yêu cầu gìthêm thì sẽ thánh lí hợp đồng với phòng kế toán
Về phía ban giám đốc gửi yêu cầu báo cáo tới phòng kĩ thuật và phòng kĩ thuật báocáo hợp đồng đã thanh lí cho ban giám đốc Phòng kinh doanh tổng hợp các hợp đã đượcthực hiện đến cuối tháng báo cáo lên ban giám đốc và xin ý kiến chỉ đạo, ban giám đốc sẽđưa ra ý kiến chỉ đạo và phương hướng hoạt động của công ty trong tháng tới
Công ty đồng nhất dữ liệu theo ngày, tháng, quý và năm cho các server và client
CSDL trong kho DL tập trung hiện tại của công ty:
Phòng ban
STT Tên trường dữ liệu Diễn giải Kiểu dữ liệu Ghi chú
Báo cáo tổng hợp
STT Tên trường dữ liệu Diễn giải Kiểu dữ liệu Ghi chú
Trang 361 SoBaoCao Số báo cáo nvarchar(50) Khóa chính(PK)
4 NguoiLapBaoCao Người lập báo cáo nvarchar(50)
7 TinhHinhDuAn Tình hình dự án ntext
Nhân viên_ Dự án
STT Tên trường dữ liệu Diễn giải Kiểu dữ liệu Ghi chú
Dự án
STT Tên trường dữ liệu Diễn giải Kiểu dữ liệu Ghi chú
4 ThoiGianBatDau Thời gian bắt đầu Datetime
5 Thời GianKetThuc Thời gian kết thúc Datetime
Khách hàng
STT Tên trường dữ liệu Diễn giải Kiểu dữ liệu Ghi chú
Nhân viên
STT Tên trường dữ liệu Diễn giải Kiểu dữ liệu Ghi chú
Trang 372 Password Password nvarchar(50)
Trạng thái dự án
STT Tên trường dữ liệu Diễn giải Kiểu dữ liệu Ghi chú
3 TenTrangThai Tên trạng thái Nvarchar(255)
Hình 2 8 Mô hình kho dữ liệu tập trung Công ty AIT
Tổng Giám đốc sẽ là người quản lý Server nơi tập trung tất cả dữ liệu của công ty.Tổng giám đốc sẽ quản lý CSDL và phân quyền cho nhân viên tại các phòng ban Mỗinhân viên sẽ được phân quyền theo từng dự án mà nhân viên được phân công việc làmtrong dự án Và Tổng Giám đốc là người toàn bộ các dự án và thực hiện tất cả các côngviệc trong hệ thống Các máy client của nhân viên sẽ kết nối với máy chủ Server lấy vàđẩy dữ liệu qua các tài khoản của nhân viên và theo quyền đã được phân Cuối tuần, thángnhân viên sẽ báo cáo kết quả công việc lên cho Tổng giám đốc, Tổng giám đốc dựa vàobáo cáo đó để đưa ra chỉ thị và nhiệm vụ cho các nhân viên trong thời gian sắp tới Nhược
Trang 38điểm lớn nhất mà hiện đang tồn tại trong công việc đang thực hiện là một khi máy chủgặp sự cố thì các máy client cũng ngưng hoạt động công việc sẽ bị đình trệ và khi cácmáy client cùng truy cập vào cùng một lúc vào máy chủ thì tốc độ chậm nhiều khi bị treoServer phải mất một thời gian để phục lại gây chậm chễ công việc Tổng giám đốc chịuphải quản lý tất cả các nhân viên mà không phải là từng phòng ban quản lý lẫn nhau vàbáo cáo kết quả lên Tổng giám đốc, không tận dụng được triệt để nguồn lực trong công ty.
Hình 2 9 Mô hình dữ liệu quan hệ của Công ty AIT.
2.3 Thực trạng CSDL của Công ty Cổ phần Phát triển và Ứng dụng Công nghệ AIT
2.3.1 Những thành công mang lại cho AIT khi ứng dụng CSDL tập trung
Không có sự chồng chéo: Mỗi quyết định, thông tin, dữ kiện đều là duy nhất, tránh
rắc rối khi có nhiều dị bản Vì các thông tin của doanh nghiệp được lưu trữ trong nhữngCSDL, các thông tin này luôn được cập nhập, làm mới thường xuyên liên tục, đúng lúc vàluôn được cập nhập, làm mới thường xuyên liên tục, đúng lúc và luôn chính xác, kịp thời