7. Kết luận
2.1.2 Các sản phẩm yêu cầu sau khi phân tích thiết kế
- Mô tả các trạm
Thông tin địa lý
Thiết bị vật lý
Đặc trƣng về con ngƣời (trình độ, kỹ năng, ...)
- Mô tả về sử dụng dữ liệu cho mỗi trạm
Các phần tử dữ liệu sử dụng từ hệ thống
Các phần tử dữ liệu cần phải tạo ra
Các phần tử dữ liệu cập nhật
Các phần tử dữ liệu xóa
- Mô tả quá trình nghiệp vụ cho mỗi trạm
Danh sách các xử lý (sơ đồ chức năng) ở các trạm
Mô tả các xử lý
- Các thỏa thuận về phƣơng án kiến trúc hệ thống cho mỗi trạm: cho nhu cầu về dữ liệu và xử lý cho trạm đó
Có cần hay không về các trợ giúp không phải kỹ thuật
Có cần hay không về hệ thống địa phƣơng, về nối mạng
Có cần hay không về các cấu hình phân tán khác 2.2 Các chiến lƣợc phân tán dữ liệu
Việc định vị và phân tán dữ liệu ở các nút trong một mạng máy tính sẽ quyết định tính hiệu quả và đúng đắn của hệ thống phân tán.
Có 4 chiến lƣợc phân tán dữ liệu cơ bản: Tập trung dữ liệu, chia nhỏ dữ liệu, sao lặp dữ liệu, phƣơng thức lai.
2.2.1 Tập trung dữ liệu
Tất cả các dữ liệu đƣợc tập trung một chổ. Cách này đơn giản nhƣng có 3 nhƣợc điểm:
- Dữ liệu không sẵn sàng cho ngƣời sử dụng truy nhập từ xa.
- Chi phí truyền thông lớn, thƣờng làm cực đại việc truy nhập dữ liệu tới nơi tập trung.
- Toàn bộ hệ thống ngừng khi cơ sở dữ liệu bị sự cố. 2.2.2 Chia nhỏ dữ liệu
Cơ sở dữ liệu đƣợc chia thành các phần nhỏ liên kết nhau (không trùng lặp). Mỗi phần dữ liệu đƣợc đƣa đến các trạm một cách thích hợp để sử dụng.
2.2.3 Sao lặp dữ liệu
CSDL đƣợc nhân thành nhiều bản từng phần hoặc đầy đủ và đƣợc đặt ở nhiều trạm trên mạng.
Nếu bản sao của CSDL đƣợc lƣu giữ tại mọi trạm của hệ thống ta có trƣờng hợp sao lặp đầy đủ.
Hiện nay có nhiều kỹ thuật mới cho phép tạo bản sao không đầy đủ phù hợp với yêu cầu dữ liệu ở mỗi trạm và một bản đầy đủ đƣợc quản lý ở server.
Sau một khoảng thời gian nhất định các bản sao đƣợc làm đồng bộ với bản chính bằng một ứng dụng nào đó.
Cơ sở dữ liệu đƣợc phân thành nhiều phần: quan trọng và không quan trọng.
- Phần ít quan trọng đƣợc lƣu giữ một nơi.
- Phần quan trọng đƣợc lƣu trữ ở nhiều nơi khác. 2.3 Phân mảnh dữ liệu
Phân mảnh quan hệ là gì. Là việc chia nhỏ một quan hệ thành nhiều quan hệ nhỏ hơn đƣợc gọi là phân mãnh quan hệ
Phần lớn các hệ cơ sở dữ liệu phân tán đƣợc thiết kế theo hƣớng từ trên xuống (Top- Down). Hầu hết các hệ quản trị cơ sở dữ liệu phân tán đƣợc thiết kế, tạo mới cho nên chúng ta đề cập thiết kế theo hƣớng từ trên xuống top down. Thiết kế phân mảnh là công việc đầu tiên cần phải thực hiện, mục đích việc phân mảnh dữ liệu tạo ra các đơn vị cấp phát logic sao cho chi phí thực hiện truy vấn thông tin là thấp nhất. Thiết kế phân mảnh bằng các nhóm một số bộ trong trƣờng hợp phân mảnh dọc có cùng đặc tính theo quan điểm cấp phát các mảnh hình thành bằng các phƣơng pháp nhân mảnh tạo ra các đơn vị cấp phát dữ liệu khác nhau
Các lý do phân mảnh.
Trong thiết kế cơ sở dữ liệu phân tán cần phải thực hiện phân mảnh dữ liệu vì: Hệ quản trị cơ sở dự liệu, các quan hệ bảng đƣợc lƣu trữ dƣới dạng 2 chiều các thao tác đối với CSDL đƣợc thực hiện trên các bảng.
Việc phân rả quan hệ thành nhiều mảnh, mỗi mảnh đƣợc xử lý nhƣ một đơn vị dữ liệu, sẽ cho phép thực hiện giao dịch đồng thời, việc phân mảnh các quan hệ cũng cho phép thực hiện song song một câu vấn tin bằng cách chia nó thành một tập các câu vấn tin con hoạt động trên các mảnh. Vì vậy việc phân mảnh sẽ làm tăng mức độ hoạt động, đồng thời tăng lƣu lƣợng hệ thống
Khung nhìn hoặc đơn vị truy xuất của các ứng dụng không phải là toàn bộ quan hệ mà thƣờng là một mảnh.
Việc phân rã một quan hệ thành nhiều mảnh, mỗi mảnh đƣợc xử lý nhƣ một đơn vị, sẽ cho phép thực hiện nhiều giao dịch đồng thời.
Việc phân mảnh các quan hệ sẽ cho phép thực hiện song song một câu vấn tin bằng cách chia nó ra thành một tập các câu vấn tin con hoạt tác trên các mảnh.
Nếu các ứng dụng có các khung nhìn đƣợc định nghĩa trên một quan hệ cho trƣớc nằm tại những vị trí khác thì có hai cách chọn lựa đơn vị phân tán:
+ hoặc là toàn bộ quan hệ
+ hoặc quan hệ đƣợc lƣu ở một vị trí có chạy ứng dụng.
Thiết đến dữ liệu ở xa. Chọn lựa sau sẽ gây ra nhiều vấn đề khi cập nhật và lãng phí không gian lƣu trữ.
Các quy tắc phân mảnh:
Các nguyên tắc đảm bảo cơ sỡ dự liệu khi phân mảnh sẽ đảm bảo tính không thay đổi về ngữ nghĩa. Dƣới đây là ba quy tắc tuân thủ khi phân mảnh cơ sở dự liệu quan hệ
- Tính đầy đủ: Quan hệ R đƣợc phân rã thành các mảnh R1, R2, ...Rn, thì mổi mục dữ liệu có trong quan hệ R sẽ đƣợc chứa ít nhất một mảnh Ri (i=1,....,n). Quy tắc này đảm bảo cho các mục dữ liệu trong R đƣợc ánh xạ hoàn toàn vào các mảnh mà không bị mất.
- Tính phục hồi: Nếu một quan hệ R đƣợc phân rã thành các mảnh R1, R2, ...Rn, khi đó R= Ri, Ri € FR toàn tử thay đổi tùy theo từng loại phân mảnh. Khả năng phụ hồi quan hệ từ các mảnh sẽ đảm bảo bảo toàn các phụ thuộc
- Tính tách biệt: Nếu quan hệ R đƣợc phân rã thành các mảnh Ri, i=1,..n và mục dữ liệu di nằm trong một mảnh Ri thì nó sẽ không nằm trong mạnh Rk, (k#J). Quy tắc này đảm bảo các mảnh phân rã rời nhau. Trong trƣờng hợp phân mảnh dọc khóa chính của quan hệ phải đƣợc lập lại trong tất cả các mảnh. Vì vậy tính tách biệt trong phân mảnh dọc đƣợc hiểu không liên quan gì đến khóa chính của quan hệ.
2.3.1 Phân mảnh ngang
Quan hệ đƣợc chia theo chiều ngang đây là phép chọn trong quan hệ. Chọn những bộ của quan hệ thỏa mãn một biểu thức điều kiện cho trƣớc:
Ví dụ:
Tách ngang quan hệ PROJ thành 2 quan hệ PROJ1 và PROJ2 thỏa điều kiện BUDGET ≤ 200000 BUDGET >200000 nhƣ sau:
σ BUDGET ≤ 200000 (PROJ)
σ BUDGET >200000 (PROJ)
PNO PNAME BUDGET
P1 Instrumentation 150000
P2 Database develop 135000
Phân mảnh ngang một quan hệ tổng thể n-bộ R là tách R thành các quan hệ con n-bộ R1, R2, ..., Rk sao cho quan hệ R có thể đƣợc khôi phục lại từ các quan hệ con này bằng phép hợp: R = R1υ R2υ ... υ Rk.
Có hai loại phân mảnh ngang:
- Phân mảnh ngang nguyên thủy (primary horizontal fragmentation): phân mảnh ngang nguyên thủy của một quan hệ đƣợc thực hiện dựa trên các vị từ đƣợc định nghĩa trên quan hệ đó.
PNO PNAME BUDGET
P3 CAD/CAM 250000
Phân mảnh ngang nguyên thuỷ đƣợc định nghĩa bằng một phép toán chọn trên các quan hệ chủ nhân của một lƣợc đồ của CSDL. Vì thế cho biết quan hệ R, các mảnh ngang của R là các R Rl = ơFl(R), 1 < i < z.
Trong đó Fl là công thức chọn đƣợc sử dụng để có đƣợc mảnh Rl. Chú ý rằng nếu Fl có dạng chuẩn hội, nó là một vị từ hội sơ cấp (mj).
- Phân mảnh ngang dẫn xuất (derived horizontal fragmentation): phân mảnh ngang dẫn xuất của một quan hệ đƣợc thực hiện dựa trên các vị từ đƣợc định nghĩa trên quan hệ khác.
Nhƣ vậy, trong phân mảnh ngang tập các vị từ đóng một vai trò quan trọng. 2.3.2 Phân mảnh dọc
Các quan hệ đƣợc chia theo chiều dọc. Nghĩa là thiết lập một quan hệ mới chỉ có một số thuộc thuộc tính quan hệ gốc thực tế đây là phép chiếu trên tập con các thuộc tính quan hệ
Ví dụ:
Tách dọc quan hệ PROJ thành 2 quan hệ PROJ1 và PROJ2 nhƣ sau: π PNO, BUDGET (PROJ) và π PNO, PNAME,LOG (PROJ) và
PNO BUDGET PNO PNAME LOG
P1 150000 P1 Instrumentation Montreal
P2 135000 P2 Database develop New York
P3 250000 P3 CAD/CAM New York
P3 310000 P4 Maintenance Pais
Phân mảnh dọc một quan hệ tổng thể n-bộ R là tách R thành các quan hệ con R1, R2, ..., Rk sao cho quan hệ R có thể đƣợc khôi phục lại từ các quan hệ con này bằng phép nối: R = R1 R2 ..., Rk.
Mục đích của phân mảnh dọc là phân hoạch một quan hệ thành một tập các quan hệ nhỏ hơn để nhiều ứng dụng có thể chỉ chạy trên một quan hệ.
2.3.3 Phân mảnh hỗn hợp
Cách đơn giản nhất để phân mảnh hỗn hợp gồm có: Áp dụng phân mảnh ngang cho các mảnh phân chia theo chiều dọc; phân mảnh dọc cho các mảnh phân chia theo chiều ngang.
Trong đa số các trƣờng hợp, phân mảnh ngang hoặc phân mảnh dọc đơn giản cho một lƣợc đồ CSDL không đủ đáp ứng các yêu cầu từ ứng dụng. Trong trƣờng hợp đó phân mảnh dọc có thể thực hiện sau một số mảnh ngang hoặc ngƣợc lại, sinh ra một lối phân hoạch có cấu trúc cây. Bởi vì hai chiến lƣợc này đƣợc áp dụng lần lƣợt, chọn lựa này đƣợc gọi là phân mảnh hỗn hợp.
Nếu ứng dụng có những yêu cầu ngăn cản việc phân rã thành các mảnh để đƣợc sử dụng độc quyền, thì những ứng dụng có các khung nhìn đƣợc định nghĩa trên nhiều mảnh sẽ bị giảm hiệu suất hoạt động.
Nếu một khung nhìn đòi hỏi thông tin ở nhiều mảnh thì việc truy xuất dữ liệu để nối lại sẽ có chi phí cao.
Kiểm soát dữ liệu ngữ nghĩa (semantic data control): Do kết quả của phân mảnh, các thuộc tính tham gia vào một phụ thuộc có thể bị phân rã vào các mảnh khác nhau và đƣợc cấp phát cho những vị trí khác nhau. Trong trƣờng hợp này, một nhiệm vụ đơn giản nhƣ kiểm tra các phụ thuộc cũng phải thực hiện truy tìm dữ liệu ở nhiều vị trí.
2.4 Nhân bản dữ liệu
Giả sử CSDL đã đƣợc phân mảnh, tích hợp và sẽ thỏa các yêu cầu phải cấp phát cho các vị trí trên mạng, khi dữ liệu cấp phát có thể không nhân bản hoặc nhân bản. Không nhân bản đƣợc gọi là CSDL phân hoạch, các mảnh chỉ đƣợc cấp phát trên các trạm và không có bản sao nào trên mạng. Trong trƣờng hợp nhân bản, hoặc toàn bộ CSDL đều có trên tất cả các trạm ( CSDL đƣợc nhân bản đầy đủ) hoặc các mảnh của CSDL đƣợc phân tán tới các trạm bằng cách các bản sao đƣợc đặt trên nhiều trạm (CSDL đƣợc nhân bản từng phần). một số các bản sao của mảnh có thể là đầu vào cho thuật toán cấp phát hoặc quyết định giá trị của biến đƣợc xá định bởi thuật toán.
Nhân bản làm tăng độ tin cậy và tang hiệu quả của các câu vấn tin chỉ đọc (Read-only Query) đặc biệt có thể truy xuất CSDL khi gặp sự cố. Hơn nữa các truy vấn đọc truy xuất đến cùng một mục dữ liệu có thể cho thực hiện song song vì các bản sao có mặt tại vị trí nhiều.
Nhân bản hoàn toàn Nhân bản một phần Phân hoạch
Xử lý truy vấn Dễ Cùng mức độ khó tin
Quản lý thƣ mục Dễ hoặc không tồn tại Cùng mức độ khó tin
Đều khiển đồng thời Vừa phải Khó Dễ
Độ tin cậy Rất cao Cao Thấp
Thực tế Có thể áp dụng Thực tế Có thể áp dụng
Việc cấp phát dữ liệu phải đƣợc thực hiện sao cho thỏa mãn hai yêu cầu sau: - Chi phí nhỏ nhất
- Hiệu năng lớn nhất: Giảm thiều thời gian đáp ứng tăng tối đa lƣu lƣợng hệ thống tại mỗi vị trí
Công việc thiết kế CSDL phân tán phụ thuộc rất nhiều vào các yếu tố đó là ảnh hƣởng đến một thiết kế tối ƣu, tổ chức logic CSDL, vị trí các ứng dụng, đặc tính truy xuất của các ứng dụng đến CSDL và đặc tính của hệ thống máy tính tại mỗi vị trí. Điều này làm cho việc diễn đạt bài toán trở nên hết sức phức tạp.
Các thông tin cần thiết kế phân tán bao gồm: - Thông tin cơ sỡ dữ liệu.
- Thông tin ứng dụng. - Thông tin mạng.
Yêu cầu thông tin về mạng và thông tin về hệ thống máy tính chỉ đƣợc sử dụng trong các mô hình cấp phát không đƣợc sử dụng trong các thuật toán phân mảnh dữ liệu.
2.5 Sử dụng hệ thống mạng nội bộ hiện có và nghiên cứu hiện trạng mạng nội bộ của Trƣờng
KHOA ĐIỆN TỬ
Hub
PHÕNG TỔ CHỨC
SƠ ĐỒ MÔ PHỎNG MÁY TÍNH TẠI CÁC PHÕN,G KHOA, ĐƠN VỊ TRƢỜNG CAO ĐẲNG KỸ NGHỆ DUNG QUẤT
PHÕNG KẾ TOÁN
PHÕNG ĐÀO TẠO
KHOA CƠ KHÍ
Hub
KHOA LỌC HÓA DẦU
Hub KHOA CƠ BẢN Hub KHOA TỔNG HỢP Hub HIỆU TRƢỞNG HIỆU PHÓ HIỆU PHÓ
Hình 2.2: Sơ đồ mạng máy tính Trường CĐKN Dung Quất
2.6 Công tác Quản lý HS-SV trong Trƣờng Cao đẳng Kỹ nghệ Dung Quất
Việc quản lý HS-SV trong Trƣờng Cao đẳng Kỹ nghệ Dung Quất bao gồm nhiều công đoạn, mỗi công đoạn có nhiều chức năng và nhiều đối tƣợng (phòng ban, cá nhân) tham gia, trong đó phòng quản lý HS-SV đóng vai trò chủ chốt.
Phòng quản lý HS-SV phối hợp với Khoa, bố trí cán bộ tiếp nhận, kiểm tra tính hợp lệ của các loại giấy tờ, lập thành 2 bản phiếu nhận hồ sơ, giao cho học sinh - sinh viên 1 phiếu (bản sao). Chú ý, các loại giấy tờ chƣa có công chứng, cán bộ thu hồ sơ phải kiểm tra bản chính và ghi rõ đã đối chiếu với bản chính vào mặt sau và ký tên ghi rõ họ tên ngƣời kiểm tra đối chiếu.
Phòng quản lý HS-SV tiến hành kiểm tra, phân loại hồ sơ, yêu cầu học sinh – sinh viên. bổ sung các loại giấy tờ (nếu còn thiếu). Trong thời gian 30 ngày kể từ ngày nhập học, học sinh – sinh viên không hoàn chỉnh hồ sơ sẽ bị xử lý theo quy chế tuyển sinh hiện hành.
Phòng quản lý HS-SV phối hợp với Khoa nhập toàn bộ thông tin, lý lịch trích ngang của học sinh – sinh viên. vào hồ sơ.
Phòng quản lý HS-SV phối hợp với Khoa, phòng (liên quan) cập nhật các thông tin thay đổi; bổ sung kết quả trong quá trình học tập, rèn luyện của học sinh – sinh viên.
Hồ sơ cụ thể của từng học sinh – sinh viên. đƣợc xếp theo Khoa, từng khóa, theo lớp sinh hoạt và bảo quản tập trung tại Phòng quản lý HS-SV; định kỳ bổ sung các hồ sơ liên quan học sinh – sinh viên., cùng với hệ thống hồ sơ điện tử có đầy đủ thông tin thiết yếu, thuận lợi trong việc tra cứu, truy xuất thông tin.
Phòng Quản lý HS-SV phối hợp với Khoa bổ sung vào hồ sơ tốt nghiệp của học sinh – sinh viên.gồm: Hồ sơ gốc của học sinh – sinh viên., sơ yếu lý lịch học sinh – sinh viên. ra trường, giấy chứng nhận sức khoẻ ra trƣờng...
Hủy hồ sơ: Phòng Quản lý HS-SV lập biên bản đề xuất trình Hiệu trưởng hủy hồ sơ học sinh – sinh viên. với những trƣờng hợp xóa tên, thôi học tại trƣờng sau 1 năm.
2.6.2 Quản lý điểm rèn luyện
- Cập nhật điểm rèn luyện học sinh – sinh viên. - Cập nhật khen thƣởng và kỷ luật
- Tổng hợp điểm rèn luyện theo học kỳ, năm học và toàn khóa học - In báo cáo
2.6.3 Quản lý chuyên cần
- Quản lý điểm chuyên cần học sinh - sinh viên - Xét danh hiệu thi đua cá nhân, tập thể tự động. - In báo cáo
2.6.4 Quản lý học bổng - Cập nhật mức học bổng