Lý thuyết cơ sở dữ liệu phân tán

92 474 0
Lý thuyết cơ sở dữ liệu phân tán

Đang tải... (xem toàn văn)

Tài liệu hạn chế xem trước, để xem đầy đủ mời bạn chọn Tải xuống

Thông tin tài liệu

TS Nguyễn Bá Tờng: lý thuyết cSDL phân tán Chơng mạng máy tính Trong chơng thảo luận số vấn đề liên quan đến mạng máy tính, tập trung vào khái niệm vấn đề quan trọng hệ CSDL phân tán Vì bỏ qua hầu hết chi tiết công nghệ kỹ thuật phần trình bày Tiểu mạng truyền thông Hos ts Hình 1.1 Mạng máy tính Chúng ta định nghĩa mạng máy tính (computer network) tập máy tính tự vận hành, đợc nối kết lại có khả trao đổi thông tin chúng (hình 1.1) Có hai ý định nghĩa "đợc nối kết lại" "tự vận hành" Chúng ta muốn máy tính tự vận hành để máy cho chơng trình chạy chúng Chúng ta muốn máy tính đợc kết nối lại để trao đổi thông tin cho Các máy tính mạng thờng đợc gọi nút (node), host trạm (site) Chúng tạo thành phần phần cứng mạng Những thành phần khác đờng truyền dùng để nối kết nút Chúng ta lu ý thuật ngữ host Chơng 1: mạng máy tính TS Nguyễn Bá Tường: lý thuyết cSDL phân tán node sử dụng để nói đến thiết bị đơn thuần, Site dành để nói đến thiết bị phần mềm chạy 1.1 Các khái niệm truyền liệu Trước tiên đưa số định nghĩa Theo (Stallings, 1998) liệu (được định nghĩa) thực thể dùng để truyền tải ý nghĩa Tín hiệu (signal) mã hóa liệu dạng điện điện từ Phát tín hiệu (signaling) hành động gây lan truyền tín hiệu qua vật dẫn truyền thích hợp Và cuối truyền tin (transmission) trình trao đổi liệu cách làm lan truyền xử lý tín hiệu" Thiết bị (equipment) môi trường truyền thông thường nối kết qua đường truyền (link), đường truyền mang nhiều kênh (channel) Đường truyền thực thể vật lý kênh thực thể logic Đường truyền mang liệu dạng tín hiệu số (digital signal) tín hiệu tương tự (analog signal) Chẳng hạn đường điện thoại mang liệu dạng tương tự, chúng thay đường truyền thích hợp cho việc truyền tải số Mỗi đường truyền có sức tải (capacity), định nghĩa số lượng liệu truyền đường truyền đơn vị thời gian Sức tải thường gọi dải thông (bandwidth) kênh Trong kênh truyền tương tự, dải thông định nghĩa hiệu số (tính Hertz) tần số thấp tần số cao truyền kênh giây Trong đường truyền số, dải thông thường xem số bit truyền giây Dựa theo dải thông xác định ba tầm kênh Kênh điện thoại tương tự (analog telephone channel): Có thể mang đến 33 Kbps với kỹ thuật điều chế thích hợp Kênh điện thoại số (digital telephone channel): Có thể mang 56 64 Kbps (được gọi tốc độ ISDN) Kênh băng rộng (broadband channel): Có thể mang 1,5 Mbps hơn; chúng tạo thành phần cho mạch điện thoại số Chương 1: mạng máy tính TS Nguyễn Bá Tường: lý thuyết cSDL phân tán Nếu liệu truyền kênh tương tự phải điều chế (modulate) Có nghĩa liệu số mã hóa thành tín hiệu mang tương tự (analog carrier signal) cách thay đổi nhiều đặc tính (biên độ, tần số pha) Tín hiệu mang điều chế truyền đến đầu nhận, lại tái điều chế thành dạng số Ưu điểm việc sử dụng đường truyền có dải thông cao liệu truyền dồn kênh (multiplex), nhờ truyền lúc nhiều tín hiệu Có hai kiểu dồn kênh cho phép truyền đồng thời nhiều kênh logic đường truyền vật lý Một chia dải thông cho tín hiệu truyền tần số khác Dạng dồn kênh gọi dồn kênh phân tần (freauency - division multiplexing, FDM) Một kiểu khác chia thời gian truyền thành khoảng dành toàn kênh (nghĩa toàn băng tần) để truyền tín hiệu Dạng dồn kênh gọi dồn kênh phân thời (time - division multiplexing, TDM) dùng nhiều trình truyền liệu Từ góc độ hệ CSDL phân tán, đặc tính khác đường truyền liệu chế độ hoạt động Một đường truyền hoạt động theo chế độ đơn công (simplex), bán song công (half - duplex) toàn song công (full - duplex) Một đường truyền hoạt động theo chế độ đơn công truyền tín hiệu liệu theo chiều Đường truyền bán song công truyền liệu theo hai chiều không thực lúc Quá trình truyền trước tiên tiến hành theo chiều, sau đường truyền phải "quay đầu lại" trình truyền theo chiều ngược lại bắt đầu Đường truyền toàn song công truyền tín hiệu liệu theo hai chiều đồng thời Chúng môi trường linh hoạt có chi phí cao Khi truyền tải máy tính, liệu thường truyền theo bó liệu (frame) Thường giới hạn kích thước bó liệu phải thiết lập cho mạng bó chứa liệu thông tin điều khiển nơi đến địa nguồn, mã kiểm lỗi cho khối, vân vân ( xem hình 1.2) Nếu thông báo cần phải gửi từ nút nguồn đến nút đích không xếp vừa vào bó, tách thành nhiều bó Chương 1: mạng máy tính 10 TS Nguyễn Bá Tường: lý thuyết cSDL phân tán Đầu đề Nội dung thông báo Mã kiểm lỗi * Địa nguồn * Địa đến * Mã số thông báo * Mã số bó * Mã xác nhận * Thông tin điều khiển Hình 1.2 Dạng thức bó điển hình Trong chương này, bàn gói (packet) kỹ thuật chuyển mạch gói (packet switching) Thuật ngữ gói bó dùng lẫn lộn điều không hoàn toàn xác chúng đề cập đến khái niệm gần giống Nói theo kiểu giao thức truyền thông, chúng đề cập đến thực thể tầng khác Từ quan điểm thực hành, khác biệt gói bó thường xem xét qua dạng thức chúng Một dạng thức gói chứa thông tin tiêu đề cho tầng mạng, nghĩa thông tin chọn đường (routing), bó gồm thông tin liên quan đến chế khả tín tầng liên kết liệu 1.2 Các loại mạng máy tính Có nhiều chuẩn dùng để phân loại mạng máy tính Một chuẩn thường dùng cấu trúc nối kết (interconnection structure) máy tính (thường gọi topo mạng), chuẩn khác chế độ truyền chuẩn phân bố địa lý 11 Chương 1: mạng máy tính TS Nguyễn Bá Tường: lý thuyết cSDL phân tán Các kiểu mạng Như tên gọi, cấu trúc nối kết muốn nói đến cách nối máy tính mạng lại với Một số kiểu thông dụng mạng hình (star), mạng vòng (ring), mạng bus, mạng đầy đủ (meshed) mạng vô định hình (irregular) Trong mạng hình (hình 1.3), tất máy tính nối với máy tính trung tâm lo điều phối việc truyền liệu mạng Vì hai máy tính muốn trao đổi với nhau, chúng phải thông qua máy tính trung tâm Bởi máy tính có đường truyền riêng với máy tính trung tâm nên cần phải có thoả thuận máy tính "vệ tinh" máy tính trung tâm chúng muốn trao đổi Nút điều khiển Hình 1.3 Mạng hình Loại mạng thường dùng tổ chức có nhiều chi nhánh nằm nhiều vùng khác nhau, máy tính trung tâm đặt văn phòng trung tâm vùng Trong trường hợp việc xử lý cục thực nút liệu cuối truyền đến máy trung tâm Một khuyết điểm mạng hình độ tin cậy thấp Vì giao tiếp hai máy tính phụ thuộc vào máy tính trung tâm, cố nút làm cho việc truyền mạng ngừng trệ hoàn toàn Một khuyết điểm khác tải trọng cao máy trung tâm; phải điều phối việc giao tiếp mạng, tải trọng cao trạm khác Vì người ta thường dùng trạm trung tâm mạnh máy tính vệ tinh Do khuyết điểm này, mạng hình thường dùng lượng liệu cần truyền máy vệ tinh không cao Chương 1: mạng máy tính 12 TS Nguyễn Bá Tường: lý thuyết cSDL phân tán Trong mạng xoay vòng (hình1.4), máy tính nối với môi trường truyền (đường truyền) có dạng vòng khép kín Truyền liệu quanh vòng thường theo chiều, trạm (thực giao diện trạm) đóng vai trò chuyển tiếp (repeater) Khi nhận thông báo (message), kiểm tra địa chỉ, chép thông báo thông báo gửi cho truyền thông báo tiếp Giao diện Vòng xoay chiều Node (nút ) Hình 1.4 Mạng xoay vòng Việc điều khiển truyền tin mạng xoay vòng thường thực thẻ điều khiển (control token) Trong kiểu đơn giản nhất, thẻ (token) với mẫu bit mạng rảnh mẫu bit khác cho biết mạng dùng, chuyển xoay vòng mạng Mỗi trạm muốn truyền thông báo phải đợi đến thẻ truyền đến Khi trạm kiểm tra mẫu bit thẻ để xem mạng rảnh hay dùng Nếu mạng rảnh, trạm thay đổi mẫu bit, mạng dùng đặt thông báo vào vòng xoay Thông báo 13 Chương 1: mạng máy tính TS Nguyễn Bá Tường: lý thuyết cSDL phân tán chuyển xoay vòng trở trạm gửi để đổi lại mẫu bit thành "đang rảnh" thẻ gửi đến trạm Các mạng có môi trường truyền kiểu xoay vòng có độ tin cậy thấp, đơn giản đường nối cần bị cắt đứt điểm làm ngừng toàn hoạt động mạng Để có độ tin cậy cao hơn, người ta sử dụng loại mạng hai vòng Trong mạng thế, cố điểm nối không làm khả truy xuất đến phần lại mạng truyền tắt qua trạm bị hư cách chuyển đường truyền sang vòng thứ hai Một thể thức khác nhằm đảm bảo độ tin cậy sử dụng nút chuyển mạch trung tâm (central switch) Các nối kết trạm thực qua trung tâm chuyển mạch dù hoạt động mạng ỏ dạng xoay vòng Nếu trạm bị cố, đường nối bị đứt liên lạc dễ dàng tắt qua phần mạng thông qua nút chuyển mạch Kiến trúc phát triển phòng thí nghiệm IBM Zurich cài đặt mạng LAN token ring IBM Một loại mạng thông dụng khác mạng bus (hình 1.5), có kênh chung để truyền liệu, máy tính thiết bị đầu cuối gắn vào kiểu mạng này, việc điều khiển đường nối thực hai cách Một phương pháp CSMA (carrier sense multiple access) phương pháp thứ hai CSMA/CD (carrier sense multiple access with collision detection) Ngoài hai phương pháp này, bus điều khiển thẻ Nếu sử dụng lược đồ này, mạng bus xem có vòng xoay logic Node #1 Node #3 BuS Node #1 Node #3 Hình 1.5 Mạng bus Chương 1: mạng máy tính 14 TS Nguyễn Bá Tường: lý thuyết cSDL phân tán Cơ chế kiểm soát bus kiểu CSMA mô tả lược đồ "lắng nghe trước truyền" Điểm trạm liên tục lắng nghe diễn biến xảy kênh chung Khi có thông báo gửi đi, trạm kiểm tra phần header thông báo xem có phải gửi cho hay không, thực hành động thích hợp Nếu muốn truyền, chờ phát không hoạt động xảy kênh chung đặt thông báo lên mạng Ngược lại, chế điều khiển bus CSMA/CD mô tả lược đồ "lắng nghe truyền" Loại hoạt tác theo cách sau Các trạm đóng vai trò giống lược đồ CSMA, ngoại trừ chúng tiếp tục lắng nghe kênh chung sau truyền thông báo Mục đích việc lắng nghe truyền phát xem có tương tranh Node Hình 1.6 Mạng thảm (cấu trúc nối đầy đủ) (collision) hay không Tương tranh xảy hai trạm truyền thông báo đồng thời (một trạm khởi truyền trạm khác truyền) Trong trường hợp thế, phát tương tranh, trạm hủy bỏ truyền, đợi khoảng thời gian truyền lại thông báo Lược đồ CSMA/CD dùng mạng cục Ethernet Một lược đồ nối kết khác nối kết đầy đủ (mạng thảm), nút nối với tất nút khác (hình 1.6) Một cấu trúc rõ ràng cung cấp độ tin cậy cao khả hoạt động tốt cấu trúc khác Tuy nhiên cấu trúc có chi phí cao nhất, 15 Chương 1: mạng máy tính TS Nguyễn Bá Tường: lý thuyết cSDL phân tán nên ding không thực tế Ngay số lượng máy tính mạng ít, số nối kết cần có lớn Thí dụ nối kết đầy đủ cho 10.000 máy tính cần xấp xỉ (10.000)2 đường nối Các mạng truyền thông thường có đường nối vô định Nghĩa đường nối tính hệ thống không tuân theo khuôn mẫu Chúng ta gặp nút nối với nút khác nút nối với nhiều nút khác Các nối kết máy tính Internet thuộc loại Các lược đồ truyền liệu Theo lược đồ truyền thông vật lý dùng, mạng thuộc loại điểm - điểm (point - to - point) phát tán gọi đa điểm (multi - point) Trong mạng điểm - điểm, người ta dùng nhiều đường nối cặp nút Có thể đường nối trực tiếp cặp thường số đường nối gián tiếp Việc truyền thông (giao tiếp) thực hai nút, bên nhận bên gửi xác định địa có phần header bó liệu Truyền liệu từ bên gửi đến bên nhận theo nhiều đường chúng, số đường phải ngang qua số nút khác Các nút trung gian kiểm tra địa đích phần header địa chuyển cho nút nằm kế cận Hành động gọi chuyển mạch (switching) việc chọn đường nối để truyền bó liệu xác định qua giao thức thích hợp Môi trường truyền sở cho mạng điểm - điểm cáp đồng trục cáp quang Các đường dây điện thoại nối thiết bị khách hàng thường dùng dây xoắn đôi Vì tốc độ truyền không cao Còn mạng truyền hình cáp sử dụng đường dây đồng trục dẫn đến tận nhà cho phép kết nối mạng với tốc độ truyền cao Tương tự nhiều mạng cục dùng loại cáp đồng trục Tuy nhiên người ta chuyển sang dùng cáp quang với sức tải tốc độ cao Chương 1: mạng máy tính 16 TS Nguyễn Bá Tường: lý thuyết cSDL phân tán Trong mạng phát tán, người ta dùng kênh truyền chung cho tất nút mạng Các bó liệu truyền qua kênh chung tất nút nhận Mỗi nút kiểm tra địa bên nhận phần header bó liệu không gửi cho nó, bỏ qua Một trường hợp đặc biệt mạng phát tán mạng đa tán (multicast), thông báo gửi đến tập nút mạng Địa bên nhận mã hóa cách để nút bên nhận Mạng phát tán nói chung dùng sóng radio vệ tinh Trong trường hợp truyền qua vệ tinh, vị trí phát tín hiệu truyền đến vệ tinh tín hiệu phát trả lại tần số khác Mỗi vị trí mạng lắng nghe tần số nhận phải bỏ qua thông báo không gửi cho Một mạng có sử dụng kỹ thuật mạng SATNET Truyền sóng vi ba (microwave) cách truyền liệu thông dụng khác, qua vệ tinh mặt đất Các đường truyền sóng vi ba phương thức chủ yếu mạng điện thoại phần lớn quốc gia Ngoài dịch vụ công cộng, nhiều công ty cho thuê riêng đường truyền vi ba Thực thành phố đông dân gặp phải vấn đề nhiễu sóng vi ba đường truyền tư nhân công cộng Một thí dụ mạng dùng sóng vi ba vệ tinh để truyền liệu hệ thống ALONA Một điều cuối cần nói kiểu topo mạng phát tán dễ dàng phát lỗi, thông báo đến nhiều vị trí so với kiểu điểm - điểm Ngược lại trạm lắng nghe thông báo mạng nên tính an ninh khó trì so với kiểu điểm - điểm Tầm địa lý Theo phân phối mặt địa lý, mạng phân loại mạng diện rộng (wide area network, WAN), mạng liên vùng (metropolitan area network, MAN) mạng cục (local area network, LAN) Sự phân biệt thường không rõ ràng mà phân biệt chủ yếu loại mạng 17 Chương 1: mạng máy tính TS Nguyễn Bá Tường: lý thuyết cSDL phân tán a2 a3 a4 b2 b3 b4 c2 c3 c4 d2 d3 d4 e2 e3 e4 f2 f3 f4 g2 g3 g4 2.3 Cho quan hệ r sau: r A B C D E 0 1 1 0 1 0 2 0 1 1 Mệnh đề E: tổng giá trị dòng < (nhỏ 3) Viết quan hệ chọn r (E) r (không E) 2.4 Cho hai quan hệ r s sau: r s A B C D E 0 1 1 Tính tích Decac r s: r x s 2.5 Cho hai quan hệ r s sau: r s A B C D E D E 0 0 0 1 1 1 1 1 0 0 1 Tính r ữ s 2.6* Chương 2: mô hình sở liệu quan hệ 84 TS Nguyễn Bá Tường: lý thuyết cSDL phân tán a- Chứng minh rằng: năm (5) phép toán đại số quan hệ hợp, hiệu, Decac, chiếu, chọn độc lập với nhau, nghĩa không phép toán chúng biểu diễn qua phép lại b- Chứng minh phép toán lại đại số quan hệ giao, nối, nối nửa, nối theo , thương, nhận từ phép toán (ví dụ xem tập 2.7 sau) 2.7 Cho r s hai quan hệ lược đồ tương ứng R = {A1, A2, , An}, S = {A1, A2, , Ak} với k < n Giả sử X = R - S = {Ak+1, , An} Chứng minh rằng: r ữ s = r X - ((r X ì s) - r) X 2.8 a- Cho lược đồ quan hệ R tập PTH F = {AB E, AG I, BE I, E G, GI H} R Chứng minh AB GH b- Tương tự cho tập PTH F sau : F = {AB C, B D, CD E, CE GH, G A} Chứng minh : AB E, AB G 2.9 Cho sơ đồ quan hệ W = < R, F > Chứng minh (giải thích) rằng: với tập X R phần tử A thuộc tập X X A F+ Tức là: A X R X A F + 2.10 Cho sơ đồ quan hệ W = < R, F >, với R = {A, B, C, D} F = {A B, A C} Hãy tìm PTH suy từ qui tắc PTH ràng buộc sau : a- A D b- C D c- AB B d- BC A e- A BC 85 Chương 2: mô hình sở liệu quan hệ TS Nguyễn Bá Tường: lý thuyết cSDL phân tán 2.11 Cho sơ đồ quan hệ W = < R, F >, với R = {A, B, C, D ] F = {A B, BC D} PTH dãy sau suy từ F qui tắc PTH: a- C D b- A D c- AD C d- BC A e- B CD 2.12 Cho bảng quan hệ r: r A B C D x u x y y x z x z y y y y z w z Trong PTH sau PTH không thỏa mãn r: A B, A C, B A, C D, D C, D A 2.13 Cho quan hệ r sau: A B C D E a1 b1 c1 d1 e1 a1 b2 c2 d2 e1 a2 b1 c3 d3 e1 a2 b1 c4 d3 e1 a3 b2 c5 d1 e1 Tìm tập PTH F thỏa mãn r 2.14 Cho hai lược đồ quan hệ R1 R2, R1 R2 = X Chứng minh quan hệ r tập thuộc tính R1 R2 thỏa mãn X R2 r = r R1 |>, với R = {A, B, C, D, E, G, H}và tập PTH F: F = {A D, AB DE, CE G, E H} Tính (AB)+ 16 Trong thuật toán tìm bao đóng X + ta xây dựng dãy X X1 X2 X i với Chương 2: mô hình sở liệu quan hệ 86 TS Nguyễn Bá Tường: lý thuyết cSDL phân tán X0=X X i+1 = X i Z i Z i = {A R: A X i X i A F +} a- Xét giao Z i: Z i Z k = ? b- Chứng minh rằng: i Z i (X i) + 2.17 a- Tìm khóa lại W = < R, F > ví dụ 20 tìm khóa sơ đồ quan hệ W= < R, F > tập 15 b- Cho sơ đồ quan hệ W = < R, F >, với R = {A,B,C,D,E,H} F = {A E, C D, E DH} Chứng minh K = {A,B,C} khóa W c- Cho sơ đồ quan hệ W = < R, F >, với R = {A,B,C,D} F = {AB C, D B, C ABD} Tìm khóa W d- Cho sơ đồ quan hệ W = < R, F >, với R = {A,B,C,D,E,G} F = {AB C, C A, BC D, ACD B, D EG,BE C, CG BD, CE CG} Tìm khóa W 2.18 Cho lược đồ quan hệ R = {A1, A2, An} Họ S tập R gọi hệ Sperner S tượng lồng nhau, nghĩa X Y với X, Y S Gọi họ tất khóa sơ đồ quan hệ W = < R, F > Chứng minh rằng: hệ Sperner 2.19 * Cho hệ Sperner không rỗng R Chứng minh tồn sơ đồ quan hệ W để tập khóa W Vậy ta chứng minh mệnh đề họ khoá W= < R, F > hệ Sperner 2.20 Cho lược đồ quan hệ R = {A1, A2, , An} K hệ Sperner R (tức K tập khóa quan hệ lược đồ R) Ta gọi tập phản khóa K, ký hiệu K-1, tập: K-1 = {X R: ( Y K) (Y X) có Z mà (X Z) Y K để Y Z (tức phản khóa gồm tập R mà tập chứa trọn khóa, đồng thời có tập Z lớn thực phần tử phản khóa có phần tử họ khóa K nằm gọn Z) Chứng minh rằng: K -1 hệ Sperner 2.21 Giả sử K hệ Sperner R Chứng minh rằng: 87 Chương 2: mô hình sở liệu quan hệ TS Nguyễn Bá Tường: lý thuyết cSDL phân tán K = R - K -1 K K-1 hợp giao tập K K - tương ứng 2.22 Thuật toán tìm khóa quan hệ Cho lược đồ quan hệ R = {A1, A2, An} r quan hệ có m phần tử ta ký hiệu là: t1, t2, tm; tức r = {t1, t2, tm} t i dòng Nội dung thuật toán: Input: r = {t1, t2, tm} quan hệ R Output: K tập tất thuộc tính khóa r ( K khoá r) Thuật toán: Bước 1: Xây dựng họ E = {E i j: i < j m} Với E i j = {A R: ri A = r j A} Bớc 2: Xây dựng họ M = {B M: với B M: B B} (Về sau hệ E ta gọi hệ cực đại r) a- Chứng minh tập phần tử khóa K = R - M b- Tìm thuộc tính khóa quan hệ sau: r s A B C D E A B C D E 1 0 0 1 1 1 1 0 0 1 2 1 1 0 2.23 Ta nói tập PTH F Phủ tập PTH G F + G + Hai tập PTH F G tương đương, ký hiệu F ~ G nếu: F + = G + Chứng minh rằng: F ~ G F phủ G G phủ F 2.24 Ký hiệu XG +, XF + tập bao đóng tập PTH G F tương ứng Chứng minh F ~ G XG + = XF + 2.25 Cho sơ đồ quan hệ W = < R, F > Ta nói W tắc nếu: a- Vế phải PTH F thuộc tính đơn Chương 2: mô hình sở liệu quan hệ 88 TS Nguyễn Bá Tường: lý thuyết cSDL phân tán b- Trong tập PTH F PTH f (thừa) mà: F - f ~ F c- Trong F PTH X A mà có Z X (F - (X A)) (Z A) F Chứng minh với sơ đồ quan hệ W = < R, F > tồn sơ đồ quan hệ tắc W = < R, G > tương đương với W( hai sơ đồ quan hệ tương đương tập phụ thuộc hàm chúng tương đương 2.26 Thuật toán tìm phủ tắc sơ đồ quan hệ Input: W = < R, F >, với F = {f1, f2, fm} Output: W = < R, G > tắc tương đương với W Thuật toán: Bước 1: F0 = F F i = F i - - fi F i - - fi tương đương với F i - 1, ngược lại Fi = F i - 1, i = 1, 2, , m Bước 2: Loại bỏ thuộc tính thừa vế trái PTH Fm Chứng minh tập F m nhận tập G 2.27 Cho sơ đồ quan hệ W = < R, F >, với R = {a, b, c, d, e, g} F = {ab c, c a, bc d, acd d, d eg, be c, cg bd, ce ag} Dùng thuật toán 26 tìm W = < R, F > tắc tương đương với W 2.28 Giả sử W = < R, F > sơ đồ quan hệ, K họ khóa W Đặt M = {A - a: a A A khóa, tức A K} Fn tập tất thuộc tính thứ cấp (thuộc tính không khóa) Đặt L = +: {C C M} Chứng minh ta có mệnh đề sau tương đương: 1- W 2NF 2- B L B Fn = 3- B L a Fn (B - a) + = B - a Gợi ý: Độc giả chứng minh ví dụ 2, 3, Trong phần lu ý với tập thuộc tính X mà X+ = X tức X không kéo theo thuộc tính không thuộc X Vậy B L b Fn Nếu Fn rỗng W - 2NF Giả sử Fn Khi 89 Chương 2: mô hình sở liệu quan hệ TS Nguyễn Bá Tường: lý thuyết cSDL phân tán (B - b)+ = B - b có nghĩa not ((B - b) x (B - b)) tức not ((A a)+ - b x ((A - a)+ - b)) not ((A - a) - b x ((A - a) - b)) not (A - a) x (A - a) not (A - a) b b thứ cấp nên b không thuộc (A a) Vậy W 2NF 2.29 Cho sơ đồ quan hệ W = < R, F >, Fn tập tất thuộc tính thứ cấp, K tập khóa Đặt G = {B - Fn: B K - 1} Chứng minh rằng: W 2NF C G C+ = C 2.30 Cho sơ đồ quan hệ W = < R, F > Ta nói W có quan hệ bắc cầu (hoặc nhiều hơn) thuộc tính thứ cấp có ràng buộc PTH Chứng minh rằng: W 3NF W quan hệ bắc cầu 2.31 Cho lược đồ quan hệ R = {C, I, D, B, K, F, G, L, M} tập PTH = {C IDBKF, D B, K F} Xét xem W thuộc dạng chuẩn nào, 2NF, 3NF, BCNF, 4NF ? 2.32 Xét xem sơ đồ quan hệ sau thuộc dạng chuẩn W = < R, F >, với R = {A,B,C,D,E,G,H,I} F = {AC B, BI ACD, ABC D, H I, ACE BCG CG AE} 2.33 Xét xem sơ đồ quan hệ sau thuộc dạng chuẩn nào: W = , với R = {A, B, C, D, E, G, H, I, M} F = {CB GH, DE IMH, CI CBDH, H I} 2.34 Cho danh sách môn học lớp học dạng bảng thông báo môn học danh sách sau: HVKTQS DANH SACH LOP CAO HOC Học kỳ - 1999 Cua số (course no ): 350 Tên cua học: Ngoại ngữ Giáo viên: Chỗ giáo viên: MSSV 38214 40875 51893 TÊN Hoa Mơ Tuấn MÔN Anh Đức Anh bằNG A B A Chương 2: mô hình sở liệu quan hệ 90 TS Nguyễn Bá Tường: lý thuyết cSDL phân tán Hãy biến đổi (có thể tách) bảng thông báo thành quan hệ dạng chuẩn 3NF với điều kiện ngữ nghĩa (semantic): a- Mỗi giáo viên có chỗ b- Mỗi sinh viên có môn học c- Mỗi cua có tên 2.35 Cho sơ đồ quan hệ W = < R, F > Fn phần tử thứ cấp Chứng minh rằng: W 3NF B K - 1, a Fn (B - a)+ = B - a 2.36 Cho sơ đồ quan hệ W = < R, F > Chứng minh W 3NF với tập thuộc tính X R: X + = X, a thuộc tính thứ cấp a X (X - a) + = X - a Gợi ý: Chiều thuận, tức ta có W 3NF Giả sử có a thuộc X a thuộc tính thứ cấp mà (X - a) + X - a, tức có phần tử b X - a X- a b Có hai trường hợp: b = a ta có vô lý W có tập X - a kéo theo phần tử thứ cấp b mà bao đóng khác R (bao đóng X - a R X - a X = X+R) Nếu b a X - a không chứa b nên X không chứa b X bA, điều vô lý X+ = X, nghĩa X không kéo theo phần tử không thuộc Vậy điều giả sử sai nên (X - a)+ = X - a Chiều ngược lại, ta chứng minh tương tự 2.37 Giả sử r quan hệ R Chứng minh r 3NF với A thuộc E (E hệ quan hệ r - xem tập 24), a phần tử thứ cấp thuộc A (A - a)+ = A - a 2.38 Cho sơ đồ quan hệ W = < R, F > Fn thuộc tính thứ cấp Chứng minh W BCNF B K -1, a B (B - a)+ = (B - a) 2.39 Cho lược đồ quan hệ R = {A, B, C, D, E, G}, tập PTH F = {AB C, C B, ABD E, G A} Xét xem W = < R, F > có BCNF không ? 40 * Cho quan hệ r, E hệ r Từ E ta lập hệ M gọi hệ cực đại r gồm tập lớn E, nghĩa E có tập lồng tập lớn thuộc M: 91 Chương 2: mô hình sở liệu quan hệ TS Nguyễn Bá Tường: lý thuyết cSDL phân tán M = {B E: (not ) B E mà B B} Chứng minh r BCNF với A thuộc M a thuộc A (A - a) + = A - a 2.41 * Cho sơ đồ quan hệ W = < R , F >, F PTH dạng tầm thường (X Y mà Y X) Chứng minh rằng: W BCNF A B F A + = R 2.42 Hãy xét xem quan hệ r1 r2 ví dụ 2.32 thuộc dạng chuẩn ? Thử lại xem r1, r2 có 4NF không ? 2.43* Chứng minh tính chất 1, 2, 3, 4, 5, phụ thuộc đa trị MD 2.44 Cho lược đồ quan hệ R = {A1, A2, An}, X, Y R Chứng minh Nếu X Y X Y (nói cách khác PTH trờng hợp riêng MD) 2.45 * Ta nói MD X Y R không tầm thường (non trivial) Y , Y not X X Y R Cho lược đồ quan hệ R; X, Y, Z tập rời X Y Z = R Nếu X Y X Z ta có X Y (hoặc Z) Khi MD X Y (hoặc Z) ta gọi MD kề PTH X Y (hoặc Z) Ta nói phụ thuộc đa trị X Y không tầm thường không kề PTH R Cho sơ đồ quan hệ W = < R, F > K = {K1, K2, , Km} tập khóa W Chứng minh Y ( Ki) = X (Y - Ki) với i = 1, 2, m MD X Y không MD 2.46* Giả sử MD X Y MD R K = {K1, K2, , Km} tập khóa R Chứng minh X (Y - Ki), i = 1, 2, m Y ( Ki) 2.47 Giả sử X Y MD không tầm thường lược đồ R K1, K2, Km tập khóa R mà: Y - Ki , i = 1, 2, m Chứng minh Y ( Ki) = X Y KI , i = 1, 2, m X Y MD không 2.48* Giả sử X Y MD lược đồ quan hệ R; K = {K1, K2, , Km} tập khóa R Chứng minh X (Y Ki) Y ( Ki) Chương 2: mô hình sở liệu quan hệ 92 TS Nguyễn Bá Tường: lý thuyết cSDL phân tán 2.49* Giả sử X Y MD không tầm thường lợc đồ quan hệ R K1, K2, Km tập khóa R mà Y - Ki , i = 1, m Chứng minh X (Y Ki) X (Y Kj) với i j 2.50* Giả sử X Y MD không tầm thường R K khóa R, Y K Chứng minh X (Y K) Y 2.51* Giả sử X Y (hoặc Z) MD R Chứng minh với khóa K R K - Y K - Z 2.52* Chứng minh X Y (hoặc Z) MD R, K khóa R K có phần tử, tức K 2.53* Chứng minh X Y MD không tầm thường X Y tồn khóa K mà X Y K 2.54 Cho lược đồ quan hệ R = {B, D, I, O, S, Q}, tập ràng buộc {S D, I B, IS Q, B Q} Xét xem W có 4NF không? 2.55 Cho lược đồ R = {A, B, C, D, E, I} tập ràng buộc {A BCD, B AC, C D} W = < R, F > có 4NF không? 2.56 Gọi U tập thuộc tính D tập phụ thuộc (thuộc loại bất kỳ) tập thuộc tính U Chúng ta định nghĩa SAT (D) tập quan hệ r U cho r thoả phụ thuộc D Hãy chứng minh a) SAT (D D2) = SAT (D1) SAT (D2) b) Nếu D1 suy diễn logic tất phụ thuộc D2 SAT (D1) SAT (D2) 2.57 Gọi F tập hợp phụ thuộc với vế phải có thuộc tính a) Chứng minh lược đồ R có phụ thuộc vi phạm BCNF XA, XA thuộc F+ tồn phụ thuộc YB tập F vi phạm dạng BCNF R 93 Chương 2: mô hình sở liệu quan hệ TS Nguyễn Bá Tường: lý thuyết cSDL phân tán b) Chứng minh giống cho dạng chuẩn cấp ba 2.58 Chứng minh nhận xét sau : Nếu R lược đồ quan hệ X R khoá R ứng với tập phụ thuộc F X có vi phạm dạng 3NF ứng với tập phụ thuộc X(F) chiếu F lên X 2.59 Chứng minh có phụ thuộc gọi Phụ thuộc hàm gắn kết (embedded functional dependency) Nghĩa S R XY s(R) XY R 2.60 Phụ thuộc bao hàm đơn (unary inclusion dependency) AB A, B thuộc tính (có thể từ quan hệ khác nhau) khẳng định giá trị hợp lệ quan hệ, giá trị xuất cột A xuất cột B Chứng tỏ tiên đề sau đắn đầy đủ phụ thuộc bao hàm đơn a) AA với A b) Nếu AB BC AC 2.61 Giả sử với số chẵn n có thuộc tính A1,An Cũng giả sử AiAi+1 với i lẻ, nghĩa i = 1,3,, n-1 Cuối giả sử với i = 3,5,, n-1 có AiAi+1 A1 An a) Chứng minh quan hệ giả định hữu hạn tất phụ thuộc đảo ngược lại nghĩa là: A2 A1, A2 A3, A4A3, A4A5,, AnAn-1, AnA1 Chương 2: mô hình sở liệu quan hệ 94 TS Nguyễn Bá Tường: lý thuyết cSDL phân tán b) Chứng minh tồn quan hệ vô hạn mà (a) không đúng; nghĩa chúng thoả tất phụ thuộc cho không thoả phụ thuộc đảo ngược 2.62.Chứng minh D tập phụ thuộc hàm quan hệ R có dạng BCNF ứng với D R có dạng 4NF ứng với D 2.63 Chứng minh XA1,, XAn phụ thuộc hàm phủ cực tiểu lợc đồ XA1,An có dạng 3NF Câu hỏi tập ôn thi (tham khảo) 2.64 Định nghĩa quan hệ, cho ví dụ 2.65 Nêu định nghĩa phép toán quan hệ 2.66 Nêu định nghĩa phụ thuộc hàm, bao đóng tập PTH F, tập thuộc tính X 2.67 Nêu định nghĩa khóa sơ đồ quan hệ, cho ví dụ 2.68 Trình bày thuật toán tìm khóa, cho ví dụ 2.69 Nêu định nghĩa dạng chuẩn (2NF), cho ví dụ 2.70 Nêu định nghĩa dạng chuẩn (3NF), cho ví dụ 2.71 Nêu định nghĩa dạng chuẩn BCNF, cho ví dụ 2.72 Nêu định nghĩa dạng chuẩn (4NF), cho ví dụ 2.73 Nêu định nghĩa hệ Sperner, chứng minh họ khóa sơ đồ quan hệ W hệ Sperner ngược lại 2.74 Cho hai quan hệ r s sau: r s A B C D A B C D 0 1 1 0 2 1 1 1 1 95 Chương 2: mô hình sở liệu quan hệ TS Nguyễn Bá Tường: lý thuyết cSDL phân tán 1 1 x y z v a- Tính r - s s - r b- Tính r + s c- Tính r * s d- Giả sử X = {A, B, D}, Y = {A, C, D} Tính quan hệ chiếu r X, r Y s X, s Y, (r+s) X, (r+s) (X Y) e- Chứng minh với quan hệ r, s, q ta có : e r * s = s * r r + s = s + r (tính giao hoán) e r * (q + s) = (r * q) + (r * s) (tính kết hợp) e (r + s) X = r X + s X e (r * s) X = r X * s X 2.75 Cho hai quan hệ r s sau: r s A B C D E 0 1 1 Tính tích Decac r s: r x s 2.76 Cho hai quan hệ r s sau: r s A B C D E D E 0 0 0 1 1 1 1 1 0 0 1 Tính r ữ s 2.77 Cho sơ đồ quan hệ W = < R, F > Chứng minh (giải thích) với tập X R phần tử A thuộc tập X X A F+ Tức A X R X A F + 2.78 Cho sơ đồ quan hệ W = < R, F >, với R = {A, B, C, D ] F = {A B, BC D} PTH dãy sau suy từ F qui tắc PTH : a- C D b- A D Chương 2: mô hình sở liệu quan hệ 96 TS Nguyễn Bá Tường: lý thuyết cSDL phân tán c- AD C d- BC A e- B CD 2.79 Cho sơ đồ quan hệ W = < R, F >,với R = {A, B, } F = {AB E, AG I, BE I, E G, GI H} Chứng minh AB GH 2.80 Cho sơ đồ quan hệ W = < R, F >, với R = {A, B, C, D, E, G, H}, tập PTH F: F = {A D, AB DE, CE G, E H} Tính (AB)+ 2.81 a - Tìm khóa lại W = < R, F > ví dụ 2.20 tìm khóa sơ đồ quan hệ W= < R, F > tập 2.15 b - Cho sơ đồ quan hệ W = < R, F >, với R = {A,B,C,D,E,H} F = {A E, C D, E DH} Chứng minh K = {A,B,C} khóa W c - Cho sơ đồ quan hệ W = < R, F >, với R = {A,B,C,D} F = {AB C, D B, C ABD} Tìm khóa W d - Cho sơ đồ quan hệ W = < R, F >, với R = {A,B,C,D,E,G} F = {AB C, C A, BC D, ACD B, D EG,BE C, CG BD, CE CG} Tìm khóa W 2.82 Xét lược đồ quan hệ có thuộc tính S (stor), D (department), I (item) M (manager) với phụ thuộc hàm SID SDM a) Tìm tất khoá SĐQH W= b) Chứng minh W 2NF không 3NF 97 Chương 2: mô hình sở liệu quan hệ [...]... 1: mạng máy tính 28 TS Nguyễn Bá Tường: lý thuyết cSDL phân tán 29 Chương 1: mạng máy tính TS Nguyễn Bá Tường: lý thuyết cSDL phân tán chương 2 mô hình cơ sở dữ liệu quan hệ 2.1 Mở đầu ee 4v n or g Mô hình cơ sở dữ liệu quan hệ là một mô hình được sử dụng rộng rãi trong đời sống xã hội của mọi tổ chức, cơ quan, xí nghiệp, doanh nghiệp, nơi nào cần quản lý và xử lý các thông tin Ta xét một vài ví dụ minh... gửi dữ liệu theo từng đơn vị chứ không cần ở một tốc độ cố định Phần lớn các giao tiếp máy tính đều theo cách này; không có ràng buộc thời gian thực và dữ liệu được yêu cầu theo từng đợt Dịch vụ UBR sẽ nỗ lực tối đa để phân phối dữ liệu nhưng không đưa ra bất kỳ một bảo đảm nào 23 Chương 1: mạng máy tính TS Nguyễn Bá Tường: lý thuyết cSDL phân tán Dịch vụ rt-VBR Dịch vụ này cũng dành cho dòng dữ liệu. .. mã khách, NR: phòng số, TIEN: tiền thuê phòng Trong hai ví dụ trên tuy để quản lý các mảng thông tin (dữ liệu) khác nhau nhưng cả hai đều có chung một đặc thù: dữ liệu được mô tả dưới dạng bảng, mỗi bảng có một dòng đầu là dòng thuộc tính 29 Chương 2: mô hình cơ sở dữ liệu quan hệ TS Nguyễn Bá Tường: lý thuyết cSDL phân tán Trong ví dụ 2.1 các thuộc tính là TT, ms, tên, ns, tđô, quê, gt, lương Trong... vào các "mạng dữ liệu" hoặc các mạng được cấu trúc đặc biệt để mang dữ liệu số, hoặc ở dạng số hoặc ở dạng tương tự đã được điều chế Vì vậy, ít nhất là về mặt logic, các mạng dữ liệu khác biệt hoàn toàn với các mạng điện thoại (truyền âm thanh) Tuy nhiên nhiều ứng dụng mới (thí dụ các hệ thông tin đa phương tiện) có nhu Chương 1: mạng máy tính 22 TS Nguyễn Bá Tường: lý thuyết cSDL phân tán cầu truyền... một cách nào đó để quản lý thư mục Có một số loại trạm di động khác nhau Thứ nhất là loại bao gồm các máy tính khá đơn giản với khả năng hạn chế Trong trường hợp này, dữ liệu được lưu trên các máy tính của mạng hữu tuyến và các trạm di động sẽ "tải" dữ liệu xuống khi cần Bối cảnh này là thực tế đối với một số ứng dụng Tuy nhiên trong trường hợp này, bài toán quản lý dữ liệu phân tán không bị ảnh hưởng... vào Trong một môi trường như thế, việc truyền dữ liệu trên mạng không liên tục nhưng theo từng đợt Các đường truyền khi đó có thể được dùng cho những người khác khi một người sử dụng trước đó đang đợi Chương 1: mạng máy tính 18 TS Nguyễn Bá Tường: lý thuyết cSDL phân tán trả lời hoặc đang suy nghĩ Một lý do nữa là việc tách gói cho phép truyền song song dữ liệu Hệ thống không nhất thiết phải truyền các... hưởng nhiều bởi tính chất di động nhờ dữ liệu nằm chủ yếu trên các máy hữu tuyến Đáng chú ý hơn là môi trường trong đó các trạm di động có khả năng tính toán mạnh và khả năng lưu trữ dữ liệu của riêng nó và có thể có những máy khác cần dùng dữ liệu đó - chúng được gọi là các "Trạm du mục" (walkstation) Cách tiếp cận này gây ra nhiều khó khăn cho việc quản lý dữ liệu bởi vì các đặc trưng truyền thông,... phần tử của quan hệ Để ký hiệu một quan hệ nào đó trên tập thuộc tính R = {A1, A2, An}đôi khi ta viết R(A1, A2, An) 31 Chương 2: mô hình cơ sở dữ liệu quan hệ TS Nguyễn Bá Tường: lý thuyết cSDL phân tán Ta quay lại ví dụ 2 1 bảng lưu trữ hồ sơ nhân sự của cơ quan là một quan hệ Với R = {TT, MS, TÊN, NS, TĐÔ, QUÊ, GT, LƯƠNG} D(TT) = {1, 2, 3, 4, } D(TÊN) = {Minh, Tiến, Lan, Hiền, } D(MS) = {01,... cho các quan hệ trên nó, nên đôi khi thay cho việc nói cho LĐQH R và r là quan hệ trên R ta có thể nói cho quan hệ R(A1, , An) Thí dụ 2.3: Chương 2: mô hình cơ sở dữ liệu quan hệ 32 TS Nguyễn Bá Tường: lý thuyết cSDL phân tán Ta xét CSDL quản lý lương của cán bộ Cho LĐQH R = {MA, HOTEN, ĐƠNVI, NS, LƯƠNG, PHUCÂP, THƯƠNG} và quan hệ r như sau: MA HOTÊN ĐƠNVI NS LƯƠNG PHUCÂP 01 Minh G1 1965 400 50 02... nên trên R = {A,B,C} ta có 212 quan hệ r khác nhau Ví dụ r0 = { } là quan hệ rỗng, r1= {(0,a,x)}, r1= {(0,b,x)} là các quan hệ chứa 1 phần tử, quan hệ Chương 2: mô hình cơ sở dữ liệu quan hệ 30 TS Nguyễn Bá Tường: lý thuyết cSDL phân tán r2= {(0,a,x), (0,b,x) } là quan hệ chứa 2 phần tử còn quan hệ r = {(0,a,x), (0,a,y), (0,b,x), (0,b,y), (0,c,x), (0,c,y), (1,a,x), (1,a,y), (1,b,x), (1,b,y), (1,c,x), ... Nguyễn Bá Tường: lý thuyết cSDL phân tán 29 Chương 1: mạng máy tính TS Nguyễn Bá Tường: lý thuyết cSDL phân tán chương mô hình sở liệu quan hệ 2.1 Mở đầu ee 4v n or g Mô hình sở liệu quan hệ mô... quản lý mảng thông tin (dữ liệu) khác hai có chung đặc thù: liệu mô tả dạng bảng, bảng có dòng đầu dòng thuộc tính 29 Chương 2: mô hình sở liệu quan hệ TS Nguyễn Bá Tường: lý thuyết cSDL phân. .. quản lý đại học( quan hệ chứa tất thí sinh dự thi đại học) quan hệ cụ thể quản lý trường đại học với lược đồ R Như Chương 2: mô hình sở liệu quan hệ 46 TS Nguyễn Bá Tường: lý thuyết cSDL phân

Ngày đăng: 03/01/2016, 19:56

Từ khóa liên quan

Tài liệu cùng người dùng

Tài liệu liên quan