1. Trang chủ
  2. » Công Nghệ Thông Tin

Bài giảng Tổ chức dữ liệu vật lý - Vũ Tuyết Trinh

13 2 0

Đang tải... (xem toàn văn)

Tài liệu hạn chế xem trước, để xem đầy đủ mời bạn chọn Tải xuống

THÔNG TIN TÀI LIỆU

Thông tin cơ bản

Định dạng
Số trang 13
Dung lượng 293,54 KB

Nội dung

Bài giảng Tổ chức dữ liệu vật lý cung cấp cho sinh viên các kiến thức về quản lý lưu trữ dữ liệu, tổ chức bộ nhớ ngoài, thiết bị nhớ ngoài, tổ chức tệp, các phép toán, so sánh các tổ chức dữ liệu. Đây là một tài liệu hữu ích dành cho các bạn sinh viên Công nghệ thông tin dùng làm tài liệu học tập và nghiên cứu.

Nhập môn sở liệu Tổ chức liệu ệ vật ậ lý ý Vũ Tuyết Trinh trinhvt@it-hut.edu.vn Bộ môn Các hệ thống thông tin, Khoa Công nghệ thông tin Đại học Bách Khoa Hà Nội Hệ CSDL Ứng dụng Hệ QTCSDL CSDL Vũ Tuyết Trinh, b/m Hệ thống thông tin, Khoa CNTT, ĐHBKHN CSDL Nhập môn sở liệu Bộ xử lý câu hỏi Quản lý lưu trữ { z { Bộ quản lý lưu trữ Tổ chức tệp: xếp ghi thiết ế bị nhớ z Bộ quản lý lưu trữ Quản lý giao dịch Quản lý buffer RID (record id): xác định địa vật lý ghi số: cấu trúc liệu xác định tương ứng RID ghi giá trị trường (khoá) Vùng nhớ đệm: trung gian thiết bị nhớ ngồi nhớ (có thể sử dụng cho DL số) Bộ quản lý Giao dịch Quản lý tệp Metadata & Data dictionary Data & index Tổ chức nhớ ngồi { Mục đích: giảm thiểu truy xuất đến liệu không cần ầ thiết ế thiết ế bị nhớ { Các vấn đề cần quan tâm z z Cấu trúc lưu trữ Các phép tốn (thêm, xố, sửa, tìm kiếm) Vũ Tuyết Trinh, b/m Hệ thống thông tin, Khoa CNTT, ĐHBKHN Nhập môn sở liệu Các thiết bị nhớ { Đĩa từ, băng từ, trống từ, { Đĩa từ: tổ chức thành trang z z { Băng từ: z z { Chí phí truy nhập đến trang tương đương Chí phí đọc nhiều trang liền < chí phí đọc trang theo thứ tự đọc trang liền rẻ đĩa từ chi phí truy nhập thương lớn Đĩa từ vs nhớ { { { { Tốc độ truy nhập ms vs ns (~1000 lần) Kích thước GB vs 10x MB (~ 100 lần với chi phí) Lưu trữ ổn định (kể điện) vs tạm thời Phân chia block 4KB vs 1Byte Vũ Tuyết Trinh, b/m Hệ thống thông tin, Khoa CNTT, ĐHBKHN Nhập môn sở liệu Nội dung { { { { Tổng quan tổ chức nhớ Tổ chức tệp đống Tổ chức tệp băm Tổ chức tệp dẫn Cây cân Tổ chức tệp đống (Heap File) { Lưu trữ ghi trang khô ttuân không â th theo ột thứ ttự đặc đặ biệt { Để thực phép toán, cần: z z z ¾ Ghi nhớ số trang tệp Ghi nhớ không gian trống trang Ghi nhớ ghi trang Có trỏ trỏ tới tất trang tệp trỏ lưu trữ nhớ Vũ Tuyết Trinh, b/m Hệ thống thông tin, Khoa CNTT, ĐHBKHN Nhập môn sở liệu Cài đặt tệp đống danh sách Data Page Data Page Data Page Data Page Data Page Data Page Full Pages Header Page { { Pages with Free Space Cần lưu trữ HeaderPage tên tệp Mỗi trang gồm liệu trỏ Các phép tốn { Tìm kiếm ghi { Thêm ghi { Xoá ghi { Sửa đổi ghi Vũ Tuyết Trinh, b/m Hệ thống thông tin, Khoa CNTT, ĐHBKHN Nhập môn sở liệu Sử dụng trang danh bạ Data Page Header Page Data Page DIRECTORY { { Data Page N Lưu thông tin số byte cịn trống trang Danh bạ tập trang Tổ chức tệp băm (Hash File) { Mục đích z z { Sử dụng số để hạn chế số lượng phép truy xuất đĩa phân nhóm ghi (giả thiết n nhóm) Mapping giá trị khố với vị trí (nhóm) ghi tương ứng D Dựa t ê bảng bả băm bă (hash (h h ttable) bl ) z z Hàm băm (hash function) Cụm (bucket) Vũ Tuyết Trinh, b/m Hệ thống thông tin, Khoa CNTT, ĐHBKHN Nhập môn sở liệu Ví dụ h(x) = x mod 4 Store hash 4 Ví dụ tiếp h(x) = x mod 10 12 Store hash 4 10 12 Vũ Tuyết Trinh, b/m Hệ thống thông tin, Khoa CNTT, ĐHBKHN Nhập mơn sở liệu Các phép tốn { Tìm kiếm ghi { Thêm ghi { Xoá ghi { Sửa đổi ghi Tiêu chí chọn hàm băm { { Phân bố ghi tương đối đồng (theo cụm) Hạn chế việc sử dụng nhiều trang nhớ cho cụm Vũ Tuyết Trinh, b/m Hệ thống thông tin, Khoa CNTT, ĐHBKHN Nhập môn sở liệu Tổ chức tệp dẫn (Index File) { { { Tệp dẫn theo khoá chọn ghi Tệp dẫn bao gồm cặp (k,d), k giá trị khố ghi đầu tiên, d địa khối (hay trỏ khối) Tệp dẫn xếp theo giá trị khố Các phép tốn { Tìm kiếm ghi { Thêm ghi { Xoá ghi { Sửa đổi ghi Vũ Tuyết Trinh, b/m Hệ thống thông tin, Khoa CNTT, ĐHBKHN Nhập mơn sở liệu Tìm kiếm ghi { Tìm kiếm z z { Duyệt tệp dẫn ẫ từ ghi đầu ầ tiên đến ế tìm thấy ấ ghi có khố k cần tìm Nhận xét { chậm tệp dẫn nói chung { Thích hợp với tệp dẫn nhỏ đủ để lưu nhớ Tìm kiếm nhị phân z z Chia đơi tệp dẫn xếp để hạn chế số ghi cần duyệt Tại lần chia hạn chế ½ số ghi cần xem xét Cây cân (BalanceTree) { B-tree cân tổ chức theo cấp m, có tính chất ấ sau đây: z z z Gốc nút có hai Mỗi nút (trừ nút gốc nút lá) có từ [m/2] đến m Mỗi đường từ nút gốc đến nút có độ dài Vũ Tuyết Trinh, b/m Hệ thống thông tin, Khoa CNTT, ĐHBKHN 10 Nhập mơn sở liệu Ví dụ Nhận xét { Cấu trúc nút B-tree z z { { (p0, kl, p1, k2, ,kn, pn) pi (i=l n) trỏ trỏ tới khối i nút có ki khố khối Các khố k nút xếp theo thứ tự tăng dần Mọi khoá con, trỏ pi nhỏ ki+1 Mọi khoá con, trỏ pn lớn kn Vũ Tuyết Trinh, b/m Hệ thống thông tin, Khoa CNTT, ĐHBKHN 11 Nhập môn sở liệu Các phép tốn { Tìm kiếm ghi { Thêm ghi { Xoá ghi { Sửa đổi ghi So sánh cách tổ chức liệu { Tệp đống { Tệp băm { Tệp dẫn { Cây cân Vũ Tuyết Trinh, b/m Hệ thống thông tin, Khoa CNTT, ĐHBKHN 12 Nhập môn sở liệu Kết luận { Truy cập đến CSDL thường liên quan đến phần nhỏ ghi tệp liệu hay vài trường (đặc biệt trường khố) ghi liệu ¾ { Xác định yêu cầu cho phép thiết kế liệu vật lý hiệu thông qua việc sử dụng tổ chức lưu trữ đặc biệt Tệp ệp dẫn ợ tạo lập ập khố tìm kiếm để tăng hiệu lưu trữ liệu ¾ Hiệu cấu trúc dẫn khác phụ thuộc vào điều kiện áp dụng chúng Vũ Tuyết Trinh, b/m Hệ thống thông tin, Khoa CNTT, ĐHBKHN 13 ... vs 1Byte Vũ Tuyết Trinh, b/m Hệ thống thông tin, Khoa CNTT, ĐHBKHN Nhập môn sở liệu Nội dung { { { { Tổng quan tổ chức nhớ Tổ chức tệp đống Tổ chức tệp băm Tổ chức tệp dẫn Cây cân Tổ chức tệp... sở liệu Bộ xử lý câu hỏi Quản lý lưu trữ { z { Bộ quản lý lưu trữ Tổ chức tệp: xếp ghi thiết ế bị nhớ z Bộ quản lý lưu trữ Quản lý giao dịch Quản lý buffer RID (record id): xác định địa vật lý. .. Cụm (bucket) Vũ Tuyết Trinh, b/m Hệ thống thông tin, Khoa CNTT, ĐHBKHN Nhập mơn sở liệu Ví dụ h(x) = x mod 4 Store hash 4 Ví dụ tiếp h(x) = x mod 10 12 Store hash 4 10 12 Vũ Tuyết Trinh, b/m Hệ

Ngày đăng: 10/05/2021, 23:17

TỪ KHÓA LIÊN QUAN

TÀI LIỆU CÙNG NGƯỜI DÙNG

TÀI LIỆU LIÊN QUAN