1. Trang chủ
  2. » Công Nghệ Thông Tin

bài giảng chương v cấu trúc lưu trữ và phương pháp truy xuất

41 386 0

Đang tải... (xem toàn văn)

Tài liệu hạn chế xem trước, để xem đầy đủ mời bạn chọn Tải xuống

THÔNG TIN TÀI LIỆU

Thông tin cơ bản

Định dạng
Số trang 41
Dung lượng 913,97 KB

Nội dung

Chương V Cấu trúc lưu trữ phương pháp truy xuất Nội dung  Giới thiệu  Đĩa (magnetic disk)  Mẫu tin (record)  Sắp xếp mẫu tin vào block  Tổ chức mẫu tin tập tin Giới thiệu (tt)  Phân cấp lưu trữ  Bộ nhớ  Dữ liệu hành  Đĩa  CSDL thức  Băng từ (tape) hay đĩa quang (optical disk)  Phiên cũ CSDL Đĩa (Disk) Quản lý đĩa  Một mặt đĩa chia thành nhiều track, track chia thành nhiều     block(page) cluster = n block Dùng đĩa từ (magnetic disk) để lưu CSDL vì:  Khối lương lưu trữ lớn  Lưu cách bền bỉ, lâu dài, phục vị truy cập xử lý lặp lại  Chi phí rẻ Dữ liệu đĩa phải chép vào nhớ cần xử lý Nếu liệu có thay đổi ghi trở lại vào đĩa Bộ điều khiển đĩa(Disk controller - DC): giao tiếp ổ đĩa máy tính, nhận lệnh I/O, định vị đầu đọc làm cho hành động R/W diễn Block đơn vị để lưu trữ chuyển liệu Lưu tập tin đĩa Mục đích Mẩu tin Tập tin 10 Tuần tự (Sequential)  Các mẫu tin tổ chức lưu trữ theo thứ tự đó, thơng thường theo trường khóa tìm kiếm (search-key)  Khóa tìm kiếm khơng thiết khóa hay siêu khóa  27 Mỗi mẫu tin có trỏ trỏ đến mẫu tin khác theo thứ tự khóa tìm kiếm Tuần tự (tt)  Xóa mẫu tin  Sử dụng danh sách trỏ trỏ đến vùng trống  Thêm mẫu tin  Tìm vị trí thích hợp tập tin  Nếu có vị trí trống block thêm vào  Ngược lại thêm vào vùng overflow block  Cập nhật lại trỏ theo thứ tự khóa tìm kiếm 28 Tuần tự (tt)  Nhận xét  Giảm tối thiểu khối lượng block cần đọc truy xuất tập tin  Tốn nhiều chi phí di chuyển mẫu tin sau thêm xóa mẫu tin  Phải tổ chức lại tập tin theo thứ tự khóa tìm kiếm sau lần thêm xóa 29 Clustering  Xét quan hệ depositor customer  Thực câu truy vấn select account-number, customer-name, customer-street, customer-city from depositor, customer where depositor.customer-name=customer.customer-name  Nếu quan hệ depositor customer nằm gần 30 tập tin câu truy vấn thực cách hiệu  Khi customer đọc nguyên khối chứa đưa vào nhớ  Lúc depositor có liên quan đến customer có sẳn xử lý Clustering (tt)  Tổ chức clustering lưu trữ mẫu tin tương ứng hay nhiều quan hệ block  Nhận xét    31 Có hiệu truy vấn có phép kết Chưa thật tốt truy vấn quan hệ Một block có nhiều loại mẫu tin Chỉ mục (Indexing)  Chỉ mục dùng để truy xuất liệu nhanh  Một tập tin liệu có nhiều tập tin mục kèm theo  Tập tin mục gồm search-key pointer  Tập tin mục nhỏ nhiều so với tập tin liệu ban đầu  Tập tin mục xếp thứ tự theo khóa tìm kiếm 32 Chỉ mục (tt)  Nếu tập tin chứa mẫu tin thứ tự  Chỉ mục sơ cấp (Primary index)  Là mục có khóa tìm kiếm định nghĩa thứ tự xếp mẫu tin tập tin gốc  Còn gọi clustering index  Chỉ mục thứ cấp (Secondary index)  Là mục có khóa tìm kiếm đưa thứ tự xếp khác với thứ tự tập tin gốc  Còn gọi nonclustering index 33 Chỉ mục (tt)  Chỉ mục dày (Dense index)  Tập tin gốc có mẫu tin tập tin mục có nhiêu 34 Chỉ mục (tt)  Chỉ mục thưa (Sparse index)  Tập tin mục lưu lại số khóa tập tin gốc  Để xác định vị trí khóa k  Tìm tập tin mục khóa lớn bé k  Tìm tập tin gốc địa vừa xác định tập tin mục 35 Băm (hashing)  Chia mẫu tin tập tin thành vùng (bucket) tùy theo giá trị khóa mẫu tin  Mẫu tin thuộc vùng tùy thuộc vào hàm băm áp dụng mẫu tin  Sử dụng hàm băm để xác định vị trí mẫu tin  Các mẫu tin có khóa khác băm vào vùng, cần phải tìm vùng để định vị mẫu tin 36 Băm (tt)  Xét tập tin gồm mẫu tin account có trường branch-name khóa  Giả sử  10 vùng  Thứ tự thứ i ký tự bảng chữ số nguyên i  Hàm băm sum(các ký tự) modulo 10  h(Perryridge) =  h(Round Hill) =  h(Brighton) = 37 38 Băm (tt)  Các vùng xãy tượng tràn  Khơng đủ kích thước  Phân phối mẫu tin vào vùng khơng cân xứng  Có nhiều mẫu tin trùng giá trị khóa  Hàm băm cho kết băm không tốt  39 Vấn đề tràn vùng giải cách sử dụng thêm vùng tràn (overflow buckets) Cây cân (B-Tree)  B-Tree có gốc thỏa điều kiện  Tất đường từ nút gốc đến đến nút  Ngoại trừ nút gốc, nút có từ n/2 đến n  n bậc  Nút có từ (n-1)/2 đến n-1 khóa  Cấu trúc nút  Khóa tìm kiếm nút thứ tự tăng dần K1 < K2 < K3 < < Kn–1 40 Cây cân (tt) 41 ... disk) để lưu CSDL v? ?:  Khối lương lưu trữ lớn  Lưu cách bền bỉ, lâu dài, phục v? ?? truy cập xử lý lặp lại  Chi phí rẻ Dữ liệu đĩa phải chép v? ?o nhớ cần xử lý Nếu liệu có thay đổi ghi trở lại v? ?o... tin  Sử dụng danh sách trỏ trỏ đến v? ?ng trống  Thêm mẫu tin  Tìm v? ?? trí thích hợp tập tin  Nếu có v? ?? trí trống block thêm v? ?o  Ngược lại thêm v? ?o v? ?ng overflow block  Cập nhật lại trỏ theo... tin  Mẫu tin thuộc v? ?ng tùy thuộc v? ?o hàm băm áp dụng mẫu tin  Sử dụng hàm băm để xác định v? ?? trí mẫu tin  Các mẫu tin có khóa khác băm v? ?o v? ?ng, cần phải tìm v? ?ng để định v? ?? mẫu tin 36 Băm

Ngày đăng: 17/10/2014, 07:23

TỪ KHÓA LIÊN QUAN