Tài liệu hạn chế xem trước, để xem đầy đủ mời bạn chọn Tải xuống
1
/ 33 trang
THÔNG TIN TÀI LIỆU
Thông tin cơ bản
Định dạng
Số trang
33
Dung lượng
560,79 KB
Nội dung
Tổ ch ức lưu tr trữ ữ ph phươ ương ng th thứ ức truy xu xuấ ất Dẫn nhập Dẫn nh nhậ ập Các ph phươ ương ng tiệ tiện lưu tr trữ ữ DL CPU sử dụng ñể thi hành CT nhanh Volatile storage: thông tin nguồn Cache (RAM) Main memory (DRAM) Primary storage CPU dùng DRAM ñể làm nơi load CT + DL, thi hành CT Flash memory (MP3, USB) Nonvolatile storage Secondary storage/ Magnetic disk On-line storage Optical disk (CD-ROM) Giá thành Tốc ñộ Tertiary storage/ Magnetic tapes Off-line storage ðĩa từ (Magnetic disk) Một số khái niệ niệm mặt ñĩa chia thành nhiều track, track chia thành nhiều block (page) cluster = n block Dữ liệu ñĩa phải ñược chép vào nhớ cần xử lý Nếu liệu có thay đổi ghi trở lại vào ñĩa Bộ ñiều khiển ñĩa (disk controller - DC): giao tiếp ổ đĩa máy tính, nhận lệnh I/O, ñịnh vị ñầu ñọc làm cho hành ñộng R/W diễn Block ñơn vị ñể lưu trữ chuyển liệu Tập tin (File) Mẫu tin (Record) : lưu trữ thông ti ñối tượng ◦ Xác ñịnh : ñịnh danh mẫu tin (record-ID) ◦ Bao gồm hay nhiều trường (field) : cấu trúc Tập tin ◦ Tập hợp mẫu tin có cấu trúc Tập tin (tt) Số mẫu tin không hạn chế Thao tác với mẫu tin qua trỏ mẫu tin (record pointer) Có hai mẫu tin ñặc biệt ◦ Begin Of File (BOF) ◦ End Of File (EOF) File Header : chứa thơng tin để truy xuất tập tin Tập tin (tt) Các thao tác ◦ ◦ ◦ ◦ ◦ Mở tập tin ðịnh vị mẫu tin ðọc 1/n mẫu tin Viết 1/n mẫu tin ðóng tập tin Heap file Là hình thức lưu trữ liệu record lưu không theo thứ tự logic (mà thứ tự thêm liệu) Thường liệu quan hệ lưu file ◦ Tìm kiếm: duyệt ◦ Thêm: nhanh Cách thức lưu trữ thao tác liệu dễ, thích hợp cho tập tin có kích thước nhỏ, chậm tập tin có kích thước lớn Tập tin tu tuầ ần tự (Sequential Sequential)) Là hình thức lưu trữ liệu mẫu tin lưu trữ theo thứ tự trường search key Link mẫu tin quan hệ thứ tự pointer Thích hợp cho ứng dụng ñặc trưng làm việc liệu ñược xếp (theo search key) ◦ Tìm kiếm: duyệt tìm Nên lưu trữ vật lý theo thứ tự search key ñể giảm thiểu số block cần phải truy cập Nhưng: ◦ Khi liệu lớn, thao tác Insert, Delete phức tạp Clustering File Việc lưu trữ có ích: ◦ Giảm thời gian truy xuất ñĩa số block phải ñọc giảm ◦ Giá trị field cluster key ñược lưu lần, có record table khác tham chiếu đến dịng ⇒ tiết kiệm khơng gian để lưu trữ (và tạo mối quan hệ liệu) Tổ chức dl theo kiểu cluster khơng ảnh hưởng ñến việc tạo index table tham gia tạo cluster Sử dụng cluster file Chỉ ñịnh cluster giai ñọan thiết kế vật lý Chọn table ñể gom nhóm: ◦ Các table chủ yếu phục vụ cho truy vấn (select), thêm (insert) cập nhật (update) ◦ Chứa liệu ñược truy vấn chung kết với tần suất cao Chọn field làm cluster key ◦ Cluster key phải có đủ giá trị phân biệt ñể record liên quan ñến giá trị cluster key lấp gần ñầy block liệu Nếu có dịng q làm tốn khơng gian lưu trữ mà hiệu khơng đáng kể Có thể định SIZE tạo cluster, số byte trung bình ước tính để lưu cluster Nếu có nhiều dịng q khơng hiệu Dùng cluster key có q giá trị, vd: PHAI, phản tác dụng 20 Ch Chỉỉ mục (Index) Về kỹ thuật, có lọai index bản: ◦ Index thứ tự (ordered indices) dựa giá trị làm index Dùng PP tìm nhị phân file index Index file có thứ tự gồm mẫu tin có chiều dài cố định gồm field Field 1: khóa tìm kiếm Field 2: trỏ trỏ đến block ◦ Index dùng kỹ thuật băm (hash indices) ðánh giá kỹ thuật dùng index Lọai truy xuất Thời gian truy xuất (access time) Thời gian Insert / delete Khơng gian đĩa dùng cho index 21 Phân lo loạ ại ch chỉỉ mục Dense index ◦ File liệu có giá trị search key file index có nhiêu record ◦ Mỗi record file index chứa giá trị search key trỏ trỏ ñến record ñầu tiên file liệu có giá trị trường search key Sparse index ◦ Các record tập tin index ứng với số giá trị file liệu trường search key (chứ tất giá trị search key dense index) ◦ ðể tìm giá trị, ta tìm tập tin index mẫu tin cho giá trị search key lớn =,