Phương tiện lưu trữ dữ liệu phổ biến hiện nay là CD-ROM.
Lời giới thiệu Phơng tiện lu trữ dữ liệu phổ biến nhất hiện nay là CD-ROM. Các nhà sản xuất máy tính hàng đầu cũng đã trang bị CD cho các máy tính PC. CD ngày nay đã đến với từng gia đình, mang lại cho ngời sử dụng rất nhiều tiện ích mutimedia. Các nhà phát triển hệ thống đã điều chỉnh các ổ đĩa cứng với các phần mềm phù hợp để chạy trên đĩa CD. Các ứng dụng thấy đợc sự tiện lợi khi sử dụng đĩa CD cũng nh thấy đợc khối lợng dữ liệu khổng lồ mà CD có khả năng l- u trữ. Trong phần báo cáo này của chúng em, phần đầu chúng em trình bày về cơ sở lý thuyết về cấu trúc lu trữ của ổ đĩa CD. Phần sau trên cơ sở những lý thuyết đó chúng em xây dựng chơng trình để truy cập vào cấu trúc điều khiển của đĩa CD. 1 Báo cáo đề tài CDROM. Khuôn dạng vật lý: - CD-ROM đợc tổ chức nh thế nào:Bề mặt có thể ghi của CD-ROM có thể đợc chia thành 3 phần: + Lead in: 4mm đầu tiên, chứa các bảng nội dung. + Data Area: có thể đạt tới 33 mm tuỳ thuộc vào số lợng dữ liệu. + Lead out: đánh dấu sự kết thúc của vùng dữ liệu, rộng khoảng 1mm. Cấu trúc của đĩa CD Thông tin đợc lu trữ trên CD dới dạng các pit (vết lõm) và các lands;CD đợc lu trữ từ trong ra ngoài. 2 Vị trí của các pit và land trên CD-ROM Các phơng pháp lu trữ dữ liệu CAV và CLV: CAV (Constant Angular Velocity): tốc độ góc không đổi, ứng dụng trong đĩa cứng, tiến hành truy cập dữ liệu ở các tốc độ khác nhau, tuỳ theo khoảng cách của đầu từ đến trục ổ đĩa ở xa hay gần. Do đó thời gian khôI phục dữ liệu nhanh hơn khi đầu từ ở gần trục trung tâm, và trung gian khôI phục sẽ chậm dần khi đầu từ đợc chuyển từ trong ra ngoài. CLV (Constant Linear Velocity):tốc độ tuyến tính không đổi, làm nhanh hoặc làm chậm tốc độ quay của đĩa để đảm bảo tốc độ đĩa ở điểm đọc luôn không đổi. Để đảm bảo tốc độ tuyến tính không đổi đĩa phải quay chậm hơn khi đọc hoặc ghi ở gần trục tâm. Sự thay đổi tốc độ quay liên tục của đĩa CD là một trong những lý do làm cho thời gian truy cập trên CD ROM chậm hơn trên ổ cứng. Các phơng pháp lu trữ thông tin trên đĩa từ Lu trữ các bit và các byte: Bởi sự giới hạn về kỹ thuật, mỗi land (hoặc pit) có độ dài tối thiểu là 3 bit, và lớn nhất là 11 bit. Với giới hạn này ta không thể biểu diễn hai bit 1 liền nhau, cho nên không diễn tả hết đợc các hoán vị của 0 và 1, dẫn đến phải dùng lợc đồ EFM (Eight-to-Fourteen Modulation). 3 Bảng EFM Mỗi byte 8 bit thông thờng giờ đây đợc chuyển thành byte với 14 chanel bit, và sự chuyển đổi này dựa vào một bảng là một phần của đơn vị điều khiển trên mọi ổ CD-ROM. Nhng còn vấn đề nữa đặt ra là nếu kết thúc của một byte là một chanel 1 và bắt đầu của byte tiếp theo là chanel 1 thì không thể thể hiện đợc, cho nên phải chèn thêm 3 bit đợc gọi là 3 bit trộn để tách biệt giữa các byte, dẫn đến một byte có 17 chanel bit. Các frames: Khối thông tin nhỏ nhất trên một CD đợc gọi là một frame. Một frame bao gồm 24 byte. Các sector: CD Audio có thể đọc 75 sector/second. Địa chỉ dữ liệu trên CD dựa trên cơ sở các đơn vị thời gian có dạng: minutes/seconds /sector. 4 Một sector đợc định dạng trên CD Các subchannel: Một subchannel là sự kết hợp của tất cả các bit trong cùng một vị trí củâ các byte điều khiển của các frame kế tiếp. Luồng dữ liệu bao gồm các bit dữ liệu của 98 byte điều khiển trong một sector đợc gọi là P-channel, và tơng tự các luồng dữ liệu đợc thiết lập từ bit thứ hai là Q-channel. Sáu bit tiếp theo lập nên sau kênh từ R đến W. Minh hoạ một Subchannel 5 Subchannel P chỉ ra rằng music hay dữ liệu máy tính đợc tìm thấy trong một sector. Subchannel Q chứa đựng các thông tin thời gian, nó có thể là thời gian tuyệt đối tính từ sự khởi đầu của CD (ATime ) hay là thời gian tính theo track. Trong vùng Lead in, 72 bit của subchannel Q chứa đựng bảng nội dung 26 bit sử dụng cho đồng bộ và sửa lỗi. Subchannel RW chứa đựng dữ liệu đồng bộ và sữa lỗi. Sửa Lỗi: Có 2 x 39 Byte thông tin sửa lỗi trên mỗi Sector Với CD Audio sử dụng kỹ thuật - Reed - Solomon - Code. Với CD - ROM sử dụng - Cross Interleaved Reed Solomon Code CIRC: Sử dụng CIRC, với khuôn dạng CD - DA ta có tỷ lệ mắc lỗi là 1/10 8 . tỷ lệ vẫn cao đối với các dữ liệu quan trọng có một khuôn dạng mới Các khuôn dạng CD ROM: Xét mode 1: với việc giảm vùng data (2352 -> 2048 byte) và tăng thông tin sửa lỗi -> khả năng sinh lỗi giảm. Làm việc với 2k data là dễ dàng nhất đối với lập trình viên -> dùng để lu các thông tin quan trọng. Xét mode 2: không thêm vào các tín hiệu sửa lỗi -> dùng lu các thông tin không quan trọng (ví dụ ảnh). Ưu điểm: tỷ lệ chuyển giao dữ liệu nhanh, ví dụ trong 1 giây. chế độ 1: 75 x 2048 = 150 K chế độ 2: 75 x 236 = 171 K Mode 0: Sector rỗng, lấp đầy bởi 0 6 Khuôn dạng XA (Extended Architecture): o Chuẩn XA đợc phát triển để giải quyết một vấn đề đặc biệt cho các ứng dụng Multimedia. Ví dụ hiển thị văn bản trên màn hình trong khi đang chạy video và có nền của một bản nhạc, một ứng dụng phải đồng thời sử lý 3 luồng dữ liệu từ 3 file riêng biệt. Hơn nữa, ứng dụng phải thực hiện trong thời gian thực. Tuy nhiên với một CPU thì nó phải lặp đi lặp lại các công việc với các số lợng nhỏ dữ liệu của văn bản, video và music. Điều đó có nghĩa là CPU phải tải một phần file văn bản sau đó là một phần video, và cuối cùng là một phần của file music. Với khả năng truy cập chậm của CD - ROM thì thế giới muôn màu của Multimedia sẽ bị đổ sập nhanh chóng, video sẽ giật âm thanh bị méo và văn bản hiển thị không phù hợp. o Nét đặc trng quan trọng của XA đó là khả năng chèn các Sector. Bởi kỹ thuật này mà CPU đọc cả 3 loại dữ liệu mà không phải di chuyển đầu dọc. Với kỹ thuật này, các Sector đợc lồng vào một file, ví dụ nh 3 Sector văn bản bắt đầu một dãy tiếp theo là 4 Sectors video và tiếp theo là 3 Sector Audio. Bớc này cứ lặp đi lặp lại cho tới khi cả 3 luồng dữ liệu đều hết. XA flag trong Subheader của một Sector trong CD-ROM XA 7 High Sierra diễn tả khuôn dạng logic o Bây giờ ta sẽ đi tìm hiểu về các khuôn dạng logic - files và directorys. o Khuôn dạng HSG (High Sierra Group) nói về - Volume and File structure of compact Read only Optical Disk for Information Interchange. o ISO 9660 chấp nhận 99.5% sự đề xuất của HSG, điều khác biệt đó là cấu trúc các phần tử directory. Logical Sectors - Kích thớc của Sector logic HSG là 2048 byte (2k) - Mỗi Sector có một số duy nhất đợc gọi là Logical Sector Number (LSN) - Địa chỉ đầu tiên của LSN là 0 tơng ứng với Sector vật lý tại địa chỉ 00:02:00, vì thế một số Sector vật lý đầu tiên hình thành 2 s đầu tiên của CD không thể truy cập tại mức logic - Công thức chuyển đổi LSN ( mm : ss : ff) = (mm*60 +ss)*75 - 150 Logical Blocks (LBN) - Đế dễ dàng cho việc xử lý các Sector logic có thể đợc chia thành các logical blocks (LBN) - LBN có thể là 512 byte, 1024 byte, hay 2048 byte. - LBN cũng đợc đánh số, ta lấy ví dụ với LBN = 512 byte 8 File và tên file - Các file HSG đợc lu trữ dới dạng một dãy liên tiếp các Logical blocks và đợc gọi là extent, vì thế ta sẽ không tìm thấy một bảng FAT trên CD- ROM, thay vào đó ta chỉ cần biết vị trí bắt đầu và độ dài của file là đủ. - Tên file HSG: 8 byte cho tên (chỉ chứa các ký tự hoa A-Z, các số 0-9 và dấu gạch dới _) và 3 fbyte cho đuôi mở rộng. - Tên file ISO: 1 tên file có 32 ký tự có hoặc không có dấu chem. Directory và SubDirectory - Cd có một th mục gốc cho cấu trúc các file lu trữ, th mục gốc có thể có th mục con, th mục con có thể có th mục con của nó, cấp cao nhất là 8. - Th mục gốc và tất cả các th mục con của nó đợc lu trữ nh một file. Các file th mục có thể đợc sắp xếp giữa các th mục khác ở bất kỳ vị trí nào trên đĩa. Offset HSG field Type Meaning ISO field Type 00h Len-dr 1 Byte Độ dài các phần tử Direction (Byte) = 01h XAR-len 1Byte Số lợng Sector logic dự trữ cho XAR = 02h Loc- ExtendI 1Word Block logical đầu tiên của file tính theo Intel. = 06h Loc- ExtendM 1Word Block logical đầu tiên của file tính theo Motorola. = 0Ah Data-len I 1Word Độ dài file (Byte) tính theo Intel. = 0Eh Data-len M 1Word Độ dài file (Byte) tính theo Motorola. = 12h Record time 6Byte Ngày và thời gian của file Record time 7Byte 18h File flag HSG 1Byte Các cờ của file HSG 19h Reserver 1Byte File flag ISO 1Byte 1Ah Il-Size 1Byte Số các sector liên tiếp trong việc . 1Bh Il-Skip 1Byte 1Ch VSSN 1 1Word Số Volume theo định dạng Intel. 9 1Eh VSSN M 1Word Số Volume theo định dạng Motorola. 20h Len-fi 1Byte Độ dài tên file. 21h File-Id nByte Tên file, độ dài đợc xác định trong len-fi (32byte) 21h+n Padding 1Byte Fill Byte, khi trờng kế tiếp không bắt đầu tại địa chỉ bộ nhớ even Sys-data nByte Mọi thông tin ghi vào, từ chiều dài tên file (len-fi), chiều dài của trờng fixed fiedls và toàn bộ chiều dài của th mục vào (len-dr) có thể đợc tính toán. - Không có nhiều hơn 40 file trong một th mục cho ta tìm kiếm một file nhanh chóng. - Vì có nhiều phần tử Directory nằm trong một sector logic nên chỉ cần đọc sector đầu tiên của một th mục để tìm file mong muốn. Bảng đờng dẫn: - Cho ta tìm ra vị trí file một cách nhanh nhất. - Bảng đờng dẫn chứa đựng tên của tất cả các th mục và các th mục con trên CD, nó cũng chứa chỉ số sector đầu tiên của file th mục. - Có hai bản sao đờng dẫn cho Intel và Motorola. Extended Attribute Records (XAR): - Có bản ghi XAR cho ngời tạo ra file có khả năng lựa chọn các thông tin về file mà ta muốn, hình thành một kiểu hệ thống file hớng đối tợng. 10 [...]... cầu chính xác số lợng sector o DI:SI: Với các hàm yêu cầu số sector, o CF: chỉ ra lỗi sau lời gọi ngắt (Nếu có) o AL: Mã lỗi trả về khi CF khác 0 Một số hàm truy cập CDROM quan trọng: 1 Kiểm tra ổ đĩa CD-ROM (ngắt 2fh, hàm 15h, chức năng 00h): (Trả về số lợng ổ CD mà MSCDEX có thể địa chỉ hoá trong thanh ghi BX) Đầu vào: - AH=15H - AL=00H Đầu ra: 12 - BX= Số lợng ổ đĩa CDROM đợc quản lý CX = Nhãn... CX=Nhãn ổ CDROM đợc truy cập (ví dụ: 0 = A; 1 = B etc.) - ES:BX= FAR trỏ tới vùng đệm chứa tên file đọc đợc Đầu ra: - CF = 0: Đọc thành công CF = 1: Có lỗi.(nếu AL=15:Nhãn ổ CD không hợp lệ) c Lấy tên file tài liệu Biblioghraphic (ngắt 2fh, hàm 15h, chức năng 04h): File Biblioghraphic cho ta biết thông tin về nguồn thông tin ghi trên đĩa Đầu vào: - AH=15H - AL=04H 14 - CX=Nhãn ổ CDROM đợc truy cập (ví dụ: . khiển của đĩa CD. 1 Báo cáo đề tài CDROM. Khuôn dạng vật lý: - CD-ROM đợc tổ chức nh thế nào:Bề mặt có thể ghi của CD-ROM có thể đợc chia thành. thấy đợc khối lợng dữ liệu khổng lồ mà CD có khả năng l- u trữ. Trong phần báo cáo này của chúng em, phần đầu chúng em trình bày về cơ sở lý thuyết về