Ma trận (mảng hai chiều) được xem như là một véctơ của các véctơ. Một mảng 3 chiều
được xem như là một véctơ của các ma trận... Ngôn ngữ lập trình Chương IV: Kiểu dữ liệu có cấu trúc
37
Đặc tả thuộc tính
Mảng nhiều chiều tương tự như véctơ nhưng chỉ có một thuộc tính khác véctơ là mỗi một chiều phải có một tập chỉ số tương ứng.
Chẳng hạn khai báo cho một mảng hai chiều có thể đươc viết dưới dạng ARRAY[LB1..UB1, LB2..UB2] OF <Kiểu phần tử>
Trong đó tập chỉ số 1 có các giá trị từ LB1 đến UB1, tập chỉ số 2 có các giá trị từ LB2 đến UB2.
Như vậy số lượng các phần tử của mảng hai chiều sẽ là (UB1-LB1+1)*(UB2-LB2+1) Ví dụ sự khai báo của Pascal:
M= array [1..3, -1..2] of Integer;
Sự khai báo này cho ta thấy mảng M có hai chiều, chiều thứ nhất được xác định bởi tập chỉ số 1..3 và chiều thứ hai được xác định bởi tập chỉ số -1..2. Có thể xem đây là một ma trận có 3 dòng và 4 cột, như vậy sẽ có 12 phần tử, mỗi phần tử có thể lưu trữ một số integer.
Đối với các mảng có số chiều nhiều hơn hai thì cách làm cũng tương tự như mảng hai chiều.
Đặc tả phép toán
Phép lựa chọn một phần tử được thực hiện bằng cách chỉ ra tên mảng và chỉ số của mỗi một chiều.
Chẳng hạn để lựa chọn một phân tử của ma trận ta viết tên ma trận, theo sau là cặp chỉ số dòng, cột phân cách nhau bởi dấu phẩy và đặt trong cặp dấu [], ví dụ M[2,0].
Như vậy phép lựa chọn một phần tử của mảng nhiều chiều là phép lựa chọn trực tiếp. 4.6.2 Sự cài đặt
Sự biểu diễn bộ nhớ
với véctơ. Nghĩa là cũng sử dụng sự biểu diễn tuần tự và khố ô nhớ được chia làm hai phần: bộ mô tả và bộ nhớ cho các phần tử. Bộ mô tả của mảng giống bộ mô tả của véctơ ngoại trừ mỗi một chiều có một cận dưới và cận trên của tập chỉ số của chiều đó. Trong bộ nhớ dành cho các phần tử ta cũng lưu trữ liên tiếp các phần tử theo một trật tự nào đó.
Với ma trận, về mặt logic thì ma trận là một bảng gồm m dòng và n côt, mỗi một ô là một phần tử, nhưng bộ nhớ lại chỉ gồm các ô liên tiếp nhau, vì thế ta phải lưu trữ ma trận theo trật tự dòng hoặc theo trật tự cột.
Lưu trữ theo trật tự dòng có nghĩa là trong bộ nhớ dành cho các phần tử ta lưu trữ tuần tự các phần tử trong dòng thứ nhất, tiếp đến là các phần tử trong dòng thứ hai... cho đên dòng cuối cùng. Ngôn ngữ lập trình Chương IV: Kiểu dữ liệu có cấu trúc
38
Lưu trữ theo trật tự cột nghĩa là trong bộ nhớ dành cho các phần tử ta lưu trữ tuần tự các phần tử trong cột thứ nhất, tiếp đến là các phần tử trong cột thứ hai... cho đến cột cuối cùng.
Chẳng hạn với khai báo M: ARRAY [1..3,-1..2] OF Integer; ta có hình ảnh biểu diễn trong bộ nhớ như các hình sau:
Cấu trúc logic của ma trận M Lưu trữ ma trận M theo trật tự dòng M[1,-1] M[1,0] M[1,1] M[1,2] Ma trận M Kiểu dữ liệu
M[2,-1] M[2,0] M[2,1] M[2,2] LB1 (= 1) Cận dưới của tập chỉ số thứ nhất
M[3,-1] M[3,0] M[3,1] M[3,2] Bộ mô tả UB1 (= 3) Cận trên của tập chỉ số thứ nhất LB2 (= -1) Cận dưới của tập chỉ số thứ hai
UB2 (= 2) Cận trên của tập chỉ số thứ hai M[1,-1]
M[1,0] Dòng thứ nhất Bộ nhớ cho M[1,1] Các phần tử M[1,2] M[2,-1] Dòng thứ hai M[2,0] ... ... M[3,2]
Cấu trúc logic của ma trận M Lưu trữ ma trận M theo trật tự cột M[1,-1] M[1,0] M[1,1] M[1,2] Ma trận M Kiểu dữ liệu
M[2,-1] M[2,0] M[2,1] M[2,2] LB1 (= 1) Cận dưới của tập chỉ số thứ nhất
M[3,-1] M[3,0] M[3,1] M[3,2] Bộ mô tả UB1 (= 3) Cận trên của tập chỉ số thứ nhất LB2 (= -1) Cận dưới của tập chỉ số thứ hai
UB2 (= 2) Cận trên của tập chỉ số thứ hai M[1,-1] M[2,-1] Cột thứ nhất Bộ nhớ cho M[3,-1] Các phần tử M[1,0] M[2,0] Cột thứ hai M[3,0] ... ...
M[3,2]
Ngôn ngữ lập trình Chương IV: Kiểu dữ liệu có cấu trúc
39
Giải thuật thực hiện phép toán
Ðể thực hiện phép toán lựa chọn phần tử, ta sử dụng công thức tính vị trí của phần tử trong bộ nhớ.
Với cách lưu trữ theo trật tự dòng của ma trận M, để tính vị trí của M[i,j], đầu tiên ta xác định số dòng cần nhảy qua: (i-LB1) nhân với độ dài của mỗi dòng để xác định vị trí bắt đầu của dòng thứ i và sau đó tìm vị trí thứ J trong dòng này như đối với 1 véctơ. Như vậy, vị trí của phần tử M[i,j] được tính bởi:
Vị trí của M [i,j] = ∝ + D + (i-LB1) x S + (j-LB2) x E Trong đó: ∝ là địa chỉ cơ sở.
D là độ lớn của bộ mô tả.
S là độ lớn của mỗi dòng = (UB2 - LB2 +1) x E. LB1 là cận dưới của chỉ số thứ nhất.
LB2,UB2 tương ứng là cận dưới và cận trên của chỉ số thứ hai.
Tương tự ta có thể thành lập công thức tính vị trí của phần tử M[i,j] trong trường hợp ma trận M được tổ chức lưu trữ theo trật tự cột.
Tổng quát hóa công thức này cho mảng nhiều chiều hơn là một điều đơn giản. 4.7 MẨU TIN
4.7.1 Định nghĩa mẩu tin
Mẩu tin là một CTDL bao gồm một số cố định các phần tử có kiểu khác nhau. Như vậy, mẩu tin là một CTDL có kích thước cố định và không đồng nhất. Các phần tử của mẩu tin được gọi là các trường.
4.7.2 Sự đặc tả và cú pháp Đặc tả thuộc tính
Các thuộc tính của một mẩu tin phải được chỉ rõ trong phép khai báo, chúng bao gồm: 1. Số lượng các phần tử.
2. Kiểu dữ liệu của các phần tử (Các phần tử có thể có kiểu khác nhau). 3. Mỗi phần tử được cho bởi tên phần tử (tên trường).
Cú pháp khai báo mẩu tin của Pascal: Nhan_vien: RECORD
Ma: Integer; {Mã nhân viên} Ho_ten: String[25];
Tuoi: Integer; {Tuổi} Luong: Real; {Hệ số lương} END
Việc khai báo này đặc tả một mẩu tin có 4 phần tử của các kiểu Integer, Real và String. Mỗi phần tử có một tên: Ma, Ho_ten, Tuoi và Luong. Ðể chọn một phần tử của mẩu tin ta sử dụng tên của phần tử (trường) đó, chẳng hạn trong Pascal, Nhan_vien.Luong
là để truy xuất tới phần tử Luong của mẩu tin Nhan_vien. Ngôn ngữ lập trình Chương IV: Kiểu dữ liệu có cấu trúc 40 22901 ← Ma Nguyen Van A ← Ho_ten
20 ← Tuoi 2.18 ← Luong Đặc tả phép toán
Lựa chọn một phần tử là phép toán cơ bản cuả mẩu tin. Phép toán này được thực hiện bằng cách chỉ ra tên trực kiện của phần tử.
Ví dụ để lựa chọn phần tử thứ 4 của mẩu tin Nhan_vien ta viết: Nhan_vien.Luong. Phép toán lựa chọn một phần tử của mẩu tin là sự lựa chọn trực tiếp.
Mặc dù đều là lựa chọn trực tiếp, nhưng có khác biệt so với cách lựa chọn phần tử của véctơ. Điểm khác biệt ở đây là: đối với véctơ, ta có thể sử dụng giá trị của một biểu thức làm chỉ số, chẳng hạn VECTO[i+1], còn đối với mẩu tin thì bắt buộc phải chỉ rõ tên trực kiện, chứ không thể là biểu thức.
Ngoài phép toán lựa chọn phần tử, phép gán các mẩu tin có cùng cấu trúc là một phép toán phổ biến được các ngôn ngữ đưa vào. Chẳng hạn Nhan_vien := InputRec trong đó InputRec có các thuộc tính giống hệt Nhan_vien.
4.7.3 Sự cài đặt Biểu diễn bộ nhớ
Biểu diễn bộ nhớ tuần tự được sử dụng để lưu trữ một mẩu tin. Một khối liên tục các ô nhớ được dùng để lưu trữ cho một mẩu tin, trong khối đó, mỗi ô biểu diễn cho một trường. Có thể cũng cần sử dụng bộ mô tả riêng cho từng trường để lưu trữ thuộc tính của các trường đó. Do các trường có kiểu khác nhau nên ô nhớ dành cho chúng cũng có kích thước khác nhau.
Giải thuật thực hiên phép toán
Việc lựa chọn phần tử được thực hiện một cách dễ dàng vì tên trường được biết đến thông qua việc dịch chứ không phải được tính toán thông qua việc thực hiện như đối với véctơ. Việc khai báo mẩu tin còn cho phép xác định kích thước và vị trí của nó
trong ô nhớ thông qua việc dịch. Kết quả là độ dời của phần tử bất kỳ có thể được tính thông qua việc dịch.
Chẳng hạn với mẩu tin Nhan_vien, các phần tử của nó được lưu trữ trong bộ nhớ như sau:
Vị trí của một phần tử bất kỳ được tính một cách dễ dàng. Chẳng hạn
Vị trí của Tuoi = α + Kích thước của Ma + Kích thước của Ho_ten.
Trong đó α là địa chỉ cơ sở của khối ô nhớ biểu diễn cho Nhan_vien.
Phép toán gán toàn bộ một mẩu tin cho một mẩu tin khác có cùng cấu trúc được thực hiện một cách đơn giản là copy nội dung khối ô nhớ biểu diễn cho mẩu tin thứ nhất sang khối ô nhớ biểu diễn cho mẩu tin thứ 2. Ngôn ngữ lập trình Chương IV: Kiểu dữ liệu có cấu trúc
41
4.8 MẨU TIN CÓ CẤU TRÚC THAY ÐỔI 4.8.1 Ðặc tả và khai báo 4.8.1 Ðặc tả và khai báo
Trước hết ta xét ví dụ sau:
Giả sử trong một xí nghiệp có hai loại công nhân là công nhân trong biên chế và công nhân hợp đồng. Ðối với công nhân trong biên chế thì lương sẽ được tính bằng số ngày công * mức lương tối thiểu * hệ số /20, những ngày nghỉ bảo hiểm xã hội, họ được trả lương bảo hiểm xã hội. Ngược lại công nhân hợp đồng chỉ được trả lương bằng số ngày công * đơn giá công nhật và họ không được trả lương bảo hiểm xã hội.
Ta thấy, hai loại công nhân này có những thông tin chung là họ tên, số ngày công, tiền lương và loại công nhân (biên chế hay hợp đồng). Mỗi loại công nhân lại có các thông tin riêng. Đối với công nhân trong biên chế, ta cần thêm các thông tin: hệ số lương và số ngày nghỉ bảo hiểm xã hội. Đối với công nhân hợp đồng, ta cần thêm thông tin về đơn giá công nhật.
Nếu sử dụng mẩu tin bình thường để lưu trữ thông tin về hai loại công nhân này, ta cần tất cả 7 trường để lưu trữ 4 thông tin chung và 3 thông tin riêng. Khối ô nhớ cần cấp phát phải đủ để lưu trữ cả 7 trường nhưng việc sử dụng khối ô nhớ lại bị dư, do đối với công nhân biên chế ta chỉ cần 6 trường, đối với công nhân hợp đồng ta chỉ cần 5 trường!
Đặc tả thuộc tính
Ðể giải quyết vấn đề lãng phí bộ nhớ, trong một số ngôn ngữ lập trình có một loại CTDL gọi là mẩu tin có cấu trúc thay đổi.
Mỗi một cấu trúc sẽ có một số trường giống nhau cho mọi loại mẩu tin và một số trường khác nhau cho từng loại mẩu tin. Các trường giống nhau gọi là phần chung hay phần tĩnh, các trường khác nhau này gọi là phần động hay phần thay đổi của mẩu tin. Chẳng hạn đối với bài toán nêu trên thì mỗi công nhân được lưu trong một mẩu tin, có các trường thuộc phần chung đó là Ho_Ten, Ngay_Cong, Tien_Luong. Ngoài ra tùy thuộc vào loại công nhân là biên chế hay hợp đồng mà có các trường riêng. Ðối với công nhân trong biên chế ta cần thêm các trường He_So và Nghi_Bhxh để lưu trữ hệ số lương và số ngày nghỉ bảo hiểm xã hội. Ðối với công nhân hợp đồng ta chỉ cần thêm một trường là Gia_Cong_Nhat để lưu trữ giá công nhật cho mỗi người. Khai báo trong Pascal như sau:
TYPE
VAR
Cong_Nhan : RECORD ho_ten: String[20]; ngay_cong: Real; luong: Real;
CASE loai: loai_cong_nhan OF bien_che:
(he_so: Real; nghi_bhxh:Real);
hop_dong: Ngôn ngữ lập trình Chương IV: Kiểu dữ liệu có cấu trúc
42
(gia_cong_nhat: Real); END;
Khai báo trên định nghĩa một mẩu tin có cấu trúc thay đổi. Mẩu tin luôn luôn có các trường Ho_Ten, Ngay_Cong, Luong và Loai. Khi giá trị của Loai = "bien_che" thì mẩu tin còn có các trường He_So và Nghi_Bhxh, trong khi đó nếu giá trị của Loai = "hop_dong" thì nó lại có trường Gia_Cong_Nhat.
Đặc tả phép toán
Phép toán lựa chọn các phần tử của mẩu tin có cấu trúc thay đổi cũng giống như mẩu tin bình thường. Chẳng hạn ta có thể sử dụng Cong_Nhan.Luong, Cong_Nhan.He_So hay Cong_Nhan.Gia_Cong_Nhat. Tuy nhiên các trường thuộc phần động chỉ tồn tại trong một thời điểm nhất định do đó khi chúng ta truy xuất tới một tên trường mà nó không tồn tại thì sẽ bị lỗi. Trường Loai trong ví dụ trên là rất quan trọng vì nó chỉ ra phần động nào của mẩu tin được sử dụng trong quá trình thực hiện chương trình.
Người đọc có thể tham khảo ví dụ tương đối hoàn chỉnh viết bằng Pascal. uses crt;
Const luong_toi_thieu = 290000; Type
Loai_cong_nhan = (bien_che, hop_dong); Cong_nhan = Record
ho_ten : String[20]; Ngay_cong : real; luong : real;
Case loai: Loai_cong_nhan of
bien_che: (He_so, so_ngay_nghi_BHXH : real); hop_dong: (don_gia: real);
end;
danh_sach_cong_nhan = Array[1..10] of cong_nhan; Var
n : integer; ho_so : danh_sach_cong_nhan;
{Nhập danh sách công nhân, và các thông tin liên quan đến lao động} Procedure Nhap (var ho_so: danh_sach_cong_nhan; var n: integer); Var
i: integer; loaicn : char; Begin
write('So cong nhan: '); readln(n); For i:=1 to n do with ho_so[i] do begin
Writeln('Cong nhan ',i);
Write('Ho va Ten: '); readln(ho_ten);
Write('Loai cong nhan: A la bien che, B la hop dong '); Ngôn ngữ lập trình Chương IV: Kiểu dữ liệu có cấu trúc
43
readln(loaicn);
If Upcase(loaicn) ='A' then loai := bien_che else loai := hop_dong; write('So ngay cong: '); readln(ngay_cong);
if loai = bien_che then begin write('He so: '); readln(he_so);
write('So ngay nghi bao hiem: '); readln(so_ngay_nghi_BHXH); end else begin
write('Don gia hop dong: '); readln(don_gia); end;
end; { with Ho_so[i] } end; {nhap}
{Tính lương cho từng công nhân, theo công thức của từng loại công nhân} Procedure Tinh_luong (var ho_so: danh_sach_cong_nhan; n: integer); Var
i : integer; luong_binh_quan: real; begin
for i:=1 to n do with ho_so[i] do begin
if loai = bien_che then begin {tính lương của công nhân biên chế} luong_binh_quan := he_so * luong_toi_thieu/20;
so_ngay_nghi_BHXH * luong_binh_quan*0.80; end else {tính lương của công nhân hợp đồng} luong := ngay_cong * don_gia;
end; { with Ho_so[i] } end; {Tinh_luong }
Procedure In_luong (ho_so: danh_sach_cong_nhan; n: integer); Var
i : integer; begin
for i:=1 to n do with ho_so[i] do begin Write(ho_ten:25);
If loai = bien_che then write('Bien che':10) else write('Hop dong':10);
write(ngay_cong:5:1); if loai = bien_che then begin write(he_so:5:1);
write(so_ngay_nghi_BHXH:5:1); end else
write(don_gia:10:2);
writeln(luong:10:2); Ngôn ngữ lập trình Chương IV: Kiểu dữ liệu có cấu trúc
44
end; { with Ho_so[i] } end; { In_luong }
begin {Chuong trinh chinh} nhap(ho_so,n); tinh_luong(ho_so,n); in_luong(ho_so,n); readln; end.
4.8.2 Cài đặt mẩu tin có cấu trúc thay đổi Biểu diễn bộ nhớ
Biểu diễn tuần tự sẽ được sử dụng để biểu diễn cho một mẩu tin có cấu trúc thay đổi. Thông qua việc dịch, tổng bộ nhớ cần để lưu các phần tử của mỗi một phần động được xác định và bộ nhớ được cấp phát đủ để lưu trữ mẩu tin với phần động lớn nhất. Chẳng hạn với mẩu tin cong_nhan ta có mô hình lưu trữ như trong hình vẽ sau:
Ho_ten → ← Ho_ten Ngay_cong → ← Ngay_cong Luong → ← Luong
Loai → ← Loai He_so →
← Gia_cong_nhat Nghi_bhxh →
← Không sử dụng
Công nhân biên chế Công nhân hợp đồng
Vì khối ô nhớ đủ lớn để lưu trữ phần động lớn nhất nên có đủ chỗ cho bất kỳ một phần động nào nhưng đối với những phần động nhỏ hơn sẽ không sử dụng tới một số ô nhớ đã được cấp phát.
Với mẩu tin có cấu trúc thay đổi, rõ ràng ta đã tiết kiệm được một số ô nhớ so với mẩu tin bình thường.
Giải thuật thực hiện phép toán
Lựa chọn một phần tử của phần động cũng giống như lựa chọn một phần tử bình thường, qua việc dịch thì độ dời của phần tử được lựa chọn sẽ được tính toán và qua việc thực hiện thì độ dời được cọng vào địa chỉ cơ sở của khối để xác định vị trí của phần tử. Ngôn ngữ lập trình Chương IV: Kiểu dữ liệu có cấu trúc
45
4.9 CHUỖI KÝ TỰ:
Chuỗi ký tự là cấu trúc dữ liệu bao gồm một dãy các ký tự.
Như vậy, kiểu chuỗi ký tự là một kiểu đồng nhất, còn về kích thước thì có thể cố định hoặc thay đổi tùy theo ngôn ngữ. Kiểu dữ liệu chuỗi ký tự là một kiểu quan trọng mà
hầu hết các ngôn ngữ đều có. 4.9.1 Ðặc tả và cú pháp: