2. Khai bâo biến tập tin
I. Khâi niệm về tập tin1. Khâi niệm 1. Khâi niệm
Dữ liệu kiểu tập tin được sử dụng khi muốn lưu trữ dữ liệu trín đĩa từ hoặc câc thiết bị ngoải lđu dăi.
Kiểu tập tin lă tập hợp câc dữ liệu có cùng kiểu được nhóm lại với nhau, được lưu trữ ở bộ nhớ ngoăi mây tính vă được đặt một tín gọi lă tín tập tin. Tín tập tin năy sẽ được dùng.
2. Phđn loại
Có hai câch phđn loại tập tin. Phđn loại tập tin theo phương phâp truy cập tập tin hoặc phđn loại theo bản chất dữ liệu tập tin.
2.1. Phđn loại theo phưong phâp truy cập
Có hai câch truy cập tập tin: truy cập tuần tự vă truy cập trực tiếp.
Tập tin truy cập tuần tự lă những tập tin có đặc điểm: để truy cập một phần tử của tệp ta phải duyệt qua tất că câc phầ tử đứng trước phấn tử năy. Hình ảnh của tập tuần tự lă băng cassette ghi câc băi hât.
Tập tin truy nhập trực tiếp lă những tập tin cho phĩp truy nhập một phăn tử bất kỳ của tệp mă không phải duyệt qua câc phần tử khâc. Câc tập tin trín đĩa cứng đề lă những tập tin truy nhập trực tiếp. Tập tin truy nhập trực tiếp còn được gọi lă tập tin truy xuất ngẫu nhiín.
2.2. Phđn loại theo bản chất dữ liệu tập tin
Theo câch phđn loại năy thì tập tin được chia thănh tập tin văn bản (text file) vă tập tin nhị phđn (binary file).
Tập tin vên bản: có câc phần tử lă câc ký tự, mỗi phần tử lă một chữ câi,
chữ số hoặc một ký tự đặc biệt nhưng không được lă câc ký tự điều khiển.
Câc phần tử của tập tin văn bản được tổ chức thănh dòng với dấu kết thúc dòng lă CR vă LF (‘\r’ vă ‘\n’). Vì vậy tập tin văn bản có thể đọc được trín măn hình. Khi đọc được hai kỷ tự CR vă LH mây sẽ biến hai ký tự đó thănh một ký tự LF (có mê lă 10). Khi ghi thì một ký tự LF sẽ được chuyển thănh hai ký tự CR lien tiếp nhau. Tập tin văn bản dùng ký tự AZ(ctrl_Z), mă ASCII lă 26 lăm dấu hiệu kết thức tập tin. Khi đọc tập tin nếu gặp dấu hiệu kết thúc tập tin thì hăm eof() sẽ cho giâ trị khâc 0.
Tập tin nhị phđn: lă tập tin mă câc phần tử lă câc số nhị phđn biểu diễn
thong tin. Mỗi số nhị phđn chiếm một số byte cần thiết để biểu diễn một sổ nguyín, số thực, một cấu trúc, . . Tập tin nhị phđn có thể chứa dữ liệu lă câc ký tự điíu khiển (có mê từ 0 đín 31). Tập tin nhị phđn dùng mê kít thúc tập tin lă -1.
Khi sử dụng câc lệnh xử lý tập tin luôn phải xâc định rõ răng lă tập tin đang xử lý lă văn bản hay nhị phđn.
3. Bộ nhớ đệm (buffer)
Bộ nhớ đệm lă một phần của bộ nhờ RAM được mây tính dùng để lưu trữ thơng tin tạm thời trong q trình xử lý tập tin. Trong quâ trình xử lý tập tin ta thường phải đọc hoặc ghi từng phần của tập tin. Như vậy cần xử lý bao nhiíu phần tử của tập tin thì phải truy cập đến đó bấy nhiíu lần.Điều năy lăm giảm tốc độ thực hiện chương trình.
Để khắc phục nhược điểm trín mây tính sử dụng bộ nhớ đệm để ghi khối dữ liệu sau khi đọc từ tập tin. Từng phần tử của tập tin sẽ được lấy từ bộ nhớ đệm. Khi bộ nhớ đệm đê hết dữ liệu thì khối dữ liệu tiếp theo sẽ được đọc từ tệp văo bộ nhớ đệm. Quâ trình năy ngược lại khi ghi