Biểu diễn thông tin văn bản trong các hệ thống máy tính

Một phần của tài liệu Bài giảng Tin học Đại cương Chương 1 - PGS.TS. Lê Văn Năm (Trang 91 - 102)

- Mô tả cấu trúc đại số và số học của các số

1.4.4Biểu diễn thông tin văn bản trong các hệ thống máy tính

d Hệ đếm thập lục phân (hệ đếm cơ số 16) Khái niệm

1.4.4Biểu diễn thông tin văn bản trong các hệ thống máy tính

các hệ thống máy tính

Trong một máy tính số, đơn vị đo cơ sở nhất của thông tin là bit, viết tắt của từ binary digit. Mỗi bit tương

ứng với một trạng thái “đóng” hoặc “mở”, “cao” hoặc “thấp” trong một mạch máy tính.

Bit là khả năng ghi nhớ một mã nhị phân 0 hoặc 1.

Cụ thể, bộ nhớ của máy tính được chia thành các ô bộ nhớ. Mỗi ô bộ nhớ có một địa chỉ duy nhất (không bao giờ thay đổi) và có một dung lượng cố định.

Dung lượng của một ô nhớ khác nhau đối với các mô hình máy

tính khác nhau. Đối với ô bộ nhớ chỉ chứa được một kí tự dữ liệu thì gọi là một byte, với ô bộ nhớ có thể chứa hai hay nhiều hơn hai kí tự dữ liệu thì được gọi là một

Mỗi ô bộ nhớ gồm một bộ các mạch máy tính và mỗi mạch có

thể ở trạng thái “đóng” hoặc “mở” tương ứng với các chữ số 1 hoặc 0.

Để biểu diễn các chữ số của hệ thập phân (cũng như các chữ cái và các kí tự đặc biệt khác) phục vụ nhu cầu xử lý trên máy tính, nhiều bits hay nhiều mạch phải được kết hợp với nhau để biểu diễn từng kí tự.

Trong phần lớn các máy tính, cứ 8 bits hay 8 mạch biểu diễn một kí tự và một ô bộ nhớ chứa một kí tự

được gọi là một byte. Chính vậy nên, 8 bits tương đương 1 byte trong phần lớn các máy tính.

Các hệ thống mã hóa (Coding Schemes)

Tất cả các kí tự, bao gồm chữ cái,

chữ số và các kí hiệu đặc biệt, đều có thể được mã hóa theo một quy ước

xác định thành một dãy các chữ số của hệ nhị phân 0 và 1. Quy ước này phụ thuộc vào hệ thống mã hóa mà máy tính sử dụng và cách thức các giá trị được lưu trữ và truy cập.

Có hai hệ thống mã hay được sử dụng nhất : 1/ Hệ thống EBCDIC (Extended Binary Coded Decimal Interrchange Code) do IBM phát triển trong những năm 1950 và hiện vẫn đang được IBM và các nhà cung cấp khác sử dụng

2/ Hệ thống mã chuẩn chuyển đổi thông tin Hoa Kì - ASCII

(American Standard Code for Information Interchange)

Hệ thống mã ASCII quy định mối tương quan giữa kiểu bit số với kí tự trong ngôn ngữ viết, vì vậy cho phép các thiết bị số liên lạc với

nhau và xử lí, lưu trữ, trao đổi thông tin hướng kí tự.

Theo bảng mã ASCII, mỗi kí tự

được biểu diễn bằng 8 chữ số của hệ 2 và được viết gọn lại thành 2 chữ số của hệ 16. Ví dụ, kí tự A được mã hóa thành

65=01000001, viết gọn thành 41 ở hệ 16

Một phần của tài liệu Bài giảng Tin học Đại cương Chương 1 - PGS.TS. Lê Văn Năm (Trang 91 - 102)