- Thông tin là những hiểu biết có thể có được về 1 thực thể nào đó
- Dữ liệu là thông tin đưa vào máy tính để xử lý
- Đơn vị cơ bản đo thông tin là bit (Binary Digital)
- Bit là đơn vị nhỏ nhất được lưu trữ trong máy tính để biểu diễn hai trạng thái 0 và 1 (0: không có điện; 1: có điện) ta còn thường gọi là mã nhị phân
Hình 1. Biểu diến thông tin bằng dãy tám bit
- Ngoài đơn vị bit, ta cũng thường dùng đơn vị đo lượng thông tin là Byte (đọc là bai)
- 1 byte = 8 bit
Một số đơn vị bội của Byte
Kí hiệu
Đọc
Độ lớn
Byte Bai
8 bit
KB
Ki-lô-bai
1024 byte
MB
Mê-ga-bai
1024 KB
GB
Gi-ga-bai
1024 MB
TB
Tê-ra-bai
1024 GB
PB
Pê-ta-bai
1024 TB
Bảng 1. Một số đơn vị bội của Byte
Thông tin có 2 loại: số và phi số
- Số: Số nguyên, số thực,…
- Phi số: Văn bản, hình ảnh, âm thành,…
- Dạng văn bản: Tờ báo, cuốn sách, tấm bia,…
- Dạng hình ảnh: Bức tranh vẽ, ảnh chụp, bản đồ, biển báo,…
- Dạng âm thanh: Tiếng nói con người, tiếng sóng biển, tiếng đàn, tiếng chim hót,…
- Để máy tính xử lí được, thông tin cần phải được biến đổi thành dãy bit (biểu diễn bằng các số 0, 1). Cách biến đổi như thế được gọi là mã hoá thông tin
- Ví dụ:
Hình 2. Mã hóa thông tin trong máy tính
- Để mã hoá thông tin dạng văn bản ta dùng bộ mã ASCII để mã hoá các ký tự. Mã ASCII các ký tự đánh số từ: 0 đến 255
- Bộ mã Unicode: có thể mã hóa 65536 =216 ký tự, có thể mã hóa tất cả các bảng chữ cái trên thế giới
a. Thông tin loại số
- Hệ đếm:
- Hệ thập phân: 0, 1, 2, 3, 4, 5, 6, 7, 8, 9
- Hệ nhị phân: 0, 1
- Hệ cơ số mười sáu (hexa): 0, 1, 2, 3, 4, 5, 6, 7, 8, 9, A, B, C, D, E, F
Biểu diễn số trong các hệ đếm:
- Hệ thập phân: Mọi số N có thể biểu diễn dưới dạng
(N = a_{n} 10^{n} + a_{n-1} 10^{n-1} + …+ a_{1} 10^{1} + a_{0} 10^{0} + a_{-1} 10^{-1} +…+ a_{-m} 10^{-m})
(0 leq a_{i} leq 9)
- Hệ nhị phân: Tương tự như trong hệ thập phân, mọi số N cũng có biểu diễn dạng
(N = a_{n} 2^{n} + a_{n-1} 2^{n-1} + …+ a_{1} 2^{1} + a_{0} 2^{0} + a_{-1} 2^{-1} +…+ a_{-m} 2^{-m} )
(a_{i} = 0, 1 )
- Hệ hexa: Biểu diễn số trong hệ hexa cũng tương tự
(N = a_{n} 16^{n} + a_{n-1} 16^{n-1} + …+ a_{1} 16^{1} + a_{0}16^{0} + a_{-1} 16 ^{-1} +…+ a_{-m} 16^{-m})
(0 leq a_{i} leq15)
Với quy ước: A = 10, B = 11, C = 12, D = 13, E = 14, F = 15
Chuyển đổi giữa các hệ đếm:
Đổi số trong hệ cơ số 10 sang hệ cơ số 2 và hệ cơ số 16
Hình 3. Ví dụ minh họa đổi số trong hệ cơ số 10 sang hệ cơ số 2 và hệ cơ số 16
Biểu diễn số trong máy tính:
- Biểu diễn số nguyên:
( 7_{(10)} = 111_{(2)})
Hình 4. Ví dụ minh họa biểu diễn số nguyên
- Trong đó:
- Phần nhỏ nhất của bộ nhớ lưu trữ số 0 hoặc 1: 1 bit
- Một byte có 8 bit, bit cao nhất thể hiện dấu (bit dấu)
- Có thể dùng 1 byte, 2 byte, 4 byte… để biểu diễn số nguyên
- Biểu diễn số thực:
- Biểu diễn số thực dưới dạng dấu phẩy động:
- Ví dụ: 13456,25 = 0.1345625 x 105
- Dạng tổng quát: ±M x 10±K
- Trong đó:
- M: Là phần định trị ((0,1leq M < 1))
- K: Là phần bậc ((K leq 0))
- Biểu diễn số thực trong một số máy tính:
-
Ví dụ: 0,007 = 0.7 x 10-2
-
- Biểu diễn số thực dưới dạng dấu phẩy động:
Hình 5. Ví dụ minh họa biểu diễn số thực
b. Thông tin loại phi số
Biểu diễn văn bản:
- Mã hoá thông tin dạng văn bản thông qua việc mã hóa từng kí tự và thường sử dụng:
- Bộ mã ASCII: Dùng 8 bit để mã hoá kí tự, mã hoá được 256 = 28 kí tự
- Bộ mã Unicode: Dùng 16 bit để mã hóa kí tự, mã hoá được 65536 = 216 kí tự
-
Trong bảng mã ASCII mỗi kí tự được biểu diễn bằng 1 byte
Các dạng khác: Hình ảnh, âm thanh cũng phải mã hoá thành các dãy bit
*Nguyên lí mã hóa nhị phân:
Thông tin có nhiều dạng khác nhau như số, văn bản, hình ảnh, âm thanh,… Khi đưa vào máy tính, chúng đều biến đổi thành dạng chung – dãy bit. Dãy bit đó là mã nhị phân của thông tin mà nó biểu diễn.