You are on page 1of 4

§2.

THÔNG TIN VÀ DỮ LIỆU


1. Thông tin và dữ liệu.:
Những hiểu biết có thể có được về một thực thể nào đó được gọi là thông tin về thực thể đó.
VD: bảng điểm của học sinh, quyển sách, bản đồ, tiếng sóng, tiếng đàn…..
Trong tin học, dữ liệu là thông tin đã được đưa vào máy tính.
2. Đơn vị đo thông tin:
- Đơn vị đo lượng thông tin cơ bản là „bit‟.
- “ Bit”: là phần nhỏ nhất của bộ nhớ máy tính lưu trữ một trong hai kí hiệu 0, 1.
- Ngoài đơn vị “ bit”, đơn vị đo lượng thông tin thường dùng là “Byte” (đọc là bai)
Bảng đơn vị đo lượng thông tin
Kí hiệu Đọc Độ lớn
Byte Bai 8 bit
KB Ki-lô-bai 1024 byte
MB Mê-ga-bai 1024 KB
GB Gi-ga-bai 1024 MB
TB Tê-ra-bai 1024GB
PB Pê-ta-bai 1024TB
3. Các dạng thông tin: có 2 dạng
* Dạng số: số tự nhiên, số nguyên, số thực,….
VD: bảng lương, bảng điểm,….
* Dạng phi số: văn bản, hình ảnh, âm thanh,…..
- Dạng văn bản: tờ báo, cuốn sách, tấm bia,….
- Dạng hình ảnh: Ảnh chụp, bức tranh, biển báo, bản đồ,….
- Dạng âm thanh: Tiếng nói con người, tiếng sóng, tiếng còi, tiếng chim hót,….
4. Mã hóa thông tin trong máy tính
- Khái niệm: Thông tin muốn máy tính xử lý được cần phải được biến đổi thành dãy bit
(biểu diễn bằng các số 0,1). Cách biến đổi như thế gọi là mã hoá thông tin.
Vd:
 01011101 
Thông tin gốc Thông tin mã hoá
Ví dụ, xét việc mã hóa thông tin dạng văn bản, người ta dùng bộ mã ASCII

Ký tù M· thËp ph©n M· nhÞ ph©n


A 65 01000001
B 66 01000010
C 67 01000011
.... ... ...
a 97 01100001
b 98 01100010
c 99 01100011
... ... ...
z 122 01111010
* Bộ mã ASCII dùng 8 bít để mã hóa nên chỉ mã hóa được 256 (=28) ký tự không mã hóa hết
các chữ cái của các ngôn ngữ trên thế giới.
* Bộ mã Unicode dùng 16 bít để mã hóa nên mã hóa được 216 ký tự (tức 65536 ký tự), cho phép
thể hiện trong máy tính văn bản của tất cả các ngôn ngữ trên thế giới.
5. Biểu diễn thông tin trong máy tính
a. Thông tin loại số:
* Hệ đếm:- Hệ thập phân: 0, 1, 2, 3, 4, 5, 6, 7, 8, 9.
- Hệ nhị phân: 0, 1
- Hệ cơ số 16 (hexa): 0, 1, 2, 3, 4, 5, 6, 7, 8, 9, A, B, C, D, E, F.
* Biểu diến số trong hệ đếm
- Hệ thập phân: Mọi số thập phân N có thể biểu diễn dưới dạng
N = an 10n + an-1 10n-1 + …+ a1 101 + a0 100 + a-1 10-1 +…+ a-m 10-m, 0  ai  9
Ví dụ: 1 2 5 = 1 x 102 + 2 x 101 + 5 x 100

- Hệ nhị phân: Mọi số nhị phân N có thể biểu diễn dưới dạng
N = an 2n + an-1 2n-1 + …+ a1 21 + a0 20 + a-1 2-1 +…+ a-m 2-m, 0  ai  1
Ví dụ: 11012 = 1  23 + 1  22 + 0  21 + 1  20 = 1310
- Hệ cơ số 16 (hexa): Mọi số N trong hệ hexa có thể biểu diễn dưới dạng
N = an 16n + an-1 16n-1 + …+ a1 161 + a0 160 + a-1 16-1 +…+ a-m 16-m, 0  ai  15
Quy ước: A = 10, B = 11, C = 12,
D = 13, E = 14, F = 15.
Ví dụ: 1BE16 = 1  16 + 11  16 + 14  16 = 44610
2 1 0

* Chuyển đổi giữa các hệ đếm


- Đổi số trong hệ cơ số 10 sang hệ cơ số 2, cơ số 16
7 2 45 16

6 3 2 32 2 16

1 2 1 2 13 0 0
1 0 0 2
1

 7(10) = 111( 2)  45(10) = 2D(16)


* Biểu diễn số trong máy tính
0 là dấu dương
Bit
1 là dấu âm
7(10) = 1 1 1(2)

0 0 0 0 0 1 1 1

1 byte

Trong đó:
- Phần nhỏ nhất của bộ nhớ lưu trữ số 0 hoặc số 1 là 1 bit
- Một byte có 8 bit, bit cao nhất thể hiện dấu (bít dấu)
- Có thể dùng 2 byte, 2 byte, 4 byte,…. Để biểu diễn số nguyên.
* Biểu diễn số nguyên
- Có thể dùng 1 byte, 2 byte, 4 byte… để biểu diễn số nguyên.
- Với số nguyên có dấu: dùng bít cao nhất để biểu diễn dấu, quy ước 1 là dấu âm, 0 là dấu
dương, các bít còn lại biểu diễn giá trị tuyệt đối của số viết dưới dạng nhị phân. Theo cách đó, 1
byte biểu diễn được số nguyên từ -127 đến 127
VD: Số -22 được biểu diễn là:

1 0 0 1 0 1 1 0

1 byte
- Với số nguyên không âm: toàn bộ 8 bít được dùng để biểu diễn giá trị số, 1 byte biểu diễn
được số nguyên không âm trong phạm vi từ 0 đến 255.
* Biểu diễn số thực:
- Biểu diễn số thực dưới dạng dấu phẩy động: Mọi số thực đều có thể biểu diễn dưới dạng
. Trong đó: - M: là phần định trị
- K: là phần bậc .
5
Ví dụ: 13456.25 = 0.1345625 x 10
0.0000345 = 0.345 x 10-4
Máy tính sẽ lưu thông tin gồm dấu của số, phần định trị, dấu của phần bậc và phần bậc.
- Biểu diễn số thực trong máy tính:
Ví dụ: Số 0.007 = 0.7 x 10-2
DÊu phÇn 4 byte
®Þnh trÞ

0 1 0 0 0 0 1 0 0 . . 0 0 0 0 0 1 1 1

DÊu C¸c bit dïng cho gi¸ trÞ


phÇn bËc Đoạn Bit biÓu
diÔn gi¸ trÞ phÇn phÇn ®Þnh trÞ.
bËcphi số:
b. Thông tin loại
* Văn bản: Máy tính có thể dùng 1 dãy bít để biểu diễn một kí tự, chẳng hạng mã
ASCII của kí tự đó.
Để biểu diễn một dãy kí tự, máy tính có thể dùng một dãy byte, mỗi byte biểu diễn một
kí tự theo thứ tự từ trái sang phải.
Ví dụ:
Dãy số 01010100 01001001 01001110 là biểu diễn cho chữ “Tin”
* Các dạng khác: Hình ảnh, âm thanh cũng phải mã hóa thành dãy bit
Nguyên lí mã hóa nhị phân:
Th«ng tin cã nhiÒu d¹ng kh¸c nhau như sè, v¨n b¶n, h×nh ¶nh, ©m thanh, … Khi
®ưa vµo m¸y tÝnh, chóng ®Òu biÕn ®æi thµnh d¹ng chung – d·y bit. D·y bit ®ã lµ m· nhÞ
ph©n cña th«ng tin mµ nã biÓu diÔn.

You might also like