You are on page 1of 16

Một số kiểu dữ liệu

dữ liệu văn bản



Group 1
Nội dung bài học :
Phân loại và biểu diễn thông tin trong
1 máy tính
• Biểu diễn thông tin trên máy tính là gì ?
• Các kiểu dữ liệu phổ biến
Biểu diễn dữ liệu văn bản
2 • Bảng mã ASCII
• Bảng mã Unicode và tiếng Việt trong Unicode
• Số hóa văn bản

3 Bài tập vận dụng


1. Phân loại và biểu diễn thông tin
trong máy tính
Câu hỏi khởi động :

• Hình 3.1 minh họa 1 thẻ CCCD. Trên đó có những


thông tin gì ?

 Các thông tin trên căn cước công dân gồm: ảnh, họ
và tên, giới tính, quốc tịch, quê quán, nơi cư trú, ngày
sinh,..

• Những thông tin này là loại dữ liệu gì?

 Dữ liệu số, dữ liệu văn bản và dữ liệu hình ảnh

3.1 . Hình ảnh thẻ CCCD


biểu diễn thông tin trên máy tính là gì ?
 Biểu diễn thông tin trên máy tính là một cách dùng để mã hóa
thông tin

Các loại dữ liệu phổ biến gồm có ?


Văn bản

Số
Dữ liệu
lôgic

Đa phương tiện
( âm thanh , hình ảnh )
2. biểu diễn dữ liệu văn
bản
1. Bảng chữ cái tiếng Anh

2. Bảng chữ cái tiếng Việt

• Hãy kể tên các kí tự tiếng Việt không có trong tiếng Anh ?

->Có 7 kí tự: ă, â, đ, ê, ô, ơ, ư
a ) Bảng mã ASCII

Bảng mã chuẩn của Mỹ ( American


Standard Code for Information
Interchange )

Ban đầu

Chỉ có 128 kí tự
( đủ dùng cho tiếng Anh )
Mở rộng

Thành 256 kí tự
(Các quốc gia có thể sử dụng cho các kí
tự riêng của nước mình)
CHÚ Ý :
• Muốn lấy mã nhị phân : ghép 4 bit ở chỉ số cột dọc
với 4 bit chỉ số cột ngang
Vd : Mã nhị phân của A là 01000001
• Lấy mã thập phân : là STT của kí tự trong bảng
Vd : Mã thập phân của A là 65
Bảng mã ASCII (sgk/165)
b ) Bảng mã Unicode và tiếng Việt trong Unicode

Là bảng mã cho phép mã hóa hàng


trăm nghìn kí tự khác nhau

giải quyết vấn đề thiếu vị trí cho


bộ kí tự của một số quốc gia

UTF-8
( 8 bit Unicode
Transformation Format)
3 byte: dùng để mã hóa
kí tự đặc biệt

1 byte: dùng để mã hóa các kí tự


La Tinh không dấu 2 byte: dùng đểmã hóa các nguyên Các bảng mã ASCII và Unicode quy định
âm có dấu ,các kí tự đ,Đ cách biểu diễn kí tự
c ) Số hóa văn bản

Tệp văn bản là gì?

Là tệp văn bản là định


dạng lưu trữ ở bộ nhớ
ngoài
3. Bài tập vận dụng
1 .Trong bảng mã Unicode,mỗi kí tự Tiếng Việt theo UTF-8 được biểu diễn
bởi bao nhiêu byte ?

A. 1 Byte

B. 2 Byte

C .4 Byte

D. Từ 1 đến 3 Byte
2 . Sử dụng phụ lục Bảng mã ASCII mở rộng trang 165, hãy xác
định mã nhị phân và mã thập phân ( là số thứ tự của kí tự trong
bảng ) của các kí tự S , G , K

 mã nhị phân của S : 01010011


mã thập phân của S : 83

 mã nhị phân của G : 01000111


mã thập phân của G : 71

 mã nhị phân của K : 01001011


mã thập phân của K : 75
3 . Câu trả lời nào đúng cho câu hỏi "Tại sao cần xây dựng bảng mã
Unicode?’’

A. Để đảm bảo bình đẳng cho mỗi quốc gia trong ứng dụng tin học

B. Bảng mã ASCII mã hóa mỗi kí tự bởi 1 byte. Giá thành thiết bị lưu trữ
ngày càng rẻ nên không cần phải sử dụng các bộ ký tự mã hóa bởi 1 byte

C. Dùng một bảng mã chung cho mọi quốc gia, giải quyết vấn đề thiếu vị trí
cho bộ ký tự của một số quốc gia đáp ứng nhu cầu dùng nhiều ngôn ngữ
đồng thời trong cùng một ứng dụng

D. Dùng cho các quốc gia sử dụng chữ tượng hình


Member
s of the
group
=))

You might also like