You are on page 1of 4

Lý thuyết Đa Phương Tiện

Câu 1

- MPEG-1 được hình thành vào năm 1988, là tiêu chuẩn của nhóm chuyên gia về hình ảnh MPEG ở
trong giai đoạn đầu tiên (tương ứng với tiêu chuẩn ISO/IEC 11172 của ITU). Mục đích của MPEG-1 là
nghiên cứu một tiêu chuẩn mã hoá video và âm thanh kèm theo trong các môi trường lưu trữ như:
CD-ROM, đĩa quang... Tốc độ mã hoá trong khoảng 1.5 Mb/s. Chuẩn nén MPEG-1 bao gồm 4 phần:

 Các hệ thống: ISO/IEC 11172-1


 Video: ISO/IEC 11172-2
 Audio: ISO/IEC 11172-3
 Hệ thống kiểm tra: ISO/IEC 11172-4 –

- Chuẩn nén MPEG-2 là chuẩn nên phát triển tiếp sau MPEG-1, có kế thừa tất cả các tiêu chuẩn của
MPEG-1 và mục đích là nhằm hỗ trợ việc truyền video số, tốc độ bit lớn hơn 4 Mb/s, bao gồm các
ứng dụng DSM (phương tiện lưu trữ số). Các hệ thống truyền hình hiện tại (NTSC, PAL, SECAM), cáp,
thu lượm tin tức điện tử, truyền hình trực tiếp từ vệ tinh. truyền hình mở rộng (EDTV), truyền hình
độ phân giải cao (HDTV)

Chuẩn MPEG-2 bao gồm 4 phần chính:

 Các hệ thống: ISO/IEC 13818 -1.


 Video: ISO/IEC 13818-2
 Audio: ISO/IEC 13818-3
 Các hệ thống kiểm tra: ISO/IEC 13818 -4.

-Tiêu chuẩn tiếp theo mà MPEG đưa ra là MPEG-4. MPEG-4 xuất hiện vào tháng 10 năm 1998, đã tạo
ra một phương thức thiết lập và tương tác mới với truyền thông nghe nhìn trên mạng Internet, tạo
ra một phương thức sản xuất, cung cấp và tiêu thụ mới các nội dung video trên cơ sơ nội dung và
hướng đối tượng.

Câu 2

- Tiêu chuẩn 4:4:4: Gồm 12 khối: 4 khối Y ( giá trị mức chói), 4 khối Cb ( Hiệu số giữa giá trị mức chói
và mức màu lam) và 4 khối Cr ( Hiệu số giữa giá trị mức chói và mức màu đỏ):

Tín hiệu chói và màu được lấy mẫu tại tất cả các điểm lấy mẫu trên dòng tích cực của tín hiệu video.
Cấu trúc lấy mẫu trực giao:

Tiêu chuẩn lấy mẫu 4:4:4 cho chất lượng hình ảnh tốt nhất, thuận tiện cho việc xử lý tín hiệu video
số. Tuy nhiên, với phương pháp lấy mẫu này, tốc độ dòng dữ liệu video số sẽ tương đối cao, ví dụ khi
số hóa tín hiệu video có độ phân giải 720x576 (hệ PAL), 8 bít lượng tử /điểm ảnh, 25 ảnh/s luồng dữ
liệu số nhận được sẽ có tốc độ: 3x720x576x8x25-249Mbits/s.

Tín hiệu chói được lấy mẫu tại tất cả các điểm lấy mẫu trên dòng tích cực của tín hiệu video. Tín hiệu
màu trên mỗi dòng được lấy mẫu với tần số bằng nửa tần số lấy mẫu tín hiệu chói

- Tiêu chuẩn 4:2:0: Gồm 6 khối: 4 khối Y, một khối Cb, một khối Cr

Tín hiệu chói được lấy mẫu tại tất cả các điểm lấy mẫu trên dòng tích cực của tín liệu video. Cách
một điểm lấy mẫu một tín hiệu màu. Tại dòng chẵn chỉ lấy mẫu tín liệu màu CR, tại dòng chẵn lấy
mẫu tín hiệu CB. Như vậy, nếu tần số lấy mẫu tín liệu chói là fD, Thì tần số lấy mẫu tín hiệu màu sẽ là
fD/2.
Câu 3

 Ảnh I (Intra Pictures): được mã hóa mà không có sự so sánh tham khảo các ảnh khác, dùng trong
nén trong ảnh. Chúng chứa tất cả các thông tin cần thiết để tái tạo lại ảnh sau giải mã, nên tỷ lệ
nén các ảnh I tương đối thấp. Vì vậy, ảnh I là điểm nút quan trọng phục vụ việc truy cập vào một
đoạn Video.
 Ảnh P (Predicted Pictures): được mã hoá từ ảnh I, ảnh P trước đó, nhờ sử dụng các thuật toán
dự đoán bù chuyển động. Các ảnh P có thể được sử dụng như là cơ sở dữ liệu cho việc dự đoán
ảnh tiếp theo. Tuy nhiên do hạn chế của kỹ thuật bù chuyển động, số ảnh P giữa hai ảnh I không
thể quá lớn. Tỷ lệ nén của các ảnh P tương đối lớn so với tỷ lệ nén các ảnh I.
 Ảnh B (Bidirectionally Predicted Pictures): được mã hoá bởi phép nội suy giữa các ảnh I và P ở
trước và sau đó. Vì không được sử dụng để mã hoá các ảnh tiếp theo, ảnh B không phải là nguồn
gốc sinh ra các lỗi ảnh trong quá trình mã hoá. Các ảnh B cho tỷ lệ nén cao nhất.

Câu 4

Dư thừa không gian là những dư thừa tồn tại trong từng bức ảnh, đó có thể là những vùng diện tích
lớn mà các giá tị các điểm ảnh sấp sỉ nhau hoặc những thành phần quá chi tiết trong bức ảnh là dư
thừa. -> Loại bỏ dư thừa không gian bằng các biến đổi DCT

Dư thừa thời gian là trong tín hiệu video có nhiều chi tiết được lặp lại ở các ảnh liên tiếp nhau. Trong
MPEG loại bỏ dư thừa thời gian bằng cách trước khi mã hóa một thông tin trong ảnh sẽ thực hiện
tìm kiếm thông tin đó ở ảnh trước. Dữ liệu được mã hóa sẽ bao gồm ảnh sai số và vecto chuyển
động

Câu 5

Giải thích hình vẽ

- Target frame là ảnh mã hóa, Reference frame là ảnh tham chiếu

-Ta chia ảnh thành các Macro block 16x16 pixel. Từ ảnh tham chiếu tìm kiếm thông tin cần tìm và xác
định 2 tham số : ảnh sai số và vecto chuyển động

-Ta thực hiện trừ Macro Block hiện tại cho khối tham chiếu giống nhất ( ảnh sai số ). Thực chất việc
này chính là trừ các khối Y cho nhau và Cb, Cr cho nhau ( khối 8x8 ) dùng 4:2:0.

-Sau khi thực hiện phép tính ta biến đổi DCT bình thường, lượng tử hóa cùng với vecto chuyển động
và bộ giải mã.

Câu 6

Khái niệm nhóm ảnh GOP: nhóm ảnh GOP (Group of Pictures) là một phương pháp nén video được
sử dụng trong chuẩn MPEG. Nó sử dụng ba loại ảnh I, B và P để giảm lượng thông tin dư thừa và cho
phép nén dữ liệu video hiệu quả hơn.

Ví dụ, trong hình minh họa, không có sự thay đổi trực quan về cây cối, do đó thông tin trên đó sẽ là
dư thừa trong các khung hình tiếp theo. Do đó, P/B frame chỉ ghi lại những điểm khác biệt—nói cách
khác là người đang chạy.

Do đó, một Nhóm Hình Ảnh (GOP) bao gồm một khung I frame, theo sau là một số khung P frame và
B frame khác nhau.
Câu 7

Tại sao lại đưa ra tiêu chuẩn lấy mẫu

Tiêu chuẩn lấy mẫu trong mã hóa MPEG là một khái niệm liên quan đến cách thức chuyển đổi tín
hiệu âm thanh và video từ dạng liên tục sang dạng rời rạc. Quá trình này giúp giảm số lượng dữ liệu
cần thiết để biểu diễn tín hiệu, đồng thời giữ được chất lượng mong muốn. Tiêu chuẩn lấy mẫu
trong mã hóa MPEG bao gồm các bước sau:

 Lấy mẫu không gian: Chia hình ảnh thành các khối nhỏ gọi là macroblock, mỗi macroblock có
kích thước 16x16 pixel. Mỗi macroblock được biểu diễn bằng ba thành phần màu: Y (độ sáng),
Cb (màu xanh - độ sáng) và Cr (màu đỏ - độ sáng).
 Lấy mẫu thời gian: Chia video thành các khung hình, mỗi khung hình có thể là I frame (khung
hình chính), P frame (khung hình dự đoán) hoặc B frame (khung hình dự đoán hai hướng). Các
khung hình này được sắp xếp theo một trình tự gọi là nhóm hình ảnh (GOP).
 Lấy mẫu tần số: Áp dụng phép biến đổi cosin rời rạc (DCT) cho mỗi macroblock để chuyển đổi từ
miền không gian sang miền tần số. Kết quả là một ma trận 8x8 gọi là DCT coefficient, biểu diễn
các thành phần tần số của macroblock.
 Lấy mẫu lượng tử: Áp dụng một bảng lượng tử cho mỗi ma trận DCT coefficient để giảm số bit
cần thiết để biểu diễn chúng. Quá trình này làm giảm độ chính xác của các hệ số, nhưng cũng
giảm thiểu sai số khi tái tạo lại macroblock.

Tiêu chuẩn lấy mẫu trong mã hóa MPEG có ảnh hưởng đến chất lượng và kích thước của video. Nếu
lấy mẫu quá ít, video sẽ bị mất nhiều thông tin và xuất hiện hiện tượng khối hóa, nhiễu hoặc méo
tiếng. Nếu lấy mẫu quá nhiều, video sẽ có kích thước lớn và khó xử lý. Do đó, việc chọn tiêu chuẩn
lấy mẫu phù hợp với yêu cầu của người dùng và ứng dụng là rất quan trọng.

Câu 8

Sơ đồ nén mã hóa JPEG

Giải thích

- Chuyển ảnh ban đầu thành các block 8x8

Block là một ma trận điểm ảnh 8x8 pixel

Mục đích: tính toán DCT cho từng vùng dư thừa dữ liệu khác nhau
Tất cả các block có cùng kích thước và mỗi block là một ma trận điểm ảnh 8×8 pixel được lấy từ một
ảnh màn hình theo chiều từ trái sang phải, từ trên xuống dưới. Kích thước block là 8×8 được chọn
bởi hai lý do sau:

 Kích thước block lớn làm tăng độ phức tạp thuật toán
 Khoảng cách giữa các pixel vượt quá 8 sẽ làm cho hàm tương quan suy giảm nhanh

- Biến đổi Cosin rời rạc DCT (Discrete Cosine Transform)

DCT (Discrete Cosine Transform): biến đổi dữ liệu dưới dạng biên độ thành dữ liệu dưới dạng tần số.
Mục đích: loại bỏ sự dư thừa dữ liệu trong không gian DCT chia thành 2 loại:

 DCT một chiều.


 DCT hai chiều.

- Lượng tử hóa

Chức năng cơ bản: chia các hệ số F(u,v) cho các hệ số ở vị trí tương ứng trong bảng lượng tử Q(u,v)
để biểu diễn số lần nhỏ hơn các giá trị cho phép của hệ số DCT: Fq(u,v)=[F(u,v)/Q(u,v)]

Trong phần lượng tử hóa, để biến đổi mảng hai chiều các hệ số Fq(u,v) thành một chuối số một
chiều ta sử dụng qua thuật toán zigzag

Thu được kết quả là một chuỗi các số của ma trận cũ được lấy theo hình zigzag từ ô thứ nhất đến ô
cuối cùng.

- Mã hóa entropy

Mục đích: Làm giảm độ dư thừa thống kê trong các phần tử được mã hóa để truyền

Mã hóa entropy sử dụng mã hóa VLC và mã hóa RLC

RLC (Run Length Code): mã hóa độ dài chạy thực hiện mã hóa một hệ số khác 0 sau giá trị DC bằng
một từ mã

VLC (Variable Length Code): Mã hóa độ dài biến đổi được thực thi bằng cách đặt các từ mã ngắn cho
các mức có xác suất xuất hiện cao và các từ mã dài cho các mức có xác suất xuất hiện thấp.

You might also like