MỤC LỤC

DANH MỤC CHỮ VIẾT TẮT
DANH MỤC CÁC BẢNG
DANH MỤC HÌNH VẼ
MỞ ĐẦU...............................................................................................................1
CHƯƠNG 1: TỔNG QUAN HDTV.....................................................................3
1.1.Khái niệm HDTV.........................................................................................3
1.1.1. Khái niệm và ưu điểm của HDTV [5]..................................................3
1.1.2.Tỷ lệ khuụn hỡnh [3].............................................................................3
1.1.3.Đặc tớnh quột ảnh..................................................................................4
1.1.4.Độ phân giải hình và băng thông tín hiệu..............................................5
1.2.Lịch sử và xu hướng phát triển [5]...............................................................7
1.2.1. HDTV tại Nhật Bản..............................................................................7
1.2.2. HDTV tại Mỹ........................................................................................8
1.2.3. HDTV tại châu Âu................................................................................9
1.3.Mô hình tổng quan của hệ thống HD.........................................................11
1.3.1.Hệ thống thiết bị trung tâm (Master Headend)....................................11
1.3.2.Hệ thống mạng phân phối tín hiệu......................................................12
1.3.3.Thiết bị đầu cuối thuê bao...................................................................12
CHƯƠNG 2: CÁC CÔNG NGHỆ VÀ KỸ THUẬT ĐƯỢC SỬ DỤNG
TRONG HDTV...................................................................................................13
2.1.Tần số lấy mẫu và cấu trúc lấy mẫu...........................................................13
2.2.Lượng tử hoá..............................................................................................14
2.3.Nén video số bằng MPEG [3]....................................................................16
2.3.1.Tổng quan nén MPEG.........................................................................16
2.3.2.Nguyên lý nén Video...........................................................................17
2.3.3.Nén trong ảnh......................................................................................18
2.3.4.Nén liên ảnh.........................................................................................19
2.4.Nén MPEG 4 [3]........................................................................................21
2.4.1.Tổng quan về MPEG 4........................................................................21
2.4.2 MPEG 4 Profile...................................................................................26
2.4.3 MPEG 4 Visual (Part 2)..........................................................................30
2.4.4. MPEG 4 AVC (Part 10)/ H264...........................................................34
2.5.Nén HDTV.................................................................................................41
2.6.Chuyển đổi âm thanh tiêu chuẩn SD sang âm thanh tiêu chuẩn HD.........44
CHƯƠNG 3: TRUYỀN DẪN HDTV.................................................................45
3.1.Phát HDTV qua vệ tinh..............................................................................46
3.1.1. Phát sóng theo chuẩn DVB-S.............................................................46
3.1.2. Chuẩn DVB-S2 [4].............................................................................47
3.1.3. Phát HDTV qua vệ tinh sử dụng DVB-S2.........................................50
3.2.Phát HDTV qua sóng mặt đất....................................................................51
3.2.1. Chuẩn DVB-T....................................................................................52
3.2.2. Chuẩn DVB-T2 [4].............................................................................53
3.3.Phát HDTV qua mạng cáp.........................................................................64

3.3.1. Phát HDTV qua chuẩn DVB-C..........................................................64
3.3.2. Giới thiệu DVB-C2[4]........................................................................69
3.3.3. Kiến trúc hệ thống DVB-C2...............................................................70
3.4.Phát HDTV qua IP.....................................................................................80
CHƯƠNG 4: MỘT SỐ KẾT QUẢ MÔ PHỎNG...............................................82
4.1.Mô hình mô phỏng.....................................................................................82
4.1.1.Mô hình hệ thống DVB-T...................................................................82
4.1.2.Mô hình hệ thống DVB-T2.................................................................83
4.1.3.Mô hình hệ thống DVB-S2..................................................................84
4.2.Đánh giá một số kết quả mô phỏng...........................................................84
4.2.1.Hệ HDTV sử dụng chuẩn DVB-T.......................................................84
4.2.2.Hệ thống DVB-S2...............................................................................85
4.2.3.Hệ thống DVB-T2...............................................................................86
CHƯƠNG 5: ỨNG DỤNG TRIỂN KHAI HDTV TẠI VIỆT NAM.................87
5.2.1.Kỹ thuật De-interlacing [6].................................................................89
5.2.2.Kỹ thuật upconvesion [6]....................................................................92
KẾT LUẬN:........................................................................................................94

1

MỞ ĐẦU
HDTV (High-definition television) là hệ thống truyền hình số quảng bá có
độ phân giải cao cho hình ảnh đẹp, sắc nét, màu sắc đa dạng phong phú kết hợp
với hệ thống âm thanh số trung thực, đa kênh tạo ra một dịch vụ có chất lượng
nổi trội so với các hệ thống truyền hình truyền thống (PAL, NTSC, SECAM)
Chuẩn truyền hình này đưa đến cho người xem không chỉ cảm nhận về
chất lượng hình ảnh tốt với độ phân giải cao mà còn mang lại một cảm giác ấn
tượng về vẻ đẹp, độ chân thực, độ sâu và kích thước của toàn bộ hình ảnh. Hơn
thế nữa, với việc cung cấp tín hiệu âm thanh vòng (surround sound) 5.1 đã mang
lại cho người xem một cảm giác như đang ngồi trong rạp chiếu phim.
Việc người dùng chuyển lên HDTV thay thế SDTV được coi là một bước
tiến đáng nhớ cho ngành công nghiệp điện tử gia dụng, tương tự như việc nhân
loại chuyển từ tivi đen trắng sang tivi màu trước đây.
Việc truyền dẫn dịch vụ HDTV trờn cụng cỏc công nghệ khác nhau đặc
biệt là sử dụng chuẩn DVB (T,S,C) đang gặp khó khăn về yêu cầu cân bằng giữa
băng thông tín hiệu và chất lượng kênh truyền. Sự ra đời của chuẩn nén mới
MPEG-4/AV đã cải thiện được hiệu suất nộn dũng tín hiệu và hiệu quả sử dụng
kênh truyền. Đầu năm 2009 đánh dấu sự công nhận hệ tiêu chuẩn thứ 2 của
DVB gồm DVB- T2, DVB-S2, DVB-C2 với việc làm giảm rất nhiều dung lượng
của kênh, tăng độ tin cậy và khả năng chống nhiễu do vậy càng thúc đẩy sự phát
triển mạnh của dịch vụ HDTV.
Hiện nay tại Việt Nam truyền hình độ phân giải cao vẫn là một khái niệm
rất mới đối với người sử dụng. Trên thị trường chỉ xuất hiện màn hình Plasma và
LCD có thể xem truyền hình với độ phân giải cao, việc sản xuất chương trình
cũng như cung cấp loại hình dịch vụ này mới đang trong giai đoạn xây dựng
phương án đầu tư, nghiên cứu và phát thử nghiệm.
Luận văn “Truyền hình số có độ phân giải cao HDTV và khả năng ứng
dụng tại Việt Nam” đi vào nghiên cứu các công nghệ, chuẩn sử dụng trên
HDTV và đánh giá so sánh được hiệu quả của việc sử dụng tiêu chuẩn DVB thứ
2 trong truyền dẫn phát sóng HDTV. Đồng thời cũng đánh giá được hiện trạng
việc áp dụng công nghệ tiên tiến này vào nước ta để cho người sử dụng có một
cách sâu sắc hơn về dịch vụ mới HDTV tại Việt Nam.
Nội dung của luận văn được chia thành 5 chương như sau:
Chương 1: Tổng quan HDTV

2
Chương 2: Các công nghệ và kỹ thuật sử dụng trong HDTV: Lấy mẫu,
lượng tử hoỏ, nộn video số, chuẩn nén MPEG4, MPEG-4/AVC, kỹ thuật âm
thanh vòng sử dụng trong HDTV
Chương 3: Các công nghệ truyền dẫn HDTV, giới thiệu chuẩn DVB thế
hệ thứ 2 (DVB-T2,DVB-S2,DVB-C2) và so sánh đánh giá hiệu quả kênh truyền.
Chương 4: Một số kết quả mô phỏng sử dụng phần mềm mô phỏng
MATLAB 2009a về mô phỏng hệ HDTV, so sánh đánh giá hiệu suất về việc
dùng chuẩn DVB đầu tiên và thế hệ thứ 2 qua mó hoỏ LDPC
Chương 5: Ứng dụng triển khai HDTV tại Việt Nam
Qua lời nói đầu tác giả xin gửi lời cảm ơn sâu sắc tới TS.Ngụ Thỏi Trị,
người đã tận tình hướng dẫn tôi trong quá trình hoàn thiện bản luận văn này;
cũng xin được cảm ơn các thầy cô giáo, bạn học cùng lớp, bạn bè đồng nghiệp
đã giúp đỡ và động viên tôi trong suốt thời gian thực hiện luận văn.

Hà Nội, tháng 12 năm 2009
Học viên
Nguyễn Thị Thu Trang

3

CHƯƠNG 1: TỔNG QUAN HDTV
1.1.Khái niệm HDTV
1.1.1. Khái niệm và ưu điểm của HDTV [5]
HDTV sử các kỹ thuật tiên tiến để tăng thêm các chi tiết ảnh và cải tiến
chất lượng âm thanh cung cấp tới tivi. Chất luợng hình ảnh tương đương với 35
mm phim camera, chất lượng âm thanh tương đương với một máy nghe nhạc
compact. Để đạt được điều đó HDTV đã tạo thờm cỏc dòng điện tử quét ngang
màn hình và thờm cỏc electron để tạo thêm chi tiết ảnh. Các hệ thống truyền
hình truyền thống cung cấp loại tivi với 525 dũng quột (NTSC) với 300 điểm
ảnh trờn/dũng. HDTV sử dùng hơn 1000 dũng quột với khoảng 1000 điểm ảnh
trong một dòng. Với việc tăng thông tin cho hình ảnh nên HDTV yêu cầu một
băng thông cao hơn hẳn so với hệ thống truyền hình truyền thống do đó tăng
hiệu xuất sử dụng băng thông.
Các ưu điểm của HDTV so với SDTV
Khuụn hình rộng hơn, hình ảnh có độ sắc nét rõ ràng.
Âm thanh với chất luợng cao.
Băng thông sử dụng hẹp.
Khả năng chống xuyên nhiễu tốt, một số hiện tượng như búng
hỡnh(ghosting), hoặc muỗi (snow) không tìm thấy với hệ thống HDTV.
1.1.2.Tỷ lệ khuụn hình [3]
Tỷ lệ khuụn hỡnh là tỷ lệ giữa chiều ngang và chiều cao của hình ảnh, về
bản chất là tỷ lệ giữa số điểm ảnh tích cực của 1 dũng trờn số dòng tích cực. Tỷ
lệ truyền thống là 4:3, còn tỷ lệ của một khuụn hỡnh rộng là 16:9. Một số ưu
điểm của khuụn hỡnh rộng là:
+ Góc nhìn thấy của con người khoảng xung quanh 120 o, nhưng khi nhìn
màn hình nhỏ tỷ lệ 4:3 từ khoảng cách vài mét, chúng ta sẽ phải làm hẹp gúc
nhỡn một cách đáng kể thậm chí lên đến 10 o. Điều này làm giảm khả năng cảm
thụ hình ảnh.
+ Tỷ lệ khuụn hỡnh 16:9 (1.78:1) gần hơn với tỷ lệ khuụn hỡnh sử dụng
trong điện ảnh (thường là 1.85:1 hoặc 2.35:1).
+ Phần lớn các chuyển động trên màn hình được thực hiện theo chiều
ngang (ví dụ bóng đá, đua xe), do đó màn hình rộng sẽ có thể đáp ứng tốt hơn.
+ Màn hình rộng cũng có nghĩa giảm bớt số lượng cỏc hỡnh cận cảnh và
chuyển cảnh. Mặt khác các chuyển động trên màn hình rộng là liền mạch và liên
tục với chương trình có tính phim ảnh. Nói một cách đơn giản là có thể giảm bớt

4
được các chuyển cảnh nhanh do ta có thể nhìn được nhiều hơn trên màn hình
rộng
Hình sau đây sẽ cho ta thấy hiệu quả của tỷ lệ khuụn hỡnh.
16

9

Khoảng cách nhìn: 3HKhoảng cách nhìn: 7H
Khoảng cách nhìn: 7H
Gúc nhìn: 300
Gúc nhìn: 100
Hình 1.1: So sánh giữa HDTV và SDTV về tỷ lệ khuụn hỡnh
HDTV sử dụng tỷ lệ khuụn hỡnh rộng 16:9.
1.1.3.Đặc tớnh quột ảnh
Với định dạng 720p, tần số mành cũng là tần số khung, mỗi khung hình
truyền đi bao gồm 1 mành quét với 750 dòng tín hiệu..
Với định dạng 1080i, một khung hình gồm 1125 dòng tín hiệu, được
truyền đi bằng 2 mành. Mành 1 gồm cỏc dũng lẻ, gồm có 563 dòng. Mành 2
gồm cỏc dũng chẵn, gồm có 562 dòng. Tần số khung tương ứng với 2 hệ tần số
là 25Hz và 30Hz.
Tần số dòng với định dạng 1080/30i: fH = 30 x 1125 = 33750Hz.
Tương tự như vậy, tần số dòng với các định dạng 1080/25i là 28125Hz,
với định dạng 720/60p là 45000Hz, với định dạng 720/50p là 37500Hz.
Bảng sau đây thể hiện các thông số quét ảnh của HDTV tương tự
STT Thông số

50Hz
720p

1080i

60Hz
720p

1080i

5

3
4

Tần số khung
(Hz)
Tần số mành
(Hz)
Dạng quét
Tổng số dòng

5

Dòng tích cực

6

Dòng trống

1
2

7

50

25

60

30

50

50

60

60

1:1
750

2:1
1125

1:1
750

2:1
1125
1080 (21720 (26 đến 1080 (21-560, 720 (26 đến
560, 564745)
564-1123)
745)
1123)
45 (1-20, 56145 (1-20,
30 (1-25,
30 (1-25,
563, 1124561-563,
746-750)
746-750)
1125)
1124-1125)

Tần số dòng (fH,
37500
28125
Hz)
Bảng 1.1: Thông số quét ảnh của HDTV

45000

33750

1.1.4.Độ phân giải hình và băng thông tín hiệu
Độ phân giải đứng tương đương với số lần chuyển đổi giữa dòng tín hiệu
mức trắng và mức đen trong toàn ảnh. Từ những năm 1930, đã xác định độ phân
giải chiều đứng được tính bằng 70% của số dòng tích cực. Hệ số 0.7 được gọi là
hệ số K (Kell Factor).
Độ phân giải chiều đứng thường được thể hiện ở dạng số dòng của chiều
cao 1 ảnh (LPH – Lines per piture height), giá trị này được dùng để xác định
mức phân giải đứng tối đa có thể hiển thị được. Nếu 1 ảnh yêu cầu độ phân giải
cao hơn giá trị phân giải đứng của mành thì ảnh sẽ bị mờ.
Độ phân giải ngang của mành sẽ quyết định bề rộng băng thông cần thiết
để truyền tín hiệu. Ta sẽ tính toán trên ví dụ là hệ 1080/25i như sau:
Số dòng tích cực: 1080
Độ phân giải đứng: 1080 x 0.7 = 756 LPH
Với tỷ lệ khuụn hỡnh 16:9, chiều ngang của mành phải đảm bảo hiển thị
số điểm ảnh là: 756 x 16/9 = 1344 điểm ảnh.
Tần số mành của hệ 1080/25i là: 28125Hz, do đó thời gian tích cực 1
dòng là:
(1/28125) x (1920/2640) = 25.858s
Do chiều ngang có số điểm ảnh là 1344, nên số lần chuyển đổi điểm ảnh
đen trắng trên 1 dòng là 1344/2 = 672 lần.
Thời gian 1 lần chuyển đổi là: 25.858/672 = 0.0384s
Tần số cực đại là: 1/0.0384 = 26.04 MHz

6
Đây cũng chính là độ rộng băng thông tối thiểu cần thiết để truyền tín
hiệu đảm bảo độ phân giải đứng và ngang nói trên. Nếu giảm độ rộng băng
thông truyền tín hiệu, sẽ làm giảm độ phân giải hình.
Tính toán trên là với tín hiệu chói, với tín hiệu hiệu mầu, độ rộng băng
thông tương ứng sẽ là 13MHz.
Độ phân giải của SDTV ở châu Âu là 720 điểm ảnh trên một dòng, 575
dòng tích cực trong một mành được quét xen kẽ, tương đương với 0.41Mpixels.
Tại Bắc Mỹ số dòng tích cực thậm chí còn ít hơn, chỉ có 480 dũng quột xen kẽ.
Độ phân giải của định dạng HDTV 1080i là hơn 2Mpixels, tức là cao hơn 5 lần
so với SDTV.
Cũng cần phải nhấn mạnh rằng, một đĩa DVD hay một chương trình
truyền hình số (truyền qua cáp, vệ tinh số, hay số mặt đất) cũng chỉ có 575 dòng
tích cực mặc dù rất nhiều người nghĩ rằng DVD hay truyền hình số hiện nay là
có độ phân giải cao.
Để có thể dán nhãn HD ready, thiết bị cần ít nhất 720 dòng vật lý, nhưng
hiện nay phần lớn các TV màn hình phẳng có 768 dũng. Cỏc Projector độ phân
giải cao thường được gọi là Projector 720p có độ phân giải là 1280x720. Một
điều quan trọng cần nhấn mạnh là: Các yêu cầu để đạt HD ready không đề cập
đến số điểm ảnh trên 1 dòng, nhưng ta cần hiểu rằng số điểm ảnh là càng nhiều
càng tốt. Độ phân giải đặc chưng của hiển thị HD là: 1280x720(0.92Mpix),
1280x768(0.98Mpix),
1024x768(0.78Mpix),
1024x1024(1.05Mpix),
1366x768(1.05Mpix), 1920x1080(2.07Mpix). Thiết bị hiển thị với độ phân giải
gốc 1920x1080 được biết đến với tên HD đầy đủ (Full HD) hoặc bộ TV 1080p
hoặc Projector.

Hình 1.2: Tương quan về độ phân giải

7

1.2.Lịch sử và xu hướng phát triển [5]
1.2.1. HDTV tại Nhật Bản
Năm 1968, hãng NHK của Nhật Bản bắt đầu nghiên cứu và phát triển
HDTV, kết quả cho ra đời chuẩn kỹ thuật đầu tiên dành cho studio: Số dũng
quột/ảnh : 1125, tỷ lệ khuụn hình : 5/3, thương pháp quét: xen kẽ, tần số mành :
60Hz, độ rộng băng tần : 20MHz.
Đến tháng 10/1984, hệ MUSE (Multiple SubNyquist Sampling Encoding)
được NHK thiết kế để phát sóng truyền hình tương tự có độ phân giải cao qua vệ
tinh. Theo yêu cầu phát sóng, hệ MUSE còn được phát triển với nhiều version
khác nhau nữa. Trong đó, băng tần tín hiệu HDTV được nén từ 20MHz xuống
8.1MHz và có thể truyền, phát sóng qua vệ tinh. Nhật Bản cũng được ghi nhận
là nước duy nhất phát thương mại HDTV tương tự và cũng đó cú những thành
công nhất định.
Cho đến đầu những năm 2000 thì Nhật Bản đã chính thức chuyển sang
phát sóng HDTV số mặt đất theo tiêu chuẩn ISDB-T, và phát sóng số HDTV qua
vệ tinh theo tiêu chuẩn ISDB-S.
Hiện nay Nhật Bản sử dụng định dạng 1080i/60 với số mẫu trên 1 dòng là
1440 hoặc 1920.
Phát sóng trên mạng vệ tinh và sóng mặt đất theo chuẩn ISDB-T và
ISDB-S
-Mặt đất:
+ Có 17,9 triệu đầu thu HDTV số mặt đất được bán tính đến 1/2007
+ Đã phủ sóng 84 % lãnh thổ, tính đến cuối năm 2006
+ Một số kênh HDTV tại khu vực nội đô Tokyo

-Vệ tinh:
+ Có khoảng 20,4 triệu đầu thu HDTV số vệ tinh được bán, tính đến
1/2007.
+ Một số kênh HDTV qua vệ tinh tại Nhật Bản:

8
-Mạng cáp:
Hiện nay không triển khai trên mạng cáp, tuy nhiên các thuê bao của các
mạng vệ tinh và mặt đất có thể thu trực tiếp hoặc thông qua mạng cáp với các
thiết bị đầu cuối tương thích.
-Thị trường thiết bị hiển thị HDTV.
Đa dạng với nhiều model và nhà sản xuất. Giá thành ngày càng giảm.

-

Xu hướng phát triển
Theo lộ trình số hoá, đến năm 2011 thì Nhật Bản sẽ dừng phát sóng
analog, toàn bộ các thuê bao truyền hình tại gia sẽ là HDTV số.
Việc chuyển đổi từ cỏc kờnh mặt đất tương tự sang số phát HDTV là kế
hoạch quốc gia của Nhật Bản và phải mất 4 năm mới hoàn thành.
Thị trường TV phẳng như LCD, PDP phát triển mạnh mẽ và là những sản
phẩm chính trong thị trường HDTV số rất đông đúc của Nhật Bản. Giá cả các
loại TV trên cũng giảm xuống một cách nhanh chóng, với xu hướng xuống còn
khoảng 50$/inche
HDTV sẽ trở lên thông dụng tại Nhật Bản, bản thân các nhà cung cấp dịch
vụ truyền hình cũng xác định tiêu chí này thông qua câu nói: HDTV là điều cần
thiết để sống sót.
1.2.2. HDTV tại Mỹ
Chính phủ Mỹ đã quyết định nghiên cứu một định dạng HDTV mới so với
NHK để có thể phù hợp với các hệ thống phát sóng hiện tại. Các nhà nghiên cứu
và các nhà sản xuất đã tập hợp lại thành 4 nhóm riêng biệt để thực hiện việc này.
Bản thân 4 nhúm đó xây dựng nên 4 hệ truyền hình HDTV riêng là: DigiCipher
HDTV System, DSC HDTV System, Advance Digital (AD) HDTV, và CCDC

9
HDTV System. Đó là tiền thân của tổ chức The Grand Alliance với hệ GA
HDTV, được thành lập vào ngày 24/5/1993 từ việc thống nhất 4 nhóm nói trên.
Trong quá trình xây dựng hệ thống HDTV, Grand Alliance đã nhận thấy
rằng, công nghệ mới này phải được chuyển sang số hoá để có thể tương thích
với các hệ thống truyền hình hiện tại. Chính vì vậy, hệ thống HDTV tại Mỹ
được xây dựng từ đầu với truyền hình số và hoàn toàn khác biệt với Nhật Bản.
Đến năm 1996 thì FCC chính thức lập tiêu chuẩn cho HDTV, được phát
số mặt đất theo tiêu chuẩn ATSC. Tín hiệu số HDTV được nén và phỏt trờn
kờnh 6MHz của truyền hình NTSC. Đến năm 1998 thì HDTV chính thức được
phát sóng thương mại tại Mỹ.
Hiện nay các chương trình HDTV được cung cấp tới khách hàng như là
một dịch vụ số phát song song với SDTV và các dịch vụ khỏc trờn cả mạng cáp,
vệ tinh và sóng mặt đất.
Theo lộ trình, đến năm 2006, Mỹ sẽ chấm dứt việc phát sóng tương tự.
Toàn bộ hệ thống truyền hình tại Mỹ sẽ là truyền hình số. Khác với Nhật Bản,
HDTV tại Mỹ chỉ là một phần trong các dịch vụ số được các thuê bao đăng ký,
với tỷ lệ khoảng 10%. Tuy nhiên số lượng kênh lại rất phong phú, diện phủ sóng
chiếm 75 % lãnh thổ.
Có thể nói hệ thống HDTV tại Mỹ đã được phát triển một cách hoàn
chỉnh với khoảng 6 nhà cung cấp dịch vụ chính qua vệ tinh, hơn 30 nhà cung
cấp HDTV qua mạng cáp, hệ thống số mặt đất phủ sóng toàn lãnh thổ với hơn
75% số vùng có thể thu HDTV.
1.2.3. HDTV tại châu Âu.
Vào năm 1986, 19 nước ở châu Âu đã tổ chức hội nghị bàn thảo về
chương trình nghiên cứu HDTV mang tên “Eureka 95”, nhằm phát triển hệ
thống HDTV tại châu Âu. Giống như Nhật Bản, châu Âu cũng bắt đầu với hệ
truyền hình HDTV tương tự phát sóng qua vệ tinh. Vào tháng 5/1992, EU đưa ra
tiêu chuẩn D2-MAC, được phát triển bởi SGS-Thomson của Pháp và Philips của
Hà Lan, để phát sóng truyền hình màn rộng và các dịch vụ vệ tinh.
Hệ HDTV của châu Âu khi đó có số dũng quột là 1250 với 1152 dòng tích
cực, tỷ lệ khuụn hỡnh là 16:9, và tần số mành là 50Hz.
Thời điểm đó, EU có kế hoạch chuyển đổi các hệ thống truyền hình tương
tự hiện tại sang hệ thống D2-MAC thậm chí sang cả HD-MAC là hệ thống
HDTV tương tự đầy đủ. Tuy nhiên việc chuyển đổi này đã gặp một số trở ngại
từ một số nước, khi họ lo ngại các hệ truyền hình HDTV này sẽ không thể tồn
tại lâu dài do sự phát triển của truyền hình số. Trong khi đó một số nước có nền

10
công nghiệp truyền hình nhỏ như Hy Lạp, Ailen…cũng bày tỏ sự lo ngại về khả
năng tài chính của việc đầu tư phát triển HDTV. Chính vì vậy mà HDTV tương
tự đã không thể phát triển tại châu Âu, mặc dù một số hãng truyền hình của
Phỏp đó lập kế hoạch để triển khai D2-MAC, song sự phát triển của nó cũng rất
hạn chế, một phần do giá thành bộ thu HDTV theo D2-MAC khi đó là quá cao.
Đến năm 1993 thì hệ truyền hình HDTV tương tự HD-MAC chính thức dừng
lại, EU và EBU khi đó tập trung vào phát triển truyền hình số với hệ DVB.
Cho đến năm 2003, HDTV mới lại được bắt đầu được phát số thử nghiệm
tại châu Âu theo tiêu chuẩn DVB trên cả vệ tinh, cáp và sóng mặt đất.
- Hiện nay ở châu Âu đang chấp nhận 4 định dạng HDTV sau: 1080i/25,
1080p/50, 1080p/25 và 720p/50. Định dạng được EBU khuyến cáo nên sử dụng
là 720p/50
- Các chuẩn truyền dẫn: DVB-T cho sóng mặt đất, DVB-S, S2 cho sóng
vệ tinh, DVB-C cho mạng cáp, DVB-IPI cho mạng IP.
Hiện trạng HDTV tại một số nước châu Âu:

HDTV tại Pháp:
Vệ tinh: có 7 kênh HDTV được phát với hơn 40000 đầu thu STB
Sóng mặt đất: phát thử nghiệm 2 kênh từ tháng 5/2006 cho các
chương trình tennis, bóng đá, phim, sân khấu
Trên ADSL: Tất cả các nhà cung cấp mạng đều đưa ra các dịch vụ
quảng bá HD.
Chưa tiến hành trên mạng cáp.

HDTV tại Đức:
Hiện chỉ phỏt trờn vệ tinh, với khoảng 10 chương trình.
Sẽ triển khai trên mạng cáp và mặt đất.

HDTV tại Anh:
Phỏt trên vệ tinh và mặt đất, sớm triển khai trên mạng cáp.
Có khoảng 9 chương trình HDTV

HDTV tại Bỉ
Phỏt trên vệ tinh và mạng cáp
Hiện tại có 3 chương trình HD1,2,3. Sắp cú thờm HD4

Một số nước khác:
Tây Ban Nha: Có kế hoạch phát HDTV vào năm 2007 trên mạng
cáp và vệ tinh.
Italy: Đã phát 5 chương trình trên vệ tinh
Na Uy: phỏt trờn vệ tinh và sóng mặt đất

11
Hà Lan, Bồ Đào Nha: Phát HDTV trên mạng cáp
Thụy Điển, Phần Lan: phát HDTV trên vệ tinh
Thụy Sỹ: sẽ phát HDTV trên vệ tinh năm 2007.
Các nước Ba Lan, Slovakia, Rumani, Nga đã bắt đầu thử nghiệm.
Xu hướng tại châu Âu:
Đa phần các nước đều triển khai HDTV qua vệ tinh với những ưu
điểm về băng thông và sự hỗ trợ của DVB-S2
Ngoài một số hệ thống đang sử dụng nén MPEG 2, tất cả các nước
bắt đầu triển khai HDTV đều sử dụng MPEG 4/H.264 làm chuẩn nộn. Cỏc nước
đã sử dụng MPEG 2 cho HDTV cũng đã thông báo sẽ sử dụng MPEG 4/H.264
cho các hệ thống tiếp theo.
1.3.Mô hình tổng quan của hệ thống HD
Hệ thống truyền hình có độ phân giải cao được cấu thành từ ba thành
phần chính như sau:
- Hệ thống thiết bị trung tâm.
- Hệ thống truyền dẫn tín hiệu.
- Các thiết bị đầu cuối thuê bao.

Hình 1.3: Mô hình tổng quan của một hệ thống HDTV
1.3.1.Hệ thống thiết bị trung tâm (Master Headend)
 Hệ thống cung cấp và quản lý các chương trình truyền hình : Hệ
thống thu tín hiệu các chương trình truyền hình sau đó qua quá trình xử lý tín
hiệu: chèn quảng cáo, key chữ, mó hoỏ, điều chế tín hiệu... và chuyển sang
mạng phân phối tín hiệu. Các chương trình có thể thu trực tiếp từ vệ tinh, truyền
hình mặt đất, các chương trình tự sản xuất.

12
 Hệ thống kiểm tra, giám sát: Bao gồm hệ thống monitor để kiểm tra
chất lượng cũng như nội dung các chương trình truyền, hệ thống chuyển đổi
nguồn tín hiệu (matrix), hệ thống điều hành toàn bộ hoạt động của trung tâm thu
phát và mạng phân phối tín hiệu...
1.3.2.Hệ thống mạng phân phối tín hiệu
Hệ thống mạng phân phối tín hiệu có chức năng truyền dẫn các tín hiệu
truyền hình cũng như các dữ liệu từ trung tâm tới các thuê bao và ngược lại.
1.3.3.Thiết bị đầu cuối thuê bao
Đây là các thiết bị làm chức năng giải mã tín hiệu cung cấp tới tivi.
Toàn bộ quá trình xử lý tín hiệu được tích hợp trong một hộp nhỏ gọi là settopbox, nối tới tivi qua chuẩn HDMI.

13

CHƯƠNG 2: CÁC CÔNG NGHỆ VÀ KỸ THUẬT ĐƯỢC
SỬ DỤNG TRONG HDTV
2.1.Tần số lấy mẫu và cấu trúc lấy mẫu
Nếu trong SDTV, tần số lấy mẫu là 13.5MHz, là bội số của tần số dòng
với cả 2 hệ NTSC và PAL, thì với HDTV, tần số lấy mẫu cũng là bội số của tần
số dòng. Việc lấy mẫu tín hiệu có thể thực hiện với tín hiệu chói (Y’) và 2 tín
hiệu mầu thành phần (C’B, C’R) hoặc có thể thực hiện với 3 tín hiệu màu cơ bản
(R’, B’, G’). Đồng thời tần số lấy mẫu cũng phải đảm bảo lớn hơn 2 lần độ rộng
dải phổ tín hiệu.
Với HDTV, tần số lấy mẫu tín hiệu chói được lựa chọn là 74.25MHz cho
tất cả các định dạng tương tự. Tần số này là bội số của tần số dòng với cả 4 định
dạng nói trên.
+ Với hệ 50Hz:
74.25MHZ = 1980 x fH : với định dạng 720p
74.25MHZ = 2640x fH : với định dạng 1080i
+ Với hệ 60Hz:
74.25MHZ = 1650 x fH : với định dạng 720p
74.25MHZ = 2200 x fH : với định dạng 1080i
Với tín hiệu thành phần, tần số lấy mẫu cũng thường được biểu hiện thông
qua tỷ số giữa tần số lấy mẫu tín hiệu chói và tần số lấy mẫu tín hiệu hiệu mầu.
Với tín hiệu HDTV thành phần, tần số lấy mẫu 2 tín hiệu hiệu mầu là
37.125MHz.
fS (Y): 74.25MHz
74.25MHz
fS (C’B): 37.125MHz
37.125MHz
fS (C’R): 37.125MHz
37.125MHz
Cấu trúc lấy mẫu là trực giao, các mẫu tín hiệu hiệu mầu được lấy cùng
với các mẫu tín hiệu chói lẻ trên mỗi dòng. Điểm lấy mầu tín hiệu hiệu mầu sẽ
phụ thuộc vào mục đích để sản xuất, lưu trữ hay truyền dẫn. Các cấu trúc lấy
mẫu cũng tương tự như SDTV, gồm có các cấu trúc 4:2:0, 4:2:2, 4:4:4.

14
Theo Shanon và Nyquist, dải tần cho tín hiệu chói sẽ không được vượt
quá một nửa tần số lấy mẫu là 37.125MHz, và dải tần cho 2 tín hiệu hiệu mầu
không được vượt quá 18.5625MHz. Với việc sử dụng một bộ lọc thông thấp, tần
số cutoff của đặc tuyến biên tần với tín hiệu chói sẽ là 30MHz, với tín hiệu mầu
là 15MHz, giá trị này là đảm bảo độ rộng băng thông cần thiết để truyền tín hiệu
HDTV mà không làm suy giảm độ phân giải hình.

Hình 2.1: Đặc tuyến biên tần của tín hiệu Y, C’B, C’R
2.2.Lượng tử hoá
Tuỳ theo mục đích để lưu trữ hay truyền dẫn, số bít lượng tử có thể là 10
hoặc 8 bít. Thành phần được lượng tử hoá sẽ bao gồm tín hiệu chói, tín hiệu hiệu
màu và các tín hiệu về chuẩn thời gian (Time Reference Signal – TRS) bao gồm
tín hiệu kết thúc dòng video tích cực (EAV – End of Active Line) và bắt đầu một
dòng video tích cực (SAV – Start of Active Line).
Với hệ thống có 10 bit lượng tử, các giá trị số sẽ chạy từ 000h đến 3FFh
(tương ứng giá trị 0 đến 1023 trong hệ thập phân). Tín hiệu chói sẽ đi từ mức
đen 040h (64) đến mức trắng 3ACh (940). Tín hiệu mầu C’ B, C’R sẽ đi từ 040h
(640 đến 3C0h (960). Nhằm dự phòng cho sự quá mức tín hiệu, dải lượng tử cho
phép sẽ là từ 004h đến 3FBh (từ 4 đến 1019).
Các giá trị từ 000h đến 003h (0 đến 3) và từ 3FCh đến 3FFh (1020 đến
1023) được để dành cho các tín hiệu TRS (EAV và SAV).
Mỗi tín hiệu TRS sẽ bao gồm 4 từ mã:
3 từ mã đầu là cố định, có giá trị là 3FF, 000, 000.
Từ mã thứ tư là XYZ, trong đó có thể mang cỏc bớt V, F và H để
định nghĩa xoỏ dũng và xoá mành. Ngoài ra cỏc bớt P0, P1, P2, P3 được định

15
nghĩa thêm, phụ thuộc vào trạng thái của các bit V, F, H sẽ cung cấp các khả
năng sửa lỗi khác nhau (sửa 1 bit hay sửa 2 bit).
Bảng sau sẽ tổng hợp các thông số với các hệ khác nhau

TT

Thông số

1

Mã hoá tín hiệu thành
phần

2

Tần số lấy mẫu

3
4
5
6
7
8
9
10
11

Cấu trúc lấy mẫu

Giá trị
E’Y = 0.7152E’G + 0.2126E’R + 0.0722E’B
E’CB = 0.5389 (E’B – E’Y)
E’CR = 0.635 (E’R – E’Y)
Y : 74.25 MHz
CB : 37.125 MHz
CR : 37.125 MHz
- Trực giao
- Mẫu tín hiệu mầu được lấy tại các mẫu
tín hiệu chói lẻ

Mã hoá
Lượng tử đồng đều, PCM
Mức đen
040h (64)
Mức trắng
3Ach (940)
Mức mầu dưới
040h (64)
Mức mầu trên
3C0h (960)
Dải video
004h – 3FBh (4 – 1019)
Mức cấm dưới
000h – 003h (0 – 3)
Mức cấm trên
3FCh – 3FFh (1020 – 1023)
Bảng 2.1 : Tổng hợp các thông số với các hệ khác nhau
Tính toán dung lượng video số HDTV
Ta sẽ tính toán cụ thể tốc độ bít của video với hệ 1080/25i
Thời gian của 1 dòng tích cực: 1/28125 = 35.55s.
Tổng số mẫu tín hiệu chói được lấy tại mỗi dòng là: 35.55 x 74.25 = 2640
mẫu/1 dòng
Tổng số mẫu tín hiệu mầu được lấy tại mỗi dòng là: 35.55 x 37.125 x 2 =
2640 mẫu/1 dòng
Tổng số mẫu chói video là: (2640 + 2640) x 1080 = 5702400 mẫu/1 ảnh
Số mẫu trong 1s là: 5702400 x 25 = 142.56 M mẫu
Nếu để lưu trữ, mỗi mẫu được mó hoỏ bằng 10 bit, do đó tốc độ tín hiệu
video là: 1425.6Mbps
Nếu mó hoỏ bằng 8 bít, tốc độ video HDTV là: 1140.48Mbps

16
2.3.Nén video số bằng MPEG [3]
2.3.1.Tổng quan nén MPEG
Hiện nay các chuẩn nén MPEG đang được sử dụng phổ biến và được các
tổ chức ISO/IEC, ITU (International Telecommunication Union) công nhận là
chuẩn nén quốc tế, áp dụng cho các hệ truyền hình tại Mỹ, Nhật Bản, châu Âu.
MPEG 1
Được phát triển vào năm 1988-1992, là tiêu chuẩn đầu tiên của MPEG.
Chuẩn MPEG1 được sử dụng chủ yếu để nén tín hiệu VCD và các luồng tốc độ
thấp khoảng 1.5Mbps.
MPEG1 hỗ trợ nộn cỏc tín hiệu có độ phân giải thấp 352x240(60Hz) và
352x288(50Hz), sử dụng biến đổi cosin (DCT) để loại bỏ dư thừa không gian,
có dự đoán và bù chuyển động.
Điểm nổi bật của MPEG1 khi đó là có hỗ trợ nộn cỏc hình ảnh quét liên
tục.
MPEG 2
Được xây dựng từ năm 1991 đến 1994 và vẫn đang được sử dụng rộng rãi
đến tận bây giờ.
MPEG 2 có thuật toán nén tương tự như MPEG 1, song đã được phát triển
lên tầm cao hơn, hoàn chỉnh hơn với hệ thống công cụ và cấp đa dạng (Profile &
Level), hỗ trợ nén cho rất nhiều định dạng tín hiệu.
MPEG 2 gồm có 10 phần (Part 1 đến Part 10), trong đó Part 2 là về video,
part 3 là về audio. MPEG 2 / Part 2 tương tự như MPEG 1 song đó cú hỗ trợ nén
hình ảnh quét xen kẽ. Chính vì vậy, MPEG 2 được sử dụng rộng rãi và chính
thức trong các tiêu chuẩn truyền hình DVB, ITSC, ISDB.
MPEG 3
Được phát triển vào năm 1992 với mục đích áp dụng cho HDTV, tuy
nhiên nó bị huỷ bỏ vào năm 1993 do nhận thấy rằng: MPEG 2 hoàn toàn có thể
thực hiện cho HDTV.
MPEG 4
Được bắt đầu vào năm 1993, nhằm nâng cao hiệu quả nén cho HDTV.
MPEG 4 vẫn đang được phát triển đến hiện nay.
MPEG 7
Được đưa ra không phải là để cho nén, mà là các mô tả về đối tượng số và
metadata

17
2.3.2.Nguyên lý nén Video
Nguyờn lý của nén video là loại bỏ các thành phần dư thừa trong chuỗi
hình ảnh trước khi truyền đi hay lưu trữ.
Các thành phần dư thừa trong chuỗi hình ảnh:
+ Dư thừa có tính thống kê: là các dư thừa về không gian và thời gian có
trong ảnh và trong quá trình chuyển động của ảnh.
+ Các dư thừa thuộc về khả năng cảm nhận của mắt người: là các thành
phần trong ảnh mà mắt người không có khả năng cảm nhận.
MPEG sử dụng 3 phương pháp để loại trừ các dư thừa nói trên
+ Loại trừ các dư thừa không gian (Nén trong ảnh): các dư thừa không
gian là các thành phần giống nhau trong ảnh hoặc các thành phần nằm ngoài khả
năng cảm nhận của mắt người. Nén trong ảnh sử dụng cả hai quá trình nộn cú
tổn hao (làm mất một phần dữ liệu không thể khôi phục) và không tổn hao (làm
mất một phần dữ liệu nhưng có thể khôi phục tại đầu thu).
+ Loại trừ các dư thừa về mặt thời gian (Nộn liờn ảnh): với một chuỗi ảnh
liên tục, lượng thông tin chứa đựng trong ảnh thay đổi không nhiều. Do đó thay
vì truyền đi cả chuỗi ảnh thì chỉ cần truyền đi một ảnh và vector dự đoán hướng
chuyển động – thành phần có dung lượng nhỏ hơn nhiều so với ảnh. Kỹ thuật dự
đoán và bù chuyển động là phần rất quan trọng trong nén MPEG.
+ Sử dụng các phương pháp thống kê (Huffman Coding): Thông qua việc
xác định lượng thông tin của ảnh để lựa chọn số bớt mó hoỏ thích hợp.

Hình 2.2: Tổng quan về chu trình nén MPEG

18
2.3.3.Nén trong ảnh
2.3.3.1. Biến đổi cosin rời rạc (Discrete Cosin Transform - DCT)
DCT là phép biến đổi toán học không tổn hao và có tính thuận nghịch.
DCT biến đổi dữ liệu dưới dạng biên độ thành dữ liệu dưới dạng tần số. Các
phép tính được thực hiện trong phạm vi các khối block 8x8 tín hiệu chói và các
khối tương ứng của tín hiệu màu.
Horizontal frequency
14311813611412011212913413112112
61431341231241331471271341361131
11140129151129132139115116134131
15012411213412612913212513493116
13612413713813114414211914716214
9123132143117103125122109128132

1033720123731-20-41210-26-1287138-4-1-26-18090-16-1114-1-3152171126-3-14-3720110-2-7-63424-9208624611111128-3-10-70

DCT

8x8 pixel block

Vertical
frequency

8x8 coefficients Matrix

Hình 2.3: Biến đổi DCT
Hình 2.3: Biến đổi DCT
Một block 8x8 pixel cú cỏc dữ liệu dưới dạng mức biên độ, qua biến đổi
DCT sẽ chuyển thành ma trận hệ số 8x8. Hệ số gúc trỏi phía trên là thể hiện
thành phần 1 chiều trong block, các hệ số còn lại thể hiện các thành phần tần số
cao trong block ảnh theo chiều ngang và chiều đứng.
Phép biến đổi DCT sẽ cho các thành phần tần số cao ứng với các hệ số
nhỏ. Do đặc trưng của mắt người, các thành phần tần số cao có thể biểu thị bằng
số lượng bít nhỏ hoặc loại bỏ.
2.3.3.2 Lượng tử hoá
Lượng tử hoá là quá trình làm giảm bớt số lượng bit cần thiết để biểu diễn
các hệ số của ma trận DCT.
Hệ số 1 chiều là thông số quan trọng nhất, biểu thị độ chói trung bình của
từng block ảnh, do đó nó cần biểu thị bằng số lượng bít đủ lớn. Các hệ số biểu
thị thành phần tần cao có thể cần số lượng bít ít hơn hoặc loại bỏ.
Quá trình lượng tử hoá sẽ sử dụng một bảng các hệ số lượng tử, trong đó
các hệ số ứng với thành phần tần thấp có giá trị nhỏ và các hệ số ứng với thành
phần tần cao có giá trị lớn. Các hệ số tương ứng trong bảng DCT sẽ được chia
cho các hệ số trong bảng lượng tử, sau kết quả thu được sẽ được loại bỏ phần

19
thập phân. Do vậy sau quá trình lượng tử hoá, bảng ma trận thu được sẽ cú cỏc
hệ số ứng với thành phần tần cao là rất nhỏ và phần lớn là bằng 0.
1033720123731-20-41210-26-1287138-4-1-26-18090-16-1114-1-3152171126-3-14-3720110-2-7-63424-9208624611111128-3-10-70

1291112100011-1-100000000-10001000000-10000000100000001000000000000000

Quantization

Hình 2.4: Lượng tử hoá các hệ số biến đổi DCT
Quá trình lượng tử hoá là quá trình gây tổn hao, tuỳ theo giá trị của bảng
trọng số lượng tử mà mức độ tổn hao sẽ khác nhau, đồng thời cũng đạt hiệu quả
nén khác nhau.
2.3.3.3 Mó hoỏ
Bảng hệ số sau quá trình lượng tử được chuyển đổi sang dòng tín hiệu nối
tiếp bằng quét Zig-zag. Nhờ đó có thể tạo ra dòng tín hiệu gồm một chuỗi các
giá trị 0 liên tiếp.
Các phương pháp mó hoỏ được sử dụng cho nén trong ảnh là mó hoỏ với
độ dài từ mã thay đổi (Variable Length Coding - VLC) và mó hoỏ theo chiều dài
(Run Length Coding).
VLC (được biết đến với tên Huffma Coding) là phương pháp mó hoỏ dựa
trên xác suất xuất hiện giá trị biểu thị. Những giá trị biểu thị có xác suất xuất
hiện cao sẽ được mó hoỏ bằng một từ mã có số lượng bớt ớt, cỏc giá trị biểu thị
có xác suất xuất hiện thấp sẽ được biểu thị bằng từ mã có số lượng bít nhiều
hơn. Nhờ đó mà tăng hiệu quả nén mà không gây tổn hao dữ liệu.
RLC là phương pháp mó hoỏ áp dụng trong trường hợp có một chuỗi các
giá trị giống nhau liên tiếp. Khi đó thay vì phải truyền đi cả chuỗi thì chỉ cần
truyền đi 1 giá trị và 1 từ mã cho biết số lượng giá trị đó.
2.3.4.Nộn liên ảnh
Nộn liên ảnh về cơ bản là dựa trên ảnh nguyên bản chưa qua các quá trình
nộn, nờn bản chất khụng gõy tổn hao. Tuy nhiên do có yếu tố dự đoán chuyển
động nên có thể ảnh khôi phục phía đầu thu không hoàn toàn đúng như ảnh
nguyên bản ban đầu.

20
Nộn liên ảnh được thực hiện với các Macro Block (MB) gồm 16x16 phần
tử ảnh, tương đương với 4 Block.
Với một chuỗi các ảnh của chuyển động, ảnh đầu tiên sẽ được truyền đi
với đầy đủ thông tin. Các ảnh tiếp theo sẽ chỉ phải truyền giá trị biểu thị sự khác
biệt với ảnh trước đó và vector dự đoán hướng chuyển động.
2.3. 4.1 Các loại ảnh của MPEG.
MPEG định nghĩa 3 loại ảnh là I, P, B
- Ảnh I (Intra): chứa các thông tin cần thiết cho việc khôi phục lại ảnh tại
phía đầu thu. Là điểm truy cập vào chuỗi ảnh nén. Ảnh I chỉ được nén theo
phương pháp nén trong ảnh. Hiệu quả nén đạt không cao.
- Ảnh P (Predicted): Có thể được nộn trờn cơ sở dự đoán chuyển động
của ảnh I và P trước đó, thông qua kỹ thuật dự đoán bù chuyển động. Các ảnh P
có thể làm phần tử cơ bản để dự đoán ảnh tiếp theo, tuy nhiên việc bù chuyển
động trong trường hợp này là không đảm bảo. Vì vậy không thể tăng nhiều ảnh
P giữa 2 ảnh I. Nén ảnh P đạt hiệu quả cao hơn ảnh I.
- Ảnh B (Bidirectional Predicted): Có thể nhận được từ việc nội suy 2
hướng giữa 2 ảnh I hoặc 2 ảnh P ở ngay trước và sau nó. Ảnh B đạt hiệu suất
nén cao nhất.
Để có thể khôi phục lại chuỗi ảnh tại đầu thu, thứ tự truyền các ảnh và
nhận các ảnh tại phớa phỏt và phía thu sẽ không đúng như trình tự xuất hiện ảnh.

Thứ tự trên là thứ tự mà các ảnh được trình chiếu, ta có thể đánh số như
sau:
Hình 2.5: Thứ tự trình chiếu các loại ảnh
I1, B2, B3, P4, B5, B6, P7, B8, B9, P10, B11, B12, I13.
Ảnh I1 là ảnh gốc, các ảnh từ B2 đến B12 được dự đoán từ ảnh I1
Thứ tự mó hoỏ và giải mã:
I1, P4, B2, B3, P7, B5, B6, P10, B8, B9, I13, B11, B12

21
2.3.4.2 Dự đoán chuyển động
Dự đoán chuyển động trong nộn liờn ảnh được thực hiện trên đơn vị MB
của mỗi ảnh I, B, P. Hình vẽ sau đây là một ví dụ về dự đoán chuyển động của 1
MB.

Hình 2.6: Dự đoán bù chuyển động
Phần MB trong ảnh I được dự đoán tới vị trí mới trong ảnh P, khi đó thay
vì truyền đi cả 4 ảnh (đã được mó hoỏ thành chuỗi dữ liệu), chỉ cần truyền đi
ảnh I đầu tiên, vector chuyển động, và phần sai lệch giữa ảnh P nguyên bản và
ảnh P được dự đoán.
Tại phía thu, từ ảnh I và vector chuyển động sẽ khôi phục lại ảnh P, cộng
với phần sai lệch được truyền đi sẽ có được ảnh P gần nhất với nguyên bản. Từ
ảnh I và P vừa khôi phục, sẽ thực hiện nội suy để tìm ra 2 ảnh B ở giữa
2.4.Nén MPEG 4 [3]
2.4.1.Tổng quan về MPEG 4
MPEG 2 có khả năng nén SDTV ở tốc độ từ 3-15Mbps, nhưng hiện nay
gần như không có cách nào để cải thiện hơn nữa hiệu quả nén của MPEG 2. Với
nguồn tín hiệu có dung lượng lớn như HDTV, khả năng nén của MPEG 2 không
cho kết qua như mong muốn.
MPEG 4 được bắt đầu nghiên cứu từ năm 1993, đến năm 1998 thì hoàn
thành và được ISO công nhận là chuẩn quốc tế vài tháng sau đó.
MPEG 4 version 1 được hoàn thành vào năm 1998, version 2 ra đời vào
năm 1999. sau 2 version chớnh đú, rất nhiều công cụ được thêm vào cho các bản
sửa đổi tiếp theo, đến mức không thể phân biệt được các version. Tuy nhiên việc
phân biệt các version không quan trọng, điều cần thiết là phải phân biệt được
các profile. Các công cụ và profile hiện tại trong tất cả các version không được
thay thế trong version tiếp theo. Tất cả các công nghệ mới luôn luôn được thêm
vào MPEG 4 dưới dạng một profile mới.

22

Hiện nay MPEG 4 bao gồm 16 phần

Phần 1: Hệ thống (System)

Phần 2: Hình ảnh (Visual)

Phần 3: Âm thanh (Aural)

Phần 4: Định nghĩa cách thử nghiệm ứng dụng MPEG 4

Phần 5: Phần mềm tham khảo


Phần 6: DMIF (Delivery Multimedia Intergration Framework), đưa
ra các mô tả về việc phân phối các khung tích hợp đa phương tiện (DMIF)

Phần 7: Tối ưu hoá mô tả bộ mó hoỏ video

Phần 8: Các ánh xạ dòng MPEG 4 vào dòng truyền tải IP

Phần 9: Mô tả phần cứng

Phần 10: Mó hoỏ video tiên tiến (Advance Video Coding – AVC)

Phần 11: Mô tả cảnh

Phần 12: Định dạng file thông tin ISO

Phần 13: Các mở rộng IPMP

Phần 14: Định dạng file MP4

Phần 15: Định dạng file AVC


Phần 16: Mô phỏng cấu trúc mở rộng (AFX) và thế giới đa người
dùng (MuX)
MPEG 4 cung cấp các công cụ để có thể làm thoả mãn cả 3 thành phần là:
các tác giả, các nhà cung cấp dịch vụ và người sử dụng cuối cùng. MPEG 4 có 6
đặc chưng cơ bản
2.4.1.1. Mã hoỏ cỏc đối tượng nghe nhìn
Nếu như MPEG 2 mó hoỏ thực hiện với dòng video bao gồm cả âm
thanh, hình ảnh, các dữ liệu phụ như Text, văn bản đồ hoạ…thỡ MPEG 4 lại
phân tách từng thành phần trong luồng dữ liệu số. Việc mó hoỏ của MPEG 4
được thực hiện trên cơ sở các cảnh âm thanh hình ảnh (audiovisual scenes) được
kết hợp từ các đối tượng nghe nhìn (media objects hay audiovisual object AVO). MPEG 4 cho phép mỗi loại đối tượng này được mó hoỏ theo cách riêng
để tối ưu hoá đặc điểm tự nhiên của chúng, và cho phép chúng được truyền đi
đến người dùng như cỏc dũng căn bản.
Các cảnh âm thanh hình ảnh là kết hợp của một vài đối tượng nghe nhìn,
được sắp xếp theo cấu trúc phân cấp. Các đối tượng nghe nhìn nguyên bản như:

23
Các hình ảnh tĩnh (ví dụ hình nền )
Các đối tượng video (ví dụ người đang nói, không có hình nền)
Các đối tượng âm thanh (ví dụ các giọng nói liên kết với người đó,
nhạc nền)
MPEG 4 cũng định nghĩa số lượng các đối tượng nghe nhìn có khả năng
thể hiện dưới cả 2 dạng nội dung tự nhiên và tổng hợp.
Thêm vào các đối tượng nghe nhìn nói trên, MPEG 4 cũng định nghĩa một
số đối tượng khác để có thể tổng hợp lại các AVO tại đầu thu như:
Text và đồ hoạ
Các text liên kết và hình ảnh mặt đang nói để đồng bộ thoại với
hình ảnh nói, đồng bộ mặt người với cơ thể.
Các âm thanh nhân tạo.
Một đối tượng nghe nhìn ở dạng mó hoỏ có thể chứa một số thông tin mô
tả, để có thể kết hợp nó vào trong một cảnh âm thanh hình ảnh thành 1 dòng dữ
liệu. Một điều quan trọng nữa là mỗi AVO có thể được trình diễn độc lập với các
hình ảnh xung quanh và hình nền.
Việc mó hoỏ cỏc AVO sẽ tăng hiệu quả nén và tăng tính linh hoạt phía
thu. Người sử dụng có thể thay đổi sự kết hợp các AVO mà không làm thay đổi
nội dung các AVO.
2.4.1.2. Kết hợp các AVO
Hình vẽ sau sẽ giải thích cách 1 cảnh âm thanh hình ảnh được kết hợp lại
từ các AVO. Trong đó các AVO như là các chiếc lá trong cây mô tả và các AVO
kết hợp sẽ là các cành cây. Ví dụ đối tượng hình ảnh là hình người đang nói, đối
tượng âm thanh tương ứng sẽ được ghép với đối tượng hình ảnh để hình thành 1
AVO mới bao gồm cả âm thanh và hình ảnh của người đang nói.
MPEG 4 cũng cung cấp một cách chuẩn hoá để mô tả 1 cảnh âm thanh
hình ảnh:
Đặt các AVO tại bất cứ chỗ nào trong hệ toạ độ đã cho.
Thực hiện phép biến đổi để chuyển định dạng hình học hoặc âm
thanh của AVO
Nhúm các AVO nguyên bản để hình thành Avo tổng hợp.
Gắn cỏc dũng số liệu vào các AVO để thay đổi các thuộc tính của
chúng (ví dụ như âm thanh, chuyển động của một đối tượng, các thông số làm
sinh động 1 hình ảnh mặt người)
Thay đổi một cách tương tác điểm nghe nhìn của người xem tại bất
cứ nơi đâu trong cảnh.

24

Hình 2.7: Âm thanh hình ảnh được kết hợp lại từ các AVO
2.4.1.3.Mô tả và đồng bộ dòng dữ liệu cho các AVO
Các AVO có thể cần tới cỏc dũng dữ liệu được chia thành cỏc dũng cơ bản
(Elemetary Stream). Một bộ mô tả đối tượng sẽ nhận dạng tất cả cỏc dũng dữ
liệu được ghép với 1 AVO. Điều này cho phép kết hợp các dữ liệu được mó hoỏ
phân cấp như là một liên kết siêu thông tin về nội dung (được gọi là “ Thông tin
nội dung đối tượng”)
2.4.1.4. Phân phối dòng dữ liệu
Việc phân phối cỏc dũng dữ liệu thông tin từ phớa phỏt đến phía thu, khai
thác các chất lượng dịch vụ (Quality of Service – QoS) sẵn có của mạng, được
mô tả theo các lớp đồng bộ và phân phối bao gồm ghộp kờnh 2 lớp như hình vẽ:

25

Hình 2.8: Phõn phối các dòng dữ liệu từ phớa phát đến phớa thu
Lớp ghộp kờnh thứ nhất được thực hiện dựa trên các mô tả DMIF (MPEG
4 /part 6). Việc ghộp kờnh này có thể được thực hiện bằng công cụ ghép mềm
dẻo của MPEG, để ghộp cỏc ES với QoS giống nhau, để giảm các kết nối mạng
hay giảm thời gian trễ đầu cuối.
Lớp ghộp kờnh thứ 2 (TransMux) sẽ thực hiện việc truyền tải các dịch vụ
tương thích với QoS yêu cầu..
2.4.1.5.Tương tác với các AVO
Nói chung người sử dụng phải đối diện với mức độ cho phép của bản
quyền tác giả. Tuy nhiên người sử dụng hoàn toàn có thể tương tác với các cảnh
âm thanh hình ảnh:
Thay đổi điểm nghe nhìn của cảnh, ví dụ có thể chuyển bỏ qua cảnh
đó.
Kộo các đối tượng của cảnh đó sang vị trí khác.
Khởi sự một chuỗi sự kiện bằng cách kích vào 1 đối tượng lựa
chọn, ví dụ như bắt đầu hay kết thúc một dòng video.
Lựa chọn ngôn ngữ theo ý muốn.
2.4.1.6. Quản lý và nhận dạng sở hữu trí tuệ
Với MPEG 4, mó hoỏ theo các đối tượng, một điều rất quan trọng là có
khả năng nhận dạng các quyền sở hữu trí tuệ. MPEG 4 đã phải làm việc với các
đối tác về sở hữu trí tuệ để định nghĩa các cú pháp và công cụ thực hiện điều
này. Hiện nay, bộ đầy đủ các điều kiện cho việc nhận dạng quyền sở hữu trí tuệ
có thể tìm thấy trong phần ‘ Management and Protection of Intellectual Property
‘ của MPEG 4.

26
2.4.2 MPEG 4 Profile
MPEG 4 cung cấp bộ profile rất rộng cho việc mó hoỏ cỏc AVO. Nhằm
tăng hiệu quả cho việc thực hiện chuẩn, MPEG 4 chia ra thành các bộ profile
riêng sử dụng cho các ứng dụng tương ứng.
2.4.2.1. Visual Profile
Phần Visual của MPEG 4 cung cấp các công cụ để mó hoỏ cỏc nội dung
hình ảnh tự nhiên, nhân tạo hay các hình ảnh kết hợp tự nhiên và nhân tạo.
Có 5 profile cho các nội dung hình ảnh tự nhiên:
1.
Simple Visual Profile: Cung cấp kỹ thuật mó hoỏ đàn hồi lỗi cho
các đối tượng video hình chữ nhật. Phù hợp cho các mạng di động
2.
Simple Scalable Visual Profile: hỗ trợ thêm cho Simple Visual
Profile trong việc mó hoỏ cỏc đối tượng co giãn không gian và thời gian. Sử
dụng cho cung cấp các dịch vụ với yêu cầu về cấp chất lượng khác nhau do hạn
chế phía đầu thu, như mạng Internet, giải mã phần mềm.
3.
Core Visual Profile: cung cấp mó hoỏ cỏc đối tượng co giãn tuỳ ý
hỡnh dỏn và thời gian. Hỗ trợ thêm cho Simple Visual Profile cho các ứng dụng
tương tác nội dung (ví dụ các ứng dụng đa phương tiện qua Internet).
4.
Main Visual Profile: hỗ trợ thêm cho Core Visual Profile trong việc
mó hoỏ cỏc đối tượng quét xen kẽ, bán trong suốt và xoắn. Thích hợp cho các
dịch vụ tương tác, quảng bá, và các ứng dụng DVD.
5.
N-Bit Visual Profile: hỗ trợ cho Main Visual Profile trong việc mó
hoỏ cỏc đối tượng video có độ sâu ảnh từ 4 đến 12bit. Thích hợp cho các dịch vụ
giám sát.
Có 4 Profile cho các nội dung hình ảnh nhân tạo và kết hợp
1.
Simple Facial Animation Visual Profile: cung cấp các công cụ đơn
giản để làm sinh động hình ảnh mặt người.
2.
Scalable Texture Visual Profile: Cung cấp mó hoỏ co giãn không
gian cho các đối tượng hình ảnh tĩnh (hoặc bề mặt tĩnh). Phù hợp với game hay
các camera số phân giải cao.
3.
Basic Animated 2-D Texture Visual Profile: cung cấp co giãn không
gian, co giãn SNR cho ảnh tĩnh.
4.
Hybrid Visual Profile: bao gồm các khả năng giải mã các đối tượng
hình ảnh tự nhiên co giãn, với khả năng giải mã vài đối tượng kết hợp.
Version 2 của MPEG 4 thêm vào 3 Profile cho nội dung hình ảnh tự
nhiên:

27
5.
Advance Real-Time Simple Profile (ARTS): Cung cấp các kỹ thuật
mó hoỏ đàn hồi lỗi tiên tiến cho các đối tượng video hình chữ nhật.
6.
Core Scalable Profile: thêm vào các hỗ trợ cho Core Visual Profile
trong việc mó hoỏ cỏc đối tượng hình dạng tuỳ ý, co giãn không gian và thời
gian.
7.
Advance Coding Efficiency Profile (ACE): công cụ để tăng hiệu
quả mó hoỏ cho các đối tượng hình chữ nhật và hình ảnh tuỳ ý.
Các Profile của Version 2 cho các nội dung hình ảnh nhân tạo và kết hợp
tự nhiên nhân tạo:
8.
Advance Scalable Texture Profile: cung cấp giải mã cho các kết cấu
hình ảnh tuỳ ý và hình ảnh tĩnh bao gồm cả mó hoỏ co giãn hình ảnh, thích hợp
cho các ứng dụng cần sự truy cập ngẫu nhiên nhanh.
9.
Advance Core Profile: kết hợp khả năng giải mã các đối tượng
video có hình ảnh tuỳ ý (như Core Visual Profile) và khả năng giải mã các đối
tượng hình ảnh tuỳ ý co giãn (như Advance Scalable Profile). Thích hợp với các
ứng dụng đa phương tiện giàu nội dung như cỏc dũng dữ liệu tương tác đa
phương tiện truyền trên Internet.
10. Simple Face and Body Animation Profile: là bộ các công cụ làm
sinh động mặt người và cơ thể.
Tại các version tiếp theo, các Profile sau được thêm vào:
11. Advance Simple Profile: giống như Simple Visual Profile trong
việc mó hoỏ cỏc đối tượng hình ảnh hình chữ nhật, tuy nhiên được bổ sung thêm
một số công cụ để tăng hiệu quả mó hoỏ như: mó hoỏ cho khung B, bù chuyển
động ẳ pel, bảng lượng tử mở rộng và bù chuyển động toàn thể.
12. Fine Granularity Scalability Profile: cho phép cắt gọt dũng bớt lớp
nâng cao tại bất cứ vị trí bít nào, do đó chất lượng phân phối có thể dễ dàng
tương thích với các tình huống truyền dẫn và giải mã. Nó có thể được sử dụng
cùng với Simple hoặc Advance Simple như là lớp nền tảng.
13. Simple Studio Profile: là Profile với chất lượng rất cao cho các ứng
dụng chỉnh sửa trong studio. Nó chỉ có khung I, nhưng có thể hỗ trợ các hình
ảnh tuỳ ý và đạt tốc độ bít tới gần 2Gbps
14. Core Studio Profile: thêm vào khung P cho Simple Studio, do đó
đạt hiệu quả cao hơn nhưng cũng phức tạp hơn.
2.4.2.2. Aural Profile
MPEG 4 V.1 có 4 Profile cho Audio

28
1.
Speech Profile: cung cấp HVXC (Harmonic Vector Excitation
Coding) - mã hoỏ thoại có tốc độ bít rất thấp, CELP (Code Excited Linear
Prediction) – mó hoỏ thoại băng hẹp/rộng và giao diện Text to Speech.
2.
Synsethis Profile: cung cấp sự tổng hợp sử dụng SAOL (là một
ngôn ngữ lập trình để biến âm thanh thành một chương trình máy tính có thể tạo
ra audio khi chạy) và giao diện Text to Speech để tạo âm thanh với tốc độ bit rất
thấp.
3.
Scalable Profile: là tập hợp Profile thoại, phù hợp với mó hoỏ co
giãn thoại và nhạc cho mạng, ví dụ như quảng bá âm thanh số internet và băng
hẹp. Tốc độ bit từ 6kbps đến 24kbps, băng thông từ 3.5 đến 9kHz
4.
Main Profile: tập hợp các Profile có công cụ cho mó hoỏ audio tự
nhiên và nhân tạo.
MPEG 4 V.2 thêm vào 4 Profile khác:
1.
High Quality Audio Profile: cú cỏc mó hoỏ thoại CELP và mó hoỏ
AAC.
2.
Low Delay Audio Profile: cú cỏc mó hoỏ HVCX và CELP, mó hoỏ
trễ thấp AAC và giao diện Text to Speech.
3.
Nature Audio Profile: có tất cả các công cụ mó hoỏ audio tự nhiên
có trong MPEG 4 (không cho audio nhân tạo)
4.
Mobile Audio Internetworking (MAUI) Profile: bao gồm các đối
tượng AAC trễ thấp và co giãn bao gồm Twin VQ và BSAC. Dự định dùng cho
các ứng dụng viễn thông không sử dụng thuật mó hoỏ thoại MPEG.
2.4.2.3 Graphics Profile
Graphics Profile định nghĩa phần tử đồ hoạ và kết cấu nào có thể sử dụng
trong cảnh. Các Profile này được định nghĩa trong phần System của chuẩn.
1.
Simple 2-D Graphics Profile: cung cấp cho các phần tử đồ hoạ của
công cụ BIFS (Binary Format for Scene), cần thiết cho đặt vị trí của đối tượng
hình ảnh vào cảnh.
2.
Comlete 2-D Graphics Profile: cung cấp các chức năng đồ hoạ 2D
và các đặc chưng như hình ảnh đồ hoạ 2D tuỳ ý và text.
3.
Complete Graphics Profile: cung cấp các phần tử đồ hoạ tiên tiến
4.
3D Audio Graphics Profile: không dành cho hình ảnh, các công cụ
đồ hoạ được cung cấp để định nghĩa các nội dung âm thanh của cảnh.
5.
Một số Profile đang được xây dựng:
Simple 2-D + Text Profile
Core 2D Profile

29
-

Advance 2D Profile
X3D Core Profile
2.4.2.4 Scene Graph Profile

Scene Graph Profile (hay Scene Description Profile) là Profile về mô tả
cảnh, được định nghĩa trong phần System của chuẩn, cho phép các cảnh hình
ảnh âm thanh các nội dung 2-D, 3-D hoặc kết hợp 2-D/3-D.
1.
Audio Scene Graph Profile: cung cấp tập hợp các phần tử đồ thị
cảnh BIFS được sử dụng cho các ứng dụng audio
2.
Simple 2-D Scene Graph Profile: cung cấp tập hợp các phần tử đồ
thị cảnh được sử dụng để đặt các AVO vào cảnh.
3.
Complete 2-D Scene Graph Profile: cung cấp cho tất cả các phần tử
mô tả cảnh 2-D của công cụ BIFS
4.
Complete Scene Graph Profile: cung cấp tập hợp đầy đủ các phần
tử đồ thị cảnh của công cụ BIFS
5.
3D Audio Scene Graph Profile: cung cấp các công cụ để đặt âm
thanh 3D liên kết với thông số âm thanh của cảnh hoặc các thuộc tính giác quan
của nó.
6.
Các Profile đang được xây dựng:
Basic 2D Profile
Core 2D Profile
Advance 2D Profile
Main 2D Profile
X3D Core Profile
2.4.2.5 MPEG-J Profile
Hai Profile MPEG-J đang tồn tại hiện nay: Personal (Cá nhân) và (Main)
chính
1.
Personal: gói trọng lượng nhẹ cho các thiết bị cá nhân. Profile này
sẽ địa chỉ hoá một số các thiết bị như điện thoại di động, các thiết bị cầm tay ví
dụ như các điện thoại video, PDA (personal digital assistant), các thiết bị chơi
game cầm tay…Profile này bao gồm cỏc gúi sau của MPEG-J APIs
Mạng (Network)
Cảnh (Scene)
Nguồn (Resource)
2.
Main Profile: bao gồm toàn bộ MPEG-J API’SDTV, địa chỉ hoá các
thiết bị phía người sử dụng ví dụ như các set-top-box, máy tính trên nền hệ

30
thống đa phương tiện. Nó là tập hợp của Personal Profile, và bao gồm cỏc gúi
sau đây:
Giải mã (Decoder)
Chức năng giải mã (Decoder Functionality)
Lọc phân đoạn và thông tin dịch vụ (Section Filter and Service
Information)
2.4.2.6. Object Descritor Profile: cú cỏc công cụ sau:
-

Công cụ mô tả đối tượng (Object Descriptor-OD)
Công cụ lớp đồng bộ (Syn Layer-SL)
Công cụ thông tin nội dung đối tượng (Object Content Information-

OCI)
Công cụ quản lý và bảo vệ quyền sở hữu trí tuệ (Intellectual
Property Management and Protection-IPMP)
2.4.3 MPEG 4 Visual (Part 2)
MPEG 4 Visual cho phép mó hoỏ ghộp lai giữa các hình ảnh và video tự
nhiên với các cảnh nhân tạo (từ máy tính). MPEG 4 Visual bao gồm các công cụ
và thuật toán hỗ trợ việc mó hoỏ cỏc ảnh tĩnh tự nhiên và các chuỗi video cũng
như hỗ trợ nộn cỏc thông số đồ hoạ của các hình ảnh 2-D và 3-D.
2.4.3.1 Các định dạng hỗ trợ
- Bitrate: từ 5 Kbps đến hơn 1Gbps.
- Định dạng: quét liên tục và quét xen kẽ.
- Độ phân giải: từ QCIF (Quarter Common Intermediate Format) đến độ
phân giải cấp studio (4k x 4k pixel).
2.4.3.2 Đối tượng video
Một trong những đóng góp quan trọng của MPEG 4 Visual là loại bỏ cách
nhìn truyền thống về chuỗi video như là một tập hợp các khung hình chữ nhật.
Thay vì đó MPEG 4 Visual xem chuỗi video như là 1 tập hợp gồm 1 hay nhiều
đối tượng video (Video object-VO). MPEG 4 Visual định nghĩa các VO là các
thực thể linh hoạt mà người sử dụng có thể truy cập, thao tác với nó. Một VO có
thể có thể có hình dạng tuỳ ý, ví dụ là một hình người đang nói mà không có
hình nền. Hình ảnh hình chữ nhật chỉ là một trường hợp đặc biệt của VO. Các
VO cũng có thể từ các ảnh I, B, P và mang đặc tính giống như các loại ảnh trên.

31
2.4.3.3. Mó hoỏ co giãn các VO
MPEG 4 Visual cung cấp mó hoỏ cỏc đối tượng hình ảnh, video với sự co
giãn về không gian, thời gian và chất lượng, cho cả các hình ảnh chữ nhật và
hình ảnh tuỳ ý. Sự co giãn trong mó hoỏ sẽ cho phép khả năng giải mã một phần
dòng bit và khôi phục lại chuỗi hình ảnh với các cấp độ khác nhau:
Co giãn mức độ phức tạp tại mó hoỏ: cho phép mó hoỏ với các cấp độ
phức tạp khác nhau, tạo ra dòng bit hợp lý với các bề mặt, hình ảnh hay video đã
cho.
Co giãn mức độ phức tạp tại bộ giải mã: cho phép bộ giải mã có thể giải
mã các bề mặt, hình ảnh, video với các cấp độ phức tạp khác nhau, tuỳ thuộc
vào khả năng của bộ giải mã và nhu cầu phía đầu thu.
Co giãn độ phân giải không gian: cho phép bộ giải mã có thể giải mã một
phần dòng bit để khôi phục lại hình ảnh, hay bề mặt, video với độ phân giải thấp
đi.
Co giãn độ phân giải thời gian: cho phép bộ giải mã có thể giải mã một
phần dũng bớt để khôi phục lại các bề mặt, hình ảnh, video với độ phân giải thời
gian suy giảm.
Co giãn chất lượng: Giữ độ phân giải không gian và thời gian nhưng giảm
chất lượng.
Chức năng này được thiết kế cho mó hoỏ cỏc hình ảnh quét xen kẽ và phù
hợp với các ứng dụng mà phía thu không có khả năng thể hiện độ phân giải đầy
đủ hay chất lượng đầy đủ.
2.4.3.4. Cấu trúc các công cụ trình diễn video tự nhiên
Các thuật toán mó hoỏ hình ảnh và video của MPEG 4 mang đến sự trình
diễn hiệu quả các đối tượng video của các hình dạng tuỳ ý, đồng thời cũng hỗ
trợ các chức năng được gọi là nội dung cơ sở (conten based). MPEG 4 cũng hỗ
trợ phần lớn các chức năng được cung cấp bởi MPEG 1 và MPEG 2 bao gồm cả
chuẩn nộn cỏc chuỗi hình ảnh chữ nhật với rất nhiều các định dạng đầu vào, tốc
độ khung, độ sâu điểm, tốc độ bit và rất nhiều cấp co giãn không gian, thời gian,
chất lượng.

32

VLBL core (Vere Low Bit-rate Video) cung cấp các thuật toán và các
công cụ để thực hiện các ứng dụng có tốc độ từ 5 đến 64Kbps, hỗ trợ chuối hình
ảnh có độ phân giải không gian thấp (chất lượng CIF) và tốc độ khung thấp
(15Hz). Các chức năng của cá ứng dụng cơ bản được hỗ trợ bởi VBVL Core là:
Mó hoá chuỗi hình ảnh kích thước chữ nhật với hiệu quả mó hoỏ cao.
Các thao tác truy cập ngẫu nhiên, tua đi, tua ngược cho lưu trữ dữ liệu đa
phương tiện VLB và cho các ứng dụng truy cập.
2.4.3.5. Cấu trúc mó hoỏ hình ảnh video MPEG 4
Hình sau đây mô tả tổng quan về thuật toán của MPEG 4 để mó hoỏ cỏc
chuỗi hình ảnh có dạng chữ nhật và dạng tuỳ ý.

Hình 2.9: Thuật toán của MPEG 4 để mó hoỏ cỏc chuỗi hình ảnh
Cấu trúc mó hoỏ cơ bản bao hàm mó hoỏ hình dạng (cho các VO có hình
dạng tuỳ ý) và bù chuyển động cũng như mó hoỏ bề mặt DCT ( sử dụng DCT
tiêu chuẩn 8x8 hoặc DCT tương thích hình dạng).
Một cải tiến quan trọng của phương pháp mó hoỏ theo nội dung MPEG 4
là hiệu quả nén có thể cải thiện được đáng kể với một số chuỗi video bằng cách
sử dụng các công cụ dự đoán chuyển động đối tượng cho mỗi đối tượng trong 1
cảnh. MPEG 4 đưa ra một số kỹ thuật dự đoán chuyển động để tăng hiệu quả mó
hoỏ và sự trình diễn mềm dẻo các đối tượng.

33

Dự đoán và bù chuyển động dựa trên các block 8x8 hoặc 16x16 với
độ chính xác lên đến ẳ pel

Bù chuyển động toàn thể cho các đối tượng video (Global Motion
Compensation-GMC): mó hoỏ chuyển động toán thể cho một đối tượng sử dụng
một số ít thông số. GMC dựa trên dự đoán chuyển động toàn thể, sự mộo hỡnh,
mó hoỏ đuờng cong chuyển động và mó hoỏ bề mặt cho các lỗi dự đoán.

Bù chuyển động toàn thể cho các “sprite” tĩnh. Một “sprite” tĩnh có
thể là một ảnh tĩnh rộng, mô tả nền bao quát. Với mỗi ảnh tiếp theo trong chuỗi
ảnh, chỉ có 8 thông số mô tả chuyển động được mó hoỏ để khôi phục lại đối
tượng.

Bù chuyển động ở mức ẳ pel làm cải thiện lược đồ bù cho dự đoán
chuyển động

Biến đổi DCT hình dạng tương thích: tại cỏc vựng bề mặt mó hoỏ,
biến đổi DCT tương thích (Shape adaptive DCT : SA-DCT) sẽ cải thiện hiệu quả
mó hoỏ cỏc đối tượng hình dáng tuỳ ý.
Hình sau mô tả ý tưởng mó hoỏ cơ bản cho chuỗi video MPEG 4, sử dụng
1 hình ảnh bao quát sprite (Sprite panorama image). Trong đó có thể thấy rằng,
các đối tượng tiền cảnh (Foreground object) - trong trường hợp này là người
chơi tennis, có thể tách ra khỏi hình nền và do đó hình ảnh bao quát sprite cũng
có thể tách ra khỏi chuỗi để mó hoỏ độc lập (một hình bao quát sprite là một
hình tĩnh mô tả nội dung của hình nền trong tất cả các khung của chuỗi video).

Sprite panorama image

Foreground object

Reconstructed image

Hình 2.10: Ý tưởng mó hoá cơ bản cho chuỗi video MPEG 4
Hình ảnh bao quát sprite được mó hoỏ và truyền đi 1 lần duy nhất trong
khung đầu tiên của chuỗi để mô tả cảnh nền, sau đó ảnh này được lưu lại trong

34
bộ nhớ đệm sprite tại phía đầu thu. Trong các khung hình tiếp theo, chỉ có các
thông số camera liên quan đến hình nền, như hình ảnh người chơi chuyển động,
là được truyền đi. Điều này cho phép phía thu khôi phục lại hình nền cho tất cả
các khung hình tiếp theo bằng cách lấy hình nền từ bộ nhớ đệm. Đối tượng tiền
cảnh chuyển động (người chơi) sẽ được truyền đi độc lập như là 1 đối tượng
video (VO) hỡnhdạng tuỳ ý. Hình ảnh khôi phục sẽ bao gồm cả hình nền và cỏc
hỡnh tiền cảnh.
2.4.4. MPEG 4 AVC (Part 10)/ H264
2.4.4.1. Giới thiệu
Sự gia tăng của các loại dịch vụ và số lượng TV độ phân giải cao đã thúc
đẩy nhu cầu có một công cụ nén hiệu quả hơn.
Vào năm 2001, VCEG và MPEG cộng tác với nhau thành nhóm JVT
(Join Video Team) để phát triển một chuẩn mó hoỏ video mới. Kết quả ra đời
chuẩn nén ITU-T H.264/AVC, tương đương với tiêu chuẩn MPEG 4 Part
10/AVC về mó hoỏ video tiên tiến (Advance Video Coding), được cả ITU và
ISO phát hành năm 2003.
Nhằm không ngừng nâng cao hiệu quả mó hoỏ, rất nhiều kỹ thuật được áp
dụng vào trong MPEG 4/AVC nhằm khai thác tối đa sự tương quan giữa các
khung hình video và xử lý linh hoạt các tham số theo nội dung của cảnh video
cần nén. MPEG 4/AVC cũng đã áp dụng rất nhiều công cụ đã được giới thiệu
trong MPEG 4 Visual.
Trong các phần sau đây, ta sẽ gọi chuẩn này dưới tên MPEG 4/H.264.
2.4.4.2. Phạm vi ứng dụng và các điểm tiêu biểu của MPEG
4/H.264
Chuẩn này được thiết kế cho các giải pháp kỹ thuật của các lĩnh vực ứng
dụng sau đây:

Quảng bá trờn cỏc kờnh vệ tinh, cỏp, súng mặt đất, DSL (Digital
Subscriber Line)…

Lưu trữ nối tiếp hoặc tương tác trên các thiết bị quang và từ, trên
DVD…

Các dịch vụ hội nghị trên ISDL, Ethernet, LAN, DSL, không dây
và mạng di động…

Các dịch vụ đã phương tiện hoặc video theo yêu cầu trên ISDL,
cáp, DSL, LAN, mạng khụng dõy…

35

Các dịch vụ nhắn tin đa phương tiện (Multimedia Messaging
Service-MMS) trên ISDL, DSL, Ethernet, LAN, mạng di động và mạng không
dây.
Hơn nữa, các dịch vụ mới cũng có thể được thực hiện trờn cỏc mạng hiện
tại hoặc tương lai. Điều này dẫn đến yêu cầu về việc làm thế nào để quản lý sự
đa dạng trong ứng dụng và khai thác mạng.
Để thực hiện việc này, MPEG 4/H.264 đưa ra lớp mó hoỏ video (Video
Coding Layer-VCL), được thiết kế để trình diễn hiệu quả các nội dung video, và
đưa ra lớp mạng trừu tượng (Network Abstraction Layer-NAL) để định dạng sự
trình diễn video của lớp VCL và cung cấp các thông tin mào đầu (Header) theo
cách thích hợp cho việc truyền dữ liệu tại lớp truyền tải hoặc cho việc lưu trữ dữ
liệu.
Tương quan với các giải pháp mó hoỏ trước đây, ví dụ như MPEG 2, một
số điểm tiêu biểu của MPEG 4/H.264 cho phép tăng hiệu quả nén, bao gồm cả
khả năng dự đoán giá trị nội dung ảnh được trình bầy sau đây:
1.
Kích thước Block bù chuyển động nhỏ hơn: Chuẩn này cho phép
lựa chọn kích thước block bù chuyển động và hình dạng một cách mềm dẻo hơn
tất cả các chuẩn trước đó, với kích thước block bù chuyển động tối thiểu đạt tới
4x4.
2.
Bù chuyển động chính xác đến ẳ mẫu: các chuẩn trước cho phép độ
chính xác bù chuyển động đến tối đa là ẵ mẫu. Chuẩn mới cho phép điều này đạt
đến mức ẳ mẫu, như có thế thấy ở MPEG 4 Visual. Tuy nhiên độ phức tạp trong
xử lý việc này đã giảm đi với MPEG 4/H.264.
3.
Vector chuyển động tại đường bao ảnh: trong khi vector chuyển
động tại MPEG 2 cần phải chỉ đúng vào vùng ảnh đã được giải mã trước đó thì
MPEG 4/H.264 cho phép chỉ tới đường bao của ảnh.
4.
Bù chuyển động đa ảnh: các ảnh P trong MPEG 2 chỉ sử dụng 1 ảnh
I hoặc P trước đó để dự đoán ảnh tiếp theo. Với MPEG 4/H.264, dự đoán bù
chuyển động từ nhiều ảnh trước đó được lưu trong bộ nhớ. Tương tự như vậy
với ảnh B.
5.
Tách riêng thứ tự mó hoỏ khỏi thứ tự trình diễn: trong MPEG 2, có
một sự phụ thuộc chặt chẽ giữa thứ tự mó hoỏ và thứ tự trình diễn. MPEG
4/H.264 cho phép bộ mó hoỏ có thể lựa chọn thứ tự mó hoỏ hoàn toàn độc lập
với thứ tự trình diễn, miễn là dung lượng bộ nhớ của bộ giải mã đủ lớn. Điều
này sẽ giảm được thời gian trễ khi mó hoỏ cỏc ảnh dự đoán 2 chiều.
6.
Tách riêng các giải pháp trình diễn ảnh khỏi khả năng làm ảnh
chuẩn: trong các chuẩn trước, các ảnh B là các ảnh được mó hoỏ từ việc dự đoán

36
2 chiều các ảnh khác, không thể được sử dụng như một ảnh chuẩn để dự đoán
các ảnh khác trong chuỗi video. Chuẩn mới loại trừ việc này, do đó làm tăng tính
mềm dẻo cho việc dự đoán chuyển động.
7.
Dự đoán có trọng số: bước đột phá mới trong MPEG 4/H.264 là
cho phép tín hiệu dự đoán bù chuyển động được kết hợp với một giá trị trọng số
được mô tả bởi bộ mó hoỏ. Chế độ dự đoán này là hỗ trợ cần thiết khi nộn cỏc
cảnh có sự mờ đi (khi 1 cảnh được mờ đi vào cảnh khác), nhờ vậy mà tăng được
hiệu quả nén.
8.
Suy đoán chuyển động trực tiếp: với các chuẩn trước, một khu vực
bị bỏ qua sẽ không chuyển động trong nội dung cảnh. Điều này sẽ có ảnh hưởng
không tốt khi mó hoỏ video có chứa chuyển động toàn thể. Thay vì suy luận
vùng bị bỏ qua, MPEG 4/H.264 đưa ra giải pháp suy đoán chuyển động mới, gọi
là bù chuyển động trực tiếp (Direct).
9.
Switching slices (còn được gọi là SP và SI): là chức năng cho phép
bộ mó hoỏ có thể chỉ thị cho bộ giải mã xâm nhập vào dũng bớt để chuyển tốc
độ bit hay có thể giải mã được ảnh tại đúng vị trí xâm nhập đó mà không cần sử
dụng các ảnh khác.
10. Ảnh dự phòng (Redundant Picture): MPEG 4/H.264 có khả năng
cho phép bộ mó hoỏ gửi đi hình ảnh dự phòng của vùng ảnh được truyền, nhằm
khôi phục lại vùng ảnh bị mất ở trên đường truyền.
Nhằm cải tiến các giải pháp dự đoán, một số phần khác của chuẩn cũng
được nâng cao để tăng hiệu quả nén:
11. Biến đổi với kích thước block nhỏ: tất cả các chuẩn trước đều sử
dụng kích thước block biến đổi là 8x8, trong khi MPEG 4/H.264 dựa trên kích
thước 4x4. Do có kích thước block nhỏ hơn nên sẽ độ sai khác giữa ảnh thật và
ảnh dự đoán giảm đi, nhờ vậy tăng hiệu quả nén.
12. Thực hiện các biến đổi với kích thước block phân cấp: cho phép
kích thước block có thể tăng lên trong một số trường hợp.
13. Phép biến đổi ngược chính xác: trong các chuẩn mó hoỏ video
trước đây, các phép biến đổi được sử dụng cho trình diễn video thường có
ngưỡng chấp nhận lỗi cho phía thu, do không thể đạt được phép biến đổi ngược
lý tưởng trên lý thuyết. Vì thế, mỗi bộ giải mã sẽ có tín hiệu video khác một chút
so với bộ mó hoỏ, điều này làm ảnh hưởng đến chất lượng video. MPEG
4/H.264 là tiêu chuẩn đầu tiên đạt được sự chính xác về chất lượng của tín hiệu
video giải mã từ tất cả các bộ giải mã.
14. Mó hoá entropy số học: một phộp mó hoỏ entropy tiên tiến được áp
dụng trong MPEG 4/H.264 là mó hoỏ số học nhị phân theo nội dung CABAC

37
(Context Adaptive Binary Arithmetic Coding). Phương pháp mó hoỏ này dựa
trên khả năng chon lựa các chế độ cho mỗi cú pháp dựa vào nội dung.
15. Mó hoá entropy theo nội dung: phương pháp mó hoỏ entropy thứ 2
được áp dụng trong MPEG 4/H.264 là mó hoỏ độ dài thay đổi theo nội dung
(CAVLC-Context Adaptive Variable Length Coding). Phương pháp này được
thiết kế để mó hoỏ độ dư thừa các hệ số chuyển đổi của các khối 4x4 và 2x2.
Một số cải tiến nhằm nâng cao việc truyền dữ liệu trờn cỏc mạng cũng
được thêm vào MPEG 4/H.264
16. Cấu trúc bộ thông số: được thiết kế để truyền các bit có tính chỡa
khoỏ trong dòng dữ liệu như thông tin header, một cách độc lập và mềm dẻo
hơn, nhằm đảm bảo có thể khôi phục chính xác dữ liệu tại đầu thu.
17. Cấu trúc cú pháp đơn vị NAL: mỗi cấu trúc cú pháp trong MPEG
4/H.264 được đặt trong một gói dữ liệu logic, được gọi là đơn vị NAL. Điều này
cho phép sự tuỳ biến lớn hơn trong các giải pháp truyền nội dung video.
18. Kích thước Slice mềm dẻo: khắc phục nhược điểm trong MPEG 2,
khi có nhiều header trong slice làm giảm hiệu quả mó hoỏ.
19. Thứ tự macroblock mềm dẻo (FMO) và thứ tự macroblock tuỳ ý
(AMO): là kỹ thuật cho phép khôi phục lại thứ tự trình diễn của các MB khi
không đúng như thứ tự trình diễn..
2.4.4.3. VCL (Video Coding Layer)
Trong các chuẩn mã hóa video trước của ITU-T và ISO/IEC, VCL dựa
trên đơn vị mó hoỏ là các block, tại đó các ảnh được mó hoỏ sẽ được thể hiện
dưới dạng các macroblock. Thuật toán mó hoỏ là sự kết hợp của nộn liờn ảnh để
loại trừ dư thừa thời gian và phép biến đổi DCT để loại trừ dư thừa không gian.
Với VCL của MPEG 4/H.264, không có cải tiến nào mang tính đột phá,
nhưng có một số điểm bổ sung nhỏ được kết hợp lại để nâng hiệu quả nén.
a. Ảnh, khung và mành
Một chuỗi video được mó hoỏ trong MPEG 4/H.264 bao gồm chuỗi các
ảnh được mó hoỏ. Một bức ảnh được mó hoỏ có thể trình diễn dưới 1 trong 2
dạng là khung hình hoặc mành đơn. Một khung hình quét liên tục bao gồm 2
mành quét xen kẽ. Mó hoỏ tại VCL không dựa trên thời gian mà dựa trên cơ sở
về hình học.
b. Chia ảnh vào các Macroblock
Một bức ảnh có thể được chia vào các MB có kích thước cố định là một
khu vực gồm 16x16 mẫu chói và 8x8 mẫu mầu. MPEG 4/H.264 cũng định nghĩa
các MB như các chuẩn trước đây.

38
c. Slice và nhóm Slice
Một slice là nột chuỗi các MB được xử lý theo thứ tự quét. Trong mỗi
slice có chứa các thông tin cần thiết để giải mã ra vùng ảnh chứa trong slice đó.
Nếu có sử dụng kỹ thuật FMO, việc chia nội dung ảnh vào các MB và các
slice sẽ mềm dẻo hơn với cơ sở nhóm slice. Nhóm slice là một tập hợp các MB
được xác định từ bản đồ xắp xếp MB vào nhóm slice . Bản đồ này cũng chứa
con số nhận dạng nhóm slice mà các MB đó thuộc về

Hình 2.11: Phõn chia Slice và nhúm slice
Tuỳ theo việc có sử dụng kỹ thuật FMO hay không, mỗi slice có thể được
mó hoỏ với kỹ thuật khác nhau sau đây:

I slice: là slice mà tất cả các MB của nó đều được mó hoỏ theo
phương pháp dự đoán trong ảnh.

P slice: một số MB trong slice được mó hoỏ theo phương pháp dự
đoán liên ảnh.

B slice: một số MB được mó hoỏ từ các MB khác theo 2 chiều
Một số kỹ thuật mới được thêm vào như sau:

SP, SI slice: là kỹ thuật cho phép đầu thu có thể truy cập ngẫu
nhiên vào dòng bit để thay đổi tốc độ, khôi phục lỗi hay các mục đích khác.
d. Chu trình mó hoỏ và giải mã MB
Tất cả các mẫu mầu và chói của các MB được dự đoán không gian và thời
gian. Kết quả dự đoán sẽ được mó hoỏ biến đổi. Để thực hiện mó hoỏ biến đổi,
các tín hiệu dự đoán được chia thành các block 4x4. Sau đó được biến đổi bằng
phép biến đổi cỏi nguyờn. Kết quả được lượng tử hoá và mó hoỏ entropy.

39

Hình 2.12: Sơ đồ mã hoá MacroBlock
e. Dự đoán trong ảnh
Có 2 kích thước để dự đoán là 4x4 và 16x16. Chế độ dự đoán với kích
thước 4x4 phù hợp với các phần ảnh có độ chi tiết cao còn chế độ dự đoán với
kích thước 16x16 phù hợp với các phần ảnh mịn.
MPEG 4/H.264 cũn cú thờm chế độ mó hoỏ trong ảnh I_PCM, chế độ này
không thực hiện mó hoỏ theo các giá trị đã được biến đổi. I_PCM cho phép
truyền trực tiếp các giá trị được mó hoỏ.
Chế độ mó hoỏ cho phép đạt được các mục đích sau:

Cho phép bộ mó hoỏ có thể biểu thị một cách chính xác giá trị của
các mẫu.

Đưa ra phương thức để biểu thị một cách chính xác nội dung bất
thường của ảnh mà không làm tăng đáng kể dữ liệu.

Nó cho phép giới hạn tuyệt đối số lượng bit trong MB mà không
làm ảnh hưởng đến chất lượng hình ảnh.
Các chuẩn mó hoỏ trước đây đều thực hiện trên một miền đã biến đổi, còn
MPEG 4/H.264 với chế độ mó hoỏ I_PCM vẫn thực hiện hoàn toàn trên miền
không gian.
f.Dự đoán liên khung
IV.3.6.1 Dự đoán liên khung với slice P
MPEG 4/H.264 hỗ trợ nhiều kích thước dự đoán nhỏ hơn, từ 16x16 đến
4x4. Mỗi MB có thể chia thành 4 phân đoạn 8x8, mỗi phân đoạn 8x8 lại có thể

40
chia thành 4 phân đoạn 4x4. Mỗi phân đoạn đều yêu cầu phải có vector chuyển
động riêng. Như vậy 1 MB có thể có tối đa là 16 vector chuyển động.

Hình
2.13: Kích thước dự đoán MB
Việc bù chuyển động để khôi phục lại ảnh yêu cầu cả phớa phỏt và phía
thu phải lưu trữ các ảnh chuẩn để dự đoán.

Hình 2.14: Dự đoán bù chuyển động
Khi giải mã bù chuyển động, đầu thu sẽ đọc các thông số ảnh tham chiếu
trong bộ nhớ đệm. Trên cơ sở đó sẽ khôi phục lại ảnh gốc
Ảnh P cũng có thể được mó hoỏ theo chế độ P_skip. Với chế độ mó hoỏ
này, không phải bảng các giá trị lượng tử sai số, hay vector bù chuyển động, hay
các thông số trình diễn được truyền đi, mà tín hiệu khôi phục ảnh tại đầu thu
chính là tín hiệu dự đoán chuyển động của microblock P_16x16 lưu tại vị trí đầu
tiên của chuỗi trong bộ nhớ đêm của đầu thu.
Chế độ P_skip phù hợp với các trường hợp có một vùng ảnh rộng không
có thay đổi.
IV.3.6.2 Dự đoán liên khung với ảnh B
Dự đoán khung ảnh B sử dụng 2 danh sách:
Danh sách 0 chứa các ảnh gần nhất trước đó
Danh sách 1 chứa các ảnh gần nhất sau đó
Dự đoán khung ảnh B có thể theo 1 trong 4 phương thức: dự đoán từ các
ảnh trong danh sách 0, từ các ảnh trong danh sách 1, dự đoán 2 chiều và dự đoán
trực tiếp.

41
Với chế độ dự đoán 2 chiều, tín hiệu dự đoán được tạo nên từ giá trị trung
bình của các tín hiệu bù chuyển động theo danh sách 0 và danh sách 1, có bổ
sung trọng số.
Chế độ dự đoán trực tiếp, ảnh được suy ra từ các cú pháp dự đoán ảnh
truyền trước đó, có thể là theo danh sách 0 hoặc 1 hoặc theo chế độ 2 chiều.
Các slice B cũng sử dụng phân chia MB như slice P. Dự đoán liên khung
với ảnh B cũng có chế độ B_skip tương tự như với ảnh P.
g.Biến đổi Cosin
MPEG 4/H.264 cũng sử dụng biến đổi cosin để loại trừ các dư thừa trong
ảnh. Tuy nhiên khác với MPEG 2, phép biến đổi DCT được thực hiện với các
block 4x4. Thay vì sử dụng DCT cho khối 4x4, một phép biến đổi thứ nguyên
với các đặc tính tương tự như phép DCT cho block 4x4 được sủ dụng.
Việc sử dụng DCT với block có kích thước nhỏ sẽ đem lại một số lợi ích
sau:
Giảm tương quan về không gian trong khối
Giảm nhiễu đường biên của phần ảnh mà block đó mang thông tin.
Giảm sự phức tạp trong tính toán và sai lệch giữ mó hoỏ và giải mã.
h. Mã hoá Entropy.
MPEG 4/H.264 sử dụng 2 loại mó hoỏ cú cấu trúc phức tạp hơn nhưng
hiệu quả hơn là:
Mó hoá độ dài thay đổi theo nội dung (Context Adaptive Variable
Length Coding – CAVLC)
Mó hoá nhị phân tương thích nội dung (Context Adaptive Binary
Arithmetic Coding – CABAC).
2.5.Nén HDTV
Về bản chất HDTV không khác biệt so với SDTV cả về mặt tương tự và
số hoá. Vấn đề duy nhất gặp phải khi triển khai HDTV chính là độ rộng băng
thông yêu cầu để đảm bảo chất lượng. Ngoài một số hệ HDTV tương tự của
Nhật và châu Âu, chỉ có số hoá mới có thể phát triển được HDTV.
MPEG 2 đã có lịch sử phát triển hơn 10 năm, song bây giờ sẽ là thời điểm
của MPEG 4/H.264 với hiệu quả nén vượt trội.
Phần này không đi sâu vào tìm hiểu nén HDTV bằng MPEG 2 và MPEG
4/H.264 như thế nào, mà chỉ giới thiệu kết quả nén HDTV, với những phương
thức khác nhau, thì khác nhau như thế nào.
Sơ đồ sau đây thể hiện tương quan giữa nén MPEG 2, MPEG 4, và
MPEG 4/H.264.

42

Hình 2.15: Mối tương quan giữa nén MPEG2, MPEG4 và MPEG4/AVC
Như trên có thể thấy, nén bằng MPEG 4/H.264 có thể đạt được hiệu quả
hơn 50 % so với MPEG 2.

Bảng 2.2: So sánh tốc độ bít của chuẩn MPEG2 và MPEG4/AVC
Dòng tín hiệu số HDTV được nén theo nguyên lý áp dụng cho SDTV, tuy
nhiên với MPEG 2 thì SDTV được nén ở MP@ML, còn với HDTV thỡ nộn ở
MP@HL.
Bản thân MPEG 4/H.264 cũng được chia thành các Profile khác nhau
Basline Profile:cho các ứng dụng có trễ đầu cuối thấp
eXtended Profile: dùng cho các ứng dụng di động.
Mạin Profile: dùng cho các ứng dụng SD
High Profile: được chia thành các Profile khác nhau về cấu trúc lấy
mẫu (4:2:0 – 4:4:4), số bớt mó hoỏ (8-12bít), dùng cho các ứng dụng yêu cầu
chất lượng cao như HDTV.

43
Hiện nay, ngoại trừ một số kênh truyền hình đang sử dụng nén MPEG 2,
đa phần các nước đều đã sử dụng nén MPEG 4 cho HDTV, và các nhà cung cấp
dịch vụ đều đã lên kế hoạch chuyển sang MPEG 4.
Như đó trỡnh bầy ở trên, nén MPEG 4 Visual có cấu trúc tương thích với
MPEG 2, tuy nhiên MPEG 4/H.264 có một số điểm khác biệt không tương thích
với 2 chuẩn trên, vì vậy khi triển khai MPEG 4, sẽ phải thiết lập bộ mó hoỏ và
giải mã mới.
Cỏc hình sau đây sẽ cho cái nhìn cụ thể về sự phát triển của phương pháp
nén:

Hình 2.15: So sánh chuẩn nén sử dụng trong SDTV và HDTV

44
Kết luận:
Từ so sánh trờn thỡ nộn HDTV hiện tại được sử dụng là chuẩn nén
MPEG4 để giảm băng thông và tăng số lượng kênh truyền.
2.6.Chuyển đổi âm thanh tiêu chuẩn SD sang âm thanh tiêu chuẩn HD
Trong hệ thống SD sử dụng âm thanh stereo với hai loa trái và phải còn
đối với HD sử dụng âm thanh lập thể dolby AC-3 5.1 với hệ thống gồm 6 loa
khác nhau được miêu tả ở dưới đây.
Sơ đô dưới đây biểu diễn kỹ thuật chuyển đổi từ âm thanh stereo sang âm
thanh suround. Đây cũng là cơ sở chuyển đổi từ âm thanh từ SD sang HD.
Left front

Stereo
left

+

Center front

÷
Lọc

Stereo
Right

LPF
Left surround

Right surround

Right front

Hình 2.16: Kỹ thuật chuyển đổi từ âm thanh stereo sang âm thanh suround

45

Hình 2.17: Hệ thống õm thanh đa kênh dùng trong HDTV
- Hệ thống âm thanh đa kênh có thể chuyển đổi từ âm thanh mono sang
âm thanh lập thể 5.1 gồm sỏu kờnh âm thanh khác nhau.
• 5 main channels : L, C, R, LS, RS.
• 1 LFE (low-frequency effects) channel.
- Băng thông Audio : 48 KHz *16 bits * 6 Channels= 46.08 Mbit/s.
- Sử dụng tiêu chuẩn mã hóa Dolby AC-3 Audio Encoding.
- Tốc độ lấy mấu: 32 KHz, 44.1KHz, 48KHz.
- Tốc độ dữ liệu: 32 Kbps to 640 Kbps.

Hình 2.18: Sơ đồ mã hoá õm thanh HDTV

CHƯƠNG 3: TRUYỀN DẪN HDTV
Về bản chất, dòng tín hiệu HDTV sau mó hoỏ sẽ được chia vào cỏc gúi
truyền tải và thực hiện ghộp kờnh, khi đú dũng dữ liệu sẽ là cỏc gúi truyền tải
TS. Hệ thống phát sóng sẽ thực hiện với cỏc gúi TS. MPEG 4 không định nghĩa
dòng truyền tải riêng mà chỉ định nghĩa phương thức truyền dũng bớt mó hoỏ
MPEG 4 trờn dũng truyền tải MPEG 2 và IP.
Trong phần này, ta hiểu rằng dòng tín hiệu số được phát lên là dòng
truyền tải TS của MPEG 2. Sự khác nhau giữa SDTV và HDTV lúc này chỉ là
dung lượng của 1 chương trình. Chúng ta sẽ chỉ quan tâm tới việc: với 1 kênh

46
phát sóng mặt đất, vệ tinh hay cỏp thỡ có thể phát được bao nhiêu kênh HDTV
số.
Hình vẽ sau là một ví dụ về ghộp kờnh thống kê 2 chương trình HDTV
cựng cỏc dữ liệu khác của chúng để thành 1 dòng truyền tải. Vấn đề chỉ là dung
lượng tối đa kờnh súng cho phép và năng lực của bộ ghộp kờnh tương ứng.

Hình 3.1: Ghép kênh 2 chương trình HDTV
3.1.Phát HDTV qua vệ tinh
HDTV sử dụng điều chế QPSK với hệ thống HDTV vệ tinh.
Phát sóng theo chuẩn DVB-S
Phát sóng theo chuẩn DVB-S2

3.1.1. Phát sóng theo chuẩn DVB-S
HDTV
MPEG 2 or
MPEG 4/H.264

47
Hình 3.2: Sơ đồ hệ thống truyền hình số vệ tinh DVB-S
Như hình vẽ trên, phần mó hoỏ nguồn tín hiệu và ghộp kờnh sẽ thực hiện
mó hoỏ HDTV theo chuẩn MPEG 2 hoặc MPEG 4/H.264. Sau ghộp kờnh
truyền tải, dũng bớt được thực hiện các công đoạn thích ứng kênh vệ tinh theo
chuẩn DVB-S.
Mó hoỏ kờnh theo DVB-S gồm có mó hoỏ ngoài là RS (204,188) và mó
hoỏ trong là mã xoắn với các tỷ lệ ẵ, 2/3, ắ, 5/6, 7/8.
Phương thức điều chế là QPSK.
Tính toán dung lượng kênh:
Dung lượng kênh tối đa phụ thuộc vào hệ số roll off của bộ lọc
Nyquist là . Quan hệ giữa độ rộng băng tần, hệ số roll off, và chu kỳ symbol
được mô tả theo công thức sau:
BW = (1+)/T
Trong truyền hình số vệ tinh thì = 0.35.
Kênh truyền là 33 MHz thì tốc độ symbol lớn nhất là:
FS = 1/T = BW/(1+ ) = 33/1.35 = 24.4MHz.
Với điều chế QPSK, mỗi symbol mang 2 bít thông tin, ta có tốc độ bít là:
Rb = 2 . 22.4 = 44.8 Mbps
Tốc độ bít hữu ích phụ thuộc vào tỷ lệ mã trong (r C) và mã RS (hệ số rRS =
188/204)
Trong trường hợp mức tín hiệu là thấp nhất (E b/N0 thấp nhất), tỷ lệ mã
trong ẵ sẽ đảm bảo đạt BER < 10-10. Tốc độ bít hữu ích sẽ là:
RU = Rb  rC  rRS = 48.8  1/2  188/204 = 22.48 Mbps.
Trong trường hợp Eb/N0 lớn nhất, chất lượng tương đương có thể đạt được
với tỷ lệ mã rC = 7/8. Khi đó tốc độ hữu ích là:
RU = Rb  rC  rRS = 48.8  7/8  188/204 = 39.35 Mbps.
Trong thực tế thì hệ số  thường được lấy là 0.2, tốc độ hữu ích với tỷ lệ
mã trong ẵ là: 25.3Mbps, với tỷ lệ mã trong 7/8 là: 44.3 Mbps.
Hệ số mã trong thông thường được lựa chọn cho phát sóng vệ tinh số tối
thiểu là 2/3
3.1.2. Chuẩn DVB-S2 [4]
3.1.2.1. Đặc điểm chuẩn DVB-S2
Chuẩn mới DVB-S2 đã tạo ra bước đột biến trong hiệu quả sử dụng băng
thông khi so sánh với các chuẩn DVB-S và DVB-DSNG. Bước tiến mạnh mẽ
này không chỉ là do sử dụng mã sửa sai mới được gọi là “Kiểm tra chẵn lẻ mật

48
độ thấp” (Low Density Parity Check - LDPC), mà còn do một cấu trúc điều chế
mới và các chế độ hoạt động mới gọi là “Điều chế, mó hoỏ thay đổi” (Variable
Coding and Modulation – VCM) và “Điều chế, mó hoỏ tương thớch” (Adaptive
Coding and Modulation – ACM). Việc sử dụng những công nghệ mới này có thể
làm tăng lưu lượng qua một kênh vệ tinh lên tới 29% với LDPC và tăng 66% với
VCM, 131% với ACM.
Cấu trúc điều chế đơn giản nhất của DVB-S2 là “Điều chế, mó hoỏ khụng
đổi” (Constant Coding Modulation-CCM). CCM tương tư nhự DVB-S ở
điểm, tất cả các khung dữ liệu đều được điều chế và mó hoỏ với cùng thông số
cố định. Tuy nhiên ở DVB-S2, mã trong là LDPC kết hợp với mã ngoài là BCH
có khả năng sửa lỗi cao hơn so với mã Convolutional và Reed Solomon ở DVBS. Cộng thêm với khả năng mềm dẻo trong lựa chọn hệ số roll-off, nên với cùng
yêu cầu về C/N, DVB-S2 có thể đạt dung lượng lớn hơn.
Cấu trúc VCM cho phép với 2 chương trình khác nhau có thể có 2 cấu
trúc điều chế khác nhau. Cấu trúc điều chế của một chương trình có thể thay đổi
tuỳ theo yêu cầu chất lượng tại thời điểm đó.
Cấu trúc ACM cho phép cấu trúc mó hoỏ và tỷ lệ mã bảo vệ thay đổi tuỳ
theo điều kiện thu tại điểm thu.
Về bản chất, DVB-S2 không làm tăng dung lượng kênh vệ tinh số mà
DVB-S2 tăng hiệu quả sử dụng băng thụng lờn tương đương 40-80Mbps.
3.1.2.2.Kỹ thuật trong DVB-S2
• Hệ số Roll-off
DVB-S sử dụng hệ số roll-off là α = 0.35, DVB-S2 có 3 giá trị hệ số rolloff là 0.35, 0.25 và 0.20. Quan hệ giữa độ rộng băng thông và hệ số roll-off
được tính theo công thức sau:
BW = R*(1+a)
Trong đó BW được tính tại mức -3dB.
Hệ số roll-off giảm làm tăng dung lượng dữ liệu truyền qua transponder.
Ví dụ dữ liệu truyền qua transponder 36MHz có a = 0.35 tối đa là 26.67 Mbps,
trong khi truyền qua cùng transponder với a = 0.2 thì tốc độ đạt được là 30Mbps.
• Chế độ tương thích ngược
DVB-S2 có chế độ tương thích ngược, cho phép các đầu thu theo chuẩn
DVB-S vẫn có thể thu được dữ liệu thông thường, cũn cỏc đầu thu mới theo
chuẩn DVB-S2 thì có thể thu được các dịch vụ bổ sung. Quá trình chuyển đổi
này sẽ được kéo dài cho đến khi người sử dụng có thể sẵn sàng cho DVB-S2.
Khi đó hệ thống sẽ chuyển sang chế độ phát DVB-S2 hoàn toàn.

49

• Mó hoá sửa lỗi (FEC Encoding)
Khối này thực hiện mó hoỏ ngoại (BCH), mó hoỏ nội (LDPC) và xáo trộn
bit. Dòng dữ liệu đầu vào sẽ là BBFRAME, dữ liệu đầu ra sẽ là FECFRAME.
Mỗi BBFRAME có độ dài Kbch bit, được mó hoỏ FEC để tạo ra
FECFRAME gồm n ldpc bit. Các bit kiểm tra của mó hoỏ BCH được gắn vào
sau khung BBFRAME, các bit kiểm tra mó hoỏ LDPC được gắn vào sau

BCHFEC.
Hình 3.3: Mã hoá sửa lỗi FEC
Định dạng gói dữ liệu mó hoỏ LDPC và BCH.
Biểu đồ chòm sao điều chế QPSK, 8PSK, 16APSK, 32APSK

50

Hình 3.4: Giản đồ chòm sao điều chế sử dụng trong DVB-S2
3.1.3. Phát HDTV qua vệ tinh sử dụng DVB-S2
Từ tính toỏn trờn ta thấy rằng: dung lượng dành cho chương trình phỏt
trờn kờnh vệ tinh số theo chuẩn DVB-S là 25.3 Mbps với tỷ lệ mã trong là ẵ
(đảm bảo chống lỗi tốt) và tối đa là 44.3Mbps với tỷ lệ mã trong là 7/8.
Số chương trình có thể truyền trờn kờnh vệ tinh sẽ phụ thuộc vào:
Tỷ lệ mã trong được lựa chọn để đảm bảo BER đủ nhỏ.
Cấp nén thực hiện với chương trình.
1 kênh
Analog SDTV
8 x SD MPEG 2

1 đến 2
HD MPEG 2
16 x SD H264

4 x HD H264/DVB-S

51
Hình 3.5: So sánh khả năng truyền chương trình truyền hình trờn kờnh vệ
tinh số
Với chuẩn nén mới MPEG 4/H.264, và phương thức DVB-S2 khả năng
truyền HDTV trên 1 transponder sẽ tương đương với truyền SDTV/MPEG
2/DVB-S

Hình 3.6: So sánh chuẩn nén sử dụng trong DVB-S và DVB-S2
Kết luận:
Sự ra đời và phát triển của DVB-S2 sẽ tạo ra tác động lớn tới công nghiệp
quảng bá và thông tin vệ tinh. Chuẩn mới này là sự kết hợp của hai chuẩn trước
đó DVB-S và DVB-DSNG, với sự cải tiến đáng kể hiệu quả mó hoỏ và điều
chế.
Tuy nhiên, khi đưa ra DVB-S2, dự án DVB cũng không nhằm thay thế
ngay hai chuẩn cũ do hàng triệu đầu thu DVB-S đang hoạt động bình thường
mang các dịch vụ thông tin dữ liệu trên toàn thế giới.
Với DVB-S2, các ứng dụng mới như HDTV hay các dịch vụ dựa trên nền
tảng IP mới có thể thực hiện qua thông tin vệ tinh một cách hiệu quả. Với các
dịch vụ tương tác, công cụ DVB-S2 ACM sẽ làm tăng hiệu quả sử dụng băng
thông, dẫn đến giảm chi phí vệ tinh.
Cùng với công nghệ nén mới MPEG4-Part10 (H.264), chuẩn DVB-S2 sẽ
cho phép các nhà cung cấp dịch vụ DTH tăng được cỏc kờnh SDTV hay triển
khai các dịch vụ mới như HDTV, dịch vụ tương tác trên dải tần vệ tinh hiện có.
3.2.Phát HDTV qua sóng mặt đất
-HDTV sử dụng điều chế 8-VSB với hệ thống phát sóng vô tuyến
Chuẩn DVB-T
Phát sóng HDTV qua kênh số mặt đất

52

3.2.1. Chuẩn DVB-T
HDTV
Encoder
HDTV
Encoder

Hình 3.7: Sơ đồ khối hệ thống truyền hình số mặt đất DVB-T
Mó hoá nguồn có thể là MPEG 2 hoặc MPEG 4/H.264, sau đó được thực
hiện các công đoạn thích ứng kênh số mặt đất theo chuẩn DVB-T.
Dung lượng kênh số sẽ phụ thuộc vào các thông số mó hoỏ kờnh, khoảng
bảo vệ, phương thức điều chế.
Bảng 3.1: Dung lượng kênh truyền hình số mặt đất
Bảng sau cho ta giá trị dung lượng kênh truyền hình số mặt đất với các

thông số khác nhau:
Như vậy dung lượng 1 kênh số mặt đất sẽ từ 4.98 Mbps đến 31.67 Mbps.

53
3.2.2. Chuẩn DVB-T2 [4]
Tóm tắt: DVB-T2 là tiêu chuẩn truyền hình số mặt đất cho thế hệ thứ 2.
DVB-T2 là thành quả nghiên cứu của nhiều nhà khoa học thuộc tổ chức DVB Digital Video Broadcasting trong suốt 3 năm (2006-2009). DVB-T2 cho phép
tăng dung lượng dữ liệu trờn kờnh truyền (30%) và độ tin cậy trong môi trường
truyền sóng trên mặt đất. DVB-T2 không chỉ chủ yếu dành cho truyền hình số
có độ phân giải cao HDTV.
3.2.2.1. DVB-T2 - Những tiêu chí cơ bản
Những tiêu chí cơ bản của tiêu chuẩn DVB-T2 có thể tóm tắt như sau:
- DVB-T2 phải tuân thủ tiêu chí đầu tiên có tính nguyên tắc là tính tương
quan giữa các chuẩn trong họ DVB. Điều đó có nghĩa là sự chuyển đổi giữa các
tiêu chuẩn DVB phải thuận tiện đến mức có thể (ví dụ giữa DVB-S2 (tiêu chuẩn
truyền hình số qua vệ tinh thế hệ thứ 2) và DVB-T2.
- DVB-T2 phải kế thừa những giải pháp đã tồn tại trong các tiêu chuẩn
DVB khác. DVB-T2 phải chấp nhận 2 giải pháp kỹ thuật có tính then chốt của
DVB-S2, cụ thể:
+ Cấu trúc phân cấp trong DVB-S2, đóng gói dữ liệu trong khung BB (Base
Band Frame).
+ Sử dụng mã sửa sai LDPC (Low Density Parity Check).
- Mục tiêu chủ yếu của DVB-T2 là dành cho các đầu thu cố định và di
chuyển được, do vậy, DVB-T2 phải cho phép sử dụng được các anten thu hiện
đang tồn tại ở mỗi gia đình và sử dụng lại các cơ sở anten phát hiện có.
- Trong cùng một điều kiện truyền sóng, DVB-T2 phải đạt được dung
lượng cao hơn thế hệ đầu (DVB-T) ít nhất 30%.
- DVB-T2 phải đạt được hiệu quả cao hơn DVB-T trong mạng đơn tần
SFN (Single Frequency Network)
- DVB-T2 phải có cơ chế nâng cao độ tin cậy đối với từng loại hình dịch
vụ cụ thể. Điều đó có nghĩa là DVB-T2 phải có khả năng đạt được độ tin cậy
cao hơn đối với một vài dịch vụ so với các dịch vụ khác.
- DVB-T2 phải có tính linh hoạt đối với băng thông và tần số.
- Nếu có thể, phải giảm tỷ số công suất đỉnh/ công suất trung bình của tín
hiệu để giảm thiểu giá thành truyền sóng.
Trên cơ sở những tiêu chí trên, từ tháng 6/2007 đến tháng 3/2008, trên 40 tổ
chức đã tập trung nghiên cứu tiêu chuẩn DVB-T2, thông qua nhiều buổi hội thảo,

54
hội nghị qua mạng và Email. Cuối cùng cuối năm 2008, những nội dung cơ bản
của tiêu chuẩn DVB-T2 đã được ban hành.
Với những công nghệ sử dụng trong DVB-T2, dung lượng dữ liệu đạt
được tại UK lớn hơn khoảng 50% so với DVB-T, ngoài ra DVB-T2 còn có khả
năng chống lại phản xạ nhiều đường (Multipaths) và can nhiễu đột biến tốt hơn
nhiều so với DVB-T.
Bảng 3.2: DVB-T2 sử dụng tại UK so với DVB-T

Phương thức điều chế
FFT
Khoảng bảo vệ
FEC
Pilot phân tán
Pilot liên tục
Mức vượt L1
Phương thức sóng mang
Dung lượng

DVB-T
64 - QAM
2K
1/32
2/3CC + RS
8.3%
2.0%
1.0%
Tiêu chuẩn
24.1Mbps

DVB-T2
256 - QAM
32K
1/128
3/5 LDPC + BCH
1.0%
0.53%
0.53%
Mở rộng
36.1 Mbps

DVB-T2 thậm chí còn đạt được dung lượng cao hơn so với DVB-T trong
mạng đơn tần (SFN) với cùng giá trị tuyệt đối của khoảng bảo vệ (67%). DVBT2 còn cho phép sử dụng khoảng bảo vệ lớn hơn 20% so với DVB-T, điều này
cũng đồng nghĩa với việc mở rộng vùng phủ sóng của các máy phát trong mạng
SFN.
Bảng 3.3: Dung lượng dữ liệu trong mạng SFN
Phương thức điều chế
FFT
Khoảng bảo vệ
FEC
Pilot phân tán
Pilot liên tục
Mức vượt L1
Phương thức sóng mang
Dung lượng

DVB - T
64 - QAM
8K
1/4
2/3CC + RS
8.3%
2.0%
1.0%
Tiêu chuẩn
19.9Mbps

DVB - T2
256 - QAM
32K
1/16
3/5 LDPC + BCH
4.2%
0.39%
0.65%
Mở rộng
33.2 Mbps

55
3.2.2.2. Một số nội dung chính trong tiêu chuẩn DVB-T2
3.2.2.2.1. Mô hình cấu trúc DVB-T2
Hệ thống DVB-T2 được chia thành 3 khối chính ở phớa phỏt (SS1, SS2,
SS3) và 2 khối chính ở phía thu (SS4, SS5) như trình bày trong hình 1:

Tín hiệu
đầu vào
SS1:
Mã hoá và
ghép kênh
Video/Audio

SS2:
Basic Gateway

SS3:
Điều chế T2

SS4:
T2 Demod

SS5: MPEG
Decoder

SS3:
Điều
T2
Điềuchế
chế
T2

SS4:
T2 Demod
Demod
T2

SS5:
MPEG
SS3:
Decoder

SS3:
Điều chế T2

SS4:
SS3:
T2
Demod
Điều
chế
T2

Điều chế
T2
SS5: MPEG
Decoder

Hình 3.8: Mô hình cấu trúc DVB-T2
SS1: Mó hoỏ và ghộp kờnh.
Khối SS1 có chức năng mó hoỏ tín hiệu video/audio cựng cỏc tín hiệu
phụ trợ kèm theo như PSI/SI hoặc tín hiệu báo hiệu lớp 2 (L2 Signalling) với
công cụ điều khiển chung nhằm đảm bảo tốc độ bit không đổi đối với tất cả cỏc
dũng bit. Khối này có chức năng hoàn toàn giống nhau đối với tất cả các tiêu
chuẩn của DVB. Đầu ra của khối là dòng truyển tải MPEG-2TS (MPEG - 2
Transport Stream).
SS2: Basic T2 - Gateway
Đầu vào của SS1 được định nghĩa trong [1], đầu ra là dòng T2 - MI. Mỗi
gói T2-MI bao gồm Baseband Frame, IQ Vector hoặc thông tin báo hiệu (LI
hoặc SFN). Dòng T2-MI chứa mọi thông tin liên quan đến T2-FRAME. Mỗi
dòng T2-MI có thể được cung cấp cho một hoặc một vài bộ điều chế trong hệ
thống DVB-T2. Dạng thức giao diện của T2-MI được định nghĩa trong [2].
SS3: Bộ điều chế DVB-T2 (DVB-T2 Modulator)
Bộ điều chế DVB-T2 sử dụng Baseband Frame và T2- Frame mang trong
dòng T2-MI đầu vào để tạo ra DVB-T2 Frame.
SS4: Giải điều chế DVB-T2 (DVB-T2 Demodulator)

Tín
hiệu
ra

56
Bộ giải điều chế SS4 nhận tín hiệu cao tần (RF Signal) từ một hoặc nhiều
máy phát (SFN Network) và cho mụt dũng truyền tải (MPEG-TS) duy nhất tại
đầu ra.
SS5: Giải mã dòng truyền tải (Stream Decoder)
Bộ giải mã SS5 nhận dòng truyền tải (MPEG-TS) tại đầu vào và cho tín
hiệu video/audio tại đầu ra.
3.2.2.2.2. Lớp vật lý DVB-T2
Mô hình lớp vật lý của DVB-T2 được trình bày trong hình 2. Đầu vào hệ
thống có thể bao gồm một hoặc nhiều dòng truyền tải MPEG-TS hoặc dòng GS
(Generic Stream).
Đầu vào của lớp vật lý là tín hiệu cao tần RF. Tín hiệu đầu ra cũng có thể
được chia thành hai đường để cung cấp cho anten thứ 2, thường là 1 máy phát
khác
Dữ liệu
đầu vào
Xử lý dòng
dữ liệu vào

Tráo bit

Ánh xạ
Frame

Điều chế

Hình 3.9: Lớp vật lý
Việc xử lý dòng dữ liệu vào và FEC phải được lựa chọn sao cho có khả
năng tương thích với cơ chế sử dụng trong DVB-S2. Điều đó có nghĩa, DVB-T2
phải cú cựng cấu trúc baseband-frame, baseband-header, gói "0' (Null packet)
LDPC/BCH FEC và đồng bộ dòng dữ liệu như DVB-S2.
Các thông số COFDM của DVB-T cũng được mở rộng so với DVB-T,
trong đó bao gồm:
- FFT: 1K, 2K, 4K, 8K, 16K, 32K
- Khoảng bảo vệ: 1/128, 1/32, 1/16, 19/256, 1/8, 19/128, 1/4
- Pilot phân tán: 8 biến thể khác nhau phù hợp với các khoảng bảo vệ
khác nhau
- Pilot liên tục: tương tự như DVB-T, tuy nhiên tối ưu hơn
- Tráo: bao gồm tráo bit, tráo tế bào, tráo thời gian và tráo tần số

57
Việc có một khoảng lựa chọn rộng hơn các thông số COFDM cùng với
mã sửa sai mạnh hơn, cho phép DVB-T2 đạt được dung lượng cao hơn DVB-T
gần 50% đối với mạng MFN và thậm chí còn lớn hơn đối với mạng SFN.
DVB-T2 cũn cú một số tính chất mới góp phần cải thiện chất lượng hệ
thống.
- Cấu trúc khung (Frame Structure), trong đó có chứa symbol nhận diện
đặc biệt được sử dụng để quột kờnh (channel scanning) và nhận biết tín hiệu
nhanh hơn.
- Chòm sao xoay, nhằm tạo nên tính đa dạng trong điều chế tín hiệu, hỗ
trợ việc thu tín hiệu có tỷ lệ mã sửa sai lớn.
- Các giải pháp kỹ thuật đặc biệt nhằm giảm tỷ số giữa mức đỉnh và mức
trung bình của tín hiệu phát.
- Tuỳ chọn đối với khả năng mở rộng khung dữ liệu trong tương lai
(future extension frame).
3.2.2.2.3. Những giải pháp kỹ thuật cơ bản
2.3.1. Ống lớp vật lý (Physical Layer Pipes - PLPs)
Đòi hỏi của thị trường đối với độ tin cậy của các dịch vụ và sự cần thiết
phải cú cỏc loại dòng dữ liệu khác nhau đã dẫn tới khái niệm "ống" lớp vật lý
hoàn toàn trong suốt có khả năng truyền tải dữ liệu độc lập với cấu trúc và các
thông số PLP khác nhau. Cả dung lượng và độ tin cậy đều có khả năng điều
chỉnh cho phù hợp với từng nhà cung cấp nội dung/dịch vụ, tuỳ thuộc vào loại
đầu thu, môi trường.
DVB-T2 còn cho phép "gỏn" cỏc giá trị: đồ thị chòm sao, tỷ lệ mã và tráo
thời gian cho từng PLP, ngoài ra còn "dạng thức hoá" nội dung theo cùng một
cấu trúc khung "baseband frame" như được áp dụng trong DVB-S2.

Hình3.10: Các PLP khác nhau với cỏc lỏt thời gian khác nhau

58
Đặc biệt, một nhóm dịch vụ có thể cùng chia sẻ một thông tin chung, ví
dụ bảng PSI/SI hoặc CA. Để tránh phải truyền "đúp" cỏc thông tin này đối với
từng PLP, DVB-T2 có chứa "PLP chung" được chia sẻ bởi một nhóm PLP. Như
vậy, máy thu phải giải mã 2 PLP tại cùng 1 thời điểm khi thu một dịch vụ: PLP
dữ liệu và PLP chung đi kèm. Hai mode đầu vào, do đó được định nghĩa: đầu
vào mode A sử dụng duy nhất một PLP và đầu vào mode B sử dụng nhiều PLP.
2.3.1.1. Đầu vào mode A
Đầu vào mode A là mode đơn giản nhất. Ở đây chỉ có duy nhất một PLP
được sử dụng, truyền tải duy nhất một dòng dữ liệu. Hệ quả độ tin cậy của các
nội dung thông tin giống nhau như đối với DVB-T.
2.3.1.2. Đầu vào mode B
Đầu vào mode B là mode tiên tiến được sử dụng cho nhiều PLP (hình 4).
Ngoài độ tin cậy cao đối với các dịch vụ nhất định, mode B còn cho phép
khoảng tráo thời gian dài hơn và tiết kiệm năng lượng hơn đối với đầu thu.

Hình 3.11: T-2 Frame với kênh RF đơn và nhiều PLP mode
2.3.2. Băng tần phụ (1.7 Mhz và 10 Mhz)
Để đáp ứng các dịch vụ chuyên dụng, ví dụ truyền tín hiệu từ camera về
một studio lưu động, DVB-T2 còn bao gồm tuỳ chọn băng tần 10Mhz. Các máy
thu dân dụng không hỗ trợ băng tần này. DVB-T2 còn sử dụng cả băng tần 1.712
Mhz cho các dịch vụ thu di động (trong băng III và băng L)
2.3.3. Các mode sóng mang mở rộng (đối với 8K, 16K, 32K)
Do phần đỉnh xung vuông trong đồ thị phổ công suất suy giảm nhanh hơn
đối với kích thước FFT lớn. Điểm ngoài cùng của phổ tín hiệu OFDM có thể trải
rộng hơn, điều này cũng đồng nghĩa với việc nhiều sóng mang phụ trên một
symbol được sử dụng để truyền tải dữ liệu. Độ lợi (gain) đạt được ở giữa 1.4%
(8Kmode) và 2.1% (32Kmode). Hình 5 so sánh phổ của 2K so với 32K ở điều
kiện bình thường và 32K trong mode sóng mang mở rộng. Sóng mang mở rộng
là 1 đặc tính tuỳ chọn, bởi lẽ với đặc tính này khó có có thể đạt được mặt nạ phổ
(spectrum mask) cũng như tỷ số bảo vệ.

59

Hình 3.12: Mật độ phổ công suất đối với 2K và 32K
2.3.4. MISO dựa trên Alamouti (trên trục tần số)
Do DVB-T hỗ trợ mạng đơn tần (SFN), sự hiện diện của tín hiệu có
cường độ mạnh tương tự nhau từ 2 máy phát có thể tạo nên điểm "lõm" (deep
notches). Để khắc phục hiện tượng này, máy phát đòi hỏi phải có công suất cao
hơn.
DVB-T2 có tuỳ chọn sử dụng kỹ thuật Alamouti: với một cặp máy phát .
Alamouti là một ví dụ của MISO (Multiple Input, Single Output), trong đó mỗi
điểm của đồ thị chòm sao được truyền bởi một mỏy, cũn máy phát thứ 2 truyền
phiên bản có chỉnh sửa một chút của từng cặp của chòm sao với thứ tự ngược lại
trên trục tần số.
Kỹ thuật Alamouti cho kết quả tương đương với phương thức thu phân tập
trên phương diện đạt được sự kết hợp tối ưu giữa hai tín hiệu, tỷ số tớn/tạp cuối
cùng, do đó là công suất tổng hợp của hai tín hiệu trong không gian.

Hình 3.13: Mô hình MISO
2.3.5. Symbol khởi đầu (P1 và P2)

60
Những symbol đầu tiên của khung DVB-T2 ở lớp vật lý là các symbol
khởi đầu (preamble symbols). Các symbol này truyền một số lượng hạn chế các
thông tin báo hiệu bằng phương thức truyền có độ tin cậy. Khung đầu tiên được
bắt đầu bằng symbol P1, điều chế BPSK với độ tin cậy cao. Với khoảng bảo vệ
ở cả hai đầu, symbol P1 mang 7 bit thông tin (bao gồm kích thước FFT của
symbol dữ liệu). Các symbol P2, số lượng được cố định cho mỗi kích thước
FFT, cung cấp thông tin báo hiệu lớp 1 kể cả tĩnh, động và khả năng cấu trúc.
Các bit đầu tiên của thông tin báo hiệu (L1 - Pre-signalling) có phương
thức điều chế và mó hoỏ cố định, các bit còn lại (L1 - Post-signalling) tỷ lệ mã
được xác định là 1/2 nhưng phương thức điều chế có thể được lựa chọn giữa
QPSK, 16-QAM và 64-QAM. Symbol P2, nói chung còn chứa dữ liệu PLP
chung và/hoặc PLP dữ liệu.
2.3.6. Mẫu hình tín hiệu Pilot (Pilot Pattern)
Pilot phân tán ((Scattered Pilots) được xác định từ trước cả về biên độ và
pha, và được "cấy" vào tín hiệu với khoảng cách đều nhau trên cả hai trục thời
gian và tần số. Pilot phân tán được sử dụng để đánh giá sự thay đổi trên đường
truyền.
Trong khi DVB-T áp dụng mẫu hình tĩnh (static pattern) độc lập với kích
thước FFT và khoảng bảo vệ, DVB-T2 tiếp cận một cách linh hoạt hơn, bằng
cách định nghĩa 8 mẫu hình khác nhau để có thể lựa chọn, tuỳ thuộc vào kích
thước FFT và khoảng bảo vệ đối với mỗi đường truyền riêng biệt.

Hình 3.14: Mẫu hình Pilot phân tán đối với DVB-T (trái) và DVB-T2 (phải)
Pilot phân tán cho phép giảm thiểu độ "vượt mức" (overhead) từ 4  8%
khi sử dụng mẫu hình PP3 và khoảng bảo vệ 1/8. Đối với Pilot liên tục, tỷ lệ
phần trăm của DVB-T2 phụ thuộc vào kích thước FFT và đạt khoảng từ 0.7 
2.5% đối với 8K, 16K và 32K.
2.3.7. Phương thức điều chế 256-QAM
Trong hệ thống DVB-T, phương thức điều chế cao nhất là 64-QAM cho
phép truyền tải 6bit/symbol/súng mang (có nghĩa là 6bit/tế bào OFDM). Ở DVBT2, phương thức điều chế 256QAM (hình 8) cho phép tăng lên 8bit/tế bào
OFDM, tăng 33% hiệu xuất sử dụng phổ và dung lượng dữ liệu đối với một tỷ lệ

61
mã cho trước. Thông thường, tăng dung lượng dữ liệu thường đòi hỏi một tỷ số
công suất sóng mang trên tạp nhiễu cao hơn (4 hoặc 5dB, tuỳ thuộc vào kênh
truyền và tỷ lệ mã sửa sai), bởi lẽ khoảng cách Euclide giữa hai điểm cạnh nhau
trên đồ thị chòm sao chỉ bằng khoảng 1/2 so với 64-QAM và do vậy đầu thu sẽ
nhậy cảm hơn đối với tạp nhiễu. Tuy nhiên, mã LDPC tốt hơn nhiều so với mã
cuốn (Convolution code) và nếu chọn tỷ lệ mã mạnh hơn một chút cho 256QAM
so với tỷ lệ mã sử dụng trong 64-QAM của DVB-T, tỷ số công suất song mang
trên tạp nhiễu C/N sẽ không thay đổi trong khi vẫn đạt được một độ tăng trưởng
tốc độ bit đáng kể. 256-QAM do vậy sẽ là 1 sự lựa chọn đầy hứa hẹn trên thực tế.

Hình 3.15: Đồ thị chòm sao 256-QAM
2.3.8. Chòm sao xoay (Rotated Constellation)
Một trong số các kỹ thuật mới được sử dụng trong DVB-T2 là chòm sao
xoay (Rotated Constellation) và trễ Q (Q-delay). Sau khi đã định vị, chòm sao
được "xoay" một gúc trờn mặt phẳng I-Q như mô tả trờn hỡnh 9.

62

Hình 3.16: Chòm sao 16-QAM "xoay"
Các thành phần I và Q được tách bởi quá trình tráo sao cho chúng được
truyền trên miền tấn số và thời gian khác nhau. Nếu có một thành phần bị huỷ
hoại trờn kờnh truyền, thành phần còn lại có thể được sử dụng để tái tạo lại
thông tin. Kỹ thuật này tránh được mất mát trờn kờnh Gauss và tạo được độ lợi
0.7dB trờn kờnh cú phađing. Độ lợi này còn lớn hơn trờn kờnh 0dB phản xạ
(SFN) và kờnh xoỏ (nhiễu đột biến, phađing có chọn lọc) (Hình 10). Điều này
cũng đồng nghĩa với việc có thể sử dụng tỷ lệ mã, tốc độ bit cao hơn.

63

Hình 3.17: Thành tích của chòm sao xoay so với không xoay
2.3.9. 16K, 32K FFT và tỷ lệ khoảng bảo vệ 1/128
Tăng kích thước FFT đồng nghĩa với việc làm hẹp khoảng cách giữa các
sóng mang và làm tăng chu kỳ symbol. Việc này, một mặt làm tăng can nhiễu
giữa các symbol và làm giảm giới hạn tần số cho phép đối với hiệu ứng Doppler.
Mặt khác, chu kỳ symbol dài hơn, cũng có nghĩa là tỷ lệ khoảng bảo vệ nhỏ hơn
đối với cùng giá trị tuyệt đối của khoảng bảo vệ trên trục thời gian. Tỷ lệ khoảng
bảo vệ bằng 1/128 trong DVB-T2, cho phép 32K sử dụng khoảng bảo vệ cú
cựng giá trị tuyệt đối như 8K 1/32 như hình 11.
GI

8K
1/32

GI

32K

1/128

Hình 3.18: Khoảng bảo vệ đối (GI) với 8K 1/32 và 32K 1/128

2.3.10. Mã sửa sai LDPC/BCH

64
Trong khi DVB-T sử dụng mã sửa sai trong và ngoài là mã cuốn và mã RS (Convolutional and Reed-Solomon Codes), DVB-T2 và DVB-S2 sử dụng
LDPC/BCH. Cỏc mó này cho phép khả năng bảo vệ tốt hơn, truyền nhiều dữ
liệu hơn trên cùng một kênh thông tin.

Hình 3.19: So sánh mã sửa sai sử dụng trong DVB-T và DVB-T2
2.3.11. Tráo bit, tế bào, thời gian và tần số
Mục đích của tráo là trải nội dung thông tin trên miền thời gian và/hoặc
tần số sao cho kể cả nhiễu đột biến lẫn phađing đều không có khả năng xoá đi
một chuỗi bit dài của dòng dữ liệu gốc. Trỏo cũn được thiết kế sao cho các bit
thông tin được truyền tải bởi một điểm xác định trên đồ thị chòm sao không
tương ứng với chuỗi bit liên tục trong dòng dữ liệu gốc.
2.3.12. Kỹ thuật giảm thiểu tỷ số công suất đỉnh/cụng suất trung bình
(Peak - to - average Power Ratio - PAPR)
PAPR trong hệ thống OFDM cao có thể làm giảm hiệu xuất bộ khuếch đại
công suất RF. Cả hai kỹ thuật làm giảm PAPR được sử dụng trong hệ thống
DVB-T2: mở rộng chòm sao tích cực (Active Constellation Extension - ACE) và
hạn chế âm sắc (Tone Reservation - TR).
Kỹ thuật ACE làm giảm PAPR bằng cách mở rộng các điểm ngoài của đồ
thị chòm sao trên miền tần số, còn TR làm giảm PAPR bằng cách trực tiếp loại
bỏ các giá trị đỉnh của tín hiệu trên miền thời gian.
Hai kỹ thuật bổ sung cho nhau, ACE hiệu quả hơn TR ở mức điều chế
thấp còn TR hiệu quả hơn ACE ở mức điều chế cao. Hai kỹ thuật không loại trừ
nhau và có khả năng sử dụng đồng thời. Tuy nhiên ACE không được sử dụng
với chuẩn xoay.

65
Kết luận:
Tiêu chuẩn truyền hình số mặt đất thế hệ thứ 2 (DVB-T2) được
công bố tháng 2-2009 (sau DVB-S2 và DVB-C2 cho truyền hình số trên vệ tinh
và truyền hình cáp). DVB-T2 sử dụng nhiều giải pháp kỹ thuật mới như: ống vật
lý, băng tần phụ, các mode sóng mang mở rộng, MISO dựa trên Alamouti,
symbol khởi đầu (P1,P2), mẫu hình tín hiệu Pilot, chòm sao xoay,… mục đích là
làm tăng độ tin cậy của kênh truyền và tăng dung lượng bit. Trên thực tế, DVBT2 có khả năng truyền tải dung lượng bit lớn hơn DVB-T gần 50% đối với mạng
MFN và thậm chí cao hơn đối với SFN.
DVB-T2 là hệ thống truyền hình số mặt đất lý tưởng cho truyền hình có
độ phân giải cao HDTV (High Defination Televition).
Với chuẩn nén MPEG 2, một kênh số mặt đất sẽ chỉ truyền được 1
chương trình HD.
Với chuẩn nén MPEG 4/H.264, một kênh số mặt đất sẽ có thể
truyền được 2 đến 3 chương trình HDTV, tuỳ theo cấu hình lựa chọn.
Với MPEG 4/H.264, một chương trình HDTV có thể nén được xuống từ 8
đến 10Mbps, các chương trình nhiều chuyển động có thể đạt tới 16Mbps. Để
đảm bảo chất lượng hình ảnh, các thông số kênh truyền cho sóng mặt đất thường
được lựa chọn là: 64-QAM/mode 8K, tỷ lệ mã trong: 2/3, khoảng bảo vệ 1/8, khi
đó dung lượng kênh là: 22.12Mbps có thể truyền được 2 kênh HDTV.
3.3.Phát HDTV qua mạng cáp
3.3.1. Phát HDTV qua chuẩn DVB-C
So với kênh vệ tinh thỡ cỏc kờnh cỏp hầu như tuyến tính hơn và có tỷ số
S/N cao, nhưng băng tần bị hạn chế (7 đến 8 MHZ cho mỗi kênh) và có thể bị
ảnh hưởng bởi nhiễu và sự dội lại của tín hiệu (echo). Do đó để tăng hiệu quả
phổ trong DVB-C cần điều chế ở mức cao16-32-64QAM nhưng không sử dụng
mã vòng xoắn Viterbi, do đó tốc độ vào khoảng 38Mbps.

66

Video Subsystem
Video

Service Multiplex and Transport

Video
Source Coding
and Compression

Transport

RF / Transmission System

Channel
Coding

Audio Subsystem
Audio

Audio
Source Coding
and Compression

Service
Multiplex

Ancillary Data

Modulation

RF Physical
Interface

Control Data
To Cable
Channel

Hình 3.20: Sơ đồ khối hệ thống phát truyền hình số qua mạng
cáp
 Video: Tín hiệu Video.
 Audio: Tín hiệu Audio.
 Subsystem Video: hệ thống xử lý tín hiệu Video.
 Subsystem Audio: hệ thống xử lý tín hiệu Audio.
 Video source coding and compressed: Khối mó hoỏ nguồn và nén tín hiệu
Video.
 Audio source coding and compressed: Khối mó hoỏ nguồn và nén tín hiệu
Audio.
 Ancillary data: Dữ liệu phụ.
 Control data: Dữ liệu điều khiển.
 Service Multiplexing and Transport : Khối ghộp kờnh dịch vụ và truyền
tải.
 RF/Transmission System : Hệ thống Phát tín hiệu RF.
 Channel coding : mã hoỏ kờnh truyền.
 Modulation : Điều chế.
 RF physical Interface: ghộp kờnh vật lý
 Cable Channel: cáp dẫn

67
Tín hiệu Video và Audio cũng được đưa qua các khối xử lý số hoỏ, nộn, ghộp
kờnh dịch vụ, định dạng dòng truyền tải, mó hoỏ kờnh truyền chống lỗi và biến
đổi thành tín hiệu RF, khuyếch đại và đưa tới giao diện ghộp kờnh vật lý với
kờnh cỏp.
Cũng giống như trong hệ thống truyền hình số qua vệ tinh, tín hiệu Video được
số hoá và nén thành dòng truyền tải MPEG-2, dòng truyền tải MPEG-2 gồm cỏc
gúi dữ liệu chứa 188 Bytes, trong đó có một Byte đồng bộ, ba Bytes đầu chứa
các thông tin về dịch vụ, thông tin điều khiển và ngẫu nhiên hoá, tiếp theo là 184
Bytes dữ liệu.
1.2.1/ Cấu trúc khung Dòng truyền tải:
Sync
1 Byte

187 Bytes

Hình 3.21a: Gói dòng truyền tải MPEG-2

SYNC1

R
187 Bytes

SYNC2

R
187 Bytes

SYNC8

R
187 Bytes

SYNC1

R
187 Bytes

Hình 3.21b: Các gói dòng truyền tải: Các Bytes đồng bộ và Bytes dữ liệu được ngẫu
nhiên hoá R.
SYNC1
OR
SYNCn

203 Bytes

SYNC1
OR
SYNCn

203 Bytes

SYNC1
OR
SYNCn

Hình 3.21c: Các khung dữ liệu đã được Interleaved ; Độ sâu Interleaving
I=12 Bytes

Hình 3.21: Cấu trúc khung dòng truyền tải
SYNC1 : Byte đồng bộ không bị ngẫu nhiên hoàn toàn.
SYNCn : Byte đồng bộ không bị ngẫu nhiên hoá, trong đó n= 2..8.
1.2.2/ Mó hoỏ kờnh truyền .
Tín hiệu video sau khi được biến đổi sang dạng số được mó hoỏ bằng mã sơ cấp.
Tín hiệu mã này chưa thể truyền được trong một khoảng cách xa, việc sử dụng

kênh truyền sẽ khắc phục được những nhược điểm của mã sơ cấp, đó là:
- Hạn chế thành phần một chiều và thành phần tần số thấp để có thể đấu
nối tín hiệu từ mạch này sang mạch khác bằng biến áp hoặc qua tụ.
- Thuận lợi cho việc tái tạo lại xung nhịp ở đầu thu.
- Phát hiện sai nhầm.
Cỏc mã đường truyền thường được sử dụng như: AMI, Manchester, HDB3...

68
Để đạt được khả năng chống lỗi cao cho đường truyền dữ liệu số bằng cáp,
người ta sử dụng mã chống lỗi (FEC) là mã Reed-Solomon. Hệ thống truyền
hình số qua Cỏp khụng sử dụng bộ mó hoỏ Convolution Code, để tránh lỗi cụm
người ta sử dụng Kỹ thuật Interleaving Byte dữ liệu. Người ta sử dụng bộ mó
hoỏ Visai thay cho bộ mó hoỏ Convolution Code.
1.2.3. Ngẫu nhiên hoá trải phổ dữ liệu.
Dòng dữ liệu đầu vào sẽ được sắp xếp lại thành cỏc gúi dữ liệu có độ dài cố
định, tiếp theo là quá trình ghộp kờnh dũng truyền tải MPEG-2. Tổng độ dài gói
của một gúi dũng truyền tải MPEG-2 đã được ghộp kờnh là 188 Bytes, kể cả
một Byte đồng bộ. Quá trình xử lý của bộ mó hoỏ trong hệ thống phỏt luụn bắt
đầu từ Bit có nghĩa nhất của từ mã đồng bộ.
Đa thức sinh chuỗi giả ngẫu nhiên PRBS: 1+ X14+ X15.
Quá trình ngẫu nhiên hoá sẽ vẫn được tiếp tục ngay cả khi đầu vào không có
dòng dữ liệu, hay dữ liệu không tương thích với dòng MPEG-2. Mục đích nhằm
tránh tình trạng tạo ra các sóng mang không được điều chế từ bộ điều chế.
 Mó hoá Reed - Solomon
Tiếp sau quá trình ngẫu nhiên hoá dữ liệu là quá trình mó hoỏ sửa lỗi dựa trên
kiểu mó hoỏ RS cho từng gúi dũng truyền tải MPEG-2 đã bị ngẫu nhiên hoá, với
T=8, điều đó có nghĩa là có thể sửa được 8 Bytes lỗi trong một gúi dũng truyền
tải. Quá trình này được thực hiện bằng cách thêm 16 Bytes Parity vào một gúi
dũng truyền tải để tạo ra một từ mã (204,188).
Chú ý : Quá trình mó hoỏ được thực hiện đối với cả byte đồng bộ không chuyển
đổi hay chuyển đổi.
Đa thức sinh mã : g(x) = (x+0)(x+1)(x+2)...(x+15)., trong đó  =02HEX.
Đa thức sinh trường ( Field Generator Polynomial) : p(x) = x8+x4 +x3 + x2+ 1.
Mó hoá RS ngắn được thực hiện bằng cách thêm vào 51 Bytes "rỗng" trước các
Bytes thông tin tại đầu vào bộ mó hoỏ (255, 239), Sau quá trình mó hoỏ cỏc
Bytes này sẽ bị loại bỏ.
 Quá trình Interleaving Convolution
Khung dữ liệu đã được Interleaved sẽ chứa cả cỏc gúi dữ liệu lặp đã được mó
hoỏ chống lỗi, cỏc gúi này được phân định bằng các Bytes đồng bộ dòng
MPEG-2.
Bộ Interleaver có thể chứa I=12 nhánh, được kết nối vòng với dũng bớt đầu vào
nhờ chuyển mạch đầu vào. Mỗi nhánh là một thanh ghi dịch FIFO ; gồm Mj
phần tử (Trong đó M=17 = N/I, N=204 = Độ dài khung đã được mó hoỏ chống
lỗi, I=12 = độ sâu Interleaver, j = Chỉ số thứ tự nhỏnh). Cỏc phần tử của một

69
thanh ghi dịch FIFO chứa một Byte, các chuyển mạch đầu vào ra sẽ được đồng
bộ.
Nhằm mục đích đồng bộ, Các Bytes đồng bộ và các Bytes đồng bộ đã bị đảo sẽ
được định tuyến qua nhánh "0" của bộ Interleaver (Tương ứng không trễ).
 Định vị Byte vào Symbol
Sau khi thực hiện Interleaving Convolutional, quá trình Định vị byte lờn cỏc
Symbol được thực hiện. Trong từng trường hợp, Bit có nghĩa nhất MSB của
Symbol Z sẽ được lấy từ MSB của byte V. Tương ứng như vậy , bit có nghĩa tiếp
theo của Symbol sẽ được lấy từ bit có nghĩa tiếp theo trong Byte. Trong trường
hợp kiểu điều chế 2m - QAM, quá trình này sẽ định vị k Bytes vào n Symbols,
như sau:
8k = n x m.
Ví dụ như đối với kiểu điều chế 64-QAM ( Trong đó m=6, k=3 và n=4)
Byte V
Từ đầu ra bộ
Interleaver
(Bytes)

b7 b6 b5 b4 b3 b2 b1 b0

Tới bộ mã hoá
Visai
(6-bit Symbols)

b5b4 b3 b2 b1 b0

Byte V+1

Byte V+2

b7 b6 b5 b4 b3 b2 b1 b0

b7 b6 b5 b4 b3 b2 b1 b0

b5b4 b3 b2 b1 b0

Symbol Z

Symbol Z+1

b5b4 b3 b2 b1 b0

b5b4 b3 b2 b1 b0

Symbol Z+2

Symbol Z+3

Hình 3.22: Định vị các Bytes lên các Symbols cho kiểu điều chế 64-QAM

Chú thích 1: b0 là bit ít nghĩa nhất (LSB) trong mỗi Byte.
Chú thích 2 : Trong quá trình chuyển đổi này , cỏc bớt của mỗi Byte có mặt
trong hai Symbol, Các Symbol được đánh dấu Z, Z+1....Cỏc Symbol Z sẽ được
phát đi trước các Symbol Z+1.
Hai bit có nghĩa nhất (MSB) của mỗi Symbol sẽ được mó hoỏ Visai để đạt được
trạng thái xoay pha một góc /2 trong đồ thị định vị điểm thông tin. Quá trình
mó hoỏ visai hai bít có nghĩa nhất (MSB) được cho trong phương trình Boolean
Hình dưới đây sẽ minh họa quá trình thực hiện chuyển đổi Byte dữ liệu.
8

From
convoluti
onal
Interleave
r

Byte to
m-Tupe
Conversio
n

Bk=bq

Ak=MS
B

q bits ( bq,...,b0)
1
Differential
encoding

Qk

Ik

Mapping

I

Q

2 For 16 QAM
q= 3 For 32 QAM
4 For 64 QAM

Hinh 3.23: Phối hợp định tuyến các Byte với mã hoá Visai hai bit MSB
trong điều chế QAM

70

3.3.2. Giới thiệu DVB-C2[4]
DVB-C là tiêu chuẩn Châu Âu xây dựng cho hệ thống phát tín hiệu truyền
hinh số quảng bá qua hệ thống mạng cáp. Hệ thống đó sử dụng tiêu chuẩn nén
MPEG 2 hoặc MPEG4, điều chế QAM và mó hoỏ kờnh.
DVB-C2 được phát triển từ năm 2008 là thế hệ tiêu chuẩn thứ hai cho
việc truyền tín hiệu qua mạng cáp. Mục đích ban đầu của DVB-C2 là phát triển
cho các dịch vụ mạng mới như HDTV, VOD và truyền IP tốc độ cao. DVB-C2
sử dụng các kỹ thuật mới trong điều chế và mó hoỏ kờnh làm tăng hiệu suất sử
dụng phổ lên hơn 30% và dung lượng đường truyền về (downstream) của mạng
HFC tăng hơn 60%.

Hình 3.24: So sánh điều chế sử dụng trong DVB-C và DVB-C2
Dưới đây là bảng so sách một số các đặc trưng khác nhau giữa DVB-C và
DVB-C2
Đặc tính

Giao diện
vào

DVB-C

DVB-C2

Dòng TS đơn
Single Transport
Stream (TS)

Sử dụng nhiều dòng TS và dòng đóng
gói chung (Generic Stream
Encapsulation GSE)
Multiple Transport Stream and Generic
Stream Encapsulation (GSE)

Phương thức Điều chế và mã hoá Điều chế và mã hoá thay đổi theo biến
mã hoá kênh cố định

71
và điều chế
Mã sửa sai
FEC

Reed Solomon (RS) LDPC + BCH

Chèn
Theo Bit
Interleaving

Theo thời gian và theo tần số

Điều chế

COFDM

Sóng mang QAM

Khoảng bảo
Không hỗ trợ
vệ

1/64 or 1/128

Các hệ
thống điều
16- to 256-QAM
16- to 4096-QAM
chế
Bảng 3.4: So sánh đặc trưng của DVB-C và DVB-C2
3.3.3. Kiến trúc hệ thống DVB-C2.
3.3.3.1.Tổng quan hệ thống.
Một hệ thống C2 có cấu trúc chung như hình 2.1. Trong mô hình OSI
DVB – C2 chỉ tác động đến lớp vật lý của quá trình truyền dữ liệu. Tín hiệu
đầu vào có thể một hoặc nhiều dòng truyển tải Mpeg2, các quá trình xử lý
tín hiệu trước đầu vào như nén tín hiệu không thuộc hệ thống C2. Đầu vào hệ
thống là một hoặc nhiều trùm dữ liệu logic. Sau đó tín hiệu đó sẽ đi qua một
các đường dẫn vật lý PLPs (Physical Layer Pipes ). Đầu ra hệ thống là đơn
tín hiệu và được phát trên một kênh RF.

Hình 3.25: Cấu trúc hệ thống DVB-C2
Dòng tín hiệu đầu vào sẽ được chứa trong một chu kỳ của một khung lớp
vật lý (C2 Frame), tổng số dung lượng đầu vào không được vượt quá dung
lượng khả dụng của một khung C2. Một hoặc nhiều đường dẫn vật lý PLP được
sắp xếp thành một nhóm và một hay nhiều nhúm đú sẽ tạo thành một Data Slice.
Một hệ thống C2 gồm một hay nhiều Data Slice.
Khi có nhiều dòng TS MPEG -2 (MPEG 4) được phát qua một nhóm ống
dẫn vật lý PLP quá trình chia dòng TS thành Dòng TSTP và TSPSC sẽ được

72
thực hiện trước khi đến khối xử lý tín hiệu đầu vào. Quỏ tỡnh xử lý đó là một
phần không thể thiếu của hệ thống DVB –C2
3.3.3.2 Cấu trúc hệ thống
Quá trình xử lý tín hiệu của hệ thống C2 được thể hiện trong hình 3.26a.
Gồm bốn công đoạn như sau: Tín hiệu vào được chia thành các phần song song
nhờ bộ (Input Processing) hình 3.26b. Sau đó thực hiện chốn bớt và mó nộn trờn
modul BICM( Bit Interleaved Coding and Modulation) như hình 3.26c. Tiếp
theo tín hiệu sẽ được xây dựng khung như hình 3.26d và cuối cùng đưa đến bộ
phát tín hiệu ghộp kờnh trực giao OFDM như hình 3.26e.

Hình 3.26a: Quá trình xử lý tín hiệu của hệ thống DVB-C2

73

Hình 3.26b: Cấu trúc xử lý tín hiệu đầu vào

Hình 3.26c: Chốn bít và mó nộn trờn modul

74

Hình 3.26d: Quá trình xõy dựng khung tín hiệu

Hình 3.26e:Bộ phát tín hiệu ghộp kờnh trực giao OFDM
3.3.3.2.1 Hệ thống xử lý tín hiệu đầu vào.
Hệ thống C2 chấp nhận một hay nhiều dòng dữ liệu logic đầu vào. Mỗi một
dòng dữ liệu được mang bởi một đường dẫn vật lý PLP. Các đường dẫn này hoạt
động độc lập và chuyển cỏc dũng dữ liệu thành các trường dữ liệu - là một phần
của khung BBFrame (Baseband Frame). Quá trình xử lý tín hiệu của mudul đầu
vào hệ thống C2 bao gồm : đồng bộ tín hiệu đầu vào, loại bỏ cỏc gúi rỗng, và
thực hiện mó hoỏ CR8. Sau đó dòng dữ liệu được phân thành các trường chèn
vào BBheader .
a. Các định dạng đầu vào.

75
PLP đầu vào hỗ trợ một trong các định dạng dữ liệu sau:
• Dòng TS.
• Dòng GES (Generic Encapsulated Stream )
• Dòng GCS (Generic Continuous Stream) (một dòng tín hiệu có kich thước gói
thay đổi và các bộ điều chế không quan tâm kích thước gói)
• Dòng GFPS (Generic Fixed-length Packetized Stream) dạng tín hiệu này
tương thích với hệ thống DVB –S2.
b.Giao diện đầu vào.
3.1.3. Đồng bộ tín hiệu
Quá trình xử lý dữ liệu trong các bộ điều chế DVB-C2 có thể tạo ra độ trễ
khác nhau. Hệ thống đồng bộ sẽ đảm bảo cố định tốc độ bit và đỗ trễ trong quá
trình truyền dữ liệu với bất kỳ định dạng dữ liều đầu vào nào.
DVB-C2 sử dụng một trường SSY field (Input Stream Synchronization)
có dung lượng hai hoặc ba byte mang khoá bộ đếm. Phía thu dựa vào thông tin
này để khôi phục lại tín hiệu.
c. Loại bỏ cỏc gúi rỗng.
Do trong hệ thống nén MPEG quy định tốc độ ra bộ xáo trộn phớa phỏt và
vào bộ xáo trộn lại phía thu là cố định và có độ trễ không đổi. Do đó để đảm bảo
quy định đú thỡ cần phải chèn thờm cỏc bớt vào khung dữ liệu. Cỏc gúi rỗng có
PID=8191 và DVB-C2 căn cứ thông tin này để loại bỏ cỏc gúi thừa.

Hình 3.27: Sơ đồ xoỏ gúi dư thừa
d. Mó hoỏ CRC-8
CRC-8 được áp dụng để dò lỗi trong gúi gúi tin UP (User Packet).
e.Baseband header (BBHeader).
Một BBHeader bao gồm cố định 10 byte và có hai dạng. Dạng thứ nhất áp
dụng cho chế độ bình thường NM (Normal Mode) và dạng thứ hai sử dụng trong
chế độ cao HEM (High Efficiency Mode).

76

Hình 3.28: Định dạng của BBHeader
f. Định dạng đầu ra modul xử lý tín hiệu đầu vào
Tín hiệu đầu ra có 4 định dạng :
- Định dạng cho chế độ Normal Mode, dòng dữ liệu vào dạng GFPS và TS.

Hình 3.29: Cấu trúc modul xử lý tín hiệu đầu vào
- Định dạng cho chế độ High Efficiency Mode, dòng dữ liệu vào dạng TS

Hình 3.30: Định dạng cho chế độ High Efficiency Mode
- Định dạng cho chế độ Normal Mode, dòng dữ liệu vào dạng GCS và GSE.

77

Hình 3.31: Định dạng cho chế độ Normail Mode
3.3.3.2.2. Các phương thức chốn dũng dữ liệu
Việc chèn dữ liệu cung cấp ba chức năng :

Hình 3.32: Cấu trúc BBFrame
a.Lập lịch trình (Scheduler )
Lập lịch trình sẽ quyết định việc xây dựng các Data Slice với nhau và trong
hệ thống C2 nó sẽ mang dữ liệu đi trong những đường truyền vật lý PLP
b.Chốn bit
Việc chốn thêm thực hiện trong các chi tiết khi dữ liệu người dùng sẵn
sàng cho việc truyền. Kết quả là khung BBFrame có độ dài bít Kbch cố định .
c. Xáo trộn dữ liệu
Để đảm bảo an toàn dữ liệu các khung BBF cần phải được ngẫu nhiên
hoá. DVB-C2 sử dụng mó hoỏ giả ngẫu nhiên PRBS(Pseudo Random Binary
Sequence) để xáo trộn dữ liệu bằng cách tạo ra máy phát với công thức sau :
1 + X14 + X15

78

Hình 3.33: Xáo trộn dữ liệu
3.3.3.3. Hệ thống phát OFDM

Hình 3.34: Cấu trúc hệ thống OFDM
Ghép phân chia theo tần số trực giao là một công nghệ trong lĩnh vực
truyền dẫn. Băng tần tổng của đường truyền được chia thành N kênh tần số
không chồng lấn nhau. Tín hiệu mỗi kênh được điều chế với một sóng mang phụ
riêng và N kênh được ghép phân chia theo tần số.
3.3.3.3.1. Điều chế IFFT – OFDM.
IFFT (Inverse Fast Fourier Transform) là quá trình chuyển đổi Fourier
ngược. Tín hiệu phát được xậy dựng thành các khung. Mỗi khung có chu kỳ là
TF và bao gồm LF Symbols. Mỗi một Symbol được cấu thành bởi một tập hợp
Ktotal sóng mang được phát với chu kỳ TS. Nó bao gồm hai phần : Phần chu kỳ
hữu dụng TU và khoảng bảo vệ với chu kỳ Δ. Khoảng bảo vệ bao gồm một phần
và đứng trước của chu kỳ TU. Sự kết hợp giữa khoảng bảo vệ và FTT được thể
hiện trong bảng “cỏc thông số OFDM “sau :

79

Bảng 3.5: Các thông số OFDM
Các Symbol trong khung C2 là từ 0 đến L F-1. Tất cả các symbol đều chứa
dữ liệu và thông tin liên quan. Vì tín hiệu OFDM bao gồm các sóng mang được
điều chế độc lập, mỗi symbol có thể lần lượt được chia vào các cell tương ứng
với điều chế được mang trên một sóng mang trong suốt một symbol.
Các sóng mang được được xác đinh bằng khoảng k Є [ Kmin ; Kmax ].
Khoảng cách giữa hai sóng mang liên kề là 1/TU và khoảng cách giữa hai song
mang Kmin và Kmax là Ktotal/TU.
Tín hiệu phát được miêu tả trong biểu thức sau :

Trong đó : Trong đó :

Với
- k : Số lượng sóng mang.
- l : Số lượng symbol OFDM bắt đầu từ 0 tới Preamble Symbol frame của
khung
- m : Số khung C2.
- Ktotal : Là số lượng sóng mang được phát. Ktotal = Kmin - Kmax
- LF : Là tổng số symbol OFDM trong một khung.
- TS : Tổng số chu kỳ của tất symbol, và TS = TU + Δ;
- TU : Là các kỳ của symbol có ích đưwcj định nghĩa ở bản trên.
- Δ : Chu kỳ của khoảng bảo vệ.

80
- Cm,l,k : là giá trị điều chế phức hợp cho sóng mang k của symbol OFDM thứ l
trong khung C2 thứ m.
- TF là chu kỳ của khung, TF = LF . TS.
- Kmin là chỉ số của sóng mang có tần số thấp nhất.
- KMax là chỉ số của sóng mang có tần số cao nhất.
Mối liên quan giữa chu kỳ và băng thông của như sau :

3.3.3.3.2. Đặc tớnh cấu trúc
Các symbol OFDM được cấu thành bởi hai sóng mang giống nhau kề
nhau. Biên độ và pha của các sóng mang Data Cell thay đổi theo sự sắp xếp đã
được miêu tả trước.
Mật độ phổ công suất Pk(f) của sóng mang tại tần số :
fk = k/TU (với Kmin < k < Kmax ).
Được định nghĩa theo biểu thức sau :

Toàn bộ mật độ công suất phổ của các sóng mang Cell Data đã được điều chế là
tổng các mật độ công suất của tất cả các sóng mang. Một phổ tín hiệu phát DVB
theo lý thuyết có dạng như hình sau :

Hình 3.35: Phổ tín hiệu phát DVB-C2
Phổ tín hiệu biểu diễn bằng đường cong màu xanh dương có độ rộng 7.61 MHz
Phổ tín hiệu biểu diễn bằng đường cong màu xanh dương có độ rộng 7.61
MHz. Đường cong màu đỏ là minh hoạ viền tần số thấp của tín hiệu phổ rộng
tần số 455 MHz. Bởi vì chu kỳ Symbol OFDM rộng hơn khoảng chống sóng
mang biển đổi nguợc. Do vậy mật độ phổ không là hằng số trong một băng
thông danh định.

81
Kết luận:
Một kênh truyền hình trên mạng cỏp cú độ rộng băng thông là 8MHz. Hệ
số roll off là 0.15, phương thức điều chế 64QAM, dung lượng tối đa một kênh
số sẽ là 38Mbps. So với kênh vệ tinh thỡ cỏc kờnh cỏp hầu như tuyến tính hơn
và có tỷ số S/N cao, nhưng băng tần bị hạn chế (7 đến 8 MHZ cho mỗi kênh) và
có thể bị ảnh hưởng bởi nhiễu và sự dội lại của tín hiệu (echo). Do đó để tăng
hiệu quả phổ trong DVB-C cần điều chế ở mức cao16-32-64QAM nhưng không
sử dụng mã vòng xoắn Viterbi, do đó tốc độ vào khoảng 38Mbps.
3.4.Phát HDTV qua IP
Hiện nay DVB mới chỉ hỗ trợ phát HDTV qua IP với chuẩn nén MPEG 2.
Bản thân MPEG 4 cũng định nghĩa phương thức đóng gói dữ liệu MPEG 4 lờn
dũng truyền tải IP (đuợc xem như MPEG 4/part 8), tuy nhiên hiện nay mới dùng
để truyền SDTV và các dịch vụ khác.
Hình sau đây mô tả quá trình xử lý từ phớa phỏt đến phía thu có sử dụng
mã sửa lỗi FEC cho HDTV.
HDTV
MPEG2
Transport

Consumer

Hình 3.36: Qua trình thu phát phát HDTV qua IP
Theo chuẩn DVB-IP, cỏc gúi TS của MPEG 2 được đóng gói vào cỏc gúi
dữ liệu IP. Một gói dữ liệu IP sẽ bao gồm IP header, UDP header (User datagram
Protocol), RTP header (Real Time Protocol) và tải chứa nội dung gói TS MPEG
2.

82

Một gói IP chứa tối đa 7 payload của gói TS MPEG 2.
Hình 3.37: Cấu trúc gói dữ liệu IP
Truyền HDTV qua IP có sử dụng mã sửa sai Reed Solomon RFC 2733.

83

CHƯƠNG 4: MỘT SỐ KẾT QUẢ MÔ PHỎNG
4.1.Mô hình mô phỏng
Để hiểu hơn những vấn đề lý thuyết được trình bày trong những chương
trước. Trong chương này, chúng ta giới thiệu chương trình mô phỏng hệ thống
HDTV với các chế độ điều chế, tỷ lệ mã sửa sai, khoảng bảo vệ khác nhau.
Việc mô phỏng hệ thống được sử dụng chương trình mô phỏng MATLAB
để thực hiện mô phỏng việc phát sóng HDTV với các chuẩn DVB-T,DVB-T2,
DVB-C2. Những mô hình cơ bản này được lấy từ Demo-Blocksets- Application
Specific Examples, MATLAB & SIMULINK R2009a và được chỉnh sửa và cải
tiến để phù hợp với yêu cầu.
4.1.1.Mô hình hệ thống DVB-T
Mô hình DVB-T, mode 2k được mô tả như hình 4.1 .

Hình 4.1: Mô hình DVB-T, mode 2k
Mô hình bao gồm các khối chức năng độc lập, mỗi khối được biểu diễn
bởi một hàm m-file.
AWGN Channel.

Hình 4.2: Khối cộng nhiễu Gauss trắng
Tín hiệu lối vào và tín hiệu lối ra có thể là số thực hoặc số phức. Nếu

84
tín hiệu vào là thực thì khối này sẽ cộng nhiễu Gauss thực và tạo ra một tín
hiệu thực ở lối ra. Khi tín hiệu lối vào là phức, khối này cộng tín hiệu
Gauss phức và tạo ra một lối ra tín hiệu phức.
Khi sử dụng sự thay đổi mode với lối vào phức, giá trị thay đổi ngang
bằng thành phần thực chia cho thành phần ảo của tín hiệu lối vào.
Thông số có thể thay đổi được là Initial seed, Mode, Eb/No (dB),
Number of bits per symbol, Input signal power (watts), Symbol period (s).
Có thể xác định sự khác nhau của bộ tạo nhiễu bởi kênh AWGN tỷ số
tín hiệu trên tạp Eb/N0 và Eb/N0 với tín hiệu lần lượt là bít và là symbol, hay tỷ
lệ tớn trên tạp SNR.
DVB-T sử dụng các khối mó hoỏ sửa sai RS(204,188) kết hợp với khối
mó hoỏ trong Punctured Convolutional Code ( R), trong đó các giá trị tỉ lệ mã R
được sử dụng để mô phỏng là 1/2, 2/3, 3/4.
Nrs
N=

Nrs

Convolution
Encoder

2Nrs

Puncture
Function

Rcc

Hình 4.3: Bộ mó hoỏ Convolutional Code
Khối Mapper của DVB-T sử dụng các điều chế cơ sở QPSK 2K, 16QAM, 64-QAM. Khối OFDM dùng để mô phỏng ở chế độ 2k, kích thước IFFT
2048 và 1512 sóng mang có dữ liệu có ích.
4.1.2.Mô hình hệ thống DVB-T2

85

Hình 4.4 :Sơ đồ mô hình hệ thống DVB-T2 mode 32k
Ngoài các khối cơ bản như trong DVB-T thì DVB-T2 cú thờm cỏc khối
BBFRAME, BCH Encoder, LDPC Encoder.
Mã LDPC là một mã khối, tức là một khối dữ liệu được mã hoá thành một
từ mã. Mã LDPC được xác định bằng một ma trận kiểm tra chẵn lẻ thưa mật độ
thấp. LDPC trong DVB-T2 có 2 loại chiều dài từ mã : 64800 bit và 16200 bit.
4.1.3.Mô hình hệ thống DVB-S2
Sơ đồ mô hình mô phỏng hệ thống DVB-S2 như hình vẽ 4.5

Hình 4.5: Mô hình DVB-S2

86
4.2.Đánh giá một số kết quả mô phỏng
4.2.1.Hệ HDTV sử dụng chuẩn DVB-T

Hình 4.6: Hệ HDTV sử dụng chuẩn DVB-T
4.2.2.Hệ thống DVB-S2

87
Hình 4.7 : So sánh sự phụ thuộc của BER vào Eb/No trong kênh Gaussian
sau bộ sửa lỗi LDPC sử dụng QPSK và 8QPSK

4.2.3.Hệ thống DVB-T2

Hình 4.8 : Sự phụ thuộc của BER vào Eb/No trong kênh Gaussian sau bộ
sửa lỗi Viterbi sử dụng 4 QAM
Hệ mô phỏng cũng đã chạy với các tỷ lệ mã hoá R=2/3, ắ tương ứng với
điều chế 16 QAM, 64 QAM. Kết quả thể hiện khi so sánh hiệu suất giữa các sơ
đồ điều chế với cùng một tỉ lệ mã sửa sai ta thấy rằng QPSK tốt hơn so với
16QAM.

88

CHƯƠNG 5: ỨNG DỤNG TRIỂN KHAI HDTV TẠI
VIỆT NAM
Truyền hình Việt Nam đã lựa chọn hệ thống tiêu chuẩn DVB cho truyền
hình số tại Việt Nam. Hiện nay có 3 đơn vị phát sóng truyền hình số mặt đất:
Công ty VTC: được phép phát sóng qua vệ tinh theo chuẩn DVB-T,
nén MPEG2, MPEG4
Đài PTTH Bình Dương: phát truyền hình số mặt đất chuẩn DVB-T
khu vực Bình Dương và lân cận
Đài TH TP Hồ Chí Minh: phát thử nghiệm tại khu vực thành phố
với 2 đơn vị phát qua cáp (DVB-C) là HTVC, SCTV
Tuy phát nhiều kênh HD nhưng thực tế mỗi đơn vị chỉ có 1 vài kờnh phỏt
FullHD (kênh được thu bằng camera HD, dựng hình, làm hậu kỳ bằng thiết bị
HD, lưu trữ trên phương tiện hoặc được thu tín hiệu HDTV từ vệ tinh và phát
sóng theo tiêu chuẩn HDTV) còn lại đa phần là sử dụng kênh SDTV sau đó
dùng phần mềm hoặc thiết bị phần cứng có tính năng convert để nâng cấp chất
lượng chuyển đổi sang HDTV. Tại sao phải phỏt kờnh HDTV chuyển đổi vì chi
phí sản xuất chương trình HDTV thật tốn kém hơn rất nhiều so với SDTV, phải
thay thế hết các thiết bị hiện có camere, dựng hình, hậu kỳ, lưu trữ... sang chuẩn
HD) hoặc phải mua bản quyền chương trình HDTV giá thật cao hơn rất nhiều.
Với việc phát HDTV thì việc thu phát và các chuẩn được tuân thủ theo
chuẩn HDTV đã giới thiệu trong các phần trên.

89
Với việc chuyển đổi kênh từ SDTV sang HDTV thì phải sử dụng một số
kỹ thuật để tăng độ phân giải, nâng cao chất lượng hình ảnh như: kỹ thuật deinterlacing, upconvesion.
Chuyển đổi khuụn hỡnh
Video
Transmissi
on
Format

Chế độ hiển thị 16 x
9
Full

16

Phóng
to

Nén
hình

dãn
hình

Chế độ hiển thị 4 x
3
Full

Phóng
to

(b)

(c)

Nén hình

Co
hình

9
(a)

(d)

(j)

4

3
(e)

(f)

(g)

(i)

(h)

Hình 5.1a: Mô tả chuyển đổi khuôn hình
Việc chuyển đổi dịnh dạng chính là việc cho phép khuụn hỡnh được xuất
hiện với tỷ lệ nào. Đối với các màn hình LCD thu tín hiệu HD thỡ cú hỗ trợ các
giải pháp chuyển đổi khuụn hỡnh từ SD sang tiêu chuẩn HD.
- Chuyển đổi sang HD vẫn giữ nguyên hình ảnh trong SD và như vậy hai
bên màn hình sẽ có hai dải sọc màu đen. Giải sọc này có thể được tận dụng để
chốn cỏc dũng quảng cáo.

Kộo dãn hình ảnh lấp đầy khuụn hỡnh 16:9. Giải pháp này sẽ làm méo hình ảnh.

90

- Phóng to hình ảnh : giải pháp này sẽ lấp đầy hình ảnh trờn khuụn hỡnh
HD tuy nhiên một số hình ảnh ở rìa trong SD sẽ bị mất cảnh.

Hình 5.1 b,c,d: Màn hình tivi khi chuyển đổi khuôn hình SD sang HD
5.2.1.Kỹ thuật De-interlacing [6]
Là một kĩ thuật quan trọng sử dụng trong miền không gian để tăng số
dũng quột trong một mành quét.

Hình 5.2: Minh họa quá trình De-Interlacing
Để tăng số điểm ảnh người ta sử dụng thuật toán nội suy các điểm ảnh mới
bằng các điểm ảnh đó cú.

91

Hình 5.3: Nội suy các điểm ảnh mới
Điểm ảnh được nội suy sẽ là sự tổng hợp các điểm ảnh lân cận của các
trường ảnh (field) kế tiếp nhau. Có thể mô tả băng thuật toán như sau:
Định nghĩa: Chuỗi tín hiệu video số được quét liên tục là một mảng dữ
liệu 3 chiều bao gồm trục ngang, dọc và trục thời gian. Ta coi là hàm Fp [x; y;
n] với x : trục ngang, y: trục đứng và n là số trường. Một điểm ảnh sẽ được biểu
diễn bằng công thức sau:

Thuật toán cho thấy chỉ có những dòng chẵn được quét trong các mành
chẵn và cỏc dũng lẻ được quét trong cỏc dũng lẻ. Để tìm gia phần thiếu cảu các
trường ảnh người ta áp dung công thức :

là điểm ảnh còn thiếu trong một trường ảnh ( chẵn, hoặc lẻ)
mà cần phải tìm.
Có hai phương pháp cơ bản được áp dụng để tìm ra phản phù còn
thiếu là kĩ thuật interframe và Intraframe
- Interframe hay Lọc không gian: là kỹ thuật khôi phục lai chế độ
quột liờn ục bằng phương pháp nội suy điểm ảnh trong từ các điểm ảnh trong
một khung.Cụng thức dưới đây biểu diễn chế kỹ thuật Interframe :

92

Hình ảnh biểu diễn kỹ thuõt Interframe

Hoặc có thể nội suy điểm ảnh từ 2 điểm ảnh kế cận

Hình ảnh biểu diễn

- Intraframe là kỹ thuật lọc trong miền thời gian cho phép nội suy
điểm ảnh từ nhiều các trường liên tiếp.

93

Hình ảnh biểu diễn :

Như vậy với các giải pháp này cho phép khôi phục lai số dũng quột trong
một trường ảnh và như vậy hình ảnh sẽ được quét với chế độ liên tục. Đồng thời
cho phép tăng số dũng quột trong một khung ảnh.
5.2.2.Kỹ thuật upconvesion [6]
Đây là kỹ thuật cho phép nội suy khung ảnh và loại bỏ một số hiệu
ứng xấu để tăng chất lượng hình ảnh. Hinh dưới đây biểu diễn kỹ thuật
upconversion

Hình 5.4: Kỹ thuật upconversion

94
Để đảm bảo chất lượng hinh ảnh khi tăng tốc độ truyền khung, loại bỏ
hiện tượng ảnh nhấp nháy và nhòe ảnh người ta áp dụng kỹ thuật liên khung và
bù chuyển động. Dưới đây là hình ảnh biểu diễn kỹ thuật liên khung bù chuyển
động.

a,

b,

c,

95
Hình 5.5: Kỹ thuật liên khung bù chuyển động
Kết quả của kỹ thuật này cho phép thu được hình ảnh sắc nét

KẾT LUẬN:
Cùng với sự phát triển của khoa học và công nghệ, việc phát triển truyền
hình số, HDTV đã trở thành một đích đến cho truyền hình của nhiều quốc gia
trên thế giới nhờ vào bước đột phá trong kỹ thuật nén file. Khi phát HD, nếu nén
MPEG2 thì rất tốn kênh tần số, nhưng khi phát MPE 4 thì các đài nhờ công nghệ
này mà có thể phát tín hiệu cả mặt đất, lẫn cáp hay IP và vệ tinh cực kỳ thuận
lợi. Các nước tiên tiến đang đẩy mạnh việc quảng bá và triển khai dịch vụ truyền
hình có độ phõn giải cao HDTV. Hiện tại thế giới vẫn chưa thống nhất một tiêu
chuẩn HDTV chung nhất. Các tổ chức truyền hình đành cố đạt vài thông số
chung cho HDTV theo cả hai loại tần số mành là 30Hz và 25Hz.
Tại Việt Nam tuy dịch vụ HDTV đã được đưa vào nghiên cứu và triển
khai thử nghiệm phát sóng. Trên thực tế, nhiều người dùng Việt Nam vẫn chưa
được thưởng thức trọn vẹn công nghệ HD mặc dù đã có đầu HD-DVD và màn
hình HD. Vì để tạo ra một sản phẩm đạt chuẩn Full HD 1080, tất cả thiết bị từ
máy quay phim, hệ thống biên tập, lưu trữ, truyền, phát, dẫn thu hình, phát hình
đều phải đạt chuẩn Full HD 1080. Hiện tại mỗi đơn vị phát sóng, truyền dẫn
theo cách khác nhau: DVB-T, DVB-S, DVB-C. Và việc áp dụng phát theo chuẩn
DVB-T2, DVB-S2, DVB-C2 sử dụng kỹ thuật nén tiên tiến MPEG-4/AVC là tất
yếu của việc phát triển khi mà DVB-T2 có dung lưọng kênh truyền tăng lên đến
50% và độ tin cậy cũng như chất lượng dịch vụ được cải thiện rừ rệt; DVB-S2
sử dụng một số kỹ thuật như sự kết hợp mã sửa sai HCB/LDPC, kỹ thuật quay
chòm sao, mở rộng chế độ FFT và sơ đồ điều chế QAM; DVB-C2 sử dụng các
kỹ thuật mới trong điều chế và mó hoỏ kờnh làm tăng hiệu suất sử dụng phổ lên
hơn 30% và dung lượng đường truyền về của mạng HFC tăng hơn 60%.
Truyền hình số HDTV là một lĩnh vực đầy hấp dẫn. Tuy nhiên do tớnh
chất luôn mới, phức tạp, đa dạng và tớnh mở của công nghệ đặc biệt là lĩnh vực
phát thanh truyền hình trên thế giới nên chắc chắc sẽ cũn cho chúng ta nhiều
khám phá và công nghệ mới mẻ.
Mặc dù có nhiều cố gắng nhưng do nghiên cứu về một công nghệ mới và
thời gian cũng như trình độ của người viết cũn hạn chế nên không tránh khỏi
thiếu sót. Tác giả mong được sự tham gia đóng góp ý kiến của các thầy cô và
các bạn để bản luận văn được hoàn thiện hơn.
Thay lời kết, tôi xin chõn thành cảm ơn TS Ngô Thái Trị là cán bộ hướng
dẫn trực tiếp, người đã truyền đạt cho tôi những kiến thức cơ bản cùng sự góp ý

96
nhiệt tình của bạn bè, thầy cô và các đồng nghiệp đã giúp tôi hoàn thành luận
văn này.
TÀI LIỆU THAM KHẢO
Tiếng Việt
[1]Đỗ Cụng Hựng, Đinh Thế Cường, Nguyễn Quốc Bình (2006),
Đỗ Công
Hùng, Đinh Thế Cường, Nguyễn Quốc Bình (2006), “Nõng cao chất lượng hệ
thống OFDM bằng BICM-ID”, Tạp chí “ Bưu chính Viễn thông và Công nghệ
thông tin”.
[2]Ngô Thái Trị (2001), Ngô Thái Trị (2001), “Truyền hình số”, Nhà xuất bản
khoa học kỹ thuật.
Tiếng Anh
[3] Charles Poynton (2003),“Digital video and HDTV Algorithms and
Interfaces”, Copyright 2003 by Elsevier Science (USA), Printed in United
States of America
[4] European Broadcasting Union (April 2009),“Digital Video Broadcasting
(DVB); Frame structure channel coding and modulation for a second
generation digital transmission system”, CH-1218 GRAND SACONNEX
(Geneva),Switzerland
[5] Jim Krause, MA (2006), "HDTV- High Definition Television", Indiana
University Department of Telecommunications 1229 East 7th Street,
Bloomington
[6] K.F.Ibrahim (2007), “Newnes Guide to Television and Video
Technology”, Copyright 2007 Elsevier Ltd, Linacre House, Jordan Hill, Oxford
OX2 8DP, UK