You are on page 1of 67

Mở đầu

Sự phát triển của mạng Internet toàn cầu nói riêng và công nghệ thông
tin nói chung đã đem lại tiến bộ và phát triển vượt bậc của khoa học kĩ thuật.
Internet không những đã rút ngắn khoảng cách về không gian, thời gian mà
còn mạng lại cho mọi người, mọi quốc gia và cả thế giới những lợi ích to lớn.
Tốc độ phát triển nhanh chóng của công nghệ thông tin là một trong những lợi
ích to lớn, có vai trò quan trọng và tầm ảnh hưởng rộng khắp.
Với sự phát triển nhanh chóng của mạng Internet băng rộng còn làm
thay đổi cả về nội dung và kĩ thuật truyền hình. Hiện nay truyền hình có nhiều
dạng khác nhau: truyền hình số, truyền hình vệ tinh, truyền hình cáp, truyền
hình Internet và IPTV. IPTV đang là cấp độ cao nhất và là công nghệ truyền
hình của tương lai. Sự vượt trội trong kĩ thuật truyền hình của IPTV là tính
năng tương tác giữa hệ thồng với người xem, cho phép người xem chủ động
về thời gian và khả năng triển khai nhiều dịch vụ giá trị gia tăng tiện ích khác
trên hệ thồng nhằm đáp ứng nhu cầu của người sử dụng.
Hiện nay trên thế giới đã có một số quốc gia triển khai thành công IPTV.
Theo các chuyên gia dự báo thì tốc độ phát triển thuê bao IPTV sẽ tăng theo
cấp số nhân theo từng năm. Ở Việt Nam hiện nay, một số nhà cung cấp đang
thử nghiệm dịch vụ IPTV trên mạng băng rộng ADSL.
CHƯƠNG 1 TỔNG QUAN VỀ IPTV

1.1 Giới thiệu về truyền hình số theo giao thức IP:


IPTV là tên viết tắt của cụm từ Internet Protocol Television _ truyền hình
qua giao thức Internet.
ITPV theo định nghĩa chính thức như sau: IPTV được định nghĩa là các
dịch vụ đa phương tiện như truyền hình ảnh, tiến nói, văn bản, dữ liệu được
phân phối qua các mạng dựa trên IP mà được quan lý để cung cấp các cấp
chất lượng dịch vụ, bảo mật, tính tương tác, tính tin cậy theo yêu cầu. (theo
ITU – T FG IPTV)
Như vậy IPTV đóng vai trò phân phối các dữ liệu, kể cả hình ảnh, âm
thanh, văn bản qua mạng sử dụng giao thức Internet. Điều này nhấn mạnh
vào việc Internet không đóng vai trò chính trong việc truyền tải thông tin truyền
hình hay bất kì loại nội dung truyền hình nào khác. Thay vào đó, IPTV sử
dụng IP là cơ chế phân phối mà theo đó có thể sử dụng Internet, đại diện cho
mạng công cộng dựa trên IP, hay có thể sử dụng mạng riêng dựa trên IP.
Có thể thấy, IPTV là một dịch vụ số mà có khả năng cung cấp những
tính năng vượt trội hơn khả năng của bất kì cơ chế phân phối truyền hình nào
khác. Ví dụ, set – top box IPTV có thể thông qua phần mềm để cho phép xem
đồng thời 4 chương trình truyền hình trên màn hiển thị, hay có thể nhận tin
nhắn sms, e – mail….
Tiềm năng của IPTV là rất lớn. Dự đoán rằng, năm 2008 sẽ có khoảng
20 triệu gia đình sử dụng dịch vụ IPTV. Nếu chúng ta trả phí 50$ mỗi tháng
cho dịch vụ IPTV, để cả một set – top box, thì ngân sách sẽ thu về khoảng 12
tỉ $ một năm trong vài năm.

1.2 Một số đặc tính IPTV:

- Hỗ trợ truyền hình tương tác: Khả năng hai chiều của hệ thống
IPTV cho phép nhà cung cấp dịch vụ phân phối toàn bộ các ứng dụng TV
tương tác. Các loại dịch vụ được truyền tải thông qua một dịch vụ IPTV có thể
bao gồm TV trực tiếp chuẩn, TV chất lượng cao (HDTV), trò chơi tương tác,
và khả năng duyệt Internet tốc độ cao.

2
- Sự dịch thời gian: IPTV kết hợp với một máy ghi video kĩ thuật số
cho phép dịch thời gian nội dung chương trình – một cơ chế cho việc ghi và
lưu trữ nội dung IPTV để xem sau.
- Cá nhân hóa: Một thệ thống IPTV từ kết cuối đến kết cuối hỗ trợ
truyền thông tin hai chiều và cho phép người dùng ở kết cuối cá nhân hóa
những thói quen xem TV của họ bằng cách cho phép họ quyết định những gì
họ muốn xem và khi nào họ muốn xem.
- Yêu cầu về băng thông thấp: Thay vì phân phối trên mọi kênh để
tới mọi người dùng, công nghệ IPTV cho phép nhà cung cấp dịch vụ chỉ
truyền trên một kênh mà người dùng yêu cầu. Đặc điểm hấp dẫn này cho
phép nhà điều hành mạng có thể tiết kiệm băng thông của mạng.
- Có thể truy xuất qua nhiều thiết bị: Việc xem nội dung IPTV bây
giờ không chỉ giới hạn ở việc sử dụng TV. Người dùng có thể sử dụng máy
PC hay thiết bị di động để truy xuất vào các dịch vụ IPTV.

1.3 Sự khác biệt giữa IPTV và truyền hình Internet:


Do đều được truyền trên mạng dựa trên giao thức IP, người ta đôi lúc hay
nhầm IPTV là truyền hình Internet. Tuy nhiên, 2 dịch vụ này có nhiều điểm khác
nhau:

• Các nền khác nhau:


Truyền hình Internet sử dụng mạng Internet công cộng để phân phát các nội
dung video tới người sử dụng cuối.
IPTV sử dụng mạng riêng bảo mật để truyền các nội dung video đến khách
hàng. Các mạng riêng này thường được tổ chức và vận hành bởi nhà cung cấp
dịch vụ IPTV.
• Về mặt địa lí
Các mạng do nhà cung cấp dịch vụ viễn thông sở hữu và điều khiển không cho
phép người sử dụng Internet truy cập. Các mạng này chỉ giới hạn trong các khu vực địa
lí cố định.
Trong khi, mạng Internet không có giới hạn về mặt địa lí, người dùng Interet nào
cũng có thể xem truyền hình Internet ở bất kì đâu trên thế giới.
• Quyền sở hữu hạ tầng mạng
Khi nội dung video được gửi qua mạng Internet công cộng, các gói sử
dụng giao thức Internet mạng nội dung video có thể bị trễ hoặc mất khi nó di

3
chuyển trong các mạng khác nhau tạo nên mạng Internet công cộng. Do đó, nhà
cung cấp các dịch vụ truyền nhình ảnh qua mạng Internet không đảm bảo chất
lượng truyền hình như với truyền hình mặt đất, truyền hình cáp hay truyền hình
vệ tinh. Thực tế là các nội dung video truyền qua mạng Internet khi hiển thị trên
màn hình TV có thể bị giật và chất lượng hình ảnh thấp.
Trong khi, IPTV chỉ được phân phối qua một hạ tầng mạng của nhà cung
cấp dịch vụ. Do đó người vận hành mạng có thể điều chỉnh để có thể cung cấp
hình ảnh với chất lượng cao.

• Cơ chế truy cập


Một set-top box số thường được sử dụng để truy cập và giải mã nôi j dung
viedeo được phân phát qua hệ thống IPTV , trong khi PC thương được sử dụng để
truy cập các dịch vụ Internet. Các loại phần mềm được sử dụng trong PC thường
phụ thuộc vào loại nội dung truyền hình Internet. Ví dụ như, để download các
chương trình TV từ trên mạng Internet, đôi khi cần phải cài đặt các phần mềm
media cần thiết để xem được nội dung đó. Hay hệ thống quản lí bản quyền cũng
cần để hỗ trợ cơ chế truy cập.

• Giá thành
Phần trăm nội dung chương trình được phân phát qua mạng Internet công
cộng tự do thay đổi. Điều này khiến các công ty truyền thông đưa ra các loại dịch
vụ dựa trên mức giá thành. Giá thành các loại dịch vụ IPTV cũng gần giống với
mức phí hàng tháng của truyền hình truyền thống. Các nhà phân tích mong rằng
truyền hình Internet và IPTV có thể hợp lại thành 1 loại hình dịch vụ giải trí.

1.4 Cơ sở hạ tầng một mạng IPTV

4
Hình 1.1 Sơ đồ khối đơn giản của một hệ thống IPTV

• Trung tâm dữ liệu IPTV:


Cũng được biết đến là “đầu cuối_headend”. Trung tâm dữ liệu IPTV
nhân nội dung từ nhiều nguồn khác nhau, bao gồm truyền hình địa phương,
các nhà tập hợp nội dung, nhà sàn xuất, qua đường cáp, trạm số mặt đất hay
vệ tinh. Ngay khi nhận được nội dung, một số các thành phần phần cứng khác
nhau từ thiết bị mã hóa và các máy chủ video tới bộ định tuyến IP và thiết bị
bảo mật giành riêng được sử dụng để chuẩn bị nội dung video cho việc phân
phối qua mạng dựa trên IP. Thêm vào đó, hệ thống quản lý thuê bao được
yêu cầu để quản lý và hồ sơ và phí thuê bao của những người sử dụng. Chú ý
rằng, địa điểm thực của trung tâm dữ liệu IPTV được yêu cầu bởi hạ tầng cơ
sở mạng được sử dụng bởi nhà cung cấp dịch vụ.
• Mạng truyền dẫn băng thông rộng:
Việc truyền dẫn dịch vụ IPTV yêu cầu kết nối điểm – điểm. Trong
trường hợp triển khai IPTV trên diện rộng, số lượng các kết nối điểm – điểm
tăng đáng kể và yêu cầu độ rộng băng thông của cơ sở hạ tầng khá rộng. Sự
tiến bộ trong công nghệ mạng trong những năm qua cho phép những nhà
cung cấp viễn thông thỏa mãn một lượng lớn yêu cầu độ rộng băng thông
mạng. Hạ tầng truyền hình cáp dựa trên cáp đồng trục lai cáp quang và các
mạng viễn thông dựa trên cáp quang rất phù hợp để truyền tải nội dung IPTV.
• Thiết bị người dùng IPTV:
Thiết bị người dùng IPTV (IPTVCD) là thành phần quan trọng trong việc
cho phép mọi người có thể truy xuất vào các dịch vụ IPTV. Thiết bị này kết nối

5
vào mạng băng rộng và có nhiệm vụ giải mã và xử lý dữ liệu video dựa trên IP
gửi đến. Thiết bị người dùng hỗ trợ công nghệ tiên tiến để có thể tối thiểu hóa
hay loại bỏ hoàn toàn ảnh hưởng của lỗi, sự cố mạng khi đang xử lý nội dung
IPTV.
• Mạng gia đình:
Mạng gia đình kết nối với một số thiết bị kĩ thuật số bên trong một diện
tích nhỏ. Nó cải tiến việc truyền thông và cho phép chia sẻ tài nguyên (các
thiết bị) kĩ thuật số đắt tiền giữa các thành viên trong gia đình. Mục đích của
mạng gia đình là để cung cấp việc truy cập thông tin, như là tiếng nói, âm
thanh, dữ liệu, giải trí, giữa những thiết bị khác nhau trong nhà. Với mạng gia
đình, người dùng có thể tiết kiệm tiền và thời gian bởi vì các thiết bị ngoại vi
như là máy in và máy scan, cũng như kết nối Internet băng rộng, có thể được
chia sẻ một cách dễ dàng.

1.5 Ưu điểm của IP và sự lựa chọn IP cho IPTV:


Truyền hình số được định thời một cách chính xác, là dòng dữ liệu liên
tục có tốc độ bit không đổi, thường hoạt động trên các mạng mà mỗi tín hiệu
được truyền đều phục vụ cho mục đích truyền hình. Trái với truyền hình,
mạng IP truyền những loại dữ liệu khác nhau từ rất nhiều nguồn trên một kênh
chung, bao gồm thứ điện tử, trang web, tín nhắn trực tiếp, tiếng nói qua IP
(VoIP) mà nhiều loại dữ liệu khác. Để truyền đồng thời những dữ liệu này,
Mạng Internet phân thông tin thành các gói. Như vậy, rõ ràng là IP và truyền
hình không phải là một sự kết hợp hoàn hảo (lý tưởng) về công nghệ.
Mặc dù không tương thích về căn bản, nhưng thị trường IPTV vẫn bùng
nổ. Vậy lý do tại sao lại chọn các mạng dựa trên IP để truyền tín hiệu truyền
hình? Câu trả lời cho câu hỏi này có thể tóm tắt thành năm điểm sau:
- Mạng IP băng rộng đã vươn tới rất nhiều gia đình ở nhiều nước,
các nhà cung cấp dịch vụ truyền hình có thể sử dụng những mạng này để
phát các dịch vụ truyền hình mà không cần xây dựng hệ thông mạng riêng của
họ.
- IP có thể đơn giản công việc phát các dịch vụ truyền hình mới,
như là chương trình tương tác, truyền hình theo yêu cầu…
- Giá thành của mạng IP tiếp tục giảm do số thiết bị được sản xuất
mỗi năm rất lớn và sự tồn tại của các chuẩn trên toàn thế giới.

6
- Mạng IP có mặt trên toàn thế giới, và số người dùng mạng
Internet tốc độ cao tiếp tục tăng rất nhanh.
- IP là công nghệ hoàn hảo cho nhiều ứng dụng khác nhau, bao
gồm sự trao đổi dữ liệu, mạng cục bộ, chia sẻ tệp tin, lướt web và nhiều nhiều
nữa…
IP cung cấp cơ chế để định hướng truyền gói giữa các thiết bị được liên
kết trong mạng. IP là một giao thức phổ biến được sử dụng khắp các mạng
Internet và hàng triệu các mạng khác có sử dụng IP. Không có IP, mọi việc sẽ
hỗn loạn bởi vì không có cách nào để một thiết bị gửi dữ liệu một cách riêng
biệt tới một thiết bị khác.
Với việc sử dụng các mạng IP để truyền dẫn tín hiệu truyền hình, việc
xem truyền hình hiện đại sẽ rất khác so với xem truyền hình trước đây. Các
tín hiệu truyền hình bây giờ không khác gì những dữ liệu khác. Nhờ đó, ngoài
các kênh truyền hình quảng bá truyền thống, chúng ta sẽ có thêm những kênh
truyền hình riêng biệt, tương tác để thỏa mãn nhu cầu của từng người.

1.6 Nhu cầu thực tế của IPTV

Theo nhóm nghiên cứu đa phương tiện (MRG ) trong “ Dự đoán IPTV
toàn cầu năm 2005-2009”: tốc độ phát triển IPTV rất cao: gần 1000%. Thị
trường IPTV trên thế giới phát triển ở mức tăng kép hàng năm 78% lên tới
36.9 triệu người sử dụng vào năm 2009. Doanh thu dịch vụ còn tăng nhanh
hơn trong cùng thời kì, từ 880 triệu USD tới 9.9 tỷ USD.
Theo Informa: tốc độ phát triển IPTV tăng nhanh vào 5 năm tới và đạt
25.9 triệu thuê bao IPTV vào cuối năm 2010.
Theo nguyên cứu TDG: Doanh thu IPTV toàn cấu sẽ đạt trên 17 tỷ USD
vào năm 2010.
Và trên thực tế, dịch vụ IPTV đã được triển khai và đạt dược thành
công ở nhiều như Italy ( Fast Web), Hồng Kông (PCCW), Canada ( Manitoba)
và Japan (Yahoo BB).
Tại thị trường Trung Quốc, IPTV bắt đầu được triển khai từ năm 2004
với 2 nhà cung cấp hàng đầu là CHINA Telecom và ZTE cùng với những nhà
cung cấp khác.
Số lượng thuê bao có thể tăng lến tới 3-6 triệu vào năm 2010.

7
IPTV được triển khai với băng thông 2M với kĩ thuật nén MPEG-4 part
10 cho TV thường và 6M đối với HDTV.
Các dịch vụ triển khai trên IPTV đến với người dùng:
+ LiveTV: truyền hình trực tuyến
+ VoD: truyền hình theo yêu cầu
+ RoD: Dịch vụ ghi hình theo yêu cầu
+ NVoD: Xem chương trình theo lịch phát sóng

CHƯƠNG 2:CHUẨN NÉN SỬ DỤNG TRONG IPTV

Nén cho phép các nhà cung cấp dịch vụ truyền các kênh hình và tiếng với
chất lượng cao qua mạng IP băng rộng. Do mắt người ko thể phân biệt được
toàn bộ các phần của hình ảnh. Do đó việc nén sẽ làm giảm độ lớn của tín hiệu
ban đầu bằng cách bỏ bớt các phần của hình ảnh.

2.1 Nén MPEG:

MPEG là 1 chuẩn nén được sử dụng rộng rãi trong thông tin vệ tinh,
truyền hình cáp và trong các hệ thống truyền hình mặt đất. MPEG (moving
pictures exert group) được thành lập nhằm phát triển các kĩ thuật nén cho phù
hợp vói việc truyền hình ảnh. Từ khi được thành lập, MPEG đã đưa ra các chuẩn
nén như: MPEG-1, MPEG-2, MPEG4-( Part 2 và part 10), MPEG-7, và MPEG-21.
Trong các chuẩn này, MPEG-2 và MPEG-4 Part 10 được sử dụng rộng rãi trong IPTV.

2.2 Chuẩn MPEG-2:

MPEG 2 là 1 công nghệ đạt được thành công lớn và là 1 chuẩn nén có ưu
thế vượt trội dành cho truyền hình số được truyền qua nhiều mạng truyền thông
băng rộng. Chuẩn nén MPEG-2 được chia thành 2 loại nén hình và nén tiếng.

Nén hình: Video ở dạng cơ bản là 1 chuỗi các ảnh liên tục. 1 frame được

8
định nghĩa với 1 chuỗi bit header. Mắt người thường thấy thoải mái khi xem TV
với tốc độ 25 hình/s. Sẽ không có lợi nếu phát với tốc độ nhanh hơn vì người xem
không thể nhận ra sự khác biệt. do đó có thể dung lượng của những hình ảnh
bằng cách nén chúng lại. Các bộ nén hình được sử dụng với mỗi frame mà vẫn
giữ chất lượng hình ảnh cao.

2.2.1 Quá trình nén MPEG:

Phần đầu tiên của nén bao gồm 1 quá trình tiền đồng bộ. Quá trình này cơ
bản bao gồm việc làm giảm kích thước của các frame. Làm giảm kích thước của
các frame chính là làm giảm số lượng bit , điều này cũng giúp giảm băng thông
cần thiết để truyền tín hiệu. Tuy nhiên, quá trình này không phải ko có trở ngại. Ví
dụ, sự giảm kích thước của khung có thể thường xuyên gây ra những lỗi tỉ số
cạnh (giống như sai tỉ lệ 4/3 hay 16/9) khi được thể hiện trên màn hình TV có độ
phân giải thấp.

Phần 2 của quá trình nén tin hiệu là chia 1 frame ảnh ra thành các block có
kích thước 8 nhân 8 pixel –khối mã hóa nhỏ nhất trong giải thuật của MPEG. Có
3 loại block; độ chói Y, thành phần màu đỏ Cr hoặc xanh Cb. Các loại block thành
phần màu mang thông tin về những màu khác nhau của hình ảnhtrg khi độ chói
mang thông tin về những phần màu đen hoặc trắng của hình ảnh.

Khi hoàn thành 2 phần trên, MPEG sẽ thực hiện 1 hàm toán được gọi là
biến đổi cosin rời rạc đối với mỗi block riêng biệt. Kết quả thu được là một ma trận
hệ số 8*8. DCT sẽ biến đổi sự khác nhau về không gian thành các tần số khác
nhau, nhưng không làm thay đổi các thông tin trong block, các blcok ban đầu sẽ
được tái tạo lại 1 cách chính xác sử dụng biến đổi ngược. Nguyên tắc thực hiện
hàm này bao gồm việc chia các block thành các phần tùy theo mức độ quan
trọng. Những phần quan trọng sẽ đươc giữ nguyên cho tới bước tiếp theo trong
khi các phần còn lại sẽ bị giảm bớt. Điều này sẽ đảm bảo rằng mắt người không
chú ý tới việc những phần không quan trọng của block bị bỏ bớt khi tốc bít bị hạn
chế.

9
Bước tiếp theo trong MPEG là quá trình lượng tử hóa. Quá trình lượng tử
hóa dữ liệu số là quá trình làm giảm số lượng bít của các block. Mức lượng tử đối
với mỗi tìn hiệu video là rất quan trọng.

Khi tất cả các block trong frame đều đã đc nén lại, MPEG sẽ ngắt các frame
thành 1 dạng mới gồm nhiều block gọi l à macro block. Mỗi macro block có kích
thướ c 16 nhân 16 chứa các block độ chói và block thành phần màu. Nếu có sự
khác biệt giữa frame cuối cùng và frame hiện tại, các thiết bị nén MPEG sẽ chuyển
những block mới này tới 1 vị trí mới trên frame hiện tại. Điều này giúp không phải
gửi đi những hình ảnh mới hoàn toàn, do đó có thể tích kiệm băng thông. Có 2
cách để thực hiện điều đó:

Nén theo không gianlà làm giảm các bít trên từng frame riêng biệt. điều này
có thể đạt được do các pixel luôn đứng cạnh nhau trong các frame thường có giá
trị giống nhau. Do đó thay về mã hóa từng pixel riêng biệt. Kĩ thuật nén theo
không gian này mã hóa sự khác biệt giữa các pixel cạnh nhau. Số lượng bít cần
thiết để mã hóa những khác biệt này ít hơn số lượng bít cần thiết để mã hóa từng
pixel riêng biệt.

Nén theo thời gian là làm giảm các bit giữa các frame liên tục. Trong quá
trình sản xuất video có những thông tin được lặp lại giữa những frame liên tiếp.
VD: nếu trên hình có 1 bức tường , bức tường vẫn xuất hiện liên tục trong 30 hình
tiếp theo, mà không thay đổi ( bức tường đó không thay đổi trong vòng 1s) . thay
vì mã hóa 30 lần liên tục trong 1s, nên thời gian chỉ gửi đi các thông tin dự đoán
chuyển động giữa những frame hình, trong trương hợp của bức tường trong VD
trên, dự đoán chuyển động được đặt = 0.

Có nhiều phuơng thức khác nhau để nén 1 frame hình. VD như với 1 frame
hình có độ phức tạp cao thì cần phương pháp nén có yếu tố nén theo không gian
thấp bởi vì chỉ có 1 phần rất nhỏ các pixel được lặp lại. Nếu tốc đọ bit có sự thay
đổi lớn thì khó có thể truyền đi trong mạng IP, vì thế nhiều bộ mã hóa bao gồm cả
chức năng đệm để có thể điều khiển và quản lí tốc độ chung mà tại đó các bit được

10
truyền đi tới tầng tiếp theo của hệ thống sản xuất video.

Bước tiếp theo của quá trình nén MPEG là mã hóa các macroblock thành
các slice. Slice là 1 chuỗi ảnh đặt nằm ngang cạnh nhau từ trái sang phải. Nhiều
slice kết hợp với nhau tạo thành 1 hình. Mỗi slice được mã hóa độc lập với nhau
để hạn chế lỗi.

2.2.2 Các ảnh trong chuẩn nén MPEG:

Chuẩn nén MPEG định nghĩa 3 loại ảnh:

Intra-frame (I-frame)---- frame được mã hóa riêng biệt không phụ thuộc các
frame trước đó hoặc tiếp theo.Mã hóa theo hệ thống đc sử dụng gần giống như
nén JPEG. Đây là frame độc lập và đc sử dụng để tạo ra các loại frame khác.

P-frame ( forward predicted frame)---- khung dự đoán ảnh tiếp theo là


khung dự đoán ảnh dựa trên các frame I trước đó. MPEG không thực sự mã hóa
ảnh mà chứa các thông tin về chuyển động cho phép IPTVCD có thể tái tạo lại
frame. P-frame yêu cầu ít băng thông hơn I-frame, điều này là yếu tố quan trọng
đối với mạng dựa trên IPTV.
B-frame (Bi-directional predicted frame )---- frame dự đoán hướng: B-
frame là frame đc tạo thành từ việc kết hợp các thông tin từ cả I-frame và P-
frame. Mã hóa B-frame thì tương tự với P-frame, ngoại trừ các vecto chuyển
động phụ thuộc vào các vùng trong các khung tham khảo sau đó. B-frame
chiếm ít dung lượng hơn là I-frame va P-frame. Vì thế dòng Mpeg video gồm
nhiều B-frame thì chiếm dung lượng thấp hơn so với dòng chứa các frame I
va P. Thậm chí, B-frame giúp làm tối thiểu băng thông cần thiết đối với các
dòng MPEG video. Tuy nhiên, B-frame cũng có hạn chế đó là độ trễ. Do
IPTVCD phải kiểm tra 2 khung trước và sau trước khi tạo ra B-frame.

3 loại ảnh trên kết hợp với nhau tạo thành 1 chuỗi các frame đc gọi là nhóm
ảnh (GOP ). Mỗi nhóm ảnh bắt đầu bằng một frame I và có một số các frame B và
P, Mỗi nhóm ảnh MPEG có cấu trúc như sau:

[I B B B P B B B P B B B P B B B P]

11
Mỗi nhóm ảnh cần bắt đầu với một khung I, mặc dù kích thước của mỗi
nhóm ảnh là khác nhau, nhưng trung bình mỗi nhóm ảnh trong IPTV có khoảng
12 đến 15 frame. Mỗi cấu trúc của một nhóm ảnh thông thường có thể được miêu
tả bởi 2 thông số: N, số ảnh trong một nhóm và M, khoảng cách giữa các frame.
Các nhóm ảnh được chia thành 2 loại: nhóm đóng và nhóm mở. Với nhóm đóng,
khung B cuối cùng không yêu cầu khung I đầu tiên cho nhóm ảnh tiếp theo để giải
mã, trong khi với nhóm mở cần yêu cầu khung I cho nhóm ảnh tiếp theo. Các
nhóm ảnh sau đó được kết hợp với nhau để tạo thành dòng video. Mỗi dòng
video bắt đầu biết một đoạn mã, theo sau đó là một header và kết thúc với một
mã duy nhất.

Thứ tự các khung được truyền đi trên mạng băng rộng thì khác với thứ tự
các khung trong chuối bit đầu vào của bộ mã hóa. Bởi vì bộ giải mã trong
IPTVCD cần xử lý các frame I và P trước khi tạo ra khung B. Mối quan hệ tổng
thể giữa các chuỗi ảnh, ảnh, các slice, các khối macro, các khối và các điểm ảnh
được minh họa ở hình sau:

Hình 2.1 Cấu trúc dòng MPEG video

12
Mặc dù MPEG-2 được sử dụng trong truyền hình cáp và vệ tinh, nhưng
MPEG-2 có nhưng hạn chế đối với các mạng có băng thông giới hạn.Do đó một
công nghệ nén mới với nhiều tính năng đã được phát triển trong nhưng năm gần
đây vơi mục đích truyền video qua mạng băng thông giới hạn. MPEG-4 part 10
được sử dụng trong hạ tầng mạng IPTV.

2.3 MPEG-4:

Chuẩn MPEG-4 thành công hơn so với chuẩn MPEG-2. Thêm vào đó,
MPEG-4 đưa ra 1 hệ thống hoàn chỉnh với các đặc điểm hỗ trợ các định dạng
dữ liệu. Mpeg-4 bao gồm rất nhiều phần có thể thực hiện cùng nhau hoặc riêng
biệt.
• Phần1:Systems;
• Phần2:Visual;
• Phần3:Audio;
• Phần 4: Conformance xác định việc triển khai một MPEG-4 sẽ như thế nào;

• Phần 5: Các phần mềm tham chiếu, đưa ra một nhóm các phần mềm tham
chiếu quan trọng, được sử dụng để triển khai MPEG-4 và phục vụ như một ví
dụ demo về các bước phải thực hiện khi triển khai;
• Phần 6: Khung chuẩn cung cấp truyền thông đa phương tiện tích hợp
DMIF (Delivery Multimedia Integration Framework), xác định một giao diện
giữa các ứng dụng và mạng/lưu trữ;
• Phần 7: Các đặc tính của một bộ mã hoá video tối ưu (bổ xung cho các
phần mềm tham chiếu, nhưng không phải là các triển khai tối thiểu cần thiết).
• Các phần mới bổ xung tiếp cho chuẩn MPEG-4 sau này là:
• Phần 8: Giao vận (về nguyên tắc không được xác định trong chuẩn, nhưng
phần 8 xác định cần ánh xạ như thế nào các dòng MPEG-4 vào giao vận IP);
• Phần 9: Mô tả phần cứng tham chiếu (Reference Hardware Description);
• Phần 10: MPEG-4 Advanced Video Coding /H.264 là thành tựu mới nhất
về nén video, trên cơ sở đồng bộ với khả năng tính toán và dung lượng bộ
nhớ của các máy tính PC hiện nay, ứng dụng các phương pháp mã hoá phức
tạp hơn nhiều các phương pháp trước đó và có thể thực hiện cả trong môi
trường phần mềm và phần cứng, do nhóm chuyên gia MPEG hợp tác với
nhóm IUT Study Group phát triển và có nhiều khả năng sẽ trở thành chuẩn mã
hoá video qui mô toàn cầu, duy nhất của ITU và ISO;
• Phần 11: Mô tả khung hình (Scene Description - được tách ra từ phần 1);
• Phần 12: Định dạng file truyền thông ISO (ISO Media File Format);
• Phần 13: Quản lý bản quyền nội dung IPMP (Intellectual Property
Management and Protection Extensions);
• Phần 14: Định dạng fille MP4 (trên cơ sở phần 12);
• Phần 15: Định dạng file AVC (cũng trên cơ sở phần 12);
• Phần 16: AFX (Animation Framwork eXtensions) và MuW (Multi-user
Worlds).

13
Công nghệ mã hoá video trong MPEG-4.

Chuẩn MPEG-4 là một chuẩn động dễ thay đổi: với MPEG-4, các đối
tượng khác nhau trong một khung hình có thể được mô tả, mã hoá và truyền
đi một cách riêng biệt đến bộ giải mã trong các dòng cơ bản ES (Elementary
Stream) khác nhau. Cũng nhờ xác định, tách và sử lý riêng các đối tượng
(như nhạc nền, âm thanh xa gần, đồ vật, đối tượng ảnh video như con người
hay động vật, nền khung hình…), nên người sử dụng có thể loại bỏ riêng từng
đối tượng khỏi khuôn hình. Sự tổ hợp lại thành khung hình chỉ được thực hiện
sau khi giải mã các đối tượng này.

Trên Hình 2.2 thể hiện một trường hợp điển hình của tổ hợp khuôn hình
MPEG-4, cho thấy nhiều đối tượng (bàn, quả cầu, bảng đen, người hướng
dẫn và audio) được đặt vào một hệ thống toạ độ không gian 3 chiều (3-D) đối
với vị trí người xem giả định. Các thiết bị mã hoá và giải mã video đều áp
dụng sơ đồ mã hoá như nhau cho mỗi đối tượng video VO (Video Object)
riêng biệt (hình 2), nhờ vậy người sử dụng có thể thực hiện các hoạt động
tương tác riêng với từng đối tượng (thay đổi tỷ lệ, di chuyển, kết nối, loại bỏ,
bổ xung các đối tượng…) ngay tại vị trí giải mã hay mã hoá.

Hình 2.2 Tổ hợp khung hình trong MPEG-4

14
Hình 2.3 Cấu trúc bộ mã hóa và giải mã MPEG-4

Các bộ phận chức năng chính trong các thiết bị MPEG-4 bao gồm:
• Bộ mã hoá hình dạng ngoài Shape Coder dùng để nén đoạn thông tin, giúp
xác định khu vực và đường viền bao quanh đối tượng trong khung hình
scene.
• Bộ dự đoán và tổng hợp động để giảm thông tin dư thừa theo thời gian.
• Bộ mã kết cấu mặt ngoài Texture coder dùng để xử lý dữ liệu bên trong và
các dữ liệu còn lại sau khi đã bù chuyển động.

Hình 2.4 là một ví dụ về mã hoá và tổng hợp khung hình video sử dụng
trong MPEG-4. Nhiều đối tượng, như người, xe ô tô, nhà cửa, được tách ra
khỏi video đầu vào. Mỗi đối tượng video sau đó được mã hoá bởi bộ mã hoá
đối tượng video VO (video object) và sau đó được truyền đi trên mạng. Tại vị
trí thu, những đối tượng này được giải mã riêng rẽ nhờ bộ giải mã VO và gửi
đến bộ tổ hợp compositor. Người sử dụng có thể tương tác với thiết bị để cấu
trúc lại khung hình gốc (a), hay để xử lý các đối tượng tạo ra một khung hình
khác (b). Ngoài ra, người sử dụng có thể download các đối tượng khác từ các
thư viện cơ sở dữ liệu (có sẵn trên thiết bị hay từ xa thông qua mạng LAN,
WAN hay Internet) để chèn thêm vào hay thay thế các đối tượng có trong
khuôn hình gốc (c).

15
Hình2.4 Mã hóa và tổng hợp khung hình trong MPEG-4

Để có thể thực hiện việc tổ hợp khung hình, MPEG-4 sử dụng một ngôn
ngữ mô tả khung hình riêng, được gọi là Định dạng nhị phân cho các khung
hình BiFS (Binary Format for Scenes). BiFS không chỉ mô tả ở đâu và khi nào
các đối tượng xuất hiện trong khung hình, nó cũng mô tả cách thức hoạt động
của đối tượng (làm cho một đối tượng xoay tròn hay chồng mờ hai đối tượng
lên nhau) và cả điều kiện hoạt động đối tượng và tạo cho MPEG-4 có khả
năng tương tác. Trong MPEG-4, tất cả các đối tượng có thể được mã hoá với
sơ đồ mã hoá tối ưu riêng của nó – video được mã hoá theo kiểu video, text
được mã hoá theo kiểu text, các đồ hoạ được mã hoá theo kiểu đồ hoạ - thay
vì việc xử lý tất cả các phần tử ảnh pixels như là mã hoá video ảnh động. Do
các quá trình mã hoá đã được tối ưu hoá cho từng loại dữ liệu thích hợp, nên
chuẩn MPEG-4 sẽ cho phép mã hoá với hiệu quả cao tín hiệu ảnh video,
audio và cả các nội dung tổng hợp như các bộ mặt và cơ thể hoạt hình.

2.4 Tổng quan về MPEG-4 Part 10

Đầu năm 1998, 2 tổ chức ITU-T và VCEG đã cùng đưa ra một chuẩn nén
mới H.26L nhằm tăng gấp đôi hiệu suất nén . Do đó chuẩn nén này sẽ mở ra
nhiều ứng dụng mới như truyền hình qua mạng Internet, truyền hình di động và
phát triển các ứng dụng hiện có.
Cuối năm 2001, VCEG và MPEG đã thành lập JVT ( Joint Video Team) có
nhiệm vụ hoàn thành chuẩn nén mới và chính thức được thông qua với tên gọi là
MPEG-4 Part 10 hoặc H.264/AVC vào tháng 3 năm 2003.

16
2.4.1 Cấu trúc phân lớp của H.264/AVC

Với sự gia tăng các ứng dụng và dịch vụ trên nhiều mạng thì câu hỏi đặt
ra là làm thế nào quản lí được các ứng dụng đó. Do vậy, chuẩn H.264/AVC
phải có độ linh hoạt cao và có thể ứng dụng trên nhiều mạng khác nhau. Do
đó, chuẩn H.264/AVC được thiết kế theo phân lớp mã hóa video VCL ( Video
Coding Layer) và lơp NAL làm nhiệm vụ tương thích với môi trường mạng
khác nhau.

Hình 2.5: Cấu trúc phân lớp của H.264

a) Lớp mạng NAL ( Network Abstration Layer)

NAL có khả năng ánh xạ từ lớp VCL đến lớp truyền tải:
+ RTP/IP cho dịch vụ thời gian thực qua mạng Internet (conversational
và streaming).
+ Định dạng file: ISO MP4 cho lưu trữ và truyêng tải MMS.
+ H32x cho các dịch vụ đàm thoại có dây và không dây.
+ Dòng truyền tải MPEG-2 cho các dịch vụ quảng bá.

Gói NAL: dữ liệu video được mã hóa được tổ chức trong một đơn vị
NAL( hay gói NAL). Mỗi gói có độ dài tính theo byte. Byte đầu tiên của mỗi gói
NAL là byte mào đầu, nó chỉ rõ loại dữ liệu được chứa trong NAL, các byte
còn lại chứa dữ liệu.

Phần dữ liệu của NAL được ghép xen.


Cấu trúc của đơn vị NAL có định dạng chung cho việc sử dụng truyền
trong hệ thống hướng bit và hướng gói.

b) Lớp mã hóa video:

Lớp mã hóa video của H.264/AVC thì tương tự với các tiêu chuẩn khác
như MPEG-2 video. Nó là sự kết hợp dự đoán theo thời gian và theo không

17
gian,vàvới mã chuyển vị.

Ảnh được tách thành các khối. Ảnh đầu tiên của dãy hoặc điểm truy
nhập ngẫu nhiên thì được mã hóa “Intra”, có nghĩa là không dùng thông tin
nào ngoài thông tin chứa trong bản thân ảnh. Mỗi mẫu của một khối trong một
frame Intra được dự đoán nhờ dùng các mẫu không gian bên cạnh của các
khối đã mã hóa trước đó. Đối với tất cả các ảnh còn lại của dãy hoặc giữa các
điểm truy cập ngẫu nhiên, mã hóa “Inter” được sử dụng, dùng dự đoán bù
chuyển động từ các ảnh được mã hóa trước.

c) Khái niệm về ảnh, khung, bán ảnh, macroblock

Tín hiệu video được mã hóa trong H.264 bao gồm tập hợp các ảnh
được mã hóa có trật tự. Một ảnh có thể biểu diễn bằng cả một khung hoặc
một bán ảnh. Nhìn chung, một khung gồm có hai bán ảnh xen kẽ nhau: bán
ảnh trên và bán ảnh dưới. Bán ảnh trên gồm các dòng chẵn 0, 2, 4, …, H/2 -1,
với H là tổng số dòng trong một khung. Bán ảnh dưới gồm các dòng lẻ và bắt
đầu từ dòng thứ 2.

Hình 2.6: Các bán ảnh trong một khung

Các macroblock: Mỗi ảnh video, frame hoặc field, được chia thành các
macroblock có kích thước cố định bao trùm một diện tích ảnh hình chữ nhật
gồm 16 x 16 mẫu thành phần luma và 8 x 8 mẫu cho mỗi một trong hai thành
phần chroma. Tất cả các mẫu macroblock luma hoặc chroma được dự đoán
theo không gian hoặc thời gian, và dự đoán tại chỗ hợp thành được truyền đi
nhờ dùng mã chuyển vị. Do vậy mỗi thành phần màu dự đoán tại chỗ được
chia nhỏ thành các khối. Mỗi khối được biến đổi nhờ dùng biến đổi nguyên (an
integer transform), và các hệ số biến đổi được lượng tử hóa và được truyền đi

18
bằngphương pháp mã hóa entropy.

Các macroblock được tổ chức thành các slice, biểu diễn các tập con của
ảnh đã cho và có thể được giải mã độc lập. Thứ tự truyền các macroblock
trong dòng bit phụ thuộc vào bản đồ phân phối Macroblock (Macroblock
Allocation Map) và không nhất thiết phải theo thứ tự quét. H.264 / AVC hỗ trợ
năm dạng mã hóa slice khác nhau. Đơn giản nhất là slice I (Intra), trong đó tất
cả macroblock được mã hóa không có tham chiếu tới các ảnh khác trong dãy
video. Tiếp theo là các slice P và B, ở đó việc mã hóa có tham chiếu tới các
ảnh trước nó (slice P) hoặc cả ảnh trước lẫn ảnh sau (slice B). Hai dạng slice
còn lại là SP (switching P) và SI (switching I), được xác định cho chuyển mạch
hiệu quả giữa các dòng bit được mã hóa ở các tốc độ bit khác nhau.

2.4.1 H.264 CODEC

Giống như các tiêu chuẩn nén trước đây ( ví dụ như MPEG-1, MPEG-
2 và MPEG-4),H.264 không được định nghĩa là bộ CODEC ( một cặp
encoder và decoder) mà H.264 định nghĩa các cú pháp của luồng nén video.
Trong thực tế, bộ mã hóa và giải mã bao gồm các thành phần cơ bản như
trong hình 2.8 và hình 2.9. So với các chuẩn nén trước bao gồm các thành
phần như bộ dự đoán, biến đổi, lượng tử, mã hóa entropy, H.264 CODEC
còn bao gồm bộ lọc deblocking và có nhiều thay đổi quan trọng trong các chi
tiết về chức năng của các thiết bị.
Bộ mã hóa (hình 2.8) bao gồm 2 dòng dữ liệu , dòng forward (từ trái
sang phải) và dòng tái tạo (từ phải sang trái). Dòng dữ liệu trong bộ giải mã
được truyền từ phải sang trái trong hình 2.9.

19
Hình 2.7: Sơ đồ bộ mã hóa H.264.

Bộ mã hóa dòng forward

Một khung hoặc trường lối vào Fn được xử lí trong các khối của một
macroblock ( đáp ứng cho 16x16 pixel trong một hình bình thường). Mỗi
macroblock được mã hóa ở chế độ trong ảnh hoặc liên ảnh, với từng block
trong macroblock. Một dự doán PRED (kí hiệu là P trong hình 2.8) được định
dạng dựa trên các mẫu ảnh được tái tạo lại.
Trong chế độ nén liên ảnh, PRED được hình thành từ slice hiện thời vừa
được mã hóa, giải mã và tái tạo lại (uF′ n trong hình, chú ý rằng các mẫu không
được lọc được sủ dụng để tạo nên PRED)
Trong chế độ nén trong ảnh, PRED được hình thành bằng cách dự đoán
bù chuyển động từ một hoặc hai ảnh tham khảo được. Trong hình 2.8, ảnh tham
khảo là ảnh F′ n −1 vừa được mã hóa. Nhưng, dự đoán tham chiếu đối với mỗi
macroblock có thể được chọn từ các hình ảnh trong quá khứ hoặc trong tương
lai vừa được mã hóa, tái tạo và lọc ( theo thứ tự hiển thị) .
Dự đoán PRED trừ với block hiện tại đer tìm ra sự khác biệt , được biến
đổi và lượng tử hóa để thu được hệ số lưởng tử X sẽ được sắp xếp lại và mã
hóa entropy. Hệ số được mã hóa entropy cùng với thông tin về cạnh được mã
hóa trong mỗi block trong macroblock (chế độ dự đoán, mức lượng tử, thông tin
về vector chuyển động, …) định dạng nên các dòng bit để truyền tơi lớp mạng
trừu tượng để truyền hoặc lưu trữ.

Hình 2.8: Bộ mã hóa

Bộ mã hóa dòng tái tạo

Bên cạnh việc mã hóa và truyền tải các block trong macroblock, bộ mã
hóa còn giải mã ( tái tạo) chúng để làm tham khảo cho các dự đoán trong tương

20
lai. Hệ số X được giải lượng tử (Q−1 ) và biến đổi ngược (T−1 ) để thu được sụ
khác biệt block D′ n . Block dự đoán PRED được cộng vào để tạo thành block
tái tạo uF′n . Bộ lọc được ứng dụng để giảm ảnh hưởng của méo và các ảnh
tham khảo dự đoán được tạo từ 1 chuỗi các block F′n.
Mục đích chính của bộ giải mã dòng tái tạo trong bộ mã hóa là để chắc
chắn rằng cả bộ mã hóa và giải mã đều sử dụng các tham số khung đã xác định
để tạo ra dự đoán P. Nếu không có các tham số này, dự báo P ở bộ mã hóa và
giải mã sẽ không được xác định, dẫn đến lỗi giữa bộ mã hóa và giải mã.

Hình 2.9 Bộ giải mã


Bộ giải mã

Bộ giải mã nhận được các dòng bit được nén từ NAL. Các thành phần
dữ liệu được giải mã entropy để tìm ra hệ số lượng tử X. Sử dụng giải lượng
tử và biến đổi ngược để thu được Dn. Sử dụng các thông tin header đươc giải
mã từ các dòng bit, bộ mã hóa tạo ra block dự đoán, giống hệt với PRED được

tạo ra ở bộ mã hóa. PRED được cộng với D n để tạo ra uF′n , sau đó được
lọc để tạo ra các block F′n.

2.4.3 Các đặc điểm chính của MPEG-4 Part 10:

a) Kích thước block ảnh có thể thay đổi được:


Thành phần độ chói của macroblock (16*16 mẫu) có thể được chia theo 4
cách: một macro block 16 *16 phần macroblock, hai macroblock 16*8 phần, hai
8* 16 phần hoặc bốn macroblock 8*8 phần. Nếu kiểu 8*8 phần được chọn, mỗi
bốn 8*8 sub-macroblock trong một macro block có thể được chia theo 4 cách:
một phần sub-macro block 8*8, hai phần sub-macroblock 4*8, hai phần sub-
macroblock 8*4 hoặc bốn phần sub-macroblock 4*4 . Các phần này và các sub-
macroblock tạo ra nhiều cách kết hợp giữa trong mỗi macroblock.
Trong thực tế, phần có kích thước lớn phù hợp với những vị trí không chi
tiết, và phần kích thước nhỏ phù hợp với các vị trí có độ chi tiết cao.

21
Hinh 2.10: Bù chuyển động

b) Độ chính xác của vector bù chuyển động cao:

Mỗi phần hay mỗi phần sub-macroblock trong một macro được mã hóa
trong ảnh được dự đoán từ một vùng có cùng kích thước trong ảnh tham khảo.
hầu hết các chuẩn nén trước đó chỉ đạt được độ chính xác ½ của vector bù
chuyển động, nhưng với H.264 có thể đạt được tới ¼.

c) Tham chiếu nhiều ảnh bù chuyển động:

Ảnh P trong MPEG-2 là ảnh dự đoán được tham chiếu từ một ảnh trước
đó, còn ảnh B là ảnh dự đoán 2 chiều được tham chiếu từ nhiều ảnh I hoặ P
trước và sau nó.
Trong chuẩn nén H.264, ảnh hiện tại có thể tham chiếu bởi nhiều ảnh,
điều này cho phép tăng hiệu suất nén. Một lượng lớn các ảnh được giải nén và
lưu trong bộ giải nén.
Trong các chuẩn nén trước đó, thứ tự các ảnh dùng cho mục đích tham
chiếu bù chuyển động và thứ tự các ảnh thể hiện có mối quan hệ chặt chẽ với
nhau. Tuy nhiên, chuẩn nén H.264 đã khắc phục nhược điểm này bằng cách
cho phép bộ giải nén lựa chọn thứ tự các ảnh tham chiếu.

22
Hình 2.11: Tham chiếu đa ảnh

d) Dự đoán trong ảnh:

Các mẫu của một macroblock được dự đoán bằng cách chỉ sử dụng phần
thông tin của macroblock được truyền đi trong một ảnh.
Trong chuẩn nén H.264/AVC, có hai loai dự đoán trong ảnh cho thành
phần chói Y. Loại thứ nhất là intra 4x4 và loại thứ 2 là intra 16x16. Trong INTRA
4x4, các phần tử ảnh có kích thước 16x16 được chia thành 16 phần có kích
thước 4x4, việc dự đoán được thực hiên với từng phần riêng biệt. Có 9 mode dự
đoán tùy chọn đối với các block thành phần chói Y kích thước 4x4, 4 mode đối
với thành phần chói Y kích thước 16x16, 4 mode cho thành phần màu Cr, Cb. Bộ
nén sẽ lựa chọn mode dự đoán sao cho sự khác biệt giữa P và block được mã
hóa là nhỏ nhất.
c mode dự đoán thành phần chói Y 4x4
Có 9 mode dự đoán thành phần chói Y kích thước 4x4, đó là:
Mode 0: dự đoán theo chiều dọc
Mode 1: dự đoán theo chiều ngang
Mode CD: dự đoán dựa trên trung bình tất cả các mẫu xung quanh từ bên
trái và từ trên của khối dữ liệu hiện tại.
Mode 3: dự đoán dự trên các mẫu có độ nghiêng 45 độ từ phải sang trái.
Mode 4: dự đoán dự trên các mẫu có độ nghiêng 45 độ từ trái sang phải.
Mode 5 : sử dụng phép ngoại suy với góc có độ nghiêng 26.6 độ so với
chiều dọc.
Mode 6: sử dụng phép ngoại suy với góc có độ nghiêng 26.6 độ so với
chiều ngang

23
Mode 7: sử dụng phép ngoại suy với góc có độ nghiêng 26.6 độ so với
chiều dọc bên phải
Mode 8: sử dụng phép ngoại suy với góc có độ nghiêng 26.6 độ từ so với
chiều ngang.

Hình 2.12: Mode dự đoán thành phần chói Y kích thước 4x4

Hình 2.13: Mode dự đoán 16x16 liên ảnh

• Các mode dự đoán thành phần chói Y 16x16


Như dã nói trình bày ở trên, một mode dự đoán được áp dụng cho toàn
bộ một macro thành phần chói kích thước 16x16. Có 4 mode dự đoán đó là dự
đoán theo chiều dọc, dự đoán theo chiều ngang, dự đoán phẳng. Đối với mode
dự đoán phẳng, một hàm tuyến tính được sử dụng giữa các mẫu từ bên trái và
từ trên xuống so với mẫu dự đoán hiện tại. Mode này hoạt động hiệu quả giữa
các vùng có độ chói liên tục thay đổi. Các mode hoạt động giống như đối với
thành phần chói kích thước 4x4, chỉ khác là chúng hoạt động đối với toàn bộ
macroblock thay vì với 16 phần kích thước 4x4.

• Các mode dự đoán các thành phần màu Cr và Cb:

Dự đoán trong ảnh đối với các thành phần màu của một macroblock
tương tự như đối với thành phần chói Y có kích thước 16x16. Bởi vì tín hiệu
màu có sự thay đổi liên tục trong hầu hết các trường hợp. Nó luôn áp dụng cho
các khối 8x8 sử dụng dự đoán ngang, dọc, DC và sự đoán phẳng.

24
Hình 2.14: Dự đoán ảnh I

e) loại bỏ dư thừa không gian:

Biến đổi Cosine rời rạc DCT hai chiều trong các chuẩn MPEG-1, MPEG-2
nhằm mục đích loại bỏ phần dư thừa không gian. DCT được áp dụng cho các
khối 8x8. trong H.264/AVC, DCT được áp dụng với hệ số nguyên. Kích thước
khối thay đổi, có thể là 16x16, 4x4, hoặc trong trường hợp đặc biệt có thể dùng
khối kích thước 2x2. Việc sử dụng khối có kích thước nhỏ hơn so với các chuẩn
nén trước đó cho phép bộ mã hóa tương thích tốt hơn với biên của các đối
tượng chuyển động.

25
Hình 2.15: Loại bỏ dư thừa không gian

Có 3 loại biến đổi khác nhau được sử dụng trong MPEG-4 Part 10, đó là;
• Một biến đổi Hadamard áp dụng cho mảng 2 chiều kích thước 4x4
các hệ số 1 chiều DC của thành phần chói Y trong mode 16x16.
• Một biến đổi Hadamard áp dụng cho mảng 2 chiều kích thước 2x2
các hệ số 1 chiều DC của thành phần màu Cr, Cb.
• Một biến đổi dựa trên DCT áp dụng cho tất cả các block kích thước
4x4.
Dữ liệu trong 1 macroblock được truyền di theo thứ tự như trong hình sau:
Nếu macroblock được mã hóa sử dụng mode Intra 16x16, thì block đó sẽ
được dán nhãn là “-1”, và bao gồm các hệ số một chiều được biến đổi trong mỗi
block độ chói 4x4, và được truyền đi đầu tiên. Sau đó, các block độ chói từ 0-15
được truyền đi theo trật tự như trong hình vẽ(các hệ số một chiều trong một
macroblock được mã hóa sử dụng mode Intra 16x16 không được gửi đi). Block
16 và 17 được gửi đi,bao gồm 2 mảng kích thước 2x2 các hệ số một chiều các
thành phần màu Cr, Cb. Cuối cùng là các block từ 18-25(không có các hệ số một
chiều).

26
Hình 2.16: Thứ tự truyền các block trong một macroblock

f) Mã hóa Entropy:

Hình 2.17: Mã hóa Entropy


• Mã hoá số học nhị phân thích nghi với ngữ cảnh (Context-adaptive
binary arithmetic coding - CABAC)

27
• Mã hoá có độ dài từ mã thay đổi thích nghi với ngữ cảnh (Context-
adaptive variable-length coding - CAVLC)
• Mã hoá có độ dài từ mã thay đổi (Common variable-length coding -
VLC)
g) Bộ lọc deblocking:

Cấu trúc khối cơ bản của H.264 là 4x4 cho biến đổi và bù chuyển động.
Do vậy, ảnh sẽ hình thành các đường biên giữa các khối. Bộ lọc sẽ triệt tiêu các
biên này để hình ảnh được tự nhiên hơn.
Một bộ lọc được sử dụng cho mỗi macroblock được mã hóa nhằm làm
giảm méo. Bộ lọc deblocking được sử dụng sau biến đổi ngược ở bộ mã
hóa( trước khi tái tạo lại và lưu trữ ) và ngược lại đối với bộ giải mã. Bộ lọc giúp
cải thiện chất lượng hình ảnh. Hình ảnh được lọc sẽ sử dụng để làm dự đoán bù
chuyển động cho các hình ảnh trong tương lai và điều này có thể giúp cải thiện
chất lượng nén bởi vì những hình ảnh đã được lọc chân thực hơn so với các ảnh
không được lọc.

h) Thứ tự macroblock mềm dẻo:

Để cung cấp các phương pháp che giấu hiệu quả trong các kênh có
khuynh hướng bị lỗi với các ứng dụng độ trễ thấp, H.264 / AVC hỗ trợ một đặc
điểm gọi là thứ tự macroblock mềm dẻo (FMO – Flexible Macroblock
Ordering). FMO định rõ một giản đồ (pattern) ấn định các macroblock trong
ảnh vào một hoặc vài nhóm slice. Mỗi nhóm slice được truyền riêng biệt. Nếu
một nhóm slice bị mất, các mẫu trong các macroblock bên cạnh về mặt không
gian, thuộc về các nhóm slice được thu đúng, có thể được sử dụng cho che
dấu hiệu quả lỗi.

2.4.4 Ưu điểm của H.264/AVC:

Chất lượng hình ảnh tốt: H.264 là chuẩn nén sử dụng công nghệ âm
thanh, hình ảnh mới khả năng nén tôt hơn so với các chuẩn nén trước đó.
Do đó, chuẩn nén cung cấp dịch vụ phân phát hình ảnh chất lượng cao
qua mạng băng thông giới hạn.

Yêu cầu băng thông thấp: Chất lượng hình ảnh của H.264 gần giống
với MPEG-2 nhưng H.264 cần ít băng thông để truyền tải tín hiệu với cùng
chất lượng. Đặ điểm này rất phù hợp để sử dụng trong hệ thống IPTV.
Có khả năng kết hợp với các thiết bị xử lí video có sẵn như MPEG-2
và hạ tầng mạng dựa trên IP đã có sẵn .
Hỗ trợ truyên hình độ phân giải cao: Khi sử dụng tối ưu chuẩn nén
thể làm có thể làm tăng khả năng truyền dữ liệu của mạng. Do đó các nhà

28
cung cấp dịch vụ truyền thông có thể sử dụng chuẩn nén này để cung cấp
chương trình video độ phân giải cao qua mạng sẵn có.
Hỗ trợ nhiều ứng dụng:Chuẩn nén H.264 được sử dụng trong nhiều ứng
dụng, với nền khác nhau thì có những yêu cầu riêng. Ví dụ, ứng dụng truyền đa
điểm trong IPTV yêu cầu phải hiện thị hình ảnh ở dạng chuẩn truyền hình, trong
khi, đối với các ứng dụng giải trí di động, hình ảnh phải hiển thị được trên các
thiết bị di động. Để phù hợp với mọi ứng dụng, chuẩn nén H.264 có rất nhiều
profile và level.Đặc điểm của profile và level là tốc độ bit và kích thước ảnh.
Có thể truyền độc lập: Chuẩn nén H.264 có thể truyền qua nhiều giao
thức như ATM, RTP,UDP, TCP và các dong MPEG-2.
Dễ dàng thích nghi với các mạng chất lượng kém nhờ cơ chế sửa lỗi .

2.4.5 Các ứng dụng của H.264/AVC

Chuẩn nén này được thiết kế cho các ứng dụng sau:
+Truyền hình quảng bá qua qua vệ tinh, cáp, mặt đất…
+Truyền hình tương tác, video theo yếu cầu (VoD).
+Lưu trữ đĩa quang, băng từ, DVD.
+Tích hợp dịch vụ qua ISDN, LAN, DSL, mạng không dây, mạng di động,
modem.
+Nhắn tin đa phương tiện MMS qua ISDN, DSL, LAN mạng di động.
Còn nhiều ứng dụng khác được phát triển trên mạng hiện tại như video
phone,… và mạng tương lai.

Kết luận:

Từ những đặc điểm và ưu điểm của MPEG-4 AVC đánh dấu một bước ngoặt
trong lĩnh vực nén video, áp dụng các kỹ thuật tiên tiến nhằm mục đích sử
dụng băng thông hiệu quả hơn và đem lại chất lượng ảnh cao hơn. Với các kỹ
thuật này, MPEG-4 AVC có thể giảm tốc độ bit xuống hơn 50% so với chuẩn
MPEG-2. Do đó, MPEG-4 Part 10 được lựa chọn để ứng dụng trong IPTV.

29
CHƯƠNG 3: ĐÓNG GÓI NỘI DUNG VIDEO

Việc đóng gói các chương trình video bao gồm việc chèn và tổ chức các dữ
liệu video thành các gói riêng biệt.
3.1 Tổng quan về mô hình truyền thông IPTV (IPTVCD)
Mô hình truyền thông trong IPTV có 7 lớp(và một lớp tùy chọn) được xếp
chồng lên nhau.
Các dữ liệu video ở phía thiết bị gửi được truyền từ lớp cao xuống lớp thấp
trong mô hình IPTV, và được truyền đi trong mạng băng rộng bằng các giao thức
của lớp vật lí. Ở thiết bị nhận, dữ liệu nhận được chuyển từ lớp thấp nhất đến lớp
trên cùng trong mô hình IPTV.

Hình3.1: mô hình truyền thông IPTV


Do đó, nếu 1 bộ mã hóa gửi chương trình video đến 1 thiết bị IPTV của
khách hàng, thì phải chuyển qua các lớp trong mô hình IPTV ở cả phía thiết bị
nhận và thiết bị gửi. Mỗi lớp trong mô hình IPTV độc lập với nhau và có chức
năng riêng. Khi chức năng này được thực hiện , dữ liêu j video được chuyển đến
lớp tiếp theo trong mô hình IPTV. Mỗi lớp sẽ thêm vào hoặc bỏ đi phần thông tin
điều khiển của các gói video trong quad trình xử lí. Thông tin điều khiển chứa các
thông tin giúp thiết bị có thể sử dụng gói dữ liệu đúng chức năng của nó, và
thường được định dạng như các header hoặc trailer. Bên cạnh việc truyền thông
giữa các lớp, còn có các liên kết ảo giữa các tầng cùng mức. 7 lớp và 1 lớp bổ
sung trong mô hình IPTV có thể được chia làm 2 loại: các lớp cao và lớp thấp.
các tầng cao hơn thì quan tâm nhiều hơn tới các ứng dụng của IPTV và các định
dạng file, trong khi các tầng thấp hơn thì quan tâm tới việc truyền tải các nội dung.

30
3.2 Mô hình IPTV và truyền tải các nội dung MPEG
Hình 3.2 cho ta cái nhìn rõ hơn về việc các nội dung video đã được nén qua
các lớp như thế nào khi sử dụng hệ thống MPEG khi chuyển từ lớp trên xuống lớp
dưới.

Hình 3.2 Đóng gói các lớp trong mô hình IPTV

3.2.1 Lớp mã hóa video:


Quá trình truyền thông bắt đầu ở lớp mã hóa, các tín hiệu tương tự hoặc số
được nén. Tín hiệu lối ra của bộ nén là các dòng Mpeg cơ bản. các dòng MPEG
cơ bản được định nghĩa là các tín hiệu số liên tục thời gian thực. Có nhiều loại
dòng cơ bản. VD, âm thanh được mã hóa sư dụng MPEG được gọi là “dòng cơ
bản âm thanh.“ Một dòng cơ bản thực ra chỉ là tín hiệu ra thô từ bộ mã hóa. Các
dòng dữ liệu được tổ chức thành các khung tại lớp này. Các thông tin chứa trong
một dòng cơ bản có thể bao gồm:
• Loại khung và tốc độ
• Vị trí của những block dữ liệu trên màn hình
• Tỉ số cạnh

Các dòng cơ bản là nền tảng để tạo nên các dòng MPEG.
Điều quan trọng phải chú ý là lớp này được chia thành 2 lớp phụ theo đặc tính
của chuẩn H.264/AVC: lớp mã hóa video(VCL) và lớp trừu tượng(NAL). Lớp phụ
VCL quan tâm tới việc nén các nội dung video. TÍn hiệu đầu ra của lớp này là chuỗi

31
các slice ảnh. Dòng bit ở lớp NAL được tổ chức thành các gói rời rạc được gọi là
các khối NAL. Định dạng của các khối NAL được mô tả trong hình 3.3(=3.6)
Các khối trong hình 3.3 mô tả 1 khối NAL với phần payload nội dung video.
Nó có thể chứa các loại payload khác trong phần này như thông tin điều khiển.
Những khối như thế được xếp vào loại không phải khối VCL (non-VCL unit). Các
khối NAL được kết hợp với nhau thành chuỗi, định dạng nên khối truy cập. chú ý
rằng khối NAL được tạo nên từ chuẩn H.264/AVC có thể hỗ trợ cho cả cấu trúc
mạng dựa trên giao thức IP và các mạng không dựa trên giao thức IP.

Hình 3.3 Cấu trúc của khối NAL


3.2.2 Lớp đóng gói Video:
Để truyền các dòng cơ bản âm thanh, dữ liệu và hình ảnh qua mạng số, mỗi dòng
cơ bản này phải được chuyển đổi sang một dòng được chèn của gói PES đã được đánh
dấu thời gian(PES- parketized Element Stream ). Một dòng PES chỉ bao gồm 1 loại
dữ liệu từ 1 nguồn. Một gói PES có thể có kích thước khối cố định hoặc thay đổi,
có thể lên tới 65536 byte/gói. Bao gồm 6 byte header, và số byte còn lại chứa nội
dung chương trình. Định dạng của 1 PES header được minh họa trong hình 3.4 và
giải thich trong bảng 3.4.

32
Hình 3.4 Định dạng gói MPEG PES

Bảng 3.1 Cấu trúc của một gói MPEG PES

Tên trường Chức năng

Tiền tố mã bắt
đầu gói Gói PES bắt đầu với tiền tố 0x000001

Trường này nhận dạng loại payload trong gói.


Nhận dạng Một mẫu bit 111x xxxx cho biết đó là gói audio,
dòng còn mẫu bit 1110 xxxx cho biết rằng đó là gói
(1 byte) video. Giá trị "X" được sử dụng để biểu thị các
số của các dòng MPEG

Độ dài gói PES Trường dài 2 byte để chỉ thị độ dài gói

Trường được dùng để đồng bộ nội dung video


Mã đồng bộ
và audio

Cờ header PES Trường 14 bit chứa các bộ chỉ thị PES khác
nhau hay các cờ, cung cấp phần cứng hay
phần mềm bộ giải mã của set - top box IP với
thông tin thêm vào. Các loại cờ gồm:
Điều khiển tranh chấp PES: Cờ này báo cho bộ
giải mã gói có được bảo đảm hay không thông
qua xử lý tranh chấp
Độ ưu tiên PES: Cờ này cung cấp cho bộ giải
mã thông tin về mức độ ưu tiên của gói PES
Bộ chỉ thị sắp xếp dữ liệu: Bộ chỉ thị này quyết
định Payload của PES bắt đầu với bit video hay
audio

33
Thông tin bản quyền: Khi bit này được thiết đặt,
nội dung video được bảo vệ bởi bản quyền
Bản gốc hay bản sao: Cờ này chỉ ra nội dung
này là bản gốc hay bản sao

Độ dài dữ liệu
header của Trường này nhận chỉ ra tổng số byte bị chiếm
PES bởi các trường header khác nhau

Trường header
của PES Trường này chứa một số các bít tùy chọn

Payload của Payload của PES gồm các dòng audio hay dữ
PES liệu video

Do bản chất của mạng, thứ tự hay chuỗi các khung video từ lối ra của trung tâm
dữ liệu IPTV có thể khác thứ tự các khung do các thiết bị của người dùng nhận được. do
đó, để giúp đỡ quá trình đồng bộ, các hệ thống dựa trên MPEG thường dán nhãn các
gói PES khác nhau trong chuỗi video.

Có 2 loại nhãn thời gian được sử dụng đối với mỗi gói PES: nhãn thời gian
trình diễn(PTS), và nhãn thời gian giải mã(DTS):

• PTS---- nhãn thời gian trình diễn có giá trị thời gian 33 bit, được đặt trong
trường PES header. Mục đích của việc sử dụng PTS cho mỗi gói là để xác định xem
khi nào và theo trật tự nào thì gói đó được xem (bởi người xem).
• .DTS---nhãn giải mã để sử dụng để giúp bộ giải mã ở thiết bị của người sử
dụng biết khi nào xử lí gói đó.

Khái niệm ứng dụng những nhãn thời gian khác nhau đối với mỗi gói PES
trong dòng mã hóa MPEG được minh họa trong hình 3.5.

Như đã chỉ ra ở trên, thứ tự các gói được truyền đi qua mạng khác với thứ
tự các gói nhận được ở thiết bị của người sư dụng. Thiết bị người sử dụng IPTV
sẽ dùng các nhãn PTS và DTS để tái tạo lại nội dung video gốc. bên cạnh việc gửi
đi các nội dung nén MPEG-2, PES còn có khả năng truyền tải các khối H.264/AVC
qua mạng IPTV. Các chi tiết quá trình ánh xạ được mô tả ở hình 3.6.

34
3.2.3 Lớp cấu trúc dòng truyền tải:
Lớp tiếp theo trong mô hình truyền thông IPTV làm nhiệm vụ tạo nên dòng truyền
tải, bao gồm 1 dòng liên tiếp các gói. Những gói này thường được gọi là các gói TS,
được tạo ra bằng cách ngắt các gói PES thành các gói TS có kích thước cố định là 188
byte độc lập với thời gian. Sử dụng thời gian độc lập này
làm giảm khả năng mất gói tin
trong quá trình truyền và giảm ồn. Mỗi gói TS bao gồm 1 trong 3 định dạng truyền
thông: dữ liêu, âm thanh, hình ảnh. Do đó, các gói TS mang cố định 1 loại hình truyền
thông. Mỗi gói TS bao gồm 184 byte payload và 4 byte header. Các thành phần của
TS header được mô tả trong hình 3.7 và giải thích trong bảng 3.2

Hình 3.5 định dạng gói MPEG TS

35
Hình 3.6 Ánh xạ gói truy cập AVC sang gói MPEG PES

Hình 3.7 Ứng dụng nhãn thời gian với các gói MPEG PES

Bảng 3.2 Cấu trúc gói MPEG TS

Tên trường Chức năng

Phần header thường bắt đầu băng các bit đồng


Trường đồng
bộ (8 bit), thường là các bit 0. Trường này
bộ
dùng để xác định điểm bắt đầu của 1gói IPTV.

Trường chỉ thị bit cờ này sẽ chỉ ra 1 lỗi (nếu có) liên quan đến
lỗi dòng truyền tải

Trường chỉ thị bit cờ này sẽ chỉ ra 1 điểm bắt đầu của khối
điểm bắt đầu

36
khối truyền tải truyền tải

Mức ưu tiên Khi đặt cờ này sẽ chỉ ra mức ưu tiên khối


truyền tải payload

Trương quan trọng nhất trong phần header là13


bit để xác định ID chương trình. Nó sẽ chỉ ra gói
nào thuộc dòng nào.Các gói thuộc dòng nào thì
sẽ có cùng ID chương trình.Bộ phân kênh trong
ID chương trình bị của người sử dụng dùng thông tin để phân
biệt các loại gói khác nhau.chú ý rằng các gói
null có ID chương trình = 8191. Các gói không
có ID chương trình thì sẽ bị thiết bị nhận IPTV
loại bỏ

Điều khiển việc


2 bit của trường này sẽ cho biết trạng thái mã
tranh chấp các
hóa của phần payload gói truyền tải.
truyền tải

trường 2 bit này sẽ cho biết liệu header của gói


Trường điều
dữ liệu có liên quan tới dòng truyền tải có bao
khiển thích nghi
gồm trường thích nghi và payload không

Bộ đếm tiến sẽ đếm tăng lên 1 khi 1 gói dòng


truyển tải với cùng một ID chương trình. Nhờ
Bộ đếm tiến
đó có thể xác định được nếu có mất hoặc bị lặp
gói. Điều này có thể ảnh hưởng hình ảnh.

Trường này có thể có hoặc không có trong


phần header.
Trương thích nghi này bao gồm nhiều thông tin
khác nhau được sử dụng để định thời và điều
Trường thích khiển, bao gồm cả PCR. PCR được sử dụng để
nghi đồng bộ đồng hồ IPTVCD với đồng hồ bộ mã
hóa. Giá trị PCR có độ dài 42 bit và được tăng
theo tốc độ đồng hồ chuẩn, 27MHz. Ngay sau
khi đồng bộ, việc giải mã MPEG - 2 IPTV được
tiến hành

Trường thích Trường này có thể có hoặc không có trong


nghi phần header.
Trường thích nghi này bao gồm nhiều thông tin
khác nhau được sử dụng để định thời và điều
khiển, bao gồm cả PCR. PCR được sử dụng để
đồng bộ đồng hồ IPTVCD với đồng hồ bộ mã

37
hóa. Giá trị PCR có độ dài 42 bit và được tăng
Theo tốc độ đồng hồ chuẩn, 27MHz. Ngay sau
khi đồng bộ, việc giải mã MPEG - 2 IPTV được
tiến hành.

Lớp này cũng cung cấp chức năng để tạo ra các dòng chương trình. Một dòng
chương trình là một gói PES chưa 1 vài dòng cơ bản được mã hoasuwr dụng cùng
đồng hồ chủ, hoặc đồng hồ hệ thống. Các kiểu dòng này được phát triển cho những
ứng dụng như lưu trữ nội dụng video trên các đĩa quang hoặc đĩa cứng.
Bên cạnh các nội dung hình ảnh và âm thanh đã được nén, dòng truyền tải bao
gồm nhiều thông tin đặc trưng của chương trình hoặc metadata mô tả các dòng bit.
Thông tin này được chứa trong 4 bảng PSI.
(1) Bảng chương trình kết hợp (PAT)- Việc truyền các bảng PAT là bắt buộc và
là điểm vào các bảng PSI. Bảng chương trình kết hợp luôn có ID chương trình là 0.
Bảng này đưa ra các liên kết giữa chỉ số chương trình và ID của chương trình
(2) Bảng ánh xạ chương trình: Bảng ánh xạ chương trình cũng là bắt buộc
và mang cáo thông tin về một chương trình cụ thể. Bảng ánh xạ chương trình liệt
kê các ID chương trình cho các gói mang các thành phần của 1 chương trình cụ
thể (âm thanh, hình ảnh, dữ liệu, và các thông tin PCR).Hình 3.8 mô tả 1 ví dụ về
mối quan hệ giữa bảng chương trình kết hợp (PAT) và bảng chương trình ánh xạ
(PMT).
Vì thế khi 1 thiết bị người dùng(IPTVCD) yêu cầu 1 chương trình, bảng
chương trình kết hợp sẽ được kiểm tra, sau đó sẽ kiểm tra bảng chương trình ánh
xạ để định nghĩa các IP chương trình về gói âm thanh, hình ảnh và dữ liệu liên kết
với chương trình đó. Trong ví dụ này, thuê bao lựa chọn chương trình1 và thiết bị
IPTV của người sử dụng định vị toàn bộ các gói truyền tải với ID chương trình là 36
đối với phần hình ảnh của chương trình và các gói với ID chương trình là 3 với các
phần âm thanh của chương trình. Nếu dữ liệu là quảng bá với chương trình, thì
bảng ánh xạ chương trình sẽ bao gồm các chi tiết trên đó xác định các gói dữ liệu
truyền tải.

38
Hình 3.8 Mối liên hệ giưa PMT và PAT

(3) Bảng điều kiện truy cập(CAT)- bảng điều kiện truy cập là 1 bảng tùy
chọn PSI bao gồm các ID chương trình của EMMs (các tin quản lí quyền truy cập).
Tin quản lí quyền truy cập bao gồm các thông tin về mức cho phép đối với hệ
thông truy cập. bảng điều kiện truy cập(CAT) thường được chứa trong 1 gói gọi với
ID chương trình là 1.
(4) Bảng thông tin mạng (NIT)- Bảng thông tin mạng NIT là 1 bảng tùy
chọn lưu trữ các thông tin như tần số kênh và số dòng truyền tải. Set top box sẽ
sử dụng thông tin này để chỉnh sóng tới các chương trình cụ thể.
Khi TS được cấu trúc và định dạng, nó sẽ được chuyển xuống lớp truyền tải
trực tiếp hoặc tới lớp sử dụng giao thức truyền tải thời gian thực (RTP).

3.2.4 Lớp giao thức truyền tải thời gian thực( tùy chọn):
Lớp tùy chọn này được sử dụng rộng rãi trong nhiều ứng dụng khác nhau. Lớp
này hoạt động như 1 lớp trung gian giữa các nội dung được nén MPEG-2, H.264/AVC
ở lớp cao hơn và cá lớp thấp hơn trong mô hình IPTV. Giao thức RTP chính là lõi của
lớp này và thường là block cơ sở hỗ trợ truyền dòng nội dung theo thời gian thực qua
mạng IP.

39
Giao thức truyền tải thời gian thực phân phát các dòng âm thanh và hình ảnh
bằng cách đóng gói các nội dung này trong một định dạng riêng biệt được gọi gói.Mỗi
gói bao gồm phần header và payload(dữ liệu IPTV). Để sử dụng hiệu quả băng thông,
phần payload thường bao gồm nhiều hơn 1 gói MPEG-TS.
Phần header bao gồm các chức năng cốt yếu để các thể truyền thành công
các dữ liệu thời gian thực qua mạng. header của RTP có thể nhận biết với header
của UDP có giá trị là 5004, và bao gồm rất nhiều trường.Chi tiết về các trường
khác nhau được minh họa trong hình 3.9 và bảng 3.3

Có 1 điều đáng chú ý, đó là giao thức thời gian thực không có trường dài
trong phần header bởi vì nó phụ thuộc vào giao thức truyền tải cơ bản để cung cấp
loại thông tin này. Như đã miêu tả trong bảng 3.6, lợi ích chính của việc chèn các
nộ dung video đã được nén và trong các gói RTP là:
(1) Thêm số chuỗi vào gói để giúp cả bộ giải mã ở phía nhà cung cấp và
thiết bị người dùng có thể sắp xếp lại các gói nhận được từ mạng IP.
(2) Trường nhãn thời gian giúp khắc phục các vấn đề như jitter và mất
đồng bộ giữa nguồn và đích.

Hình 3.9 Định dạng RTP header

Khi header truyền tải thời gian thực được thêm vào payload video, gói truyền tải
thời gian thực được gửi tới giao thức TCP hoặc UDP để tiếp tục xử lí.

Định dạng phần payload của RTPcho việc đóng gói dòng bit nén MPEG-2 :
thay vì sử dụng UDP để mang các gói TS MPEG-2 thì một vài hệ thống IPTV sử dụng
lớp RTP thêm vào lớp UDP để truyền các gói. Việc ánh xạ các gói MPEG-TS sang các
góiRTP là khá đơn giản.Cấu trúc bao gồm phần héader và payload của gói MPEG-2 TS.
Mỗi gói có độ dài 188 byte.Hình 3.10 mô tả cấu trúc truyền tải nội dung DVB dựa trên
MPEG-2 qua mạng IP.

40
Định dạng payload RTP cho việc đóng gói dòng bit được nén dùng chuẩn
H.264/AVC: RFC 3984 cung cấp khuyến nghị về giải pháp truyền các nội dung
H264/AVC và định nghĩa 3 cơ chế để chèn các khối NAL vào RTP payload:

(1) Một gói NAL riêng biệt: kĩ thuật này định nghĩa sự ánh xạ gói NAL
sang từng payload RTP. Cấu trúc của từng gói NAL được mô tả trong hình 3.11.
(2) Gói NAL tập hợp: Kĩ thuật này định nghĩa sự ánh xạ nhiều gói NAL
sang 1 gói RTP. Cấu trúc của gói NAL tập hợp được mô tả trong hình 3.12.

Bảng 3.3: Cấu trúc của gói IPTV dựa trên RTP

Tên trường Chức năng

Trường này xác định phiên bản RTP được dùng trong
Phiên bản (V)
gói IPTV

Trường này xác định có byte đệm trong gói RTP hay
Phần đệm (P)
không

Phần mở rộng Nếu bit này được đặt bằng 1 thì phần mở rộng theo ngay
(X) sau tiêu đề cố định

Tổng số nguồn Trường này chứa thông tin số bộ nhận diện CSRC có
góp (CSRC) trong gói

Chức năng của nó được xác định bởi mô tả RTP.


Bit dấu
Thường được sử dụng để xác định ranh giới khung

Trường này chứ thông tin về định dạng payload của


Loại Payload
IPTV. Ví dụ, giá trị 34 chỉ ra nội dung video được mã hóa
(PT)
sử dụng H.263

Trường này giúp tìm ra được những gói bị mất, lỗi. Giúp
cho IPTVCD sắp xếp lại các gói được gửi tới không theo
thứ tự, xác định đúng kính thước gói không đúng và chỉ
Số thứ tự gói ra gói bị lặp. Giá trị trong trường được tăng lên một mỗi
lần một gói RTP được gửi qua mạng. Khi dòng IPTV bắt
đầu, một giá trị bất kì được gán cho trường này để giảm
rủi ro bị hacker tấn công

Dấu thời gian Trường này giữ dấu thời gian của gói, được khởi tạo từ
một đồng hồ đáng tin cậy. Trường này được sd để thêm
vào trong các gói âm thanh và hình ảnh đúng theo thứ tự

41
thời gian của dòng IPTV

Mục đích của trường này để chỉ ra nguồn đồng bộ trong


Nguồn đồng bộ mạng IPTV. Trường này thường được sử dụng kết hợp
(SSRC) với trường số thứ tự gói để sửa những vấn đề xảy ra
trong chuỗi IPTV

Danh sách Mục đích của trường 32 bit này để chỉ ra những nguồn
CSRC video và audio góp vào payload IPTV

Hình 3.10 Các gói MPEG TS

Hình 3.11 Ánh xạ nội dung H264/AVC ( từng khối NAL riêng biệt ) sang RTP
payload

42
Hình 3.12 Ánh xạ nội dung H264/AVC ( nhiều khối NAL riêng biệt ) sang một RTP
payload

Hình 3.13 Ánh xạ nội dung một H264/AVC NAL sang nhiều RTP payload

43
Khối NAL tập hợp được định nghĩa để xác định dung lượng gói lớn nhất đối với
mỗi mạng. VD, với mang Ethernet kích thước gói lớn nhất là 1500 byte, còn với mạng
ATM kích thước gói lớn nhất là 54 byte. Dùng các gói NAL tập hợp để ánh xạ nhiều gói
NAL sang 1 phần payload RTP không cần phải chuyển mã và thêm nhiều tiêu đề gói
khi triển khai IPTv trên các nền.
(3) Gói NAL phân tách: Đây là kĩ thuật để ánh xạ 1 khối NAL riêng rẽ ra khỏi
nhiều phần payload RTP. Cấu trúc của một gói Nal phân tách được mô tả như trong
hình 3.13).
Điểm đáng chú ý là gói phân tách NAL phải được gửi qua mạng theo 1 trật
tự liên tiếp. điều này là có thể khi sử dụng các số tăng dần trong header của
RTP.Kĩ thuật này đem lại 2 lợi ích cho nhà cung cấp dịch vụ. Thứ 1, điều này giúp
truyền lượng lớn chương trình có độ phân giải cao dựa trên IP. Thứ 2 là giúp tăng
khả năng sửa lỗi.

Chú ý rằng, kĩ thuật RTP thường được triển khai trong các mạng không đảm
bảo chất lượng dịch vụ QoS để truyền các dịch vụ IPTV. Mặc dù RTP giúp làm tăng
khả năng các dòng tới đích trong trật tự đúng, nhưng không được thiết kế để đảm bảo
các mức chất lượng dịch vụ. Do đó, trách nhiệm của nhà cung cấp dịch vụ là đản bảo
video luôn được ưu tiên khi chúng được truyền đi trong hạ tầng mạng.

3.2.5 Lớp truyền tải:


Thông thường các gói RTP là dạng đầu vào của lớp truyền tải. Điều đáng
chú ý là có thể ánh xạ trực tiếp các gói MPEG-TS sang payload giao thức của lớp
truyền tải.
Lớp truyền tải IPTV được thiết kế để đảm bảo các kết nối đầu cuối là tin cậy.
Nếu dữ liệu tới thiết bị người nhận đúng. Lớp truyền tải sẽ truyền lại. Lớp truyền tải
thông báo với lớp trên để có các thông tin chính xác hơn.
TCP và UDP là 2 giao thức quan trong nhất được sử dụng ở lớp này.

a) Sử dụng TCP để định tuyến các gói IPTV :


TCP là giao thức cốt lõi của bộ giao thức internet và được xếp vào loại định
hướng kết nối. Điều này cơ bản có nghĩa là kết nối được thiết lập giưa đầu cuối
nhà cung cấp và thiết bị IPTV cua người sử dụng để truyền các chương trình qua
mạng.
TCP có khả năng điều khiển lỗi xảy ra trong quá trình truyền các chương
trình qua mạng. Các lỗi như mất gói, mất trật tự gói,hoặc lặp gói thường gặp trong
mô trương truyên IPTV. Để xử lí các tình huống này, TCP sử dụng hệ thống các số
liên tục để cho phép thiết bị gửi có thể gửi lại các dữ liệu hình ảnh bị mất hoặc
hỏng. Hệ thống số liên tục này là trường có độ dài 32 bit trong cấu trúc gói. trường
đầu tiên chứa chuỗi số bắt đầu của dữ liệu trong gói và trường thứ hai chứa giá trị

44
của chuỗi số tiếp theo mà video server đang đợi (mong) nhận trở lại từ IPTVCD

Hình 3.14 Cơ chế điều khiển luồng của TCP

Bên cạnh việc sửa các lỗi có thể xảy ra trong quá trình truyền nội dung video qua
mạng IP băng rộng, TCP còn có điều khiển luồng dữ liệu. Điều này có thể đạt được
bằng cách sử dụng trường kích thước cửa sổ, với thuật toán được gọi là cửa sổ trượt.
Giá trị trong trường này xác định số các byte có thể truyền đi qua mạng trước khi nhận
được xác nhận từ phía thiêt bị nhận.
Trong môi trường IPTV, giá trị trường kích thước cửa sổ chính là kích thước
vùng đệm trong IPTVCD trừ đi lượng nội dung đã có trong vùng đệm tại một thời điểm.
Dữ liệu này sẽ được giữ cho tới khi bản tin thông báo đã nhận được gửi về từ IPTVCD.
Khi giá trị của trường này bằng 0, IPTVCD ở phía đầu thu sẽ không đủ khả
năng xử lí các dữ liệu IPTV ở tốc độ đủ lớn. khi đó, TCP sẽ chỉ thị cho video server
dừng hoặc làm chậm lại tốc độ gửi các gói dữ liệu tới IPTVCD. Điều này sẽ đảm bảo
rằng IPTVCD sẽ không bị tràn các gói dữ liệu tới. Khi IPTVCD đã xử lí xong các các
gói dữ liệu trong vùng đệmvà video server đã biết được điều đó thì giá trị tại vùng đệm
sẽ tăng lên, và video server sẽ bắt đầu truyền tiếp các nội dung. Trong môi trường
IPTV lí tưởng, số của cửa số được báo về từ IPTVCD sẽ báo cho server biết không
gian vùng đệm còn trống chính la tốc độ mà tại đó các nội dung video được gửi đi từ

45
video server.

Các cổng TCP và Socket: Mỗi điểm cuối của 1 liên kết IPTV thì có 1 địa chỉ
IP và 1 giá trị cổng liên quan. Vì thế mỗi liên kết có 4 thành phần khác nhau:
(1) Địa chỉ IP của video server
(2) Số của cổng của video server
(3) Địa chỉ IP của IPTVCD
(4) Số của cổng của IPTVCD

Việc kết hợp địa chỉ IP và số của cổng cho phép 1 tiến trình trên IPTVCD có thể
liên lạc trực tiếp với tiến trình đang chạy trên một trong các máy server được đặt ở trung
tâm dữ liêu IPTV. Một cổng gồm 16 bit để định nghĩa hướng để truyền các thông báo
giữa các lớp mạng. Có 2 loại cổng :

• Cổng well known có giá trị từ 1 đến 1023. Loại cổng này thường được các
server sử dụng và được quản lí bởi IANA
• Cổng Ephemeral được thiếu lập bởi IPTVCD ở trạng thái tạm thời khi liên lạc
với IPTV server. Các cổng thường được nhớ trong ngăn xếp phân mềm IP. Các giá trị
này thường lớn hơn 1024 và nhỏ hơn65535. Cổng này không chịu sự quản lí của IANA.

Socket cũng là một thành phần quan trọng khác trong mô hình truyền thông IP.
Một socket về cơ bản là 1 giao diện ứng dụng chương trình (API), được sử dụng để
làm cho làm việc liên lạc giữa các tiến trình đang chạy trên 1 thiết bị IP. Một socket
được thiết đặt bằng cách kết hợp địa chỉ IP với số của cổng.

Hình 3.15 Quá trình truyên thông trong mạng IPTV

46
Để hiểu hơn về mối liên hệ giữa địa chỉ IP và socket xét các bước để thiết lập 1
kênh truyền thông giữa 1 tiền trình chạy trên IPTVCD và 1 tiền trình chạy trên trung
tâm cung cấp dữ liệu IPTV. Bước được mô tả như sau:
(1) Chuẩn bị dữ liệu: Tiến trình gửi chạy trên hệ thống server dong IPTV chuẩn
bị nôi dung và gọi module truyền thông TCP/IP để truyền các dữ liệu tới 1 tiến trình đang
chạy trên một IPTVCD. Các tiến trình truyền thông bắt đầu và thông tin header được
thêm vào nội dung khi truyền qua các lớp trong IPTVCM.
(2) Thiết lập kết nối logic TCP: Cả 2 đầu kết nối đều được định nghĩa bởi
1 địa chỉ IP và 1 số cổng. kết hợp giữa địa chỉ IP và số cổng gọi là socket.Hệ
thống địa chỉ đối với liên kết truyền thông bao gồm các thành phần sau:
Giao thức
Địa chỉ IP của máy chủ IPTV
ID của tiến trình chạy trên máy chủ IPTV
Địa chỉ IP của IPTVCD
ID của tiến trình chạy trên IPTVCD

(3) Truyền dữ liệu: Truyền thông bắt đầu thông qua socket giữa 2 tiến trình từ
phía IPTV server đến IPTVCD
(4) Quản lí các dòng nội dung IPTV: giao thức TCP quản lí các dòng
IPTV trong khi kết nối được thiết lập
(5) Hủy bỏ kết nối: Khi hoàn thành việc truyền các nội dung IPTV,
IPTVCD hoặc trung tâm dữ liệu sẽ hủy bỏ socket và kết nối mạng

Header: Thông tin này giúp cho segment được truyền đi từ nguồn đến
đích. Header mang thông tin chính là số cổng của nguồn và đích, số chuỗi của
segment và kiểm tra tổng. Các số tổng đảm bảo rằng dữ liệu có thể tới và trở về
từ đúng các tiến trình đang chạy trên mỗi thiết bị IP. Số chuỗi giúp TCP có thể
hiểu được bằng cách nào để đưa dữ liệu về dạng trước khi bị gắt thành các
segment.
Dữ liệu video:
Bảng 3.4 Định dạng của TCP segment

Tên trường Chức năng


Cửa nguồn Trường 16 bit. Chỉ ra số của cổng nguồn
Cổng đích Trường 16 bit. Chỉ ra số của cổng đích
Chỉ ra chỉ số dãy của đoạn TCP. Điều này giúp
Chỉ số dãy TCP theo được vết của mỗi gói IPTV
chuyển qua mạng

47
chứa chỉ số dãy tiếp theo mà thiết bị gửi mong
Chỉ số chấp
muốn nhận được. Trường này chỉ chứa giá trị này
nhận
nếu bít điều khiển ACK được thiết lập
trường ngắn này chỉ ra vị trí trong đoạn mà dữ liệu
Độ dời dữ liệu
video bắt đầu
Được đặt Trường này được đặt trước để sử dụng sau này và
trước có giá trị bằng 0
Trường này gồm có 6 bít điều khiển:
URG: Urgent pointer
ACK: Acknowledgment
Các bit điều
PSH: Push
khiển
RST: Reset (đặt lại liên kết)
SYN: Synchronize (đồng bộ chỉ số dãy)
FIN: không có thêm dữ liệu từ bên gửi
Chỉ ra kích thước cửa sổ cho dữ liệu phân phối
Cửa sổ
giữa những lần nhận
Checksum Kiểm tra lỗi để bảo vệ dữ liệu được gửi qua mạng
con trỏ khẩn Chỉ được dịch khi trường con trỏ khẩn cấp được
cấp cho phép
Các tùy chọn là các bội số 8 bit có sẵn và có thể
chứa các kiểu biến khác nhau. Các tùy chọn được
Các tùy chọn
lựa chọn sẽ quyết định độ dài của đoạn TCP. Đệm
và đệm
là phần cuối cùng của tiêu đề và tạo thành bởi các
số 0

TCP ánh xạ segment sang giao thức IP sau khi chèn các thông tin cần thiết
vào trong phần header.Như đã mô tả ở trên, TCP cung cấp toàn bộ các chức
năng để truyền tải các dữ liệu qua mạng IP.
b) Sử dụng UDP để định hướng các gói IPTV
:
UDP là giao thức thuộc về bộ giao thức Internet. UDP cho phép máy chủ kết nối
với mạng băng rộng để gửi tới các IPTVCD dịch vụ truyền hình quảng bá có chất lượng
hài lòng người dùng. UDP giống với TCP nhưng là phiên bản sơ lược hơn, đưa ra cho
số lượng tối thiểu các dịch vụ truyền tải. UDP là giao thức không liên kết, điều đó có
nghĩa là kết nối giữa video server và IPTVCD ko cần phải thiết lập trước khi dữ liệu được
truyền đi. Video server dơn giản chỉ thêm vào địa chỉ IP đích và số cổng vào datagram
và gửi tới cơ sở mạng để phân phát tới địa chỉ IP đích.
Khi trên mạng, UDP sd cách tốt
nhất để cố gắng thu được dữ liệu về điểm đích của nó. Chú ý rằng UDP sử dụng các
khối dữ liệu được gọi là các datagram để truyền nội dung qua mạng.
UDP datagram: UDP datagram bao gồm 8 byte header và dữ liệu video.
Các thành phần cơ bản của 1 UDP datagram được mô tả trong hình 3.16 và bảng
3.5
Ưu điểm và nhược điểm của UDP:

48
Ưu điểm của UDP:
• Không có ngắt trong quá trình truyền nội dụng video: không có trễ trong
quá trình phân phối ngay cả khi trong mạng có các gói bị trễ hoặc bị hỏng. Ngược
lại, khi sử dụng TCP, có thể xảy ra sự ngắt quãng khi phải chờ các gói bị trễ và các
khung hình tới hoặc phải chờ các gói bị hỏng được thay thế.
• Dung lượng thấp: Kích thước header của UDP chỉ bao gồm có 8 byte
trong khi TCP header chiếm tới 20 byte.
• Tốc độ thiết lập kết nối: thời gian thiết lập và hủy bỏ kết nối giữa IPTVCD
và các thiết bị ở trung tâm dữ liệu IPTV ngắn. Do đó, việc phân phối các gói sử
dụng giao thức UDP thương nhanh hơn so với sử dụng giao thức TCP.
• Hỗ trợ truyền 1 chiều: UDP không yêu cầu đường về, do đó cho phép các
công ty sử dụng vệ tinh có thể truyền nội dung IPTV truyền đa điểm tới khách hàng
của mình.

Nhược điểm của UDP:


Mặc dù UDP là nhanh chóng và hiệu quả đối với các ứng dụng cần thời
gian, và sẽ là không hiệu quả trong trường hợp:

• Tính toàn vẹn của dữ liệu: Tính toàn vẹn của dữ liệu khi sử dụng UDP là
không được bảo đảm khi UDP chỉ cung cấp 1 dịch vụ duy nhất là kiểm tra tổng và
multiplexing thông qua số cổng. bất kì vấn đề nào cũng có thể xảy ra trong quá
trình truyền thông ở tại đầu cuối nào cần được điều khiển độc lập với các ứng
dụng. Các vấn đề thường gặp như là phát lại, đóng gói và lắp ráp lại, truyền lại các
gói bị mất, sự tắc nghẽn, và điều khiển luồng nằm ngoài khả năng sửa lỗi của
UDP.

• Khó khăn trong việc vượt qua các tường lửa: Nhiều loại tường lửa trên
mạng chặn các thông tin UDP gây ra các lỗi trong quá trình truyền thông. Đây
không phải là vấn đề lớn đối với các nhà cung cấp dịch vụ IPTV, tuy nhiên nó cũng
ảnh hưởng tới các công ty cung cấp dịch vụ Internet TV.

49
Hình 3.16 Định dạng datagram dựa trên UDP

Bảng 3.5 Cấu trúc datagram IPTV dựa trên UDP


Tên trường Chức năng
chỉ ra chỉ số cửa của quá trình gửi datagram. Nó
Cửa nguồn là cửa tùy chọn và nếu không được
dùng thì sẽ được điền đầy bằng các số 0
Chỉ ra chỉ số cửa của quá trình đích đang chạy
Cửa đích
trên IPTVCD
Giúp cho IPTVCD xác định độ dài và kích thước
của datagram UDP đang đến. Trường độ
Độ dài
dài bao gồm một giá trị hệ 8, bao gồm cả tiêu đề
và dữ liệu video thực sự.
Trường này dài 2 byte chứa số được định trước,
cho phép một IPTVCD kiểm lại tính
Checksum
nguyên vẹn của UDP đang đến dựa trên
datagram IPTV.
Phần này của datagram chứa dữ liệu video. Trong
trường hợp môi trường IPTV,
Dữ liệu video dữ liêu là một phần của datagram UDP được định
dạng bởi giao thức dòng video và
audio mà được sử dụng tại đầu cuối IPTV

Đối với IPTV, UDP tỏ ra hữu ích khi trung tâm dữ liệu cần gửi các nội
dung video IP tới nhiều IPTVCD và là giao thức mức truyền tải phổ biến nhất mà
các nhà cung cấp dịch vụ IPTV.

50
c) Sự khác biệt giữa TCP và UDP:
Khi các nhà cung cấp dịch vụ phát các nội dung IPTV tới các thuê bao, điều quan
trọng là các nội dung này phải đến thiết của
bị người dùng đúng lúc và trong dạng đúng.
Nói cách khác, các gói video phải không bị ngắt quãng. Do đó, các nhà cung cấp dịch vụ
cần chắc chắn sử dụng giao thức hỗ trợ khả năng phân phối qua hạ tầng mạng.
Mặc dù TCP cung cấp các ứng dụng với nhiều đặc trưng về mạng so với
UDP, nhưng các nhà cung cấp dịch vụ IPTV không thường chọn TCP là giao thức
tryền tải.Điều này chỉ ra 1 thực tế rằng IPTV là ứng dụng thời gian thực và không
có trễ. TCP có thể đưa ngầm vào sự phân phối nội dung video IP do thực tế rằng
giao thức sử dụng cơ chế điều khiển dòng. Đặc điểm và hạn chế cuảTCP đối với
phân phối chương trình thời gian thực:
Cân bằng giữa độ nhạy và độ trễ---- IPTV ít nhạy với mất hoặc ngắt gói hơn
là với độ trễ. Việc truyền lại các gói nâng cao độ tin cậy của kết nối giữa máy chủ
và thiết bị truy cập IPTV. Tuy nhiên, khi việc truyền lại diễn ra nhiều thì sẽ làm độ trễ
tăng lên.
TCP là giao thức kết nối liên kết---- Như đã trình bày ở trên TCP yêu cầu
thiết lập kết nối logic giữa máy chủ và IPTVCD trước khih truyền các nội dung
IPTV. Khi người xem chuyển từ kênh này sang kênh khác cũng sẽ gây ra độ trê
đối với môi trường truyền hình trực tiếp của IPTV.
Hỗ trợ sửa lỗi---- TCP cung cấp nhiều tính năng, đáng chú ý là khả năng
sửa lỗi và điều khiển luồng. Tuy nhiên, việc sửa lỗi trong mạng IP video có thể làm
giảm chất lượng dịch vụ tới khách hàng.
Đặc điểm của truyền video: video bao gồm 1 chuỗi các ảnh liên tiếp, bất cứ
khi nào xảy ra ngắt với tốc độ mà tại đó các hình ảnh này được xử lí và hiển thị
trên ITVCD cũng làm giảm chất lượng hình ảnh hiển thị và ảnh hưởng tới người
sử dụng. Thời gian xử lí mỗi ảnh riêng biệt chỉ mất khoảng 1 phần của giây. Nếu
sử dụng TCP để sửa lỗi do ngắt, cơ chế sửa lỗi như sau:

(1) IPTVCD sẽ báo gói dữ liệu bị lỗi bằng việc đặt cờ.
(2) Một bản tin sẽ được gửi tới máy chủ IPTV để thông báo cho ứng dụng
biết 1 trong các gói nhận được bị ngắt.
(3) Dưới sự quản lí của TCP, máy chủ cần phải tìm ra và gửi lại gói bị ngắt.
(5) IPTV CD nhận được gói mới trong vung đệm và hiển thị nội dung video
trong gói đó.
Trong khi TCP thực hiện các bước ở trên, IPTVCD phải chờ gói bị lỗi được
truyền lại và phải để trống luồng video hoặc bỏ qua gói truyền lại khi nhận được,
Do đó kĩ thuật sửa lỗi của TCP là không cần thiết.

Mất gói IP----- quá trình xử lí mất các gói IPTV nhiều hay ít cũng giống như
quad\s trình sửa ngắt gói IPTV. Các gói bị mất cũng cần được truyền lại, gây ra ảnh

51
hưởng bất lợi tới dich vụ phân phối IPTV.

Hỗ trợ điều khiển luồng---- Bên cạnh vấn đề sửa lỗi và thiết lập kết nối logic,
giao thức TCP còn hỗ trợ điều khiển tốc độ bit luồng dữ liệu gửi đi, có thể gây ra nhiều
trở ngại trong việc truyền và nhận nội dung IPTV. Trở ngại này xảy ra khi vùng đệm
IPTV bắt đầu tràn các gói IPTV hoặc mạng bị nghẽn. Khi xảy ra trường hợp này, máy
chủ nhận được yêu cầu giảm tốc độ gửi các gói tin lên mạng. Nếu máy chủ thực hiện
yêu cầu giảm tốc độ, có 1 khả năng đó là: khi tốc độ giảm xuống hình ảnh sẽ không
thể hiển thị được. Nếu bản tin dừng được thực hiện, dịch vụ IPTV sẽ bị tắt hoàn toàn.
Không hỗ trợ đa truyền thông---- TCP không hoạt động hiệu quả trong môi
trường đa truyền thông, Do đó, UDP là lựa chọn tốt hơn TCP đối với các dịch vụ
truyền thông như các ứng dụng đa truyêng thông IPTV và truyền quảng bá.
Đây là những nguyên nhân chính TCP ít được sử dụng trong IPTV trực tiếp.
TCP được dùng trong các ứng dụng khác như e-mail, download các chương trình
Internet TV.
Mặc dù, độ tin cậy và khả năng sử lỗi của UDP không bằng TCP nhưng
UDP là giao thức được lựa chọn để phân phát các dịch vụ IPTV . UDP có các
nhược điểm sau: không có khả năng tìm và sửa lỗi. Vấn đề này được khắc phục
bằng cách gắn các hàm sửa lỗi vào các ứng dụng IPTV chạy trên các mạng hoặc
trong chính các dòng video.

3.2.6 Lớp IP:


Sau lớp truyền tải là lớp IP(còn được gọi là lớp liên mạng ) Nhiệm vụ chính của lớp
này là đưa các dữ liệu tới các vị trí mạng riêng biệt thông qua nhiều mạng độc lập được
liên kết với nhau được gọi là liên mạng. Lớp này được sử dụng để gửi các dữ liệu thông
qua các đường khác nhau tới đích. IP là giao thức tốt nhất được sử dụng trong lớp liên
mạng. giao thức này cung cấp dịch vụ phân phát gói cơ bản cho tất cả các dịch vụ IPTV.
Các loại dịch vụ này với hệ thống truyền đơn điểm, nơi các gói được truyền từ nguồn tới 1
IPTVCD đích, khác với hệ thống truyền đa điểm nơi mà các gói được truyền từ máy chủ
tới nhiều IPTVCD.
IPv4 là giao thức phổ biến nhất được sử dụng trong mạng IPTV ngày nay.
Nhiệm vụ chính của IP là phân phát các bit dữ liệu trong các gói từ nguồn tới đích. IP sử
dụng kĩ thuật có hiệu quả cao nhất để phân phát dữ liệu. Nói cách khác không có tiến
trình nào đảm bảo quá trình phân phát thông tin qua mạng. Các khối cơ sở của giao
thức IP là các đoạn bit dữ liệu được đặt trong các gói và được định địa chỉ.

Gói IP là đơn vị dữ liệu bao gồm dữ liệu video thực và các thông tin của
việc nhận video từ trung tâm cung cấp dữ liệu IPTV tới đích IPTVCD. Thành phần
chính của một gói IPv4 được mô tả trong hình 3.17 và bảng 3.6.

52
Cách đánh địa chỉ IP: trong môi trường IPTV, địa chỉ IPv4 thường được
dùng để định nghĩa IPTVCD và trung tâm cung cấp dữ liệu. Địa chỉ IPv4 là chuỗi 4
số được ngăn cách với nhau bằng các dấu chấm để định nghĩa 1 cách chính xác
vị trí vật lí của 1 thiết bị, ví dụ như set-top box, trong mạng. Địa chỉ IPv4 gồm 32 bit
trong hệ nhị phân. Các số nhị phân này được chia thành 4 octet, mỗi octet 8 bit,
mỗi octet được đại diện bởi 1 số hệ thập phân nằm trong khoảng từ 0 đến 255. Mỗi
octet được ngăn cách bởi 1 dấu chấm trong hệ thâp phân. Địa chỉ IP được tổ chức
thành 2 phần:

(1) Địa chỉ mạng dùng để định nghĩa mạng băng rộng mà IPTVCD kết nối
tới.

(2) Địa chỉ host dùng để định nghĩa các thiết bị IPTV.

Hình 3.17 định dạng gói video IPv4

Bang 3.6: Cấu trúc gói video IPv4

Tên trường Chức năng


Chỉ ra phiên bản của IP được sử dụng trên mạng
Phiên bản
_ IPv4 hay IPv6
Mô tả kích thước của header, giúp cho IPTVCD
Độ dài Header
nhận ra payload của dữ liệu video bắt đầu ở đâu

53
Còn được biết là điểm mã phân biệt dịch vụ
(DSCP_Differentiated services code point).
Trường này khá quan trọng cho việc phân phối
nội dung IPTV bởi vì nó cho nhà cung cấp dịch vụ
thiết đặt loại nội dung được mang trong gói dữ
Loại dịch vụ
liệu. Thông tin này sau đó được xử lí bởi bộ định
tuyến IP trong hệ thống mạng. Điều này cho phép
các bộ định tuyến chấp nhận và làm cho mức chất
lượng dịch vụ thích hợp với những loại lưu lượng
khác nhau
Báo cho IPTVCD biết toàn bộ chiều dài của gói
Tổng chiều dài IPTV. Giá trị này có độ dài 16bit, có nghĩa là một
gói có thể có kích thước tối đa là 65535 byte
Được bộ định tuyến sử dụng để phân một gói lớn
thành nhiều mảnh nhỏ. Khi được phân mảnh, bộ
thẻ nhận dạng
định tuyến sử dụng trường này để phân biệt các
mảnh khác nhau của gói ban đầu
Các cở xác định các kiểu phân mảnh khác nhau,
hoặc gói là một mảnh, hoặc nó được cho phép
Cờ
phân mảnh, hoặc gói đó là mảnh cuối cùng hay có
thêm mảnh khác.
Khi một gói IPTV được phân mảnh và chuyền đi
qua mạng thì chức năng của IPTVCD là tổng hợp
Độ dời của
các mảnh theo đúng thứ tự. Trường này đánh số
mảnh
mỗi mảnh, cho phép IPTVCD tổng hợp lại theo
đúng thứ tự
Vì một gói IP chuyền qua mạng, trường thời gian
sống sẽ được mỗi bộ định tuyến dọc theo đường
truyền kiểm tra và giá trị bên trong trường này sẽ
được giảm dần. Quá trình này tiếp tục cho đến khi
giá trị trường này giảm về 0. Khi điều này xảy ra
Thời gian sống
có nghĩa là gói này hết hạn và sẽ bị loại bỏ. Chức
năng chính của trường này là để loại bỏ các gói
trên mạng mà không có khả năng truyền đến đích.
Điều này sẽ làm giảm tắc nghẽn trên mạng. Giá trị
của trường này trong khoảng từ 30 đến 32.
Trường dài 8 bit, chỉ ra loại giao thức đóng gói
bên trong datagram IP. Nếu giá trị là một thì sau
Giao thức đó ICMP được dùng, là hai tương ứng với IGMP,
là 6 được sử dụng cho lưu lượng TCP, và 17
được sử dụng cho ứng dụng UDP
Kiểm tra tổng cho phép IPTVCD tách datatgram khỏi header lỗi.
header Gói bị lỗi thường bị IPTVCD loại bỏ hay hủy
Địa chỉ nguồn Chứa địa chỉ IP của thiết bị gửi gói IPTV. Trong
môi trường IPTV, thiết bị gửi thường là máy chủ

54
VoD hoặc là bộ mã hóa.
Chứa địa chỉ của thiết bị nhận được chỉ định.
Địa chỉ đích Trong môi trường IPTV, địa chỉ này thường là địa
chỉ của IPTVCD
Tùy chọn và Được nhà cung cấp IPTV sử dụng để cung cấp
đệm thêm các đặc điểm khác
Dữ liệu Là nội dung video

Một điểm đáng chú ý là một vài bit đầu tiên của địa chỉ sẽ định nghĩa các bit còn
lại của trường địa chỉ sẽ được phân chia thế nào cho host và mạng. Để thuận lợi cho
việc sư dụng và quản lí, địa chỉ IP được chia thành các lớp khác nhau. Chi tiết địa chỉ
các lớp được mô tả trong bảng 3.7.
Trường địa chỉ của mạng và host được mô tả như trong hình 2.18.
Bên cạnh việc chia thành các lớp, một số địa chỉ IP được dành riêng cho các
mạng tư nhân. Các địa chỉ này nằm trong dải:
10.0.0.0 to 10.255.255.255
172.16.0.0 to 172.31.255.255
192.168.0.0 to 192.168.255.255

Bảng 3.7 các lớp địa chỉ IPv4


Lớp địa chỉ IP Mộ tả
Mô tả một mạng sở hữu số đầu tiên trong địa chỉ
IP, có giá trị từ 0 đến 128. Ba số còn lại được
dùng để xác định một IPTVCD, máy chủ, hay thiết
bị mạng khác. Do đó, một địa chỉ lớp A có địa chỉ
mạng 7 bit và địa chỉ host 24 bit. Bit có thứ tự cao
A
nhất được thiết lập bằng 0
Có 126 địa chỉ mạng lớp A trên thế giới và mỗi
mạng trong số đó có đủ số địa chỉ IP để hỗ trợ
hơn 16 thiết bị mạng. Tất cả các địa chỉ IP lớp A
được cấp phép từ InterNIC từ nhiều năm trước.
Một mạng lớp B có địa chỉ gồm số đầu tiên có giá
trị từ 128 đến 191. Giá trị này tương đương với
địa chỉ mạng 14 bit và một địa chỉ cục bộ 16 bit.
Giá trị của 1 và 0 gán cho 2 bit có thứ tự cao nhất.
Có khoảng 16000 mạng lớp B trên Internet, mỗi
B
mạng có khả năng hỗ trợ 64000 thiết bị mạng.
Những tổ chức lớn hơn và các nhà cung cấp dịch
vụ Internet đã cấp phép cho hầu hết hoặc gần hết
các địa chỉ này. Ví dụ về địa chỉ lớp B: 132.6.2.24,
trong đó, 132.6 chỉ ra mạng, 2.24 chỉ ra host.

55
Mạng lớp C có địa chỉ có số đầu tiên có giá trị từ
192 đến 223. Số này tương đương với một địa chỉ
mạng 21 và địa chỉ cục bộ 8 bit. Giá trị 1,1 và 0
C
được gán cho 3 bit có thứ tự cao nhất. Có gần 2
triệu địa chỉ mạng lớp C, mỗi mạng có khả năng
hỗ trợ đánh địa chỉ cho 254 thiết bị mạng.
Là phần đầu tiên của địa chỉ có giá trị từ 224 đến
D 239. Những địa chỉ IP này được sử dụng cho mục
đích truyền đa điểm
Địa chỉ mạng lớp E có giá trị từ 240 đến 247 và
E
được đặt trước để sử dụng sau này

Hình 3.18 các lớp địa chỉ IP

d) Mạng con IPTV:


Trong các mạng lớn IPTV với hàng ngàn IPTVCD trải rộng trên 1 khu vực địa lí
rộng., mạng dựa trên IP này cần được chia thành các mạng nhỏ hơn gọi là mạng con.
Mạng con của mạng IPTV cho phép nhà cung cấp dịch vụ định nghĩa và giám sát các
phần riêng biệt trong mạng mà không cần địa chỉ IPv4 mới. Người điều hành mạng cũng
sử dụng địa chỉ mạng con để giấu đi cấu trúc mạng nội bộ để trách bị tấn công từ mạng

56
Internet công cộng. Người quản trị mạng IPTV sử dụng các số riêng biệt đưccj gọi là địa
chỉ subnet mask để tạo các mạng con trong môi trường IPTV. Subnet mask là địa chỉ
IP32 bit. Giá trị mặc định cảu subnet mask của lớp A, B, C là:
Class A----- 255.0.0.0
Class B----- 255.255.0.0
Class C-----255.255.255.0
Các tiến trình chạy trên mạng con thường được quản lí bởi thiết bị phần cứng gọi
là router. Một router có thể nối với nhiều mạng và quyết định thông tin sẽ được gửi đến
đâu trong mạng.

e) Tương lai của địa chỉ IP:


Khi cấu trúc địa chỉ IP của mạng Internet mới được phát triển trong những
năm đầu của thập kỉ 80, người ta đã cho rằng nó đáp ứng được nhu cầu của
người dùng hiện tại và trong tương lai. Địa chỉ IP 32 bit trong vesion IPv4 có thể
đánh địa chỉ cho hơn 4 tỉ máy trạm trong khoảng 16,7 triệu mạng khác nhau.Địa
chỉ IPv4 không đáp ứng được nhu cầu tốc độ phát triển của mạng Internet như
hiện nay.Tốc đọ phát triển của mạng Internet đã nằm ngoài dự đoán của những
người phát triển giao thức IP và số lượng mạng kết nối với mạng Internet tăng lên
từng tháng.
Để tìm giải pháp cho hạn chế của địa chỉ IPv4, Nhóm Kĩ Sư mạng Internet đã đưa ra
vesion mới IPv6 với 128 bit địa chỉ. . IPv6 có thể cung cấp lượng địa chỉ gấp hàng tỉ lần số
địa chỉ IPv4. IPv6 có cả các khả năng cung cấp hỗ trợ việc xác thực, tính toàn vẹn QoS, mã
hóa và bí mật. Việc sử dụng IPv6 trên mạng IPTV là thích hợp bởi vì cơ chế QoS bên trong
nó và có khả năng hỗ trợ số lượng không giới hạn các IPTVCD.Trong 5 tới 10 năm tớ, IPv6
sẽ dần thay thế IPv4.
Tại sao lại sử dụng IPv6 khi triển khai IPTV ? IPv6 có tính năng vượt trội hơn
so với IPv4. Các nguyên nhân chính khiến các nhà cung cấp dịch vụ xem xét việc sư
dụng IPv6:
Quy mô được tăng lên: IPv4 dùng địa chỉ 32 bit trong khi IPv6 dùng địa chỉ
128 bit, lớn hơn gấp 4 lần. Điều này cho phép nhà cung cấp dịch vụ IPTV mở rộng
số lượng thiết bị có thể quản lý .
Cấu trúc header đơn giản: IPv6 giảm kích thước header xuống còn 40
byte cố định và đơn giản cấu trúc của trường header. Các thành phần cơ bản
của IPv6 header được mô tả trong hình 3.19 và bảng 3.13.
Tăng mức độ bảo vệ: IPv6 có 2 đặc điểm giúp tăng mức độ bảo vệ:
(1) Bao gồm header xác thực----- bao gồm các bản tin xác nhận và kiểm tra
người gửi gói.
(2) Payload bảo mật được đóng gói----- đặc điểm này đảm bảo tính toàn vẹn
của dữ liệu IPTV và bảo mật giữa các máy chủ trung tâm dữ liệu IPTV và các IPTVCD
khác.

57
Lưu lượng thời gian thực tốt hơn: khả năng dán nhãn luồng của IPv6
cho phép nhà cung cấp dịch vụ đánh dấu các gói riêng, phù thuộc vào từng loại
dịch vụ. Trong môi trường triple-play, các router có thể coi các gói IP được dán
nhãn với một nhận dạng video là các gói IP được dán nhãn khi mang nội dung
web.
Tự động cấu hình: Khả năng plug and play của IPv6 giúp giảm bớt độ phức
tạp khi cài đặt dịch vụ IPTV tại nhà của khách hàng.

Hình 3.19 Cấu truc header của IPv6

Bảng 3.8 Mô tả trường của IPv6


Tên trường Chức năng
Mã bắt đầu
Các gói PES bắt đầu bằng các bit 0
của gói
Trường này dùng để định nghĩa loại payload chứa
Định dạng trong gói. Dạng 111x xxxx
dòng là chỉ gói âm thanh, và 1110 xxxx chỉ các gói hình
ảnh. “x” là số dòng MPEG
Độ dài gói 2 byte của trường này dùng để định nghĩa độ dài
PES gói
Mã đồng bộ Trường này được sử dụng để đồng bộ âm thanh
và nội dung video cung cấp phần cứng
và phần mềm trong bộ mã hóa đặt trong set- top
box IP với các thông tin thêm. Trong
trường này còn bao gồm các cờ:
Cờ điều khiển trộn âm PES: báo cho bộ mã hóa

58
biết liệu gói có được đảm bảo không trong quá
trình xử lí trộn âm.
Cờ ưu tiên PES: Cung cấp thông tin về mức ưu
tiên của gói PES cho bộ giải mã.
Data_alignment_indicator : Cờ chỉ thị này sẽ xác
định xem phần payload của PES bắt đàu với bit
âm thanh hay hình ảnh,
Thông tin bản quyền: khi bit nay được thiết lập,
chương trình đó là chương trình có bản quyền.
Cờ nguyên bản hay bản sao: Cờ này chỉ thị liệu
chương trình đó có phải là bản gốc, hay la bản
sao.
trường này dùng để định nghĩa tông số byte được
Độ dài dữ liệu
sử dụng bởi các
header
trường header khác.
Các trường
header Trường này chứa các số các bit tùy chọn
trong PES
Trường
Trường payload của PES chứa các dòng cơ bản
payload và
âm thanh
dữ liệu video

Vì những ưu điểm kể trên IPv6 được xem như giải pháp lâu dài để hỗ trợ
triển khai các thiết bị số ở quy mô lớn, có thể sử dụng nhiều loại ưng dụng dựa
trên IP.
Nhược điểm chính khi sử dụng giao thức IP là không có gì đảm bảo rằng
khi nào các gói tới đúng đích hay gói có đến đúng lúc không.ngay cả thứ tự các
gói được chuyển đến cũng không được xác định. Do đó, lớp IP làm việc cùng với
giao thức lớp truyền tải để đảm bảo rằng các gói đến IPTVCD đúng lúc và theo
trật tự đúng. IP cũng làm cho quá trình phân phát nội video bị trễ.

3.2.7 Lớp liên kết dữ liệu:


Lớp liên kết dữ liệu lấy các dữ liệu thô từ lớp IP và định dạng chúng thành
các gói phù hợp để truyền qua mạng vật lí. Chú ý, lớp liên kết dữ liệu khác với
các giao thức mạng. Kĩ thuật Ethetnet là một trong những kĩ thuật phổ biến hơn
được sử dụng trong hệ thống IPTV. Lớp liên kết dữ liệu bao gồm các chức năng
dành cho các mạng dựa trên Ethernet:
Encapsulation---- Lớp này thêm vào các gói IPTV 1 header. Ethernet header
là loại Encapsulation phổ biến nhất dùng trong lớp liên kết dữ liệu của IPTVCD.
Các thành phần cơ bản của Ethernet header được giải thích trong bảng 3.9.
Định địa chỉ---- Lớp liên kết dữ liệu xử lí các địa chỉ vật lí của mạng người
sử dụng và các thiết bị chủ. Hệ thống địa chỉ khác nhau với các topo mạng. Ví

59
dụ, địa chỉ MAC được sử dụng trong mạng Ethernet. Mỗi thiết bị kết nối với
mạng IPTV thì có 1 địa chỉ MAC. Độ dài của địa chỉ MAC là 48 bit và thường
được biểu diễn bằng 12 số trong hệ 16. Trong 12 số hệ 16 này, 6 số đầu tiên để
dành cho nhà sản xuất thiết bị IPTV và các số còn lại được dùng để định nghĩa
giao diện mạng ảo.
Kiểm tra lỗi----- chức năng kiểm tra lỗi được dùng trong vài lớp của mô hình
IPTV, bao gồm cả lớp liên kết dữ liệu. Các gói bị ngắt là lỗi thường gặp trong quá trình
truyền các nội dung video qua mạng dựa trên IP. Phương pháp sửa lỗi thường dung là
kiểm tra dư thừa vòng (CRC) trong IPTV để tìm và loại bỏ các gói bị ngắt. Sử dụng kĩ
thuật CRC thiết bị gửi IPTV thực hiện việc tính toán trên các gói và lưu trữ kết quả trong
gói. Các phép tính toán tương tự cũng được thưc hiện trên thiết bị nhận khi nhận được
các gói. Nếu kết quả tính toán là như nhau, thì các gói được xử lí bình thường. Tuy
nhiên, nếu kết quả này là khác nhau, thì gói bị lỗi sẽ bị loại bỏ.Thiết bị gửi sẽ tạo một
gói mới và gửi lại nó. Thông báo với lớp trên trong mô hình IPTV khi có lỗi xảy ra là
nhiệm vụ chính của lớp liên kết dữ liệu trong kĩ thuật kiểm tra lỗi mà các hệ thống IPTV
end to end.
Điều khiển luồng---- Điều khiển luồng là một trong chức năng của lớp truyền
tải. Trong mạng IPTV, điều khiển luồng cho thiết bị IPTV của người sử dụng không
bị tràn bởi các nội dung. Lớp liên kết dữ liệu cùng với lớp truyền tải thực hiện bất kì
yêu cầu điều khiển luồng nào.

Bảng 3.9 Cấu trúc của Ethernet header


Tên
Kích
trường
thước Chức năng
trong
(bit)
Header
Địa chỉ
đích mạng 48 Chỉ ra địa chỉ của giao diện đích
Ethernet
Địa chỉ
nguồn
48 Chỉ ra địa chỉ của giao diện nguồn
mạng
Ethernet
Chỉ ra giao thức được sử dụng trong việc
Loại mã 16 định dạng gói. Ví dụ kiểu gói "TCP/IP"
chứa giá trị kiểu hex "0 x 80 0 x 00"

60
Bảng 3.10: Cấu trúc khung Ethernet được dùng để mang nội dung
MPEG-2

Mô tả Kích thước
Mỗi gói có kích thước 188 byte (184 byte chứa
Các dòng gói
nội dung video, cộng với 4 byte được
truyền
dùng làm thông tin header). Gói MPEG - TS bảy
tải MPEG bảy
này chiếm 1316 byte (10528 bit) của khung
Tiêu đề RTP Tiêu đề này chiếm 12 byte của khung Ethernet
Tiêu đề UDP Tiêu đề này chiếm 8 byte của khung Ethernet
Tiêu đề IP Tiêu đề này chiếm 20 byte của khung Ethernet
Tiêu đề
Tiêu đề này chiếm 14 byte của khung Ethernet
Ethernet

3.2.8 Lớp vật lí:

Lớp vật lí quy định luật lệ truyền các bit số qua mạng. Nó đề cập đến việc
đưa các dữ liệu qua các mạng vật lí riêng biệt như x DSL, và không dây. Lớp này
định nghĩa cấu hình mạng vật lí, thông số kĩ thuật, điện trong môi trường truyền.
Khi dòng bit được truyền qua mạng, các gói được chuyênr từ lớp thấp đến lớp
cao trong mô hình truyền thông IPTV. Ví dụ lớp liên kết dữ liệu sẽ kiểm tra các gói và
loại bỏ đi phần header Ethernet và trường sửa lỗi CRC. Tiếp đó sẽ kiểm tra trường
kiểu mã của Ethernet header và xác định gói cần được xử kí bởi giao thức IP. Do đó
gói dữ liệu được chuyển lên lớp mang. Lớp mạng kiểm tra và loại bỏ đi phần IP header
và chuyển gói đó lên lớp truyền tải. Phương pháp bỏ đi phần header khi qua các lớp
khác nhau gọi là bóc gói. Quá trình này tiếp tục đươc thực hiện cho tới khi gói dũ liệu
lên đến tưng trên cùng trong mô hình. Hình ảnh gôc được thể hiện trên màn hình TV
của người xem.

61
Bảng 3.11 Tổng kết các lớp trong mô hình IPTV

số
thứ
Tên lớp Tổng quan
tự
lớp
Xác định các thuộc tính của các phương tiện
1 Vật lý truyền thông trong mạng chịu trách nhiệm
truyền các bit dữ liệu IPTV
Quản lý các cơ chế được sử dụng để truy cập
Liên kết dữ thiết bị truyền thông trong mạng. Kiểm soát lỗi,
2
liệu đồng bộ và điều khiển luồng là những chức
năng khác mà lớp này cung cấp.
Chức năng của lớp này có quan hệ với việc
định tuyến các gói IP truyền trên mạng. Các cơ
3 IP
chế như là đánh địa chỉ và điều khiển tắc
nghẽn thương được lớp IPTVCM này sử dụng
Chức năng chính của lớp này là để đảm bảo
4 Giao vận rằng các gói IPTV đến được đích. TCP
và UDP đều vận hành tại lớp này
Mặc dù UDP là giao thức được lớp giao vận
ưu tiên sử dụng hơn cho việc phân phối nội
dung IPTV trên mạng băng rộng, nhưng nó
cũng ko phải là giao thức đang tin cậy và nó
RTP (tùy
5 không hỗ trợ việc sửa lỗi hay giải quyết vấn đề
chọn)
các gói đến IPTVCD không theo đúng thứ tự.
Do đó, một số các nhà cung cấp dịch vụ sử
dụng RTP để giải quyết những thiếu hụt cỗ
hữu trong giao thức UDP.
Xây dựng
Lớp này đóng gói các dòng bít video và audio.
6 dòng
Các gói có độ dài 188 byte
truyền tải
Lớp đóng gói Lớp này tạo một dòng các gói PES đã được
7
Video đánh dấu thời gian
Các dòng audio và video cơ bản làm thành
nền tảng cho lớp IPTVCM. Định dạng của
Mã hóa
8 dòng truyền được sử dụng ở lớp này phụ
Video
thuộc vào thuật toán nén sử dụng bởi bộ mã
hóa

62
KẾT LUẬN
Dịch vụ IPTV với những ưu điểm nổi trội so với các chuẩn truyền hình
truyền thống đã và đang được phát triển mạnh mẽ trên thế giới cũng như ở Việt
Nam. Đi kèm với IPTV là rất nhiều dịch vụ giá trị gia tăng khác như: truyền hình
theo yêu cầu, mạng giáo dục từ xa, hội thảo từ xa, …
Trong phạm vi luận văn này chỉ nêu được tổng quan về dịch vụ IPTV, công
nghệ nén video tiến tiến MPEG-4 Part 10, phương pháp đóng gói dữ liệu video
qua từng lớp. Chuẩn nén MPEG-4 Part 10 này không chỉ được sử dụng trong
IPTV mà còn được ứng dụng trong hầu hết các công nghệ truyền hình số hiện
đại như: truyền hình số mặt đất, truyền hình số vệ tinh, truyền hình cáp, truyền
hình di dộng đến truyền hình phân giải cao HDTV. Đóng gói dữ liệu video qua
từng lớp cho thấy cấu trúc dữ liệu trong từng lớp và các cơ chế điều khiển luồng,
cơ chế sửa lỗi, đảm bảo chất lượng dịch vụ làm hài lòng người xem
Các tài liệu sử dụng trong khóa luận này chủ yếu được lấy từ Internet và
đặc biệt là sự hướng dẫn của thầy giáo TS. Ngô Thái Trị. Khóa luận này còn
nhiều thiếu sót, do đó em rất mong nhận được ý kiến đóng góp của các thầy cô
và các bạn để luận văn này được hoàn thiện hơn.

63
Tài liệu tham khảo:
Tiếng Việt:
[1]. Đố Hoàng Tiến –Dương Thanh Phương, (2004), Truyền hình kĩ thuật
số, NXB Khoa học và Kĩ thuật.
[2]. Ngô Thái Trị, (2004), Truyền hình số, NXB Đại học Quốc gia Hà Nội.

Tiếng Anh:
[3]. Iain E G Richardsob, (2003), H.264 and MPEG-4 Video Compression,
NXB Wiley.
[4]. Gerard O’ Driscoll, (2008), Next Generation IPTV Services and
Technologies, John Wiley & Sons, Inc., Hoboken, New Jersey.
[5]. Thomas Wiegand, Gary J. Sullivan, Gisle Bjontegaard, and Ajay Luthra,
(2003), Overview of the H.264/ AVC Video Coding Standard, IEEE transactions
on curcuit and system for video technology.
[6]. Wes Simpson and Howard Greenfield, (2007), IPTV and Internet Video
Expanding the Reach Television Broadcasting, Focal Press.

64
65
66
67

You might also like