Bé gi¸o dôc vµ ®µo t¹o

TR−êNG §¹I Häc B¸CH KHOA Hµ Néi
------------------------------------------------

LuËn v¨n th¹c sÜ khoa häc

nÐn ¶nh ®éng dïng wavelet

Ngµnh: §iÖn tö viÔn th«ng

NguyÔn H÷u ph¸t

Ng−êi h−íng dÉn khoa häc: PGS TS. Hå Anh Tuý

Hµ néi 2005

0

Môc lôc
Trang Lêi nãi ®Çu .................................................................................................. 4 Ch−¬ng 1 TæNG QUAN VÒ NÐN ¶NH Video THEO CHUÈN MPEG ......................................................................................................................... 6 1.1. Kh¸i niÖm vÒ Video vµ ph−¬ng ph¸p nÐn Video ........................................ 5 1.1.1. Kh¸i niÖm Video ..................................................................................... 5 1.1.1.1. Kh«ng gian mÇu (Color Space)............................................................ 5 1.1.1.2. C¸c c¬ cÊu sè ho¸ tÝn hiÖu Video ........................................................ 6 1.1.2. C¸c ph−¬ng ph¸p nÐn Video ................................................................... 8 1.1.2.1. Gi¶m tèc ®é dßng bit............................................................................ 9 1.1.2.2. NÐn dßng tÝn hiÖu Video sè theo kh«ng gian ..................................... 10 1.1.2.3. NÐn dßng tÝn hiÖu theo thêi gian........................................................ 11 1.1.2.4. NÐn hçn hîp sö dông tæ hîp c¸c ph−¬ng ph¸p trªn .......................... 11 1.1.3. Tham sè nÐn Video. .............................................................................. 11 1.2. Giíi thiÖu chung vÒ chuÈn MPEG ........................................................... 12 1.3. C¸c kh¸i niÖm c¬ b¶n trong nÐn Video theo chuÈn MPEG...................... 14 1.3.1. CÊu tróc ph©n cÊp Video theo chuÈn MPEG. ...................................... 14 1.3.2. Ph©n lo¹i frame Video. ......................................................................... 17 1.3.3. Nhãm ¶nh (GOP: Group Of Picture).................................................... 19 1.4. Ph−¬ng ph¸p nÐn ¶nh Video theo chuÈn MPEG. ..................................... 21 1.4.1. M« h×nh tæng qu¸t bé m· ho¸ Video theo chuÈn MPEG...................... 21 1.4.2. LÊy mÉu th«ng tin vÒ mµu..................................................................... 22 1.4.3. L−îng tö ho¸. ........................................................................................ 23 1.4.4. Néi suy ¶nh. .......................................................................................... 23 1.4.5. Dù ®o¸n bï chuyÓn ®éng. ..................................................................... 24 1.4.5.1. §¸nh gi¸ chuyÓn ®éng (motion estimation)....................................... 24 1.4.5.2. Bï chuyÓn ®éng (Motion Compensation). ......................................... 24 1.4.6. BiÕn ®æi Cosine rêi r¹c. ........................................................................ 26 1.4.7. M· VLC................................................................................................. 27 1.5. Qu¸ tr×nh nÐn Video theo chuÈn MPEG-1. .............................................. 27 1.5.1. Tham sè ®Æc tr−ng. ............................................................................... 27 1.5.2. Qu¸ tr×nh m· ho¸................................................................................. 28 1.5.3.Qu¸ tr×nh gi¶i m·.................................................................................. 32 1.6. Qu¸ tr×nh nÐn Video theo chuÈn MPEG-2. .............................................. 33 1

1.6.1. Tham sè ®Æc tr−ng. .............................................................................. 36 1.6.2. M« h×nh m· ho¸ Non-scalable theo MPEG-2. .................................... 37 1.6.3. M« h×nh m· ho¸ scalable theo MPEG-2. ............................................ 38 Ch−¬ng 2 M∙ ho¸ SCALABLE VIDEO .............................................. 42 2.1. B¨ng läc 1/2 pixel biÕn ®æi ng−îc theo thêi gian - tÝnh to¸n bï chuyÓn ®éng................................................................................................................ 42 2.1.1. Giíi thiÖu............................................................................................... 44 2.1.2. ThuËt to¸n ............................................................................................. 46 2.1.2.1 M« h×nh Video phæ biÕn...................................................................... 46 2.1.2.2. QuÐt luü tiÕn Video víi vÐct¬ chuyÓn ®éng chÝnh x¸c 1/2 ®iÓm ¶nh . 49 2.1.2.3. Di chuyÓn côc bé më réng ................................................................. 51 2.1.3. Ba tham sè m· ho¸ b¨ng con sö dông IMCTF ..................................... 54 2.1.4. KÕt qu¶ thùc nghiÖm ............................................................................. 55 2.1.5. Tãm t¾t vµ kÕt luËn................................................................................ 59 2.2. M· ho¸ scalable video.............................................................................. 61 2.2.1. Kh¸i qu¸t............................................................................................... 62 2.2.1.1. M· ho¸ lai truyÒn thèng..................................................................... 63 2.2.1.1.1.M· ho¸ Scalable SNR ..................................................................... 63 2.2.1.1.2 Ph©n gi¶i m· Scalable ..................................................................... 66 2.2.1.2. Embedded Coding and Fine Granularity Scalability ........................ 66 2.2.1.3. M· ho¸ sö dông b¨ng con 3 chiÒu vµ m· ho¸ Wavelet ........................... 69 2.2.2. HÖ thèng tæng quan.................................................................................. 70 2.2.3. B¨ng con m· ho¸ 3 chiÒu...................................................................... 71 2.2.4. Tû lÖ dßng bÝt m· ho¸............................................................................... 74 2.2.4.1.HÖ thèng dßng bÝt................................................................................ 74 2.2.4.2. Lùa chän dßng bÝt m· ho¸ vµ truyÒn dÉn ......................................... 78 2.2.5. KÕt qu¶ thùc nghiÖm ............................................................................. 81 2.2.5.1. So s¸nh víi m· ho¸ Nonscalable....................................................... 81 2.2.5.2. So s¸nh m· ho¸ LZC vµ 3D-SPIHT........................................................ 83 2.2.5.3. M· ho¸ tèc ®é ®a ph©n gi¶i................................................................... 86 2.2.6. Tãm t¾t vµ kÕt luËn................................................................................ 91 Ch−¬ng 3 §èi t−îng-c¬ së m∙ ho¸ SCALABLE ............... 95 3.1. §èi t−îng c¬ b¶n - C¬ së m· ho¸............................................................. 97 3.1.1 MÆt ph¼ng ®èi t−îng Video.................................................................... 97 3.1.2. C«ng cô m· ho¸ cho ®èi t−îng Video................................................... 98 3.1.2.1. §Þnh d¹ng m· ho¸.............................................................................. 98 3.1.2.2. CÊu tróc m· ho¸ ................................................................................ 99 3.2. §èi t−îng-C¬ së m· ho¸ sö dông EZBC................................................ 100 2

.... 112 4.2...............4................................................................................... KÕt qu¶ thö nghiÖm ........................................................................................... 119 TµI LIÖU THAM KH¶O .... 111 4.......................................... 106 Ch−¬ng 4: Ch−¬ng tr×nh thö nghiÖm vµ ®¸nh gi¸ kÕt qu¶ ...............2............................................... 101 3...............3..............2................ Tãm t¾t vµ kÕt luËn..................chÊt l−îng nÐn....2....2.................................................2................................. Tæng quan ..........3..... CÊu tróc ch−¬ng tr×nh ...........................3.. 102 3.......................................... øng dông luËn v¨n ............................. NhËn xÐt vÒ tû sè nÐn..............1 D÷ liÖu thö nghiÖm................ 115 KÕt luËn ................. KÕt qu¶ thùc nghiÖm ........1.......................................................... H−íng ph¸t triÓn cho t−¬ng lai ...............................................................2........... 111 4.... 112 4.....................................2.......3................. 118 2........ §èi t−îng-C¬ së m· ho¸ mÆt ph¼ng bÝt EZBC .............. MiÒn – C¬ së biÕn ®æi Wavelet rêi r¹c.... Kh¸i qu¸t chung ...... 103 3....1...................1...... 111 4..................................................................................1.............................................................................................................................................. 111 4...... 112 4.........2........................... §¸nh gi¸ kÕt qu¶ thö nghiÖm ............. 118 1....................................................................................... 120 PHô LôC................ 122 THUËT NG÷ tiÕng anh ...................................................................................................................................................................... 104 3... X©y dùng ch−¬ng tr×nh ................1...2...................... 122 3 ...............

Ch−¬ng Mét lµ tæng quan vÒ nÐn ¶nh ®éng. Ch−¬ng nµy ®Ò cËp ®Õn thuËt to¸n LZC vµ 3D-SPIHT. Ch−¬ng Ba ®i s©u vµo nghiªn cøu ®èi t−îng m· ho¸ cña video dùa trªn biÕn ®æi Wavelet. §©y lµ mét kü thuËt nÐn ¶nh ®éng ®· mang l¹i nhiÒu thµnh c«ng. Ch−¬ng Bèn nªu kh¸i qu¸t c¸ch thiÕt kÕ vµ cµi ®Æt ch−¬ng tr×nh. chuÈn MPEG(Moving Photographic Experts Group) ®· ®−îc x¸c lËp bëi ISO vµ IEC. Ch−¬ng nµy giíi thiÖu mét sè chuÈn nÐn ¶nh ®éng lµ MPEG1.. 0.. Trong ph¹m vi luËn v¨n nµy t«i tËp trung vµo viÖc nÐn d÷ liÖu video.MPEG2. Cuèi cïng t«i xin ch©n thµnh c¶m ¬n sù gióp ®ì nhiÖt t×nh vµ hiÖu qu¶ cña PGS TS Hå Anh Tuý ®· gióp ®ì t«i hoµn thµnh luËn v¨n nµy. Tuy nhiªn ®©y vÉn ch−a ph¶i lµ tû lÖ cao tèi −u. Nã cã thÓ ®¹t tû lÖ nÐn kh¸ cao 10:1 mµ m¾t th−êng khã ph©n biÖt ®−îc. Ch−¬ng nµy mang tÝnh chÊt minh ho¹ cho nh÷ng g× ®· ®−îc tr×nh bµy ë c¸c ch−¬ng tr−íc. Do thêi gian cã h¹n nªn t«i chØ míi nghiªn cøu ®−îc phÇn nµo trong kü thuËt nÐn ¶nh ®éng do vËy ch¾c ch¾n kh«ng tr¸nh khái thiÕu sãt. Do ®ã viÖc nÐn d÷ liÖu ®Æc biÖt d÷ liÖu phim ¶nh lµ cÇn thiÕt h¬n bao giê hÕt.MPEG4 vµ MPEG7. Sù ra ®êi cña Wavelet ®· më ra mét c«ng nghÖ míi. §ã lµ chuÈn MJPEG2000.Lêi nãi ®Çu Trong nh÷ng n¨m gÇn ®©y do sù ph¸t triÓn m¹nh mÏ cña Internet nªn vÊn ®Ò truyÒn d÷ liÖu trªn m¹ng ®Æc biÖt lµ truyÒn ¶nh vµ ©m thanh ®−îc quan t©m. Kü thuËt Wavelet còng ®−îc nghiªn cøu trong nhiÒu phÇn mÒm nh− Matlap. Môc ®Ých cña luËn v¨n nµy nh»m nghiªn cøu mét sè ph−¬ng ph¸p nÐn ¶nh ®éng ®ang ®−îc quan t©m. PhÇn phô lôc nªu mét sè ch−¬ng tr×nh nguån th«ng dông viÕt trªn Visual C + + 6. LuËn v¨n nµy ®−îc tr×nh bµy thµnh bèn ch−¬ng vµ mét phô lôc. Ch−¬ng Hai tr×nh bµy ph−¬ng ph¸p nÐn Scalable video. §èi víi nÐn ¶nh ®éng. Sù ra ®êi cña MJPEG2000 më ra mét t−¬ng lai míi cho kü thuËt nÐn ¶nh víi nh÷ng tÝnh n¨ng cao. §ång thêi còng tr×nh bµy cÊu tróc cña video. Hµ néi ngµy 20/10/2005 4 .

HÖ mµu nµy nh»m ®¹t ®−îc hiÖu suÊt truyÒn cao h¬n. hai thµnh phÇn cßn l¹i mang th«ng tin vÒ mµu s¾c (chrominance) ®Ó chuyÓn ®æi tõ ¶nh x¸m sang ¶nh mµu. Chuçi c¸c frame xuÊt hiÖn víi tèc ®é rÊt nhanh sÏ cho ta c¶m gi¸c chuyÓn ®éng liªn tôc (tèi thiÓu lµ 25frame/gi©y). B (lam) biÓu diÔn cho 3 trôc. Kh¸i niÖm Video Video lµ sù biÓu diÔn ®iÖn tö cña mét chuçi c¸c ¶nh liªn tiÕp.1. 0.1. 0) lµ mµu ®en.1. mµu lôc (Green) vµ mµu lam (Blue). víi gèc to¹ ®é (0.1. 1. Thµnh phÇn chãi (luminance) cung cÊp gi¸ trÞ møc x¸m cña ¶nh. Mét hÖ thèng biÓu diÔn mµu kh¸c ®−îc sö dông chÝnh trong lÜnh vùc truyÒn h×nh nh»m gióp viÖc sè hãa ®−îc thuËn lîi h¬n lµ hÖ mµu YUV. ®é ph©n gi¶i cña truyÒn h×nh lµ 720x576 vµ tèc ®é frame lµ 25 hoÆc 30 Hz. Nh÷ng ¶nh nµy lµ nh÷ng ¶nh tÜnh vµ ®−îc gäi lµ c¸c frame. MÆc dï mçi frame cã sù kh¸c nhau. Kh«ng gian mÇu (Color Space) Dùa theo lý thuyÕt vÒ ¶nh mµu. c¶m thô vÒ mµu cña m¾t trªn c¬ së 3 mµu c¬ b¶n: mµu ®á (Red). c¸c mµu cã thÓ ®−îc m« t¶ lµ c¸c ®iÓm bªn trong h×nh lËp ph−¬ng ®¬n vÞ. vµ gi÷ nguyªn tÝnh t−¬ng thÝch víi hÖ sè truyÒn h×nh mµu ®en tr¾ng. Trong truyÒn h×nh. NguyÔn H÷u Ph¸t 5 . 3 thµnh phÇn R (®á). Tèc ®é frame vµ ®é ph©n gi¶i cña mçi frame lµ c¸c nh©n tè quan träng ¶nh h−ëng trùc tiÕp ®Õn chÊt l−îng Video.§å ¸n cao häc §TVT 2003 Ch−¬ng 1 TæNG QUAN VÒ NÐN ¶NH Video THEO CHUÈN MPEG 1. Trong hÖ mµu RGB. cÇn thiÕt ph¶i cã tèc ®é frame cao ®Ó ®¹t ®−îc c¶m gi¸c chuyÓn ®éng thùc sù.1. G (lôc). miªu t¶ mçi ¶nh trong Video gåm c¸c thµnh phÇn ®é chãi (Y) vµ s¾c mµu (UV). Kh¸i niÖm vÒ Video vµ ph−¬ng ph¸p nÐn Video 1.1.

Víi −u ®iÓm trªn hÖ YCBCR ®−îc ¸p dông réng r·i trong viÖc sè ho¸ Video.6 + 0.493 (B .587G + 0.114B U = 0.§å ¸n cao häc §TVT 2003 ChuyÓn ®æi RGB sang YUV ®−îc thùc hiÖn theo chuÈn CCIR 601 nh− sau: Y = 0.Y) V = 0.1. §Æc biÖt: khi R = G = B th× Y = R = G = B vµ U = V = 0. Mét ®Þnh d¹ng mµu kh¸c lµ.1.1.299R + 0. t−¬ng tù YUV lµ Y.5 Do ®ã.877 (R .2. CR víi Y t−¬ng tù nh− trªn vµ hai thµnh phÇn nh− sau: CB = U/2 + 0. CB. 1]. mµu CB. 1. CÊu tróc lÊy mÉu NguyÔn H÷u Ph¸t 6 . V lµ hai thµnh phÇn mµu.5 CR = V/1. C¸c c¬ cÊu sè ho¸ tÝn hiÖu Video H×nh 1. CR lu«n n»m trong kho¶ng [0.Y) trong ®ã: Y lµ thµnh phÇn chãi vµ U.

§iÓm tiÕp theo chØ lÊy mÉu tÝn hiÖu chãi (Y) vµ kh«ng lÊy mÉu 2 tÝn hiÖu. CB. cã 2 lÇn lÊy mÉu CR. 1 lÇn lÊy mÉu CB. cø 4 lÇn lÊy mÉu Y. CÊu tróc 4: 1: 1 H×nh 1.2.1. Mçi ¶nh trong chuçi Video ®−îc lÊy sè ho¸ nh− h×nh 1. cø 4 lÇn lÊy mÉu Y. mµu suy ra tõ ®iÓm ¶nh tr−íc. kh«ng lÊy mÉu tÝn hiÖu mµu. H×nh 1.3. Khi gi¶i m·. CR). Khi gi¶i m·. cã 1 lÇn lÊy mÉu CR. . CÊu tróc 4: 2: 2 Gi¶ sö mét dßng ngang cña TV gåm 720 ®iÓm ¶nh.§å ¸n cao häc §TVT 2003 Trong truyÒn h×nh.§iÓm ®Çu lÊy mÉu tÝn hiÖu chãi (Y) vµ lÊy mÉu 2 mµu (CB. 3 ®iÓm kÕ tiÕp chØ lÊy mÉu Y. CÊu tróc lÊy mÉu 4: 2: 0 NguyÔn H÷u Ph¸t 7 . TuÇn tù nh− vËy. CR. CÊu tróc lÊy mÉu 4: 2: 2 ViÖc lÊy mÉu sÏ tuÇn tù diÔn ra nh− sau: . 2 lÇn lÊy mÉu CB. mÇu cña 3 ®iÓm ¶nh ph¶i suy ra tõ ®iÓm ¶nh ®Çu. TuÇn tù nh− vËy. CÊu tróc lÊy mÉu 4: 1: 1 §iÓm ¶nh ®Çu tiªn lÊy mÉu ®ñ Y. c¸c frame trong chuçi Video cã ®é ph©n gi¶i lµ 720 x 576 ®iÓm vµ cã tèc ®é frame lµ 25 hoÆc 30Hz.

ChÝnh v× vËy.Gi¶m tèc ®é dßng bit (bit Rate Reduction .5.§å ¸n cao häc §TVT 2003 LÊy mÉu tÝn hiÖu Y t¹i tÊt c¶ c¸c ®iÓm ¶nh cña dßng.4. CR. gi¶m d¶i th«ng lµ vÊn ®Ò quan träng víi c«ng nghÖ Video sè. VÒ c¬ b¶n gi¶m d¶i th«ng ®−îc thùc hiÖn b»ng 4 c¸ch: . tøc lµ lín h¬n 31. C¸c ph−¬ng ph¸p nÐn Video Môc tiªu chÝnh cña viÖc nÐn tÝn hiÖu Video lµ biÓu diÔn mét nguån tÝn hiÖu Video b»ng mét sè bit Ýt nhÊt cã thÓ ®−îc mµ vÉn ®¶m b¶o yªu cÇu chÊt l−îng c¶m thô. giíi h¹n d¶i th«ng cña tÝn hiÖu t−¬ng tù kho¶ng 6MHz.2. CÊu tróc lÊy mÉu 4: 2: 0 CÊu tróc lÊy mÉu 4: 4: 4 LÊy mÉu tÝn hiÖu Y. H×nh 1. trong khi tÝn hiÖu Video sè ho¸ theo tiÓu chuÈn CCIR 601 víi tèc ®é bit lµ 270Mbit/s chiÕm d¶i th«ng kh«ng d−íi 189MHz. CB t¹i tÊt c¶ c¸c ®iÓm ¶nh cña dßng. NguyÔn H÷u Ph¸t 8 . cßn tÝn hiÖu mµu th× cø 4 Y. H×nh 1. Víi tÝn hiÖu Video.1.5 lÇn so víi d¶i th«ng cña tÝn hiÖu t−¬ng tù. CÊu tróc lÊy mÉu 4: 4: 4 1. cã 2 mµu CR vµ CB c¸ch nhau theo tõng hµng.BRR).

ViÖc ta c¾t gi¶m c¸c bit cña nhãm LMB sÏ kh«ng ¶nh h−ëng nhiÒu tíi chÊt l−îng cña ¶nh. C¸ch thø nhÊt dùa trªn ®Æc ®iÓm sinh lý cña m¾t ng−êi. nªn còng sÏ kh«ng ®−îc ®Ò cËp ®Õn.1. Gi¶m tèc ®é dßng bit. tøc gi¶m ®é d− thõa theo thêi gian (temporal redundancy). C¸ch thø hai dùa trªn ý nghÜa cña c¸c bit l−îng tö ho¸ c¸c ®iÓm ¶nh. Cã hai ph−¬ng ph¸p gi¶m tèc ®é dßng bit.5MHz ®èi víi tÝn hiÖu chãi.2.§å ¸n cao häc §TVT 2003 . M¾t ng−êi kh«ng nh¹y c¶m víi c¸c tÝn hiÖu mµu nªn trong ph−¬ng ph¸p nµy. Víi 8 bit l−îng tö ho¸.§Þnh d¹ng nµy ®−îc sö dông trong c¸c thiÕt bÞ dùng phim phi tuyÕn vµ trong ®å ho¹ vi tÝnh liªn quan ®Õn phim nhùa. . 1.NÐn hçn hîp sö dông tæ hîp c¸c ph−¬ng ph¸p trªn. 25 lµ tèc ®é chuyÓn ¶nh (25 frames/s). c¸c bit cña byte nµy ®−îc chia lµm hai nhãm: nhãm cã ý nghÜa h¬n (MMB-More Meaning Bit) vµ nhãm Ýt ý nghÜa h¬n (LMB-Less Meaning Bit). PhÇn lín c¸c ®Þnh d¹ng sè thµnh phÇn hiÖn nay ®Òu sö dông tÇn sè lÊy mÉu 13.1. tøc gi¶m ®é d− thõa trong mét sè frame (spatial redundancy). . Theo chuÈn CCIR 601. ng−êi ta gi¶m bít ®é ph©n gi¶i c¸c tÝn hiÖu mµu. Tèc ®é bit cña ®Þnh d¹ng nµy cho hÖ PAL lµ: Víi l−îng tö ho¸ 8 bit: (720 + 720 +720) x 576 x 8 x 25 = 249 Mbit/s Víi l−îng tö hãa 10 bit: (720 + 720 +720) x 576 x 10 x 25 = 311 Mbit/s. Tuy nhiªn. ph−¬ng ph¸p nµy kh«ng ®−îc chÊp nhËn trong c¸c gi¶i ph¸p gi¶m d¶i th«ng hiÖn t¹i. NguyÔn H÷u Ph¸t 9 . Trong ®ã: 720 x 576 lµ ®é ph©n gi¶i mµn h×nh (576 lµ sè dßng /frame). nÕu 2 tÝn hiÖu mµu ®−îc lÊy mµu ®−îc lÊy mÉu víi tÇn sè nh− tÝn hiÖu chãi.NÐn dßng tÝn hiÖu theo thêi gian. chóng ta sÏ cã ®Þnh d¹ng 4: 4: 4.NÐn dßng tÝn hiÖu Video sè theo kh«ng gian.

75 MHz ®èi víi hai tÝn hiÖu mµu. bÇu trêi xanh). tèc ®é dßng bit tÝnh cho PAL lµ: (720 +180 +180) x 576 x 8 x 25 = 124. tèc ®é dßng bit cßn ®−îc c¾t gi¶m nhiÒu h¬n.4 Mbit/s.5 MHz ®èi víi tÝn hiÖu chãi. sau ®ã gi¶i nÐn (gi¶i m·) th× kh«ng cã sù ph©n biÖt. so víi ph−¬ng ph¸p lÉy mÉu kh«ng c¾t gi¶m (4: 4: 4). c¸c thiÕt bÞ sö dông kü thuËt sè ë thÞ tr−êng thiÕt bÞ Video chuyªn dông th−êng sö dông chuÈn CCIR 601 4: 2: 2. ChÝnh v× vËy. 10 bit: (720 +360 +360) x 576 x 10 x 25 = 207 Mbit/s.§å ¸n cao häc §TVT 2003 HiÖn nay. c¸c d÷ liÖu gièng nhau nµy ®−îc lÆp l¹i ®Ó t¹o l¹i c¸c vïng ®Òu nhau trong mét ¶nh (vÝ dô. Theo ®Þnh d¹ng sè ho¸ nµy. vµ 6. NÐn dßng tÝn hiÖu Video sè theo kh«ng gian GÇn nh− tÊt c¶ c¸c ¶nh ®Òu chøa mét sè l−îng lín c¸c gi¸ trÞ d÷ liÖu th«ng tin gièng nhau. cã thÓ so s¸nh ®−îc víi chÊt l−îng ¶nh kh«ng nÐn. Víi ®Þnh d¹ng 4: 1: 1 vµ 4: 2: 0. ta sö dông c¸c ph−¬ng ph¸p nÐn ¶nh. tøc lµ gi¶m ®−îc 50% so víi nguyªn mÉu 4: 4: 4. C¸c ph−¬ng ph¸p nÐn ¶nh cã thÓ chia lµm 2 lo¹i: • NÐn kh«ng tæn hao (lossless compression): lµ ph−¬ng ph¸p nÐn mµ tÝn hiÖu gèc ®èi chiÕu víi tÝn hiÖu ®−îc nÐn (m· ho¸). Trong c¸c hÖ thèng kh«ng gi¶m d÷ liÖu. 1. Tèc ®é dßng d÷ liÖu cña ®Þnh d¹ng nµy ®−îc tÝnh nh− sau: Khi lÊy mÉu 8 bit: (720 +360 +360) x 576 x 8 x 25 = 166 Mbit/s. tÝn hiÖu Video thµnh phÇn ®−îc lÊy mÉu víi tÇn sè 13. Nh− vËy. Tuy nhiªn. NÐn cã tæn hao (lossy compression): lµ ph−¬ng ph¸p nÐn mµ tÝn hiÖu gèc cã sù kh¸c biÖt víi tÝn hiÖu ®−îc kh«i phôc sau khi nÐn vµ gi¶i nÐn. ChÊt l−îng h×nh ¶nh cña c¸c thiÕt bÞ dïng ph−¬ng ph¸p nÐn kh«ng tæn hao lµ rÊt tèt. c¸c −u ®iÓm cña viÖc • • NguyÔn H÷u Ph¸t 10 .1. Víi 8 bit lÊy mÉu.2. tØ sè nÐn cña ph−¬ng ph¸p nµy rÊt thÊp. ph−¬ng ph¸p nµy cho phÐp c¾t gi¶m ®−îc 33% tèc ®é dßng bit. §Ó gi¶m ®é d− thõa trong mét frame.2. vµ do ®ã cã th«ng tin d− thõa trong dßng d÷ liÖu.

2. ph−¬ng ph¸p nÐn cã tæn hao ®−îc sö dông trong hÇu hÕt c¸c thiÕt bÞ hiÖn nay. NguyÔn H÷u Ph¸t 11 . nh÷ng gi¶i thuËt nµy cã chÊt l−îng cao. Cã hai ®Þnh d¹ng nÐn ®−îc ¸p dông réng r·i trong c¸c thiÕt bÞ truyÒn h×nh. cïng c¸c phiªn b¶n cña nã. tØ sè nÐn cho phÐp ®¸nh gi¸ hiÖu qu¶ cña hÖ thèng nÐn.1. ng−êi ta chØ truyÒn nh÷ng phÇn th«ng tin sai lÖch vµ kÕt hîp víi th«ng tin cò. ng−êi ta sö dông tæ hîp c¸c ph−¬ng ph¸p trªn. thËm chÝ c¸c frame hiÖn t¹i chØ thay ®æi chót Ýt so víi c¸c frame tr−íc vµ sau ®ã. 1. C¸c frame trong Video cã quan hÖ mËt thiÕt víi nhau.1. Ngoµi ra cßn nhiÒu ph−¬ng ph¸p kh¸c. 1. Khi so s¸nh tØ sè nÐn cña c¸c hÖ thèng nÐn kh¸c nhau. Tham sè nÐn Video ®−îc ®Ò cËp ®Õn ë ®©y lµ ®Þnh d¹ng ¶nh vµ tØ sè nÐn. NÐn dßng tÝn hiÖu theo thêi gian. §Þnh d¹ng bao gåm: • Sè dßng/¶nh vµ sè pixel/dßng.3.4. gi¸ thµnh thiÕt bÞ vÉn cßn rÊt cao. §Ó gi¶m bít th«ng tin truyÒn t¶i. 1. nÐn Video lµ JPEG vµ MPEG.2.3. th× ®Þnh d¹ng ¶nh cña c¸c hÖ thèng nÐn trªn ph¶i gièng nhau. Cã nhiÒu ph−¬ng ph¸p kh¸c nhau ®Ó x¸c ®Þnh sù thay ®æi gi÷a c¸c frame. Tham sè nÐn Video.1.§å ¸n cao häc §TVT 2003 nÐn tÝn hiÖu kh«ng ®−îc ph¸t huy mét c¸ch tèi ®a. §Ó n©ng tØ sè nÐn. nh−ng møc ®é tÝnh to¸n phøc t¹p vµ cßn ®ang trong giai ®o¹n nghiªn cøu. Ph−¬ng ph¸p nÐn Video theo chuÈn MPEG lµ mét ph−¬ng ph¸p nÐn tæ hîp cña c¸c ph−¬ng ph¸p trªn. ®ã lµ c¸c ph−¬ng ph¸p x¸c ®Þnh vÐct¬ chuyÓn ®éng. NÐn hçn hîp sö dông tæ hîp c¸c ph−¬ng ph¸p trªn §Ó ®¹t ®−îc hiÖu qu¶ nÐn cao mµ vÉn ®¶m b¶o chÊt l−îng h×nh ¶nh. ph¸t huy tèi ®a −u ®iÓm cña viÖc nÐn tÝn hiÖu.

truyÒn h×nh sè vµ HDTV. ®é ph©n gi¶i cña mÉu lµ 8/10 bit (hoÆc 12 bit). Tèc ®é bit cña ¶nh gèc (tr−íc khi nÐn) cã thÓ rót ra tõ c«ng thøc: TØ sè nÐn = Tèc ®é d÷ liÖu ¶nh gèc Tèc ®é d÷ liÖu ¶nh nÐn VÝ dô: víi tèc ®é bit d÷ liÖu ¶nh gèc 166 Mbit/s ë trªn ¸p dông vµo m¸y ghi h×nh ®Üa PDR-100 (Tektronix). truyÒn th«ng ®a ph−¬ng tiÖn.2. DVD. Tèc ®é dßng d÷ liÖu lªn tíi 15 Mb/s. Kh¸c víi MPEG-1 tÝn hiÖu Video lu«n lµ quÐt liªn tôc (progressive). vµ gi¶ sö chÊt l−îng nÐn t−¬ng ®−¬ng 24Mbit/s. vµ c¸c øng dông Video sè.92. 4: 2: 2. • MPEG-1 (~1992): m· ISO/IEC 11172. MPEG-7. MPEG-2 (~1995): m· ISO/IEC 13818.5 Mb/s trong c¸c øng dông DSM (nh− c«ng nghÖ ghi VCD). MPEG-2. • NguyÔn H÷u Ph¸t 12 . vµ ®−îc biÕt ®Õn víi c¸c chuÈn MPEG-1. ChuÈn MPEG ngµy cµng ®−îc sö dông réng r·i trong nhiÒu øng dông l−u tr÷. 4: 1: 1. MPEG-4. v« tuyÕn truyÒn h×nh. lµ chuÈn ®Çu tiªn cña MPEG nh»m môc ®Ých nÐn Video cã kÝch th−íc khu«n h×nh 320x240 cho dßng d÷ liÖu cã tèc ®é tõ 1 ®Õn 1. HDTV (High Definition Television). VideoConferencing. Internet Video. Vµ cÊu tróc lÊy mÉu bao gåm: 4: 4: 4. lµ chuÈn dµnh cho gi¶i ph¸p cao h¬n dïng trong studio sè. th× tØ sè nÐn lµ 166/24 = 6. 4: 2: 0. 1.§å ¸n cao häc §TVT 2003 • Sè frame/s. DSS (Digital Satellite System). Giíi thiÖu chung vÒ chuÈn MPEG ChuÈn MPEG (Moving Picture Expert Group) ®−îc x©y dùng vµ ph¸t triÓn bëi c¸c tæ chøc ISO vµ IEC (International Electrotechnical Commission) víi môc ®Ých m· ho¸ tÝn hiÖu h×nh ¶nh vµ ©m thanh cho DSM (Digital Storage Media). MPEG-2 ¸p dông cho c¶ quÐt liªn tôc vµ quÐt xen kÏ (interlace).

MPEG-7 ®Æc tr−ng cho mét tËp tiªu chuÈn biÓu diÔn nhiÒu lo¹i th«ng tin multimedia kh¸c nhau. MPEG-7 kh«ng ph¶i lµ chuÈn nÐn. truyÒn th«ng ®a ph−¬ng tiÖn NguyÔn H÷u Ph¸t 13 . M« t¶ nµy cho kh¶ n¨ng t×m kiÕm nhanh vµ hiÖu qu¶ theo yªu cÇu ng−êi dïng.6. chuÈn MPEG-7 ®−îc m« t¶ vÒ phÇn néi dung gièng nh− MPEG-4. tËp trung vµo dån kªnh. C¸c chuÈn. Vai trß nÐn Ýt ®−îc ®Ò cËp trong phiªn b¶n nµy. vµ ®−îc gäi chÝnh thøc lµ “Giao thøc m« t¶ néi dung ®a ph−¬ng tiÖn” (Multimedia Content Description Interface). S¬ ®å giíi thiÖu c¸c chuÈn nÐn vµ c¸c c«ng nghÖ nÐn xem h×nh 1.6: H×nh 1. MPEG-4 sö dông tèc ®é bit (Video) rÊt thÊp: 5÷64 Kb/s. • MPEG-7 (~2001): MPEG-7 lµ chuÈn m« t¶ th«ng tin cña rÊt nhiÒu lo¹i ph−¬ng tiÖn. c¸c c«ng nghÖ nÐn. Tuy nhiªn. lµ chuÈn chñ yÕu dµnh cho c¸c øng dông ®a ph−¬ng tiÖn t−¬ng t¸c. ph©n lo¹i khung c¶nh ®a ph−¬ng tiÖn thµnh c¸c ®èi t−îng néi dung media. ®ång bé d÷ liÖu víi c¸c ®èi t−îng media ®Ó truyÒn qua m¹ng.§å ¸n cao häc §TVT 2003 • MPEG-4 (~1998): m· ISO/IEC 14496.

u Intra MB: kh«ng dïng dù ®o¸n tõ frame tr−íc ®ã. c¸c hÖ sè DCT vµ kÝch th−íc b−íc l−îng tö. truy cËp ngÉu nhiªn. Header cña Marcroblock chøa th«ng tin vÒ c¸c khèi ®é chãi vµ ®é mµu. Slice chøa header vµ mét hoÆc nhiÒu Macroblock liªn tiÕp. KÝch th−íc Slice cùc ®¹i cã thÓ lµ toµn c¶nh. kÝch th−íc cùc tiÓu cã thÓ lµ mét Macroblock. • Block: Lµ c¸c khèi kÝch th−íc 8x8 ®iÓm ¶nh cña tÝn hiÖu chãi vµ mµu ®−îc dïng ®Ó biÕn ®æi DCT. Nªn chØ cÇn truyÒn kiÓu MB.1. Slice: Slice cung cÊp kh¶ n¨ng phßng ngõa sù sai lÖch d÷ liÖu. • • NguyÔn H÷u Ph¸t 14 . vect¬ chuyÓn ®éng. c¸c hÖ sè DCT vµ kÝch th−íc b−íc l−îng tö ®Õn n¬i nhËn. ®Þa chØ MB. u Inter MB: sö dông dù ®o¸n bï chuyÓn ®éng tõ frame tr−íc ®ã. cÇn truyÒn ®i kiÓu MB. CÊu tróc dßng bit Video ®−îc chia thµnh ph©n cÊp c¸c líp (layer) ®Ó hç trî qu¶n lý lçi. Kh«ng cã th«ng tin vÒ Macroblock ®−îc gi¶i m· còng nh− ®−îc truyÒn ®Õn n¬i nhËn. Macroblock: Mét Macroblock lµ mét nhãm c¸c khèi DCT (theo néi dung th«ng tin) trong ¶nh gèc. Header cña Slice chøa th«ng tin vÒ vÞ trÝ cña nã trong ¶nh vµ hÖ sè thang ®é cña bé l−îng tö ho¸. Cã ba lo¹i Macroblock (ph©n lo¹i theo ph−¬ng ph¸p m· ho¸ Macroblock): u Skipped MB: sö dông dù ®o¸n tõ frame gi¶i m· tr−íc ®ã víi vÐct¬ chuyÓn ®éng b»ng 0.3. ®Þa chØ MB.§å ¸n cao häc §TVT 2003 1. C¸c kh¸i niÖm c¬ b¶n trong nÐn Video theo chuÈn MPEG. dùng h×nh (editting) vµ ®ång bé víi dßng bit audio. Do ®ã. bé gi¶i m· cã thÓ kh«i phôc b»ng c¸ch ®îi Slice tiÕp theo mµ kh«ng ph¶i huû bá toµn bé ¶nh. vµ th«ng tin bï chuyÓn ®éng. Khi gÆp lçi trong dßng bit cña mét ¶nh. CÊu tróc ph©n cÊp Video theo chuÈn MPEG. 1.3.

¶nh m· cuèi cïng cña nhãm ¶nh (trong thø tù tr×nh diÔn) lµ ¶nh I hoÆc P. lµ ®¬n vÞ m· ho¸ nhá nhÊt mµ cã thÓ ®−îc gi¶i m· ®éc lËp. l−u tr÷ vµ kh«i phôc) kh«ng theo thø tù hiÓn thÞ. Chuçi chøa mét header.§å ¸n cao häc §TVT 2003 • Picture (frame): Mét ¶nh t−¬ng øng víi mét frame cña Video. . vµ/hoÆc frame B. . ®−îc gäi lµ dßng s¬ cÊp Video ES (elementary stream). . CÊu tróc GOP ®−îc biÓu diÔn th«ng qua hai tham sè: n (sè frame trong GOP) vµ m (kho¶ng c¸ch dù ®o¸n). Chuçi Video (Video sequence): Lµ líp cao nhÊt cña ph©n cÊp m· ho¸. ®Ó khëi g¸n tr¹ng th¸i cña bé gi¶i m·. Mçi GOP b¾t ®Çu b»ng mét frame I. C¸c ¶nh nµy kh«ng ®éc lËp nhau. • • NguyÔn H÷u Ph¸t 15 . bao gåm phÇn header vµ c¸c ¶nh. Header chøa th«ng tin thêi gian vµ dùng h×nh (editting). Mét nhãm ¶nh GOP h×nh thµnh tõ liªn kÕt mét hoÆc nhiÒu frame I. Header chØ thÞ sù s¾p xÕp ®Ó truyÒn frame. tØ lÖ pixel. tèc ®é ¶nh vµ c¸c kÝch th−íc tèi thiÓu cña bé nhí cho bé gi¶i m·. th«ng th−êng n=15. §Æc biÖt. P vµ B. Thø tù c¸c ¶nh dßng m· lµ thø tù mµ qua qu¸ tr×nh gi¶i m· ®−a chóng trë l¹i b×nh th−êng. Líp ¶nh bao gåm phÇn header vµ mét hoÆc nhiÒu Slice. cho phÐp bé gi¶i m· hiÓn thÞ frame ®óng theo bËc. tèc ®é bit cña ¶nh trong chuçi. kiÓu ¶nh vµ th«ng tin m· ho¸. vµ c¸c frame P. Th«ng tin quan träng nhÊt chøa trong header lµ kÝch th−íc theo chiÒu ngang vµ ®øng cña mçi ¶nh. ¶nh B trong dßng gi¶i m· ®−îc ®−a ngay ra mµn h×nh. . Chuçi Video vµ th«ng tin header t¹o thµnh dßng bit m· ho¸. mµ lµ thø tù cho phÐp bé gi¶i m· cã thÓ gi¶i m· dßng bit. mét hoÆc nhiÒu GOP vµ mét m· kÕt thóc chuçi. GOP (Group Of Picture): Mét nhãm ¶nh lµ mét ®iÓm truy nhËp ngÉu nhiªn (random access point). Cã ba kiÓu ¶nh chÝnh lµ: ¶nh I. m = 3. nªn thø tù dßng bit (tøc lµ thø tù c¸c c¶nh ®−îc truyÒn.

§å ¸n cao häc §TVT 2003 H×nh 1. CÊu tróc dßng d÷ liÖu MPEG NguyÔn H÷u Ph¸t 16 .7. C¸c líp video theo chuÈn MPEG H×nh 1.8.

vµ frame P còng cã thÓ ®−îc dù ®o¸n tõ c¸c frame tr−íc ®ã. vµ cã thÓ dïng nh− nh− lµ frame tham chiÕu (reference frame) ®Ó dù ®o¸n c¸c frame kh¸c. bé m· ho¸ cã thÓ dù ®o¸n thuËn (forward predection) frame tiÕp theo. vµ do ®ã chia c¸c frame Video thµnh 3 lo¹i lµ: frame I. vÐct¬ nµy x¸c ®Þnh mét Macroblock (MB) nµo ®ã ®−îc sö dông tõ ¶nh gèc. frame P. M· ho¸ c¸c frame I chØ lµm gi¶m ®é d− thõa kh«ng gian vµ cho mét tØ lÖ nÐn võa ph¶i. Nh− vËy. frame nµy ®−îc m· ho¸ t−¬ng tù nh− m· ho¸ ¶nh tÜnh theo chuÈn JPEG. C¸c frame I ®−îc m· ho¸ ®éc lËp. Frame ®−îc dù ®o¸n gäi lµ frame P (predicted frame). • Frame I (Intra Coded Picture): Frame I lµ frame ®Çu tiªn trong mçi nhãm ¶nh cña chuçi Video. tham chiÕu cho viÖc bï chuyÓn ®éng cho c¸c frame P vµ B kh¸c. ViÖc m· ho¸ ¶nh P cã sö dông bï chuyÓn ®éng. Frame P cho hÖ sè nÐn cao h¬n.§å ¸n cao häc §TVT 2003 1. C¨n cø vµo ®Æc tÝnh cña Video cã sù d− thõa kh«ng gian vµ d− thõa thêi gian ®Ó ®−a ra hai ph−¬ng ph¸p nÐn gi¶m ®é d− thõa kh«ng gian (m· ho¸ “intraframe”) vµ nÐn gi¶m ®é d− thõa thêi gian t−¬ng øng (m· ho¸ “intrerframe”). vµ cã thÓ sö dông lµm mét frame so s¸nh.2. Ph©n lo¹i frame Video. Th«ng tin −íc l−îng chuyÓn ®éng cña c¸c khèi n»m trong vÐct¬ chuyÓn ®éng. frame B. Frame I cã thÓ dïng lµm ®iÓm truy cËp ngÉu nhiªn trong chuçi cho bé gi¶i m·. Frame P (Predictive Code Picture): Qua frame I. kh«ng cÇn tham chiÕu ®Õn c¸c frame kh¸c trong chuçi Video.3. • NguyÔn H÷u Ph¸t 17 . mçi frame P ®−îc dù ®o¸n tõ frame I hoÆc P tr−íc ®ã.

hoÆc P vµ P. NguyÔn H÷u Ph¸t 18 . ViÖc sö dông th«ng tin lÊy tõ ¶nh trong t−¬ng lai hoµn toµn cã thÓ thùc hiÖn ®−îc v× t¹i thêi ®iÓm m· ho¸ th× bé m· ho¸ ®· s½n sµng truy cËp tíi ¶nh phÝa sau.9. Néi suy bï chuyÓn ®éng • Frame B (Bidirectionally Predicted 0icture): Bé m· ho¸ còng cã thÓ sö dông ®ång thêi dù ®o¸n thuËn vµ ng−îc. frame P vµ B gäi lµ c¸c frame Inter (sö dông kü thuËt m· ho¸ interframe).§å ¸n cao häc §TVT 2003 H×nh 1. vµ kh«ng ®−îc dïng lµm frame tham chiÕu. Frame B cho tØ lÖ nÐn cao nhÊt. Kh«ng nh− frame I (®−îc dù ®o¸n ®éc lËp) vµ frame P (®−îc dù ®o¸n dùa vµo frame I hoÆc P tr−íc ®ã). hoÆc P vµ I (víi frame I cña nhãm ¶nh tiÕp theo). frame B ®−îc dù ®o¸n 2 chiÒu dùa vµo cÆp frame I vµ P. hay frame B. frame I gäi lµ frame intra (sö dông kü thuËt m· ho¸ intraframe). Theo ph−¬ng ph¸p nÐn nµy. Nh÷ng frame nµy gäi lµ frame dù ®o¸n néi suy 2 chiÒu (Bi-directional Interpolated Prediction).

Nhãm ®ãng cã cÊu tróc khÐp kÝn. Nhãm ¶nh (GOP: Group Of Picture).3.3. viÖc dù ®o¸n ¶nh kh«ng phô thuéc vµo th«ng tin cña nhãm kh¸c vµ ¶nh cuèi cïng cña mét nhãm bao giê còng lµ mét ¶nh P. Cã hai lo¹i nhãm lµ më vµ ®ãng. chÝnh v× vËy ®èi víi MPEG cã mét kh¸i niªm lµ GOP (nhãm ¶nh). Nhãm më b¾t ®Çu b»ng mét ¶nh I vµ kÕt thóc b»ng mét ¶nh I. trong ®ã P. KÝch th−íc c¸c lo¹i frame 1.§å ¸n cao häc §TVT 2003 Mét thuËn lîi khi sö dông nhiÒu lo¹i frame lµ ®Ó theo dâi d÷ liÖu trong qu¸ tr×nh truyÒn. KÝch th−íc c¸c frame ®−îc minh ho¹ trong h×nh vÏ sau: H×nh 1. hay sù kh¸c biÖt ®èi víi c¶ ¶nh xuÊt hiÖn tr−íc vµ sau nã (®èi víi B). P vµ B. P. nÕu cã frame bÞ mÊt (th−êng lµ frame P hoÆc frame B) th× chÊt l−îng Video còng kh«ng bÞ ¶nh h−ëng nhiÒu. B kh«ng ph¶i lµ mét ¶nh hoµn chØnh mµ chØ chøa sù kh¸c biÖt gi÷a ¶nh ®ã vµ ¶nh xuÊt hiÖn tr−íc ®ã (®èi víi P). viÖc dù ®o¸n ¶nh phô thuéc c¶ vµo th«ng tin cña c¸c GOP kh¸c. §Ó cã mét khu«n h×nh hoµn chØnh ¶nh P vµ B cÇn cã d÷ liÖu tõ c¸c ¶nh l©n cËn. C«ng nghÖ MPEG sö dông 3 lo¹i ¶nh I. NguyÔn H÷u Ph¸t 19 .10. Mçi nhãm ph¶i b¾t ®Çu b»ng mét ¶nh hoµn chØnh I vµ tiÕp theo lµ mét lo¹t c¸c ¶nh B.

§å ¸n cao häc §TVT 2003

Chuçi ¶nh MPEG th−êng cã cÊu tróc IBBPBBPBBI nh−ng thø tù truyÒn dÉn vµ thø tù hiÓn thÞ ¶nh lµ kh¸c nhau do khi t¹o ¶nh B cÇn th«ng tin tõ c¶ khung qu¸ khø vµ t−¬ng lai. ¶nh t−¬ng lai cÇn ph¶i ®−îc truyÒn dÉn tr−íc, khi hiÓn thÞ ph¶i theo ®óng thø tù nguån. §Ó thùc hiÖn ®iÒu nµy, líp ¶nh (Picture layer) cña dßng d÷ liÖu MPEG cã th«ng tin vÒ sè thø tù ¶nh ®Ó trî gióp hiÓn thÞ. H×nh d−íi tr×nh bµy thø tù truyÒn dÉn vµ thø tù hiÓn thÞ ¶nh.

H×nh 1.11. Thø tù truyÒn dÉn vµ thø tù hiÓn thÞ ¶nh ChuÈn MPEG kh«ng ®Þnh nghÜa sè l−îng giíi h¹n c¸c frame B liªn tiÕp trong nhãm ¶nh, nªn sè l−îng frame B liªn tiÕp phô thuéc vµo tõng øng dông. Th«ng th−êng, sè l−îng nµy lµ 2 (I, B, B, P, B, B, P) ®Ó ®¶m b¶o hiÖu qu¶ nÐn vµ chÊt l−îng Video. Mét cÊu tróc nhãm ¶nh th«ng th−êng ®−îc m« t¶ bëi hai tham sè: n - sè ¶nh trong mét nhãm vµ m - sè kho¶ng c¸ch cho ¶nh B. Nh− vÝ dô trªn n=9 vµ m=3.

NguyÔn H÷u Ph¸t

20

§å ¸n cao häc §TVT 2003

1.4. Ph−¬ng ph¸p nÐn ¶nh Video theo chuÈn MPEG. 1.4.1. M« h×nh tæng qu¸t bé m· ho¸ Video theo chuÈn MPEG. NÐn Video sè nh»m môc ®Ých lo¹i bá d− thõa kh«ng gian vµ d− thõa thêi gian trong chuçi Video mµ kh«ng ¶nh h−ëng ®Õn møc ®é c¶m thô cña m¾t ng−êi. Trong ph−¬ng ph¸p nÐn Video theo chuÈn MPEG cã hai kü thuËt nÐn ®−îc sö dông lµ:

Kü thuËt m· ho¸ “Intra frame”: Kü thuËt m· ho¸ “Intra frame” nh»m gi¶m ®é d− thõa kh«ng gian trong mét frame. Kü thuËt nµy xuÊt ph¸t tõ mèi t−¬ng quan kh«ng gian gi÷a c¸c ®iÓm ¶nh trong mét ¶nh, tõ ®ã ®Ó nÐn ¶nh hiÖu qu¶. Ph−¬ng ph¸p ®−îc sö dông ®Ó gi¶m d− thõa kh«ng gian lµ kü thuËt m· ho¸ biÕn ®æi Cosine rêi r¹c (DCT) trªn c¸c khèi 8x8 ®iÓm ¶nh. Kü thuËt nµy ®· ®−îc sö dông trong ph−¬ng ph¸p nÐn ¶nh tÜnh tr×nh bµy ë Ch−¬ng 2. Kü thuËt m· ho¸ “Inter frame”: nh»m gi¶m ®é d− thõa thêi gian gi÷a c¸c frame ¶nh: Kü thuËt m· ho¸ “Inter frame” tÝnh gi¸ trÞ cña mét ®iÓm ¶nh riªng biÖt b»ng c¸ch dù ®o¸n tõ c¸c ®iÓm ¶nh trong ¶nh l©n cËn. Kü thuËt nµy xuÊt ph¸t tõ mèi t−¬ng quan thêi gian gi÷a c¸c ®iÓm ¶nh trong c¸c ¶nh l©n cËn. Ph−¬ng ph¸p ®Ó gi¶m ®é d− thõa thêi gian lµ kü thuËt m· ho¸ DPCM dùa trªn dù ®o¸n bï chuyÓn ®éng gi÷a c¸c frame. Trong m« h×nh nÐn Video theo chuÈn MPEG, ®Ó ®¹t ®−îc hiÖu qu¶ nÐn cao cÇn kÕt hîp c¶ hai kü thuËt nÐn ë trªn ®Ó gi¶m d− thõa kh«ng gian vµ thêi gian. M« h×nh nÐn Video Hybrid DPCM/DCT lµ sù kÕt hîp cña hai kü thuËt trªn (xem h×nh 1.12). M« h×nh Hybrid DPCM/DCT gåm cã c¸c kü thuËt: LÊy mÉu (subsampling) th«ng tin vÒ mµu ®Ó thÝch hîp víi ®é nhËy c¶m cña m¾t ng−êi.

NguyÔn H÷u Ph¸t

21

§å ¸n cao häc §TVT 2003

• • •

L−îng tö ho¸ (Quantization-Q) Néi suy ¶nh (picture interpolation). Dù ®o¸n bï chuyÓn ®éng bao gåm: ®¸nh gi¸ chuyÓn ®éng (motion estimation) vµ bï chuyÓn ®éng (motion compensation-MC)

• •

BiÕn ®æi Cosine rêi r¹c (DCT) ®Ó khai th¸c tÝnh d− thõa kh«ng gian. M· ho¸ chiÒu dµi thµy ®æi (VLC-Variable length coding).

H×nh 1.12. Nguyªn lý m· ho¸ Hybrid DCT/DPCM 1.4.2. LÊy mÉu th«ng tin vÒ mµu. LÊy mÉu víi tÇn sè lÊy mÉu thÊp h¬n lµ ®Ó gi¶m kÝch th−íc cña Video ®Çu vµo vµ nh− thÕ sÏ gi¶m sè l−îng c¸c ®iÓm tr−íc khi m· ho¸. LÊy mÉu mµu nghÜa lµ lÊy mÉu mµu ë tÇn sè thÊp h¬n tÇn sè lÊy mÉu theo lý thuyÕt Nyquist hoÆc Shannon. M¾t ng−êi nh¹y c¶m nhÊt víi ®é ph©n gi¶i thµnh phÇn ®é chãi cña ¶nh vµ Ýt nh¹y c¶m víi th«ng tin vÒ mµu. LÊy mÉu lµ mét ph−¬ng ph¸p gi¶m d÷

NguyÔn H÷u Ph¸t

22

Bé gi¶i m· cã thÓ kh«i phôc ¶nh hiÖn t¹i tõ ¶nh tr−íc vµ ¶nh sau. C¸c khèi trong ¶nh hiÖn t¹i cã thÓ ®−îc dù ®o¸n thuËn hoÆc ng−îc vµ ®−îc dÞch theo c¸c vÐct¬ chuyÓn ®éng. th× kü thuËt kh«i phôc ®ã gäi lµ kü thuËt néi suy ¶nh.§å ¸n cao häc §TVT 2003 liÖu rÊt cã hiÖu qu¶.v) cã gi¸ trÞ tõ 1 ®Õn 255 x¸c ®Þnh b−íc cña kÝch th−íc l−îng tö ho¸ t−¬ng øng.[] lµ lµm trßn vÒ sè nguyªn gÇn nhÊt. Bé gi¶i m· cã thÓ t¸i t¹o c¸c gi¸ trÞ ®iÓm ¶nh theo mét khèi cho tr−íc lµ trung b×nh cña c¸c gi¸ trÞ cña khèi tr−íc vµ khèi sau. ⎡ S (u .4.3. V× lý do nµy. v) ⎤ S q (u . v) * Q(u . v) = Sq (u . . CÊu tróc lÊy mÉu th−êng dïng lµ 4: 2: 2 vµ 4: 2: 0. nh−ng sù tæn thÊt ®é ph©n gi¶i ¶nh vµ c¸c thµnh phÇn chång phæ sÏ lµm gi¶m chÊt l−îng néi dung ¶nh gèc. Néi suy ¶nh. NguyÔn H÷u Ph¸t 23 . v) ⎦ trong ®ã: . v) 1. v) = ⎢ ⎥ ⎣ Q(u .v): hÖ sè l−îng tö ho¸ x¸c ®Þnh bëi b¶ng l−îng tö ho¸. sau ®ã lµm trßn vÒ sè nguyªn gÇn nhÊt. L−îng tö ho¸ ®−îc thùc hiÖn b»ng c¸ch chia mçi hÖ sè DCT cho c¸c gi¸ trÞ kÝch th−íc b−íc l−îng tö t−¬ng øng trong b¶ng l−îng tö. MPEG dïng cÊu tróc 4: 2: 0.4. nªn kh«ng dïng lÊy mÉu thÊp cho tÝn hiÖu chãi.Q(u. Gi¶i l−îng tö ho¸ ®−îc thùc hiÖn bëi: S '(u.4. 1. Q(u. L−îng tö ho¸.

§¸nh gi¸ chuyÓn ®éng lµ qu¸ tr×nh ®¸nh gi¸ xÊp xØ c¸c ®iÓm cña frame hiÖn t¹i tõ frame tham chiÕu. Trong thùc tÕ th× kh«ng ph¶i khèi t−¬ng thÝch lóc nµo còng gi÷ nguyªn tr¹ng th¸i c©n b»ng sau khi dÞch chuyÓn mµ trong qu¸ tr×nh dÞch chuyÓn nã bÞ NguyÔn H÷u Ph¸t 24 . vµ ®−îc thùc hiÖn t¹i bé m· ho¸ víi nhiÒu sù tÝnh to¸n phøc t¹p.§å ¸n cao häc §TVT 2003 1. §¸nh gi¸ chuyÓn ®éng ph¶i x¸c ®Þnh c¸c vÐct¬ chuyÓn ®éng. sÏ t¹o ra vÐct¬ chuyÓn ®éng (motion vÐct¬) thÝch hîp nhÊt (xem h×nh 1. 1.1. H×nh 1.13).5. §¸nh gi¸ chuyÓn ®éng (motion estimation). Khi qu¸ tr×nh t×m kiÕm kÕt thóc. bé m· ho¸ cè g¾ng ®èi s¸nh c¸c ®iÓm trong mét Macroblock víi c¸c ®iÓm trong ¶nh ®−îc m· ho¸ tr−íc hoÆc sau ®ã (theo thø tù hiÓn thÞ).5. Víi mçi chiÕn l−îc t×m kiÕm.13.4. Dù ®o¸n bï chuyÓn ®éng.2. Bï chuyÓn ®éng (Motion Compensation).4.5. X¸c ®Þnh vect¬ chuyÓn ®éng mv (motion vector) 1. Cã nhiÒu chiÕn l−îc t×m kiÕm ®Ó x¸c ®Þnh vÐct¬ chuyÓn ®éng.4.

Khi m· ho¸ thay v× ph¶i m· ho¸ toµn bé ¶nh ng−êi ta chØ cÇn m· ho¸ vÐct¬ chuyÓn ®éng vµ ¶nh sai sè dù ®o¸n. vµ ®−îc gäi lµ ng−îc nÕu ¶nh tham chiÕu lµ ¶nh sau ®ang xÐt (theo thø tù hiÓn thÞ). Bï chuyÓn ®éng nµy gäi lµ bï chuyÓn ®éng thuËn v× xu«i theo tr×nh tù thêi gian. Qu¸ tr×nh x©y dùng l¹i ¶nh ®−îc thùc hiÖn b»ng c¸ch lÊy ¶nh dù ®o¸n th«ng qua vÐct¬ chuyÓn ®éng céng víi sai sè dù ®o¸n. VÝ dô trong h×nh 1. Víi gãc quay nh− vËy sÏ lµm cho ¶nh sau khi x©y dùng l¹i sÏ bÞ lÖch ®i mét gãc nµo ®ã (lÖch h×nh). C¸c ¶nh P lu«n dïng bï chuyÓn ®éng thuËn tõ ¶nh I hoÆc P ®−îc truyÒn tr−íc ®ã.Do ®ã. do ®ã viÖc m· ho¸ sÏ ®ßi hái Ýt byte h¬n. Bï chuyÓn ®éng ®−îc thùc hiÖn t¹i bé m· ho¸ vµ gi¶i m·. C¸c ¶nh B ®−îc gi¶i m· sö dông bï chuyÓn ®éng tõ ¶nh I hoÆc ¶nh P tr−íc hoÆc sau ®ã (theo thø tù hiÓn thÞ). ¶nh ®ã ®−îc x¸c ®Þnh b»ng c¸ch lÊy ¶nh hiÖn t¹i trõ ®i ®i ¶nh sau khi dù ®o¸n. . NguyÔn H÷u Ph¸t 25 .11 ¶nh B2 dïng bï chuyÓn ®éng thuËn tõ ¶nh I1 vµ bï chuyÓn ®éng ng−îc tõ ¶nh P4.11). ¶nh I1 ®−îc gi¶i m· mµ kh«ng cÇn xÐt ®Õn vÐct¬ chuyÓn ®éng. nªn ®−îc gäi lµ bï chuyÓn ®éng néi suy. Dù ®o¸n ®−îc gäi lµ thuËn nÕu ¶nh tham chiÕu (¶nh I hoÆc ¶nh P) lµ ¶nh tr−íc ¶nh ®ang xÐt. Trong nhãm ¶nh trªn (h×nh 1. Qu¸ tr×nh kh«i phôc mét ¶nh b»ng c¸ch dïng c¸c phÇn ¶nh tõ ¶nh tr−íc cïng víi th«ng tin vÒ chuyÓn ®éng (vÐct¬ chuyÓn ®éng) nh− ë trªn gäi lµ bï chuyÓn ®éng (Motion Compensation).§å ¸n cao häc §TVT 2003 quay ®i mét gãc nµo ®ã. ¶nh B2 dïng bï chuyÓn ®éng hai chiÒu vµ kÕt qu¶ lÊy trung b×nh. nh−ng ¶nh P4 ®−îc gi¶i m· ph¶i sö dông vÐct¬ chuyÓn ®éng tõ ¶nh I1. ¶nh sai sè dù ®o¸n cã kÝch cì nhá h¬n rÊt nhiÒu so víi toµn bé ¶nh v× phÇn ¶nh gièng nhau sÏ bÞ triÖt tiªu (cã gi¸ trÞ b»ng 0) khi x¸c ®Þnh ¶nh sai sè dù ®o¸n. §Ó kh¾c phôc t×nh tr¹ng ®ã ng−êi ta ®−a vµo kh¸i niÖm ¶nh lçi dù ®o¸n. ¶nh sai sè dù ®o¸n lµ phÇn kh¸c nhau nhá nhÊt gi÷a ¶nh hiÖn t¹i ®−îc truyÒn vµ ¶nh dù ®o¸n tèt nhÊt cã thÓ ®¹t ®−îc.

Gi÷a nh÷ng ®iÓm kÕ tiÕp nhau cã liªn quan lÉn nhau dÉn ®Õn sù d− thõa. PhÇn chªnh lÖch gi÷a ®iÓm dù ®o¸n vµ ®iÓm hiÖn t¹i ®−îc m· ho¸. T−¬ng tù nh− biÕn ®æi DCT. H×nh 1. M· dù ®o¸n ®−îc dïng ®Ó lo¹i bá sù d− thõa ®ã. BiÕn ®æi Cosine rêi r¹c.14.6. H×nh 1. mçi gi¸ trÞ cña ®iÓm cã thÓ ®−îc dù ®o¸n ®Ó thay thÕ ®iÓm hiÖn t¹i.4. M· ho¸ dù ®o¸n ®ãng vai trß quan träng trong c¸c chuÈn nÐn ¶nh nh− JPEG vµ MPEG ®Ó cã hiÖu suÊt nÐn vµ ®¬n gi¶n h¬n.§å ¸n cao häc §TVT 2003 Qu¸ tr×nh kh«i phôc frame (víi lo¹i frame inter) sö dông bï chuyÓn ®éng gåm hai b−íc: + Céng vÐct¬ chuyÓn ®éng vµo frame tham chiÕu.14 minh ho¹ qu¸ tr×nh kh«i phôc frame. Minh ho¹ qu¸ tr×nh kh«i phôc frame 1. Dùa trªn qu¸ tr×nh t¹o c¸c ®iÓm tuÇn tù vµ luËt dù ®o¸n. + Céng sai sè dù ®o¸n vµ kÕt qu¶ trªn. Thµnh c«ng trong m· ho¸ Ýt bit h¬n so víi m· ho¸ trùc tiÕp ®iÓm hiÖn t¹i. NguyÔn H÷u Ph¸t 26 .

C¸c gi¸ trÞ cã tÇn sè xuÊt xuÊt hiÖn cao ®−îc g¸n tõ m· ng¾n. §Þnh d¹ng ®Çu vµo lµ: 720 ®iÓm mçi dßng.7.1.5. m· ho¸ ®−îc gäi lµ m· ho¸ cã ®é dµi thay ®æi nh»m tèi −u viÖc m· ho¸ víi sè l−îng bit Ýt nhÊt. c¸c tõ m· cã tÇn xuÊt xuÊt hiÖn thÊp ®−îc g¸n tõ m· dµi h¬n sao cho x©u biÓu diÔn m· ng¾n h¬n so víi d÷ liÖu gèc. CÊu tróc lÊy mÉu lµ 4: 2: 0. NguyÔn H÷u Ph¸t 27 . Tham sè ®Æc tr−ng ®Ò cËp ®Õn ë ®©y lµ ®Þnh d¹ng ¶nh ®Çu vµo vµ cÊu tróc lÊy mÉu. Kü thuËt nÐn Video theo chuÈn MPEG -1 chñ yÕu øng dông cho viÖc l−u tr÷ trªn CD-ROM vµ truyÒn trªn m¹ng. M· ho¸ VLC lµ ph−¬ng ph¸p m· ho¸ thèng kª. TØ lÖ bit lín nhÊt lµ 1.86 Mbit/s. Qu¸ tr×nh nÐn Video theo chuÈn MPEG-1.4. 576 dßng mçi ¶nh vµ 30 ¶nh mçi gi©y. Tham sè ®Æc tr−ng.§å ¸n cao häc §TVT 2003 1. g¸n c¸c tõ m· cho c¸c gi¸ trÞ ®−îc m· ho¸.5. M· VLC. Víi c¸ch g¸n trªn. §Çu vµo Video theo chuÈn bao gåm mét ®Þnh d¹ng ¶nh Video liªn tôc (non-interlaced) 1. 1.

2. X¸c ®Þnh sai lÖch gi÷a khèi thuéc frame hiÖn t¹i vµ khèi thuéc frame tr−íc ®ã.15. • • • NguyÔn H÷u Ph¸t 28 . Víi mçi khèi cña frame hiÖn t¹i: T×m kiÕm khèi gièng nhÊt trong frame tr−íc. H×nh 1.§å ¸n cao häc §TVT 2003 1. TÝnh to¸n vect¬ chuyÓn ®éng tõ khèi gièng nhÊt ®ã.5.1. PhÐp t×m kiÕm thùc hiÖn trªn mét vïng giíi h¹n. S¬ ®å khèi bé m· ho¸ video theo chuÈn MPEG-1 Quy tr×nh ho¹t ®éng cña bé ®¸nh gi¸ xÊp xØ chuyÓn ®éng vµ bï chuyÓn ®éng theo chuÈn MPEG-1 gåm: 1. Qu¸ tr×nh m∙ ho¸. M· hãa vÐct¬ chuyÓn ®éng. gäi lµ vïng t×m kiÕm.2. M· ho¸ khèi sai lÖch.5. Bé ®¸nh gi¸ chuyÓn ®éng. • • • • • Thao t¸c cho tõng khèi t¹i mçi thêi ®iÓm.

§å ¸n cao häc §TVT 2003 1. • Bé m· ho¸ dïng vÐct¬ chuyÓn ®éng vµ frame tham chiÕu ®Ó t¹o ra frame dù ®o¸n bï chuyÓn ®éng cña frame hiÖn t¹i. Bé bï chuyÓn ®éng. • • • 1. Thø tù l−u tr÷ trong FS cña bé m· ho¸ ph¶i ®ång nhÊt víi thø tù nµy trong bé gi¶i m·. Khèi hiÖn t¹i trõ ®i khèi dù ®o¸n ®Ó t¹o ra khèi sai lÖch bï chuyÓn ®éng. Bé bï chuyÓn ®éng t¹o ra frame dù ®o¸n bï chuyÓn ®éng (lµ frame gièng frame hiÖn t¹i nhÊt). l−îng tö ho¸ vµ m· ho¸.5. • NguyÔn H÷u Ph¸t 29 .5.2. • Mét b¶n sao kh«i phôc tõ frame ®· m· ho¸ ®−îc l−u tr÷ trong vïng ®Öm frame (frame store). khèi sai lÖch nµy cïng víi vÐct¬ chuyÓn ®éng ®−îc truyÒn ®i. C¸c hÖ sè sau khi l−îng tö ho¸ vµ c¸c vÐct¬ chuyÓn ®éng ®−îc m· ho¸ vµ truyÒn ®i. ®Ó frame nµy ®−îc dïng nh− frame tham chiÕu cho ®¸nh gi¸ chuyÓn ®éng. Qu¸ tr×nh m· ho¸.3.2. Khèi sai lÖch nµy ®−îc biÕn ®æi DCT. Sau khi m· ho¸. • Mçi khèi cña frame hiÖn t¹i (tøc mçi Macroblock 16x16 ®iÓm) ®−îc dù ®o¸n dùa vµo th«ng tin vÒ chuyÓn ®éng (tøc vect¬ chuyÓn ®éng) vµ frame tham chiÕu. Bé ®¸nh gi¸ chuyÓn ®éng tÝnh to¸n vÐct¬ chuyÓn ®éng cho mçi khèi b»ng c¸ch ®èi s¸nh frame ®Çu vµo hiÖn t¹i víi frame tham chiÕu gÇn nhÊt.2. • • • Frame hiÖn t¹i trõ ®i frame bï chuyÓn ®éng ®Ó t¹o ra frame sai lÖch bï chuyÓn ®éng.

c¸c hÖ sè l−îng tö ho¸ ®−îc l−îng tö ho¸ ng−îc. Frame I ®−îc l−u tr÷ trong bé ®Öm frame ®Ó lµm frame tham chiÕu dïng cho ®¸nh gi¸ chuyÓn ®éng vµ t¹o ra c¸c frame P vµ B. hoÆc P ®−îc tham chiÕu gÇn nhÊt. Frame P kh«ng ®−îc m· ho¸ trùc tiÕp nh− frame I. Frame dù ®o¸n ®−îc t¹o ra nhê sö dông vÐct¬ chuyÓn ®éng hai chiÒu vµ cÆp frame I vµ P. C¸ch ho¹t ®éng cña bé m· ho¸ phô thuéc vµo tõng lo¹i frame. Frame dù ®o¸n ®−îc t¹o ra nhê sö dông vÐct¬ chuyÓn ®éng vµ frame I. • • • Qu¸ tr×nh m· ho¸ frame I: NguyÔn H÷u Ph¸t 30 . biÕn ®æi ng−îc. frame B kh«ng ®−îc m· ho¸ trùc tiÕp mµ m· ho¸ frame sai lÖch gi÷a frame B hiÖn t¹i vµ frame dù ®o¸n (hai chiÒu) cña nã. hoÆc P vµ I ®−îc tham chiÕu gÇn nhÊt. Frame I ®−îc xö lý theo c¸ch thøc t−¬ng tù nh− ph−¬ng ph¸p nÐn ¶nh tÜnh theo chuÈn JPEG. vµ cïng víi frame dù ®o¸n bï chuyÓn ®éng ®Ó t¹o ra frame tham chiÕu míi.§å ¸n cao häc §TVT 2003 • §ång thêi. hoÆc P vµ P. T−¬ng tù nh− frame P. mµ m· ho¸ frame sai lÖch gi÷a frame P hiÖn t¹i vµ frame dù ®o¸n (thuËn) cña nã.

§å ¸n cao häc §TVT 2003

H×nh 1.16. Qu¸ tr×nh m· ho¸ frame I Qu¸ tr×nh m· ho¸ frame sai lÖch:

H×nh 1.17. Qu¸ tr×nh bï chuyÓn ®éng vµ m· ho¸ frame sai lÖch Tèc ®é bit cña tÝn hiÖu Video ®−îc nÐn kh«ng cè ®Þnh, phô thuéc vµo néi dung ¶nh ®ang xÐt. Ng−îc l¹i, t¹i ®Çu ra bé m· ho¸, dßng bit ph¶i cè ®Þnh

NguyÔn H÷u Ph¸t

31

§å ¸n cao häc §TVT 2003

®Ó x¸c ®Þnh tèc ®é cho dung l−îng kªnh truyÒn. Do ®ã, tr−íc khi truyÒn ®i, t¹i ®Çu ra bé m· ho¸ ph¶i cã bé nhí ®Öm ®ñ lín. Bé m· ho¸ ph¶i kiÓm tra tr¹ng th¸i ®Çy (overflow) cña bé nhí ®Öm. Khi sè liÖu trong bé nhí ®Öm gÇn b»ng dung l−îng cùc ®¹i, th× c¸c hÖ sè biÕn ®æi DCT ®−îc l−îng tö ho¸ Ýt chÝnh x¸c h¬n. Trong tr−êng hîp ng−îc l¹i, cã nghÜa lµ bé ®Öm chøa sè liÖu qu¸ Ýt (underflow), th× ®é chÝnh x¸c cña viÖc l−îng tö ho¸ c¸c hÖ sè sÏ t¨ng lªn. Bé nhí ®Öm ®−îc thiÕt kÕ theo kiÓu FIFO (First In First Out) vµ cã kÝch th−íc khai b¸o trong dßng d÷ liÖu ra ®Ó gi¶i m·. 1.5.3.Qu¸ tr×nh gi¶i m∙. S¬ ®å gi¶i m·:

H×nh 1.18. S¬ ®å khçi bé gi¶i m· video MPEG-1 Gi¶i m· lµ phÐp biÕn ®æi ng−îc cña m· ho¸, nh−ng ®¬n gi¶n h¬n do kh«ng cÇn thùc hiÖn ®¸nh gi¸ chuyÓn ®éng, vµ còng Ýt lùa chän h¬n. Bé gi¶i m· thùc hiÖn nh− sau: - Gi¶i m· c¸c vÐct¬ chuyÓn ®éng vµ c¸c hÖ sè. - C¸c hÖ sè ®−îc l−îng tö ho¸ ng−îc vµ biÕn ®æi ng−îc ®Ó t¹o ra frame sai lÖch. - Frame ®−îc kh«i phôc tr−íc ®ã (l−u tr÷ trong vïng ®Öm frame) kÕt hîp víi c¸c vÐct¬ chuyÓn ®éng ®Ó t¹o ra frame bï chuyÓn ®éng.

NguyÔn H÷u Ph¸t

32

§å ¸n cao häc §TVT 2003

- Kh«i phôc frame hiÖn t¹i b»ng c¸ch céng frame sai lÖch víi frame bï chuyÓn ®éng. - Frame hiÖn t¹i l¹i ®−îc l−u tr÷ trong vïng ®Öm frame ®Ó x©y dùng frame tham chiÕu míi. Tr−íc khi c¸c c¶nh ®−îc tr×nh diÔn, chóng cÇn ph¶i ®−îc s¾p xÕp l¹i theo thø tù tr×nh diÔn tù nhiªn cña nã. Sau khi s¾p xÕp, c¸c ¶nh ®−îc tr×nh diÔn theo ph−¬ng ph¸p mµ mçi øng dông lùa chän.

H×nh 1.19. S¾p xÕp thø tù hiÓn thÞ Chó ý: Bé m· ho¸ vµ bé gi¶i m· ph¶i sö dông thø tù frame tham chiÕu gièng nhau trong vïng ®Öm frame ®Ó tr¸nh tr−êng hîp bÞ lÖch h×nh (drift), do c¸c frame tham chiÕu bÞ sai trËt tù trong bï chuyÓn ®éng. H×nh 1.18 vµ 1.15 lµ s¬ ®å khèi ®¬n gi¶n (kh«ng xÐt tr−êng hîp m· ho¸ vµ gi¶i m· frame B). Trong tr−êng hîp ®èi víi frame B, cÇn cã 2 vïng ®Öm frame vµ 2 m¹ch x¸c ®Þnh vÐct¬ chuyÓn ®éng vµ bï chuyÓn ®éng. 1.6. Qu¸ tr×nh nÐn Video theo chuÈn MPEG-2. Kü thuËt nÐn Video theo chuÈn MPEG-2 lµ siªu tËp hîp (superset) c¸c kü thuËt cña chuÈn MPEG-1 vµ nã ®−îc thiÕt kÕ trªn c¬ së kÕ thõa MPEG1.RÊt nhiÒu gi¶i thuËt m· ho¸ Video ®· ®−îc tÝch hîp vµ mét có ph¸p ®¬n nh»m tho¶ m·n yªu cÇu cña c¸c øng dông.

NguyÔn H÷u Ph¸t

33

Ng−êi ta mong ®îi r»ng hÇu hÕt c¸c thùc hiÖn MPEG-2 sÏ phï hîp víi MAIN Profile t¹i MAIN Level.§å ¸n cao häc §TVT 2003 §iÓm ®Æc tr−ng míi cña ph−¬ng ph¸p nÐn Video theo chuÈn MPEG-2 lµ m· ho¸ ®−îc Video xen kÏ (interlaced Video). Tuy nhiªn trªn thùc tÕ kh«ng thÓ thùc hiÖn ®−îc có ph¸p ®Çy ®ñ cho hÇu hÕt c¸c øng dông. C¸c Profile vµ Level cung cÊp mét ph−¬ng tiÖn cho viÖc ®Þnh nghÜa c¸c tËp con có ph¸p vµ nh− vËy bé gi¶i m· cã kh¶ n¨ng gi¶i m· mét luång bit c¸ biÖt. vµ sù gi¶m chÊt l−îng Ýt (graceful degradation) khi xuÊt hiÖn c¸c lçi truyÒn dÉn. H¬n n÷a nh÷ng më réng cña m· ho¸ Video scalable ®· ®−îc thùc hiÖn ®Ó cung cÊp thªm c¸c chøc n¨ng nh− lµ m· ho¸ nhóng cña TV vµ HDTV sè. MAIN Profile cung cÊp kh¶ n¨ng m· ho¸ Non-scalable cho ¶nh Video sè víi c¸c tham sè gÇn gièng TV ®ã lµ mËt ®é lÊy mÉu cùc ®¹i lµ 720 mÉu víi mçi dßng vµ 576 dßng cho mçi frame. Theo nguyªn t¾c chung. mçi Profile ®Þnh nghÜa mét tËp míi c¸c gi¶i thuËt ®−îc thªm nh− lµ mét siªu tËp hîp vµo c¸c gi¶i thuËt trong Profile ë d−íi. NguyÔn H÷u Ph¸t 34 .1 vµ 1. tèc ®é frame cùc ®¹i lµ 30 frame mçi gi©y vµ tèc ®é bit tèi ®a lµ 15 Mbit/s. Kh¸i niÖm nµy ®−îc minh ho¹ b»ng b¶ng 1. MPEG-2 ®−a ra hai kh¸i niÖm “Profiles” vµ “Level” qui ®Þnh sù phï hîp gi÷a thiÕt bÞ kh«ng hç trî kh¶ n¨ng thùc hiÖn ®Çy ®ñ. Mét Level x¸c ®Þnh d¶i c¸c tham sè ®−îc cung cÊp khi thùc hiÖn nh− kÝch th−íc ¶nh. Nßng cèt h¹t nh©n cña MPEG-2 t¹i MAIN Profile m« t¶ nh÷ng nÐt næi bËt m· ho¸ Non-scalable cña c¶ nguån ¶nh Video liªn tôc (progressive) vµ xen kÏ (interlaced). tèc ®é frame vµ tèc ®é bit.2.

BiÓu diÔn YUV víi cÊu tróc 4: 2: 2 cho c¶i thiÖn c¸c yªu cÇu chÊt l−îng. BiÓu diÔn YUV víi cÊu tróc 4: 0: 0. • Hç trî tÊt c¶ c¸c tÝnh n¨ng cung cÊp bëi SNR Scalable SPATIAL Scalable Profile céng víi mét thuËt to¸n cho: • • M· ho¸ Spatial Profile (cho phÐp 2 líp). BiÓu diÔn YUV víi cÊu tróc 4: 2: 0. Hç trî tÊt c¶ c¸c tÝnh n¨ng cung cÊp bëi MAIN Profile céng víi mét thuËt to¸n cho: • • M· ho¸ SNR Scalable (cho phÐp 2 líp). ThuËt to¸n m· ho¸ Non-scalable hç trî c¸c tÝnh n¨ng cho: • M· ho¸ ¶nh Video xen kÏ. MAIN • • • Bao gåm tÊt c¶ c¸c tÝnh n¨ng cung cÊp bëi MAIN Profile SIMPLE nh−ng: • • Kh«ng cung cÊp c¸c chÕ ®é dù ®o¸n ¶nh B.1. B¶ng 1. Truy cËp ngÉu nhiªn. C¸c thuËt to¸n vµ c¸c tÝnh n¨ng hç trî víi mçi Profile NguyÔn H÷u Ph¸t 35 . BiÓu diÔn YUV víi cÊu tróc 4: 2: 0.§å ¸n cao häc §TVT 2003 Profile ThuËt to¸n Hç trî tÊt c¶ c¸c tÝnh n¨ng ®−îc cung cÊp bëi Spatial HIGH Scalable Profile céng víi sù cung cÊp c¸c hç trî sau: • 3 líp víi c¸c chÕ ®é m· ho¸ SNR vµ Spatial scalable. C¸c chÕ ®é dù ®o¸n ¶nh B. BiÓu diÔn YUV víi cÊu tróc 4: 2: 0.

6. 30 frames/gi©y. 352 mÉu/dßng 288 dßng/frame. 80 Mbit/s/ 1440 mÉu/dßng 1152 dßng/frame. 4 Mbit/s. Tham sè ®Æc tr−ng ®Ò cËp ®Õn ë ®©y lµ ®Þnh d¹ng ¶nh ®Çu vµo vµ cÊu tróc lÊy mÉu. 30 frames/gi©y. 60 frames/gi©y. 60 Mbit/s. HIGH • • • • HIGH 1440 • • • • MAIN • • • • LOW B¶ng 1. C¸c giíi h¹n trªn cña c¸c tham sè t¹i mçi Level cña mét Profile. 60 frames/gi©y.§å ¸n cao häc §TVT 2003 Level • • • • C¸c tham sè 1920 mÉu/dßng. Tham sè ®Æc tr−ng. 1152 dßng/frame. 15 Mbit/s. 1. 576 dßng NguyÔn H÷u Ph¸t 36 .1. §Þnh d¹ng ®Çu vµo lµ: 720 ®iÓm ¶nh cho mçi dßng. 720 mÉu/dßng 576 dßng/frame.2.

trong khi vÉn duy tr× ph¹m vi ®Çy ®ñ cña c¸c chøc n¨ng cung cÊp bëi MPEG1. nh−ng nã kh«ng sö dông c¸c m« h×nh dù ®o¸n cho frame B ë bé m· ho¸. §èi víi MAIN Profile: Nguyªn t¾c m· ho¸ ë ®©y lµ sù më réng trùc tiÕp cña nguyªn lý m· ho¸ trong MPEG-1 ®Ó ®iÒu chØnh m· ho¸ Video xen kÏ. Khi ®ã mét tr−êng ®−îc chia thµnh c¸c Macroblock vµ ¸p dông m· ho¸ nh− mét frame trong MPEG-1.6. khi ®ã viÖc m· ho¸ trë thµnh m· ho¸ truyÒn thèng cña chuçi Video liªn tiÕp. Còng gièng nh− chuÈn MPEG-1. 1. CÊu tróc lÊy mÉu lµ 4: 2: 2. §èi víi SIMPLE Profile: Nguyªn lý m· ho¸ còng t−¬ng tù nh− MAIN Profile. ®é phøc t¹p khi thùc hiÖn vµ khèi l−u tr÷ c¸c frame tham chiÕu cho viÖc gi¶i m· ¶nh B kh«ng cÇn cho bé gi¶i m· cña chuÈn MPEG-2 (chØ ®èi v¬i SIMPLE Profile). thuËt to¸n m· ho¸ MPEG-2 dùa trªn nguyªn lý m· ho¸ Hybrid DCT/DPCM nh− h×nh 1. MPEG-2 ®−a vµo kh¸i niÖm frame picture vµ field picture t−¬ng øng víi hai chÕ ®é dù ®o¸n lµ frame prediction vµ field prediction ®Ó ®iÒu tiÕt m· ho¸ ¶nh Video liªn tôc vµ xen kÏ. C¶ hai tr−êng nµy cã thÓ ®−îc m· ho¸ ®éc lËp.12. §èi víi chuçi xen kÏ (interlaced sequence).2. Hai tr−êng còng cã thÓ ®−îc m· ho¸ ®ång thêi. TØ lÖ bit lín nhÊt lµ 15 Mbit/s. mét frame gåm hai tr−êng: mét tr−êng ch½n (even field-bottom field) vµ mét tr−êng lÎ (odd fieldtop field). NguyÔn H÷u Ph¸t 37 . M« h×nh m∙ ho¸ Non-scalable theo MPEG-2.§å ¸n cao häc §TVT 2003 cho mçi frame vµ 30 frame (¶nh) mçi gi©y cho Main Profile vµ Main Level. Nh− vËy. §Ó tho¶ m·n cho viÖc m· ho¸ c¶ Video liªn tôc vµ xen kÏ.

Trong mét field picture tÊt c¶ c¸c dù ®o¸n lµ dù ®o¸n tr−êng (field prediction). C¸c nguyªn lý dù ®o¸n tr−êng bï chuyÓn ®éng (motion compensated field prediction) ®Ó dù ®o¸n chuyÓn ®éng cña field picture t−¬ng øng (xem h×nh 1. M« h×nh m∙ ho¸ scalable theo MPEG-2. C¸c bé thu nhËn hoÆc kh«ng cã kh¶ n¨ng hoÆc s½n sµng x©y dùng l¹i Video víi ®é ph©n gi¶i ®Çy ®ñ cã thÓ gi¶i m· c¸c tËp con cña dßng bit ®· ph©n líp ®Ó biÓu diÔn Video trong ®é ph©n gi¶i kh«ng gian hoÆc thêi gian thÊp h¬n hoÆc víi chÊt l−îng thÊp h¬n.3. NguyÔn H÷u Ph¸t 38 . Trong ®ã tr−êng top ®−îc dù ®o¸n tõ tr−êng top tr−íc ®ã hoÆc tõ mét tr−êng bottom tr−íc ®ã thuéc cïng mét ¶nh.§å ¸n cao häc §TVT 2003 H×nh 1. dù ®o¸n ®−îc t¹o ra mét c¸ch ®éc lËp cho mçi tr−êng dùa trªn mét hoÆc nhiÒu tr−êng tham chiÕu.6. 1. Môc ®Ých cña m· ho¸ scalable lµ cung cÊp sù thao t¸c gi÷a c¸c dÞch vô kh¸c nhau vµ hç trî c¸c dÞch vô mét c¸ch linh ho¹t víi c¸c kh¶ n¨ng biÓu diÔn kh¸c nhau. Nh− vËy trong frame picture cã thÓ sö dông dù ®o¸n frame hoÆc field.20). Trong field prediction. Kh¸i niÖm frame picture. field picture vµ dù ®o¸n tr−êng (field prediction). Dù ®o¸n frame cã thÓ sö dông nh− trong MPEG-1 hoÆc cã thÓ sö dông nh− hai dù ®o¸n field kÕt hîp.20.

Ngoµi ra sù t−¬ng t¸c gi÷a c¸c dÞch vô HDTV vµ SDTV cã thÓ ®−îc cung cÊp kÌm theo kh¶ n¨ng hiÖu chØnh c¸c lçi kªnh truyÒn b»ng c¸ch kÕt hîp sù më réng Spatial scalability víi c«ng cô SNR scalability. Spatial scalability vµ temporal scalability. Spatial scalability: u §−îc ph¸t triÓn ®Ó hç trî hiÓn thÞ c¸c ®é ph©n gi¶i kh¸c nhau t¹i bé thu nhËn. cã nghÜa lµ sù t−¬ng t¸c gi÷a c¸c dÞch vô kÓ c¶ ®é ph©n gi¶i kh«ng gian vµ tØ lÖ frame kh¸c nhau cã thÓ ®−îc hç trî b»ng c¸ch kÕt hîp Spatial scalability vµ Temporal scalability. Cã thÓ kÕt hîp c¸c c«ng cô scalability kh¸c nhau thµnh mét s¬ ®å m· ho¸ hybrid. NghÜa lµ ¶nh Video cã ®é ph©n gi¶i kh«ng gian thÊp cã thÓ ®−îc kh«i phôc tõ líp c¬ së. ChuÈn MPEG-2 chuÈn ho¸ 3 nguyªn lý m· ho¸ scalable lµ: SNR scalability. Mçi nguyªn lý cã mét chøc n¨ng riªng nh»m hç trî cho c¸c øng dông cã yªu cÇu riªng biÖt. NguyÔn H÷u Ph¸t 39 . u Cã kh¶ n¨ng hç trî mét c¸ch linh ho¹t cho mét ph¹m vi réng ®é ph©n gi¶i nh−ng khi ®ã ®é phøc t¹p tÝnh to¸n trong MAIN Profile còng sÏ t¨ng. cho phÐp chuyÓn c¸c dÞch vô TV sè ®Õn c¸c dÞch vô HDTV víi ®é ph©n gi¶i kh«ng gian cao h¬n. SNR scalability: u C«ng cô nµy ®−îc ph¸t triÓn ®Ó cung cÊp sù suy gi¶m chÊt l−îng uyÓn chuyÓn (graceful degradation) cña chÊt l−îng Video trong m«i tr−êng truyÒn −u tiªn. u ThuËt to¸n dùa trªn ph−¬ng ph¸p tiÕp cËn h×nh chãp truyÒn thèng cho m· ho¸ ¶nh liªn tôc.§å ¸n cao häc §TVT 2003 Mét øng dông quan träng cho m· ho¸ scalable gåm cã viÖc liÖt kª c¬ së d÷ liÖu Video vµ biÓu diÔn l¹i ®a ph©n gi¶i cña Video trong c¸c m«i tr−êng ®a ph−¬ng tiÖn. TÝnh n¨ng nµy rÊt h÷u hiÖu cho rÊt nhiÒu øng dông bao gåm m· ho¸ nhóng cho c¸c hÖ thèng HDTV/TV.

21). u ThuËt to¸n lµ t−¬ng tù nh− c«ng cô SNR scalability. Ph©n vïng d÷ liÖu: u C«ng cô nµy nh»m trî gióp huû bá lçi cã mÆt trong khi truyÒn ®¹t hoÆc lçi kªnh truyÒn trong ATM. dùa trªn sù ph©n chia c¸c hÖ sè vµ ®−îc thùc hiÖn víi ®é phøc t¹p thÊp so víi c¸c s¬ ®å scalable m· ho¸ kh¸c.22). u Cung cÊp sù b¶o vÖ lçi.§å ¸n cao häc §TVT 2003 u ThuËt to¸n th−êng sö dông ®Ó cã ®−îc sù suy gi¶m uyÓn chuyÓn (graceful degradation) dùa trªn kü thuËt scalability tuÇn tù (DCT-domain). u Líp n©ng cao m· ho¸ vµ truyÒn sù kh¸c nhau gi÷a c¸c hÖ sè DCT kh«ng ®−îc l−îng tö vµ hÖ sè DCT ®· ®−îc l−îng tö tõ líp c¬ së víi kÝch cì b−íc l−îng tö tèt (xem h×nh 1. u T¹i líp c¬ së. Temporal scalability: u C«ng cô ®−îc ph¸t triÓn víi môc ®Ých t−¬ng tù nh− Spatial scalability. u T¹i bé gi¶i m·. c¸c hÖ sè DCT ®−îc l−îng tö ho¸ vµ truyÒn th« ®Ó ®¹t ®−îc chÊt l−îng võa ph¶i vµ gi¶m tØ sè bit (xem h×nh 1. c¸c hÖ sè DCT m· ho¸ trong dßng bit ®−îc chia vµ truyÒn mét c¸ch ®¬n gi¶n trong hai líp víi kh¶ n¨ng x¶y ra lçi kh¸c nhau. NguyÔn H÷u Ph¸t 40 .21). truyÒn th«ng hoÆc c¸c m«i tr−êng thu ©m hÊp dÉn. tÝn hiÖu Video chÊt l−îng cao nhÊt ®−îc x©y dùng l¹i b»ng c¸ch gi¶i m· dßng bit ë c¶ líp c¬ së vµ líp n©ng cao (xem h×nh 1.

§å ¸n cao häc §TVT 2003 H×nh 1. Bé m· ho¸ hai líp cho m· ho¸ SNR scalable cña video H×nh 1. Bé gi¶i m· cho m· ho¸ SNR scalable cña video NguyÔn H÷u Ph¸t 41 .22.21.

1. Tuy vËy vÉn cã mét sè vÊn ®Ò x¶y ra. Trong h×nh 2. H×nh 2. Thø 3.1.2 cung cÊp s¬ ®å khèi tæng qu¸t cña hÖ thèng m· ho¸ Video 3 chiÒu.§å ¸n cao häc §TVT 2003 Ch−¬ng 2 M· ho¸ SCALABLE VIDEO 2. B¨ng läc 1/2 pixel biÕn ®æi ng−îc theo thêi gian . viÖc m· ho¸ dïng DPCM chØ ®−îc thùc hiÖn khi cã xung tiÕp theo. viÖc x¸c ®Þnh vÞ trÝ bit tèi −u phøc t¹p phô thuéc vµo khung ®−îc l−îng tö ho¸. Trong c¸c hÖ thèng m· ho¸ Video (vÝ dô MPEG-1. 8] vµ H.tÝnh to¸n bï chuyÓn ®éng §Ó ®¹t hiÖu qu¶ cao trong nÐn tÝn hiÖu Video ng−êi ta ph¶i t×m c¸ch lo¹i bá d− thõa vÒ mÆt thêi gian bëi do c¸c khung s¸t nhau cã sù t−¬ng quan rÊt lín. ®ã lµ: Thø nhÊt.261/263) sù d− thõa vÒ mÆt thêi gian ®−îc lo¹i bá nhê kü thuËt m· ho¸ lai (hybrid coding technique). Thø 2. BiÕn ®æi m· ho¸ 3 chiÒu (3-D) lµ mét ph−¬ng ph¸p tiÕp cËn cã hiÖu qu¶ trong nÐn Video. Theo c¸ch nµy sù d− thõa cña c¸c khung liªn tiÕp nhau sÏ ®−îc sö dông tèt. 2 [7. ta thÊy bé biÕn ®æi 3 chiÒu kh«ng chøa m¹ch vßng DPCM trong bé m· ho¸ lai. NguyÔn H÷u Ph¸t 42 . Do ®ã nã thÓ tr¸nh ®−îc nh÷ng nh−îc ®iÓm cña ph−¬ng ph¸p m· ho¸ truyÒn thèng. Trong kü thuËt nµy cÊu tróc xung tr−íc ®−îc sö dông ®Ó dù ®o¸n xung hiÖn thêi sau khi bï chuyÓn ®éng nh− h×nh 2. KÕt qu¶ lµ hiÖu qu¶ nÐn gi¶m khi tèc ®é bit thÊp.1. KÕt qu¶ lµ khung sai kh¸c thay thÕ cã n¨ng l−îng thÊp h¬n tÝn hiÖu nguån sÏ ®−îc truyÒn ®i vµ ®−îc m· ho¸. khi gi¶m sù d− thõa thêi gian th× tèc ®é bit m· ho¸ còng gi¶m. bï chuyÓn ®éng ®iÒu xung m· vi ph©n (DPCM) vµ biÕn ®æi m· ho¸. Tuy nhiªn viÖc biÕn ®æi trùc tiÕp th−êng gÆp khã kh¨n víi bé nhí cao vµ m· ho¸ cã trÔ.

Môc 2. S¬ ®å bé gi¶i m· Ch−¬ng nµy xin giíi thiÖu mét hÖ thèng m· ho¸ Video 3 chiÒu míi. kÕt hîp gi÷a b¨ng läc MC-3D vµ thuËt to¸n m· ho¸ mÆt ph¼ng bit EZBC sÏ ®−îc tr×nh bµy trong ch−¬ng tiÕp theo.2 miªu t¶ toµn bé l−îc ®å ph©n tÝch tæng hîp b¨ng con.1.2.1.3 miªu t¶ hÖ thèng b¨ng con 3-D víi cÊu tróc MC3D-FSSQ. PhÇn sau chóng ta sÏ nghiªn cøu c¸c c«ng viÖc liªn quan ®Õn viÖc h×nh thµnh m· ho¸ b¨ng con 3-D.§å ¸n cao häc §TVT 2003 H×nh 2. Môc 2.4 tr×nh bµy nh÷ng kÕt qu¶ thùc nghiÖm. Môc 2. NguyÔn H÷u Ph¸t 43 . S¬ ®å bé m· ho¸ H×nh 2.1.1.

Do sù thùc hiÖn kh«ng qu¸ phøc t¹p l−îc ®å nµy vÉn ®−îc sö dông réng r·i trong hÖ thèng m· ho¸ b¨ng läc 3 chiÒu. Giíi thiÖu M· ho¸ wavelet b¨ng con 3-D cho Video ®· ®−îc t¨ng c−êng nghiªn cøu trong nh÷ng n¨m gÇn ®©y bëi nh÷ng −u ®iÓm quan träng cña nã so víi ph−¬ng ph¸p biÕn ®æi truyÒn thèng DCT. tÝn hiÖu d− thõa thªm vµo ®−îc m· ho¸ víi pixel chø kh«ng theo vect¬ chuyÓn ®éng. Thay v× thùc hiÖn trùc tiÕp ¶nh ®Çu vµo. TÝnh chÝnh x¸c cña b¨ng läc sÏ ®¹t ®−îc khi bé bï chuyÓn ®éng thùc hiÖn víi ®iÓm ¶nh ®Çy ®ñ. Trong ph−¬ng ph¸p TRI-ZTR cho tèc ®é Video thÊp. §iÒu ®ã nãi lªn r»ng bï chuyÓn ®éng víi mét nöa ®iÓm ¶nh lµ cÇn thiÕt ®Ó t¨ng hiÖu qu¶ trong viÖc lµm gi¶m n¨ng l−îng cña khung sai kh¸c.1. c¸c ®iÓm ¶nh ®−îc s¾p xÕp theo vÕt chuyÓn ®éng cho b¨ng läc thêi gian bï chuyÓn ®éng. Tuy nhiªn khi tÝn hiÖu Video ®Çu vµo yªu cÇu tèc ®é nhanh kh«ng thÓ dïng ®−îc ph−¬ng ph¸p nµy. Do ®Çu NguyÔn H÷u Ph¸t 44 . Tuy nhiªn. kÕt hîp víi khung th«ng th−êng vµ sai kh¸c. KÕt qu¶ hÖ thèng ph©n tÝch vµ tæng hîp kh«ng thÓ kh«i phôc hoµn h¶o kh«ng thÝch hîp cho øng dông m· ho¸ Video ë tèc ®é cao. Nhê ®ã sÏ gi¶m ®−îc sù d− thõa n¨ng l−îng cña b¨ng läc th«ng cao.§å ¸n cao häc §TVT 2003 2.3 minh ho¹ thuËt to¸n m· ho¸ cña bé läc bï chuyÓn ®éng theo thêi gian. ¶nh h−ëng cña ®a kÕt nèi vµ kh«ng kÕt nèi trong bé m· ho¸ bï chuyÓn ®éng ®−îc bá qua trong phÇn nµy. Trong ph−¬ng ph¸p Kronander dùa trªn 3-DDCT vµ m· ho¸ b¨ng con 3-D. thuËt to¸n b¨ng läc theo thêi gian sÏ ®−îc tiÕn hµnh theo ®−êng chuyÓn ®éng cña ¶nh. ®−îc chän cho b¨ng läc thêi gian ®Ó tr¸nh trÔ m· ho¸ vµ bé nhí lín. H×nh 2.1. Mét cÆp b¨ng läc Haar 2 chiÒu. Ba tham sè cho m· ho¸ wavelet/b¨ng con bï chuyÓn ®éng côc bé sÏ ®−îc tr×nh bµy ë phÇn sau. Karlsson vµ Vetterli lµ ng−êi ®Çu tiªn kh¸i qu¸t viÖc ph¸t triÓn tõ m« h×nh hai chiÒu lªn ba chiÒu.

Ht: §å thÞ thêi gian cña ®Çu ra th«ng cao. H×nh 2.3. PhÐp néi suy ®−îc sö dông cho ®iÓm ¶nh ®Ó trong l−íi con c¶ tr−êng hîp ph©n tÝch vµ tæng hîp. ChØ mét tr¹ng th¸i ®−îc sö dông trong øng dông HDTV. VÝ dô 2 tr¹ng th¸i ph©n tÝch trong MC3D-FSSQ cho ph©n gi¶i m· ho¸ SIF. Trong qu¸ tr×nh néi suy kÕt qu¶ lµ kh¶ n¨ng kh«i phôc cña b¨ng läc lµ kh«ng cao. §Ó gi¶m mÐo cho hÖ thèng trong qu¸ tr×nh ph©n tÝch vµ tæng hîp. (a) Mét cÆp khung liÒn kÒ (b) Ph©n tÝch tÝn hiÖu Video (A: khung tr−íc ®ã. L−îc ®å ph©n tÝch bï chuyÓn ®éng víi ®iÓm ¶nh chÝnh x¸c. Haar chØ kÕt dÝnh gi÷a khung hiÖn t¹i vµ tr−íc ®ã. mét sè tr¹ng th¸i ph©n tÝch bÞ h¹n chÕ.§å ¸n cao häc §TVT 2003 ra cña b¨ng läc th«ng cao. b¨ng läc thêi gian bï chuyÓn ®éng víi mét nöa ®iÓm ¶nh ®−îc lùa chän ®Ó lµm gi¶m tÇn sè n¨ng l−îng b¨ng con.) NguyÔn H÷u Ph¸t 45 . B: khung hiÖn thêi. Lt: §å thÞ thêi gian cña ®Çu ra th«ng thÊp.

ThuËt to¸n Môc ®Ých chÝnh cña biÓn ®æi ng−îc b¨ng läc bï chuyÓn ®éng (IMCTF) lµ khai th¸c l−íi nhÞ tè ph©n gi¶i ®iÓm ¶nh trong nguån Video.2) ∆ Sc ( x = vx . 2.§å ¸n cao häc §TVT 2003 MÆc dï. vy). y − v y . Trong hÖ thèng míi kh«ng quan t©m ®Õn viÖc kh«i phôc lçi. C−êng ®é tÝn hiÖu Video ®−îc biÓu diÔn theo c«ng thøc: Sc ( x.2.t . chuçi ¶nh ®Çu vµo ®−îc ph©n t¸ch thµnh 4 tr¹ng th¸i theo thêi gian sö dông cho biÕn ®æi ng−îc b¨ng läc 3 chiÒu. bé m· ho¸ bï chuyÓn ®éng MC-DPCM ®−îc lùa chän cho b¨ng läc th«ng thÊp theo thêi gian trong MC3D-FSSQ. t ) = Sc 0 ( x − vx . y − v y . Do ®ã khi th«ng tin th«. ng−êi ta cã thÓ tèi −u ho¸ trong viÖc ph©n chia bit trong ®¬n vÞ d÷ liÖu cña mçi nhãm ¶nh trong tr−êng hîp mÐo ¶nh.1) (2. vÞ trÝ bit vÉn kh«ng thÓ tèi −u ho¸ ®Çy ®ñ cho m· ho¸ nhãm GOP. 2.t .t ) (2.1 M« h×nh Video phæ biÕn M« h×nh phæ biÕn trong mÆt ph¼ng Video ®−îc giíi thiÖu bëi vÐct¬ chuyÓn ®éng toµn côc (vx. Nhãm ¶nh gåm 16 khung hoµn toµn kh«ng chøa bÊt kú cÊu tróc m· ho¸ nµo. Nã dùa trªn sù quan s¸t l−íi nhÞ tè cña 2 khung ®an xen s¸t c¹nh nhau vµ ghÐp 2 khung ph©n gi¶i vÒ kh«ng gian sau khi bï ®iÓm ¶nh chÝnh x¸c trong ®Æc tÝnh quÐt Video bëi vÐct¬ bï chuyÓn ®éng 1/2 ®iÓm ¶nh. ThuËt to¸n sÏ thùc hiÖn quÐt luü tiÕn víi 1/2 ®iÓm ¶nh trªn vÐct¬ ®Çu vµo. §ã lµ chóng ta cã thÓ lÊy mÉu víi mËt ®é dµy ®Æc ¶nh ®Çu vµo liªn tôc ngay khi vÐct¬ tr−êng chuyÓn ®éng ch−a ®¸p øng ®−îc vÐc t¬ liªn quan ®Õn chuyÓn ®éng trong l−íi lÊy mÉu. ThuËt to¸n thÝch nghi cho m· ho¸ Video thùc sÏ ®−îc tr×nh bµy cuèi cïng.2. PhÇn nµy b¾t ®Çu víi m« h×nh phæ biÕn cho 2 ®Þnh d¹ng: quÐt xen kÏ vµ quÐt luü tiÕn. y.1.t .1.0) Vµ tÝn hiÖu lÊy mÉu Video ®−îc biÓu diÔn: NguyÔn H÷u Ph¸t 46 .

1) víi vÐct¬ chuyÓn ®éng toµn côc v = (0. m« t¶ trong h×nh 2. n. 0). VÝ dô. Do kh«ng gian cña l−íi lÊy mÉu gåm 2 tr−êng ch½n vµ lÎ ®an NguyÔn H÷u Ph¸t 47 . (2. t) (b) Kh«ng gian lÊy mÉu cña 2 tr−êng s¸t c¹nh nhau.4 theo 2 chiÒu thêi gian vµ trôc th¼ng ®øng.§å ¸n cao häc §TVT 2003 S[m. xem xÐt tÝn hiÖu Video ®an xen trong m« h×nh (2. kh¶ n¨ng ph©n gi¶i ¶nh cao tõ ®a khung phô thuéc vµo l−íi lÊy mÉu vµ vÐct¬ chuyÓn ®éng toµn côc.3) NÕu tÊt c¶ c¸c khung cña tÝn hiÖu Video lÊy mÉu ®−îc s¾p xÕp theo khung tham chiÕu. n. ®iÓm ¶nh trong l−íi con cña khung tham chiÕu cã thÓ ®−îc lÊp ®Çy trong khung lÊy mÉu tõ vÞ trÝ l−íi gièng nhau cña c¸c khung kh¸c sau khi bï chuyÓn ®éng. H×nh 2. L−íi lÊy mÉu cho tÝn hiÖu Video xen kÏ (a) LÊy mÉu cña tÝn hiÖu Video theo 2 chiÒu (y. k]T. k] = Sc (VN) ë ®©y V ma trËn lÊy mÉu vu«ng 3x3 vµ N = [m. ChÝnh v× vËy.4.

NguyÔn H÷u Ph¸t 48 . H×nh 2. mçi ®iÓm ¶nh trong chuçi ¶nh ®−îc kÕt nèi tíi mÉu ®ang tån t¹i trong khung tham kh¶o. n ] .5. n chan ⎪ C [ m. n ] . khi sù hiÖu chØnh vÒ phÝa sau däc theo vÕt chuyÓn ®éng. Minh ho¹ vËn tèc tíi h¹n trong tÝn hiÖu Video theo ®Þnh d¹ng quÐt luü tiÕn.4 (b).§å ¸n cao häc §TVT 2003 xen nhau nh− h×nh 2. (a) L−íi lÊy mÉu cña tÝn hiÖu Video víi vÐct¬ chuyÓn ®éng côc bé v = (0. mét khung ghÐp lai víi sù ph©n gi¶i kh«ng gian ®Çy ®ñ cã thÓ ®−îc cÊu tróc bëi viÖc kÕt hîp hµi hoµ 1 cÆp c¹nh nhau nh− sau: ⎧ A[ m. TiÕp theo chóng ta sÏ xem xÐt tÝn hiÖu Video viÖc quÐt luü tiÕn. 1).4) ë ®©y A vµ B lµ gi¸ trÞ ch½n vµ lÎ cña 1 cÆp s¸t nhau vµ C ký hiÖu lµ xung kÕt Kü thuËt lÊy mÉu ®an xen nµy ®−îc h×nh thµnh trong øng dông TV nh»m lµm gi¶m tèc ®é lÊy mÉu cña tÝn hiÖu Video. (b) L−íi lÊy mÉu cña 2 khung liªn tiÕp sau khi bï chuyÓn ®éng. n le ⎩ hîp.5 (a). Nh− minh ho¹ h×nh 2. (2. n ] = ⎨ ⎪ B [ m.

1. Líp OO: 2dm lÎ. n le ⎩ (2. Líp EE: 2dm ch½n.§å ¸n cao häc §TVT 2003 2.6 (a) gièng nh− l−íi lÊy mÉu trªn h×nh 2. ë ®©y (d m . n / 2 + d n ] .®Ó gi÷ cho bé läc néi suy trong qu¸ tr×nh chuyÓn ®éng. chóng ta cã thÓ x¸c ®Þnh khung C víi sù ph©n gi¶i gÊp ®«i theo chiÒu däc: ⎧ A[ m.∆t ) lµ vÐct¬ chuyÓn ®éng gi÷a khung tr−íc ®ã vµ khung hiÖn t¹i vµ ∆t lµ chu kú lÊy mÉu. 2dn lÎ. Do ®ã viÖc lÊy mÉu l−íi cña 2 khung c¹nh nhau ®−îc trén lÉn sau khi bï chuyÓn ®éng.4 (b) co l¹i 0.5) ë ®©y A vµ B ký hiÖu xung tr−íc ®ã vµ khung hiÖn t¹i.6. Khung ghÐp nµy ®−îc ph©n thµnh 2 kªnh ph©n tÝch b¨ng läc con theo chiÒu däc (B¨ng läc NguyÔn H÷u Ph¸t 49 . Do ®ã ®iÓm ¶nh bÞ mÊy sÏ ®−îc lÊp ®Çy bëi thêi gian 0 . 2dn ch½n. n ] = ⎨ ⎪ B [ m + d m . Líp OE: 2dm lÎ. chóng ta cã thÓ thÊy r»ng l−íi m¾t c¸o lÊy mÉu trªn h×nh 2.2.4.∆t .4). n chan ⎪ C [ m. Nh÷ng mÉu nµy gåm c¸c líp: • • • • Líp EO: 2dm ch½n. §Ó gi¶m sai sè trong qu¸ tr×nh ph©n gi¶i ¶nh. n / 2] . Më réng biÓu thøc (2. v y . 2dn ch½n. chóng ta cã thÓ më réng thuËt to¸n dïng cho qu¸ tr×nh quÐt tõ ®an xen ®Õn luü tiÕn.2. QuÐt luü tiÕn Video víi vÐct¬ chuyÓn ®éng chÝnh x¸c 1/2 ®iÓm ¶nh Xem xÐt qu¸ tr×nh quÐt luü tiÕn tÝn hiÖu Video víi 1/2 ®iÓm ¶nh vËn tèc kh«ng ®æi. 2dn lÎ. d n ) = ( vx .6 (a) víi Video ®an xen h×nh 2. víi bèn mÉu tån t¹i trong l−íi lattices (m¾t c¸o) cña 2 khung liªn tiÕp sau khi bï chuyÓn ®éng cña toµn bé ®iÓm ¶nh nh− h×nh 2.5 theo chiÒu däc. So s¸nh líp EO trªn h×nh 2.

Khung A vµ B cã thÓ biÕn ®æi ®¶o ng−îc nhê biÓu thøc: A[m. n] = C[m . L−íi lÊy mÉu cña 2 khung liªn tiÕp sau khi bï chuyÓn ®éng cña c¶ ®iÓm ¶nh. n] = C[m. h0 [ k ] H t [ m. (d) líp EE. (b) líp OE. 2n] B[m. (c) líp OO.dn)] (2. (a) líp EO.6) ë ®©y h0 vµ h1 lµ ®¸p øng xung th«ng thÊp vµ th«ng cao cña biÕn ®æi Daubechies’ 9/7.h1 [ k ] k k (2.2. 2 (n . NguyÔn H÷u Ph¸t 50 .7) H×nh 2.6. Pixel x¸m vµ mòi tªn chØ râ h−íng bé läc. Khung ghÐp C cã thÓ h×nh thµnh th«ng qua Lt vµ Ht. n ] = ∑ C [ m.§å ¸n cao häc §TVT 2003 Daubechies’ 9/7). n ] = ∑ C [ m − d m . §Çu ra th«ng thÊp vµ th«ng cao cña b¨ng läc cã thÓ x¸c ®Þnh bëi: Lt [ m.n − k ].dm.(n − d n ) − k ]. 2. H×nh trßn ®en lµ pixel ®ang ®−îc xö lý.

n] = (Lt[m. n] = (B[m. Do ®ã nÕu vÐct¬ chuyÓn ®éng cho khèi hiÖn thêi n»m gi÷a c¸c líp EO. nh− líp EO h×nh 2.5. th× sau khi bï (2. Di chuyÓn côc bé më réng MÆc dï m« h×nh vÐct¬ chuyÓn ®éng kh«ng ®æi thùc sù cã hiÖu qu¶ trong viÖc b¾t h×nh ¶nh cña chuçi Video ¶nh thùc.3. n] = (B[m + dm.8) NguyÔn H÷u Ph¸t 51 . n .6) lµ 1 cÆp ph©n tÝch vµ tæng hîp Haar. Khung ghÐp lai ph©n gi¶i 2 møc cã thÓ dùng l¹i th«ng qua viÖc trén lÉn 1 cÆp khung s¸t nhau sau khi bï chuyÓn ®éng. ë l−íi lÊy mÉu nh− h×nh 2.7) dïng cho viÖc ph©n tÝch vµ tæng hîp tÝn hiÖu Video theo ®−êng ngang vµ chÐo. n + dn])/ 2 Vµ B[m.2. Trong thuËt to¸n cña chóng ta.5) – (2. n] = (Lt[m .dn] + Ht[m. n])/ 2 Chó ý r»ng (2.6 (a).dn])/ 2 Khung A vµ B cã thÓ x¸c 0®Þnh nhê biÓu thøc: A[m. n .5) vµ (2. kÝch th−íc bËc cña khèi thÝch hîp thay ®æi (HVSBM) ®−îc thiÕt lËp ®Ó ®¸nh gi¸ bï chuyÓn ®éng.Ht[m + dm.1.6 (b) vµ (c)). n])/ 2 Vµ Ht[m. khung ghÐp lai cã ®é ph©n gi¶i cao h¬n trong miÒn kh«ng gian kh«ng thÓ x©y dùng víi líp vÐct¬ chuyÓn ®éng nµy. 2. cÆp l−íi lÊy mÉu cña 2 khung s¸t c¹nh nhau ®−îc biÕn ®æi ®an xen sau khi bï chuyÓn ®éng. OE.dm.§å ¸n cao häc §TVT 2003 TÝn hiÖu Video víi vÐct¬ chuyÓn ®éng cña líp OE vµ OO (h×nh 2. n] . vµ OO. Trong tr−êng hîp nµy chóng ta sö dông Lt vµ Ht tÝnh to¸n tû lÖ bï chuyÓn ®éng vµ sai kh¸c cña khung A vµ B: Lt[m.A[m .dm. n] . nã còng cã thÓ chøng minh tÝnh hîp lý trong rÊt nhiÒu øng dông Video. BiÓu thøc (2.9) (2. n + dn] + A[m. KÕt qu¶ cña tr−êng chuyÓn ®éng th−êng kh«ng thay ®æi víi mäi ®iÓm ¶nh tõ khèi chuyÓn ®éng gièng nhau.

11) Víi d m . n ] ⎣ ⎦ ( ) (2. chóng ta cã thÓ minh ho¹ biÓu ®å ph©n tÝch theo thêi gian cña 1 cÆp khèi chuyÓn ®éng kÕt nèi. d n lµ mét phÇn cña vÐct¬ chuyÓn ®éng bªn trong. biÓu thøc (2.10) H t [ m. n − d n ⎤ − 2 H t [ m. n ] = B [ m. n] = 2 A[m.8) vµ (2. §Çu ra cña b¨ng läc th«ng thÊp vµ th«ng cao ®−îc l−u tr÷ t¹i vÞ trÝ Lt vµ Ht t−¬ng ®−¬ng trªn l−íi khi cã ®Çu vµo lµ khung tr−íc ®ã vµ khung hiÖn thêi A vµ B. n] = Lt[m. n − d n ⎤ / 2 ⎣ ⎦ Víi qu¸ tr×nh tæng hîp: A[m. Trong h×nh 2. Víi c¸c ®iÓm ¶nh kh«ng kÕt nèi (H×nh 2. HÖ thèng ph©n tÝch vµ tæng hîp míi sÏ lµm gi¶m cho líp hÖ thèng cò.3).9) ®−îc sö dông ®Ó ph©n tÝch vµ tæng hîp 1 cÆp khèi chuyÓn ®éng.7. ( ) NguyÔn H÷u Ph¸t 52 . VÐct¬ chuyÓn ®éng cña líp EO víi kÝch th−íc khèi bï chuyÓn ®éng 3x3 ®−îc sö dông. n ] = Lt ⎡ m − d m .7) cã thÓ h×nh thµnh tõng khèi theo kh«ng gian ®−îc quyÕt ®Þnh bëi líp chuyÓn ®éng theo m« h×nh 2.5) – (2. §èi víi vÐct¬ chuyÓn ®éng cña líp EE. Sau ®ã víi c¸c ®iÓm ¶nh kÕt nèi connected pixels. n ] − A ⎡ m − d m .§å ¸n cao häc §TVT 2003 chuyÓn ®éng khèi ghÐp lai cã thÓ dùng l¹i th«ng qua viÖc ghÐp 1 cÆp khèi kÕt nèi cña khung tr−íc ®ã vµ khung hiÖn thêi. l−îc ®å ph©n tÝch tæng hîp (2. n] (2.6. tÝn hiÖu ®−îc më réng ®èi xøng ra c¶ 2 bªn b¨ng läc. n]/ 2 B [ m. ph−¬ng ph¸p t−¬ng tù ®−îc øng dông nh− sau: Víi ph©n tÝch: Lt[m. T¹i khèi biªn.

§å ¸n cao häc §TVT 2003 H×nh 2.8. Khèi m· ho¸ Video cña IMC3D-FSSQ.7. (a) Mét cÆp khèi kÕt nèi (b) Khèi ph©n tÝch ghÐp (c) Khung kÕt qu¶ Lt vµ Ht. VÝ dô vÒ l−îc ®å chuyÓn ®éng cña khèi ¶nh theo thêi gian. NguyÔn H÷u Ph¸t 53 . VÐct¬ chuyÓn ®éng cña khèi ¶nh t−¬ng ®−¬ng EO víi kÝch th−íc 3 x 3. H×nh 2.

12) NguyÔn H÷u Ph¸t 54 .4. 1 lµ khung t-LLLH. L−îc ®å khèi cho hÖ thèng m· ho¸ ®−îc thÓ hiÖn trªn h×nh 2. Tèc ®é ®iÒu khiÓn cho mçi nhãm GOP víi bit dù tr÷ ®−îc biÓu diÔn bëi: Rg = Ngr / F (bits) Víi Ng: sè khung trong 1 nhãm ¶nh GOP. bèn lµ khung t-LH. C¸c khèi nµy ®−îc chia lµm 1/8 khèi ®Ó t¨ng ®é mÞn trong vect¬ chuyÓn ®éng. CÊu tróc b¨ng con 3-D trong 1 nhãm GOP m« t¶ trªn h×nh 2. Ba kh«ng gian tr¹ng th¸i ®−îc ph©n tÝch theo l−îc ®å thêi gian ®Ó hoµn thµnh sù ph©n tÝch b¨ng con 3 chiÒu. Bèn tr¹ng th¸i ®−îc h×nh thµnh trªn c¬ së tÇn sè b¨ng con thÊp ®Ó ph¸t ra nhhãm 8 tr¹ng th¸i trªn c¬ së 5 b¨ng ph©n tÝch nh− h×nh 2. vµ t¸m lµ khung t-H.1. Khèi ph©n chia ®ã ®−îc dïng lµm ®¹i diÖn cho ph©n tÝch/m· ho¸ c©y 1/4.5. HÖ thèng m· ho¸ ®−îc ph©n chia thµnh c¸c khung liªn tiÕp trong 1 nhãm ¶nh (GOP). B¨ng läc ®−îc sö dông ë ®©y lµ b¨ng läc ph©n tÝch tæng hîp Daubechies’ 9/7. gièng nh− MPEG.3. VÐct¬ chuyÓn ®éng ®−îc m· ho¸ bëi DPCM vµ m· ho¸ sè häc.§å ¸n cao häc §TVT 2003 2. Mçi nhãm ¶nh chøa 16 khung-1 lµ khung t-LLLL. vÐct¬ m· ho¸ l©n cËn ®−îc dïng cho dù ®o¸n. Tèc ®é bit cña vect¬ chuyÓn ®éng ®iÒu khiÓn bëi hÖ sè nh©n Lagrange l mv thùc hiÖn trong tr¹ng th¸i ®· ®−îc chØnh söa. Khèi chuyÓn ®éng cã kÝch th−íc trong ph¹m vi tõ 4x4 tíi 64x64. Ba tham sè m· ho¸ b¨ng con sö dông IMCTF §Ó ®¸nh gi¸ l−îc ®å b¨ng läc theo thêi gian cho m· ho¸ Video. (2. ®Ò xuÊt hîp lý nhÊt b¨ng läc trong hÖ thèng m· ho¸ Video 3 chiÒu IMC3D-FSSQ víi khèi gièng nhau tíi bé m· ho¸ 3 chiÒu MC3D-FSSQ. r: tæng sè tèc ®é bit (bits/sec). 2 lµ khung t-LLH.3. KÝch th−íc khèi cña hÖ thèng thay ®æi (HVSBM) ®−îc dïng cho ®¸nh gi¸ bï chuyÓn ®éng. §Çu tiªn ng−êi ta ph©n tÝch tÝn hiÖu Video vÒ mÆt thêi gian bëi hÖ thèng ph©n tÝch 2 kªnh bï chuyÓn ®éng.

Bit cÊp ph¸t n»m trong líp 3-D ®−îc tèi −u ho¸ bëi thuËt to¸n BFOS. mçi mÉu trong b¨ng con ®−îc ph©n lo¹i thµnh 1 vµi líp kÝch ho¹t dùa trªn viÖc gi¶i m· hÖ sè cña b¨ng cha. miªu t¶ trong b¶ng 2. C¸c mÉu riªng lÎ ®−îc l−îng tö ho¸ bëi viÖc h×nh thµnh c¸c ng−ìng (UTQ) víi miÒn chÕt trung t©m.1 so s¸nh gi÷a chuÈn IMC3D-FSSQ vµ MC3D-FSSQ. Tuy nhiªn nh− ®· ®Ò cËp trong môc 2. vµ sö dông m« h×nh hµm Laplacian. Trong thuËt to¸n l−îng tö ho¸ thÝch nghi. 2. B¨ng con/lÊy mÉu wavelet/c¸c hÖ sè ®−îc l−îng tö ho¸ vµ m· ho¸ bëi tr¹ng th¸i l−îng tö ho¸ x¸c ®Þnh (FSSQ) cña b¶n dÞch 3 chiÒu.§å ¸n cao häc §TVT 2003 F: tèc ®é cña khung (frames/sec).4. KÕt qu¶ thùc nghiÖm H×nh 2. Nãi mét c¸ch kh¸c.9. chóng ta cã thÓ hoµn toµn lo¹i trõ d− thõa thêi gian DPCM trong hÖ thèng míi IMC3D-FSSQ víi chi phÝ vµ bé nhí võa ph¶i.1. khung tõ b¨ng thÊp nhÊt ®−îc m· ho¸ liªn tiÕp bëi bé ®iÒu xung m· DPCM trong MC3D-FSSQ.1. Nhãm 8 trªn c¬ së ph©n tÝch 5 b¨ng con theo thêi gian NguyÔn H÷u Ph¸t 55 . Sù kh¸c nhau c¬ b¶n gi÷a 2 hÖ thèng m· ho¸ ®¹t ®−îc trªn c¬ së l−îc ®å läc b¨ng con.

§å ¸n cao häc §TVT 2003 H×nh 2. So s¸nh gi÷a IMC3D-FSSQ vµ MC3D-FSSQ Trong môc nµy. PhÇn mÒm nµy ®−îc øng dông bëi hÖ thèng m· ho¸ b¨ng con míi IMC3D-FSSQ. chóng ta sÏ ®¸nh gi¸ viÖc m· ho¸ l−îc ®å ph©n tÝch tæng hîp IMCTF.10: CÊu tróc b¨ng con 3 chiÒu trong GOP MC-3D FSSQ MCTF Yes 16 2 3 4 frs No IMC-3DFSSQ B¨ng läc theo thêi gian Cêu tróc lai Sè khung trong mét nhãm ¶nh Sè tr¹ng th¸i ph©n gi¶i thêi gian Tèc ®é khung tèi ®a tr−íc khi ph©n tÝch theo thêi gian KÝch th−íc bé nhí ®Öm Kh¶ n¨ng tèi −u ho¸ tèc ®é bit cho nhãm ¶nh IMCTF No 16 4 5 16 frs Yes B¶ng 2.1. KÕt qu¶ ®−îc so s¸nh tíi bé m· ho¸ b¨ng con MC3D- NguyÔn H÷u Ph¸t 56 .

Giíi h¹n ®−îc x¸c ®Þnh víi bé läc MCTF viÖc ph©n tÝch tæng hîp kh«ng cã kh¶ n¨ng biÕn ®æi ng−îc. HÖ thèng m· ho¸ míi bao gåm c¸c thµnh phÇn gièng nhau MC3DFSSQ ®−îc so s¸nh hîp lý. 30 khung/s) ®−îc dïng ®Ó ®¸nh gi¸.§å ¸n cao häc §TVT 2003 FSSQ. Mçi Video chøa 96 khung. B¶ng 2. Trong qu¸ tr×nh thùc hiÖn. KÝch th−íc nhãm ¶nh cho MPEG-2 ®−îc chän lµ 15 khung IBBPBBPBBPBBI. 352 x 240 ®iÓm ¶nh. Video dïng ®Ó thö nghiÖm lµ Mobile Calendar. MÐo trung b×nh PSNR (dB) giíi thiÖu bëi chÝnh x¸c 1/2 ®iÓm ¶nh MCTF víi møc ph©n tÝch tæng hîp kh¸c nhau (ch−a m· ho¸) NguyÔn H÷u Ph¸t 57 . B¶ng 2. KÕt qu¶ m· ho¸ sö dông chuÈn lai MPEG-2 còng ®−îc tham kh¶o.2. Ph¹m vi ®¸nh gi¸ ®Ò xuÊt cho kho¶ng c¸ch cña khung thêi gian lµ 7 pixels trªn 1 khung. 4: 2: 0. khi bé läc bï chuyÓn ®éng thùc hiÖn víi ®é chÝnh x¸c 1/2 ®iÓm ¶nh.2 cung cÊp kÕt qu¶ ®¸nh gi¸ trung b×nh PSNR cho cÊu tróc Video sau khi ph©n tÝch sai kh¸c tr¹ng th¸i sö dông chÝnh x¸c 1/2 b−íc sãng MCTF mµ kh«ng m· ho¸. gi¸ trÞ cña ®iÓm ¶nh t¹i vÞ trÝ l−íi ®−îc néi suy sö dông 8 nÊc bé läc FIR. Flower Garden vµ Football trong ph©n gi¶i SIF (quÐt luü tiÕn.

NguyÔn H÷u Ph¸t 58 . §¸nh gi¸ khung Y-PSNR cho cÊu tróc liªn tiÕp Mobile Calendar sö dông bï chÝnh x¸c 1 nöa ®iÓm ¶nh cña møc ph©n tÝch theo thêi gian (ch−a m· ho¸) Hai thuËt to¸n läc b¨ng con ®Òu cã thÓ tr¸nh nhiÔu. B¶ng 2.§å ¸n cao häc §TVT 2003 H×nh 2.11. Tèc ®é m· ho¸ ®−îc tÝnh to¸n theo tû lÖ cña ph−¬ng ph¸p ®¹i sè vµ h×nh häc cña hÖ sè 3 chiÒu ®¬n vÞ dB.3 cho biÕt kÕt qu¶ so s¸nh hÖ sè m· ho¸ 3 chiÒu cña b¨ng läc 3 chiÒu sö dông 2 l−îc ®å b¨ng läc ph©n tÝch tæng hîp wavelet trong IMCTF. Bé läc bï MCTF cã thÓ biÕn ®æi ng−îc khi b¨ng läc bï chuyÓn ®éng ®−îc thùc hiÖn víi toµn bé ®iÓm ¶nh. B¨ng läc thêi gian Haar kh«ng bï chuyÓn ®éng ®−îc sö dông trong øng dông m· ho¸ Video.

40 MCTF-F 10.0 13.88 B¶ng 2. vµ MPEG-2 NguyÔn H÷u Ph¸t 59 .23 12. vµ läc bï chuyÓn ®éng víi toµn bé ®iÓm ¶nh (MCTF-F) 2. Tãm t¾t vµ kÕt luËn Trong ch−¬ng nµy mét hÖ thèng ph©n tÝch tæng hîp míi víi ®é chÝnh x¸c 1/2 ®iÓm ¶nh bï chuyÓn ®éng ®−îc ph¸t triÓn cho øng dông m· ho¸ Video.98/0.04/0. So s¸nh lý thuyÕt m· ho¸ 3 chiÒu (dB) gi÷a 3 l−îc ®å b¨ng läc cã thÓ biÕn ®æi ng−îc: läc bï chuyÓn ®éng míi (IMCTF).§å ¸n cao häc §TVT 2003 Video Mobile Calendar Flower Garden IMCTF 11.3. MC3DFSSQ.5.29 7.1. H×nh 2. So s¸nh gi¸ trÞ trung b×nh Y-PSNR cho IMC3D-FSSQ.69/-4.16/-0. läc kh«ng cã bï chuyÓn ®éng (TF).74/-1. KÕt qu¶ cho thÊy hÖ thèng m· ho¸ b¨ng con IMC3D-FSSQ chã hiÖuqu¶ h¬n vµ cã thÓ chuÈn m· ho¸ lai MPEG-2.0 TF 7.64/-5.12.

4. MPEG-2. So s¸nh Frame-by-frame Y-PSNR cho m· ho¸ Mobile Calendar at 1.0 Mbps. vµ MPEG-2 (dB).71 dB. So s¸nh gi¸ trÞ trung b×nh PSNR cho IMC3D-FSSQ. 26.MC3D-FSSQ.§å ¸n cao häc §TVT 2003 H×nh2.09 dB. 26. 23.MC3D-FSSQ.74 dB.13. NguyÔn H÷u Ph¸t 60 .) B¶ng 2. (Average Y-PSNR: IMC3D-FSSQ.

So víi ph−¬ng ph¸p truyÒn thèng.2. ë ®©y b¨ng läc bï chuyÓn ®éng MC 3-D ®−îc kÕt hîp víi thuËt to¸n m· ho¸ mÆt ph¼ng bit 3-D EZBC. V× thÕ mµ nh÷ng hµm −u viÖt nh− lµ ph©n gi¶i ®−îc cung cÊp dÔ dµng. §©y lµ −u ®iÓm v−ît tréi cña bé m· ho¸ nµy. sù d− thõa trong Video gi¶m ®−îc ®¸ng kÓ. viÖc tiÕt kiÖm trong tÝnh to¸n cã thÓ ®¹t ®−îc víi bé m· ho¸ bï chuyÓn ®éng IMC3D-EZBC mµ kh«ng cÇn kh«i phôc l¹i khung tham kh¶o nh− m· ho¸ DPCM. KÕt qu¶ thùc nghiÖm • • • NguyÔn H÷u Ph¸t 61 . §ã lµ sù më réng cña thuËt to¸n 2-D EZBC ®èi víi m· ho¸ scalable Video. Ta sÏ gäi hÖ thèng m· ho¸ nµy lµ IMC3D-EZBC. §é phøc t¹p cña hÖ thèng m· ho¸ kh«ng cã tÝnh ®èi xøng do yªu cÇu vÒ chi phÝ tÝnh to¸n cho viÖc ®¸nh gi¸ chuyÓn ®éng cña bé m· ho¸. M· ho¸ scalable video Chóng ta ®· biÕt. TÝnh to¸n ®¬n gi¶n: B¨ng con 3 chiÒu ®−îc m· ho¸ nhanh trong hÖ thèng sö dông m· ho¸ mÆt ph¼ng bit EZBC. Kh¶ n¨ng kh«i phôc lçi khi thùc hiÖn cÊu tróc b¨ng con 3-D rÊt cao. nÐn ¶nh lµ kü thuËt dùa trªn c¬ së m· ho¸ b¨ng con/wavelet víi viÖc bï chuyÓn ®éng côc bé ®−îc tr×nh bµy trong ch−¬ng tr−íc cho øng dông m· ho¸ Video nonscalable. Sù t−¬ng quan ®ã sÏ ®−îc khai th¸c mét c¸ch hiÖu qu¶ khi m· ho¸ mÆt ph¼ng bit 3-D EZBC. b¨ng con ph©n tÝch ®−îc thùc hiÖn víi toµn bé ¶nh. trong ®ã lçi ph¸t ra do IMC3D-EZBC ®−îc giíi h¹n bëi chiÒu dµi cña bé läc tæng hîp.§å ¸n cao häc §TVT 2003 2. §iÒu nµy hoµn toµn hîp lý víi môc ®Ých gi¶i m· luång bit nhiÒu lÇn víi nhiÒu møc kh¸c nhau. Chóng ta cã thÓ thÊy ®−îc −u ®iÓm cña m· ho¸ b¨ng con 3-D lµ chøng minh kh¶ n¨ng lo¹i trõ cÊu tróc khung ®Ö qui cña bé m· ho¸ lai. HiÖu qu¶ nÐn: Víi hÖ thèng b¨ng läc 3-D cã bï chuyÓn ®éng. −u ®iÓm cña bé m· ho¸ Video gåm: • Kh¸c víi bé m· ho¸ DCT th«ng th−êng. KÕt qu¶ cho thÊy viÖc kh«i phôc ¶nh trong IMC3D-EZBC kh«ng cã lçi d− thõa nh− m· ho¸ DCT.

Mét ®Æc tr−ng cña Internet lµ cã b¨ng th«ng thay ®æi theo thêi gian vµ NguyÔn H÷u Ph¸t 62 .2. §ã lµ hÖ thèng m· ho¸ scalable Video ®iÒu chØnh víi hµm cã ®é réng thay ®æi rÊt réng víi ®Æc tÝnh bÈm sinh trong ®a ph©n gi¶i vµ dù ®o¸n 3-D. Ch−¬ng nµy ®−îc tæ chøc nh− sau: • • • Tæng qu¸t vÒ c¸c c«ng viÖc liªn quan ®Õn m· ho¸ scalable Video. ThuËt to¸n m· ho¸. Kh¸i qu¸t ®· sím quan t©m tËp trung vµo tÝnh t−¬ng thÝch m· ho¸ vµ m· ho¸ cho øng dông thÊp. • TÝnh mÒm dÎo vµ kh¶ n¨ng chuyªn s©u cña luång bit ®−îc ®¸nh gi¸ ®−¬ng ®−¬ng víi m· ho¸ ¶nh EZBC. Chóng ta sÏ kh¸i qu¸t l¹i l−îc ®å m· ho¸ scalable thùc hiÖn trong hÖ thèng m· ho¸ lai. Ta ®· biÕt intnet h×nh thµnh vµ ph¸t triÓn rÊt nhanh tõ nh÷ng thËp kû tr−íc. §Ó ®é tin cËy truyÒn dÉn cµng cao th× chiÕn l−îc b¶o vÖ cµng ph¶i c¶i thiÖn trong luång bit c¬ së mµ chøa th«ng tin cã ý nghÜa. §©y lµ líp c¬ së cña Video. §©y lµ nh÷ng ®Æc tÝnh næi bËt ®−îc cung cÊp mµ kh«ng x¶y ra tæn thÊt th−êng thÊy trong c¸c øng dông m· ho¸ truyÒn thèng. bao gåm c¸c luång bit con cho øng dông ®Çu cuèi cao. Ng−êi ta • • • 2.1. TiÕp cËn ®a m¹ch vßngtrong hÖ thèng lai th«ng th−êng Mét vµi thuËt to¸n b¨ng con vµ tÝnh chÊt râ nÐt (FGS) cña kü thuËt m· ho¸.§å ¸n cao häc §TVT 2003 chØ ra tû sè PSNR cña hÖ thèng m· ho¸ theo chuÈn MPEG-2 vµ bé m· ho¸ nonscalable 3-D. gi«ng nh− chuÈn TV (STV) trong tÝn hiÖu HDTV. Mét vµi hµm scalable ®−îc dïng trong chuÈn MPEG-2 vµ phiªn b¶n 2 cña H. M· ho¸ scalable ®· ®−îc dïng trong truyÒn Video th« th«ng qua kªnh cã lçi.263. HÖ thèng m· ho¸ vµ c¸c kÕt qu¶ m· ho¸ KÕt luËn M· ho¸ scalable ®· ®−îc ®Ò cËp ®Õn trong c¸c thËp kû tr−íc.

kü thuËt m· ho¸ míi SNR ®−îc ®−a vµo sö dông trong chuÈn MPEG-4.1.§å ¸n cao häc §TVT 2003 ng−ßi sö dông. Do ®Æc tÝnh c¬ b¶n cña hÖ thèng m· ho¸ lai truyÒn thèng. sè líp vµ møc cña tèc ®é bit ®−îc m· ho¸ ®ång thêi trong 1 thêi gian. Vµ nh− vËy.1. tËp trung c¸c tÝn hiÖu ®Çu vµo tr¸i ng−îc nhau hoÆc c¸c sai kh¸c gi÷a m· ho¸ vµ gi¶i m· theo kÕt qu¶ cña c¸c khung tham chiÕu sö dông cho dù ®o¸n. Chóng ta cã thÓ ®¶m b¶o r»ng c¶ bé m· ho¸ vµ gi¶i m· ®Òu cã thÓ sö dông d÷ liÖu cho líp hiÖn thêi. gièng nh− kÕt qu¶ cña DPCM víi dù ®o¸n m¹ch vßng hë. CÊu tróc bé gi¶i m· A set of decoding ®−îc x¸c ®Þnh trong chuÈn MPEG-2 cho m· ho¸ SNR scalable. NhiÒu líp t¨ng c−êng thªm vµo môc ®Ých NguyÔn H÷u Ph¸t 63 . §Ó gi¶i quyÕt vÊn ®Ò nµy. §Ó gi¶m sai sè gi÷ bé m· ho¸ vµ gi¶i m·.1. CÊu tróc bé gi¶i m· míi dùa trªn ph−¬ng ph¸p nµy ®−îc thªm vµo cho phiªn b¶n 2 cña H. ChÊt l−îng kÐm trong MPEG-2 chñ yÕu do sai sè.263.14 minh ho¹ l−îc ®å khèi SNR cho hÖ thèng m· ho¸ lai. M· ho¸ lai truyÒn thèng 2.M· ho¸ Scalable SNR Khung m· ho¸ truyÒn thèng nãi chung kh«ng thÝch hîp trong øng dông tèc ®é m· ho¸ mÆc dï nã rÊt gÇn víi m¹ch vßng DPCM. chóng ta cã thÓ dïng nhiÒu m¹ch vßng dù ®o¸n ph©n chia cho c¸c líp riªng lÎ. §©y lµ trë ng¹i chung trong hÖ thèng m· ho¸ lai. giíi h¹n b¨ng th«ng thay ®æi cho luång Video kh«ng thÓ tho¶ m·n trong tr−êng hîp nµy.1. Trong l−îc ®å ®a m¹ch vßng. chóng ta sÏ ph¶i xem xÐt l¹i l−îc ®å m· ho¸ FGS trong khung m· ho¸ lai truyÒn thèng. H×nh 2. H¬n n÷a. Ph−¬ng ph¸p tiÕp cËn ®a líp th«ng th−êng chØ cã thÓ øng dông cho luång bit rêi r¹c. ¶nh cña líp c¬ b¶n ®−îc tiªn ®o¸n dùa trªn viÖc sö dông ¶nh cña líp tr−íc ®ã. ¶nh cña líp hiÖn thêi trong líp t¨ng c−êng ®−îc dù ®o¸n bëi ¶nh cña líp thÊp h¬n ngay t¹i thêi ®iÓm ®ã hoÆc kÕt hîp c¶ hai nh− h×nh 2. 2.1.15.2.2. Khi luång Video ®−îc gi¶i m· t¹i líp c¬ së. c¸c chøc n¨ng thªm vµo hÇu nh− ®Òy ®¹t hiÖu qu¶ víi lçi c¬ b¶n trong viÖc nÐn.

Ng−îc l¹i gi¸ cña biÕn ®æi/l−îng tö ho¸ ng−îc vµ ®¸nh gi¸/bï chuyÓn ®éng cung cÊp víi mçi m· ho¸ m¹ch vßng thªm vµo kh«ng cã hiÖu qu¶. L−îc ®å khèi chung cña hÖ thèng m· ho¸ lai Video SNR sö dông cho dù ®o¸n m¹ch vßng.0 – 1. MÊt m¸t nªn tõ 1.263.5 dB trªn 1 líp. Tr−íc hÕt do nhiÒu th«ng tin tiªu ®Ò vµ kh«ng hiÖu qu¶ cña hÖ sè l−îng tö ho¸ vµ m· ho¸ l¹i.14. NguyÔn H÷u Ph¸t 64 . lçi trong viÖc thùc hiÖn nÐn ®−îc quan t©m chñ yÕu cho c¶ 2 líp cña hÖ thèng m· ho¸.§å ¸n cao häc §TVT 2003 cung cÊp cho møc vµ lùa chän bit. VÊn ®Ò nay ®−îc ph©n tÝch trong chuÈn MPEG-2 vµ H. H×nh 2.

Sai sè xuÊt hiÖn khi líp t¨ng c−êng bÞ lo¹i bá.15. H×nh 2.§å ¸n cao häc §TVT 2003 Líp gi¶i m· t¨ng c−êng (nÐt ®øt) lµ tuú chän thªm vµo tuú tõng phiªn b¶n. L−îc ®å khèi chung cho hÖ thèng m· ho¸ lai Video SNR sö dông nhiÒu m¹ch vßng dù ®o¸n NguyÔn H÷u Ph¸t 65 .

Ng−îc l¹i do nh÷ng m¹ch vßng DPCM tr−íc kia.16. P vµ B trong chuÈn H. VÝ dô.1.2. Líp t¨ng c−êng chØ chøa tÝn hiÖu m· ho¸ dù ®o¸n lçi.2.263. chóng ta cã thÓ minh ho¹ kh«ng gian vµ thêi gian m· ho¸ trong chuÈn H. gi¸ trÞ PSNR lµ 1.2 Ph©n gi¶i m· Scalable Ph©n gi¶i m· ho¸ scalable Video ®iÓn h×nh th−êng dïng biÓu ®å h×nh kim tù th¸p: Líp c¬ së ®Çu tiªn ®¹t ®−îc nhê m· ho¸ 1/10 nguån Video. NguyÔn H÷u Ph¸t 66 . 2. 2. L−îc ®å ph©n gi¶i nµy cã hiÖu qu¶ vµ ®é phøc t¹p cho m· ho¸ ®a m¹ch vßng SNR.263.¶nh ®øt nÐt liªn quan tíi líp m· ho¸ t¨ng c−êng.1. H×nh 2.1.47–1. Embedded Coding and Fine Granularity Scalability Nhê nh÷ng thµnh c«ng trong viÖc nÐn ¶nh trong nh÷ng n¨m gÇn ®©y ®· ®em l¹i nh÷ng ®Ò xuÊt vÒ thùc hiÖn m· ho¸ ¶nh cho m· ho¸ DFD trong hÖ thèng m· ho¸ th«ng th−êng. P.I. Minh ho¹ m· ho¸ ph©n gi¶i scalable trong H. Trong tr−êng hîp nµy.§å ¸n cao häc §TVT 2003 Líp gi¶i m· t¨ng cõ¬ng (nÐt ®øt)lµ tuú chän.34 dB vµ trong t−¬ng lai cã thÓ lo¹i bít 0.38 dB.2.16. vµ B ®¹i diÖn cho ¶nh I.263 h×nh 2. Kh«i phôc l¹i líp Video thÊp h¬n nhê néi suy dù ®o¸n dùa trªn viÖc ph©n gi¶i Video cao h¬n tiÕp theo.

Do ®ã PSNR th−êng mÊt 2 dB khi so s¸nh víi víi ph−¬ng ph¸p nonscalable t−¬ng tù. NguyÔn H÷u Ph¸t 67 . cÇn thÊy mét thùc tÕ r»ng bé gi¶i m· lu«n sö dông h×nh ¶nh chÊt l−îng kÐm nhÊt trong m¹ch vßng DPCM trong toµn bé ph¹m vi m· ho¸. Tuy vËy so s¸nh víi l−îc ®å ®a m¹ch vßng h×nh 2. L−îc ®å m¹ch vßng ®¬n còng ®−îc chÊp nhËn bëi 1 vµi bé m· ho¸ ®a líp SNR ®Ó lµm gi¶m ®é phøc t¹p víi m¹ch vßng vi ph©n ®−îc thªm vµo. khung tham kh¶o trong m¹ch vßng DPCM ®−îc gi¶i m· tõ líp bit c¬ së. sù sai kh¸c gi÷a bé m· ho¸ vµ gi¶i m· hÇu nh− kh«ng x¶y ra. ChÝnh v× thÕ ph¹m vi bit bÞ giíi h¹n. mét vµi thuËt to¸n s¸t nhËp m· ho¸ mÆt ph¼ng bit trong khung m· ho¸ lai truyÒn thèng ®· ®−îc giíi thiÖu. nh− H×nh 2. KÕt qu¶ chØ ra r»ng m¹ch vßng sÏ cã thÓ tåi h¬n ch−¬ng tr×nh ®ã t¹i tèc ®é bit cao.15. Nh− chóng ta ®· biÕt dù ®o¸n lçi kh¸c nhau gia t¨ng víi sù suy gi¶m tèc ®é bit. Trong chuÈn MPEG-4 FGS. t−¬ng øng víi biªn d−íi cña ph¹m vi m· ho¸ Video. Khung m¹ch vßng ®¬n còng ®−îc thiÕt lËp bëi Shen vµ Delp trong viÖc kÕt hîp víi bé m· ho¸ EZW. Qu¸ tr×nh gi¶i m· cã thÓ dõng t¹i bÊt kú ®iÓm nµ khi luång bit ®−îc gi¶i m· thµnh c«ng. Do líp bit c¬ së lu«n cã kh¶ n¨ng gi¶i m· (gi¶ thiÕt kh«ng cã tæn hao). PhÇn cßn l¹i sau khi biÕn ®æi DCT ®−îc m· ho¸ bëi mÆt ph¼ng bit DCT. ®iÒu khiÓn tèc ®é bit chÝnh x¸c tõ viÖc x©y dùng h×nh ¶nh m· ho¸ kh¶ n¨ng SNR trong viÖc thùc hiÖn m· ho¸ vÉn ph¶i lo¹i bá. ChÝnh v× vËy mÆc dï bé m· ho¸ vÉn thõa kÕ mét vµi ®Æc tÝnh −u viÖt nh− ®¬n gi¶n.§å ¸n cao häc §TVT 2003 luång bit Video kh«ng thÓ gi¶i m· t¹i tèc ®é bit thÊp h¬n do tæn hao. §Ó tho¶ m·n yªu cÇu ph¸t triÓn cho Video ®a tèc ®é víi tÝnh chÊt kÕt dÝnh cao vµ kh«ng bÞ ¶nh −ëng do sai sè.17. ph−¬ng ph¸p tiÕp cËn bªn ngoµi kh«ng ph¶i lµ viÖc sö dông th«ng tin tèi −u nhÊt cho gi¶i m·.

§å ¸n cao häc §TVT 2003 Mét vµi ®Ò xuÊt nh»m c¶i thiÖn hiÖu qu¶ nÐn ¶nh trong chÕ ®é FGS cña MPEG-4. viÖc c¶i thiÖn thuËt to¸n cßn nhiÒu giíi h¹n. H×nh 2.17. L−îc ®å khèi chung cña hÖ thèng m· ho¸ lai Video cho viÖc cung cÊp chøc n¨ng FGS NguyÔn H÷u Ph¸t 68 . Tuy nhiªn do giíi h¹n cña viÖc m· ho¸ lai.

chóng ta sÏ xem xÐt ¶nh h−ëng chuyÓn ®éng cña toµn bé camera.2. hÇu hÕt c¸c thuËt to¸n ®Òu dùa trªn b¨ng läc 3-D cæ ®iÓn (kh«ng cã bï chuyÓn ®éng). SNR trong hÖ thèng m· ho¸ nµy®¹t ®−îc víi sù mÊt m¸t m· ho¸ kh«ng ®¸ng kÓ. BiÕn ®æi b¨ng läc Daubechies 9/7 phæ biÕn ®−îc thùc hiÖn trong mçi tham sè ®Ó ph¸t sinh cÊu tróc b¨ng con 3-D. CÊu tróc c©y trong hÖ thèng 3 chiÒu ®−îc dïng cho viÖc ®¸nh gi¸ hÖ sè kh«ng quan träng. LZC ®· chØ râ 1 trong nh÷ng −u ®iÓm næi bËt cña PSNR cho ¶nh nÐn. øng dông trong m· ho¸ Video. hoÆc s¾p th¼ng hµng. th«ng tin vÒ chuyÓn ®éng côc bé sÏ ®−îc s¸t nhËp trong hÖ th«ng m· ho¸ b¨ng con 3 chiÒu. cÊu tróc m· ho¸ b¨ng con 3 chiÒu hoµn toµn phï hîp cho m· ho¸ SNR scalable. Kh«ng nh− c¸c ph−¬ng ph¸p m· ho¸ lai truyÒn thèng.§å ¸n cao häc §TVT 2003 Líp m· ho¸ t¨ng c−êng (nÐt ®øt) lµ tuú chän. 2. ThuËt to¸n nµy ®−îc thùc hiÖn nh»m môc ®Ých khai th¸c 1 nhãm hÖ sè b¨ng con 3-D/wavelet. Kh«ng gièng nh− bé m· ho¸ th«ng th−êng. ThËm chÝ c¶ chuyÓn ®éng toµn côc. LZC (Layer Zero Coding) vµ 3D-SPIHT (Set Partitioning In Hierarchical Tree) lµ 2 ph−¬ng ph¸p m· ho¸ ®iÓn h×nh trong m· ho¸ 3-D. MÆc dï cã rÊt nhiÒu c«ng viÖc c«ng bè trong miÒn nÐn ¶nh Video. tr−íc khi ph©n tÝch b¨ng läc nh»m tr¸nh cho ¶nh bÞ blurring.3.1. Chuçi ¶nh ®−îc tiÒn lµm mÐo. Tuy nhiªn nh− chóng ta nhÊn NguyÔn H÷u Ph¸t 69 . Ba tham sè SPIHT nµy lµ sù më réng trong m· ho¸ ¶nh SPIHT. Víi viÖc quan t©m trong øng dông ®a tèc ®é. Luång bit m· ho¸ lµ tèc ®é bit m· ho¸ vµ ®−îc thùc hiÖn ®Çy ®ñ. §Æc tÝnh ®¬n gi¶n cña SPIHT ®−îc gi÷ l¹i. LZC do Tubman vµ Zakhor thiÕt lËp gi¸ trÞ ®Çu tiªn trong m¸y tÝnh dïng cho m· ho¸ Video ®a tèc ®é 3 chiÒu. mét vµi thuËt to¸nthùc hiÖn m· ho¸ b¨ng con 3-D ®· ®−îc ®Ò xuÊt trong c¸c tµi liÖu gÇn ®©y. M· ho¸ sö dông b¨ng con 3 chiÒu vµ m· ho¸ Wavelet MÆc dï kh«ng cã ý kiÕn ph¶n håi cña m¹ch vßng DPCM. Víi hiÖu qu¶ lín trong viÖc khai th¸c sù t−¬ng quan gi÷a gi¸ trÞ c¸c b¨ng con.

TÝn hiÖu Video ®Çu vµo ®Çu tiªn ®−îc biÕn ®æi nhê 3 tham sè bï chuyÓn ®éng biÕn ®æi ng−îc giøoi thiÖu trong ch−¬ng tr−íc. T−¬ng tù nh− b¶n sao 2-D. 3D-EZBC m· NguyÔn H÷u Ph¸t 70 .12) cho tèc ®é m· ho¸ bit kh«ng ®æi (CBR).5. Do ®ã c¸c thuËt to¸n nµy kh«ng thÓ c¹nh tranh víi bé m· ho¸ lai truyÒn thèngtrong nÐn ¶nh cho tèc ®é bit ®¬n (nonscalable) øng dông khi chuyÓn ®éng tèc ®é cao tån t¹i trong nguån Video.2. hiÖu qu¶ chÊt l−îng nÐn Video dùa vµo viÖc khai th¸c th«ng tin vÒ chuyÓn ®éng.18. KÕt qu¶ lµ kh«ng gian thêi gian b¨ng läc 3.9 vµ 2. Bit dù tr÷ chonhãm ¶nh riªng ®−îc ®−a ra bëi h×nh (2. Tuy nhiªn b¨ng läc ®Ò xuÊt nµy kh«ng cã kh¶ n¨ng biÕn ®æi ng−îc vµ kh«ng lµ chuÈn cho øng dông m· ho¸ Video. Mét tr−êng hîp ngo¹i lÖ ®¸ng chó ý lµ ®Ò xuÊt c©y Tri-Zerotree ®−a ra bëi Th cho m· ho¸ tèc ®é bit thÊp. So s¸nh víi kh«ng gian vµ thêi gian b¨ng läc truyÒn thèng (kh«ng cã bï chuyÓn ®éng). Môc ®Ých thùc hiÖn cña hÖ thèng m· ho¸ Video ®−îc thÓ hiÖn trªn H×nh 2. HÖ thèng tæng quan H×nh 2. L−îc ®å khèi cña hÖ thèng scalable Video. HÖ sè cña b¨ng läc 3-D råi sau ®ã ®−îc m· ho¸ bëi thuËt to¸n m· ho¸ mÆt ph¼ng bit EZBC (3D-EZBC).18. 2.§å ¸n cao häc §TVT 2003 m¹nh tr−íc ®ã.D vµ cÊu tróc nhãm ¶nh chØ ra trªn h×nh 2.2. §iÒu nµy ®−îc chøng minh trong kÕt qu¶ thùc nghiÖm sÏ th¶o luËn sau. biÕn ®æi 3-D cã thÓ lo¹i bá d− thõa vÒ kh«ng gian trong tÝn hiÖu Video trong tr¹ng th¸i chuyÓn ®éng cao.

5. §iÒu ®¸ng nãi lµ kh«ng gièng nh− hÖ thèng m· ho¸ lai truyÒn thèng.phô thuéc vµo viÖc thùc hiÖn thuËt to¸n l−îng tö ho¸ trong bé gi¶i m· ¶nh EZBC. hoÆc khai th¸c l−îng tö tr−íc khi m· ho¸ mÆt ph¼ng bit cho môc ®Ých ®iÒu khiÓn tèc ®é. nªn cÇn bé ®Öm khung Ng. tû lÖ. ho¹t ®éng biÕn ®æi ng−îc ®−îc thùc hiÖn ng−îc l¹i ®Ó m· ho¸ mµ kh«ng cÇn bï chuyÓn ®éng. ChÝnh v× vËy hÖ sè ®−îc biÕn ®æi cho phÐp gi¶i m· trong ph¹m vi dù ®o¸n réng víi kÝch th−íc b−íc cña miÒn chÕt τ = 2n.1 chu kú khung.18 ®−îc h×nh thµnh trªn c¶ hai tÝn hiÖu ®Çu vµo gèc.§å ¸n cao häc §TVT 2003 ho¸ c¸c hÖ sè riªng lÎ th«ng qua l−îng tö ho¸ vµ m· ho¸. møc c©y 1/4 lµ l vµ b¨ng con k ®−îc x¸c ®Þnh nh− sau: NguyÔn H÷u Ph¸t 71 . C©y 1/4 ®Çu tiªn ®−îc thiÕt lËp cho b¨ng con riªng lÎ tõ khung nhËn ®−îc.2.3. B¨ng con m· ho¸ 3 chiÒu ThuËt to¸n m· ho¸ mÆt ph¼ng bit 3D-EZBC ®−îc më réng trùc tiÕp cña thuËt to¸n 2 chiÒu 2-D EZBC tíi c¸c khung riªng lÎ trong hÖ thèng b¨ng con 3 chiÒu m« t¶ trªn h×nh 2. MÉu cña b¨ng con gi¶i m· ®−îc cÊu tróc bëi mÉu t−¬ng tù . . TrÔ lín nhÊt quan hÖ gi÷a 2 khung ®Çu cuèi 2Ng . t). .0 lµ chØ sè mÆt ph¼ng bit vµ ∆ lµ kÝch th−íc b−íc tiÒn l−îng tö ho¸. 2. HÖ sè biÕn ®æi trong b¨ng con riªngcã thÓ s¾p xÕp l¹i. ThuËt to¸n m· ho¸ mÆt ph¼ng bit 3D-EZBC sÏ ®−îc giíi thiÖu trong ch−¬ng sau. j. ë ®©y Ng lµ sè khung cña nhãm ¶nh nh©n ®−îc. Do tÊt c¶ c¸c khung trong cïng 1 nhãm ¶nh ®−îc xö lý vµ m· ho¸ ®ång thêi.. j. M¹ch vßng ph¶n håi DPCM vµ c¸c quan hÖ kh¸c kh«ng ®−îc giíi thiÖu trong hÖ thèng m· ho¸ Video nµy.. bï vµ ®¸nh gi¸ chuyÓn ®éng trong h×nh 2. Trong hÖ thèng gi¶i m·. t) t¹i vÞ trÝ (i. Gi¸ trÞ cña nót c©y 1/4 Qk (i. Luång bit m· ho¸ dïng cho øng dông phô thuéc tr¹ng th¸i ®Þnh d¹ng nÐn.∆ víi n=nmax.

l): hµm xö lý nót kh« trong LINk[l]. LSPk: danh s¸ch c¸c ®iÓm ¶nh cã nghÜa tõ b¨ng con k.2j. t) ®èi diÖn víi ng−ìng 2n. vµ kh«ng cã ý nghÜa trong tr−êng hîp cßn l¹i. t) = 1.t) k⎣ ⎦ k ⎧Q ⎡l -1⎤ ( 2i. K: tæng sè b¨ng con. t) lµ cã ý nghÜa nÕu Sn (i. D÷ liÖu trªn mÆt ph¼ng ®−îc m· ho¸ tõ mÉu cã nghÜa lín nhÊt MSB ®Õn mÉu Ýt cã nghÜa nh©t LSB nhê kiÓm tra c¸c nót tõ LIN vµ tinh chØnh hÖ sè tõ LSP. j. j. ⎧1 S n ( i.t) ∆max ⎪ k ⎨ ⎬ k⎣ ⎦ ⎡ ⎤ ⎡ ⎤ ⎪Qk ⎣l -1⎦ ( 2i+1.2j+1. j. t): bit cã nghÜa nhÊt (MSB) cña nót (i. j.t ) . • Sn (i. Dmax: max{k}{Dk}. víi b¨ng con thø k. t) cßn l¹i Nót (hay ®iÓm ¶nh) (i. Chóng ta cã thÓ thùc hiÖn gièng nh− trong m· ho¸ 2-D EZBC cho viÖcm· ho¸ entropy cña mÆt ph¼ng lÊy mÉu. j.§å ¸n cao häc §TVT 2003 Q ⎡0 ⎤ (i.2j+1. t): nót kiÓm tra cã nghÜa (i. j.t ) .Qk ⎣l -1⎦ ( 2i+1. n: chØ sè cña mÆt ph¼ng bit th«ng qua hiÖn thêi. t) lµ gi¸ trÞ b¨ng con t¹i vÞ trÝ (i. j. Nót ®Ønh cña c©y bao gåm LIN t¹i qu¸ tr×nh b¾t ®Çu cña mÆt ph¼ng bit. Víi viÖc x©y dùng ®Ö quy c©y 1/4. t).2j. • • • LINk[l]: danh s¸ch c¸c nót kh«ng cã nghÜa tõ møc l cña b¨ng con k. ⎫ ⎣ ⎦ ⎪ k⎣ ⎦ Q ⎡l ⎤ (i. nót ®Ønh cña c©y cã gi¸ trÞ biªn ®é lín nhÈt trong tÊt c¶ c¸c mÉutõ b¨ng con gièng nhau trong khung nhËn ®−îc. t−¬ng øng víi ng−ìng l−îng tö ho¸ 2n. j. CodeLIN (k. j.t) ∆ c (i. Dk: ®é s©u cña c©y 1/4 cho b¨ng läc k. j. t). Thñ tôc hoµn chØnh cã thÓ tãm t¾t nh− sau: §Þnh nghÜa • • • • • m (i.t ) ⎭ ⎪ ⎩ (2.t ) . j.13) víi ck (i.t ) ∆ ⎨ ⎩0 nÕu n < m(i.Q ⎡l -1⎤ ( 2i. NguyÔn H÷u Ph¸t 72 . j. j.

for k = 0: K . t) .ng−îc l¹i * NÕu (l = 0). j. j. j. l. gi¶m n quay l¹i b−íc 2. j. CodeDescendants (k. l.§å ¸n cao häc §TVT 2003 • • CodeLSP (k): hµm ®Þnh nghÜa l¹i c¸c hÖ sè. j.1 . for l = 0: Dmax for k = 0: K . t ) ⎤ }⎥⎦ 2. l) { for mçi nót (i. M· gi¶: CodeLIN (k. j.CodeLSP (k) NÕu (n > 0). 0.NÕu (Sn (i.M· ho¸ Sn (i. t ) ⎪ ⎨ ⎪Φ ⎩ ∀ t ∈ subbank k} . t) trong LINk[l] .1 . Khëi t¹o LIN l ∆ k( ) ⎧{( 0. t) } NguyÔn H÷u Ph¸t 73 . t) trong LINk[l] . t): hµm cho m· ho¸ cã nghÜa cña tÊt c¶ c¸c nót Qk[l] (i. t) tíi LSPk * ng−îc l¹i CodeDescendants (k. dïng cho kiÓm tra møc ng−âng hiÖn thêi.CodeLIN (k. m· ho¸ bit dÊu cña ck (i. C¸c b−íc m· ho¸ 1. j. i. l) 3. j. l = D cßn l¹i k LSPk = φ n = n max ∆ ⎡ log ⎢ ⎣ 2( max ) c { k( i. j. j. t). i. t) = 0) * Duy tr× phÇn cßn l¹i (i. t) vµ thªm nót (i.

t). y. 2j+1. t) vµ thªm nót (x. t) vµo LSPk ng−îc l¹i CodeDescendants (k. thªm nót (x.1] ng−îc l¹i -NÕu (l = 1). t)| } 2. y.HÖ thèng dßng bÝt Gièng nh− c¬ cÊu cña mÆt ph¼ng m· ho¸ b¨ng con 3 chiÒu/wavelet cña tÝn hiÖu Video víi tèc ®é chuyÓn ®éng cña khung. y.1. x. t) } CodeLSP (k) { for mçi ®iÓm ¶nh (i. t) vµo LINk[l . y.§å ¸n cao häc §TVT 2003 CodeDescendants (k. l. t) { for mçi nót (x.4. y. 2j. t). j. y. t) trong { (2i. m· ho¸ bit dÊu cña ck (x.1.NÕu (Sn (x.m· ho¸ bit n cña |ck (i. 2.2. 2j+1. (2i+1. t). t) . 2j. j. t)} cña møc l-1 trong c©y 1/4. t) trong LSPk . Trong tr−êng hîp nµy b¨ng NguyÔn H÷u Ph¸t 74 . Tû lÖ dßng bÝt m· ho¸ TiÕp theo chóng ta sÏ xem xÐt c¸ch nÐn luång bit m· ho¸ tõ bé m· ho¸ ®Ó cã thÓ ®¹t hiÖu qu¶ chu c¸c øng dông m· ho¸ Video thay ®æi. t) = 0).2. b¨ng k . i. y. (2i. j.M· ho¸ Sn (x. (2i+1. l .4.

U. HÖ sè luång bit NguyÔn H÷u Ph¸t 75 .§å ¸n cao häc §TVT 2003 con läc 3 chiÒuchØ ra trªn h×nh 2. Rt} liªn quan tíi vect¬ m· ho¸ bï chuyÓn ®éng cho b¨ng läc bï chuyÓn ®éng trong biÓu ®å tû lÖ thêi gian rt. Luång bit chuyÓn ®éng PMV gåm luång bit nhá h¬n {PMV rt |rt =1. PU. kÕt qu¶ lµ tÝn hiÖu Video ®−îc ph©n thµnh 5 b¨ng l−íi m¾t c¸o theo thêi gian vµ 3 b¨ng l−íi theo kh«ng gian minh ho¹ trªn h×nh 2.19. Trªn cïng cña hÖ thèng m· ho¸. ë ®©y PMV ký hiÖu luång bit cho tr−êng chuyÓn ®éng. .. mçi nhãm ¶nh m· ho¸ gåm 1 ®¬n vÞ luång bit ®éc lËp {PMV.19. PV lµ hÖ sè b¨ng con ®¸p øng víi thµnh phÇn mµu Y. B¨ng con m· ho¸ ®−îc tiÒn l−îng tö ho¸ víi b−íc l−îng tö τ ®−îc gi¶i m· víi ph¹m vi l−îng tö ho¸ hiÖu qu¶ τ = 2 n. . TÇn sè ph©n gi¶i b¨ng con biÕn ®æi tÝn hiÖu Video 3-D trong hÖ thèng m· ho¸ Vieo Nhãm ¶nh riªng phôc vô cho ®¬n vÞ m· ho¸ c¬ b¶n cho viÖc h×nh thµnh ®iÒu khiÓn cña luång bit tû lÖ. bëi mÆt ph¼ng gi¶i m· bit n. minh ho¹ trªn H×nh 2. PU.. n = n max . PV}. Thø bËc cña líp bit m· ho¸ trong nhãm ¶nh ®−îc m« t¶ trªn h×nh 2. .20 (a).20. vµ PY..10.∆. thêi gian ph©n tÝch Rt = 4 víi kh«ng gian ph©n tÝch Rs = 2..20 (b). H×nh 2. V cña tÝn hiÖu nguån Video. PY.0 . chØ ra trªn H×nh 2..

rs) vµ thµnh phÇn mµu v ∈ {Y.rs lµ sè b¨ng con tû lÖ (rt.§å ¸n cao häc §TVT 2003 PV ®−îc t¹o ra tõ sù lùa chän b¨ng con { 0. .19 vµ 2.2. nmax = 12 (víi ∆ = NguyÔn H÷u Ph¸t 76 . rs) vµ Dmax vµ nmax ®Þnh nghÜa trong môc 2.rs v ®−îc m· ho¸ tõ MSB ®Õn LSB vµ mçi mÆt ph¼ng bit n th«ng qua sÏ ®−îc ph©n chia thµnh c¸c mÆt ph¼ng bit con l. Dmax = 9. minh ho¹ trªn H×nh 2.. Trong tÊt c¶ c¸c luång bit con Prt .20 (c). ë ®©y K rt .rs v ®−îc cung cÊp trªn H×nh 2. Líp hÖ thèng cho hÖ sè luång bit b¨ng con Prt .20 (d). Rs } liªn quan tíi hÖ sè m· ho¸ b¨ng con tõ kh«ng gian tû lÖ (rt.3. . . V }. U.

(d) Líp hÖ thèng cho luång bit con quan hÖ ®Õn kh«ng gian tû lÖ (rt. H×nh 2. Líp hÖ thèng file luång bit ph¸t sinh trong hÖ thèng m· ho¸ Video scalable EZBC. NguyÔn H÷u Ph¸t 77 . (b) Lùa chän luång bit con chuyÓn ®éng (c) Lùa chän hÖ sè luång bit con cho thµnh phÇn mµu v. rs).5). (a) §Ønh hÖ thèng.§å ¸n cao häc §TVT 2003 1) lµ tham sè ®iÓn h×nh cho ph©n gi¶i SIF (môc 2.20.

§å ¸n cao häc §TVT 2003 2. nhê sù lùa chän ®¬n vÞ m· ho¸ {P MV rt . luång bit m· ho¸ nÐn cã NguyÔn H÷u Ph¸t 78 . Thay v× göi rÊt nhiÒu luång bit tõ cïng 1 nguån Video víi bé g¶i m· chuyªn dông (gäi lµ simulcast). n¬i mµ m¹ng bao gåm c¸c b¨ng th«ng kh¸c nhau vµ hÖ thèng ®Çu cuèi víi ®é phøc t¹p kh¸c nhau. chó ý ®Æc biÖt nhËn ®−îc cho m« h×nh hÖ sè b¨ng con 3 chiÒu trong hÖ thèng m· ho¸ Video v× thÕ luång bit ph©n gi¶i thÊp h¬n cã thÓ gi¶i m· mµ kh«ng cÇn ph©n gi¶i b¨ng con ë møc cao h¬n. hÖ thèng m· ho¸ cña chóng ta lµ lý t−ëng cho m«i tr−êng øng dông hçn hîp. Víi kh¶ n¨ng mÒm dÎo cña luång bit. chóng ta chØ cÇn truyÒn luång bit m· ho¸ ®¬n th«ng qua toµn m¹ng (gäi lµ multicast).2. Luång bit b¨ng con trªn H×nh 2. Ba thµnh phÇn mµu cã thÓ nÐn l¹i l¹i hoÆc bÞ lo¹i bá khi kho dù tr÷ bit rÊt thÊp.2. n ' ≤ n ≤ nmax .4.0 ≤ rs ≤ R 's . Lùa chän dßng bÝt m· ho¸ vµ truyÒn dÉn Gièng nh− thuËt to¸n m· ho¸ mÆt ph¼ng bit 2 chiÒu 2-D EZBC. TruyÒn h×nh qu¶ng b¸ vµ héi nghÞ ®a ®iÓm cã −u ®iÓm khi sö dông hÖ thèng nµy.n 0 ≤ rt ≤ R 't . Víi øng dông server-client nh− m· ho¸ Video trªn Internet. viÖc ph©n gi¶i tÝn hiÖu Video gi¶i m· (tèc ®é khung vµ kÝch th−íc ¶nh) cho phÐp chia tû lÖ bëi luü thõa 2 trong khu«n d¹ng c¸c tham sè. R’s. } Víi nhãm 8 tÇn sè ph©n chia trong c¶ kh«ng gian vµ thêi gian. Trong tr−êng hîp nµy. (R’t. KÕt qu¶ lµ chóng ta cã thÓ chän bÊt kú thµnh phÇn v mµu nµo cña tÝn hiÖu Video m· ho¸ kh«i phôc l¹i trong sù ph©n gi¶i kh«ng gian kh¸c nhau. MÊt m¸t do d− thõa gi÷a c¸c luång bit cã thÓ gi¶m thiÓu.20 ®−îc m· ho¸ theo tõ m· s« häc ®éc lËp vµ ®−îc ®−a vµo ®Þa chØ ho¸ trong 1 file. Qn’). tèc ®é khung vµ møc chÊt l−îng.rs v . tèc ®é m· ho¸ ®−îc thùc hiÖn liªn tôc. Prt . Cung cÊp víi luång bit m· ho¸ nhê kh¶ n¨ng dù ®o¸n héi tô tèt. luång bit ®¬n trong hÖ thèng cã thÓ co d·n theo sù thay ®æi b¨ng th«ng kh¸c nhau cña kªnh vµ giíi h¹n cña thiÕt bÞ ®Çu cuèi.

vµ 2 møc l−îng tö.16. H×nh 2. Trong chiÕn l−îc ph¸t thanh truyÒn thèng. Nh− ®· chøng minh.®iÒu khiÓn ®a líp (RLM) nghiªn cøu bëi McCanne minh ho¹ trªn h×nh 2.21.21.8) vµ luång bit m· ho¸ líp thÊp h¬n ®−îc chia sÎ cao víi ng−êi sö dông ®Çu cuèi.22.§å ¸n cao häc §TVT 2003 kh¶ n¨ng thÝch nghi víi viÖc tiÕp cËn ®a líp nh− h×nh 2. luång bit m· ho¸ ®¬n trong NguyÔn H÷u Ph¸t 79 . ë ®©y bé nhËn cã 3 møc ®é phøc t¹p kh¸c nhau.21) vµ nguån Video ban ®Çu ®−îc chøa trong líp t¨ng c−êng (ký hiÖu lµ EL0 vµ EL1 trong h×nh 2. 5 luång bit ph¸t thanh qu¶ng b¸ tõ nguån Video ®−îc cung cÊp cho gi¶i m· trong 2 kh«ng gian ph©n gi¶i. Th«ng tin sai kh¸c gi÷a líp c¬ së (ký hiÖu lµ BL trong h×nh 2. truyÒn th«ng trªn m¹ng ®−îc gi¶m bít cho hÕt nèi A trªn h×nh 2. luång bit m· ho¸ Video cã thÓ øng dông cho qu¶ng b¸ Video sö dông bé nhËn . Trong vÝ dô minh ho¹ h×nh 2. líp bit m· ho¸ t¨ng c−êng cho ph©n gi¶i ®−îc truyÒn th«ng qua kªnh ph©n chia. Ng−êi sö dông cuèi cïng cã thÓ lùa chon gia nhËp hoÆc rêi bá nhãm. Trong l−îc ®å nµy. Minh ho¹ viÖc tiÕp cËn ®a truyÒn thanh ®a líp trong Video Mét vÝ dô kh¸c.17. hai tèc ®é khung.

H×nh 2. NguyÔn H÷u Ph¸t 80 .§å ¸n cao häc §TVT 2003 tr−êng hîp nµy cã thÓ phôc vô cho 4 ng−êi sö dông ®Çu cuèi víi ®Þnh d¹ng nÐn kh¸c nhau sö dông nguån Video. hÖ thèng trong t−¬ng lai cung cÊp chÊt l−îng/tèc ®é mong muèn cho øng dông m¹ng. Minh ho¹ scalable Video cho ®a truyÒn thanh Tr¸i víi viÖc h×nh thµnh b¨ng con/h×nh kim tù th¸p – c¬ së cña thuËt to¸n ®a ph©n gi¶i trong tµi liÖu nµy.22. Bªn c¹nh ®ã chÊt l−îng gi¶i m· cho ph©n gi¶i kh«ng gian thêi gian kh«ng yªu cÇu b¾t buéc vÒ thêi gian m· ho¸ ngay khi yªu cÇu chÊt l−îng Video d−íi møc cao nhÊt cung cÊp bëi lußng bit l−u tr÷.

§å ¸n cao häc §TVT 2003

2.2.5. KÕt qu¶ thùc nghiÖm ThuËt to¸n nÐn Video ®−îc thùc hiÖn trªn c¸c phÇn mÒm. Video dïng ®Ó

thö nghiÖm lµ Mobile Calendar, Flower Garden, Football vµ b¶ng Tennis trong ph©n gi¶i SIF.

2.2.5.1. So s¸nh víi m· ho¸ Nonscalable

Chóng ta sÏ so s¸nh thuËt to¸n IMC3D-EZBC víi chuÈn m· ho¸
nonscalable MPEG-2. Tham sè miªu t¶ trong ch−¬ng tr−íc ®−îc chän cho kÕt

qu¶ m· ho¸ MPEG-2. B¶ng 2.13 cung cÊp hiÖu suÊt PSNR trung b×nh cho m· ho¸ thµnh phÇn mµu liªn tiÕp Mobile Calendar, Flower Garden vµ Football t¹i tèc ®é bit m· ho¸ 0.73, 1.2, vµ 2.4 Mbps. Chóng ta cã thÓ chØ ra chuÈn MPEG-2 bëi 0.8–4.0 dB trong viÖc cung cÊp c¸c ®Æc tÝnh ®a tèc ®é. Gièng nh− kÕt qu¶ quan s¸t trªn h×nh 2.22 cho thµnh phÇn x¸m cña Video m· ho¸ Mobile Calendar.
B¶ng 2.5. So s¸nh hiÖu suÊt trung b×nh PSNR cña MPEG-2, IMC3D-FSSQ, vµ IMC3D-EZBC (in dB)

H×nh 2.22. HiÓn thÞ thµnh phÇn chãi cña ¶nh kh«i phôc

NguyÔn H÷u Ph¸t

81

§å ¸n cao häc §TVT 2003

th«ng qua bé m· ho¸ IMC3D-EZBC vµ MPEG-2 t¹i tèc ®é bit 0.73, 1.2, 2.4 vµ 4.8 Mbps.

Chóng ta còng chØ ra thµnh phÇn chãi cña ¶nh gèc trªn h×nh 2.22. H×nh 2.22 minh ho¹ ph¹m vi bit cã thÓ kÕt hîp bëi bé m· ho¸ IMC3D-EZBC.

H×nh 2.22. So s¸nh Y-PSNR t−¬ng øng víi ph¹m vi bit, Mobile Calendar.

NguyÔn H÷u Ph¸t

82

§å ¸n cao häc §TVT 2003

2.2.5.2. So s¸nh m· ho¸ LZC vµ 3D-SPIHT

H×nh 2.23. So s¸nh thµnh phÇn chãi cña ¶nh tõ khung 001 cña bé gi¶i m· liªn tiÕp Mobile Calendar t¹i tèc ®é bit 0.73, 1.2, 2.4, vµ 4.8 Mbps

(tõ trªn xuèng d−íi) víi MPEG-2 (bªn tr¸i) vµ IMC3D-EZBC (bªn ph¶i).

NguyÔn H÷u Ph¸t

83

23 tõ khung 001 cña ¶nh gèc Mobile Calendar.§å ¸n cao häc §TVT 2003 H×nh 2.24. vµ IMC3D-EZBC t¹i tèc ®é bit kh¸c nhau t¹i møc x¸m cña chuçi ¶nh kiÓm tra NguyÔn H÷u Ph¸t 84 . B¶ng 2. 3DSPIHT.6: So s¸nh PSNR cho 3 bé m· ho¸ LZC. Thµnh phÇn chãi cña ¶nh gièng nhau trªn h×nh 2.

6 tãm t¾t gi¸ trÞ trung b×nh PSNR cho møc x¸m m· ho¸ cña Video kiÓm tra Mobile Calendar.25: So s¸nh PSNR cho møc x¸m cña Flower Garden IMC3D-EZBC còng ®−îc so s¸nh víi 2 tèc ®é cña bé m· ho¸ Video 3D-SPIHT vµ LZC. Kh«ng bï chuyÓn ®éng. Flower garden.6 vµ h×nh 2. vµ b¶ng Tennis at bitrates 0. Gi¸ trÞ trung b×nh PSNR cho møc x¸m m· ho¸ cña Flower Garden trong ph¹m vi tèc ®é réng r·i ®−îc miªu t¶ trªn h×nh 2.26. KÕt qu¶ m· ho¸ chØ ra trong B¶ng 2.§å ¸n cao häc §TVT 2003 H×nh 2. chóng ta thiÕt lËp c©u tróc file sö dông 9 b¨ng läc cña Adelson cho b¨ng läc kh«ng gian. 1. ChÊt l−îng thÞ gi¸c cho cÊu tróc khung ®−îc ®¸nh gi¸ trong h×nh 2. H×nh 2.6. B¶ng 2.2. Víi LZC. c¶ 2 clips víi sù chuyÓn ®éng lín. and 2.27 cung cÊp khung Y-PSNR kÕt qu¶ cña bé m· ho¸ (IMC3D- NguyÔn H÷u Ph¸t 85 . 3D-SPIHT chØ ra h×nh thøc kÐm trªn Mobile Calendar vµ Flower Garden.¶nh kh«i phôc cho thuËt to¸n 3D-SPIHT xuÊt hiÖn chËp chênkhi dïng b¨ng läc thêi gian.133. ¶nh h−ëng nµy suy gi¶m trong LZC víi bï chuyÓn ®éng toµn côc.4Mbps.25 cho bé m· ho¸. khung cho mçi khèi truyÒn dÉn F = 32.

5.2. LZC vµ SPIHT.§å ¸n cao häc §TVT 2003 EZBC) cho ¶nh liªn tiÕp Mobile Calendar t¹i tèc ®é bit kh¸c nhau víi c¸c phiªn b¶n kh«ng bbï chuyÓn ®éng (3D-EZBC).28dB).875 fps.2. Gi¸ trÞ trung b×nh PSNRs cho toµn bé chuçi ¶nhghi trong B¶ng 2.32 dB). M· ho¸ tèc ®é ®a ph©n gi¶i Môc nµy giíi thiÖu kÕt qu¶ ®a ph©n gi¶i ®a tèc ®é m· ho¸ sö dông thuËt to¸n trong môc 2. vµ kh«ng gian ph©n gi¶i 352 x 240 hoÆc 176 x 120 pixels.75 hoÆc 1.2 Mbps.11 dB). hÖ thèng cã thÓ hç trî gi¶i m· khung t¹i tèc ®é 30.5. H×nh 2. 15.4. khung 001 cña møc x¸m Flower Garden t¹i 1.6. 2. D−íi cïng bªn tr¸i: LZC (25.26. Trªn cïng bªn tr¸it: ¶nh gèc.3. Víi chuçi ¶nh kiÓm tra (trong ph©n gi¶i SIF). 7. 3. So s¸nh ¶nh cÊu tróc bëi 3 bé m· ho¸ 3D-EZBC. NguyÔn H÷u Ph¸t 86 . Trªn cïng bªn ph¶i: 3D-SPIHT (23. D−íi cïng bªn ph¶i: IMC3D-EZBC (24.

28. H×nh 2. Trong b¶ng 2.2.505 bit/pixel (bpp) cho tÊt c¶ c¸c møc ph©n gi¶i hç trî theo kh«ng gian vµ thêi gian.8. chóng ta hiÓn thÞ líp byte cña nhãm ¶nh ®Çu tiªn cho thµnh phÇn chãi cña luång bit m· ho¸ trong b¶ng 2.3 Mbps.6.8 víi møc ph©n gi¶i “t-LL”. So s¸nh tõng khung Y-PSNR cña EZBC víi (IMC3D-EZBC) vµ kh«ng bï chuyÓn ®éng (3D-EZBC) cho m· ho¸ Mobile Calendar t¹i tèc ®é bit 2. 0. Gi¸ trÞ trung b×nh PSNR ®−îc lËp trªn b¶ng 2.7.4. “t-L” vµ “Full”. luång bit m· ho¸ ë ®©y cã thÓ gi¶m t¾c nghÏn trªn ®−êng truyÒn th«ng qua tèc ®é 960.0 Kbps (640. chóng ta chØ ra khung ®Çu tiªn tõ Video kh«i phôc Mobile Calendar t¹i tèc ®é bit m· ho¸ trung b×nh 0.27.§å ¸n cao häc §TVT 2003 Trªn h×nh 2.7.0 Kbps + 320. øng dông phæ biÕn miªu t¶ trªn h×nh 2. NguyÔn H÷u Ph¸t 87 . 1. 0.0 Kbps) cho kÕt nèi A.

B¶ng 2.7.§å ¸n cao häc §TVT 2003 B¶ng 2.8.7. Gi¸ trÞ trung b×nh PSNR (dB) cho m· ho¸ ®a ph©n gi¶i cña Mobile Calendar víi møc ®é ph©n gi¶i kh«ng gian thêi gian vµ tèc ®é m· ho¸ 0. TÇn sè ph©n chia ®¸p ønghiÓn thÞ trªn h×nh 2.505 bpp. Bè trÝ byte cña nhãm ¶nh ®Çu tiªn cho thµnh phÇn chãi cña luång bit tû lÖ trong b¶ng2. NguyÔn H÷u Ph¸t 88 .27.

vµ 2.28. 2.30 chØ ra khung ®Çu tiªn tõ bé gi¶i m· Flower Garden liªn tiÕp t¹i tèc ®é bit 800. Khung ®Çu tiªn cña chuçi ¶nh kh«i phôc Mobile Calendar t¹i møc ph©n gi¶i theo kh«ng gian vµ thêi gian thay ®æi vµ gi¶i m· t¹i tèc ®é bit 0.28.29. 200. vµ 50 Kbps. NguyÔn H÷u Ph¸t 89 . H×nh 2.505 bpp.§å ¸n cao häc §TVT 2003 H×nh 2.

29.9. NguyÔn H÷u Ph¸t 90 . So s¸nh PSNR (dB) cña IMC3D-EZBC cã vµ kh«ng cã ph©n gi¶i tû lÖ. Football.8. Thùc hiÖn ph©n chia tÇn sè theo b¶ng 2.§å ¸n cao häc §TVT 2003 H×nh 2. B¶ng 2.

2. (32. 27.30.6.25 dB).76 dB).30dB). (34.57 dB. 37. (27. Khung ®Çu tiªn tõ chuçi ¶nh kh«i phôc Flower Garden víi møc ®é ph©n gi¶i kh¸c nhau. víi viÖc kÕ thõa næi bËt cña FGS trong MPEG-4. t¹i tèc ®é 800 Kbps.263+. chóng ta ®Ò xuÊt ph−¬ng ph¸p m· ho¸ NguyÔn H÷u Ph¸t 91 .§å ¸n cao häc §TVT 2003 H×nh 2.23 dB.67 dB. CÆp chØ sè d−íi ®©y Y-PSNR cho khung ®Çu tiªn vµ gi¸ trÞ trung b×nh Y-PSNR cho toµn bé chuçi ¶nh. 30. (24. (c) D−íi cïng bªn tr¸i: t-LL. (a) §Ønh bªn tr¸i: Ph©n gi¶i toµn bé. §Çu tiªn chóng ta kh¸i qu¸t l¹i c¸c ph−¬ng ph¸p m· ho¸ hiªn thêi nh− chuÈn MPEG-2 vµ H. Tãm t¾t vµ kÕt luËn Ch−¬ng nµy giíi thiÖu hÖ thèng m· ho¸ Video b¨ng con 3 chiÒu/wavelet IMC3D-EZBC.88 dB. 2. §Ó tr¸nh ®Ö quy trong cÊu tróc m· ho¸. (d) D−íi cïng bªn ph¶i: t-LLL. 26.83 dB). Chóng ta còng ®Ò cËp ®Õn nh÷ng h¹n chÕ cña ph−¬ng ph¸p DPCM. (b) §Ønh bªn ph¶i: t-L.

Chóng ta còng ®Ò cËp ®Õn viÖc so s¸nh chuçi Video thùc hiÖn LZC vµ 3D-SPIHT. ®¬n gi¶n vµ tû lÖ SNR vÉn ®−îc duy tr×. CÆp Y-PSNR cho khung ®Çu tiªn vµ gi¸ trÞ trung b×nh Y-PSNR cho toµn bé chuçi ¶nh. HiÖu qu¶ cña thuËt to¸n nÐn ¶nh EZBC ®−îc më réng víi 3 tham sè cho kÕt qu¶ m· ho¸ theo thêi gian kh«ng gian.§å ¸n cao häc §TVT 2003 míi dùa trªn c¬ së b¨ng läc 3-D. H×nh 2. NguyÔn H÷u Ph¸t 92 . KÕt qu¶ h×nh thµnh khi chuyÓn ®éng víi tèc ®é cao trong Video. Khung ®Çu tiªn tõ chuçi ¶nh kh«i phôc Flower Garden víi møc ph©n gi¶i kh¸c nhau víi tèc ®é 200 Kbps. Mét vµi ®Æc tÝnh cña EZBC nh− hiÖu qu¶ nÐn.31. Bè trÝ ¶nh ®−îc m« t¶ trong h×nh trªn cïng.

22.05 dB). Khung ®Çu tiªn tõ chuçi m· ho¸ FlowerGarden víi møc ®é ph©n gi¶i kh¸c nhau.09 dB.16 dB). (20.84 dB. Ph©n gi¶i t-LL-s-LL: (31.131 dB).21 dB. phÝa gi÷a: t-LLL-s-LL. Ph©n gi¶i t-L-s-LL: (24. 24.58 dB. NguyÔn H÷u Ph¸t 93 .14 dB). (a) §Ønh trªn cïng bªn tr¸i: t-LL.48 dB. 25.03 dB.§å ¸n cao häc §TVT 2003 • • • • • • • Ph©n gi¶i ®Çy ®ñ: (22. 23. (d) §Ønh trªn cïng. Ph©n gi¶i t-LLLL: (30. 24. (13.77 dB). H×nh 2.83 dB). 30.87 dB).74 dB.93 dB). tèc ®é 50 Kbps.32.69 dB). CÆp Y-PSNR cho khung ®Çu tiªn vµ gi¸ trÞ trung b×nh Y-PSNR cho toµn chuçi ¶nh.22 dB).56 dB). 20.04 dB. (b) §Ønh trªn cïng bªn ph¶i: t-LLLL. Ph©n gi¶i t-LL: (24. Ph©n gi¶i t-LLs.79 dB.70 dB. (22.LL: (35. 17. (23. 21. 27. 22. 21.02 dB. (c) §Ønh d−íi cïng bªn tr¸i: t-LL-s-LL. Ph©n gi¶i s-LL: (27. (e) §Ønh trªn cïng bªn ph¶i: t-LLLL-s-LL.04 dB. (24.95 dB).

§å ¸n cao häc §TVT 2003 NguyÔn H÷u Ph¸t 94 .

Ph−¬ng ph¸p tiÕp cËn cho m· ho¸ ®ã lµ xem xÐt tÝn hiÖu Video khi ph©n tÝch l−îc ®å Video trong m¾t ng−êi. hoÆc lµ ph©n bè ®iÒu khiÓn m· ho¸ trong tr−êng hîp tèc ®é bit ®−îc ®iÒu khiÓn kh¸c nhau hoÆc lµ t¸c ®éng ®a thµnh phÇn nhê thay ®æi c¸c tham sè nh− lµ c¸c thµnh phÇn ng÷ c¶nh. Theo ®ã th× chØ khung c¬ b¶n míi ®−îc xö lý. ngµnh c«ng nghiÖp gi¶i trÝ. Ng−êi sö dông cã thÓ t¸c ®éng tíi bé m· ho¸.1 ®· chØ ra s¬ ®å chung cña hÖ thèng m· ho¸ ®èi t−îng Video. viÔn th«ng ph¸t triÓn nhanh chãng ®· t¹o ra sù quan t©m rÊt lín trong c¸c øng dùng phim ¶nh gäi chung lµ ®a truyÒn th«ng. Ng−êi sö dông kh«ng thÓ truy cËp hoÆc ®iÒu khiÓn ®èi t−îng trªn mµn h×nh khi mµ ch−a gi¶i m·.§å ¸n cao häc §TVT 2003 Ch−¬ng 3 §èi t−îng-c¬ së m· ho¸ SCALABLE Trong nh÷ng n¨m g©n ®©y. ng−êi sö dông cã thÓ gi¶i m· bëi viÖc s¾p xÕp vÞ trÝ cña VO hoÆc yªu cÇu ®a kªnh. §èi t−îng Video VO ®−îc m· ho¸ ®éc lËp vµ cã thÓ kh«i phôc l¹i tõ luång bit. NguyÔn H÷u Ph¸t 95 . m¸y tÝnh. Trong hÖ thèng m· ho¸ ¶nh vµ Video sè. H×nh 3. Trong tr−êng hîp kh«ng cã kªnh ph¶n håi hay khi luång bit tån t¹i. Cã mét gi¶i ph¸p ®−îc cung cÊp bëi l−îc ®å m· ho¸ ®èi t−îng Video. Xu h−íng nµy cµng t¨ng nhanh do nhu cÇu sö dông World Wide Web (WWW) trªn Internet. mét bøc tranh ®−îc giíi thiÖu nh− lµ m¶ng ®iÓm ¶nh h×nh ch÷ nhËt vµ ®−îc xö lý m· ho¸.

1: S¬ ®å khèi chung cña hÖ thèng m· ho¸ ®èi t−îng Video Víi môc ®Ých cung cÊp kü thuËt chuÈn trong l−u tr÷. øng dông ¶nh ¶o bao gåm c¬ së kh«i phôc vµ l−u tr÷.§å ¸n cao häc §TVT 2003 H×nh 3. vµ luång Video trªn Internet/ Intranet. truyÒn dÉn vµ ®iÒu khiÓn tèc ®é t¹i m«i tr−êng d÷ liÖu phim ¶nh. Do luång bit cho ¶nh vµ Video ®−îc t¹o ra ®éc lËp. L−îc ®å míi nµy cã thÓ lµm viÖc nh− lµ mét c«ng cô m· ho¸ trong hÖ thèng ®èi t−îng m· ho¸ Video. Trong luËn v¨n nµy. ta sÏ ph¸t triÓn thuËt to¸n dùa trªn ®èi t−îng m· ho¸ ¶nh ®−îc më réng cña EZBC. nhãm chuyªn gia vÒ ¶nh Moving Picture Expert Group (MPEG) ®· ®Ò xuÊt kü thuËt m· ho¸ ®èi t−îng Video nh− lµ h¹t nh©n trong chuÈn MPEG-4. tiÒn xö lý tinh vi tr−êng quay. ®−êng nÐt g©y ra bëi c¸c yÕu tè kh«ng tù nhiªn trong mËt ®é ¶nh däc theo biªn cña ®èi t−îng th−êng g©y nhiÔu khi xem NguyÔn H÷u Ph¸t 96 .

Mét møc ®é Video trung gian trong suèt cho phÐp sö dông mÆt ph¼ng x¸m tû lÖ alpha. Th«ng tin vÒ thµnh phÇn ¶nh ®−îc chøa trong mÆt ph¼ng alpha.§å ¸n cao häc §TVT 2003 xÐt trong øng dông ®èi t−îng m· ho¸. Thêi gian lÊy mÉu cña ®èi t−îng Video ®−îc gäi lµ mÆt ph¼ng Video (VOP’s). ®èi t−îng Video trong chuçi phim ¶nh mang l¹i cho ng−êi sö dông quyÒn truy cËp chØnh söa.1. víi 8 bits/pixel. Kh¸i niÖm chung ®−îc minh ho¹ trªn h×nh 3. §iÒu nµy sÏ ®−îc ph©n tÝch trong ch−¬ng tiÕp theo.1. KÕt qu¶ lµ c−êng ®é ¶nh ghÐp lai nhËn ®−îc bëi: NguyÔn H÷u Ph¸t 97 . • Môc 3.2: NÒn t¶ng cña ®èi t−îng m· ho¸.3: H×nh thøc cña thuËt to¸n m· ho¸ míi. ë ®©y cã 3 mÆt ph¼ng Video (bao gåm c¶ c¬ së) t¹o thµnh h×nh ¶nh hîp nhÊt. Chóng ta chó ý r»ng l−îc ®å m· ho¸ ®èi t−îng nµy gi¶m thiÓu so víi m· ho¸ tõng khung truyÒn thèng khi toµn bé chuçi ¶nh ®−îc xem nh− lµ 1 ®èi t−îng Video ®¬n lÎ.2. Mçi nhãm ¶nh ®−îc chØ ®Þnh cho mÆt ph¼ng alpha x¸c ®Þnh ®èi t−îng Video t−¬ng øng. 3. ®−îc thÓ hiÖn hoÆc Èn ®i t¹i h×nh ¶nh kÕt hîp trong cïng 1 thêi gian. §èi t−îng c¬ b¶n . Khung Video bao gåm tÊt c¶ c¸c nhãm ¶nh tõ ®èi t−îng Video trong phim ¶nh nhËn ®−îc. PhÇn cßn l¹i ®−îc cÊu tróc nh− sau: • Môc 3. Trong mÆt ph¼ng nhÞ ph©n alpha. ‘0’ x¸c ®Þnh ®iÓm ¶nh trong suèt vµ ‘1’ ký hiÖu cho ®iÓm ¶nh ®ôc.C¬ së m· ho¸ 3. • Môc 3. cÊu tróc ®−îc sö dông réng r·i trong tÝnh to¸n ®å ho¹ cho miªu t¶ phim ¶nh.1 MÆt ph¼ng ®èi t−îng Video Trong chuÈn MPEG-4.4: Tãm t¾t ch−¬ng.

vµ α j [ m. §Þnh d¹ng m∙ ho¸ Kü thuËt m· ho¸ theo h×nh d¹ng ®−îc dïng ®Ó giíi thiÖu th«ng tin mÆt ph¨ng alpha. n ].2. dùa trªn mét vµi kü thuËt ph©n ¶nh/chuyÓn ®éng. ThuËt to¸n m· ho¸ h×nh d¹ng chung cã thÓ øng dông trùc tiÕp cho mÆt ph¼ng nhÞ ph©n. n ] vµ Ij [m. 3. ThuËt to¸n khèi thÝch hîp tiªu chuÈn cho ®¸nh gi¸ chuyÓn ®éng cã thÓ më réng cho m· ho¸ h−íng ®èi t−îng Video trªn c¬ së khèi biªn boundary blocks. Víi mÆt ph¼ng alpha cã tû lÖ x¸m m· ho¸.1. th«ng tin ®iÒu khiÓn ®èi t−îng Video trong h×nh 3. n ] = ∑α i [ m.1 cã thÓ ®¸p øng bëi thuËt to¸n vÕt ®èi t−îng on hoÆc off.2. L−îc ®å ph©n tÝch h×nh (3. nh− chuÈn MPEG-4. n ] j =0 N (3. Víi mÆt ph¼ng alpha. chóng ta NguyÔn H÷u Ph¸t 98 .1.1) ë ®©y N lµ sè ®èi t−îng Video. VÝ dô ¶nh ghÐp hîp bao gåm 3 mÆt ph¼ng ®èi t−îng Video (mçi mÆt ph¼ng x¸c ®Þnh bëi 1 thµnh phÇn mµu).1. thµnh phÇn mµu vµ th«ng tin chuyÓn ®éng.1) cung cÊp kiÕn tróc phæ biÕn cho kÕt hîp gi÷a thuéc tÝnh tù nhiªn vµ nh©n t¹o cña ®èi t−îng Video.§å ¸n cao häc §TVT 2003 I c [ m. n] lµ mÆt ph¼ng alpha vµ c−êng ®é ¶nh cña ®èi t−îng Video j.2. Hoµn toµn ®óng ®¾n khi cho r»ng ®èi t−îng Video ®−îc t¹o ra hoÆc tån t¹i nh− tiªu ®Ò ti vi/ phim ¶nh vµ ®å ho¹ m¸y tÝnh. H×nh 3. 3. C«ng cô m· ho¸ cho ®èi t−îng Video Mét nhãm ¶nh h−íng ®èi t−îng ®−îc miªu t¶ bëi h×nh d¹ng.I j [ m.

CÊu tróc m∙ ho¸ Khèi truyÒn thèng vµ b¨ng con biÕn ®æi cho øng dông m· ho¸ ¶nh ®−îc thùc hiÖn cho tÝn hiÖu trong h×nh ch÷ nhËt. ®−êng viÒn khèi tõ h×nh d¹ng tuú ý cña mÆt ph¼ng ®èi t−îng Video ®−îc ®Öm trong ph¹m vi khèi. M· ho¸ b¶n ®å bit hoÆc chuçi m· ho¸ lµ hai ph−¬ng ph¸p phæ biÕn cho nÐn ®Þnh d¹ng Ýt tæn hao. MÆt ph¼ng bit x¸c ®Þnh phÇn ®ôc (d¹ng nhÞ ph©n) cña ®iÓm ¶nh riªng lÎ trong ranh giíi khèi hîp ®−îc m· ho¸ entropy. m· ho¸ h×nh d¹ng cã thÓ cã tæn thÊt hoÆc tæn thÊt rÊt Ýt. CÊu tróc l¹i h×nh ¶nh chÝnh x¸c cña mÆt ph¼ng ®èi t−îng Video nh»m môc ®Ých gi¶m gi¸ cña bit trong m· ho¸ theo h×nh d¹ng cã tæn hao. do ®ã nã kh«ng hiÖu qu¶ trong nÐn.1. H×nh d¹ng thÝch nghi DCT (SA-DCT) NguyÔn H÷u Ph¸t 99 . ThuËt to¸n nÐn h×nh d¹ng cã tæn hao bao gåm tÝnh xÊp xØ h×nh häc. Nã ®−îc sö dông trong chuÈn MPEG-4 sö dông DCT vµ trong OWT (Object Wavelet Transform). Thay ®æi quan hÖ trùc tiÕp (®i tõ ®iÓm nµy ®Õn ®iÓm kh¸c) lµ th«ng tin yªu cÇu m· ho¸. Mét vµi thuËt to¸n ®−îc ®Ò cËp trong luËn v¨n nh»m t¨ng hiÖu qu¶ biÕn ®æi cÊu tróc h×nh d¹ng tÝn hiÖu cho ®èi t−îng . Trong b¶n ®å bit m· ho¸(mét trong c¸c chuÈn MPEG-4). Tuy nhiªn ph−¬ng ph¸p nµy t¹o ra nhiÒu mÉu tÝn hiÖu ®Ó m· ho¸ sau khi biÕn ®æi.§å ¸n cao häc §TVT 2003 cã thÓ m· ho¸ tÝn hiÖu hç trî sö dông bé m· ho¸ nhÞ ph©n ch÷ nhËt nhê gi¸ trÞ m· ho¸ trong suèt bªn trong ®èi t−îng dùa trªn c¬ së kÕt cÊu bé m· ho¸.2. Trong tr−êng hîp nµy. C«ng cô m· ho¸ xem biªn ®èi t−îng nh− lµ kÕt qu¶ tÝn hiÖu ®Öm. miªu t¶ Fourier vµ tiÒm Èn viÖc m· ho¸. Trong chuçi m· ho¸. DCT ®−îc thiÕt lËp trong chuÈn m· ho¸ quèc tÕ th−êng lµ khèi 8 x 8.c¬ së m· ho¸.2. 3. BiÕn ®æi DWT ®−îc h×nh thµnh cho toµn bé ¶nh. ThuËt to¸n ®Öm rÊt ®¬n gi¶n vµ ®−îc giíi thiÖu trong luËn v¨n. T−¬ng tù nh− øng dông nÐn ¶nh truyÒn thèng. ranh giíi khèi gåm ®Çy ®ñ mÆt ph¼ng ®èi t−îng Video ®· ®−îc ®Þnh nghÜa. Víi c¸ch tiÕp cËn nh− trªn. tÊt c¶ ranh giíi ®iÓm ¶nh tõ ®èi t−îng ®−îc ph¸t hiÖn däc theo ®−êng viÒn ®èi t−îng.

2. §iÒu nµy cã thÓ lµm gi¶m hiÖu qu¶ truyÒn theo chiÒu ngang.§å ¸n cao häc §TVT 2003 minh ho¹ trªn h×nh 3. ®ã lµ mÉu bªn trong cña ®èi t−îng.c¬ së m· ho¸ mÆt ph¼ng bit EZBC. NguyÔn H÷u Ph¸t 100 .c¬ së biÕn ®æi wavelet RBDWT víi ®Æc tÝnh ®iÓn h×nh sÏ ®Ò cËp ®Õn trong môc 3. MiÒn kh¸c.3 lµ mét l−îc ®å phæ biÕn kh¸c cña ®èi t−îng vµ ®−îc chän trong chuÈn MPEG-4 phiªn b¶n 2. ®èi t−îng . Cèt lâi cña thuËt to¸n.3.Adaptive Wavelet Transforms (SAWT).3 (b). H×nh 3.c¬ së m· ho¸ ¶nh. 3. ThuËt to¸n t−¬ng tù ®−îc ph¸t triÓn cho biÕn ®æi wavelet thÝch nghi .2. §Æc tÝnh −u viÖt cña ph−¬ng ph¸p nµy lµ nã hÖ sè biÕn ®æi chÝnh x¸c gièng nh− ®Çu vµo. ThuËt to¸n ®−a ra cã thÓ øng dông trªn c¬ cÊu m· ho¸ mÆt ph¼ng ®èi t−îng Video VOP . sÏ ®−îc ®Ò cËp chi tiÕt trong môc sau. §Çu tiªn chóng ta cung cÊp tæng quan vÒ hÖ thèng. §iÓm ¶nh t−¬ng ®−¬ng vïng x¸m. C¸c b−íc thùc hiÖn SA-DCT.c¬ së cña hÖ thèng m· ho¸ Video. Tuy nhiªn ®Æc tÝnh thèng kª cña hÖ sè theo chiÒu ngang ®−îc thay ®æi bëi mét hÖ sè ho¹t ®éng minh ho¹ trªn h×nh 3. §èi t−îng-C¬ së m· ho¸ sö dông EZBC Trong môc nµy chóng ta sÏ ph¸t triÓn thuËt to¸n m· ho¸ EZBC nh»m t¨ng hiÖu qu¶ trªn ®èi t−îng .

c¬ së cña hÖ thèng m· ho¸ ¶nh EZBC (OB-EZBC) biÓu thÞ trªn h×nh 3. Bé m· ho¸ chÊp nhËn ®èi t−îng ¶nh.2. nh− lµ ®Çu vµo vµ m· ho¸ chóng riªng lÎ. V× thÕ mçi ®iÓm ¶nh ®Çu vµo ®−îc xem nh− lµ bªn trong hoÆc bªn ngoµi cña mét ®èi t−îng.1. ký hiÖu bëi VOP’s. Luång bit cho m· ho¸ ®Þnh d¹ng vµ cÊu tróc m· ho¸ cña ®èi t−îng riªng lÎ ®−îc biªn dÞch trong luång vµo bé xö lý ®Ó ph¸t sinh luång bit cuèi cïng.1. cung cÊp th«ng tin ®Þnh d¹ng cho ®èi t−îng biÕn ®æi trong b¨ng con riªng lÎ. Gi¶ thiÕt r»ng mÆt ph¼ng alpha kÕt hîp víi mÆt ph¼ng ®èi t−îng Video riªng lÎ ®−îc l−îng tö ho¸ sang d¹ng nhÞ ph©n.1 còng cã thÓ ®−îc thiÕt lËp ®Ó giíi thiÖu th«ng tin ®Þnh d¹ng trong hÖ thèng.c¬ së biÕn ®æi wavelet rêi r¹c (RBDWT). ®−îc miªu t¶ 1 c¸ch ng¾n gän. CÊu tróc tÝn hiÖu ph©n chia theo miÒn . MÆt ph¼ng ph©n chia alpha hay mÆt n¹ m. Tæng quan §èi t−îng ®Ò xuÊt . §Çu vµo cña mÆt ph¼ng ®èi t−îng Video cã thÓ tån t¹i trùc tiÕp bëi øng dông cña mét vµi thuËt to¸n ph©n chia.2.3).2. NguyÔn H÷u Ph¸t 101 . BÊt kú thuËt to¸n m· ho¸ ®Þnh d¹ng nµo ®· giíi thiÖu trong môc 3.§å ¸n cao häc §TVT 2003 3.4 (a). HÖ sè biÕn ®æi w ®−îc m· ho¸ bëi ®èi t−îng ®Ò xuÊt lµ hÖ sè m· ho¸ mÆt ph¼ng bit c¬ b¶n EZBC (xem chi tiÕt trong môc 3. M· ho¸ ®Þnh d¹ng cã tæn hao cã thÓ ®−îc øng dông ngay khi h×nh d¹ng ®èi t−îng kh«i phôc ®−îc ®−a cho chuçi kÕt cÊu m· ho¸ tuÇn tù. ®−îc dïng lµm ®Çu vµo cho mÆt ph¼ng bit m· ho¸.

MiÒn – C¬ së biÕn ®æi Wavelet rêi r¹c MiÒn . C¬ së biÕn ®æi wavelet rêi r¹c RBDWT thiÕt lËp trong hÖ thèng nµy lµ phiªn b¶n ®· ®−îc hiÖu chØnh. tõ cét nµy ®Õn cét kh¸c tíi tæn hao ®¸ng kÓ. ThuËt to¸n biÕn ®æi b¨ng con nµy kh«ng më réng. thay v× kÕt hîp côc bé trong ®−êng viÒn cña b¨ng läc ®Çu vµo. ThuËt to¸n kh«ng më réng tÝn hiÖu c©n ®èi cho b¨ng läc ®a tèc ®é ®−îc sö dông ®Ó qu¶n lý biªn cña ®èi t−îng. 3. MÉu tõ ®−êng ph©n chia cña 1 ®¬n vÞ chiÒu dµi ch½n ®−îc chia tû lÖ bëi hÖ sè 1 chiÒu DC råi sau ®ã ®−îc copy sang b¨ng NguyÔn H÷u Ph¸t 102 .4.2. ®ã lµ mét ®Æc tÝnh ®iÓn h×nh cho hiÖu qu¶ nÐn. bé läc QMF ®−îc thay thÕ bëi bé läc Daubechies 9/7. S¬ ®å khèi cña ®èi t−îng c¬ së cña hÖ thèng m· ho¸ ¶nh EZBC.2. Sè mÉu ®Çu vµo gièng hÖt kÕt qu¶ hÖ sè biÕn ®æi.c¬ së biÕn ®æi wavelet rêi r¹c (RBDWT) ph©n chia cho tÝn hiÖu ¶nh cã h×nh d¹ng tuú ý. §−êng ph©n ®o¹n cña viÖc lÊy mÉu xuèng ®−îc h×nh thµnh víi toµn h×nh ¶nh nguån kÕt hîp.§å ¸n cao häc §TVT 2003 (b) Mét nh¸nh b¨ng con cña kü thuËt m· ho¸ mÆt ph¼ng bit OB-EZBC H×nh 3. Trong qu¸ tr×nh thùc hiÖn. Sau ®ã cã thÓ g©y ra trÔ pha tõ hµng nµy ®Õn hµng kh¸c.

3.4 (b). ë ®©y wk vµ mk ký hiÖu lµ hÖ sè RBDWT vµ d¹ng mÆt n¹ ph©n tÝch cho b¨ng con k. Víi hÖ sè m· ho¸ “SINGLE” t¹o ra trong viÖc ph©n tÝch tr¹ng th¸i b¨ng con. 2j). møc c©y 1/4 riªng lÎ ®−îc chØ ®Þnh 1 mÆt n¹ nhÞ ph©n nÕu nh− nót cña c©y 1/4 n»m “INSIDE” hoÆc “OUTSIDE” dùa tren viÖc ph©n tÝch h×nh d¹ng mÆt n¹. tÊt c¶ c¸c mÉu ngoµi b¨ng con cña biªn miÒn ¶nh ®−îc thiÕt lËp gi¸ trÞ 0 v× thÕ c¸c hÖ sè kh«ng hîp lÖ sÏ kh«ng ¶nh h−ëng tíi kÕt qu¶ cña c©y 1/4 trong b¨ng con. NguyÔn H÷u Ph¸t 103 . j) lµ “OUTSIDE” nÕu tÊt c¶ c¸c nót phô thuéc {Q[l -1] (2i. Víi th«ng tin ®Þnh d¹ng nhËn ®−îc vµ kÕt qu¶ ph©n tÝch mÆt n¹. Qu¸ tr×nh ®ã gièng nh− thñ tôc m· ho¸ cho møc ®iÓm ¶nh pixel-level LIN vµ LSP.3. Q[l -1] (2i+1.ph−¬ng tiÖn m· ho¸ mÆt ph¼ng bit EZBC cho b¨ng con k thÓ hiÖn trªn h×nh 3. §èi t−îng-C¬ së m· ho¸ mÆt ph¼ng bÝt EZBC §èi t−îng . 2j +1)} lµ “OUTSIDE”.§å ¸n cao häc §TVT 2003 läc th«ng thÊp. Nót c©y 1/4 Q[l] (i. 2j). Trong mÆt n¹ pha. bé gi¶i m· cã thÓ nhËn c¸c b−íc gièng nhau khi nh− bé m· ho¸ vµ cã nót “OUTSIDE” ®−îc l−ít qua mµ kh«ng cã bÊt kú th«ng tin g× thªm vµo. Trong khèi tiÒn l−îng tö. hai danh s¸ch thªm vµo LISG (danh s¸ch c¸c tÝn hiÖu ®¬n kh«ng quan träng) vµ LSSG (danh s¸ch c¸c tÝn hiÖu ®¬n quan träng) ®−îc t¹o ra t¹i mçi møc ph©n gi¶i. MÉu tõ 1 ®¬n vÞ chiÒu dµi ph©n chia trong vÞ trÝ lÎ ®−îc ®Æt tªn lµ“SINGLE” vµ sau ®ã ®−îc m· ho¸ riªng.2. L−îc ®å m« h×nh ng÷ c¶nh nµy khëi t¹o trong m· ho¸ entropy truyÒn thèng lo¹i bá trong c¸ch nµy nh÷ng c¸i xem nh− lµ l©n cËn “OUTSIDE” khi kh«ng cã nghÜa. Chóng ta sÏ ®Þnh nghÜa hÖ sè b¨ng con (1 nót d−íi cïng cña c©y 1/4) lµ “OUTSIDE” nÕu nã ®−îc chØ ®Þnh ra ngoµi biªn cña ®èi t−îng ¶nh. 2j +1). Q[l -1] (2i. Q[l -1] (2i+1.

Bé m· ho¸ OB-SPECK giíi thiÖu bëi Lu lµ phiªn b¶n më réng cña SPECK (mµ kh«ng sö dông m· ho¸ sè häc). Tèc ®é bit tÝnh to¸n cho b¶ng 3. H×nh thøc bé m· ho¸ míi ®−îc ®¸nh gi¸ th«ng qua viÖc thö nghiÖm bé m· ho¸.2 chØ dùa trªm gi¸ bit cho cÊu tróc m· ho¸.0 bpp nhê thuËt to¸n so s¸nh nµy. chóng ta cung cÊp kÕt qu¶ PSNR cho m· ho¸ ®èi t−îng ¶nh cËn c¶nh h×nh 3. vµ 1.5 sö dông bé m· ho¸ OB-EZBC t¹i tèc ®é bit m· ho¸ trung b×nh 0.1. KÕt qu¶ thùc nghiÖm §èi t−îng ®Ò xuÊt – c¬ së thuËt to¸n EZBC (OB-EZBC) ®−îc øng dông trong phÇn mÒm nµy. MÆt n¹ cã h×nh d¹ng/ph©n ®o¹ncho ¶nh m· ho¸ ®−îc cung cÊp bëi chuÈn MPEG.3. 0. So s¸nh PSNR m· ho¸ cho AKIYO NguyÔn H÷u Ph¸t 104 . Trong b¶ng 3. Chóng ta sÏ hiÖn thÞ ¶nh kiÓm tra vµ mÆt n¹ trªn h×nh 3. PSNR vµ gi¸ trÞ tèc ®é bit ®−îc tÝnh to¸n ®iÓm ¶nh cËn c¶nh vµ gi¸ cña bit cho cÊu tróc m· ho¸.1. §èi t−îng Han – dùa trªn c¬ cÊu bé m· ho¸ co b¨ng läc gièng nhau (sö dông RBDWT) nh− lµ OB-EZBC vµ bit ph©n bè gi÷a b¨ng con vµ ®èi t−îng ®−îc tèi −u ho¸ bëi thuËt to¸n BFOS. B¶ng 3.5.§å ¸n cao häc §TVT 2003 3. SA-ZTE vµ SA-DCT ®−îc thùc hiÖn trong m« h×nh MPEG-4. ThuËt to¸n Egger lµ sù kÕt hîp cña SAWT vµ EZW. Chóng ta sö dông ®èi t−îng h×nh ¶nh m· ho¸ trÝch ra tõ chuçi ¶nh kiÓm nghiÖm MPEG-4. KÕt qu¶ PSNR cña OB-EZBC cho m· ho¸ ®èi t−îng cËn c¶nh B¶ng 3.5.1. Bé m· ho¸ míi ®−îc so s¸nh víi c¸c tr¹ng th¸i kh¸c-c¬ së thuËt ton¸ m· ho¸ b¶ng 3.2. ë ®©y chóng ta liÖt kª gi¸ trÞ PSNR ghi trong khung 000 cña AKIYO t¹i tèc ®é bit 1.0 bpp.2.

6 (b) vµ (d) dïng 827 bits hoÆc.8. §iÒu nµy minh ho¹ r»ng. B¶ng 3.7. chóng ta giíi thiÖu ®èi t−îng m· ho¸ Foreman t¹i tèc dé bit kh¸c nhau vµ kÕt hîp ph©n gi¶i. Nh− chóng ta thÊy. chóng ta chØ ra chÊt l−îng ¶nh cho bÒ mÆt cña ¶nh kiÓm tra MISS AMERICA c¶i thiÖn ®−îc t¨ng c−êng t¹i cung gi¸ cña bit.§å ¸n cao häc §TVT 2003 Trªn h×nh 3. ®èi t−îng gi¶i m· tõ luång bit m· ho¸ t¹o nªn cho ¶nh cuèi cïng. Trong h×nh 3. chóng ta cã thÓ cho phÐp hiÖu qu¶ trong ®èi t−îng ¶nh riªng lÎ trong ph¹m vi ph©n gi¶i kh¸c nhau vµ chÊt l−îng møc nÐn sö dông nÐn ®¬n. víi luång bit m· ho¸ cao.3.5 bpp. Trong h×nh 3. gia cña bit cho ®Þnh d¹ng m· ho¸ nhËn ®−îc trong kÐt qu¶ tÝnh to¸n h×nh 3. KÕt qu¶ lµ EZBC ®−îc ph¸t sinh bëi miÒn m· ho¸ h×nh ch÷ nhËt bao trïm ®èi t−îng ¶nh cËn c¶nh víi c¸c ®iÓm ¶nh nÒn t¶ng bªn trong ranh giíi miÒn thiÕt lËp gi¸ trÞ 0.3. C«ng b»ng mµ nãi.022 bpp. Trªn h×nh 3.6.1 vµ 0. chóng ta so s¸nh h×nh thøc cña OB-EZBC víi h×nh thøc truyÒn thèng (frame-based) EZBC cho AKIYO t¹i tèc ®é bit m· ho¸ 0.7. Gi¸ trÞ PSNR cho m· ho¸ ®èi t−îng ¶nh FOREMAN trong h×nh 3. NguyÔn H÷u Ph¸t 105 . KÕt qu¶ PSNR liÖt kª trong b¶ng 3. h×nh thøc ®Ò xuÊt OB-EZBC h×nh thµnh tèt h¬n c¶ bªn trong (®−êng viªn) lÉn bªn ngoµi (PSNR).9.

§å ¸n cao häc §TVT 2003 3.5: MÆt n¹ ¶nh gèc NguyÔn H÷u Ph¸t 106 .4. (b) Frame 000 and its shape mask from sequence FOREMAN. Nã ®−îc khëi t¹o nh− lµ céng cô m· ho¸ trong hÖ thèng m· ho¸ Video. Tãm t¾t vµ kÕt luËn Ch−¬ng nµy giíi thiÖu hÖ thèng m· ho¸ OB-EZBC. KÕt hîp RBDWT vµ bé m· ho¸ mÆt ph¼ng bit OB-EZBC (më réng EZBC). H×nh 3. thuËt to¸n ®Ò xuÊt cã kh¶ n¨ng hiÖu qu¶ víi ¶nh h×nh d¹ng tuú ý. ThuËt to¸n nµy gi¶m quy vÒ thuËt to¸n EZBC truyÒn thèng cho miÒn ¶nh m· ho¸ ch÷ nhËt.

So s¸nh kÕt qu¶ cña EZBC vµ OB-EZBC. PSNR = 25.51 dB.5 bpp. PSNR = 34. 0. PSNR = 24. 0.70 dB.42 dB.1 bpp. NguyÔn H÷u Ph¸t 107 . (b) Trªn cïng bªn ph¶i: OB-EZBC.5 bpp. (d) D−íi cïng bªn ph¶i: OB-EZBC.6.§å ¸n cao häc §TVT 2003 H×nh 3. (c) D−íi cïng bªn tr¸i: EZBC.1 bpp. 0.40 dB. PSNR = 32. 0. (a)Trªn cïng bªn tr¸i: EZBC.

0.§å ¸n cao häc §TVT 2003 H×nh 3. vµ 1.1.0 bpp tõ trªn xuèng d−íi).7. Khung kh«i phôc 000 cña FOREMAN t¹i ®é ph©n gi¶i kh¸c vµ tèc ®é bit (0.5. NguyÔn H÷u Ph¸t 108 .

8.§å ¸n cao häc §TVT 2003 H×nh 3. ba møc (trªn cïng bªn ph¸i) vµ 5 møc (d−íi cïng bªn ph¶i). 1 møc (gi÷a bªn ph¶i). NguyÔn H÷u Ph¸t 109 .05 bpp. MISS AMERICA m· ho¸ t¹i 0. HÖ sè mÆt ph¼ng bit liªn quan ®Õn bÒ mÆt ¶nh bÞ t¨ng bëi møc 0 (gi÷a bªn tr¸i).

4 ®èi t−îng ¶nh tõ h×nh 3.0 bpp vµ ®é ph©n gi¶i kh¸c nhau cho ¶nh cuèi cïng. NguyÔn H÷u Ph¸t 110 .§å ¸n cao häc §TVT 2003 H×nh 3.5 ®−îcgi¶i m· t¹i tèc ®é bittrung b×nh 1.9. VÝ dô cña øng dông m· ho¸ scalable.

HiÓn thÞ c¸c th«ng sè cña file avi. AMR.®é lín cña 1 frame.avi ®Çu vµo.tèc ®é frame.yuv) víi th«ng sè ®Çu vµo nh− chiÕu cao chiÒu réng sè frames/s ®Çu ra gåm kÝch th−íc y.XVID. Cöa sæ thùc hiÖn nÐn cho phÐp nÐn tõ file *.mp3.1. CÊu tróc ch−¬ng tr×nh CÊu tróc ch−¬ng tr×nh gåm c¸c chøc n¨ng chÝnh sau: a.ghi ra file MPEG4 (*.1.263.MP4AV.0.MP4AV.2.yuv víi 2 tham sè tuú chän lµ chiÒu cao vµ chiÒu réng cña frame. Cöa sæ thùc hiÖn nÐn cho phÐp nhËp file video *.rgb (hoÆc *.avi nh− lo¹i file avi. Kh¸i qu¸t chung Ch−¬ng tr×nh cña t«i ®−îc viÕt trªn nÒn Visual C++ 6.sè frame trong file.ACC.263.M4V. ®Çu vµo.rgb) sang file ®Þnh d¹ng YUV (*.H. Cöa sæ thùc hiÖn nÐn cho phÐp nÐn tõ file *.DIVX.1.v vµ frame ®· ®äc.u.XVID. d.raw b.mp4) ®Çu ra víi c¸c tham sè tuú chän lµ tèc ®é frame. 4.yuv).rgb ®Çu vµo. Cöa sæ hiÓn thÞ cho phÐp hiÓn thÞ th«ng tin vÒ file *. X©y dùng ch−¬ng tr×nh 4. HiÓn thÞ th«ng tin file MPEG4. AMR.ghi ra file *.DIVX.1.M4V. sö dông NguyÔn H÷u Ph¸t 111 . ChuyÓn tõ file RAW sang file WAVELET.ACC. e. HiÓn thÞ th«ng tin file RGB vµ YUV.§å ¸n cao häc §TVT 2003 Ch−¬ng 4: Ch−¬ng tr×nh thö nghiÖm vµ ®¸nh gi¸ kÕt qu¶ 4.avi) sang file RAW(*.CMP.Ch−¬ng tr×nh thùc hiÖn c¸c chøc n¨ng sau: ChuyÓn tõ file video AVI (*.raw).CMP. c. T¹o file MPEG4 tõ file ®Çu vµo d¹ng MP3. ChuyÓn tõ file RGB(*. Cöa sæ hiÓn thÞ cho phÐp hiÓn thÞ th«ng tin vÒ file *.H. ghi file ®Çu ra d¹ng .

g. §¸nh gi¸ kÕt qu¶ thö nghiÖm 4.2. Cöa sæ hiÓn thÞ cho phÐp hiÓn thÞ th«ng tin vÒ file *. KÕt qu¶ thö nghiÖm KÕt qu¶ thu ®−îc cho tÖp air. v× vËy t«i chØ ®−a mét sè phÇn vµo trong phÇn phô lôc cña luËn v¨n. Ch−¬ng tr×nh gi¶i nÐn thùc hiÖn ®äc file WAVELET(*.rgb : dung l−îng 426 Kb.lo¹i track.raw) sö dông Wavelet. c¸c module thùc hiÖn thuËt to¸n cho qu¸ tr×nh nÐn vµ qu¸ tr×nh gi¶i nÐn.. TÖp Demo..Do m· nguån cho ch−¬ng tr×nh kh¸ dµi.§©y lµ file nh¹c Audio ®Þnh d¹ng theo chuÈn MP3.th«ng tin cña tõng track.cho phÐp thay ®æi tèc ®é bÝt.file thu trùc tiÕp 3 tÝn hiÖu Red Green vµ Blue.85 KB ®©y lµ file mp3.46 MB. h. TÖp global.KÝch th−íc frame 320x240 gåm 107 frames. ghi ra file ®Çu ra WAVELET(*. 4.rgb : NguyÔn H÷u Ph¸t 112 .2.mp3: dung l−îng 2. §©y lµ tÖp cña thö nghiÖm cña Visual C++..§å ¸n cao häc §TVT 2003 ®Þnh d¹ng file ACC.wl). Ch−¬ng tr×nh wavelet thùc hiÖn nÐn file Video ®Çu vµo ®Þnh d¹ng RAW(*. Trong ch−¬ng tr×nh cã sö dông mét sè cÊu tróc d÷ liÖu.§©y lµ file nh¹c Audio ®Þnh d¹ng theo chuÈn MP3.2.Tèc ®é truyÒn 15 frames/s.cho phÐp file AVI. tÝnh to¸n tèc ®é bit H263.2.1 D÷ liÖu thö nghiÖm D÷ liÖu thö nghiÖm lµ hai tÖp: TÖp air.mp4 ®Çu ra gåm sè track.tèi −u ho¸. TÖp Sound. f.mp3: dung l−îng 36.liÖt kª c¸c track.rgb nh− sau: §¸nh gi¸ cho tÖp air.3 KB ®©y lµ file mp3. 4..wl) ®Çu vµo.avi : dung l−îng 3.

mp3 Ph©n tÝch th«ng tin file Demo.mp3 ta thu ®−îc : NguyÔn H÷u Ph¸t 113 .yuv YUV 213 Kb 40 pixels 40 pixels 91 1600 400 320 pixels 40 pixels 240 pixels 30 pixels 122 1200 300 B¶ng 4.mp3 vµ Sound.mp3 vµ Sound.1: §¸nh gi¸ tham sè cña tÖp air.yuv YUV 253 Kb 240 pixels 240 pixels 3 57600 14400 YUV air.mp4 MPEG4 4.mp3 MP3 36.rgb RGB 426 Kb YUV air.85 KB 30 9000 1460 Sound.yuv §¸nh gi¸ cho tÖp Demo.mp3 MP3 2.rgb vµ air.mp4 MPEG4 41.yuv YUV 214 Kb YUV air.2: §¸nh gi¸ tham sè cña tÖp Demo.mp4 vµ Sound.§å ¸n cao häc §TVT 2003 RGB TÖp gèc Lo¹i tÖp Dung l−îng ChiÒu réng frames ChiÒu cao frames Sè frames xö lý KÝch th−íc Y KÝch th−íc UV air.45 KB B¶ng 4.3 KB 30 9000 1460 Demo.8 KB Sound.mp3 tèc ®é 30 frames/s thu ®−îc kÕt qu¶ TÖp gèc Lo¹i tÖp Dung l−îng Video frames/s Time Scale Play load Demo.yuv YUV 225 Kb 320 pixels 240 pixels 2 76800 19200 YUV air.

56Kbps.90000Hz Playload track 1 MPA cho B¶ng 4.4: Tham sè cña tÖp Sound.3: Tham sè cña tÖp Demo.avi nh− sau: TÖp gèc Lo¹i tÖp Dung l−îng ChiÒu réng frames ChiÒu cao frames Sè frames 107 107 15 B¶ng 4.mp3 KÕt qu¶ thu ®−îc cho tÖp global.avi Global.46 MB 320 pixels 240 pixels Global.mp4 STT track 1 2 Lo¹i track Audio Hint Th«ng tin track MPEG-1 Audio.128Kbps.raw RAW 3.§å ¸n cao häc §TVT 2003 Tªn tÖp Demo.38 MB 320 pixels 240 pixels Global.mp4 STT track 1 2 Lo¹i track Audio Hint Th«ng tin track MPEG-2 Audio.90000Hz Playload MPA cho track 1 B¶ng 4.mp3 Tªn tÖp Sound.1KB 320 pixels 240 pixels Minh ho¹ mét frame trong file global.5: §¸nh gi¸ tÖp Global.wl WAVELET 15.avi AVI 3.avi: NguyÔn H÷u Ph¸t 114 .

mp3 ta cã: Víi tÖp ®Çu vµo MP3 ®Çu ra chóng ta cã tÖp ®Þnh d¹ng MPEG4. dung l−îng ®Çu ra lµ 214 Kb kÝch th−íc 40x30.raw 3.Mp3 vµ Demo. Do ®ã tØ sè nÐn lµ: CR = 3.89333 225 Dung l−îng ®Çu vµo lµ 426 Kb.026 3.File MPEG4 ë ®©y cã chÊt l−îng cao kh«ng cã nhiÔu øng dông trong truyÒn th«ng ®a ph−¬ng tiÖn.avi 3. NhËn xÐt vÒ tû sè nÐn.rgb: Dung l−îng ®Çu vµo 426 Kb. Do ®ã tØ sè nÐn lµ: CR = 426 = 1. Do ®ã tØ sè nÐn lµ : CR = 426 = 1.38 NguyÔn H÷u Ph¸t 115 .§å ¸n cao häc §TVT 2003 H×nh 4.1: Mét frame trong file Global.avi 4.46 = 1.ë ®©y chóng ta chó ý ®Õn chÊt l−îng cña ®Çu ra h¬n lµ chÊt l−îng nÐn.2.chÊt l−îng nÐn §èi víi tÖp air.38 Mb cïng kÝch th−íc frames 320x240 pixels.3.9999 214 §èi víi tÖp Sound.46 Mb. §èi víi tÖp Global.avi: Dung l−îng ®Çu vµo file Global. dung l−îng ®Çu ra Global. dung l−îng ®Çu ra 225 Kb cïng kÝch th−íc frames 320x240.

24 2413. Do ®ã tØ sè nÐn lµ : CR = 3.80 2884.38.6: Sai sè psnr cña tÖp Global.705 52.390 13.684 14.400 52. dung l−îng ®Çu ra Global.50 2901.485 13.789 13.1 Qua ®©y chóng ta thÊy ®èi víi ph−¬ng ph¸p dïng wavelet chóng ta cã tû lÖ nÐn rÊt cao so víi c¸c ph−¬ng ph¸p nÐn th«ng th−êng.82 2718.94 2468.65 2708.2 15.H×nh sau minh ho¹ quan hÖ gi÷a kÝch th−íc khung vµ tû sè nÐn: Víi file Global.869 13.54 2825.38MB .76 2624.78 2893.045 13.708 13.123 14.wl NguyÔn H÷u Ph¸t 116 .143 13.56 B¶ng 4.246 13.84 2645.895 53.34 2729.55 2929.wl 15.536 53.1 Kb kÝch th−íc 320x240 víi sè khung xö lý lµ 15.329 53.206 53.154 13.208 54.157 13.122 13.881 52.685 52.592 51.82 2744.raw 3.233 13.§å ¸n cao häc §TVT 2003 Dung l−îng ®Çu vµo file Global.484 49.063 49.651 52.435 13.1024 = 229.97 2720.778 51.wl kÝch th−íc 320x240 l−îng tö lµ 129 vµ tæn hao dpcm =65 sè frame 15 ta cã : STT 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 MSE RMSE PSNR 2754.689 52.

2. §å thÞ quan hÖ RMSE vµ PSNR gi÷a c¸c khung NguyÔn H÷u Ph¸t 117 . §å thÞ quan hÖ MSE gi÷a c¸c khung 60 50 40 30 20 10 0 1 3 5 7 9 11 13 15 RMSE PSNR H×nh 4.3.§å ¸n cao häc §TVT 2003 Ta cã ®å thÞ sau: MSE 3500 3000 2500 2000 MSE 1500 1000 500 0 1 3 5 7 9 11 13 15 H×nh 4.

ChÊt l−îng ¶nh cña b¨ng läc gi¶i m· Video kh«ng bÞ ¶nh h−ëng tõ hiÖn t−îng bãng mê t¸c ®éng th−êng thÊy trong bé m· ho¸ 3-D th«ng th−êng (kh«ng bï chuyÓn ®éng). 1.dùa trªn l−îc ®å khèi m· ho¸ zeroblock cho viÖc ph©n chia hÖ sè m· ho¸ wavelet.thiÕt lËp sù ph©n chia vµ m« h×nh ng÷ c¶nh .cho hiÖu qu¶ m· ho¸ entropy ®Æc tr−ng cho mÆt ph¼ng m· ho¸. HÖ thèng m· ho¸ Video míi (IMC3D-EZBC) ®−îc tr×nh bµy trong ch−¬ng 7. ThuËt to¸n nµy ®−a ®Õn 2 kü thuËt thµnh c«ng ®ã lµ .§å ¸n cao häc §TVT 2003 KÕt luËn LuËn v¨n xin ®−îc kÕt thóc víi 1 vµi ®Þnh h−íng. chóng ta cã thÓ thiÕt lËp c©y tø ph©n . Mét hÖ thèng ph©n tÝch tæng hîp theo thêi gian víi viÖc bï chuyÓn ®éng chÝnh x¸c 1 nöa ®iÓm ¶nh (IMCTF) ®−îc gi−ãi thiÖu trong ch−¬ng 6.c¬ së bé m· ho¸ ph©n chia. B¨ng läc thêi gian cho phÐp gi¶i m· hoµn chØnh tÝn hiÖu Video. øng dông luËn v¨n Mét thuËt to¸n m· ho¸ ¶nh míi dïng wavelet (EZBC) ®· ®−îc giíi thiÖu trong ch−¬ng tr−íc. §Çu tiªn chóng ta sÏ khai th¸c tÝnh thèng kª phô thuéc vµo c©y quadtree giíi thiÖu trong bé gi¶i m·. ThuËt to¸n nµy lµ lý t−ëng cho m· ho¸ ph©n gi¶i scalable. NguyÔn H÷u Ph¸t 118 . Sù c¶i thiÖn rÊt lín cña PSNR th«ng qua thuËt to¸n ®ã lµ kÕt qu¶ m« pháng. Chóng ta minh ho¹ kÕt qu¶ thùc nghiÖm ®ã lµ sù thay ®æi tèc ®é bit m· ho¸ vµ ph©n gi¶i kh«ng gian thêi gian cã thÓ ®−îc gi¶i m· tõ 1 file nÐn ®¬n lÎ sö dông hÖ thèng m· ho¸ míi. Bé m· ho¸ cña chóng ta cã 1 vµi ®Æc tÝnh −u viÖt so víi mÆt ph¼ng m· ho¸ truyÒn thèng lµ tèc ®é ®iÒu khiÓn chÝnh x¸c vµ dô ®o¸n gi¶i m· ®a tèc ®é. Kh«ng gièng nh− c©y nhÞ ph©n truyÒn thèng.

Cã thÓ c¶i thiÖn nhê sö dông ph©n gi¶i gãi wavelet cho viÖc tèi −u ho¸ b¨ng con theo kh«ng gian vµ thêi gian. KÕt qu¶ t×m ®−îc trong môc 6.§å ¸n cao häc §TVT 2003 §èi t−îng míi .dùa trªn hÖ thèng m· ho¸ OB-EZBC. ®−îc tr×nh bµy trong ch−¬ng 3. chuÈn hoa bëi hµm mËt ®é Gaussian. • ViÖc thÝch nghi trong cÊu tróc b¨ng con vµ kÝch th−íc GOP: Ph©n tÝch 2 b¨ng con vµ kÝch th−íc cè ®Þnh GOP (chØ cho Video) ®−îc sö dông cho hÖ thèng m· ho¸ hiÖn thêi. ThuËt to¸n ®Ò xuÊt cã kh¶ n¨ng m· ho¸ h×nh d¹ng ¶nh tuú ý. H−íng ph¸t triÓn cho t−¬ng lai Mét vµi h−íng ph¸t triÓn cho t−¬ng lai: • ¦u ®iÓm cña m« h×nh ng÷ c¶nh: Sù thy ®æi mang tÝnh thèng kª phô thuéc cã thÓ ®−îc quan s¸t trong cÊu tróc h×nh th¸p. §iÒu ®ã hy väng r»ng viÖc c¶i thiÖn nÐn ¶nh cã thÓ ®¹t ®−îc bëi m« h×nh chiÕn l−îc tinh vi cã lîi cho viÖc lùa chän vµ l−îng tö ho¸. thay v× h×nh thµnh hµm mËt ®é hiÖn thêi. 2. NguyÔn H÷u Ph¸t 119 . Kh¶ n¨ng cao cña EZBC ®−îc gi÷ l¹i vµ luång bit cho ®èi t−îng riªng lÎ cã thÓ ph©n gi¶i tû lÖ vµ m· ho¸ tèc ®é ®éc lËp. më réng tõ khung ®Çu vµo EZBC. • M« h×nh thèng kª chÝnh x¸c cho hÖ sè wavelet: L−îc ®å l−îng tö ho¸ l¹i cã thÓ ®−îc c¶i thiÖn sö dông k¶ n¨ng m« h×nh chÝnh x¸c. TËp trung n¨ng l−îng b¨ng con sÏ t¨ng khi ph©n chia tÇn sè cao cho m« h×nh ¶nh.5.

Information Technology — Generic Coding of Moving Pictures and Associated Audio Informations: Video. Pennebaker and J.1309–1324.1994.261.9. Information Technology — Coding of Moving Pictures and Associated Audio for Digital Storage Media at up to 1. [Online]. “The digital (r)evolution. Mitchell. 1993. Aaron. J. pp. Seroussi. [2] J. ”Communications of the ACM. ISO/IEC 13818-2. 1994. 1992. JPEG Still Image Data Compression Standard. Aug. ISO/IEC 11172-2. Dec. 1974.41. M. “The LOCO-I lossless image compression algorithm: principles and standardization into JPEG-LS. April 1991. Sapiro. [9] ISO/IEC. on Signal Processing.1993.. hp.3445–3462. pp. [4] W.1994. Dec. Dec. [3] G. ISO/IEC 14496-2. L.30–44. “The JPEG still picture compression standard. ” IEEE Commu. Available: http: //www. R. com/loco. vol. K. “Embedded image coding using zerotrees of wavelet coefficients. [5] ISO/IEC. Information Technology — Lossless and Near-Lossless Compression of Continuous-Tone Still Images. [10] ITU Telecommunication Standardization Sector of ITU. NguyÔn H÷u Ph¸t 120 .2000. pp. pp.34. T. Shapiro. [6] M. G. New York: Van Nostrand Reinhold.21–22. [8] ISO/IEC. [7] ISO/IEC. vol. 1995. ISO/IEC 14495-1.87. hpl. Video Codec for Audiovisual Services at p × 64 kbits/sec. Wallace. Weinberger. Image Processing.5 Mbps. Mag. ITU Recommend. ” IEEE Trans. and G.§å ¸n cao häc §TVT 2003 TµI LIÖU THAM KH¶O [1] M. P. ” IEEE Trans. vol. Information Technology — Coding of Audio-Visual Objects — Part 2: Visual. ITU-T Recommendation H.

vol.. ” in Proc. Image Processing.11. “Embedded image coding using zeroblocks of subband/wavelet coefficients and context modeling. [16] W. [18] S. May 2000.Speical Issue on Streaming Video. ” in Packet Video Workshop.2000. on Circuits and Systems. version 1. “Embedded Video coding using motion compensated 3-D subband/wavelet filter bank. vol. “Embedded image coding using zeroblocks of subband/wavelet coefficients and context modeling.1158 –1170. vol. Circuits and Syst. ITU-T Recommendation H. -T.9. for Video Technol. (Sardinia. [17] S. Woods. pp.1996. Mar. Li. “High performance scalable image compression with EBCOT. Taubman. Hsiang and J. of IEEE In tSymp. [14] D. W. Mar. (Snowbird.2.263. [19] S. ” in Proc. Inc. Woods. Video Coding for Low Bitrate Communication. July 2000. pp.263 Version 2. ”IEEE Trans. Flashpix Format Specification. (Geneva). Italy). May 2000. Jan. -T. July 1993.1993.3. Hsiang. [13] Digital Imaging Group. ISO/IEC JTC1/SC 29/WG N1646.0.§å ¸n cao häc §TVT 2003 [11] ITU Telecommunication Standardization Sector of ITU.2001 IEEE Data Compression Conference. Hsiang and J. ITU-T Recommendation H. Video Coding for Low Bitrate Communication.-T. Utah). [12] ITU Telecommunication Standardization Sector of ITU.301– 317. “Overview of fine granularity scalability in MPEG-4 Video standard” IEEE Trans. Mar.662–665. pp.2001. NguyÔn H÷u Ph¸t 121 .2001. [15] ISO/IEC. Mar. W. ISO/IEC FCD 15444-1: Information Technology — JPEG 2000 image coding system: Core coding system.

§å ¸n cao häc §TVT 2003 PHô LôC THUËT NG÷ tiÕng anh 3-D AGP APSG CREW CSF DCT DFD DPCM DVR DWT EBCOT EZBC EZW FGS GOP HDTV HVS HVSBM IMCTF JND JPEG three .dimensional alphabet and group partitioning alphabet partitioning and sample grouping Compression with Reversible Embedded Wavelets contrast sensitivity function discrete cosine transform displaced frame difference differential pulse code modulation display visual resolution discrete wavelet transform Embedded Block Coding with Optimal Truncation Embedded ZeroBlock Coding and context modeling Embedded image coding using Zerotrees of Wavelet coefficients fine granularity scalability group of pictures high definition television human visual system hierarchical variable size block matching invertible motion compensated temporal subband/wavelet filtering system just noticeable distortion Joint Photographic Experts Group NguyÔn H÷u Ph¸t 122 .

§å ¸n cao häc §TVT 2003 LSB LZC MC MND MPEG MSB MSE PCM PSF PSNR R-D RBDWT ROI RWT SA-DCT SAQ SNR SPIHT UTQ VO VOP WMSE bpp bps cpd ppd ppi least significant bit Layered Zero Coding motion compensated/compensation minimally noticeable distortion Moving Picture Experts Group most significant bit mean square error pulse code modulation point spread function peak signal-to-noise ratio rate-distortion region-based discrete wavelet transform region Of interest reversible wavelet transform shape adaptive discrete cosine transform successive approximation quantization signal-to-noise ratio Set-Partitioning In Hierarchical Trees uniform threshold quantization/quantizer Video object Video object plane weighted mean square error bits per pixel bits per second cycles per degree pixels per degree pixels per inch NguyÔn H÷u Ph¸t 123 .

Sign up to vote on this title
UsefulNot useful