You are on page 1of 16

Đa Phương Tiện

- Khái niệm:
 Dữ liệu đa phương tiện là nhứng gì có thể nghe nhìn và thấy.
 VD: Băng đĩa từ,….
 Nội dung, cơ sở hình ảnh.
- Nội Dung:
 Lý thuyết cơ sử nén hình ảnh.
 Mã Hóa Vid.
 Mã hóa Audio.
 Thiết bị Đa phương tiện.
 Mạng Multimedia.
I. Mở đầu
- Ảnh là 1 ma trận được tập hợp bởi nhiều điểm ảnh, mỗi điểm ảnh
được lưu trữ dưới dạng số hoặc phát tín hiệu liên tục.
- Trong trương hợp ảnh lưu dưới dạng số, ta có ảnh nhị phân, ảnh
xám hoặc ảnh màu.
 Trương hợp ảnh nhị phân: 1 điểm ảnh được lưu trữ bởi 1 bit.
 Trường hợp ảnh xám: 1 điểm ảnh có thể lưu trữ bới 2, 4 bit,…
 Trường hợp ảnh mảu: Có thể lưu trữ 1 byte, 2 byte hoặc 3
byte.
- Khi ảnh lưu trữ bởi 3 byte được gọi là R, G, B.
-

- Y chói là thành phần trói, đây là thành phần quan trọng nhất, nó thể
hiện độ sáng của điểm ảnh.

- CrCb là 2 thành phần màu: thể hiện màu sắc của điểm ảnh.

- Với mỗi 1 khung hình ta có 1 ma trận điểm ảnh được đặc trưng bởi
các thông số sau:

 Chiều rộng của ảnh (Width).


 Chiều cao của ảnh (Heigth).
 Độ sâu của ảnh (Depth): là số Bit trên 1 điểm ảnh.
- Với 1 chuỗi Vid ta có thông số là FPS số khung hình trên 1s.
- Để giảm kích thước lữu trữ cần nén ảnh và video
- Có 2 loại khung hình:
 Inter – frame: Khung hình ngoại.
 Intra – frame: Khung hình nội.
- Với Khung hình nội để giảm kích thước người ta phải nén giữ liệu
hay dựa trên sự tương quan giữa các điểm ảnh về mặt không gian
và thời gian.

Buổi 2:

- Để loại bỏ sự dư thừa về mặt không gian người ta thực hiện biến đổi
ảnh nhằm loại bỏ các điểm ảnh giống nhau.
- Dữ liệu ảnh sau khi đc biến đổi DCT sẽ được lượng tử hóa dựa trên
bảng lượng tử theo CT:
 Fq[u,vư = Round (F[u,v]/q[u,v])
- Tùy vào thành phần chói hay màu mà bảng lượng tử khác nhau.
- Hai bang lượng tử chói và màu:

- Tín hiệu sau khi đc lượng tử sẽ được biến đổi zig zag. Ở đây dữ liệu
đc mã hóa, sử dụng mã theo chiều dài và mã entrophy.
- Dữ liệu ảnh ban đầu có dạng R,G,B trong đó mỗi thành phần được
lữu trữ thành 1 bang, dữ liệu này được chyển thành YcrCb, trong đó
Y là thành phần chói, CrCb là thành phần màu.
- Đây là các ma trận điểm ảnh, các ma trận này được chia thành các
khối 8x8, các khối này sau khi đc biến đổi thành DCT sẽ được lượng
tử hóa dựa trên bảng lượng tử.
- Để tăng hiệu quả dữ liệu này được biến đổi zig zag nhằm chia thành
DC và AC.
- Thành phần tầm thấp được đưa qua bộ điều xung mã vi phân DPCM,
thành phần tầm cao được đưa qua bộ mã hóa theo chiều dài RLC.
- Cả 2 thành phần này sau đó được đưa qua bộ mã hóa entrophy,
Huffman coding is used.
- Bộ bảng lượng tử sẽ được lưu trữ thành file JPEG.
- Về nguyên tắc người ta thường sử dụng không gian màu, do vậy cần
có sự chuyển đổi giữa các ko gian màu này.
-

- Quan hệ giữa ko gian Y U B qua biểu thức


-
- Với các hệ màu khác nhau sẽ có các độ phân giải khác nhau.

Buổi 3:
- Audio hay là âm thanh thường có dạng tín hiệu tương tự, để lưu trữ
người ta chuyển sang dạng số. Quá trình chuyển âm thanh từ tín
hiệu sang số được gọi là số hóa tín hiệu.
- Quá trình này gồm các bước sau:
 B1: Được gọi là bước lấy mẫu.
 B2: Là bước lượng tử hóa.
 B3: Là bước mã hóa.
- Để mã hóa âm thanh người ta có thể sử dụng nhiều thuật toán khác
nhau. Như sử dụng mã hóa Entropy, mã nhị phân, mã LPC,….
- Hệ số nén được đánh giá bằng: “kích thước dữ liệu sau khi nén/ kích
thước dữ liệu ban đầu”.
- Trong B1 là bước lấy mẫu, để đảm bảo có thể khôi phục tín hiệu thì
cần tuân theo định lý Nyquest.
- Định lý phát biểu như sau: 1 tín hiệu có phổ tần số xác định tại tần số
lớn nhất là fc thì hoàn toàn có thể được lấy mẫu với các mẫu cách
nhau 1 khoảng deta (t) <= 1/(2fc).
- Quá trình lấy mẫu thực chất là quá trình rời rạc hóa dữ liệu:
- Như đã thấy trên hình quá trình lấy mẫu là quá trình chuyển x(t) ->
x(n deta t).
- Do đó trong bước này ta thực hiện 2 bước nhỏ:
 B1: Xác định số mẫu cần lấy.
N = T/(deta(t)).
T: Chu kỳ tín hiệu.
Deta t: khoảng cách giữa các mẫu – Deta (t) = 1/2fc.
Trong đó fc là tần số phổ lớn nhất.
 B2: Tính các giá trị mẫu x(k. deta(t)) với k= 0 – N-1.
 Lượng tử hóa là quá trình chuyển giá trị từ B1 về dạng số
nguyên. Có 2 kiểu lượng tử:
 Lượng tử hóa đều – là quá trình chuyển tín hiệu sang
dạng số nguyên, nghĩa là thay thế x(k. deta(t)) ->
x(k)=x(kdeta(t))/deta(x), sau đó làm tròn. Deta x được gọi
là bước lượng tử.
 Lượng tử hóa không đều.
 Trong TH lượng tử hóa ko đều thì tuân theo luật Q với
luật A, với lượng tử hóa không đều thì bước lượng tử
thay đổi so với giá trị được lượng tử.
 B3: Mã hóa – Cần chuẩn hóa tin hiệu – Xác định x(k) min –
Thay thế x'(k)=x(k)+|x(k)min|. Mục đích bước này là chuyển hết
các giá trị âm -> dương, các giá trị này được mã hóa từ hệ thập
phân sang hệ nhị phân.

Buổi 4:

4. Chuẩn nén Video:


- Với nén Video có 2 loại khung hình:
 Intra – frame: Hay còn gọi là khung hình nội là khung hình chỉ
chứa thông tin về bản thân nó mà ko có thông tin nào khác. Với
khung hình này khi lưu trữ người ta thường nén theo chuẩn
JPEG nhằm loại bỏ dư thừa về mặt không gian.
 Inter – frame: Là khung hình ngoại làm khung hình ngoài thông
tin về bản thân nó còn có thông tin của các khung hình khác,
với khung hình này khi nén người ta quan tâm đến giảm độ dư
thừa về mặt không gian và thời gian.
 Dư thừa về mặt không gian chính là sự giống nhau về
các điểm ảnh lân cận.
 Dư thừa về mặt thời gian là sự giống nhau về các khung
hình liên tiếp.
- Để khai thác hay thực hiện nén các khung hình nhằm giảm dư thừa
về mặt không gian và thời gian. Trong quá trình thực hiện người ta
làm như sau:
 Intra – frame:
 B1: Chia thành các block (8x8).
 B2: Thực hiện mã hóa cho các block dựa trên các bảng
lượng tử.
 Inter – frame: Vì khai thác sự dư thừa cả không gian và thời
gian thì quá trình mã hóa như sau:
 B1: Chia frame thành các khối nhỏ với kích thước khác
nhau.
 B2: Xác định phần sai khác giữa các khung hình, phần
này gọi là phần bù chuyển động.
 B3: Xác định các vector chuyển động, phần này gọi là
đánh giá chuyển động.
 B4: Thực hiện mã hóa các khối này nhằm giảm dư thừa
về mặt không gian và thời gian.
- Để đánh giá chuyển động có 3 phương pháp, đánh giá chuyển động
là tìm vector chuyển động. Để tìm vector chuyển động như sau:
 B1: Xác định đối tượng chuyển động ơ khung hình hiện thời và
khung hình sau hoặc trước đó.
 B2: Thực hiện tìm đối tượng chuyển động trong khung hình
tham chiếu (Reference frame).
 B3: Tính toán sự sai khác giữa đối tượng khung hiện tại và
tham chiếu. Nếu sự sai khác bằng 1 ngưỡng nào đó ta sẽ coi
đây là vector chuyển động.
- Để xác định vector chuyển động ta thực hiện 3 bước như trên hình.
- Để đánh giá sự sai khác hoặc tìm vecto chuyển động người ta dựa
trên hệ số MAD hoặc MSE.
- N có thể là 4, 6, 18, 32.
- Cij là giá trị điểm ảnh tại khung hình hiện tại, Rij là giá trị điểm ảnh tại
khung hình tiếp đó.
- Để xác định vecto chuyển động người ta có 2 cách:
 C1: Quét toàn bộ khung hình (full search).
 C2: Quét nhanh (fast search).
a. Full search.
- Đối tượng được kiểm tra trong toàn bộ khung hình. Quá trình thực
hiện:
 B1: Xác định đối tượng trong khung hình hiện tại.
 B2: Cho đối tượng trượt trong toàn bộ khung hình tham chiếu
cho đến khi đạt được giá trị MAD min.
 B3: Xác định vị trí có giá trị MAD nhỏ nhất, đó là vecto chuyển
động.
- Với phương pháp full search khi tìm kiếm toàn bộ cửa sổ với ưu
điểm là thực hiện rất nhanh, nhược điểm là rất tốn tài nguyên và bộ
nhớ. Người ta đề cập đến phương pháp fast search để giải quyết.

Buổi 5:

- Có 2 chuẩn nén video:


 ITU – T: H – 26L (H261, H262, H263).
 ISO: gọi là MPEG – X.
- Trong chuẩn MPEG ta có: MPEG 1,2,4.
 Trong đó chuẩn MPEG 1 tốc độ bit là 1,5 mbps, định dạng
khung hình theo CIF (352x288), tốc độ quét là 24 – 30 fps,
được ứng dụng trong lưu trữ vid.
 MPEG 2: là phiên bản tiếp của MPEG 1, dùng trong các hệ
thống có fps cao: NTSC (704x480). Tốc độ 4 – 8 mbps, đối với
HD TV có thể lên 20 mbps.
 MPEG 4: là phiên bản tiếp của MPEG 2, mục đích hướng tới
mã hóa đối tượng, tỷ lệ nén cao, lỗi bit thấp.
- Chuẩn H. 261: Đây là chuẩn đầu tiên của mã hóa vid, nó có thể được
dùng cho mã hóa số thích hợp, hội thảo, định dạng khung hình có thể
là CF hoặc QCIF.
- Tốc độ quét hình từ 7.5 – 30 fps

You might also like