Professional Documents
Culture Documents
- Khái niệm:
Dữ liệu đa phương tiện là nhứng gì có thể nghe nhìn và thấy.
VD: Băng đĩa từ,….
Nội dung, cơ sở hình ảnh.
- Nội Dung:
Lý thuyết cơ sử nén hình ảnh.
Mã Hóa Vid.
Mã hóa Audio.
Thiết bị Đa phương tiện.
Mạng Multimedia.
I. Mở đầu
- Ảnh là 1 ma trận được tập hợp bởi nhiều điểm ảnh, mỗi điểm ảnh
được lưu trữ dưới dạng số hoặc phát tín hiệu liên tục.
- Trong trương hợp ảnh lưu dưới dạng số, ta có ảnh nhị phân, ảnh
xám hoặc ảnh màu.
Trương hợp ảnh nhị phân: 1 điểm ảnh được lưu trữ bởi 1 bit.
Trường hợp ảnh xám: 1 điểm ảnh có thể lưu trữ bới 2, 4 bit,…
Trường hợp ảnh mảu: Có thể lưu trữ 1 byte, 2 byte hoặc 3
byte.
- Khi ảnh lưu trữ bởi 3 byte được gọi là R, G, B.
-
- Y chói là thành phần trói, đây là thành phần quan trọng nhất, nó thể
hiện độ sáng của điểm ảnh.
- CrCb là 2 thành phần màu: thể hiện màu sắc của điểm ảnh.
- Với mỗi 1 khung hình ta có 1 ma trận điểm ảnh được đặc trưng bởi
các thông số sau:
Buổi 2:
- Để loại bỏ sự dư thừa về mặt không gian người ta thực hiện biến đổi
ảnh nhằm loại bỏ các điểm ảnh giống nhau.
- Dữ liệu ảnh sau khi đc biến đổi DCT sẽ được lượng tử hóa dựa trên
bảng lượng tử theo CT:
Fq[u,vư = Round (F[u,v]/q[u,v])
- Tùy vào thành phần chói hay màu mà bảng lượng tử khác nhau.
- Hai bang lượng tử chói và màu:
- Tín hiệu sau khi đc lượng tử sẽ được biến đổi zig zag. Ở đây dữ liệu
đc mã hóa, sử dụng mã theo chiều dài và mã entrophy.
- Dữ liệu ảnh ban đầu có dạng R,G,B trong đó mỗi thành phần được
lữu trữ thành 1 bang, dữ liệu này được chyển thành YcrCb, trong đó
Y là thành phần chói, CrCb là thành phần màu.
- Đây là các ma trận điểm ảnh, các ma trận này được chia thành các
khối 8x8, các khối này sau khi đc biến đổi thành DCT sẽ được lượng
tử hóa dựa trên bảng lượng tử.
- Để tăng hiệu quả dữ liệu này được biến đổi zig zag nhằm chia thành
DC và AC.
- Thành phần tầm thấp được đưa qua bộ điều xung mã vi phân DPCM,
thành phần tầm cao được đưa qua bộ mã hóa theo chiều dài RLC.
- Cả 2 thành phần này sau đó được đưa qua bộ mã hóa entrophy,
Huffman coding is used.
- Bộ bảng lượng tử sẽ được lưu trữ thành file JPEG.
- Về nguyên tắc người ta thường sử dụng không gian màu, do vậy cần
có sự chuyển đổi giữa các ko gian màu này.
-
Buổi 3:
- Audio hay là âm thanh thường có dạng tín hiệu tương tự, để lưu trữ
người ta chuyển sang dạng số. Quá trình chuyển âm thanh từ tín
hiệu sang số được gọi là số hóa tín hiệu.
- Quá trình này gồm các bước sau:
B1: Được gọi là bước lấy mẫu.
B2: Là bước lượng tử hóa.
B3: Là bước mã hóa.
- Để mã hóa âm thanh người ta có thể sử dụng nhiều thuật toán khác
nhau. Như sử dụng mã hóa Entropy, mã nhị phân, mã LPC,….
- Hệ số nén được đánh giá bằng: “kích thước dữ liệu sau khi nén/ kích
thước dữ liệu ban đầu”.
- Trong B1 là bước lấy mẫu, để đảm bảo có thể khôi phục tín hiệu thì
cần tuân theo định lý Nyquest.
- Định lý phát biểu như sau: 1 tín hiệu có phổ tần số xác định tại tần số
lớn nhất là fc thì hoàn toàn có thể được lấy mẫu với các mẫu cách
nhau 1 khoảng deta (t) <= 1/(2fc).
- Quá trình lấy mẫu thực chất là quá trình rời rạc hóa dữ liệu:
- Như đã thấy trên hình quá trình lấy mẫu là quá trình chuyển x(t) ->
x(n deta t).
- Do đó trong bước này ta thực hiện 2 bước nhỏ:
B1: Xác định số mẫu cần lấy.
N = T/(deta(t)).
T: Chu kỳ tín hiệu.
Deta t: khoảng cách giữa các mẫu – Deta (t) = 1/2fc.
Trong đó fc là tần số phổ lớn nhất.
B2: Tính các giá trị mẫu x(k. deta(t)) với k= 0 – N-1.
Lượng tử hóa là quá trình chuyển giá trị từ B1 về dạng số
nguyên. Có 2 kiểu lượng tử:
Lượng tử hóa đều – là quá trình chuyển tín hiệu sang
dạng số nguyên, nghĩa là thay thế x(k. deta(t)) ->
x(k)=x(kdeta(t))/deta(x), sau đó làm tròn. Deta x được gọi
là bước lượng tử.
Lượng tử hóa không đều.
Trong TH lượng tử hóa ko đều thì tuân theo luật Q với
luật A, với lượng tử hóa không đều thì bước lượng tử
thay đổi so với giá trị được lượng tử.
B3: Mã hóa – Cần chuẩn hóa tin hiệu – Xác định x(k) min –
Thay thế x'(k)=x(k)+|x(k)min|. Mục đích bước này là chuyển hết
các giá trị âm -> dương, các giá trị này được mã hóa từ hệ thập
phân sang hệ nhị phân.
Buổi 4:
Buổi 5: