You are on page 1of 11

ĐẠI HỌC QUỐC GIA TP.

HỒ CHÍ MINH
TRƯỜNG ĐẠI HỌC BÁCH KHOA

BÁO CÁO BÀI TẬP LỚN


MÔN: ĐẠI SỐ TUYẾN TÍNH

GVHD: ThS. Nguyễn Xuân Mỹ


SVTH:
Đinh Văn Linh 1812806
Nguyễn Trương Hoàng Minh 2114064
Nguyễn Châu Long 2111666
Nguyên Lê Khánh Minh 2114058
Lý Minh Luân 2111701
Tống Phước Hoàng Minh 2111764
Nguyễn Vương Long 1911520

TP. HỒ CHÍ MINH, 3/2022


ĐẠI HỌC QUỐC GIA TP. HỒ CHÍ MINH
TRƯỜNG ĐẠI HỌC BÁCH KHOA

BÁO CÁO BÀI TẬP LỚN


MÔN: ĐẠI SỐ TUYẾN TÍNH

GVHD: ThS. Nguyễn Xuân Mỹ


SVTH:
Đinh Văn Linh 1812806
Nguyễn Trương Hoàng Minh 2114064
Nguyễn Châu Long 2111666
Nguyên Lê Khánh Minh 2114058
Lý Minh Luân 2111701
Tống Phước Hoàng Minh 2111764
Nguyễn Vương Long 1911520

TP. HỒ CHÍ MINH, 3/2022


MỤC LỤC

MỤC LỤC........................................................................................................................i
CHƯƠNG 1 CƠ SỞ LÝ THUYẾT...........................................................................1
1.1 Phương pháp phân tích trị riêng.........................................................................1
1.2 Cách tìm ma trận S, U, V...................................................................................1
CHƯƠNG 2 VÍ DỤ...................................................................................................3
CHƯƠNG 3 ỨNG DỤNG PHÂN TÍCH SVD ĐỂ NÉN DỮ LIỆU........................5
3.1 Ứng dụng phân tích SVD để nén ảnh số............................................................5
3.2 Nội dung code....................................................................................................6
3.3 Giải thích code...................................................................................................7

i
CHƯƠNG 1 CƠ SỞ LÝ THUYẾT

1.1 Phương pháp phân tích trị riêng

Phương pháp phân tích trị riêng (SVD – Singular Value Decomposition) là một đề tài
rất được quan tâm của đại số tuyến tính. Phương pháp này có nhiều ứng dụng thực tế,
một trong số đó là ứng dụng trong kỹ thuật nén ảnh. Đặc điểm quan trọng của phương
pháp này là nó có thể áp dụng cho bất kỳ ma trận thực mxn nào. Nội dung của nó là:
phân tích một ma trận A cho trước thành 3 ma trận U, S, V, sao cho

A = USVT (1)

trong đó U và V là các ma trận trực giao và S là ma trận đường chéo. Ma trận U là ma


trận gồm các vector riêng trái của A, ma trận V là ma trận gồm các vector riêng phải
của A và ma trận S là ma trận đường chéo, mỗi phần tử đường chéo là một trị riêng
của A. Các trị riêng được sắp trên đường chéo chính theo thứ tự sau:

s1 > s2 > ... > sr > sr+1 = ... = sp = 0

với r là hạng của ma trận A và p = min{m,n}.

1.2 Cách tìm ma trận S, U, V

Để tìm các ma trận S, U, V, ta thực hiện các bước như sau:


Bước 1: Tìm ma trận V. Nhân AT vào hai vế của (1), ta có:
AT.A = (USVT )T USVT = V.ST .UT .U.S.VT
= V.ST .S.VT
= V.S2.VT
Do UT.U=I. Như vậy, để tìm ma trận S và V, ta chỉ cần tìm các trị riêng và các vector
riêng của AT.A vì từ (1) ta thấy các trị riêng của AT.A chính là bình phương các phần
tử của S còn các vector riêng của AT.A chính là các cột của V.
Bước 2: Tìm ma trận U. Nhân hai về của (1) với AT và sử dụng: VTV = I
ta cũng có :
AAT = U.S2 .UT

1
Vậy các cột của U chính là các vector riêng của A.AT. Cuối cùng, ta phân tích ma trận A dưới
dạng như sau:

[]
T
V1

A=(u1 … ur … um) [ σ1 ¿ ¿
¿… ¿ ¿
¿ σ 1 ¿¿¿¿¿ ¿ …¿¿¿¿¿ ¿ 0¿ ] T
Vr

T
Vn

A và S là các ma trận kích thước mxn, U là ma trận mxm và V là ma trận nxn.

2
CHƯƠNG 2 VÍ DỤ

(3
Chọn ma trận A= 2 3 −2
2 2
)
Đầu tiên tính các giá trị đơn lẻ σ i bằng cách tìm các giá trị riêng của A AT

T
(
17 8
AA = 9 17 )
Đa thức đặc trưng là det( AA T - λ I ) = λ 2−34 λ+ 225=(λ−25)(λ−9)
Vì vậy các giá trị đơn lẻ là σ 1 = √ 25=5 và σ 2=√ 9=3
Bây giờ chúng ta tìm đúng vector đơn lẻ ( các cột của V) bằng cách tìm một trực
chuẩn của các vector riêng của AT A . Nó có thể tiếp tục bằng cách tìm các vector đơn
lẻ bên trái ( cột của U) thay vào đó. Các giá trị riêng của AT A là 25, 9, 0, và kể từ khi
A A đối xứng thì các vector đơn lẻ sẽ trực giao.
T

Đối với λ=25 ta có:

( )
−12 12 2
T
A A−25 I = 12 −12 −2
2 −2 −17

( )
1 −1 0
Hàng giảm xuống bằng 0 0 1 . Một vector độ dài đơn vị trong nhân của ma trận
0 0 0
đó là

( )
1/ √ 2
v 1= 1/ √ 2
0

Đối với λ=9 ta có:

( ) ( )
4 12 2 1 0 −1/4
T
A A−9 I = 12 4 −2 hàng giảm xuống bằng 0 1 1/4 .
2 −2 −1 0 0 0

3
( )
1 / √18
v
Một vector độ dài đơn vị trong nhân của ma trận đó là 2 = −1 / √18 .
4 / √ 18

Đối với vector đơn lẻ cuối cùng chúng ta có thể tính toán hạt nhân của AT A hoặc tìm

()
a
v v v =
một vector đơn vị vuông góc với 1và 2. Để vuông góc với 1 b chúng ta cần −a=b
c
, điều kiện sau đó là

( )
a
v 2 v 3=0 trở thành 2 a/ √ 18+ 4 c / √ 18=0 hoặc−a=2 c . vì vậy v 3= −a và để nó là một
T

−a/2

( )
2/3
chiều dài đơn vị chúng ta cần a=2/3 v
chính vì vậy 3 = −2/3 .
−1/3

Vì vậy tại thời điểm này chúng ta biết rằng

( )
1/ √ 2 1/ √ 2 0
A=U Σ V =U
T
( 5 0 0
0 3 0 )
1/ √ 18 −1/ √ 18 4 / √ 18
2/3 −2 /3 −1/3
1
Cuối cùng chúng ta có thể tính U theo công thức σ ui =A v i hoặc ui= A v i. Dẫn đến
σ

( )
U = 1/ √ 2 1 / √2 . Vì vậy SVD của ma trận A là:
1/ √ 2 −1 / √2

( )
1/ √ 2 1/ √ 2 0
A=U Σ V = (
1/ √ 2 1/ √ 2 5 0 0
T

1/ √ 2 −1/ √ 2 0 3 0 )( )
1/ √ 18 −1/ √ 18 4 / √ 18
2/3 −2 /3 −1/3

4
CHƯƠNG 3 ỨNG DỤNG PHÂN TÍCH SVD ĐỂ NÉN DỮ LIỆU

3.1 Ứng dụng phân tích SVD để nén ảnh số

Mục đích của việc nén ảnh số là mã hoá các dữ liệu ảnh về một dạng thu gọn, tối thiểu
hoá cả số bit dùng để biểu diễn ảnh lẫn các sai khác do quá trình nén gây ra. Tầm quan
trọng của vấn đề nén ảnh có thể thấy rõ qua các số liệu cụ thể: với một bức ảnh trắng
đen kích thước 512x512 pixels, mỗi pixel được biểu diễn bởi 8 bits (biểu diễn một
trong 256 giá trị mức xám), cần khoảng 256 Kbytes dữ liệu. Với ảnh màu cần gấp ba
lần con số này. Với các dữ liệu video, cần 25 khung hình trên một giây, như vậy một
đoạn video chỉ 30s phải cần đến 540MB dữ liệu, một con số quá lớn. Do đó vấn đề nén
ảnh là hết sức cần thiết.

Nói chung, các phương pháp nén ảnh chủ yếu được phân thành 2 nhóm: nhóm không
tổn hao và nhóm có tổn hao. Các phương pháp nén ảnh không tổn hao cho phép biểu
diễn ảnh với chất lượng hoàn toàn ngang bằng với ảnh gốc. Các phương pháp này dựa
trên các giải thuật nén được áp dụng cho tất cả các đối tượng dữ liệu nói chung chứ
không chỉ riêng dữ liệu ảnh, ví dụ mã Huffman, mã số học, mã Golomb, ... Tuy nhiên,
các phương pháp này không lợi dụng được những đặc tính riêng của dữ liệu ảnh và tỷ
lệ nén rất thấp. Do đó, trong thực tế, các phương pháp nén có tổn hao là các phương
pháp được sử dụng chủ yếu. Với các phương pháp này, luôn có sự đánh đổi giữa dung
lượng ảnh với chất lượng ảnh.

Bằng cách phân tích ma trận ảnh A dưới dạng A=USV T , ta có thể biểu diễn xấp xỉ ma
trận A bằng ít phần tử hơn. Nếu hạng của ma trận A là r<m hoặc r<n, ta có thể giảm đi
những thông tin thừa:

A=s1u1vT1 + s2u2vT2 + … + srurvTr + sr+1ur+1vTr+1 + … (2)

Hơn nữa, các trị riêng được sắp xếp theo thứ tự giảm dần, do đó những số hạng phía
sau sẽ có ít ảnh hưởng đến ảnh và có thể bỏ đi các số hạng này.

MATLAB có hàm svd để thực hiện nhân tử hoá ma trận A thành USVT

5
>> [U,S,V] = svd(A)

Chúng ta có thể sử dụng hàm này kết hợp với phương trình (2) để viết một hàm nén
ảnh dùng giải thuật SVD. Ví dụ hàm svdcompr. Cú pháp của nó là:

>> im = svdcompr (infile,singvals,outfile)

trong đó infile và outfile là tên các file ảnh gốc và ảnh nén, singvals là số các trị riêng
lớn nhất được giữ lại.

3.2 Nội dung code


close all
clear all
clc

%doc va chuyen doi hinh anh


inImage=imread('Hinh_anh.jpg');
inImage=rgb2gray(inImage);
inImageD=double(inImage);

% phan tich hinh anh vua roi bang SVD


[U,S,V]=svd(inImageD);

% Su dung cac he so k khac nhau de


% nen anh
dispEr = [];
numSVals = [];
for N=5:25:300
% Luu cac gia tri singular values vao mot bien C
C = S;

% Bo cac gia tri k khong can thiet de nen anh


C(N+1:end,:)=0;
C(:,N+1:end)=0;

% Tao lai anh moi su dung gia tri k moi


D=U*C*V';

% bieu dien hinh anh va tinh toan loi sai


figure;
buffer = sprintf('Anh nen sau khi su dung %d gia tri singular
values', N)
imshow(uint8(D));
title(buffer);

% luu cac gia tri de bieu dien len do thi


error=sum(sum((inImageD-D).^2));
dispEr = [dispEr; error];

6
numSVals = [numSVals; N];
end

% bieu dien do thi


figure;
title('Khac biet khi nen');
plot(numSVals, dispEr);
grid on
xlabel('So gia tri Singular Values su dung');
ylabel('Su khac biet giua anh ban dau va sau khi nen');

3.3 Giải thích code

Các câu lệnh trong thuật toán được sử dụng như sau:

- close all: đóng tất cả các đồ thị.

- clear all: xóa tất cả các biến, hàm, khỏi bộ nhớ. Lệnh này làm cho bộ nhớ trống hoàn
toàn.

- clc: Xóa cửa sổ lệnh.

- imread: sẽ đọc một file thành một ma trận.

- rgb2gray: chuyển đổi hình ảnh RGB thành trắng đen bằng cách loại bỏ các thông tin
màu sắc và độ bão hòa nhưng vẫn giữ độ sáng.

- double: chuyển đổi sang số thập phân với độ chính xác kép.

- [U, S, V]=sdv(A): thực hiện phân rã giá trị đơn lẻ của ma trận A, sao cho A = U * S
* V '.

- figure: Tạo mới hình ảnh (đồ thị).

- sprintf: hiển thị thông tin lên màn hình.

- %d: đối số là số nguyên được viết dưới dạng thập phân.

- imshow: cho chúng ta một hình ảnh trong định dạng tiêu chuẩn là 8-bit, giống như
trong một trình duyệt web.

- sum: tính tổng.

- title: đặt tiêu đề cho đồ thị.

7
- plot (numSVals, dispEr): Vẽ đồ thị tuyến tính trong không gian 2 chiều. (vẽ giá trị
numSVals theo giá trị dispEr).

- grid on: hiển thị lưới tọa độ.

- xlable, ylable: đặt tên cho trục x,y.

You might also like