Professional Documents
Culture Documents
Haar
Haar
Hình 1: Người trên xe buýt - Phụ nữ trên xe buýt - Phụ nữ trẻ trên xe buýt - Rosa Parks trên xe buýt
Dr. Colm Mulcahy là Giáo sư Khoa học toán tại Trường Đại học Spelman, nơi ông đã giảng dạy từ năm
1988. Trong những năm gần đây, sở thích toán học của ông đã mở rộng để bao gồm các vấn đề liên
quan đến tính toán và hình ảnh, chẳng hạn như thiết kế hình học hỗ trợ máy tính (CAGD), đồ họa máy
tính, xử lý hình ảnh và sóng con, và ông đã hướng dẫn nghiên cứu sinh viên cấp đại học về tất cả các
chủ đề này.
22/ Spelman Science and Math Journal: Tạp chí Khoa học và Toán học của Trường
Đại học Spelman.
Có hai quan sát đáng chú ý ở đây. Đầu tiên, có những tình huống dưới đó, bất kỳ một trong những sự
gần đúng này đều đủ cho mục đích ngay lập tức của chúng ta. Ví dụ, nếu nhìn từ khoảng cách đủ xa,
tất cả chúng trông giống nhau. Do đó, nếu một trong chúng được sử dụng để tạo thành một phần nhỏ
của một bức tranh lớn hơn nhiều, ví dụ như một bức ảnh trên bếp hoặc một hình ảnh ngắn trong một
video, không cần phải hiển thị phiên bản chất lượng cao.
Thứ hai, việc truyền tải liên tục một chuỗi các sự gần đúng ngày càng tốt đẹp đến "bức tranh thực sự"
là tự nhiên: đó là cách nhiều người trong chúng ta truyền đạt thông tin và học về các chủ đề mới. Đây
cũng là cách trình duyệt Netscape World Wide Web phổ biến cung cấp hình ảnh cho người dùng web:
khi chúng ta gọi một URL (địa chỉ WWW) chứa một hình ảnh, hình ảnh đó xuất hiện dưới dạng các
phần, bắt đầu từ sự gần đúng và tiến đến hình ảnh hoàn chỉnh cuối cùng. Tất cả các hình thức truyền
thông thông tin liên tục đều có một lợi ích chính: người nhận có thể dừng quá trình và chuyển sang
việc khác nếu cô quyết định, dựa trên thông tin ban đầu, rằng cô không muốn "bức tranh đầy đủ".
Điều này cũng áp dụng cho việc tìm hiểu về một ứng cử viên trong cuộc bầu cử, lắng nghe người kể lại
kinh nghiệm du lịch của họ hoặc lấy một hình ảnh trên World Wide Web bằng cách sử dụng Netscape.
Sóng con cung cấp một cách toán học để mã hóa thông tin số học (dữ liệu) theo cách mà nó được lớp
trên cơ sở mức độ chi tiết. Cách lớp này không chỉ hỗ trợ truyền thông dữ liệu liên tục như đã đề cập
ở trên, mà còn bao gồm các sự gần đúng ở các giai đoạn trung gian khác nhau. Điểm quan trọng là
những sự gần đúng này có thể được lưu trữ bằng ít không gian hơn so với dữ liệu gốc, và trong các
tình huống có không gian hạn chế, nén dữ liệu này rất đáng giá.
Phần 2: Biến đổi sóng con
Trong phần này, chúng ta sẽ giới thiệu biến đổi sóng con đơn giản nhất, được gọi là biến đổi sóng con
Haar, và giải thích cách nó có thể được sử dụng để tạo ra các hình ảnh giống như ba hình ảnh đầu tiên
trong Hình 1, dựa trên hình ảnh cuối cùng và hoàn chỉnh của Rosa Parks (hình ảnh này được trích xuất
từ tệp .gif tải về từ World Wide Web.) Phần mềm số học và trực quan hóa Matlab đã được sử dụng để
thực hiện tất cả các tính toán và tạo ra và hiển thị tất cả các hình ảnh trong bài viết này.
Mỗi hình ảnh kỹ thuật số trong Hình 1 được biểu diễn toán học bằng một ma trận (mảng) 128 x 128
số, có giá trị từ 0 (đại diện cho màu đen) đến một số nguyên dương nào đó (đại diện cho màu trắng).
Hình ảnh cuối cùng sử dụng 32 = 25 sắc màu xám khác nhau và do đó được gọi là hình ảnh 5 bit. Các
số trong ma trận cụ thể mà chúng tôi sử dụng để biểu diễn hình ảnh này nằm trong khoảng từ 0 đến
1984, với khoảng cách 64 (các số cụ thể này không quan trọng; chúng được chọn để tránh số thập
phân trong các tính toán sau này).
Mỗi mục trong ma trận tạo ra một hình vuông nhỏ được tô màu xám đồng nhất dựa trên giá trị số học
của nó. Chúng tôi gọi những hình vuông nhỏ này là điểm ảnh; chúng trở nên rõ ràng hơn khi xem hình
ảnh ở một tỷ lệ lớn hơn, ví dụ như trong Hình 2(a). Khi có đủ số lượng chúng trong một vùng cụ thể
trên giấy, như trong hình ảnh 256 x 256 pixel 8-bit của Nelson Mandela trong Hình 2(b), chúng ta có
ấn tượng về một bức ảnh đang dần thay màu liên tục.
(Chúng tôi đã làm căng độ tương phản trong Hình 3(b) để làm nổi bật sự biến đổi tinh tế thường
xuyên giữa các cấp độ màu xám: giá trị nhỏ nhất và lớn nhất trong ma trận, 448 và 1600, được thể
hiện là màu đen và màu trắng, tương ứng, điều này không phải là cách chúng xuất hiện trong Hình
2(a).)
Để minh họa cách biến đổi sóng con cho một ma trận như vậy, chúng tôi trước tiên mô tả một
phương pháp để biến đổi chuỗi dữ liệu, gọi là phép trung bình và phép chênh lệch. Sau đó, chúng tôi
sẽ sử dụng kỹ thuật này để biến đổi một ma trận toàn bộ như sau: Xem xét mỗi hàng như một chuỗi
dữ liệu và thực hiện phép trung bình và phép chênh lệch trên mỗi hàng để có được một ma trận mới,
sau đó áp dụng chính xác các bước giống nhau trên mỗi cột của ma trận mới này, cuối cùng có được
một ma trận được biến đổi theo hàng và cột.
Để hiểu rõ phép trung bình và phép chênh lệch làm gì với một chuỗi dữ liệu, ví dụ như hàng đầu tiên
trong ma trận P ở trên, xem xét bảng dưới đây. Các hàng liên tiếp của bảng hiển thị kết quả ban đầu,
trung gian và cuối cùng.