Ecit15proceedings 151211020048

HỘI VÔ TUYẾN ĐIỆN TỬ VIỆT NAM HỌC VIỆN CÔNG NGHỆ BƯU CHÍNH VIỄN THÔNG
Proceedings of The 2015 National Conference on Electronics, Communications and Information Technology
VỀ ĐIỆN TỬ, TRUYỀN THÔNG VÀ CÔNG NGHỆ THÔNG TIN
KỶ YẾU HỘI THẢO QUỐC GIA 2015
ECIT 2015
ECIT 2015
VỀ ĐIỆN TỬ, TRUYỀN THÔNG VỀ ĐIỆN TỬ, TRUYỀN THÔNG
VÀ CÔNG NGHỆ THÔNG TIN VÀ CÔNG NGHỆ THÔNG TIN
Proceedings of The 2015 National Conference Proceedings of The 2015 National Conference
on Electronics, Communications
and Information Technology on Electronics, Communications
and Information Technology
215166H00
ISBN: 978-604-67-0635-9 ECIT 2015
SÁCH KHÔNG BÁN NHÀ XUẤT BẢN KHOA HỌC VÀ KỸ THUẬT

về ĐIỆN TỬ, TRUYỀN THÔNG
và CÔNG NGHỆ THÔNG TIN
Proceedings of The 2015 National Conference

ECIT 2015
i
ii
iii
MỤC LỤC
Mục lục.......................................................................................................................................... iv
Lời chào mừng của Giám Đốc Học Viện.................................................................................... xi
Ban tổ chức hội thảo.................................................................................................................. xii
Ban chương trình....................................................................................................................... xiii
Danh sách các phản biện.......................................................................................................... xvi
Báo cáo mời 1: Quy hoạch tần số cho hệ thống thông tin di động thế hệ thứ 5 tại Việt Nam
Mr. Đoàn Quang Hoan, Cục Trưởng Cục Tần Số Vô Tuyến Điện,
Bộ Thông tin và Truyền thông, Việt Nam..................................................................................... xviii
Báo cáo mời 2: Enabling Technologies for Future Sustainable Optical Infrastructure
Dr. Tetsuya Miyazaki, Photonic Network Research Institute (PNRI),National Institute of
Information and Communications Technology (NICT)...................................................................xix
Báo cáo mời 3: Điều Chế Đa Sóng Mang Như Công Cụ Chống Nhiễu Nhân Tạo
(Multicarrier Modulation as Tool to Combat the Influence of Man-made Noise)
Prof.Huỳnh Hữu Tuệ,Technical Editor-in-Chief, REV Journal on Electronics and
Communications, Vietnam............................................................................................................. xx
Báo cáo mời của tiểu ban Truyền Thông và Mạng: Build Tomorrow’s 5G Systems Today
Mr. Phạm Ðăng Khoa, Kỹ sư ứng dụng, National Instruments...................................................xxii
Hiệu quả sử dụng năng lượng của đường xuống trong hệ thống thông tin MIMO
với rất nhiều ăngten ở trạm gốc
Lương Đức Bằng, Nguyễn Thị Thanh Hương, Trương Trung Kiên................................................. 1
Giải pháp ánh xạ thích nghi cho hệ thống OFDM bằng mã BICM-ID với các bộ ánh xạ tín hiệu
16-QAM khác nhau
Đỗ Công Hùng................................................................................................................................. 7
Quy hoạch tần số cho hệ thống thông tin di động thế hệ thứ 5 tại Việt Nam
Đoàn Quang Hoan, Nguyễn Anh Tuấn.......................................................................................... 13
Tối ưu hoá lưu trữ nội dung trong mạng ICN

Nguyễn Quốc Anh, Võ Thị Lưu Phương, Lê Tuấn Anh................................................................. 18
Điều Phối Tác Vụ Trong Hệ Thống MAP-REDUCE Dựa Trên Tính Địa Phương Của Dữ Liệu
Huỳnh Tấn Đạt, Bùi Xuân Lộc....................................................................................................... 24
Ứng dụng tối ưu hóa đa mục tiêu trong bài toán tự động phân loại thư rác
Nguyễn Xuân Thắng, Trần Quang Anh, Trịnh Bảo Ngọc, Nguyễn Thanh Hà............................... 30
Nâng cao chất lượng tạo ảnh siêu âm sóng biến dạng sử dụng hai bước lọc
Lương Quang Hải, Nguyễn Linh Trung, Trần Đức Tân................................................................. 36
Thủy vân trên mô hình 3D

Nguyễn Lương Nhật, Đào Duy Liêm, Lương Xuân Dẫn................................................................ 41
Phát hiện và ước lượng khoảng cách tới vật cản trợ giúp cảnh báo cho người khiếm thị
Nguyễn Quốc Hùng, Trần Thị Thanh Hải, Vũ Hải, Hoàng Văn Nam, Nguyễn Quang Hoan......... 45
iv
Khảo sát giải thuật điều khiển tắc nghẽn cho luồng TCP
Nguyễn Xuân Khánh..................................................................................................................... 51
Mô Phỏng Sự Tác Động Của Lượng Mưa Lên Quá Trình Thủy Triều
Tại Vùng Đồng Bằng Sông Cửu Long
Hoàng Ngọc Hiển, Huỳnh Xuân Hiệp............................................................................................ 60
Giải Thuật Phòng Tránh Tình Trạng Quá Tải Trong Điện Toán Đám Mây
Nguyễn Xuân Phi, Trần Công Hùng.............................................................................................. 66
Gán nhãn ngữ nghĩa trong song ngữ Anh-Việt

Huỳnh Quang Đức, Trần Lê Tâm Linh.......................................................................................... 71
Xây dựng giải pháp điều khiển thích nghi hội tụ nhanh để thiết kế bộ lọc tích cực 3 pha
Huỳnh Lê Minh Thiện, Hồ Văn Cừu, Trần Thanh Vũ, Đỗ Đăng Trình........................................... 77
Một phương pháp trích trọn thuộc tính hiệu quả cho dữ liệu có số chiều lớn
Hà Văn Sang, Đồng Thị Ngọc Lan, Ngô Thị Thu Trang................................................................ 82
Giao thức định tuyến IPv6 có sự nhận thức về năng lượng cho mạng cảm biến không dây
Vũ Chiến Thắng, Nguyễn Văn Tảo, Vũ Văn San, Lê Nhật Thăng................................................ 87
Một phương thức phát hiện bất thường trong lưu lượng mạng
Nguyễn Hà Dương........................................................................................................................ 92
Đề xuất giải pháp đánh giá cân bằng băng thông mạng
Nguyễn Chiến Trinh, Trần Minh Anh.............................................................................................. 96
Thiết Kế và Chế Tạo Bộ Dao Động VCO Băng S Rộng Một Octave
Nguyễn Tấn Nhân....................................................................................................................... 102
Thiết Kế Phòng Thí Nghiệm Viễn Thông Từ Xa Dựa Trên Bộ Thí Nghiệm Emona DATEx
Lương Vinh Quốc Danh, Nguyễn Thị Trâm................................................................................. 107
Phát triển lược đồ chữ ký số mù

Nguyễn Tiền Giang, Nguyễn Đức Thụy, Lê Đình Sơn, Lưu Hồng Dũng......................................112
Mô hình trọng số kết hợp các phương pháp trích chọn đặc tính
trong nhận dạng hành động người
Nguyễn Năng Hùng Vân, Phạm Minh Tuấn, Ung Nho Dãi...........................................................119
Theo vết đa đối tượng bằng giải thuật lọc hạt trên cơ sở của chuỗi Markov Monte Carlo
Trương Công Dung Nghi, Chế Viết Nhật Anh, Hồ Phước Tiến, Đỗ Hồng Tuấn.......................... 125
Nâng cao chất lượng gom cụm kết quả tìm kiếm video sử dụng kết hợp đặc trưng âm thanh,
đặc trưng thị giác và thông tin văn bản
Nguyễn Quang Phúc, Nguyễn Thị Anh Thư, Ngô Đức Thành, Lê Đình Duy,
Nguyễn Hoàng Tú Anh................................................................................................................ 130
Ứng dụng PCA trong nhận dạng cử chỉ tay ngôn ngữ tiếng Việt
Nguyễn Thị Hương Thảo, Vũ Hữu Tiến, Nguyễn Ngọc Minh, Vũ Văn San................................. 136
v
Tổng quan những thách thức của kỹ thuật theo dõi bệnh tiểu đường bằng phương pháp
không xâm lấn
Chử Đức Hoàng, Lê Thị Như, Trần Minh Tú, Hoàng Đình Đại, Đỗ Xuân Hiếu........................... 140
Công nghệ nhúng trong thiết kế thiết bị đo điện tim có chức năng phát hiện phức bộ QRS
Phạm Văn Nam, Trần Hoài Linh.................................................................................................. 146
Phương Pháp Tham Số Cho Bài Toán Ước Lượng Thời Gian Trễ Thay Đổi Theo Thời Gian
Giữa Hai Tín Hiệu Điện Cơ
Lưu Gia Thiện, Trần Trung Duy, Tân Hạnh, Lê Quang Phú........................................................ 152
Hệ thống hỗ trợ nông dân trên thiết bị di động: Nhận dạng cua giống
Nguyễn Thiện An, Nguyễn Thái Nghe......................................................................................... 159
Phương Pháp Ước Lượng Giá Trị Hệ Số Hấp Thụ Riêng (SAR) Của Thiết Bị Di Động
Có Đa Ăng-ten Phát Sử Dụng Gần Cơ Thể Con Người
Chu Văn Hải, Lê Đình Thành...................................................................................................... 165
Nâng Cao Tín Hiệu Tiếng Nói Bằng Giảm Nhiễu Phi Tuyến Dựa Vào Miền Wavelet
Tuan V. Tran, Tuan V. Pham........................................................................................................ 169
Anten Dò Sóng Terahertz Trong Hệ Quang Phổ Miền Thời Gian Dùng Xung Laser Femto Giây
Nguyễn Trương Khang, Nguyễn Thanh Tú, Đặng Lê Khoa, Hứa Thị Hoàng Yến,
Huỳnh Văn Tuấn.......................................................................................................................... 175
Đánh giá hiệu quả cập nhật nhiễu trực tuyến trong các thuật toán nâng cao chất lượng
tiếng nói
Đào Văn Lân, Hoàng Văn Phúc, Vũ Hỏa Tiễn............................................................................ 178
Tăng Khả Năng Phát Hiện Mục Tiêu Có Kích Thước Nhỏ, Phản Xạ Yếu Chuyển Động
Trên Bề Mặt Nền Bằng Giải Pháp Phân Cực-Doppler
Phạm Trọng Hùng....................................................................................................................... 182
Hệ Thống Mã Hoá Và Nhận Dạng Mẫu Hai Chiều Ứng Dụng Trong In Ấn
Và Tra Cứu Thông Tin
Hoàng Anh Tuấn, Nguyễn Hữu Phương, Bùi Trọng Tú............................................................... 186
Bộ Ước Lượng Chuyển Động Nguyên Thông Lượng Cao Trên Thuật Toán Full-Search
Cho Chuẩn H.264
Huỳnh Quốc Thịnh, Bùi Trọng Tú................................................................................................ 190
Thuật toán lpso lập lịch thực thi luồng công việc cho các ứng dụng khoa học
trong môi trường điện toán đám mây
Phan Thanh Toàn, Nguyễn Thế Lộc, Nguyễn Doãn Cường........................................................ 194
Hệ Thống Nhúng Nhận Dạng Tiếng Nói Tiếng Việt Sử Dụng Mel-Frequency Cepstral
Coefficients Và Dynamic Time Warping
Lê Đức Lộc, Trần Văn Hoàng, Hoàng Trang............................................................................... 200
Một Phương Pháp Dịch Từ Mới Trong Dịch Máy Hoa-Việt

Trần Thanh Phước, Trịnh Thanh Duy, Nguyễn Thị Thanh Thảo, Đinh Điền................................ 206
vi
Mẫu Thiết Kế Cho Việc Phát Triển Phần Mềm Trong Môi Trường Đám Mây: Bản Khảo Sát
Hiện Trạng
Ngô Huy Biên, Trần Đan Thư...................................................................................................... 212
Nhận dạng ngôn ngữ ký hiệu tiếng Việt với cử chỉ động dựa trên hệ tọa độ cầu
Võ Đức Hoàng, Huỳnh Hữu Hưng, Nguyễn Hồng Sang, Jean Meunier..................................... 222
Về một phương pháp xây dựng hệ mật mã lai ghép

Nguyễn ToànThắng, Ngô ĐứcThiện............................................................................................ 227
Phát triển thuật toán xác lập khoá cho các hệ mật mã khóa đối xứng
Hoàng Văn Việt, Nguyễn Đức Thụy, Bùi Thế Truyền, Lưu Hồng Dũng....................................... 232
Nén tín hiệu ECG và bảo mật thông tin bệnh nhân
Nguyễn Lương Nhật, Đào Duy Liêm, Nguyễn Thị Minh Thy....................................................... 236
E-RISKE, một sơ đồ mật mã khóa bí mật dựa trên các phần tử khả nghịch và khả nghịch
mở rộng trong các vành đa thức bậc hữu hạn hệ số nhị phân có hai lớp kề cyclic
Cao Minh Thắng, Nguyễn Bình, Hoàng Mạnh Thắng, Nguyễn Ngọc Quân................................ 240
Một số phương pháp mới xác định cấp của đa thức trên vành đa thức sử dụng tính chất
của nhóm nhân cyclic đối xứng
Nguyễn Trung Hiếu...................................................................................................................... 248
Về một kiến trúc mạng nơ-ron nhân tạo trên FPGA ứng dụng trong nhận dạng
chữ số viết tay
Nguyễn Thị Kim Anh, Nguyễn Trường Thọ, Huỳnh Việt Thắng................................................... 253
Cải Tiến Tốc Độ Hội Tụ Của Giải Thuật Tối Ưu Bầy Đàn Cho Bài Toán Ánh Xạ Ứng Dụng
Lên Mạng Trên Chip
Đặng Thị Hương Giang, Phạm Minh Triển.................................................................................. 257
Xây dựng thuật toán điều khiển tia siêu âm hội tụ dựa trên FPGA
Trần Trọng Thắng, Nguyễn Duy Thông, Trịnh Quang Đức.......................................................... 262
Phương pháp chênh lệch trong hiện thực hóa các hàm phức tạp trên ASIC
cho các hệ thống DSP
Sái Văn Thuận, Hoàng Văn Phúc, Trần Văn Khẩn...................................................................... 267
Chương Trình Điều Khiển, Thu Thập Và Xử Lý Dữ Liệu Các Đại Lượng Điện Được Đo,
Kiểm Tra Bằng Thiết Bị Đo Công Suất Hioki 3334
Nguyễn Trọng Thắng, Phùng Phú Bình....................................................................................... 273
Mạng thế hệ mới – Tương lai của Internet và truyền thông

Nguyễn Chiến Trinh, Trần Minh Anh............................................................................................ 276
Nghiên cứu và thiết kế Gương thông minh kiêm thiết bị theo dõi sức khoẻ
Phan Ngọc Điệp, Phạm Văn Tuấn............................................................................................... 282
Phân Loại Câu Trả Lời Giả Mạo Trên Các Trang Web Hỏi Đáp Cộng Đồng Dựa Vào
Quan Hệ Người Dùng
Nông Thị Hoa, Quách Xuân Trưởng, Nguyễn Thuỳ Linh, Vũ Thị Thuý Thảo,
Nguyễn Xuân Hưng..................................................................................................................... 288
vii
Đánh Giá Trải Nghiệm Khách Hàng Sử Dụng Dịch Vụ IPTV
Phan Thanh Vy, Lê Tuấn Anh...................................................................................................... 293
Thuật toán xử lý không gian thích nghi các tín hiệu ở mạng anten số
Lê Ngọc Uyên, Nguyễn Trung Thành.......................................................................................... 297
Sử dụng quay pha phụ tối ưu sóng mang thu để giảm ảnh hưởng riêng của méo phi tuyến
trên hệ thống MIMO STBC 2xNR
Nguyễn Tất Nam, Nguyễn Quốc Bình......................................................................................... 303
Kỹ Thuật Sắp Xếp Can Nhiễu Cho Hệ Thống Phối Hợp Nhiều Cell Với Thông Tin
Trạng Thái Kênh Không Hoàn Hảo
Nguyễn Quang Tuấn, Hà Hoàng Kha, Tạ Quang Hùng, Võ Quế Sơn........................................ 309
Phân tích tỷ số tín hiệu/ tạp của hệ thống radar mimo

Lê Ngọc Uyên, Võ Văn Phúc, Đinh Văn Trường, Cao Văn Vũ.................................................... 314
Nâng cao tốc độ truyền tin trong một kênh nước biển nông thuộc vịnh Bắc Bộ của Việt Nam
dùng điều chế OFDM
Trần Cao Quyền.......................................................................................................................... 318
Nâng cao hiệu quả của mã BCH sử dụng phương pháp giải mã dựa trên chuẩn Syndrome
Phạm Khắc Hoan, Lê Văn Thái................................................................................................... 322
Hiệu năng mã hóa với tập lệnh AES-NI

Nguyễn Tuấn Anh, Lương Thế Dũng, Nguyễn Thị Trang............................................................ 327
Đánh Giá Hiệu Năng Máy Vector Hỗ Trợ Sử Dụng Hàm Nhân Radial Basic
trong Hệ Thống Nhận Dạng Khuôn Mặt Sử Dụng Khối Trích Xuất PCA-LDA
Phạm Văn Tuấn, Hà Xuân Cường, Hồ Đức Trung...................................................................... 330
Đánh giá bộ nhãn ngữ nghĩa LLOCE

Hồ Xuân Vinh, Nguyễn Thị Thanh Thảo, Đinh Điền.................................................................... 336
Đánh giá hiệu năng một số mô hình học máy thống kê với vấn đề nhận dạng
thanh điệu tiếng Việt nói
Nguyễn Hồng Quang, Trịnh Văn Loan........................................................................................ 342
Dự báo dịch tả dựa trên mô hình học máy phân lớp

Lê Thị Ngọc Anh, Hoàng Xuân Dậu............................................................................................ 348
Kỹ thuật tra cứu ảnh cây dược liệu dựa vào nội dung phục vụ cho phát hiện,
quản lý và khai thác
Nguyễn Văn Huân, Nguyễn Văn Tảo.......................................................................................... 353
Thiết kế chế tạo thiết bị sưởi ấm máu và dịch truyền

Nguyễn Phan Kiên, Đỗ Thị Thu Hằng, Truong Duc Thuan......................................................... 358
Một phương pháp đo đạc tính chất điện môi cho chất lỏng tổn hao cao ở tần số vi ba
Nguyễn Đạt Sơn, Lâm Tấn Phát, Lê Nguyên Ngân.................................................................... 363
Nghiên cứu và thiết kế chip xử lý đa nhân sử dụng Multi2Sim

Ngô Quang Vinh, Đỗ Đức Hào, Hoàng Trang, Vũ Đình Thành................................................... 369
viii
Phát hiện bất thường trong dáng đi ở người dựa trên khung xương sử dụng
mô hình Markov ẩn
Nguyễn Trọng Nguyên, Huỳnh Hữu Hưng.................................................................................. 378
Kỹ Thuật Nén Tiếng Nói Số Ứng Dụng Trong Thông Tin Vô Tuyến Sóng Ngắn
Nguyễn Nam Hải......................................................................................................................... 384
Hệ Thống Gợi Ý Bài Báo Khoa Học

Sử Kim Anh, Nguyễn Thái Nghe................................................................................................. 388
Thiết kế anten mảng tái cấu hình tần số sử dụng cấu trúc DGS
Nguyễn Ngọc Lan, Vũ Văn Yêm, Bernard Journeet, Lâm Hồng Thạch, Trịnh Thị Hương.......... 394
Nghiên cứu, thiết kế, chế tạo bộ thiết bị thực hành điện tâm đồ phục vụ đào tạo
Nguyễn Lê Cường, Hoàng Văn Đông, Đinh Văn Tuấn................................................................ 399
Những Ảnh Hưởng Của Thời Tiết Đối Với Kết Nối Mạng Quang Vô Tuyến
Lê Quốc Cường,Tăng Chí Kiệt.................................................................................................... 403
Kỹ Thuật Điều Chế QPSK Cho Hệ Thống Thông Tin Quang Vô Tuyến DWDM
Lê Quốc Cường, Lê Duy Hưng.................................................................................................... 409
Phân tích ảnh hưởng của góc truyền, đường phản xạ và sự phân bố nguồn sáng
trong truyền thông ánh sáng khả kiến dùng LED
Nguyễn Thanh Sơn, Trần Phú Cường......................................................................................... 415
Mô hình đánh giá suy hao hai vùng truyền sóng trong hầm mỏ than chữ nhật
Nguyễn Văn Tài, Lâm Hồng Thạch, Nguyễn Hoàng Hải............................................................. 420
Thiết kế hệ thống giám sát dây chuyền sản xuất công nghiệp thời gian thực sử dụng
công nghệ PLC tích hợp trên nền giao thức IP
Đỗ Trọng Tuấn, Phạm Gia Điềm, Phạm Hoàng Anh, Đoàn Văn Toàn, Nguyễn Việt Đức,
Phạm Tiến Đạt, Lê Bảo Sơn, Lê Anh Tuấn Dương..................................................................... 425
Mô hình tính toán và Kiến trúc mảng tái cấu hình cấu trúc thô cho các ứng dụng
điều khiển hiệu năng cao
Nguyễn Đức Nam, Trần Quang Vinh, Nguyễn Kiêm Hùng.......................................................... 431
Mô Hình Nghiên Cứu Thực Nghiệm Về Truyền Dữ Liệu Thời Gian Thực Sử Dụng
Ánh Sáng Đèn LED
Đỗ Trọng Tuấn, Hà Duyên Trung, La Văn Thiện, Phan Văn Huy, Lương Tuấn Hải..................... 437
Phát hiện và bám đuổi cá bằng phương pháp GMM kết hợp Frame-Differencing
Nguyễn Đình Minh Nhật, Huỳnh Như Kiên, Võ Ngọc Nhân, Phạm Văn Tuấn............................ 443
Điều khiển dẫn đường hành vi cho robot di động hai bánh vi sai
Nguyễn Thị Thanh Vân, Phùng Mạnh Dương, Đặng Anh Việt, Quách Công Hoàng,
Trần Quang Vinh......................................................................................................................... 450
Nghiên cứu tác động của phương pháp điều chỉnh mức sáng dựa trên cắt mức
năng lượng biên sau lên đối tượng đèn sợi đốt, đèn huỳnh quang và đèn compact
Nguyễn Phan Kiên, Nguyễn Mạnh Cường, Hoàng Anh Dũng, Trần Đức Hưng, Đỗ Chí Hiếu.... 456
ix
Kiến Trúc Vi Mạch FFT Cơ Số Hai Với Số Điểm Linh Động Và Độ Chính Xác Cao
Với Công Nghệ 130nm
Phạm Đăng Lâm, Nguyễn Trọng Ngô Nhật Du, Ngô Thành Đạt, Hoàng Trang.......................... 461
Đánh giá hiệu năng bảo mật của mạng vô tuyến nhận thức chuyển tiếp đa chặng
Chu Tiến Dũng, Võ Nguyễn Quốc Bảo, Nguyễn Lương Nhật, Hồ Văn Cừu............................... 466
Khảo Sát Sự Ảnh Hưởng Của Phần Cứng Không Hoàn Hảo Lên Mạng Chuyển Tiếp
Đa Chặng Trong Các Môi Trường Fading Khác Nhau
Phạm Minh Quang, Trần Trung Duy, Võ Nguyễn Quốc Bảo....................................................... 471
Đánh Giá Hiệu Năng Mạng Vô Tuyến Nhận Thức Dạng Nền Với TAS/SC
và Suy Hao Phần Cứng
Phạm Thị Đan Ngọc, Trần Trung Duy, Võ Nguyễn Quốc Bảo, Hồ Văn Khương,
Nguyễn Lương Nhật.................................................................................................................... 477
Nâng Cao Hiệu Năng Bảo Mật Mạng Thứ Cấp Với Kỹ Thuật Chọn Nhiều Nút
Chuyển Tiếp Đơn Phần
Đặng Thế Hùng, Trần Trung Duy, Lưu Gia Thiện, Võ Nguyễn Quốc Bảo................................... 482
Phân Tích Hiệu Năng của Hệ Thống Truyền Thông Chuyển Tiếp Đường Lên
với Thu Thập Năng Lượng và Kết Hợp Lựa Chọn tại Nút Đích
Trần Mạnh Hoàng, Nguyễn Thị Thái Hòa, Trần Trung Duy, Võ Nguyễn Quốc Bảo..................... 488
Điều Khiển Xe Lăn Dựa Trên Nhận Dạng Ảnh Trạng Thái Của Bàn Tay
Với Board Intel Galileo
Trương Phong Tuyên, Phạm Hoàng Lượm, Phạm Thanh Hùng................................................. 494
Danh sách tác giả...................................................................................................................... 502
x
LỜI CHÀO MỪNG CỦA GIÁM ĐỐC HỌC VIỆN
Kính thưa quý vị đại biểu, các nhà khoa học và các tác giả
Tiếp nối sự thành công của Hội nghị Quốc tế về các công nghệ tiên tiến trong truyền thông
(ATC’ 2014) diễn ra tại Hà Nội năm 2014, Học viện Công nghệ Bưu chính Viễn thông (Học viện)
thật vinh dự tiếp tục cùng Hội Vô tuyến Điện tử Việt Nam tổ chức Hội thảo Quốc gia năm 2015
về Điện tử, Truyền thông và Công nghệ Thông tin (The 2015 National Conference on Electronics,
Communications, and Information Technology - ECIT 2015) tại Thành phố Hồ Chí Minh trong hai
ngày 10-11/12/2015.
Với bề dày 60 năm hình thành và phát triển, trong những năm qua, Học viện Công nghệ Bưu
chính Viễn thông, nay trực thuộc Bộ Thông tin và Truyền thông đã có những đóng góp và cống hiến
to lớn cho quá trình phát triển kinh tế, xã hội của đất nước thông qua việc cung cấp nguồn nhân
lực và các sản phẩm nghiên cứu có chất lượng cao trong lĩnh vực Công nghệ Thông tin và Truyền
thông. Học viện hiện là cái nôi đào tạo và nghiên cứu của hơn 20.000 sinh viên, học viên và gần
1.000 cán bộ nghiên cứu và giảng viên đang trực tiếp giảng dạy, nghiên cứu khoa học tại 09 ngành
đào tạo, 03 Viện nghiên cứu và 02 cơ sở đào tạo dài hạn và ngắn hạn tại hai thành phố lớn nhất cả
nước là Hà Nội và Thành phố Hồ Chí Minh.
Trong những năm qua, Hội thảo ECIT đã khẳng định là hoạt động trao đổi học thuật uy tín
cấp quốc gia do Hội Vô tuyến Điện tử tổ chức, theo mô hình kết hợp giữa Hội khoa học với các
trường đại học nhằm tạo lập một diễn đàn trao đổi chuyên sâu có chất lượng về các lĩnh vực thuộc
chuyên ngành điện tử, công nghệ thông tin và truyền thông. Là trường Đại học hàng đầu trong lĩnh
vực Công nghệ Thông tin và Truyền thông, trực thuộc Bộ chuyên ngành chủ quản, Học viện Công
nghệ Bưu chính Viễn thông vinh dự cùng phối hợp với Hội Vô tuyến Điện tử Việt Nam tham gia Hội
thảo ECIT 2015. Hội thảo lần này đã thu hút được 62 bài báo dạng thuyết trình và 30 bài báo dạng
poster trên tổng số 135 bài báo đăng ký. Các chủ đề được trình bày đều là các lĩnh vực được quan
tâm hiện nay như khoa học máy tính, kỹ thuật truyền thông, mạng truyền dữ liệu, xử lý tín hiệu và
hình ảnh và điện tử y sinh, điều này hứa hẹn mang đến một Hội thảo có chất lượng chuyên môn cao
của Ngành. Hội thảo cũng là nơi để các nhà khoa học, các đại biểu có dịp chia sẻ, trao đổi những
kinh nghiệm quý báu, những kết quả trong hoạt động nghiên cứu khoa học công nghệ trong các lĩnh
vực nêu trên, qua đó đóng góp hiệu quả cho sự nghiệp công nghiệp hóa, hiện đại hóa và hội nhập
quốc tế của đất nước.
Trong suốt quá trình chuẩn bị Hội thảo, Học viện đã nhận được sự ủng hộ, phối hợp và chỉ
đạo và tư vấn thường xuyên của Ban chỉ đạo Hội thảo, sự tận tâm và trách nhiệm của Ban chương
trình Hội nghị, sự chu đáo, nhiệt tình của các tiểu ban hậu cần, khánh tiết và đặc biệt là sự đóng góp
tích cực của các tác giả bài báo để có được thành công của Hội thảo ECIT 2015. Qua Hội thảo lần
này, Học viện mong muốn tiếp tục cùng Hội Vô tuyến Điện tử Việt Nam đăng cai các Hội nghị, Hội
thảo trong nước và quốc tế khác trong thời gian tới, nhằm đóng góp hơn nữa vào sự phát triển của
nền khoa học, công nghệ của nước nhà.
Thay mặt Học viện Công nghệ Bưu chính Viễn thông, xin kính chúc quý vị đại biểu, các vị
khách mời, các tác giả và người tham dự gặt hái được nhiều kết quả hữu ích từ Hội thảo và có
những ngày giao lưu, chia sẻ trong một không khí đầm ấm tại thành phố mang tên Bác.
Giám đốc Học viện Công nghệ Bưu chính Viễn thông
TS. Vũ Văn San
xi
BAN TỔ CHỨC HỘI THẢO
BAN CHỈ ĐẠO

PGS. TS. Nguyễn Ngọc Bình, Chủ tịch Hội Vô tuyến Điện tử Việt Nam
TS. Vũ Văn San, Giám Đốc Học viện Công nghệ Bưu chính Viễn thông
GS. Huỳnh Hữu Tuệ, Đại Học Quốc Gia TP. Hồ Chí Minh
BAN TỔ CHỨC
TS. Tân Hạnh, Học viện Công nghệ Bưu chính Viễn thông
PGS.TS. Trần Xuân Nam, Học viện KTQS & Hội VTĐT Việt Nam
PGS.TS. Nguyễn Hữu Thanh, Trường Đại học Bách Khoa Hà Nội
PGS.TS. Trương Vũ Bằng Giang, Trường Đại học Công nghệ, ĐHQGHN
PGS.TS. Nguyễn Lê Hùng, Trường Đại học Bách Khoa Đà Nẵng
PGS. TS. Đinh Đức Anh Vũ, Đại Học Công Nghệ Thông Tin TP. Hồ Chí Minh
TS. Mai Linh, Trường Đại Học Quốc Tế TP. Hồ Chí Minh
TS. Bùi Trọng Tú, Đại Học Khoa Học Tự Nhiên Thành Phố Hồ Chí Minh
PGS. TS. Võ Nguyễn Quốc Bảo, Học viện Công nghệ Bưu chính Viễn thông
BAN TỔ CHỨC ĐỊA PHƯƠNG
TS. Đặng Hoài Bắc, Học viện Công nghệ Bưu chính Viễn thông
TS. Trần Trung Duy, Học viện Công nghệ Bưu chính Viễn thông
BAN XUẤT BẢN
PGS. TSKH. Hoàng Đăng Hải, Học viện Công nghệ Bưu chính Viễn thông
PGS. TS. Đặng Thế Ngọc, Học viện Công nghệ Bưu chính Viễn thông
BAN THƯ KÝ
ThS. Phạm Thị Đan Ngọc, Học viện Công nghệ Bưu chính Viễn thông
ThS. Phạm Minh Quang, Học viện Công nghệ Bưu chính Viễn thông
Triều Phương Thảo, Học viện Công nghệ Bưu chính Viễn thông
xii
BAN CHƯƠNG TRÌNH
BAN CHƯƠNG TRÌNH

PGS. TS. Trần Quang Anh, Học viện Công nghệ Bưu chính Viễn thông
PGS. TS. Trương Vũ Bằng Giang, Trường Đại học Công nghệ, ĐHQGHN
TS. Đỗ Hồng Tuấn, Trường Đại Học Bách Khoa TP. Hồ Chí Minh
PGS. TS. Võ Nguyễn Quốc Bảo, Học viện Công nghệ Bưu chính Viễn thông
TIỂU BAN KỸ THUẬT TRUYỀN THÔNG
PGS. TS. Hồ Văn Khương, Đại Học Bách Khoa TP. Hồ Chí Minh
TS. Trương Trung Kiên, Học viện Công nghệ Bưu chính Viễn thông
TS. Lê Bá Tân, Bộ Thông Tin TruyềnThông
TIỂU BAN SIÊU CAO TẦN VÀ TRUYỀN SÓNG
TS. Nguyễn Bình Dương, Đại Học Quốc Tế TP. Hồ Chí Minh
PGS. TS. Vũ Văn Yêm, Trường Đại học Bách khoa Hà Nội
PGS.TS. Trần Minh Tuấn, Viện Nghiên cứu Chiến lược Công nghệ thông tin - Truyền thông
TIỂU BAN KỸ THUẬT ĐIỆN TỬ
PGS. TS. Đinh Đức Anh Vũ, Đại Học Công Nghệ Thông Tin TP. Hồ Chí Minh
TS. Huỳnh Phú Minh Cường, Trường Đại học Bách khoa Tp. Hồ Chí Minh
TS. Lê Đức Hùng, Đại Học Khoa Học Tự Nhiên TP. Hồ Chí Minh
TS. Hà Đắc Bình, Đại Học Duy Tân, Đà Nẵng
TIỂU BAN KỸ THUẬT MẠNG MÁY TÍNH VÀ ĐIỀU KHIỂN
PGS. TS. Nguyễn Hữu Thanh, Đại Học Bách Khoa Hà Nội
TS. Võ Nguyên Sơn, Đại Học Duy Tân, TP. Hồ Chí Minh
PGS. TS. Chử Đức Trình, Trường Đại học Công nghệ, ĐHQGHN
TIỂU BAN XỬ LÝ TÍN HIỆU
PGS. TS. Trần Đức Tân, Đại Học Công Nghệ, Đại Học Quốc Gia Hà Nội
PGS. TS. Trần Đỗ Đạt, Trung Tâm MICA, Đại Học Bách Khoa Hà Nội
TS. Võ Trung Dũng, Đại Học Bách Khoa TP. Hồ Chí Minh
TIỂU BAN GIÁO DỤC VÀ ĐÀO TẠO
PGS.TS. Phạm Ngọc Nam, Đại học Bách Khoa Hà Nội
PGS. TS. Trần Công Hùng, Học Viện Công Nghệ Bưu Chính Viễn Thông
TIỂU BAN CÔNG NGHỆ THÔNG TIN
PGS. TS. Từ Minh Phương, Học Viện Công Nghệ Bưu Chính Viễn Thông
PGS. TS. Bùi Thu Lâm, Học Viện Kỹ Thuật Quân Sự
CÁC THÀNH VIÊN KHÁC
Lê Tuấn Anh, Đại Học Thủ Dầu Một

Chế Viết Nhật Anh, Đại Học Bách Khoa TP. Hồ Chí Minh
Ngô Xuân Bách, Học Viện Công Nghệ Bưu Chính Viễn Thông
Võ Nguyễn Quốc Bảo, Học Viện Công Nghệ Bưu Chính Viễn Thông
xiii
Võ Đình Bảy, Đại Học Tôn Đức Thắng
Phí Hòa Bình, Viện Vật Liệu - Viện Hàn Lâm Khoa Học và Công Nghệ Việt Nam
Phạm Văn Cường, Học Viện Công Nghệ Bưu Chính Viễn Thông
Nguyễn Văn Cường, Đại Học Bách Khoa Đà Nẵng
Lương Vinh Quốc Danh, Đại Học Cần Thơ
Trần Đỗ Đạt, Đại Học Bách Khoa Hà Nội
Hoàng Xuân Dậu, Học Viện Công Nghệ Bưu Chính Viễn Thông
Nguyễn Quốc Định, Học Viện Kỹ Thuật Quân Sự
Nguyễn Quốc Định, Đại học Bách khoa Hà Nội
Nguyễn Tuấn Đức, Đại Học Quốc Tế - Đại Học Quốc Gia TP. Hồ Chí Minh
Đặng Ngọc Minh Đức, Đại Học Tôn Đức Thắng
Ngô Vũ Đức, Đại học Bách khoa Hà Nội
Nguyễn Bình Dương, Đại Học Quốc Tế - Đại Học Quốc Gia TP. Hồ Chí Minh
Trần Trung Duy, Học Viện Công Nghệ Bưu Chính Viễn Thông
Phạm Thanh Giang, Viện Công Nghệ Thông Tin
Nguyễn Xuân Hà, Đại Học Tân Tạo
Trần Thị Thanh Hải, Đại Học Bách Khoa Hà Nội
Phạm Thanh Hiệp, Đại Học Kỹ Thuật Lê Quý Đôn
Đinh Chí Hiếu, Bộ Thông Tin và Truyền Thông
Nguyễn Xuân Hoài, Đại Học Hà Nội
Nguyễn Huy Hoàng, Đại Học Kỹ Thuật Lê Quý Đôn
Nguyễn Kiêm Hùng, Đại Học Quốc Gia Hà Nội
Lê Đức Hùng, Đại Học Khoa Học Tự Nhiên - Đại Học Quốc Gia TP. Hồ Chí Minh
Nguyễn Việt Hùng, Học Viện Công Nghệ Bưu Chính Viễn Thông
Nguyễn Lê Hùng, Đại Học Bách Khoa Đà Nẵng
Hà Hoàng Kha, Đại Học Bách Khoa TP. Hồ Chí Minh
Hồ Văn Khương, Đại Học Bách Khoa TP. Hồ Chí Minh
Trương Trung Kiên, Học Viện Công Nghệ Bưu Chính Viễn Thông
Lê Thị Lan, Đại Học Bách Khoa Hà Nội
Võ Thị Kiều Loan, Đại Học Tân Tạo
Bùi Xuân Lộc, Đại Học Tân Tạo
Ngô Thành Long, Đại Học Kỹ Thuật Lê Quý Đôn
Nguyễn Ngọc Trường Minh, Đại Học Quốc Tế - Đại Học Quốc Gia TP. Hồ Chí Minh
Phạm Tuấn Minh, Đại Học Sư Phạm Hà Nội
Nguyễn Ngọc Minh, Học Viện Công Nghệ Bưu Chính Viễn Thông
Trần Xuân Nam, Đại Học Kỹ Thuật Lê Quý Đôn
Phạm Thị Đan Ngọc, Học Viện Công Nghệ Bưu Chính Viễn Thông
Đặng Thế Ngọc, Học Viện Công Nghệ Bưu Chính Viễn Thông
Đỗ Thị Bích Ngọc, Học Viện Công Nghệ Bưu Chính Viễn Thông
Hoàng Văn Phúc, Đại Học Kỹ Thuật Lê Quý Đôn
xiv
Võ Thị Lưu Phương, Đại Học Quốc Tế, Đại Học Quốc Gia TP. Hồ Chí Minh
Từ Minh Phương, Học Viện Công Nghệ Bưu Chính Viễn Thông
Phạm Minh Quang, Học Viện Công Nghệ Bưu Chính Viễn Thông
Trần Minh Quang, Đại Học Bách Khoa TP. Hồ Chí Minh
Nguyễn Xuân Quyền, Đại Học Bách Khoa Hà Nội
Trần Thế Sơn, Cao Đẳng Công Nghệ Thông Tin Hữu Nghị Việt - Hàn
Trần Đức Tân, Đại Học Quốc Gia Hà Nội
Hoàng Mạnh Thắng, Đại Học Bách Khoa Hà Nội
Cao Minh Thắng, Học Viện Công Nghệ Bưu Chính Viễn Thông
Trần Thiên Thanh, Đại Học Giao Thông Vận Tải TP. Hồ Chí Minh
Quản Thành Thơ, Đại Học Bách Khoa TP. Hồ Chí Minh
Vũ Hữu Tiến, Học Viện Công Nghệ Bưu Chính Viễn Thông
Nguyễn Nam Trân, Đại Học Sasketchewan, Canada
Nguyễn Chiến Trinh, Học Viện Công Nghệ Bưu Chính Viễn Thông
Hà Duyên Trung, Đại Học Bách Khoa Hà Nội
Trần Xuân Tú, Đại Học Công Nghệ, Đại Học Quốc Gia Hà Nội
Phạm Văn Tuấn, Đại Học Bách Khoa Đà Nẵng
Huỳnh Hữu Tuệ, Đại Học Quốc Tế, Đại Học Quốc Gia TP. Hồ Chí Minh
Trần Quang Vinh, Đại Học Bách Khoa Hà Nội
Trương Quang Vinh, Đại Học Bách Khoa TP. Hồ Chí Minh
Lê Sỹ Vinh, Đại Học Công Nghệ, Đại Học Quốc Gia Hà Nội
Đinh Đức Anh Vũ, Đại Học Công Nghệ Thông Tin - Đại Học Quốc Gia TP. Hồ Chí Minh
Vũ Văn Yêm, Đại Học Bách Khoa Hà Nội
xv
DANH SÁCH CÁC PHẢN BIỆN
Chế Viết Nhật Anh, Đại Học Bách Khoa TP. Hồ Chí Minh
Lê Tuấn Anh, Đại Học Thủ Dầu Một
Ngô Xuân Bách, Học Viện Công Nghệ Bưu Chính Viễn Thông
Trương Quốc Bảo, Đại Học Cần Thơ
Võ Đình Bảy, Đại Học Tôn Đức Thắng
Phạm Văn Cường, Học Viện Công Nghệ Bưu Chính Viễn Thông
Nguyễn Tuấn Đăng, Đại Học Lạc Hồng
Lương Vinh Quốc Danh, Đại Học Cần Thơ
Hoàng Xuân Dậu, Học Viện Công Nghệ Bưu Chính Viễn Thông
Nguyễn Quốc Định, Học Viện Kỹ Thuật Quân Sự
Đặng Ngọc Minh Đức, Đại Học Tôn Đức Thắng
Ngô Vũ Đức, Đại Học Bách Khoa Hà Nội
Nguyễn Tuấn Đức, Đại Học Quốc Tế - ĐHQG TP. Hồ Chí Minh
Nguyễn Bình Dương, Đại Học Quốc Tế - ĐHQG TP. Hồ Chí Minh
Trần Trung Duy, Học Viện Công Nghệ Bưu Chính Viễn Thông
Phan Đình Duy, Đại Học Công Nghệ Thông Tin
Nguyễn Xuân Hà, Đại Học Tân Tạo
Hoàng Mạnh Hà, Đại Học Bách Khoa TP. Hồ Chí Minh
Phạm Thanh Hiệp, Đại Học Kỹ Thuật Lê Quý Đôn
Đinh Chí Hiếu, Bộ Thông Tin và Truyền Thông
Đặng Thế Hùng, Trường Sỹ Quan Thông Tin Nha Trang
Nguyễn Việt Hùng, Học Viện Công Nghệ Bưu Chính Viễn Thông
Nguyễn Lê Hùng, Đại Học Bách Khoa Đà Nẵng
Nguyễn Kiêm Hùng, Đại Học Quốc Gia Hà Nội
Lê Đức Hùng, Đại Học Khoa Học Tự Nhiên - ĐHQG TP. Hồ Chí Minh
Trương Thu Hương, Đại Học Bách Khoa Hà Nội
Hà Hoàng Kha, Đại Học Bách Khoa TP. Hồ Chí Minh
Hồ Văn Khương, Đại Học Bách Khoa TP. Hồ Chí Minh
TrươngTrung Kiên, Học Viện Công Nghệ Bưu Chính Viễn Thông
Lê Thị Lan, Đại Học Bách Khoa Hà Nội
Bùi Xuân Lộc, Đại Học Tân Tạo
Ngô Thành Long, Đại Học Kỹ Thuật Lê Quý Đôn
Phạm Tuấn Minh, Đại Học Sư Phạm Hà Nội
Nguyễn NgọcTrường Minh, Đại Học Quốc Tế - ĐHQG TP. Hồ Chí Minh
Trần Xuân Nam, Đại Học Kỹ Thuật Lê Quý Đôn
Nguyễn Thị Kim Ngân, Đại Học Sư Phạm Hà Nội
Đặng Thế Ngọc, Học Viện Công Nghệ Bưu Chính Viễn Thông
Đỗ Thị Bích Ngọc, Học Viện Công Nghệ Bưu Chính Viễn Thông
Nguyễn Hữu Phát, Đại Học Bách Khoa Hà Nội
xvi
Hoàng Văn Phúc, Đại Học Kỹ Thuật Lê Quý Đôn
Võ Thị Lưu Phương, Đại Học Quốc Tế, ĐHQG TP. Hồ Chí Minh
Từ Minh Phương, Học Viện Công Nghệ Bưu Chính Viễn Thông
Trần Minh Quang, Đại Học Bách Khoa TP. Hồ Chí Minh
Nguyễn Xuân Quyền, Đại Học Bách Khoa Hà Nội
Trần Thế Sơn, Cao Đẳng Công Nghệ Thông Tin Hữu Nghị Việt - Hàn
Phạm Ngọc Sơn, Đại Học Sư Phạm Kỹ Thuật
Trần Đức Tân, Đại Học Quốc Gia Hà Nội
Hoàng Mạnh Thắng, Đại Học Kỹ Thuật Hà Nội
Ngô Đức Thiện, Học Viện Công Nghệ Bưu Chính Viễn Thông
Quản Thành Thơ, Đại Học Bách Khoa TP. Hồ Chí Minh
Đỗ Đình Thuấn, Đại Học Sư Phạm Kỹ Thuật
Vũ HữuTiến, Học Viện Công Nghệ Bưu Chính Viễn Thông
Nguyễn Chiến Trinh, Học Viện Công Nghệ Bưu Chính Viễn Thông
Hà Duyên Trung, Đại Học Bách Khoa Hà Nội
Trần Quang Vinh, Đại Học Kỹ Thuật Hà Nội
Đinh Đức Anh Vũ, Đại Học Công Nghệ Thông Tin - ĐHQG TP. Hồ Chí Minh
xvii
BÁO CÁO MỜI SỐ 1
Quy Hoạch Tần Số Cho Hệ Thống Thông Tin Di Động

Thế Hệ Thứ 5 Tại Việt Nam
Mr. Đoàn Quang Hoan
Cục Trưởng Cục Tần Số Vô Tuyến Điện,

Bộ Thông tin và Truyền thông, Việt Nam
Tóm tắt:
Thế giới đang hướng tới mạng thông tin kết nối rộng khắp và kết nối mọi loại hình thiết bị. Thiết bị
thông tin di động ngày càng đa dạng và đang là thành phần thiết yếu của cuộc sống. Mạng thông
tin di động thế hệ thứ 5 cần phải đáp ứng nhu cầu về tốc độ cao và dung lượng dữ liệu lớn, kết nối
nhiều thiết bị cùng lúc, độ trễ thấp và độ tin cậy cao khi mà mạng thông tin thế hệ thứ 4 chưa đáp
ứng được. Bài báo này sẽ đánh giá lại hiện trạng quy hoạch và sử dụng băng tần cho thông tin di
động của Việt Nam. Đồng thời đánh giá sự tăng trưởng của thị trường thông tin di động giai đoạn
2011-2014, dự báo nhu cầu giai đoạn 2015-2020 để đánh giá nhu cầu phổ tần đối với thông tin di
động băng rộng của Việt Nam. Dựa trên các phân tích này, bài báo phân tích những khó khăn và
thuận lợi trong việc quản lý tài nguyên tần số. Tác giả cũng sẽ đưa ra giải pháp quy hoạch lại các
băng tần hiện có cho thông tin di động băng rộng và giải pháp tìm kiếm quy hoạch băng tần mới
cho thông tin di động băng rộng của Việt Nam.
Tiểu sử:
Ông Đoàn Quang Hoan là một trong những chuyên gia hàng đầu trong
lĩnh vực quản lý tần số vô tuyến điện. Ông tốt nghiệp Kỹ sư Thông tin vô
tuyến Đại học Bách Khoa Hà Nội vào năm 1980. Từ năm 1995 đến 2006,
ông công tác trải qua nhiều chức vụ tại Cục Tần Số Vô Tuyến Điện. Từ
năm 2006 đến nay, ông đảm nhiệm chức Cục Trưởng Cục Tần Số Vô
Tuyến Điện, Bộ Thông tin và Truyền thông, Việt Nam. Ông đã lãnh đạo
nhóm điều phối dự án vệ tinh thành công ở Việt Nam. Ông là Phó Trưởng
Phái Đoàn Việt Nam trong Hội nghị Thông tin Vô tuyến Thế Giới (WRC),
Hiệp hội Thông tin Vô tuyến vào những năm 2003, 2007 và 2012. Ông
cũng là Chủ tịch Phân nhóm Quản lý Tần số ASEAN và đồng Chủ tịch
Diễn đàn Chính sách Tần số ASEAN. Ông còn là thành viên của Hội đồng Quy chuẩn Vô tuyến
ITU vào năm 2014.
xviii
Enabling Technologies for Future Sustainable Optical

Infrastructure
Dr. Tetsuya Miyazaki
Photonic Network Research Institute (PNRI)

National Institute of Information and Communications Technology (NICT)
Tóm tắt:
I would like to introduce most recent research activities of PNRI of NICT, convergence of optical
& wireless communication and spatial division multiplexing (SDM) transmission technologies and
network architecture for future sustainable network infrastructure.
Tiểu sử:
Tetsuya Miyazaki received the M.S. and Dr. Eng. degrees in information
processing from the Tokyo Institute of Technology, Tokyo, Japan, in 1987
and 1997, respectively.
From 1987 to 2002, he was with KDDI R&D Laboratories, where he was
engaged in research on coherent optical communications and WDM
optical networks.
Since 2002 April, he has been with NICT where he was engaged in research on ultra-fast and
multi-level modulation techniques. He has been a Director General of Photonic Network Research
Institute of NICT since April 2011.
xix
Điều Chế Đa Sóng Mang Như Công Cụ Chống Nhiễu Nhân Tạo
(Multicarrier Modulation as Tool to Combat the Influence of
Man-made Noise)
Prof. Huỳnh Hữu Tuệ

Technical Editor-in-Chief, REV Journal on Electronics and Communications, Vietnam
Tóm tắt:
Mấy thập niên qua, mạng viễn thông không dây được phát triển như vũ bão; số nguồn phát sóng
ngày hôm nay thật sự dày đặc, tạo ra một nguồn nhiễu nhân tạo quan trọng có tính chất xung.
Nguồn nhiễu này đã được một số nhà nghiên cứu quan tâm; họ đã đề ra một số mô hình thống kê
và cũng đã được thực nghiệm kiểm chứng. Đồng thời, mạng truyền dữ liệu được nghiên cứu và triển
khai trên nền mạng tải điện (Power Lines Communications). Một trong những yếu tố ảnh hưởng lớn
đến chất lượng của hệ thống PLC là loại nhiễu cộng có tính chất xung. Loại nhiễu này xuất hiện do
các sự kiện xảy ra trên hệ thống tải điện như công tắc bật mở, nhiễu nền do biến động của mức điện
một chiều, v.v… Loại nhiễu này cũng được khá nhiều nhà nghiên cứu quan tâm. Loại nhiễu có tính
chất xung cũng xuất hiện trong các hệ thống thông tin quang và các hệ thống ADSL. Tất cả loại nhiễu
này đều có tính chất xung, tức là nhiễu xuất hiện dưới dạng tổ hợp các tín hiệu có dạng chuyển tiếp
ngẫu nhiên, giống như nhiễu loại sốc (Shot Noise) trong các thiết bị điện tử đã được nghiên cứu từ
những năm 30-40 của thế kỷ trước.
Bài thuyết trình này sẽ trình bày các quan điểm cũng như các mô hình nhiễu không chuẩn, phát xuất
từ loại nhiễu xung như vừa được trình bày. Dựa vào đo lường thực nghiệm, chúng tôi khuyến cáo
nên dùng mô hình nhiễu loại A là mô hình có tính tương thích cao so với thực tiễn. Từ đấy, một số
phương pháp đánh giá chất lượng các hệ thống truyền dẫn dưới ảnh hưởng của loại nhiễu không
chuẩn này cũng sẽ được đề cập, đặc biệt là phương pháp mô phỏng Monté-Carlo. Chống lại ảnh
hưởng của loại nhiễu này, người ta thường sử dụng một số phương pháp xử lý phi tuyến như mức
hóa (thresholding), mạng nơ ron, v.v… Những phương pháp này có thể có chất lượng cao, nhưng
vì độ phức tạp của nó, nên khó có thể được sử sụng trong thực tế. Một phương pháp khác đã được
khởi xướng đầu những năm 60 là trải và nén trải tín hiệu (spread-despread). Hiện nay, với mô hình
nhiễu loại A, lúc sử dụng hệ điều sóng đa sóng mang, ta thấy xuất hiện thao tác trải nhiễu một cách
tự nhiên, làm ảnh hưởng của nhiễu bớt trầm trọng. Để kết luận bài thuyết trình này, chúng tôi sẽ
trình bày một số kết quả vừa thu lượm được bằng mô phỏng Monté-Carlo và cắt nghĩa lý do tại sao
COFDM là hệ thống vừa có khả năng chống pha đinh đa đường vừa chống nhiễu không chuẩn một
cách có hiệu quả.
xx
GS. TS. Huỳnh Hữu Tuệ sinh trưởng tại Thành phố Huế; bảo vệ
thành công luận án Sc.D. năm 1972 tại Đại học Laval, tại đấy, từ năm
1966 đến 1972, ông là Nghiên cứu viên và Giáo sư trợ giảng của
khoa Kỹ sư Điện và Máy tính; sau đó ông trở thành Phó Giáo sư vào
năm 1975 và Giáo sư thực thụ năm 1983. Năm 2004, ông rời Đại học
Laval để trở về tiếp tục công việc giảng dạy, hướng dẫn và nghiên
cứu tại Đại học Công Nghệ thuộc Đại học Quốc gia Hà Nội. Ông rời
Đại học Công nghệ năm 2007 để tham gia xây dựng Đại học Quốc tế
Bắc Hà mà ông là người Hiệu trưởng đầu tiên. Ông là khách mời của AT&T Information Systems
in Neptune, N.J. năm 1984 và đã từng được mời giảng dạy tại một số Đại học ở Bắc Mỹ, Âu Châu
và Á Châu. Từ năm 2012 đến nay, ông là Giáo sư tại Đại học Quốc tế thuộc Đại học Quốc gia
Thành phố Hồ Chí Minh. Giáo sư Huỳnh Hữu Tuệ là tác giả và đồng tác giả của 2 quyển sách
chuyên khảo do Nhà xuất bản Economica và Wiley phát hành và hơn 200 công trình nghiên cứu
được công bố dưới dạng “Research reports” của các công ty hay trên các tạp chí chuyên ngành.
Ông đã hướng dẫn thành công 17 luận án tiến sĩ và 45 luận án thạc sĩ ở trong và ngoài nước; ông
cũng từng là cố vấn cho một số công ty và một số tổ chức nhà nước ở Canada và Hoa Kỳ. Mối
quan tâm hiện nay của Giáo sư Huỳnh Hữu Tuệ bao gồm các kỹ thuật mô hình hóa, mô phỏng
Monte Carlo nhanh, các thuật toán và cấu trúc xử lý nhanh với áp dụng vào các vấn đề thực tiễn,
chủ yếu là hệ thống truyền dẫn số.
xxi
BÁO CÁO MỜI CỦA TIỂU BAN TRUYỀN THÔNG VÀ MẠNG
Build Tomorrow’s 5G Systems Today

Mr. Phạm Đăng Khoa
Kỹ sư ứng dụng,

National Instruments
Tóm tắt:
Trong bài thuyết trình này, chúng tôi sẽ trao đổi về tầm nhìn 5G và các hướng nghiên cứu chính
về 5G trên thế giới hiện nay. Chúng tôi sẽ giới thiệu các công nghệ phần cứng và phần mềm của
National Instruments hỗ trợ các nhà nghiên cứu trong việc chế thử (prototype) và hiện thực hóa
các ý tưởng nghiên cứu. Và chúng tôi cũng sẽ cập nhật những kết quả nghiên cứu đột phá trong
công nghệ 5G của các trường đại học và các tập đoàn viễn thông trên thế giới.
Tiểu sử:
Phạm Ðăng Khoa tốt nghiệp từ trường Ðại học Quốc gia Singapore
(NUS) với bằng Cử nhân Kỹ thuật điện & điện tử. Trước khi gia nhập
National Instruments, anh đã từng làm việc cho một công ty phát triển
giao diện người và máy dựa trên công nghệ mới về cảm ứng âm thanh.
Anh cũng từng công tác tại Viện nghiên cứu viễn thông ở Singapore
với vai trò kỹ sư nghiên cứu.
Gia nhập National Instruments từ tháng 9 năm 2011, Ðăng Khoa hiện
chịu trách nhiệm hỗ trợ tư vấn kỹ thuật và tiến hành đào tạo kỹ thuật
về sản phẩm và công nghệ của National Instruments cho khách hàng
tại Việt Nam. Anh cũng chịu trách nhiệm hỗ trợ kỹ thuật cho công việc quảng bá các công nghệ
của National Instruments đến người dùng.
xxii
Hội Thảo Quốc Gia 2015 về Điện Tử, Truyền Thông và Công Nghệ Thông Tin (ECIT 2015)
Hiệu quả sử dụng năng lượng của

đường xuống trong hệ thống thông tin MIMO
với rất nhiều ăngten ở trạm gốc
Lương Đức Bằng∗§ , Nguyễn Thị Thanh Hương†§ và Trương Trung Kiên‡§
∗ Trung tâm Nghiên cứu Kỹ thuật Thông tin Vô tuyến, Viện Khoa học Kỹ thuật Bưu điện
† Bộ môn Marketing, Viện Kinh tế Bưu điện
‡ Khoa Kỹ thuật Điện tử I
§ Phòng thí nghiệm Hệ thống Vô tuyến và Ứng dụng
Học viện Công nghệ Bưu chính Viễn thông, 122 Hoàng Quốc Việt, Hà Nội, Việt Nam
Email: ducbang.dtvt.k52@gmail.com, huongntt@ptit.edu.vn, kientruong@utexas.edu
Tóm tắt—Hệ thống thông tin nhiều đầu vào nhiều đầu huy hết khả năng của công nghệ MIMO thông qua việc
ra (MIMO - Multiple-Input Multiple-Output) với rất nhiều triển khai hàng trăm ăngten ở từng trạm gốc và sử dụng
ăngten ở trạm gốc là một công nghệ ứng cử cho mạng truyền dẫn MIMO đa người dùng (MU-MIMO) để phục
thông tin di động thế hệ 5 (5G). Ý tưởng của hệ thống
vụ đồng thời hàng chục người dùng [2]. Các bài báo
này là sử dụng hợp lý các ăngten ở trạm gốc để truyền
dữ liệu độc lập đồng thời tới nhiều thuê bao. Các bài báo trước đây khi nghiên cứu các hệ thống thông tin MIMO
trước đây khi nghiên cứu hệ thống này thường tập trung với rất nhiều ăngten ở trạm gốc thường tập trung vào
vào hoặc khả năng cải thiện tổng dung lượng truyền tin hoặc khả năng cải thiện tổng dung lượng truyền tin với
với một công suất tiêu thụ cố định hoặc khả năng giảm một công suất tiêu thụ cố định [2]–[4] hoặc khả năng
công suất tiêu thụ những vẫn đảm bảo tổng dung lượng giảm công suất tiêu thụ những vẫn đảm bảo tổng dung
truyền tin cho trước. Một số ít bài báo nghiên cứu hiệu lượng truyền tin cho trước [5]. Trong thực tế, một cách
quả sử dụng năng lượng của hệ thống này nhưng chủ yếu
cho mô hình đơn cell, do đó bỏ qua một số tính chất quan tiếp cận để dung hoà hai mục tiêu thiết kế có phần mâu
trọng của hệ thống như nhiễu tín hiệu hoa tiêu. Trong thuẫn nhau này là tối đa hoá tỷ số hiệu quả sử dụng
bài báo này, chúng tôi đề xuất một phương pháp mới để năng lượng của hệ thống. Theo định nghĩa, hiệu quả sử
phân tích hiệu quả sử dụng năng lượng đường xuống của dụng năng lượng của một hệ thống thông tin là tỷ số
mạng thông tin MIMO với rất nhiều ăngten ở trạm gốc giữa tổng dung lượng thông tin được truyền đi trên tổng
và với nhiều cell hoạt động trên cùng băng tần. Dựa trên công suất tiêu thụ tương ứng.
kết quả mô phỏng số tương ứng, chúng tôi cũng thu được
Trong khả năng hiểu biết của chúng tôi, đến nay có
những nhận xét thú vị về ảnh hưởng của một số tham số
hệ thống lên hiệu quả sử dụng năng lượng của hệ thống. khá ít bài báo đã nghiên cứu hiệu quả sử dụng năng
Từ khóa—Hiệu quả sử dụng năng lượng, hệ thống lượng của hệ thống thông tin MIMO với rất nhiều ăngten
MIMO với rất nhiều ăng-ten ở trạm gốc, mạng thông tin ở trạm gốc [6]–[9]. Bài báo [6] so sánh hiệu quả sử dụng
di động thế hệ 5 (5G), hệ thống thông tin "xanh". hiệu quả năng lượng giữa hệ thống MIMO với nhiều
ăngten ở trạm gốc và hệ thống sử dụng cell cỡ nhỏ. Tuy
I. GIỚI THIỆU nhiên, bài báo này mới chỉ tính đến công suất tiêu thụ
Mặc dù đã tích hợp công nghệ thông tin nhiều đầu vào liên quan đến bức xạ tín hiệu. Bài báo [7] đề xuất một
nhiều đầu ra (MIMO - Multiple-Input Multiple-Output), mô hình công suất tiêu thụ mới không chỉ bao gồm công
các hệ thống di động tế bào hiện nay vẫn chưa đạt được suất phát trên bộ khếch đại công suất mà còn là công
mức tốc độ cao mà công nghệ này hứa hẹn do mới suất tiêu thụ mạch bởi các thành phần của trạm BSs
xem xét các cấu hình MIMO nhỏ [1]. Ví dụ trong hệ (Base Stations) và bởi các thiết bị tương tự. Từ mô hình
thống 4G LTE/LTE-Advanced, mỗi trạm gốc có tối đa 8 mới đưa ra được công thức tính hiệu quả năng lượng,
ăngten trong khi thiết bị người dùng có tối đa 4 ăngten. sau đó xác định được số ăng-ten cần thiết để mang lại
Hệ thống thông tin MIMO với rất nhiều ăngten ở trạm hiệu quả năng lượng cho hệ thống MIMO cỡ rất lớn.
gốc là một kỹ thuật thông tin đột phá mới hứa hẹn phát Tuy nhiên, mô hình công suất tiêu thụ sử dụng trong
ISBN: 978-604-67-0635-9 11
bài báo [7] khá đơn giản và chưa phản ánh được các Nt U . Hệ thống mạng hoạt động ở chế độ TDD
đặc trưng riêng của truyền dẫn MIMO đa người dùng. trong đó tất cả các cell dùng chung một băng tần có độ
Các bài báo [8], [9] đề xuất một mô hình công suất tiêu rộng B Hz. Có nghĩa là tín hiệu đường lên và đường
thụ thực tế hơn và có khả năng phản ánh cơ chế xử lý xuống được truyền trên toàn bộ băng tần tại những thời
tín hiệu và truyền dẫn MIMO đa người dùng để nghiên điểm khác nhau. Chúng tôi giả thiết rằng tất cả các trạm
cứu hiệu quả sử dụng năng lượng của hệ thống MIMO gốc và thiết bị người dùng được đồng bộ cả về thời gian
đơn cell với nhiều ăngten ở trạm gốc. Việc xem xét chỉ và về tần số. Bên cạnh đó, chúng tôi giả thiết rằng các
một cell duy nhất bỏ qua một số tính chất quan trọng khoảng bảo vệ ở miền tần số được bỏ qua.
của hệ thống này như nhiễu tín hiệu hoa tiêu và nhiễu Ký hiệu BC (Hz) là độ rộng băng thông kết hợp và
liên cell khi truyền dữ liệu. TC (giây) là thời gian kết hợp của kênh truyền giữa trạm
Trong bài báo này, chúng tôi xem xét hệ thống thông gốc và thiết bị người dùng. Chúng tôi giả thiết mô hình
tin MIMO với rất nhiều ăngten ở trạm gốc và với nhiều kênh pha đinh khối cận tĩnh trong đó các hệ số kênh
cell hoạt động trên cùng một băng tần. Chúng tôi giả truyền được coi như không thay đổi trong mỗi khối tài
thiết hệ thống này hoạt động ở chế độ song công phân nguyên thời gian-tần số có kích thước τt = BC TC lần sử
chia theo thời gian (TDD - Time Division Duplexing) dụng kênh. Chúng tôi cũng giả thiết một khung truyền
trong đó trạm gốc ước lượng các hệ số kênh truyền dựa dẫn ứng với một khối tài nguyên thời gian-tần số. Ký
trên tín hiệu hoa tiêu ở đường lên. Chúng tôi giả thiết hiệu hbcu ∈ CNt ×1 là vector hệ số kênh truyền đường
trạm gốc sử dụng mã trước truyền tỷ số cực đại (MRT - lên từ thuê bao u ∈ Uc tới trạm gốc b ∈ C. Chúng tôi giả
Maximal Ratio Transmission) để truyền dữ liệu ở đường thiết mô hình kênh truyền không tương quan về không
xuống. Đóng góp chính của chúng tôi trong bài báo này gian. Cụ thể, hbcu được biểu diễn bởi [2], [3]
là đề xuất một phương pháp mới để phân tích hiệu quả
1/2
sử dụng năng lượng của hệ thống trên bằng cách sử hbcu =βbcu gbcu (1)
dụng các tiếp cận tìm giá trị tất định tương đương và
trong đó gbcu ∈ CNt ×1 là vector hệ số kênh truyền
môt mô hình công suất tiêu thụ được sửa đổi từ mô hình
pha đinh nhanh và βbcu là giá trị tất định biểu diễn
đề xuất trong các bài báo [8], [9]. Kết quả phân tích cho
hệ số kênh truyền pha đinh phạm vi lớn bao gồm
ra một giá trị xấp xỉ của hiệu quả sử dụng năng lượng
các hiệu ứng như suy hao đường truyền, che khuất và
của hệ thống dưới dạng một hàm số của một số tham
suy hao xuyên tường. Chúng tôi giả thiết rằng các hệ
số hệ thống như hệ số pha đinh phạm vi lớn, số ăngten
số của gbcu là độc lập thống kê và cùng tuân theo
ở trạm gốc, số thuê bao trong mỗi cell, công suất tiêu
phân bố chuẩn, tức là gbcu ∼ CN (0, INt ). Chúng tôi
thụ của mỗi phần tử trong mạng. Kết quả mô phỏng số
cũng giả thiết kênh đường lên và kênh đường xuống
cho phép chúng tôi có một số nhận xét quan trọng về
có tính chất đảo nhau (reciprocity) hoàn hảo. Để tiện
ảnh hưởng của các tham số hệ thống lên hiệu quả sử
cho việc viết các biểu thức toán học, chúng tôi giả
dụng năng lượng của hệ thống. Ví dụ, khi cố định số
thiết h∗bcu ∈ C1×Nt là vector hệ số kênh truyền đường
thuê bao trong một cell, tồn tại một giá trị số ăngten
xuống từ trạm gốc b ∈ C tới thuê bao u ∈ Uc . Ký hiệu
trên trạm gốc tối ưu. Đáng chú ý là giá trị tối ưu này
Hbc = [hbc1 hbc2 · · · hbcU ] ∈ CNt ×U là ma trận kênh
nằm trong giới hạn cho phép của các công nghệ chế tạo
tổng hợp từ tất cả các thuê bao trong cell c ∈ C tới trạm
ăngten hiện nay. Bên cạnh đó, khi cố định số ăngten
gốc b ∈ C.
trên trạm gốc, tăng số thuê bao trong một cell có thể
góp phần làm tăng hiệu quả sử dụng năng lượng. Trong hệ thống này, chúng tôi giả thiết rằng thiết bị
người dùng chỉ có thông tin trạng thái kênh thống kê của
II. MÔ HÌNH HỆ THỐNG kênh truyền giữa thiết bị đó và trạm gốc trong cùng cell.
Xét một mạng tế bào với C cell, hay ô tế bào. Mỗi Các trạm gốc phải ước lượng các hệ số kênh truyền tức
cell có một trạm gốc với Nt ăngten để phục vụ đồng thời thời từ trạm gốc đó tới các thuê bao trong cùng cell dựa
cho U người dùng được phân bố một cách ngẫu nhiêu trên tín hiệu hoa tiêu đường lên. Không mất tính tổng
trong cùng cell. Các cell và trạm gốc được đánh số bởi quát, chúng tôi giả thiết tín hiệu hoa tiêu được truyền đi
tập C = {1, 2, · · · , C}. Người dùng trong cell c ∈ C ở đường lên trong τp lần sử dụng kênh ở đầu mỗi khung
được đánh số bởi tập Uc = {1, 2, · · · , U }. Thiết bị đầu truyền dẫn [2], [10]–[12]. Trong bài báo này, chúng tôi
cuối người dùng sử dụng chỉ có một ăngten. Trong hệ giả thiết chỉ tập trung vào truyền dữ liệu đường xuống.
thống MIMO cỡ sử dụng rất nhiều ăngten ở trạm gốc, Sau khi ước lượng kênh và thiết kế bộ mã trước, mỗi
số lượng ăngten tại mỗi trạm gốc thường phải lớn hơn trạm gốc sẽ truyền đồng thời dữ liệu đến các thuê bao
rất nhiều so với số người dùng được phục vụ, tức là trong cùng cell trong τd = (τt − τp ) lần sử dụng kênh
2
còn lại. Chúng tôi giả thiết các khung truyền dẫn được pháp tính giá trị tương đương tất định (deterministic
đồng bộ trên toàn mạng. equivalence) (được sử dụng rộng rãi như trong [3], [4] để
Giả thiết rằng tất cả các cell dùng chung một tập tín tìm giá trị xấp xỉ của tỷ số công suất tín hiệu trên công
hiệu hoa tiêu tương hỗ trực giao từng cặp ký hiệu. Tính suất nhiễu và tạp âm (SINR - Signal-to-Interference-
trực giao này yêu cầu τp ≥ U . Giả thiết rằng các trạm plus-Noise Ratio) đường xuống ứng với thuê bao u ∈ Ub .
gốc sử dụng phương pháp ước lượng kênh sai số trung Cụ thể là, bằng cách thay thế Rbcu = βbcu INt vào trong
phương nhỏ nhất (MMSE - Minimum Mean Squared Định lý 5 trong [3] và sau một số biến đổi , chúng tôi
Error). Khi đó, trạm gốc b thu được một ước lượng của thu được giá trị SINR tương đương tất định ứng với thuê
hbbu như sau [2], [3] bao u ∈ Ub như sau

βbbu Abu (τp )Nt
ĥbbu = hbbu + hbcu + z̃p,b (2) η̄bu (τp , Nt ) = (6)
θbu Bbu (τp )Nt + Cbu (τp )
c=b
σ2
C trong đó
trong đó θbu = pp τp + c=1 βbcu . Với mọi c ∈ C, chúng −1
U
tôi định nghĩa
λ̄b (τp ) = βbbk (7)
βbbu βbcu
ξbcu = . (3) k=1
2
θbu Abu (τp ) =λ̄b (τp )ξbbu (8)

Chú ý rằng ĥbbu ∼ CN (0, ξbbu INt ). Sai số ước lượng Bbu (τp ) = 2
λ̄c (τp )ξbcu (9)
kênh được cho bởi h̃bbu = hbbu − ĥbbu trong đó h̃bbu ∼ c=b
CN (0, (βbbu − ξbbu )INt ). σ 2
Ký hiệu xbu là ký hiệu dữ liệu mà trạm gốc b ∈ C Cbu (τp ) = + λ̄c (τp )βbck ξbbu . (10)
pf
cần truyền cho thuê bao u ∈ Ub trong một lần sử dụng (c,k)=(b,u)
kênh. Chúng tôi giả thiết rằng các ký hiệu dữ liệu cần Khi phần mào đầu để ước lượng kênh được tính đến,
truyền ở đường xuống độc lập thống kê với nhau và giá trị tất định tương đương của tốc độ dữ liệu đường
cùng tuân theo phân bố Gauss với E[xr,bu |] = 0 và xuống đạt được ứng với thuê bao u ∈ Ub trên cả băng
E[|xr,bu |2 ] = 1. Trạm gốc b ∈ C sử dụng một ma trận tần hoạt động là
mã trước bu ∈ CNt ×1 để ánh xạ xbu tới các ăngten
phát. Ký hiệu λb là hệ số chuẩn hoá ứng với giới hạn Bτd
R̄bu (τp , Nt ) = log2 [1 + η̄bu (τp , Nt )](bit/s) (11)
công suất phát trung bình. Công thức tính λb như sau τt
1 trong đó BBC thể hiện số khối tài nguyên thời gian-không
λb = U . (4) gian độc lập trên cả băng tần hoạt động và ττdt thể hiện
u=1 E[fbu
∗ f ]
bu
tỷ lệ thời gian thực sự được dùng để truyền dữ liệu trong
Ký hiệu zbu là tạp âm Gauss trắng cộng với trung bình một khoảng thời gian kết hợp. Chú ý rằng tốc độ đạt
không và phương sai σ 2 tại thuê bao u ∈ Ub . Ký hiệu được tại mỗi thuê bao phụ thuộc vào cả τp và Nt .
pf là công suất phát trung bình tại trạm gốc để truyền
dữ liệu tới mỗi thuê bao. Chúng tôi giả thiết rằng pf là B. Đánh giá công suất tiêu thụ
bằng nhau cho tất cả thuê bao. Thuê bao u ∈ Ub nhận Chúng tôi có thể chia công suất tiêu thụ trong mạng
được tín hiệu sau đây ở đường xuống thành hai nhóm: công suất bức xạ và công suất tiêu thụ
C
U của mạch điện tử. Chúng tôi giả thiết rằng các phần tử
√
ybu = pf λc h∗cbu fck xf,ck + zf,bu . (5) thiết bị tương đương ở các trạm gốc có giá trị tham số
c=1 u=1 hoạt động giống nhau. Tương tự, chúng tôi giả thiết rằng
các phần tử thiết bị tương đương ở các thiết bị người
III. ĐÁNH GIÁ HIỆU QUẢ SỬ DỤNG NĂNG
sử dụng cũng có giá trị tham số hoạt động giống nhau.
LƯỢNG
Giống như khi đánh giá tốc độ dữ liệu đạt được, trong
A. Đánh giá tốc độ dữ liệu đường xuống đạt được phần này chúng tôi sẽ tính các công suất tiêu thụ thành
Trong bài báo này, để thuận lợi cho việc tính toán, phần ứng với cả băng tần hoạt động B Hz.
chúng tôi giả thiết rằng các trạm gốc sử dụng ma trận 1) Công suất bức xạ: Ký hiệu ηBS là hiệu suất của
mã trước MRT. Ma trận mã trước này được thiết kế dựa bộ khuếch đại công suất tại trạm gốc và ηUE là hiệu suất
trên ước lượng kênh tương ứng, tức là fbu = ĥbbu với bộ khuếch đại công suất ở thiết bị người dùng, trong đó
mọi b ∈ C và u ∈ Ub . Chúng tôi cũng sử dụng phương 0 < ηBS , ηUE ≤ 1. Ký hiệu PRP−p là công suất bức xạ
3
(tính theo Watt) của các thiết bị người sử dụng trong Thứ tư, ký hiệu PBT là công suất tiêu thụ (tính theo
một cell trong giai đoạn truyền tín hiệu hoa tiêu. Ký Watt/bit) để truyền 1 bit dữ liệu đường xuống qua đường
hiệu PRP−f là công suất bức xạ (tính bằng W) của một trục. Khi đó, công suất tiêu thụ phụ thuộc tải tin của
trạm gốc trong giai đoạn truyền dữ liệu đường xuống. đường trục trong cell b được tính như sau
Công suất bức xạ tổng cộng của trạm gốc và các thiết U

bị người dùng trong một cell được tính như sau PBH,b (τp , Nt ) =PBT R̄bu (τp , Nt ) (W). (16)
1 U pp τp pf τd u=1
PRP (τp ) = ∗( + ) (W). (12)
TC ηUE

ηBS
Thứ năm, ký hiệu PLP là công suất tiêu thụ của quá
PRP−p PRP−f trình xử lý tín hiệu tuyến tính. Có hai hoạt động tính
toán chính trong quá trình xử lý tín hiệu tuyến tính tại
Chú ý rằng PRP (τp ) độc lập thống kê với Nt . trạm gốc b: i) xác định ma trận mã trước và ii) nhân
2) Công suất tiêu thụ của mạch điện tử: Trong bài vector ký hiệu cần truyền với ma trận mã trước. Chú
báo này, chúng tôi đề xuất áp dụng một phiên bản sửa ý rằng hoạt động đầu tiên chỉ được thực hiện một lần
đổi của mô hình công suất tiêu thụ của mạch điện trong trong mỗi khung trong khi đó hoạt động thứ hai được
hệ thống truyền dẫn MIMO đa người dùng được đề xuất thực hiện cho mỗi lần sử dụng kênh trong quá trình
trong [9]. Công suất tiêu thụ cho các phần tử mạch điện truyền dữ liệu. Vì vậy, dựa trên mô hình công suất tiêu
tử và cho các hoạt động tính toán được trình bày chi tiết thụ được đề xuất trong [9], chúng tôi tính PLP như sau
trong phần này.
B 3Nt U 2Nt U
Đầu tiên, ký hiệu PTC là công suất tiêu thụ của chuỗi PLP (τp , Nt ) = + τd (W). (17)
thu phát (transceiver chains). Ký hiệu PBS là công suất τt LBS LBS
tiêu thụ của tất cả các phần tử mạch điện tử dành riêng Cuối cùng, ký hiệu PFIX (W) là công suất tiêu thụ
cho một ăngten ở trạm gốc và PUE là công suất tiêu cố định trong một khung truyền dẫn dành cho việc làm
thụ của tất cả các phần tử mạch điện tử dành riêng cho mát nhà trạm, báo hiệu điều khiển và bộ xử lý băng tần
một ăngten ở thiết bị người dùng. Chú ý rằng cả PBS gốc. Chú ý rằng PFIX không phụ thuộc vào τp , Nt và
và PUE không phụ thuộc vào Nt , U và tốc độ dữ liệu. lượng dữ liệu cần truyền.
Theo các kết quả trong [13] chúng tôi có thể tính công Tóm lại, tổng công suất tiêu thụ của mạch điện tử
suất tiêu thụ ở các chuỗi thu phát là trong trạm gốc và các thiết bị người dùng trong cell b
được ký hiệu là PCP,b (τp , Nt ) và được tính như sau
PTC (Nt ) =Nt PBS + U PUE (W). (13)
PCP,b (τp , Nt ) =PFIX + PTC (Nt ) + PCE (τp , Nt )
Công suất tiêu thụ này độc lập với τp .
Thứ hai, ký hiệu PCE là công suất tiêu thụ của quá + PC/D,b (τp , Nt ) + PBH,b (τp , Nt )
trình ước lượng kênh (channel estimation). Ký hiệu LBS + PLP (τp , Nt ) (W). (18)
và LUE là hiệu suất tính toán ở dạng số các phép toán
3) Công suất tiêu thụ tổng cộng: Tổng công suất tiêu
giá trị phức trên Joule (hay số flop/Watt) tại trạm gốc
thụ thực tế của mạch điện là Pb (τp , Nt ) = PRP (τp ) +
và tại thiết bị người dùng. Khi ước lượng kênh truyền,
PCP,b (τp , Nt ). Thay thế Rbu (τp , Nt ) bởi giá trị tất định
trạm gốc b thực hiện phép nhân ma trận Yp,b ∈ C Nt ×τp
tương đương R̄bu (τp , Nt ) trong (15) and (16) và thay thế
với ψ u ∈ Cτp ×1 . Đây là một phép tính đại số tuyến
các kết quả nhận được vào (18), chúng tôi nhận được
tính thông thường và được thực hiện một lần trong mỗi
P̄b (τp , Nt ) là giá trị tất định tương đương của công suất
khung truyền dẫn. Như vậy, chúng tôi có
tiêu thụ tổng cộng ứng với cell b. Chú ý rằng công suất
B 2U Nt τp tiêu thụ tổng cộng phụ thuộc vào cả τp và Nt .
PCE (τp , Nt ) = (W). (14)
τt LBS
C. Tính toán hiệu quả sử dụng năng lượng
Thứ ba, ký hiệu PC/D,b là công suất tiêu thụ của các Hiệu quả sử dụng năng lượng của hệ thống được định
khối mã hoá và giải mã kênh ở trong cell b trong một nghĩa là tỷ số giữa lượng dữ liệu tổng cộng được truyền
khung truyền dẫn. Ký hiệu PCD là tổng công suất tiêu đi thành công trên tổng công suất tiêu thụ tương ứng.
thụ (tín theo Watt/bit) để mã hoá và giải mã một bit Ký hiệu EEb là hiệu quả sử dụng năng lượng của cell
thông tin. Chúng tôi tính được b. Theo định nghĩa, chúng tôi có
U
U
PC/D,b (τp , Nt ) =PCD R̄bu (τp , Nt ) (W). (15) Rbu (τp , Nt )
EEb (τp , Nt ) = u=1 (bit/J). (19)
u=1 Pb (τp , Nt )
4
Bảng I
Vì vậy, giá trị tất định tương đương của hiệu quả sử MỘT SỐ THAM SỐ MÔ PHỎNG
dụng năng lượng của cell b được tính như sau
U Tên tham số Giá trị
R̄bu (τp , Nt ))
EE b (τp , Nt ) = u=1 (bit/J). (20) Công suất phát của UE 24dBm
P̄b (τp , Nt ) Công suất phát của BS 43dBm
IV. KẾT QUẢ MÔ PHỎNG VÀ TÍNH TOÁN SỐ Tần số sóng mang 2GHz
Mật độ tạp âm nhiệt -174dBm/Hz
Trong phần này, chúng tôi mô phỏng một mạng thông Băng thông kết hợp BC 180kHz
tin di động có 7 cell, mỗi cell có hình lục giác đều được
Thời gian kết hợp TC 10ms
bố trí như trong Hình 1. Trong đó, các trạm gốc được
Tăng ích ăngten BS 10dBi
đặt ở trung tâm của cell và được miêu tả bằng hình tròn.
Tăng ích ăngten ở UE 0dBi
Thuê bao có vị trí phân bố đều ngẫu nhiên trong diện
Hệ số tạp âm nhiệt ở BS 5dB
tích của mỗi cell và được miêu tả bằng hình chữ nhật.
Hệ số tạp âm nhiệt ở UE 9dB
Do đến thời điểm bài báo được gửi đăng, 3GPP vẫn
chưa thống nhất bộ tham số cho hệ thống thông tin di Hiệu suất tính toán tại BS 12,8 Gflops/W
động 5G phát triển trên nền LTE/LTE-Advanced. Vì vậy, Hiệu suất tính toán tại UE 5 Gflops/W
chúng tôi có thể sử dụng một phần bộ tham số của hệ Hệ số khuếch đại công suất tại BS 0,39
thống thông tin di động 4G LTE/LTE-Advanced khi xây Hệ số khuếch đại công suất tại UE 0,3
dựng kịch bản mô phỏng. Ví dụ, mô hình suy hao đường Công suất tiêu thụ cố định 18W
truyền là 128, 1 + 37, 6 log10 (d) với d > 0, 035km là Công suất tiêu thụ ứng với một ăng- 1W
khoảng cách truyền dẫn tính theo km. Bảng IV trình bày ten tại BS
một số tham số hệ thống chính dùng trong mô phỏng. Công suất tiêu thụ ứng với một ăng- 0,1W
Chúng tôi sẽ khảo sát hiệu quả sử dụng năng lượng của ten ở UE
cell trung tâm trong Hình 1. Công suất tiêu thụ để mã hóa và giải 0,9 W/(Gbit/s)
mã
Công suất tiêu thụ để truyền dữ liệu 0,25
qua đường trục W/(Gbit/s)
nhất định, tốc độ tăng của tốc độ bit tổng cộng sẽ chậm
hơn tốc độ tăng của tổng công suất tiêu thụ, khiến cho
Thuê
hiệu quả sử dụng năng lượng của hệ thống bắt đầu giảm.
bao
Trạm gốc (BS) Tiếp theo, với U ∈ {6, 12, 18, 24}, số ăng-ten tại trạm
gốc tối ưu về hiệu quả sử dụng năng lượng tương ứng
Hình 1. Mô hình mạng được mô phỏng gồm 7 cell. là Nt∗ = {44, 60, 68, 76}. Hiện nay, một số công ty đã
triển khai thử nghiệm một số hệ thống thông tin di động
Hình 2 trình bày kết quả mô phỏng hiệu quả sử dụng MIMO có tới 128 ăngten nhằm mục đích nghiên cứu và
năng lượng của hệ thống MIMO sử dụng rất nhiều thử nghiệm. Có thể nhận thấy, để tối ưu hiệu quả sử
ăngten ở trạm gốc dưới dạng hàm số của Nt cho các dụng năng lượng trong hệ thống MIMO sử dụng rất
giá trị khác nhau của U ∈ {6, 12, 18, 24}. Từ các kết nhiều ăng-ten ở trạm gốc, số lượng ăng-ten tối ưu nên
quả mô phỏng trên, chúng ta có thể có một số nhận xét triển khai tại mỗi trạm gốc hoàn toàn nằm trong giới
như sau. Trước hết, với U cố định, hiệu quả sử dụng hạn cho phép của các công nghệ hiện có.
năng lượng của hệ thống là một hàm lồi của số ăng-ten Hình 3 trình bày kết quả mô phỏng hiệu quả sử dụng
tại trạm gốc. Điều này có thể giải thích dựa vào tốc độ năng lượng của hệ thống MIMO sử dụng rất nhiều
tăng của tốc độ bit tổng cộng và của tổng công suất ăngten ở trạm gốc là hàm số của U với Nt cho trước.
tiêu thụ khi tăng Nt . Chú ý rằng, tổng công suất tiêu Chúng ta có thể nhận thấy rằng với Nt cho trước, việc
thụ là một hàm tuyến tính bậc nhất của Nt . Trong khi tăng U (sao cho điều kiện U ≤ Nt /2) luôn được thoả
đó, tốc độ bit tổng cộng là một hàm logarithm của Nt . mãn) sẽ làm tăng hiệu quả sử dụng năng lượng trung
Vì vậy, trong miền giá trị Nt nhỏ, khi tăng Nt , hiệu bình của hệ thống. Tuy nhiên, lượng tăng hiệu quả sử
năng sử dụng năng lượng của hệ thống tăng gần như dụng năng lượng trung bình của hệ thống trên mỗi thuê
tuyến tính. Nếu tiếp tục tăng Nt , đến một thời điểm bao mới sẽ giảm đi.
5
2.4
thấy với số ăngten trên trạm gốc cho trước, tăng số thuê
bao trong một cell có thể góp phần làm tăng hiệu quả
2.2
sử dụng năng lượng. Một hướng nghiên cứu tiếp theo
là xác định tìm cách xác định số ăngten tối ưu tại trạm
Hiệu quả sử dụng trung bình [Mbit/J]
2
gốc với số thuê bao trong một cell cho trước. Một hướng
nghiên cứu khác là khảo sát hiệu quả năng lượng của
1.8
các hệ thống MIMO với rất nhiều ăngten ở trạm gốc sử
dụng các loại xử ký tín hiệu tuyến tính phức tạp hơn.
1.6
LỜI CÁM ƠN
1.4 Nghiên cứu này được tài trợ bởi Quỹ phát triển khoa
06 thuê bao/cell học và công nghệ quốc gia (NAFOSTED) trong đề tài
12 thuê bao/cell
1.2
18 thuê bao/cell mã số 102.02-2013.09.
24 thuê bao/cell
1
TÀI LIỆU THAM KHẢO
24 56 88 120 152 184 216 248
Số ăngten ở mỗi trạm gốc [1] F. Rusek, D. Persson, B. K. Lau, E. G. Larsson, T. L. Marzetta,
O. Edfors, and F. Tufvesson, “Scaling up MIMO: Opportunities
Hình 2. Ảnh hưởng của số lượng ăng-ten tại trạm gốc lên hiệu quả sử and challenges with very large arrays,” IEEE Signal Processing
dụng năng lượng trung bình với số thuê bao trong một cell cho trước. Mag., vol. 30, no. 1, pp. 40–60, Jan. 2013.
[2] T. L. Marzetta, “Noncooperative cellular wireless with unlim-
ited numbers of base station antennas,” IEEE Trans. Wireless
2.4
Commun., vol. 9, no. 11, pp. 3590–3600, Nov. 2010.
Hiệu quả sử dụng năng lượng trung bình [Mbit/J]
[3] J. Hoydis, S. ten Brink, and M. Debbah, “Massive MIMO in

2.2 the UL/DL of cellular networks: How many antennas do we
need?” IEEE J. Sel. Areas Commun., vol. 31, no. 2, pp. 160–
171, February 2013.
2 [4] K. T. Truong and R. W. Heath, Jr., “Effects of channel aging in
massive MIMO systems,” J. Commun. Networks, vol. 14, no. 4,
pp. 338–351, Aug. 2013.
1.8 [5] H. Q. Ngo, E. G. Larsson, and T. L. Marzetta, “Energy and
spectral efficiency of very large multiuser MIMO systems,” IEEE
Trans. Commun., vol. 61, no. 4, pp. 1436–1449, Apr. 2013.
1.6 [6] W. Liu, S. Han, C. Yang, and C. Sun, “Massive MIMO or small
Nt = 144 ăngten/BS cell network: Who is more energy efficient?” in Proc. of IEEE
Nt = 128 ăngten/BS Wireless Commun. Networking Conf., Apr. 2013, pp. 24–29.
1.4 [7] D. Ha, K. Lee, and J. Kang, “Energy efficiency analysis with
Nt = 84 ăngten/BS
circuit power consumption in massive MIMO systems,” in Proc.
of IEEE Int. Symp. Personal Indoor Mobile Radio Commun.,
1.2 Sep. 2013, pp. 938–942.
6 9 12 15 18 21
Số thuê bao trong một cell [8] E. Bjornson, J. Hoydis, M. Kountouris, and M. Debbah, “Mas-
sive MIMO systems with non-ideal hardware: Energy efficiency,
Hình 3. Ảnh hưởng của số thuê bao trong một cell lên hiệu quả sử estimation, and capacity limits,” IEEE Tran. Info. Theory, vol. 60,
dụng năng lượng trung bình với số ăng-ten tại trạm gốc cho trước. no. 11, pp. 7112–7139, Nov. 2014.
[9] E. Bjornson, L. Sanguinetti, J. Hoydis, and M. Debbah, “Optimal
design of energy-efficient multi-user MIMO systems: Is massive
MIMO the answer?” IEEE Trans. Wireless Commun., vol. 14,
V. KẾT LUẬN no. 6, pp. 3059–3075, Jun. 2015.
[10] B. Hassibi and B. M. Hochwald, “How much training is needed
in multiple-antenna wireless links?” IEEE Trans. Info. Theory,
Trong bài báo này, chúng tôi đề xuất một phương vol. 49, no. 4, pp. 951–963, Apr. 2003.
pháp phân tích hiệu quả sử dụng năng lượng của đường [11] G. Caire, N. Jindal, M. Kobayashi, and N. Ravindran, “Multiuser
xuống trong hệ thống thông tin MIMO với rất nhiều MIMO achievable rates with downlink training and channel state
feedback,” IEEE Trans. Info. Theory, vol. 56, no. 6, pp. 2845–
ăngten ở trạm gốc với nhiều cell hoạt động trên cùng 2866, Jun. 2010.
băng tần. Phương pháp này dựa trên cách tiếp cận tìm [12] K. T. Truong, A. Lozano, and R. Heath, Jr., “Optimal training
giá trị tất định tương đương và một mô hình khá thực in continuous flat-fading massive MIMO systems,” in Proc. of
IEEE European Wireless Conf., Barcelona, Spain, May 2014, pp.
tế về công suất tiêu thụ trong mạng. Kết quả mô phỏng 1–6.
cho thấy với số thuê bao trong một cell cho trước, tồn [13] S. Cui, A. Goldsmith, and A. Babai, “Energy efficiency of
tại một giá trị số ăngten trên trạm gốc tối ưu. Giá trị tối MIMO and cooperative MIMO techniques in sensor networks,”
IEEE J. Sel. Areas Commun., vol. 22, no. 6, pp. 1089–1098,
ưu này nằm trong giới hạn cho phép của các công nghệ 2004.
chế tạo ăngten hiện nay. Kết quả mô phỏng cũng cho
6
Giải pháp ánh xạ thích nghi cho hệ thống OFDM

bằng mã BICM-ID với các bộ ánh xạ tín hiệu
16-QAM khác nhau
Đỗ Công Hùng
Khoa CNKT Điện tử-Viễn thông
Đại học Thành Đô
Email: conghung@thanhdo.edu.vn, doconghung2000@gmail.com
Abstract— Yêu cầu nâng cao chất lượng lỗi bít và tốc độ truyền Tuy nhiên, các phương pháp thích nghi truyền thống làm
dẫn của một hệ thống thông tin bất kỳ luôn mâu thuẫn với nhau. thông lượng dữ liệu của hệ thống thay đổi nên là một hạn chế
Trong điều kiện kênh fading chọn lọc theo tần số, kỹ thuật với các hệ thống yêu cầu tốc độ dữ liệu không đổi như truyền
OFDM và các giải pháp thích nghi theo bậc điều chế hay rate Audio-Video hai chiều trong thời gian thực. Mặt khác, do quá
matching cho mã Turbo đã được ứng dụng cho hệ thống 4G LTE
trình thích nghi đa mức bị giới hạn bởi ngưỡng SNR mà tại đó
không đảm bảo được yêu cầu cố định về tốc độ truyền dẫn cho hệ
thống. các bộ giải mã vẫn làm việc tốt, do đó việc nghiên cứu các bộ
mã tốt cho hệ thống OFDM luôn là một công việc cần thiết.
So với các phương thức mã kênh truyền thống, việc sử dụng Sau mã Turbo, gần đây mã BICM-ID (Bit Interleaved Coded
mã BICM- ID không chỉ chứng tỏ khả năng về tăng ích mã hóa Modulation with Iterative Decoding) được đề suất sử dụng kết
[12] mà còn có khả năng thích nghi để đảm bảo tốc độ truyền dẫn hợp với OFDM nhằm đạt được chất lượng lỗi bít tốt nhất[4].
không đổi nhờ việc sử dụng các bộ ánh xạ khác nhau. Qua phân tích lý thuyết và các kết quả mô phỏng, chúng
tôi thấy rằng hệ thống BICM-ID OFDM khi sử dụng các phép
Tiếp theo các kết quả chứng minh cho giải pháp thích nghi
ánh xạ symbol Gray, SP, MSEW (Maximum Squared
dung BICM-ID với các bộ ánh xạ 8-PSK khác nhau được trình
bày trong bài báo [13] tại REV10-2006. Bài báo này trình bày các Euclidean Weight)... sẽ cho các đặc tính lỗi bít khác nhau tại
tính toán và kết quả mô phỏng chứng minh cho giải pháp thích các vùng SNR (Signal to Noise Rate) khác nhau. Dựa trên đặc
nghi hệ thống OFDM dùng mã BICM-ID với các bộ ánh xạ 16- tính này, bài báo đề xuất một giải pháp thích nghi mới cho hệ
QAM khác nhau trong điều kiện kênh pha đinh đa đường có sự thống OFDM là thay đổi thích nghi các bộ ánh xạ theo các
tác động đồng thời của tạp âm Gauss. ngưỡng SNR khác nhau, cho phép tối đa hóa đặc tính lỗi bít
trên toàn dải SNR. Giải pháp này mang lại hiệu quả về đáng kể
Keywords- Orthogonal Frequency Division Multiplexing (OFDM), về tỉ lệ lỗi bít mà vẫn đảm bảo được thông lượng thông tin
Adaptive OFDM (AOFDM), Bit Interleaved Coded Modulation không đổi, phù hợp cho các ứng dụng 2 chiều trong thời gian
with Iterative Decoding (BICM-ID).
thực. Sau khi tính toán và tiến hành các thí nghiệm mô phỏng
thành công cho hệ thống BICM-ID- OFDM với bộ điều chế 4
I. GIỚI THIỆU QAM và 8-PSK, chúng tôi tiếp tục tiến hành xây dựng mô
Như đã biết, là một trường hợp đặc biệt của phương thức hình mô phỏng để chứng minh cho hệ thống BICM-ID- OFDM
phát đa sóng mang, trong những năm gần đây OFDM với các bộ điều chế 16-QAM.
(Orthogonal Frequency Division Multiplexing) không ngừng Các nội dung tiếp theo của bài báo được sắp xếp như sau:
được nghiên cứu và mở rộng phạm vi ứng dụng nhờ những ưu Phần II trình bày cơ sở lý thuyết về OFDM và BICM-ID. Phần
điểm của nó trong tiết kiệm băng tần và khả năng chống lại pha III trình bày mô hình mô phỏng hệ thống OFDM-BICM-ID với
đinh chọn lọc theo tần số cũng như xuyên nhiễu băng hẹp. các bộ ánh xạ khác nhau. Phần IV là các kết quả mô phỏng
Cùng với sự ra đời của các chíp FFT (Fast Fourier chứng minh cho giải pháp thích nghi được đề xuất. Phần V là
Transformers) có dung lượng lớn, OFDM đã được ứng dụng các kết luận được rút ra.
rộng rãi trong hệ thống truyền hình kỹ thuật số DVB-T, các
mạng không dây theo chuẩn IEEE 802.11a, b, g, n, các hệ II. CƠ SỞ LÝ THUYẾT
thống Wimax theo chuẩn 802.16 ...và hệ thống thông tin 4G 2.1. Lý thuyết cơ bản về OFDM và AOFDM
theo cả hướng LTE và Wimax.
Nhằm khai thác tối đa dung lượng của hệ thống OFDM Về bản chất, OFDM là một trường hợp đặc biệt của phương
trên các kênh pha đinh băng hẹp, cho đến nay các nghiên cứu thức phát đa sóng mang theo nguyên lý chia dòng dữ liệu tốc
và ứng dụng về OFDM thích nghi (AOFDM) được tiến hành độ cao thành các dòng dữ liệu tốc độ thấp hơn và phát đồng
theo các hướng: điều chế đa mức trên các băng con [2]; thay thời trên một số các sóng mang được phân bổ trực giao với
đổi thích nghi các tham số OFDM [11]; thích nghi các mã nhau. Phổ của tín hiệu OFDM được mô tả ở hình 1.
RSSC, mã turbo cho OFDM [2].
ISBN: 978-604-67-0635-9 7
7
có thể được bù lại bằng cách sử dụng các bộ điều chế đa mức
bậc cao hơn tại các sóng mang có giá trị SNR cao. Tuy nhiên,
các phương pháp thích nghi truyền thống cho OFDM làm
thông lượng dữ liệu của hệ thống thay đổi nên khó ứng dụng
cho các hệ thống yêu cầu tốc độ dữ liệu không đổi như truyền
Audio-Vieo hai chiều trong thời gian thực.
Sau mã Turbo, mã BICM-ID được đề suất từ nhứng năm 1990
bởi nhóm nghiên cứu Li và Ritcey là bộ mã tốt cho truyền dẫn
Hình 1: Phổ của sóng mang và tín hiệu OFDM trên cả kênh Gauss và kênh pha đinh nhờ thừa hưởng ưu điểm
của các mã xoắn cơ sở, tăng ích xáo trộn bít và các thuật toán
Hình 1 cho thấy do tính trực giao, các sóng mang con không bị giải mã lặp [4]. Để làm rõ hơn bộ mã BICM-ID cũng như giải
xuyên nhiễu bởi các sóng mang con khác. Với kỹ thuật đa pháp thích nghi đề xuất cho hệ thống OFDM, chúng ta sẽ phân
sóng mang dựa trên IFFT và FFT, hệ thông OFDM đạt được tích nguyên lý bộ mã BICM-ID trong mục tiếp theo.
hiệu quả không phải bằng các bộ lọc giải thông mà bằng xử lý 2.2. Cơ sở lý thuyết về BICM-ID
băng gốc.
Trong hệ thống OFDM, nhờ thực hiện biến đổi chuỗi dữ liệu từ Đối với kênh tạp âm Gauss trắng cộng tính (AWGN), kỹ thuật
nối tiếp sang song song nên thời gian symbol tăng lên. Do đó điều chế mã lưới TCM [1] đã chứng tỏ là một phương pháp có
sự phân tán theo thời gian gây bởi trải trễ do truyền dẫn đa hiệu quả để ánh xạ các bít được mã hoá vào tập tín hiệu sao
đường giảm. Mặt khác, do chu kỳ phòng vệ CP được chèn vào cho cự li Euclid tối thiểu giữa các từ mã là đủ lớn. Tuy nhiên,
giữa các symbol OFDM nên xuyên nhiễu giữa các symbol (ISI) đối với kênh pha đinh thì tại tỷ lệ tín trên tạp (SNR) cao, chất
hầu như bị loại trừ hoàn toàn (hình 2). Trong khoảng thời gian lượng của mã phụ thuộc vào cự li Hamming tối thiểu giữa các
phòng vệ, symbol OFDM được kéo dài theo chu kỳ để tránh bít mã hơn là phụ thuộc vào cự li Euclid giữa các chuỗi tín
xuyên nhiễu giữa các sóng mang (ICI) [11]. hiệu. Để cải thiện hoạt động của mã TCM trên kênh fading, [2,
3] đã đề xuất một sơ đồ khác gọi là điều chế mã có xáo trộn bít
BICM (Bit Interleaved Coded Modulation). Trong sơ đồ này,
các bít đầu ra của máy mã nhị phân sẽ bị xáo trộn vị trí trước
khi được ánh xạ vào tập tín hiệu. Ngoài việc đạt cự li Hamming
lớn hơn, sơ đồ BICM còn cho khả năng thích ứng tốc độ truyền
dẫn một cách mềm dẻo.
Do sử dụng xáo trộn vị trí ở mức bít chứ không phải là ở mức
tín hiệu, các sơ đồ BICM hoạt động kém trên kênh Gauss [6].
Lý do là vì qui luật ánh xạ lên tập tín hiệu của BICM không thể
Hình 2. Khoảng phòng vệ giữa các Symbol OFDM tối ưu hoá theo tiêu chuẩn cực đại cự li Euclid tối thiểu giữa
các chuỗi tín hiệu. Tuy nhiên, cấu trúc liên kết mã hoá với điều
Với hệ thống sóng mang đơn, một pha đinh hoặc xuyên chế thông qua bộ xáo trộn vị trí cho phép thực hiện giải mã lặp
nhiễu đơn sẽ có tác động tới toàn bộ dữ liệu truyền trên kênh. một cách rất có hiệu quả. Trên thực tế, bộ Biến đổi Tín hiệu-Bít
Trong hệ thống OFDM, do việc truyền dẫn được thực hiện trên BSC (Symbol-to-Bit Converter) thực hiện giải điều chế mềm,
nhiều sóng mang trực giao nhau nên chỉ một phần dữ liệu bị cùng với bộ giải mã vòng ngoài đầu vào mềm-đầu ra mềm
ảnh hưởng. Phần dữ liệu bị sai đó sẽ được sửa bằng các mã sửa SISO (Soft Input-Soft Output) cung cấp thông tin về độ tin cậy
lỗi thích hợp. Vì vậy khả năng chống pha đinh của hệ thống của các bít, cho phép coi cặp Điều chế/Giải điều chế M mức
OFDM phụ thuộc rất nhiều vào khả năng chống nhiễu của các như là log2M kênh nhị phân. Sơ đồ BICM kết hợp với giải mã
bộ mã sửa lỗi. Đó chính là lý do mà các bộ mã sử dụng cho hệ lặp (Iterative Decoding) được ký hiệu là BICM-ID [6]. Việc sử
thống OFDM liên tục được nghiên cứu cải tiến. dụng giải mã lặp không những cải thiện chất lượng của hệ
Nhằm khai thác tối đa dung lượng Shanon biến đổi theo thống trên kênh fading, mà còn cho chất lượng tốt trên kênh
thời gian của các kênh pha đinh băng hẹp, ý tưởng làm thích Gauss [4, 6]. Hơn thể nữa, điểm mấu chốt ở đây là có thể đạt
nghi tốc độ dữ liệu trên mỗi sóng mang OFDM tuỳ thuộc SNR được các hiệu quả BER khác nhau nhờ sự thay đổi phép ánh
của sóng mang đó được Steele và Webb đề suất vào năm 1991. xạ Gray được sử dụng trong bộ tạo mã BICM của Zehavi [4,6].
Sau đó là các nghiên cứu của Sampei-Osaka, Gold Smith-
Stanfor; Peace và Tozer-York; Lau và Mc.Leod - Cambridge
cũng như của L.Hanzzo và các đồng nghiệp [2]. Trong các
kênh pha đinh chọn lọc theo tần số, lỗi bít thường tập trung tại
một vài sóng mang con bị pha đinh, trong khi các sóng mang
khác lại không bị pha đinh. Do đó cần nhận diện các sóng
mang con có xác suất lỗi bít cao trong symbol OFDM và loại
trừ ra khỏi việc mang dữ liệu. Tuy vậy, fading trong miền tần
số có thể làm xấu SNR của một số sóng mang này nhưng lại
làm tăng SNR của các sóng mang con khác nên sự thiệt hại về .
thông lượng dữ liệu do việc loại trừ các sóng mang bị pha đinh Hình 3: Sơ đồ bộ mã hóa và giải mã BICM-ID
8
Với phương pháp giải mã lặp cận tối ưu tại máy thu theo hình lại phụ thuộc rất nhiều vào khoảng cách Euclid của các bít
2, bộ giải mã Viterbi được thay bằng bộ giải mã đầu vào và đầu trước đó và tỉ lệ SNR của tín hiệu.
ra mềm (SISO) [9]. Đầu ra của nó được phản hồi tới bộ giải Tóm lại, chất lượng của BICM-ID phụ thuộc rất nhiều vào cấu
điều chế để tính lại giá trị bít. Tại bộ giải điều chế, giá trị tỉ lệ trúc các phép ánh xạ tín hiệu trong hệ thống. Nhận xét này
hợp lẽ theo hàm log (LLR) được xác định theo thuật toán cực đúng cho tất cả các bộ điều chế khác nhau. Trong bài báo này,
đại xác suất hậu nghiệm (MAP): chúng ta xét cụ thể cho bộ điều chế 16-QAM.
P(vti  1/ rt )
 P(rt / st ) P(st ) Cấu trúc và sự biểu diễn cự li bít của các bộ ánh xạ 16-QAM
LLR(v ) log
 
i
log
st S1i truyền thống được mô tả tại hình 4.
 P(rt / st ) P(st )
t
P(vti  0 / rt ) Trước hết, theo truyền thống bộ ánh xạ Gray (hình 4.a) được
st S0i
coi là tối ưu do các điểm lân cận trên constellation chỉ khác
 -||rt  t st ||2  m nhau 1 bít. Nếu giải điều chế nhầm giữa hai điểm lân cận chỉ
 exp  N0   P (v t )
i
dẫn đến sai 1 bít tín hiệu Nhận định này vẫn đúng trong giải mã
st S1i   j 1
= log (2) lặp tại SNR thấp hoặc khi số vòng lặp thấp (khi hệ thống làm
 -||r   s ||2  m
i exp  t N t t   i
P (v t ) việc ở chế độ thông tin tiên nghiệm thấp).
st S0  0  j 1 Tại SNR cao, hệ thống làm việc dựa vào thông tin tiên nghiệm
i
L (v ) (4) để tính toán (3), với thông tin đầy đủ từ 2 bít kia trong
Trong đó e t là giá trị thông tin ngoài (Extinsic symbol, bộ giải điều chế 16-QAM đưa về giải điều chế nhị
Information) được tính bởi bộ giải điều chế là: phân. Do đó khoảng cách Euclid giữa 2 điểm quyết định tới độ
i i
tin cậy khi quyết định bít còn lại đó là 0 hay 1.
i P(vt  1/ rt ) P(vt  1) Trong constellation 16-QAM chuẩn hoá, phép ánh xạ Gray các
Le (vt ) log i
 log i
 P(vt 0 / rt ) P(vt 0) bít 1, 2, 3,4 có các cự ly Euclid không đều và cự ly bình
 -||rt  t st ||2  m phương tối thiểu là 4 nên giá trị thông tin ngoài và độ tin cậy
 exp  N   P (v t )
i
bản thân thấp.
st S1i  0  j 1, j  i
= log (3) Dù có thông tin từ 2 bít kia việc xác định bít còn lại vẫn dễ bị
 -||rt  t st ||2  m
 exp  N   P (v t )
i
nhầm lẫn. Do đó, với thuật toán giải mã lặp, rõ ràng phép gán
st S0i  0  j 1, j i nhãn Gray không phải là sự lựa chọn hoàn hảo. Chúng ta cần
i tìm các phép ánh xạ khác có các cự ly bít cao hơn nhằm có
P (v )
t là xác suất được tính theo thông tin phản
Trong đó được chất lượng BER tốt hơn ở vùng SNR cao (khi có giá trị
hồi từ bộ SISO sau khi xáo trộn và được tính theo công thức: thông tin ngoài lớn).
 exp(La (vit )) i Chúng tôi tìm ra một phương pháp đơn giản nhưng hữu hiệu
 ; vt  1
i
i
 1  exp(La (vt )) trong thiết kế các bộ ánh xạ symbol M-PSK và M-QAM cho bộ
P (v t )   (4) mã BICM-ID.
 1 i
; v 0
1  exp(L (vi )) t
 a t 1111
CU LY BIT 1
1011 1010 1110
1111
CU LY BIT 2
1011 1010 1110
Thông tin này được đưa tới bộ giải mã mềm sau khi giải
xáo trộn bít. Nhờ bộ xáo trộn bít, các bít đã mã hoá ban đầu ở 0111 0011 0010 0110 0111 0011 0010 0110
xa nhau có thể được liên kết về một cùng một symbol kênh.
Với xáo trộn lý tưởng, sự phản hồi từ các vùng dữ liệu mạnh (ít 0101 0001 0000 0100 0101 0001 0000 0100
bị ảnh hưởng của nhiễu kênh) có thể loại bỏ tình trạng tranh
chấp trong điều chế bậc cao và cải thiện quá trình giải mã tại
các vùng dữ liệu yếu. Với thông tin đầy đủ của các bít khác 1101 1001 1000 1100 1101 1001 1000 1100
trong một symbol, điều chế M-PSK hay M-QAM được đưa về
điều chế nhị phân cho mỗi vị trí bít. Tuy nhiện, nếu việc phản 1111
CU LY BIT 3
1011 1010 1110
CU LY BIT 4
hồi chứa lỗi thì chúng ta sẽ nhận được một constellation nhị 1111 1011 1010 1110
phân sai. Do đó, phản hồi mềm, xáo trộn được thiết kế tốt và
kiểm soát lỗi là điểm mấu chốt đển nhận được các tăng ích của 0111 0011 0010 0110 0111 0011 0010 0110
BICM-ID.Dù có phức tạp hơn phản hồi quyết định cứng, phản
hồi mềm là điểm mấu chốt để có được tăng ích của BICM-ID
trong khi giảm việc truyền lỗi. 0101 0001 0000 0100 0101 0001 0000 0100
2.3. Thiết kế các bộ ánh xạ tín hiệu 16-QAM

Chất lượng tổng thể của hệ thống BICM-ID phụ thuộc vào chất
1101 1001 1000 1100 1101 1001 1000 1100
lượng giải điều chế khi chưa có thông tin tiên nghiệm (khi hệ (a) Gray mapping [11 10 7 6 12 9 8 5 15 14 3 2 16 13 4 1]
thống làm việc ở vùng SNR thấp) và mức độ cải thiện khi có
lượng thông tin phản hồi trong các lần lặp sau (khi hệ thống
làm việc ở vùng SNR cao). Độ tin cậy của lượng tin phản hồi
9
CU LY BIT 1 CU LY BIT 2 CU LY BIT 3 CU LY BIT 4

0000 0001 0010 0011 0000 0001 0010 0011 1111 1001 1010 1110 1111 1001 1010 1110
0100 0101 0110 0111 0100 0101 0110 0111 0110 0011 0010 0111 0110 0011 0010 0111
1000 1001 1010 1011 0101 0001 0000 0100 0101 0001 0000 0100
1000 1001 1010 1011
1101 1011 1000 1100 1101 1011 1000 1100

1100 1101 1110 1111 1100 1101 1110 1111
Gray modified mapping

CU LY BIT 3 0000
CU LY BIT 4
0001 0010 0011
[11 10 7 6 12 9 5 8 15 2 3 14 16 13 4 1]
0000 0001 0010 0011 CU LY BIT 2
CU LY BIT 1 0100 1111 1010 0001
0100 1111 1010 0001
0100 0101 0110 0111

0100 0101 0110 0111
0010 1001 1100 0111
0010 1001 1100 0111
1000 1001 1010 1011 1000 1001 1010 1011 1110 0101 0000 1011
1110 0101 0000 1011
1100 1101 1110 1111 1100 1101 1110 1111 1000 0011 0110 1101 1000 0011 0110 1101
(b) SP mapping [1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16]

CU LY BIT 3 CU LY BIT 4
0100 1111 1010 0001 0100 1111 1010 0001
Hình 4. Các sơ đồ ánh xạ 16-QAM truyền thống

0010 1001 1100 0111 0010 1001 1100 0111
Từ công thức (3) cho thấy rằng giá trị LLR của mỗi bít trong
nhãn nhị phân của tín hiệu phụ thuộc vào tín hiệu thu được và
phụ thuộc vào thông tin về các bít khác, ngoài bít đang xét, 1110 0101 0000 1011 1110 0101 0000 1011
được phản hồi về từ bộ giải mã. Giả thiết rằng thông tin phản
m
hồi là đủ tin cậy, kênh truyền với điều chế M  2 mức có 1000 0011 0110 1101 1000 0011 0110 1101
thể được coi là m kênh truyền song song. Mỗi symbol 16- MSEW mapping
QAM tương ứng với 4 bít và mỗi phép ánh xạ của 16-QAM [11 4 5 14 1 10 15 8 13 6 3 12 7 16 9 2]
 p  p1 , p2 ......., p16  Hình 5. Sơ đồ ánh xạ Gray modified và MSEW
được biểu diễn bằng một véc tơ
pi , 1  i  16 Do có các khoảng cách Euclid khác nhau, mỗi bộ ánh xạ sẽ
với đại diện cho điểm 1 tín hiệu được dán nhãn
   1 , v 2 , 3 , 4 
mang lại cho hệ thống OFDM-BICM-ID một đặc tính BER
nhị phân p
có giá trị trong hệ đề các là theo SNR khác nhau. Cũng có thể thấy rằng, mỗi bộ ánh xạ tín
i. hiệu chỉ có thể cho kết quả BER tốt tại một vùng SNR nhất
Các bộ ánh xạ mới được thiết kế dựa trên ánh xạ từ khối bít tới định. Từ nhận xét này, chúng tôi đề suất biện pháp thích nghi
constenlation sao cho bít có độ bảo vệ bít thấp được kết hợp mới cho hệ thống OFDM sử dụng mã BICM-ID. Đó là căn cứ
với bít có độ bảo vệ bít cao hơn. Như vậy độ bảo vệ bít trung vào các giá trị SNR trên mỗi sóng mang OFDM, ta sử dụng
bình của cả khối bit sẽ lớn hơn. Vậy nhờ các biến đổi tuyến một phương pháp ánh xạ khác nhau, đảm bảo đặc tính BER tối
tính đơn giản, chúng ta có thể tìm được các bộ ánh xạ symbol đa cho hệ thống mà vẫn đảm bảo được thông lượng thông tin là
mới, có các cự ly bít lớn hơn như các bộ ánh xạ Gray modified không đổi.
và MSEW (Hình 5). Phương pháp thiết kế các bộ ánh xạ khác nhau được trình bày
CU LY BIT 1 CU LY BIT 2 trong tài liệu [14].
Quá trình mô phỏng tiếp theo được thực hiện để minh hoạ cho
1111 1001 1010 1110 1111 1001 1010 1110
hiệu quả của giải pháp thích nghi trên.

0110 0011 0010 0111
III. MÔ HÌNH HỆ THỐNG
0110 0011 0010 0111
0101 0001 0000 0100 0101 0001 0000 0100

3.1. Mô hình mô phỏng hệ thống OFDM
Sơ đồ mô phỏng hệ thống OFDM được xây dựng theo mô hình
chuẩn HIPERLAN-II, bộ điều chế 16-QAM sử dụng mã xoắn
1101 1011 1000 1100 1101 1011 1000 1100
(7, [133, 171]) lấy tương thích mô hình SIMULINK của phần
mềm MATLAB.
Khi truyền tín hiệu 16QAM qua kênh Rice có hệ số K=4 và độ
dịch tần Doppler D=40Hz, đồng thời chịu tác động của tạp âm
10
10
Gauss tại SNR=10 dB, constellation của bộ tín hiệu bị xoay

pha và phân tán đến mức không thể nhận ra được (hình 6.a).
KET QUA BER HE THONG OFDM HIPERLAN II-16QAM
0
10
k=4
-1 k=16
10
k=32
k=100
-2
10 k=1000
Gauss
-3
10
BER
-4
10
-5
10
-6
10
-7
10
0 5 10 15 20 25
SNR
(a) (b)
Hình 6.(a) Constellation của bộ tín hiệu 16-QAM trên kênh
pha đinh Rice với hệ số k=4, độ dịch tần D=40Hz, đồng thời
với tạp âm Gauss với SNR=10dB .(b) kết qủa BER của hệ
thống OFDM-16 QAM dùng mã xoắn (7,[133,171]) với k khác
nhau.
Hình 7 b. Khối Điều chế 16-QAM với các bộ ánh xạ
Cũng với mô hình trên khi k=1000 thì kết quả khảo sát BER
của Hệ thống khi truyền trên kênh Rice tiệm cận với kết quả Sau một số thí nghiệm, chúng tôi chọn các phép ánh xạ điển
BER khi truyền trên kênh Gauss. Chúng ta thấy rằng hệ thống hình nhất, tức các phép ánh xạ cho các kết quả khác nhau nhất
OFDM với bộ mã xoắn truyền thống chỉ có thể hoạt động tốt ở các vùng SNR khác nhau là SP, Gray, Gray modified và
trên kênh Gauss hoặc kênh Rice có hệ số K > 100 và tương đối MSEW như đã nêu tại mục 2.2.
tĩnh (D<40Hz).
3.2. Mô hình mô phỏng hệ thống Adapptive OFDM-BICM-ID
Mô hình hệ thống OFDM sử dụng mã BICM-ID thiết kế cho
bộ điều chế 16-QAM được mô tả tại hình 7.
Hình 7c. Khối Giải điều chế 16-QAM với các bộ ánh xạ
Hệ thống AOFDM-BICM-ID được thích nghi trên cơ sở các

băng con gồm 48 sóng mang con dữ liệu và 4 sóng mang Pilot
như trên.Việc thích nghi trên các băng con như vậy sẽ làm đơn
Hình 7a. Mô hình hệ thống OFDM sử dụng mã BICM-ID
giản hoá việc truyền các thông tin báo hiệu [2].
Trong mô hình, các khối chức năng được thiết kế từ các khối IV. KẾT QUẢ
trong thư viện simulink của gói phần mềm mô phỏng
MATLAB 7.0. Các tham số trên mỗi băng con OFDM được Kết quả mô phỏng hệ thống AOFDM-BICM-ID với các
chọn tương tự như chuẩn HIPERLAN-II: Số sóng mang dữ liệu phương pháp ánh xạ khác nhau được thể hiện trên hình 8.
trên mỗi băng con là 48, số sóng mang Pilot là 4, kích cỡ FFT Đường cong đánh dấu sao trên các hình 8 b, c, d mô tả đặc tính
là 64. Bộ mã cơ sở dùng cho BICM-ID cũng là mã xoắn (7, lỗi bít của hệ thống OFlDM theo chuẩn HIPERLAN II, có các
[133,171]) với số lần lặp bằng 3. tham số OFDM tương tự và dùng mã xoắn (7, [133,171]) thông
Về các khối cơ bản, hệ thống cho 16QAM tương tự hệ thống 8- thường
PSK, nhưng việc thiết kế cụ thể BICM-ID với các bộ ánh xạ Tại vòng lặp đầu tiên, phép ánh xạ Gray cho kết quả BER tốt
16-QAM phức tạp hơn rất nhiều. nhất, đúng theo phân tích tại mục 3.2.
11
11
HộiHội
Thảo Quốc
Thảo Gia
Quốc Gia2015
2015về
vềĐiện
Điện Tử,
Tử,Truyền
Truyền Thông vàCông
Thông và CôngNghệ
Nghệ Thông
Thông TinTin (ECIT
(ECIT 2015)
2015)
Giải pháp thích nghi trên không chỉ áp dụng cho các hệ thống
KET QUA BER HE THONG OFDM-BICM-ID 16-QAM-MA (3,[5,7]) LAP 1 0
KET QUA BER HE THONG OFDM-BICM-ID 16-QAM-MA (3,[5,7]) LAP 3
0
10 10
SP SP
-1
Gray
Graymodified
10
-1 Gray
Graymodified OFDM 8-PSK hay 16-QAM mà hoàn toàn có thể mở rộng cho
các bộ điều chế M-QAM bậc cao hơn.
10 MSEW MSEW
-2
Adaptive 10 Adaptive
HIPERLAN-II Hiperlan II
-3
Kết quả nghiên cứu khảo sát chất lượng các hệ thống OFDM-
BER
-2
BER
10 10
-3
10
10
-4
BICM-ID so sánh với việc sử dụng mã Convolution hay Turbo

10
-5
và tăng ích của nó trong các ứng dụng cụ thể như Truyền hình
số sẽ được trình bày trong các bài báo tiếp theo.
-4 -6
10 10
2 3 4 5 6 7 8 9 10 11 12 2 3 4 5 6 7 8 9 10 11 12
SNR SNR
(a) (b)
10
0
KET QUA BER HE THONG OFDM-BICM-ID 16-QAM-MA (3,[5,7]) LAP 6
10
0
KET QUA BER HE THONG OFDM-BICM-ID 16-QAM-MA (3,[5,7]) LAP 9 TÀI LIỆU THAM KHẢO
[1] S.Hara, R.Prasad, 2003 ''Multicarier Techniques for 4G Mobile
SP SP
-1 Gray -1 Gray
10 10
Communications''.
Graymodified Graymodified
-2 MSEW -2
MSEW
10 Adaptive 10 Adaptive
10
-3
Hiperlan II
10
-3
HIPERLAN-II
[2] L. Hanzo, W. Webb, and T. Keller, „‟Single-and Multi-Carrier
Quadrature Amplitude Modulation‟‟. New York: IEEE Press/Wiley,
BER
BER
-4 -4
10 10
-5 -5
Apr. 2000.
10 10
-6 -6
[3] Zhang Zhao-yang, Lai Li-feng,2003 ''A novel OFDM transmission
scheme with leng- adptive Ciclic Prefix‟‟Journalof Zhejiang University
10 10
Science ISSN 1009-3095.

-7 -7
10 10
2 3 4 5 6 7 8 9 10 11 12 2 3 4 5 6 7 8 9 10 11 12
SNR SNR
(c) (d) [4] X. Li and J. A. Ritcey, “Bit-interleaved coded modulation with iterative
decoding,” IEEE Commun. Lett., vol. 1, pp. 169–171, Nov. 1997.
Hình 8. Kết quả BER hệ thống AOFDM-BICM-ID16-
[5] A. J. Viterbi and J. K. Omura, Principles of Digital Communication and
QAM lặp 1, 3, 6, 9 với các phép ánh xạ tín hiệu Coding. New York: McGraw-Hill, 1979.
[6] E. Zehavi, “16-QAMtrellis codes for a Rayleigh fading channel,” IEEE
Sau 3,6,9 chu kỳ giải mã lặp, hệ thống đạt được các BER khác Trans. Commun., vol. 40, pp. 873–883, May 1992.
nhau tại các vùng SNR khác nhau nhờ tăng ích giải mã lặp [7] G. Ungerboeck, “Channel coding with multilevel/ phase signals,” IEEE
(hình 6.b,c,d). Lúc này hiệu quả thích nghi (được biểu diễn Trans. Inform. Theory, vol. 28, pp. 56–67, Jan. 1982.
bằng các đường cong đánh dấu tròn) trở nên rõ rệt. [8] G. Caire, G. Taricco, and E. Biglieri, “Bit-interleaved coded modula-
Theo kết quả hình 8 (b) với BER mục tiêu bằng 10-4, chỉ với tion,” IEEE Trans. Inform. Theory, vol. 44, pp. 927–946, May 1998.
số vòng lặp bằng 3, hệ thống thích nghi đã có tăng ích tới 3 dB. [9] S. Benedetto, D. Divsalar, G. Montorsi, and F. Pollara, "A soft-input
soft-output APP module for iterative decoding of concatenated codes",
Dựa trên các kết quả đạt được, hoàn toàn có thể kết luận rằng IEEE Commun. Letters, vol. 1, pp. 22-24, Jan. 1997.
việc đề xuất sử dụng bộ mã BICM-ID cũng như phương pháp [10] X. Li, A. Chindapol, and J. A. Ritcey, "Bit-Interleaved coded
thích nghi mới cho hệ thống OFDM với các bộ ánh xạ khác modulation with iterative decoding and 8PSK signaling," IEEE Trans.
nhau có thể mang lại những tăng ích vượt trội về tỉ lệ lỗi bít khi on Commun., vol. 50, no. 8, pp. 1250-1257, Aug. 2002.
truyền dẫn qua kênh pha đinh có sự tác động đồng thời của [11] R.Van. Nee, ,“OFDM for Wireless Mutimedia Commu.,” Artech House,
nhiễu Gauss trong khi vẫn đảm bảo thông lượng của hệ thống Boston, London, 2000.
không đổi là 4bit trên một sóng mang con. [12] Đỗ Công Hùng, Đinh Thế Cường, Nguyễn Quốc Bình, “Nâng cao Chất
lượng Hệ thống OFDM bằng BICM-ID”, Chuyên san Các công trình
nghiên cứu- Triển khai Viễn thông và Công nghệ thông tin, Bộ Bưu
V. K ẾT LU ẬN chính Viễn thông, tháng 2/2007.
Dựa trên cơ sở lý thuyết của OFDM và mã BICM-ID, bài báo [13] Do Cong Hung, Tran Xuan Nam, Dinh The Cuong, “Adaptive Mapping
này đã xây dựng thành công mô hình mô phỏng hệ thống for BICM-ID OFDM Systems”, Biennial Vietnam conference on Radio
and Electronics (REV 2006), November 6-7, 2006.
OFDM-BICM-ID với các bộ ánh xạ 16-QAM khác nhau. Các
[14] Đỗ Công Hùng, Đinh Thế Cường, Nguyễn Quốc Bình , “ Phương pháp
kết quả mô phỏng trên khôn chỉ một lần nữa chứng minh chất thiết kế các bộ ánh xạ tín hiệu cho hệ thống AOFDM dùng mã BICM-
lượng lỗi bít vượt trội của hệ thống OFDM-BICM-ID so với hệ ID”, Tạp chí Khoa học và Kỹ thuật, Học viện KTQS, số 117 (IV-2006).
thống OFDM sử dụng các mã truyền thống mà còn đảm bảo [15] Zhixing Yang, Qiuliang Xie, Kewu Peng, and Jian Song, “ Labeling
tốc độ truyền dẫn không đổi trong điều kiện kênh pha đinh Optimization for BICM-ID Systems”, IEEE Communications Letters,
chọn lọc theo tần số. Vol. 14, No. 11, November 2010.
12
12
Quy hoạch tần số cho hệ thống thông tin di đông
Quy hoạch tần

thế số
hệ cho
thứ hệ thống
5 tại Việtthông
Nam tin di đông
thế hệ thứ 5 tại Việt Nam
Đoàn Quang Hoan Nguyễn Anh Tuấn
Cục Tần số vô tuyến điện Cục Tần số vô tuyến điện
Hà Nội,
Đoàn Việt Hoan
Quang Nam Hà Nội, Anh
Nguyễn Việt NamTuấn
dqhoan@rfd.gov.vn natuan@rfd.gov.vn
Cục Tần số vô tuyến điện Cục Tần số vô tuyến điện
Hà Nội, Việt Nam Hà Nội, Việt Nam
dqhoan@rfd.gov.vn natuan@rfd.gov.vn
đại. Tuy nhiên, số lượng kết nối thiết bị cá nhân chủ đạo sẽ
Tóm tắt— Thế giới đang hướng tới mạng thông tin kết nối
là qua mạng vô tuyến. Việc kết nối mọi loại hình, phương
rộng khắp và kết nối mọi loại hình thiết bị. Thiết bị thông tin di
động ngày càng đa dạng và đang là thành phần thiết yếu của thức tạo ra một mạng kết nối rộng khắp, kết nối mọi phương
đại.
thức,Tuy nhiên,xem
đó được số lượng
như là kết mạng nốikết thiết
nốibịInternet
cá nhânofchủ đạo sẽ
Things.
Tóm tắt— Mạng
cuộc sống. Thế giớithôngđangtin hướng
di độngtới thếmạng
hệ thứ thông
5 cầntinphải
kết đáp
nối
là qua mạng vô tuyến. Việc kết nối mọi loại hình, phương
rộng
ứng nhukhắpcầu và về
kếttốc
nốiđộmọicao loạivàhình
dungthiết bị. Thiết
lượng dữ liệu bị lớn,
thôngkếttinnối
di
động thức tạo ra Như mộtvậy,
mạng mạng kết thông
nối rộng tin khắp,
vô tuyến kết thế
nối hệmọithứ 5 với
phương
nhiều ngày
thiết càng
bị cùngđa dạng
lúc, độ vàtrễ
đang là và
thấp thành phần
độ tin cậythiết
cao yếu
khi của
mà
cuộc nhu cầu
thức, cao vềxem
đó được tốcnhưđộ là dữmạngliệu và kếtthời gian thực,
nối Internet sẽ dẫn tới
of Things.
mạngsống.
thôngMạngtin thếthông
hệ thứ tin4 di
chưađộngđápthế hệđược.
ứng thứ 5Bài cầnbáophải
này đáp
sẽ
ứng
đánhnhu giá cầu về tốctrạng
lại hiện độ cao quyvàhoạch
dung và lượng dữ liệu
sử dụng lớn, tần
băng kết cho
nối nhu cầu cao về phổ tần. Cùng với đó là nhu cầu về việc áp
dụng công Nhưnghệ vậy,
mới mạng thông
để nâng cao tinhiệu
vô tuyến
năng sử thếdụng
hệ thứ phổ5 tần.
với
nhiều
thông thiết
tin dibịđộng
cùngcủa lúc,Việt
độ trễ
Nam. thấp và độ
Đồng thờitinđánh
cậy cao khităng
giá sự mà
nhu cầu cao về tốc độ dữ liệu và
Do đó, trong tương lai ngoài việc chuyển đổi công nghệ thời gian thực, sẽ dẫn tới
mạng
trưởngthông tin thế
của thị hệ thứ
trường 4 chưa
thông đápđộng
tin di ứng giai
được. Bài 2011-2014,
đoạn báo này sẽ
đánh nhu
thông tin vô tuyến trên các băng tần hiện có được phẩn áp
cầu cao về phổ tần. Cùng với đó là nhu cầu về việc bổ
dự báogiánhu lại cầu
hiệngiai
trạng
đoạnquy hoạch và
2015-2020 đểsử dụng
đánh giábăng tần phổ
nhu cầu cho
thông
tần đốitinvớidithông
độngtin củadi Việt
động Nam. Đồngcủa
băng rộng thời
Việtđánh
Nam. giáDựa
sự tăng
trên dụng công nghệ
cho thông tin dimớiđộng để cần
nângphải cao xemhiệu năng
xét tới sửviệc
dụngtìm phổkiếm
tần.
trưởng
các phân của
tíchthịnày,
trường
bài báothôngphân tintích
di động
những giaikhóđoạn
khăn2011-2014,
và thuận Do
băngđó, tầntrong
mới cho tươngthông lai tin
ngoàidi độngviệc băng
chuyển rộng. đổiViệccôngnghiên
nghệ
dự báo nhu
lợi trong việccầuquảngiailýđoạn 2015-2020
tài nguyên để Tác
tần số. đánhgiảgiá nhusẽcầu
cũng đưaphổ ra thông
cứu nhu cầu phổ tần cho thông tin di động băng rộng bổ
tin vô tuyến trên các băng tần hiện có được phẩn đã
tần
giải đối
phápvớiquy
thông tin dilạiđộng
hoạch các băng
băng rộng của Việt
tần hiện có cho Nam. Dựatin
thông trên
di cho
đượcthôngLiên tin minhdi động
viễn thôngcần phải quốc xem tế xét
khởitớisướng,việc tìm nhiềukiếm tổ
các
độngphân
băngtích này,vàbài
giảibáo phântìmtích những khó khăn
băngvàtầnthuận băng tần mới cho thông
đã và tin di nghiên
động băng cứu.rộng. Việc nghiên
rộng pháp kiếm quy hoạch mới
lợi trong việc quản lý tài nguyên tần số. Tác giả cũng sẽ đưa ra chức quốc tế cũng đang Mặc dù vậy đánh
cho thông tin di động băng rộng của Việt Nam. cứu nhu nhu
giá đúng cầu cầuphổ phổ
tần tần chocủa thôngmỗitin quốcdi gia
độnglà băng
rất khác rộngnhau đã
giải pháp quy hoạch lại các băng tần hiện có cho thông tin di được Liên minh viễn thông quốc tế khởi sướng, nhiều tổ
động băng rộng và
Keywords— giải pháp
IMT- tìm kiếmIMT-2020
Advanced, quy hoạch and băng tần mới
beyond, tùy thuộc vào điều kiện kinh tế -xã hội . Ví dụ như nhu cầu
chức quốc tế cũng đã và đang nghiên
của nước đang phát triển sẽ rất khác so với nhu cầu của cứu. Mặc dù vậy đánh
spectrum
cho tin di động băng rộng của Việt Nam.
thông requirement giá đúng nhuđã cầuphát
phổtriển.
tần của mỗi
những nước Việc tìmquốckiếmgiabăng là rấttầnkhác
mớinhaucho
Keywords— IMT- I.Advanced,
GIỚI THIỆU
IMT-2020 and beyond, tùy
thông tin di động băng rộng nghĩa là sẽ xem xét phânnhu
thuộc vào điều kiện kinh tế -xã hội . Ví dụ như chiacầulại
spectrumNhững
requirement của
một nước
số băng đangtần phát
đangtriển phânsẽchia rất cho
khácnhững so với nhu vụ
nghiệp cầukhác
của
mạng thông tin di động thế hệ thứ 4 (4G)
những
như truyềnnướchình, đã phát
hànhtriển.
không, Việc hàng tìmhải,kiếm băng vô
vệ tinh, tầntuyến
mới mặt
cho
đang được phát triển đã I. đápGIỚIứng THIỆU
phần nào về nhu cầu dịch
thông tin di động băng rộng nghĩa là
đất. Nghĩa là xem xét thu hẹp các băng tần đang phân chia sẽ xem xét phân chia lại
vụ thông tin vô tuyến như thoại, dữ liệu, hình ảnh, video với
Những một số băng tần đang phân chia cho những nghiệp vụ khác
tốc độ cao hơn. mạng
Tuy nhiên, thôngtrongtin ditương
động lai thếngười
hệ thứ 4 (4G)
dùng cần cho các nghiệp vụ này để tạo ra băng tần mới cho thông tin
đang như truyền hình, hành
Đâykhông, hàng
nội hải,
dungvệrấttinh, vôtrọng
tuyếnđược
mặt
những kết nối nhanh hơn với thời gian thực hơn, chỉ với dịch
được phát triển đã đáp ứng phần nào về nhu cầu một di động băng rộng. cũng là quan
vụ thông tinlàvôchúng
tuyến tanhư đất. Nghĩa là xem xét thu hẹp các băng tần đang phân chia
click chuột sẽ thoại,
có những dữ liệu,
thứ hình
mìnhảnh, cần.video
Nghĩavới là bàn thảo tại Hội nghị vô tuyến thế giới năm 2015. Tại Hội
tốc độ cao hơn. Tuy nhiên, trong tương lai người dùng cần cho
nghịcácnàynghiệp
các nước vụ thành
này đểviên tạo củara băng
Liên tần
minh mớiviễnchothông
thông quốctin
độ trễ thấp và kết nối thông tin thực sẽ là những yêu cầu cho
những kết nốitinnhanh hơntươngvới thời di động băng rộng. Đây cũng là nội dung rất quan trọng được
mạng thông di động lai gian
và cũngthựclàhơn, chỉ với
để đáp ứngmộtxu tế (ITU- International Telecommunication Union) sẽ bàn
click chuột là chúng ta sẽ có những thứ mình cần. Nghĩa là bàn
thảo thảo tại Hội
về những nghị
băng tầnvô dướituyến 6GHz thế tiềm
giới năng
năm có 2015. Tại Hội
thể phân bổ
hướng phát triển các ứng dụng mới như là Y tế, giáo dục, an
độ trễ thấp và kết nối thông tin thực sẽ là những yêu cầu cho nghị
cho thông tin di động băng rộng. Dự kiến những băngquốc
này các nước thành viên của Liên minh viễn thông tần
ninh công cộng, an toàn cứu nạn, văn phòng điện tử, giải trí
mạng thông tế
trên(ITU-
6GHzInternational
sẽ được bàn Telecommunication Union)
tin vôsẽtuyếnbàn
và nhiều lĩnhtinvực di động
khác. tương
Cùng lai vớivàđó,cũngngườilà đểsử đáp
dụng ứng xu
cũng thảo tại Hội nghị thông
hướng phát triển các ứng dụng mới như là Y tế, giáo dục, an thảo về những
thế giới năm 2019. băng tần dưới 6GHz tiềm năng có thể phân bổ
phải được đảm bảo cung cấp dịch vụ tốt nhất ngay cả nơi
ninh công cộng, an toàn cứu nạn, văn phòng điện tử, giải trí cho thông tin di động băng rộng. Dự kiến những băng tần
mật độ thuê bao cao, cùng sử dụng tại một địa điểm và một
và nhiều lĩnh vực khác. Cùng với đó, người sử dụng cũng trên 6GHz Trong
sẽ đượcnội bàn
dungthảo bàitạibáo Hộinày nghị tácthông
giả sẽ tin tập trung
vô tuyến
thời điểm. Ví như những nơi mua sắm, sân vận động, lễ hội
phải được hoạtđảmđộng bảo cung phângiới
thế tíchnăm
đánh giá hiện trạng quy hoạch và sử dụng băng tần
2019.
và những xã hộicấp khác.dịchNgoài
vụ tốtra,nhất
nhữngngay cả bao
thuê nơi
mật độ thuê bao cao, cùng sử dụng tại một địa điểm và một cho thông tin di động của Việt Nam. Đồng thời dự báo nhu
cần được cung cấp dịch vụ thông tin tốt nhất ngay cả khi sử
thời cầu, tăngTrong tưởngnội củadung bài báo
thị trường này tin
thông tác digiảđộngsẽ tập củatrung
Việt
dụngđiểm. Ví như
trên các phương những tiệnnơi
giaomuathôngsắm,disânchuyển
vận động,
với tốclễ hội
độ phân
và Nam. Trong bài viết này tác giả cũng sẽ trình bàybăng
tích đánh giá hiện trạng quy hoạch và sử dụng phương tần
cao như tàu cao tốc, hay là trên máy bay. Thêm vào bao
những hoạt động xã hội khác. Ngoài ra, những thuê đó, cho thông tin di động của Việt Nam. Đồng thời dự báo nhu
cần được cung pháp tính toán hệ số hiệu năng sử dụng phổ tần. Cuối cùng
những dịch vụ cấp
truyền dịchhìnhvụ thông
phân giảitin tốtcao,nhất ngay
hình ảnhcả3Dkhiqua
sử
cầu, tăng tưởng của thị
dụng trên các phương tiện giao thông di chuyển với tốc độ bài báo đưa ra những giảitrường
pháp và thông
những tin yêu
di động
cầu mới của trong
Việt
mạng thông tin di động tới thiết bị cá nhân cũng là một nhu Nam. Trong bài viết này tác giả cũng
quản lý tần số đối với mạng thông tin di động thế hệ thứ 5 tại sẽ trình bày phương
cao nhưtốc
cầu cần tàuđộcaodữ tốc,
liệu hay
cao và là tính
trên tứcmáythờibay.củaThêm
dịch vụvào đó,
thông pháp tính toán hệ số hiệu năng sử dụng phổ tần. Cuối cùng
Việt Nam.
những
tin. dịch vụ truyền hình phân giải cao, hình ảnh 3D qua
bài báo đưa ra những giải pháp và những yêu cầu mới trong
mạng thông tin di động tới thiết bị cá nhân cũng là một nhu II. HIỆN
quản lý tần TRẠNG
số đối vớiQUY mạngHOẠCH thông tin VÀ di SỬ
độngDỤNG thế hệBĂNGthứ 5 tại
cầu cần tốc Mạng độ dữthôngliệutincaotương
và tính lai tức
là kết
thờinối củatấtdịch
cả máy móc
vụ thông
ViệtTẦNNam.CHO THÔNG TIN DI ĐỘNG TẠI VIỆT NAM
thiết bị bằng hình thức hữu tuyến hoặc vô tuyến. Do đó, số
tin.
lượng kết nối tăng lên rất nhanh, bao gồm những kết nối Những băngTRẠNG
II. HIỆN tần đangQUY
đượcHOẠCH
quy hoạch
VÀvàSỬsửDỤNG
dụng cho mạng
BĂNG
giữa điệnMạng thoại thông
thông tin tương
minh, cảmlaibiếnlà kết nối minh,
thông tất cả máy
máy mócảnh, thông tin di động IMT (International Mobile
TẦN CHO THÔNG TIN DI ĐỘNG TẠI VIỆT NAM Technology)
thiết
phương tiện đi lại, thiết bị từ đơn giản tới phức tạp vàđó,hiện
bị bằng hình thức hữu tuyến hoặc vô tuyến. Do số
lượng kết nối tăng lên rất nhanh, bao gồm những kết nối Những băng tần đang được quy hoạch và sử dụng cho mạng
giữa điện thoại thông minh, cảm biến thông minh, máy ảnh, thông tin di động IMT (International Mobile Technology)
phương tiện đi lại, thiết bị từ đơn giản tới phức tạp và hiện
ISBN: 978-604-67-0635-9 1313
13
gồm dịch vụ thế hệ thứ 2 (2G), thế hệ thứ 3 (3G) và thế hệ (TDD). Dự kiến băng tần này sẽ được đấu giá quyền sử dụng
thứ 4 (4G) của Việt Nam bao gồm những băng tần sau: tần số trong tương lai tùy thuộc vào nhu cầu của thị trường
viễn thông Việt Nam.
Băng tần 450-470 MHz
Băng tần 2600 MHz
Theo Quy hoạch phổ tần số vô tuyến điện quốc gia [1]
Việt Nam quy hoạch băng tần 450-470 MHz cho thông tin di Theo [6] Thông tư 27/2010/TT-BTTTT ngày 24/11/2010 của
động nhưng hiện nay không có mạng thông tin di động nào Bộ trưởng Bộ Thông tin và Truyền thông ban hành quy
triển khai sử dụng băng tần này. hoạch băng tần 2500-2690MHz cho hệ thống thông tin di
động IMT của Việt Nam. Băng tần 2500-2690 MHz được
Băng tần 850 MHz
quy hoạch cho cả hệ thống FDD và TDD. Đối với hệ thống
Theo [2] Quyết định số 25/2008/QĐ-BTTT ngày FDD được phân chia 3 block, A(2500-2530MHz) uplink cặp
16/4/2008 phê duyệt quy hoạch băng tần cho thông tin di với A’ (2620-2650MHz) downlink, B(2530-2550MHz)
động tế bào số của Việt Nam băng tần 821-960MHz và uplink cặp với B’ (2650-2670MHz) downlink, C(2550-
1720-2200MHz, băng tần 824-825 MHz (Uplink)/ 869- 2570MHz) uplink cặp với C’(2670-2690MHz) downlink.
880MHz (downlink) được quy hoạch cho hệ thống thông tin Đối với hệ thống thông tin di động TDD, được quy hoạch
di động CDMA. Tuy nhiên, theo [3] thông tư 04/2015/TT- block D (2575-2615MHz). Dự kiến đầu năm 2016, Bộ
BTTTT ngày 10/32015 của Bộ Thông tin và Truyền thông Thông tin và truyền thông sẽ tổ chức đấu giá quyền sử dụng
đã cho phép doanh nghiệp triển khai dịch vụ 3G (IMT-2000) 3 block quy hoạch cho hệ thống thông tin di động FDD với
trên băng tần này. Tới nay, chưa cho mạng thông tin di động công nghệ IMT-Advanced.
3G triển khai trên băng tần này.
Như vậy tổng lượng phổ tần mà Việt Nam đã quy hoạch cho
Băng tần 900 MHz hệ thống thông tin di động IMT là 687 MHz cụ thể như sau:
Theo [2] Việt Nam quy hoạch băng tần 880-915 MHz Stt Băng tần Băng thông phân bổ cho IMT
(uplink) / 925-960MHz (downlink) cho thông tin di động tế tại Việt Nam
bào. Băng tần này đã được cấp phép sử dụng cho 04 doanh
nghiệp triển khai mạng thông tin di động GSM gồm Tập 1 450MHz 20 MHz
đoàn VNPT, Tổng công ty Mobifone, Tập đoàn Viettel, 2 850 MHz 22 MHz
Công ty cổ phần viễn thông Hà Nội. Theo [3], các doanh
nghiệp này được phép triển khai đồng thời công nghệ GSM 3 900 MHz 70 MHz
và 3G (IMT-2000) trên đoạn băng tần đã được cấp phép. 4 1800 MHz 150MHz
Băng tần 1800 MHz 5 2100 MHz 155 MHz
Theo [2], Việt Nam quy hoạch băng tần 1710-1785MHz 6 2300 MHz 90 MHz
(uplink)/ 1805-1880 MHz (downlink) cho hệ thống thông tin
di động GSM. Hiện nay băng tần này được cấp phép cho 04 7 2600 MHz 180 MHz
doanh nghiệp gồm Tập đoàn VNPT, Tổng công ty
Tổng cộng 687 MHz
Mobifone, Tập đoàn Viettel, Tổng công ty viễn thông toàn
cầu Gtel. Theo [3], các doanh nghiệp này được phép triển
khai đồng thời GSM và công nghệ 4G (IMT-Advanced) trên
III. NHU CẦU PHỔ TẦN DÀNH CHO THÔNG TIN DI
đoạn băng tần đã được cấp phép.
ĐỘNG TẠI VIỆT NAM ĐẾN NĂM 2020
Theo kết quả nghiên cứu của Liên minh viễn thông quốc tế
Theo [4] Quyết định số 03/2005-QĐ-BBCVT ngày ITU-R nêu tại khuyến nghị ITU-R M. 1728 [7], các yếu tố
17/01/2005 của Bộ trưởng Bộ Bưu chính viễn thông phê cần nghiên cứu và quyết định nhu cầu phổ tần cho thông tin
duyệt quy hoạch băng tần cho hệ thống thông tin di động 3G di động gồm loại truy cập vô tuyến, các loại hình cung cấp
(IMT-2000) băng tần 1900-2200MHz, băng tần 1900- dịch vụ vô tuyến và hiệu suất phổ tần tại một cell.
1920MHz và 2010-2025 được quy hoạch cho hệ thống TDD;
1. Nhóm truy cập vô tuyến
Băng tần 1920-1980MHz (uplink)/ băng tần 2110- 2170
MHz (downlink) được quy hoạch cho hệ thống sử dụng Hiện nay, có các nhóm truy cập vô tuyến (Radio Acess
phương thức song công phân chia theo tần số (FDD). Băng Technical Group-RATG) điển hình gồm 04 loại như sau:
tần này được phân chia thành 4 block và cấp phép sử dụng
cho Tập đoàn VNPT, Tổng công ty Mobifone, Tập đoàn Loại RATG1: gồm hệ thống thế hệ trước IMT-2000 và IMT-
Viettel và Công ty cổ phần viễn thông Hà Nội. 2000.
Băng tần 2300 MHz Loại RATG 2: gồm hệ thống thế hệ IMT-Advanced.
Theo [5] Thông tư 26/2010/TT-BTTTT ngày 24/11/2010 của Loại RATG 3: gồm mạng LAN vô tuyến.
Bộ trưởng Bộ Thông tin và Truyền thông ban hành quy Loại RATG 4: gồm hệ thống quảng bá di động số.
hoạch băng tần 2300-2400MHz cho hệ thống thông tin di
động IMT của Việt Nam. Băng tần 2300-2390 MHz được 2. Các loại hình dịch vụ vô tuyến
quy hoạch thành 3 block, A(2300-2330MHz), B(2330- Cung cấp dịch vụ thông tin vô tuyến băng rộng có loại hình
2360MHz), C(2360-2390MHz) cho hệ thống thông tin sử cung cấp điển hình là dịch vụ trong nhà, dịch vụ nơi công
dụng phương thức song công phân chia theo thời gian
14
14
cộng, nơi làm việc. Xét về không gian có thể phân thành nơi Ngoại ô 0.55 120
thành phố đông dân cư, ngoại ô và nông thôn.
Tốc độ cao 0.25 350
Từ đó cấu hình Cell của mạng thông tin di động được phân
thành 04 loại điển hình gồm Macro cell, Micro cell, Pico Bảng 3.3. Hiệu suất sử dụng phổ tần theo tốc độ di chuyển
cell, Hostpost. Với dự báo nhu cầu cho IMT ở đây xét đến các trường hợp
3. Hiệu suất sử dụng phổ tần của RATG 1 và RATG 2.
Theo khuyến nghị ITU-R M.2134 [8] , gọi  là hiệu suất phổ Hiệu suất sử dụng phổ tần (bit/s/Hz/cell) dành cho công nghệ
tần tại một cell được xác định là bit/s/Hz/cell được tính theo IMT theo Báo cáo ITU – R M.2135 [9] cho nhóm RATG 1
công thức sau: và RATG 2 với sử dụng đồng thời nhiều công nghệ như sau:
N Đối với RATG 1:
χi Macro Micro Pico Hot
η
i 1
(3.1) Khu vực
cell cell cell (1)
spot
T ωM
i : là số lượng bit chính xác nhận được của user thứ i Đô thị 1 2 2 2
downlink (hoặc uplink thứ i) trong một hệ thống có mật độ
Ngoại ô 1 2 2 2
user là N với M Cell.
Nông thôn 1 2 2 2
 : là băng thông
T : là thời gian mà dữ liệu nhận được. Bảng 3.4. Hiệu suất sử dụng phổ (bit/s/Hz/cell) tính cho
hệ thống IMT nhiều thế hệ cùng hoạt động với RATG 1
Kết quả tính toán xác định hệ số hiệu suất sử dụng hiệu quả
phổ tần trong cell xác định như sau : Đối với RATG 2:
Macro Micro Pico Hot

Điều kiện sử dụng Downlink Uplink Khu vực
cell cell cell spot
(bit/s/Hz/cell) (bit/s/Hz/cell)
Trong nhà 3 2.25 Đô thị 2.25 3 3.75 4.5
Micro cell 2.6 1.80 Ngoại ô 2.25 3 3.75 4.5
Ngoại ô 2.2 1.4
Nông thôn 2.25 3 3.75 4.5
Di chuyển tốc độ cao 1.1 0.7
Bảng 3.5. Hiệu suất sử dụng phổ (bit/s/Hz/cell) tính cho
hệ thống IMT nhiều thế hệ cùng hoạt động với RATG 2.
Bảng 3.1 Hiệu suất phổ tần trong Cell
4. Tính toán nhu cầu phổ tần cho hệ thống thông tin di
Trong điều kiện thu tại vùng biên của Cell được xác định với động IMT trên thế giới
hiệu suất thấp nhất được tính theo công thức sau:
χi Theo báo cáo ITU – R M.2243 [10] dự báo tốc độ tăng
γi  (3.2) trưởng lưu lượng đến năm 2020 cho IMT. Khuyến nghị đề
Ti  ω
cập hai trường hợp, tốc độ tăng trưởng tối thiểu 25% đối với
Hiệu suất phổ tần lại biên của Cell được xác định như sau: khu vực mật độ người dùng thấp và tối đa 75% đối với khu
Điều kiện sử Downlink Uplink vực mật độ người dùng cao, căn cứ với dữ liệu khảo sát
trong giai đoạn 2010 – 2015 và ngoại suy đến năm 2020. Dự
dụng (bit/s/Hz) (bit/s/Hz) báo tăng trưởng lưu lượng của thế giới như sau:
Trong nhà 0.1 0.07
Microcellular 0.075 0.05
Ngoại ô 0.06 0.03
Tốc độ cao 0.04 0.015
Bảng 3.2. Hiệu suất phổ tần lại biên của Cell
Trong trường hợp user di chuyển, hiệu suất hiệu quả phổ tần
được xác định như sau :
Điều kiện sử dụng Bit/s/Hz Tốc độ

(km/h)
Hình 4.1. Dự báo tăng trưởng lưu lượng năm 2020
Trong nhà 1.0 10
Microcellular 0.75 30
15
15
+ӝL7KҧR4XӕF*LDYӅĈLӋQ7ӱ7UX\ӅQ7K{QJYj&{QJ1JKӋ7K{QJ7LQ(&,7
Áp dụng phương pháp tính toán nhu cầu phổ tần cho
thông tin di động IMT tại Báo cáo ITU – R. M. 2290 [11],
kết quả tính toán được xác định như sau
* Đối với nhóm RATG 1:
Nhu cầu Nhu cầu phổ tần cho

RATG 1 năm 2020
Mật độ người dùng thấp 440 MHz
Mật độ người dùng cao 540 MHz
Bảng 4.1 Nhu cầu phổ tần năm 2020 cho RATG1 Hình 4.2. Biểu đồ dự báo tăng trưởng thuê bao di động Việt
* Đối với nhóm RATG 2: Nam đến năm 2020
Nhu cầu Nhu cầu phổ tần cho Áp dụng [11] mô hình tính toán của ITU-R, nhu cầu phổ tần
RATG 2 tới năm 2020 của Việt Nam như sau:
Mật độ người dùng thấp 900 MHz
Mật độ người dùng cao 1 420 MHz
Bảng 4.2. Nhu cầu phổ tần tới năm 2020 cho RATG2
Như vậy, tổng nhu cầu phổ tần cho cả hai nhóm RATG 1
và RATG 2 hoạt động đồng thời là:
Nhu cầu Nhu cầu phổ tần cho
RATG 1 + RATG 2
tới năm 2020
Mật độ người dùng thấp 1 340 MHz
Mật độ người dùng cao 1 960 MHz
Hình 4.3. Dự báo nhu cầu phổ tần cho IMT tới năm 2020 tại
Bảng 4.3. Tổng nhu cầu phổ tần năm 2020 cho RATG 1 Việt Nam
và RATG2
Theo kết quả tính toán nhu cầu của Việt Nam từ 1060MHz
Như vậy theo kết quả tính toán xác định nhu cầu phổ tần tới 1360 MHz giai đoạn tới năm 2020. Hiện tại, phổ tần quy
cho hệ thống thông tin di động tới năm 2020 sẽ từ 1340 MHz hoạch và sử dụng cho hệ thống IMT tại Việt Nam là 687
( nhu cầu thấp) tới 1960 MHz (nhu cầu cao). Mỗi quốc gia MHz. Như vậy với tính toán này, Việt Nam có nhu cầu cần
tùy thuộc vào điều kiện kinh tế-xã hội và tăng trưởng thị thêm từ 349 MHz tới 649 MHz.
trường thông tin di động và nhu cầu thị trường sẽ có nhu cầu IV. NHỮNG BĂNG TẦN TIỀM NĂNG CHO THÔNG TIN
về phổ tần số là rất khác nhau. Phần tiếp theo tác giả sẽ trình DI ĐỘNG BĂNG RỘNG TẠI VIỆT NAM
bày cách thức tính toán và kết quả dự báo nhu cầu phổ tần
cho hệ thống IMT tới năm 2020 của Việt Nam. Để đáp ứng nhu cầu phổ tần cho thông tin di động băng
rộng, tác giả nghiên cứu một số băng tần mới có khả năng
5. Tính toán nhu cầu phổ tần cho hệ thống IMT tại Việt phân chia cho hệ thống thông tin di động IMT cụ thể như
Nam sau:
Băng 700 MHz
Năm 2009, Việt Nam bắt đầu triển khai và cung cấp dịch vụ
3G và số thuê bao 3G tăng lên nhanh chóng với tỷ lệ 50% Việt Nam đang trong quá trình số hóa truyền hình, giai đoạn
mỗi năm. Thuê bao 2G(GSM) bắt đầu giảm dần hằng năm, số hóa giai đoạn 2015-2020. Với triển khai kế hoạch số hóa
trung bình mỗi năm giảm 10%. Dịch vụ 4G sẽ được triển đang triển khai hiệu quả như hiện nay, Việt Nam hoàn toàn
khai và cung cấp vào năm 2016. Áp dụng phương thức dự có thể hoàn thành số hóa truyền hình vào năm 2020. Băng
báo của ITU-R [10], tác giả đưa ra kết quả dự báo xu hướng tần số hóa truyền hình (Digital Dividend) 694-806 MHz có
tăng trưởng thuê bao thông tin di động 2G, 3G, 4G tại Việt thể xem xét quy hoạch cho hệ thống thông tin di động IMT
Nam tới năm 2020 như sau: sau khi hoàn thành số hóa truyền hình. Tuy nhiên, cần có
giải pháp cho lộ trình chuyển đổi tần số của các trạm phát
sóng truyền hình trên băng tần này xuống băng tần dưới 694
MHz để đảm bảo sớm giải phóng băng tần 700 MHz trong
giai đoạn tới. Nếu quy hoạch băng tần cho hệ thống IMT,
Việt Nam sẽ có thêm 2x 45 MHz (90 MHz) cho hệ thống
IMT. Việc giải phóng băng tần 700MHz là một thách thức
khi mà hệ thống truyền hình mặt đất của Việt Nam hiện nay
là rất lớn. Đây cũng là nhu cầu đặc biệt trong đời sống của

16
Hội +ӝL7KҧR4XӕF*LDYӅĈLӋQ7ӱ7UX\ӅQ7K{QJYj&{QJ1JKӋ7K{QJ7LQ(&,7
Thảo Quốc Gia 2015 về Điện Tử, Truyền Thông và Công Nghệ Thông Tin (ECIT 2015)
người dân Việt Nam và cũng là công cụ hữu hiệu tuyên Việt Nam có nhu cầu cần thêm 382-682 MHz giai đoạn tới
truyền đường lối, chính sách của Nhà nước. 2020. Tác giả cũng đã đề xuất những băng tần tiềm năng có
thể phân chia bổ sung cho thông tin di động thế hệ thứ 5 tại
Băng 800 MHz
Việt Nam. Các đề xuất này sẽ được bàn thảo tại Hội nghị vô
Hiện tại Việt Nam đã quy hoạch và cấp phép cho hệ thống tuyến thế giới 2015. Tuy nhiên việc giải phóng các băng tần
FDD với 2x11 MHz (824-835/869-880MHz) cho IMT. Tuy để dành cho thông tin di động là rất nhiều khó khăn và thách
nhiên có thể xem xét quy hoạch lại băng tần 806-824/ 851- thức trong việc đảm bảo lợi ích quốc gia và tránh ảnh hưởng
869 MHz đang phân chia sử dụng cho hệ thống trunking. tới các hệ thống thông tin vô tuyến hiện có. Bài báo cũng
Việc xem xét quy hoạch lại băng tần này có thể phân bổ khuyến nghị những khó khăn và thách thức trong quy hoạch
thêm 2x15 MHz (30 MHz) cho hệ thống IMT. Tuy nhiên tần số cũng như quản lý tần số đối với cho hệ thống thông tin
việc di chuyển hệ thống trunking cần có lộ trình thực hiện để vô tuyến băng rộng tại Việt Nam.
đảm bảo không làm gián đoạn thông tin phục vụ mục đích an
ninh công cộng. Việc quy hoạch băng tần này cần đánh giá
tổng thể lợi ích kinh tế và xã hội. Đây là vấn đề sẽ gặp nhiều
khó khăn và thách thức trong giai đoạn tới. Tài liệu tham khảo
[1] Quyết định số 71/2013/QĐ-TTg của Thủ tướng Chính phủ ban hành
Các đoạn băng tần 1427-1452 MHz; 1452-1492 MHz; 1492- quy hoạch phổ tần số vô tuyến điện quốc gia.
1518MHz đang được quy hoạch cho nghiệp vụ quảng bá và [2] Quyết định số 25/2008/QĐ-BTTT ngày 16/4/2008 của Bộ Thông tin
cố định nhưng hiện nay nhu cầu sử dụng băng tần này thấp và Truyền thông phê duyệt quy hoạch băng tần cho thông tin di động
tế bào số của Việt Nam băng tần 821-960MHz và 1720-2200MHz
và có thể sử dụng băng tần khác thay thế. Kết quả nghiên
[3] Thông tư 04/2015/TT-BTTTT ngày 10/32015 của Bộ Thông tin và
cứu cho thấy hệ thống IMT có khả năng sử dụng các băng Truyền thông quy định triển khai hệ thống thông tin di động IMT trên
tần này và không gây can nhiễu với các hệ thống sử dụng các băng tần 924-935MHz, 969-915MHz, 925-960MHz, 1710-1785
băng tần liền kề. Do đó, các đoạn băng tần này có thể xem MHz, 1805-1880MHz.
xét phân chia cho hệ thống IMT trong tương lai tại Việt [4] Quyết định số 03/2005-QĐ-BBCVT ngày 17/01/2005 của Bộ trưởng
Nam. Đề xuất này cũng đã được tác giả gửi tới Hội nghị vô Bộ Bưu chính viễn thông phê duyệt quy hoạch băng tần cho hệ thống
thông tin di động IMT-2000 băng tần 1900-2200MHz.
tuyến thế giới tổ chức vào tháng 11/2015.
[5] Thông tư 26/2010/TT-BTTTT ngày 24/11/2010 của Bộ trưởng Bộ
Băng tần 2100 MHz Thông tin và Truyền thông ban hành quy hoạch băng tần 2300-
2400MHz cho hệ thống thông tin di động IMT của Việt Nam.
Hiện nay đoạn băng tần liền kề với băng tần đã quy hoạch và [6] Thông tư 27/2010/TT-BTTTT ngày 24/11/2010 của Bộ trưởng Bộ
cấp phép cho dịch vụ 3G đã trình bày ở mục II, băng tần Thông tin và Truyền thông ban hành quy hoạch băng tần 2500-
2690MHz cho hệ thống thông tin di động IMT của Việt Nam.
1980-2100MHz và 2170-2200 MHz, hiện được phân chia
[7] Recommendation ITU-R M.1768-1 Methodology for calculation of
cho dịch vụ di động qua vệ tinh đang được nhiều nước spectrum requirements for the terrestrial component of International
nghiên cứu xem xét đề xuất phân chia cho dịch vụ vô tuyến Mobile Telecommunications, 2013
băng rộng mặt đất IMT. Việt Nam không có nhu cầu sử dụng [8] Report ITU-R 2134 Requirements related to technical performance for
đoạn băng tần này cho nghiệp vụ di động vệ tinh. Đặc biệt IMT-Advanced radio interface(s), 2008.
băng tần 2100 MHz hiện nay là băng tần hài hòa toàn cầu [9] Report ITU-R M.2135-1 Guidelines for evaluation of radio interface
triển khai dịch vụ 3G nên việc quy hoạch mở rộng 2x30 technologies for IMT-Advanced, 2009
MHz cho hệ thống IMT có ý nghĩa rất lớn trọng việc [10] Report ITU-R M.2243 Assessment of the global mobile broadband
deployments and forecasts for International Mobile
roaming quốc tế dịch vụ thông tin di động tại tất cả các nước Telecommunications, 2011
thành viên liên minh viễn thông quốc tế. Mặc dù vậy, việc [11] Report ITU-R M.2290-0 Future spectrum requirements estimate for
nghiên cứu can nhiễu giữa hệ thống IMT và hệ thống thông terrestrial IMT, 2013
tin di động qua vệ tinh cần xem xét kỹ lưỡng trong thời gian
tới.
Băng tần 4GHz
Các băng tần 4400-4500 MHz; 4800-4990 MHz đã được
quy hoạch cho nghiệp vụ cố định là nghiệp vụ chính nhưng
hiện nay nhu cầu sử dụng thấp và có thể sử dụng băng tần
khác thay thế. Kết quả nghiên cứu cho thấy hệ thống IMT có
khả năng sử dụng băng tần này và không gây can nhiễu với
các hệ thống sử dụng băng tần liền kề. Đề xuất này cũng đã
được tác giả gửi tới Hội nghị vô tuyến thế giới 2015.
Như vậy nếu các đoan băng tần trên được quy hoạch cho hệ
thống IMT, Việt Nam sẽ có thêm 561 MHz quy hoạch cho
thông tin di động IMT, nâng tổng số phổ tần quy hoạch cho
thông tin di đông IMT lên thành 1248 MHz.
V. KẾT LUẬN
Bài báo đã đánh giá nhu cầu của mạng thông tin di động
băng rộng thế hệ mới thứ 5. Kết quả nghiên cứu cho thấy

17
TӔI ѬU HÓA LѬU TRӲ NӜI DUNG TRONG

MҤNG ICN
NguyӉn Quӕc Anh1, Võ Thӏ Lѭu Phѭѫng2, Lê Tuҩn Anh3

1
Khoa Công NghӋ Thông Tin, Hӑc viӋn Bѭu Chính ViӉn Thông, CN HCM
2
Khoa Công NghӋ Thông Tin, ĈH Quӕc TӃ, ĈHQG HCM
3
Khoa Công NghӋ Thông Tin, ĈH Thӫ Dҫu Mӝt
Emails: nqa.it.dlu@gmail.com, vtlphuong@hcmiu.edu.vn, letuanh@tdmu.edu.vn
Abstract—Ngày nay, viӋc sӱ dөng Internet ÿang chuyӇn tӯ ÿã ÿѭӧc ÿӅ xuҩt nhѭ: TRIAD [1], ROFL [2], DONA [3],
viӋc truyӅn dӳ liӋu giӳa các máy tính ÿҫu cuӕi sang viӋc trao ÿәi PSIRP [4], CCN [5], COMET [6], CONVERGENCE [7],
nӝi dung theo hѭӟng ngѭӡi dùng mӝt cách mҥnh mӁ. KiӃn trúc
cӫa mҥng Information Centric Network (ICN) ra ÿӡi nhҵm ÿáp NDN [8], SAIL [9], PURSUIT [10], v.v.
ӭng nhu cҫu này và nó ÿang là mӝt lƭnh vӵc nghiên cӭu sôi ÿӝng
hiӋn nay trên thӃ giӟi. Trong kiӃn trúc ICN, các nӝi dung ÿѭӧc Lѭu trӳ nӝi dung (in-network caching) là mӝt chӭc năng
lѭu trӳ tҥi các nút trung gian (in-network caching), do ÿó ngѭӡi
quan trӑng trong kiӃn trúc ICN. Bҵng cách lѭu trӳ các nӝi
dùng truy xuҩt nӝi dung tҥi các nút trung gian thay vì phҧi truy
cұp ÿӃn máy chӫ gӕc ÿӅ tҧi nӝi dung. Do ÿó, chҩt lѭӧng cӫa viӋc dung phә biӃn trên các nút mҥng ICN gҫn ngѭӡi dùng, ngѭӡi
truyӅn dӳ liӋu trong mҥng ICN sӁ cao hѫn. Bài toán tӕi ѭu lѭu trӳ
các nӝi dung trên nút mҥng ICN sӁ ÿѭӧc nghiên cӭu trong bài dùng chӍ tҧi nӝi dung tҥi các nút mҥng ÿó thay vì phҧi truy xuҩt
báo này. Chúng tôi sӁ ÿӅ xuҩt hai thuұt toán nhҵm tӕi ѭu hóa khҧ
ÿӃn các máy chӫ gӕc. Khҧ năng lѭu trӳ cӫa các nút ICN là có
năng lѭu trӳ cӫa ICN dӵa trên viӋc tӕi ÿa hóa tӍ lӋ hit và tӕi ѭu
hóa lѭu lѭӧng dӳ liӋu trên ÿѭӡng truyӅn backhaul. Chúng tôi còn hҥn, do ÿó lѭu trӳ nӝi dung sao cho có hiӋu quҧ nhҩt là mӝt
xây dӵng mӝt chѭѫng trình mô phӓng nhҵm hiӋn thӵc hóa thuұt
toán ÿã ÿӅ xuҩt. Thông qua ÿó thӇ hiӋn rõ hiӋu quҧ ÿҥt ÿѭӧc cӫa chӫ ÿӅ nghiên cӭu quan trӑng [11, 12]. Hѫn nӳa viӋc triӇn khai
thuұt toán. KӃt quҧ thu ÿѭӧc tӯ hai thuұt toán ÿӅ xuҩt sӁ so sánh
vӟi nhӳng thuұt toán lѭu trӳ ÿang ÿѭӧc sӱ dөng hiӋn nay ÿó là
cѫ chӃ lѭu trӳ nӝi dung cǊng sӁ mӣ ra khҧ năng phӕi hӧp trong
LCE-LRU và LCE-LFU. viӋc tӕi ѭu ÿӏnh tuyӃn, chuyӇn tiӃp và quҧn lý lѭu trӳ nӝi dung
Keywords —ICN, in-network caching, bài toán Knapsack. trong mҥng. Các nghiên cӭu gҫn ÿây ÿã chӍ ra rҵng các giҧi
thuұt lѭu trӳ thông minh sӁ cҧi thiӋn hiӋu năng lѭu trӳ mӝt
I. GIӞI THIӊU
cách ÿáng kӇ [13][14][15].
Qua nhiӅu năm phát triӇn cùng vӟi cѫ sӣ hҥ tҫng toàn cҫu
Internet phân phӕi mӝt lѭӧng lӟn thông tin cho hàng tӍ thiӃt bӏ
Thuұt toán lѭu trӳ phә biӃn thѭӡng ÿѭӧc dùng cho ICN là
kӃt nӕi. Hàng nghìn tӍ các trang web và exabytes nӝi dung
ÿӵӧc chuyӇn hàng năm. Ngѭӡi dùng ngày càng hӭng thú hѫn leave-copy-everywhere (LCE) [16]. Mӝt bҧn sao cӫa mӛi nӝi
vӟi viӋc nhұn nӝi dung tӭc thӡi tӯ mӝt nѫi lѭu trӳ nào ÿó hѫn dung ÿѭӧc yêu cҫu và chuyӇn tӟi ngѭӡi dùng sӁ ÿѭӧc nhân
là viӋc truy cұp vào mӝt mӝt hӋ thӕng máy tính cө thӇ (host
rӝng tҥi mӛi nút mҥng mà nӝi dung ÿó ÿi qua trên ÿѭӡng ÿӃn
hoһc server). Tuy nhiên trên thӵc tӃ, Internet vүn dӵa vào mô
hình giao tiӃp host-centric yêu cҫu ngѭӡi dùng phҧi chӍ ÿӏnh rõ vӟi ngѭӡi dùng. Khi nӝi dung yêu cҫu trùng khӟp tҥi nút mҥng
không chӍ là thông tin muӕn nhұn, mà còn là ÿӏa chӍ ÿҫu cuӕi. cҩp l hoһc máy chӫ gӕc thì bҧn sao cӫa nӝi dung sӁ ÿѭӧc lѭu
NӃu không có các chӭc năng add-on ÿѭӧc thêm vào thì cѫ chӃ
trӳ tҥi tҩt cҧ các nút mҥng trung gian (cҩp l-1, …, 1) trên
cӫa Internet không thӇ xác ÿӏnh và lҩy thông tin yêu cҫu tӯ
nguӗn tӕi ѭu nhҩt, trӯ khi ngѭӡi dùng sӱ dөng mӝt cách thӭc ÿѭӡng trӣ vӅ cӫa nӝi dung. Phѭѫng pháp này sӁ gây ra sӵ dѭ
nào ÿó ÿӇ xác ÿӏnh các vӏ trí tӕi ѭu khi lҩy nӝi dung cҫn thiӃt. thӯa và tiêu tӕn tài nguyên cӫa các nút mҥng. Bên cҥnh ÿó, các
Do ÿó mà kiӃn trúc Information-Centric Networking (ICN) ra nút mҥng lѭu trӳ có thӇ sӱ dөng nhӳng thuұt toán loҥi bӓ nӝi
ÿӡi là là mӝt ӭng cӱ viên ÿҫy hӭa hҽn thay cho kiӃn trúc
dung không cҫn thiӃt khi lѭu trӳ nhѭ: least recently used (LRU)
truyӅn thӕng cӫa Internet. ICN ÿang nhұn ÿѭӧc rҩt nhiӅu sӵ
quan tâm cӫa giӟi nghiên cӭu gҫn ÿây. Mӝt sӕ kiӃn trúc ICN [17], least frequently used (LFU) [18]. Thuұt toán LRU ÿѭӧc

ISBN: 978-604-67-0635-9 18
sӱ dөng rӝng rãi ÿӇ thay thӃ nӝi dung tҥi các nút mҥng. Khi Gӑi ݀௠ là yêu cҫu cӫa ngѭӡi dùng cho nӝi dung thӭ ݉
mӝt nӝi dung mӟi cҫn ÿѭӧc lѭu trӳ, nút mҥng sӁ thay thӃ nӝi trong khoҧng thӡi gian ÿang xét. Khi ngѭӡi dùng gӱi yêu cҫu
dung ít ÿѭӧc yêu cҫu gҫn ÿây nhҩt bҵng nӝi dung mӟi. Trong vӅ nӝi dung ݉ tӟi nút mҥng, nӃu nhѭ nӝi dung ݉ ÿã ÿѭӧc lѭu
thuұt toán này viӋc tìm kiӃm và thay thӃ ÿѭӧc thӵc hiӋn liên trӳ tҥi nút mҥng này trѭӟc ÿó thì nó sӁ ÿѭӧc gӱi trҧ vӅ cho
tөc. Trong khi ÿó, thuұt toán LFU tҥo ra bӝ ÿӃm cho mӛi nӝi ngѭӡi dùng. Ngѭӧc lҥi, nӝi dung ݉ sӁ ÿѭӧc tҧi vӅ tӯ mӝt nút
dung ÿang ÿѭӧc lѭu trӳ. Giá trӏ cӫa bӝ ÿӃm này tăng lên nӃu cha vӟi chi phí là ܿ௠ cho mӛi ÿѫn vӏ nӝi dung.
nӝi dung ÿѭӧc yêu cҫu. Khi cҫn lѭu trӳ mӝt nӝi dung mӟi, nút
Dӵa vào nhu cҫu cӫa ngѭӡi dùng, chúng tôi ÿѭa ra hai
mҥng sӁ loҥi bӓ nӝi dung ÿѭӧc yêu cҫu ít nhҩt (có giá trӏ bӝ
mөc tiêu chính cҫn phҧi tӕi ѭu hóa trong vҩn ÿӅ lѭu trӳ nӝi
ÿӃm nhӓ nhҩt). Tuy nhiên viӋc triӇn khai lҥi tӕn kém bӣi vì
dung vӟi các ràng buӝc ÿã trình bày: 1) Tӕi ÿa hóa tӍ lӋ hit tҥi
thuұt toán không hӛ trӧ viӋc tìm kiӃm và thay thӃ liên tөc trong
nút lѭu trӳ, 2) Tӕi ѭu hóa lѭu lѭӧng nӝi dung tҧi xuӕng tӯ các
mӝt khoҧng thӡi gian.
cөm nút cha. ĈӇ thӵc hiӋn mөc tiêu ÿҫu tiên, cҫn tӕi ÿa hóa
Trong bài báo này chúng tôi mô hình hóa viӋc lѭu trӳ nӝi biӇu thӭc σ௠‫א‬ெ ݀௠ ‫ݔ‬௠ .
dung thông qua bài toán Knapsack [19]. Bài toán lѭu trӳ có hai
mөc tiêu: tӕi ÿa hóa tӍ lӋ hit tҥi nút mҥng hoһc tӕi thiӇu lѭu Bài toán tӕi ÿa hoá sӕ lѭӧng hit ÿѭӧc mô tҧ nhѭ sau:
lѭӧng nӝi dung trên ÿѭӡng truyӅn backhaul tѭѫng ӭng vӟi các
bài toán max_hit hoһc min_transit. Tӯ giҧi thuұt greedy giҧi (max_hit)
bài toán quy hoҥch tuyӃn tính xҩp xӍ cӫa bài toán Knapsack, Ǥ ෍ ݀௠ ‫ݔ‬௠
chúng tôi ÿӅ xuҩt hai thuұt toán loҥi bӓ nӝi dung, ÿó là max_hit ௠‫א‬ெ
và min_transit. Ǥ ෍ ‫ݏ‬௠ ‫ݔ‬௠ ൑ ܵǡ

௠‫א‬ெ
Mӝt chѭѫng trình mô phӓng ÿѭӧc chúng tôi xây dӵng ÿӇ ‫ א ݔ‬ሼͲǡͳሽǤ
so sánh các thuұt toán ÿѭӧc ÿӅ xuҩt vӟi các thuұt toán truyӅn
Vӟi mөc tiêu thӭ hai, ÿӇ tӕi ѭu hóa lѭu lѭӧng nӝi dung
thӕng khác nhѭ leave-copy-everywhere vӟi LRU hoһc LFU
giӳa nút lѭu trӳ ÿang xét và cөm nút cha thì ta cҫn tӕi thiӇu
(LCE+LRU, LCE+LFU). KӃt quҧ thu ÿѭӧc cho thҩy thuұt toán
biӇu thӭc σ௠‫א‬ெ ݀௠ ‫ݏ‬௠ ܿ௠ ሺͳ െ ‫ݔ‬௠ ሻ. ĈiӅu này tѭѫng ÿѭѫng vӟi
mà chúng tôi ÿӅ xuҩt hoҥt ÿӝng tӕt hѫn so vӟi các thuұt toán
viӋc tӕi ÿa hóa biӇu thӭc σ௠‫א‬ெ ݀௠ ‫ݏ‬௠ ܿ௠ ‫ݔ‬௠ .
truyӅn thӕng trong cùng ÿiӅu kiӋn so sánh.
Phҫn còn lҥi cӫa bài báo ÿѭӧc tә chӭc nhѭ sau: Phҫn II Do ÿó mөc tiêu tӕi thiӇu hóa lѭu lѭӧng nӝi dung ÿѭӧc thӇ
hiӋn qua bài toán sau:
giӟi thiӋu chung vӅ mô hình tӕi ѭu hóa cӫa thuұt toán lѭu trӳ.
Phҫn III mô tҧ cө thӇ thuұt toán lѭu trӳ ÿã ÿӅ xuҩt. KӃt quҧ mô (min_transit)
phӓng ÿѭӧc trình bày trong phҫn IV và phҫn V là phҫn kӃt Ǥ ෍ ݀௠ ‫ݏ‬௠ ܿ௠ ‫ݔ‬௠
௠‫א‬ெ
luұn.
Ǥ ෍ ‫ݏ‬௠ ‫ݔ‬௠ ൑ ܵǡ
௠‫א‬ெ
II. Ĉӄ XUҨT GIҦI THUҰT LѬU TRӲ
‫ א ݔ‬ሼͲǡͳሽǤ
Xét mӝt tұp hӧp ‫ ܯ‬bao gӗm các nӝi dung ÿѭӧc lѭu trӳ tҥi
III. PHÂN TÍCH GIҦI THUҰT
mӝt nút mҥng ÿѫn có khҧ năng lѭu trӳ tӟi ܵ MB. Cѫ chӃ lѭu
Vҩn ÿӅ tӕi ÿa hóa tӍ lӋ hit tҥi nút lѭu trӳ và tӕi ѭu hóa lѭu
trӳ ӣ ÿây là lѭu trӳ hoàn toàn, tӭc là các nӝi dung ÿѭӧc lѭu trӳ
lѭӧng nӝi dung tҧi xuӕng tӯ các cөm nút cha thұt ra chính là
vӟi ÿҫy ÿӫ thông tin, kích thѭӟc và không bӏ phân mҧnh. Ký
bài toán Knapsack.
hiӋu kích thѭӟc cӫa nӝi dung ݉ là ‫ݏ‬௠ . Ĉһt ‫ݔ‬௠ là biӃn nhӏ phân
biӇu thӏ nӝi dung ݉ có ÿѭӧc lѭu trӳ tҥi nút mҥng hay không. Mөc tiêu (max_hit) và (min_transit) cǊng là lӡi giҧi cho
Tәng dung lѭӧng cӫa các nӝi dung ÿѭӧc lѭu trӳ trên nút phҧi bài toán Knapsack. Kích thѭӟc cӫa mӛi nӝi dung m là sm. Giá
bӏ giӟi hҥn bӣi khҧ năng lѭu trӳ cӫa nút: σ௠‫א‬ெ ‫ݏ‬௠ ‫ݔ‬௠ ൑ ܵ. trӏ cӫa nӝi dung cӫa ݉ trong (max_hit) và (min_transit) tѭѫng
ӭng lҫn lѭӧt là ݀௠ và ݀௠ ‫ݏ‬௠ ܿ௠ . bài toán Knapsack là bài toán

19
quy hoҥch tuyӃn tính có ÿӝ phӭc tҥp theo hàm mǊ do ÿó cҫn có nút mҥng ICN cө thӇ, khi nhұn ÿѭӧc yêu cҫu cho nӝi dung m
thuұt toán xҩp xӍ ÿӇ giҧi. Thuұt toán greedy giҧi quyӃt bài toán tӯ ngѭӡi dùng, sӁ có hai trѭӡng hӧp xҧy ra. Trѭӡng hӧp ÿҫu
quy hoҥch tuyӃn tính xҩp xӍ. Theo ÿó, tҩt cҧ các nӝi dung sӁ tiên: dach sách lѭu trӳ cӫa nút mҥng có nӝi dung m, lúc này m
ÿѭӧc sҳp xӃp theo chiӅu giҧm dҫn theo giá trӏ cӫa ÿѫn vӏ nӝi sӁ ÿѭӧc trҧ vӅ cho ngѭӡi dùng, ÿӗng thӡi dm tăng thêm 1, hit-
dung ÿѭӧc tính bҵng “

୥୧୲୰ዋ୬ዒ୧ୢ୳୬୥
”. Các nӝi dung sӁ ÿѭӧc counter cǊng tăng thêm 1 ÿѫn vӏ. Trѭӡng hӧp thӭ hai: nӝi dung
୩Àୡ୦୲୦ዛዔୡ୬ዒ୧ୢ୳୬୥
m không ÿѭӧc lѭu trӳ tҥi ÿây, khi ÿó bӝ ÿӃm miss-counter sӁ
lѭu trӳ tҥi nút mҥng theo chiӅu giҧm dҫn giá trӏ ÿã nêu cho ÿӃn
tăng lên và chuyӇn tiӃp yêu cҫu ÿӃn nút mҥng khác. Khi nӝi
khi nút mҥng ÿҫy. Vì kích thѭӟc cӫa các nӝi dung nhӓ hѫn rҩt
dung m ÿѭӧc ÿѭӧc trҧ vӅ cho ngѭӡi dùng, nó sӁ ÿi qua nút
nhiӅu so vӟi khҧ năng lѭu trӳ cӫa nút mҥng, nên viӋc thӵc hiӋn
mҥng ÿang xét, tҥi thӡi ÿiӇm này, nút mҥng sӁ quyӃt ÿӏnh xem
giҧi thuұt xҩp xӍ là cách tӕi ѭu ÿӇ giҧi quyӃt bài toán Knapsack.
có nên lѭu trӳ nӝi dung ݉ hay không. NӃu bӝ nhӟ còn dѭ cӫa
Nút mҥng trong ICN sӁ luôn duy trì mӝt danh sách các nӝi nút mҥng vүn lӟn hѫn kích thѭӟc cӫa nӝi dung thì m sӁ ÿѭӧc
dung mà nó ÿang lѭu trӳ. Mӛi nӝi dung ݉ sӁ có bӕn thông sӕ, lѭu trӳ ngay lұp tӭc và danh sách lѭu trӳ sӁ ÿѭӧc cұp nhұt
ÿó là: tên nӝi dung-contentID, sӕ lҫn ÿѭӧc yêu cҫu ݀௠ , kích ÿӗng thӡi. Ngѭӧc lҥi, nút mҥng sӁ tính toán giá trӏ nhӓ nhҩt
thѭӟc ‫ݏ‬௠ và chi phí ܿ௠ . Vӟi thuұt toán (max_hit), thông tin nӝi theo hàm sӕ ݂ሺܿ௠ ǡ ݀௠ ǡ ‫ݏ‬௠ ሻ cӫa mӛi nӝi dung ÿang ÿѭӧc lѭu
dung có giá trӏ

ௗ೘
lӟn nhҩt sӁ ÿѭӧc lѭu trӳ tҥi nút mҥng ÿang trӳ. Sau ÿó, nӝi dung có giá trӏ nhӓ nhҩt sӁ bӏ loҥi bӓ ngay lұp
௦೘
tӭc cho ÿӃn khi bӝ nhӟ trӕng cӫa nút mҥng lӟn hѫn hoһc bҵng
xét. Còn vӟi thuұt toán (min_transit), nӝi dung nӝi dung có giá
vӟi kích thѭӟc cӫa nӝi dung ݉. Sau ÿó, m sӁ ÿѭӧc lѭu trӳ tҥi
trӏ ݀௠ ܿ௠ lӟn nhҩt sӁ ÿѭӧc chӑn. Khi ngѭӡi dùng gӱi yêu cҫu
nút mҥng này. Giá trӏ nhӓ nhҩt cӫa nӝi dung theo hàm sӕ
cho nӝi dung m, nút mҥng nhұn ÿѭӧc sӁ tìm kiӃm trong danh
݂ሺܿ௠ ǡ ݀௠ ǡ ‫ݏ‬௠ ሻ sӁ ÿѭӧc tính toán mӛi lҫn lѭu trӳ ݉.
sách nӝi dung cӫa mình, nӃu tên nӝi dung trong danh sách
trùng khӟp vӟi tên nӝi dung ÿѭӧc yêu cҫu thì nӝi dung ÿó sӁ Thuұt toán (min_transit) là thuұt toán có tính ÿӃn khҧ năng
ÿѭӧc gӱi ÿӃn cho ngѭӡi dùng bҵng chính con ÿѭӡng mà gói tin hӧp tác giӳa các nút mҥng. ĈiӅu này ÿѭӧc thӵc hiӋn thông qua
yêu cҫu ÿӃn. Lúc này, giá trӏ ݀௠ cӫa nӝi dung sӁ tăng lên mӝt, giá trӏ ܿ௠ . Xét mӝt vùng mҥng bao gӗm nhiӅu nút mҥng. Khi
thông sӕ này sӁ tăng lên mӛi khi nӝi dung ݉ ÿѭӧc yêu cҫu tҥi mӝt nút mҥng nhұn ÿѭӧc yêu cҫu cho nӝi dung ݉ không ÿѭӧc
nút mҥng mà nó ÿѭӧc lѭu trӳ. Bên cҥnh ÿó, mӛi nút mҥng lѭu trӳ tҥi nút mҥng ÿó thì bҳt buӝc nó phҧi gӱi yêu cҫu tӟi các
cǊng có hai bӝ ÿӃm là hit-counter và miss-counter ÿӇ ghi nhұn nút mҥng hàng xóm khác. Nӝi dung ݉ ÿѭӧc gӱi trҧ vӅ cho nút
lҥi sӕ lҫn mà nút mҥng có thӇ ÿáp ӭng yêu cҫu cӫa ngѭӡi dùng. mҥng ÿang xét tӯ các nút mҥng khác nhau vӟi chi phí ܿ௠ khác
Mӛi khi nӝi dung yêu cҫu ÿã ÿѭӧc ÿѭӧc lѭu trӳ tҥi nút mҥng nhau. Trong thuұt toán (min_transit), nӝi dung nӝi dung có giá
ÿang xét và nút mҥng có thӇ hӗi ÿáp lҥi yêu cҫu ngѭӡi dùng trӏ ݀௠ ܿ௠ lӟn nhҩt sӁ ÿѭӧc chӑn. ĈiӅu này có nghƭa là nӝi dung
ngay lұp tӭc thì giá trӏ hit-counter sӁ tăng lên. Ngѭӧc lҥi, khi m vӟi ܿ௠ cao sӁ ÿѭӧc lѭu trӳ tҥi nút mҥng. Bӣi vì khi giá trӏ
nút mҥng không lѭu trӳ nӝi dung ÿѭӧc yêu cҫu thì giá trӏ miss- vӟi ܿ௠ cao, chӭng tӓ nӝi dung ݉ ÿӃn ÿѭӧc lѭu trӳ tҥi mӝt nút
counter tҥi nút mҥng này sӁ tăng lên, ÿӗng thӡi yêu cҫu tӯ mҥng nҵm cách xa nút mҥng ÿang xét. Do vұy ÿӇ hҥn chӃ lѭu
ngѭӡi dùng sӁ ÿѭӧc chuyӇn tiӃp tӟi mӝt nút mҥng tiӅm năng lѭӧng nӝi dung truyӅn tҧi và ÿҧm bҧo băng thông thì nӝi dung
khác. m nên ÿѭӧc lѭu trӳ cho nhӳng lҫn yêu cҫu sau này. Trong
trѭӡng hӧp nӃu các nút mҥng trong vùng không có nӝi dung m
Trong thuұt toán (max_hit), tӍ lӋ hit nӝi dung tҥi các nút
mà phҧi gӱi yêu cҫu ra ngoài mҥng Internet thì ݉ sӁ ÿѭӧc ѭu
mҥng sӁ ÿѭӧc tӕi ÿa hóa (ÿӗng nghƭa vӟi viӋc tӕi thiӇu hóa tӍ lӋ
tiên lѭu trӳ tҥi nút mҥng ÿang xét ÿӇ tránh tiêu tӕn băng thông
miss nӝi dung) và tӕi thiӇu hóa lѭu lѭӧng nӝi dung truyӅn tҧi
tӯ các cөm nút khác vӟi thuұt toán (min_transit). Ta xét mӝt

20
khi nhұn nӝi dung tӯ mҥng Internet cho nhӳng lҫn yêu cҫu sau dung chӑn tӯ cөm nút cha. Ĉây là các nӝi dung nҵm trong
này. khoҧng tӯ 1 ÿӃn 4.000 cӫa cөm nút mҥng. Do ÿó sӕ lѭӧng nӝi
dung ÿѭӧc khӣi tҥo tҥi nút mҥng ÿѫn là lӟn hѫn 1 và bé hѫn
Thuұt toán max_hit và min_transit
4,000 thӓa ÿiӅu kiӋn tәng kích thѭӟc các nӝi dung nhӓ phҧi
1: Khӣi tҥo danh sách ‫;ܮ‬
2: WHILE {mӝt ngѭӡi dùng gӣi mӝt yêu cҫu nӝi dung ݉} hѫn khҧ năng lѭu trӳ tҥi nút ÿang xét là 10 GB.
3: IF (݉ ‫)ܮ א‬
4: gӣi nӝi dung ݉ ÿӃn ngѭӡi dùng; ĈӇ thӵc hiӋn ÿo lѭӡng ÿánh giá, chѭѫng trình mô phӓng
5: ELSE sӁ tҥo ra 5*105 gói tin trong khoҧng thӡi gian gҫn mӝt ngày
6: ‫ ܮ‬ൌ ‫ ܮ‬൅ ሼ݉ሽ; \* lѭu ݉ *\ cӫa quá trình mô phӓng, tӭc là cӭ mӛi giây thì 6 gói tin sӁ
7: WHILE (‫݁ݖ݅ݏ‬ሺ‫ܮ‬ሻ ൐ ܵ)
8: ‫ ܮ‬ൌ ‫ ܮ‬െ ௜‫א‬௅ ݂ሺܿ௜ ǡ ݀௜ ǡ ‫ݏ‬௜ ሻ ; \* loҥi bӓ ÿѭӧc tҥo ra. Các gói tin này ÿҥi diӋn cho yêu cҫu cӫa ngѭӡi
9: nӝi dung trong ‫ ܮ‬vӟi giá trӏ ݂ሺܿ௜ ǡ ݀௜ ǡ ‫ݏ‬௜ ሻ nhӓ dùng gӱi tӟi các máy chӫ ÿӇ yêu cҫu thông tin nӝi dung cҫn
10: nhҩt *\ thiӃt. Chúng sӁ ÿѭӧc gӱi lҫn lѭӧt ÿӃn nút mҥng ÿѫn, sau 2.000
11: ENDWHILE;
12: lҫn gӱi ÿҫu tiên sӁ tiӃn hành ÿo lѭӡng. Tӭc là sau khoҧng thӡi
ENDIF
13: ENDWHILE gian khӣi ÿӝng vӟi 2.000 gói tin, chѭѫng trình sӁ tính toán tӍ lӋ
14: miss, hit, lѭu lѭӧng nӝi dung tӯ gói tin thӭ 2.001. Trong quá
trình gӱi 2.000 gói tin ÿҫu tiên, nút mҥng thӵc hiӋn thuұt toán
IV. KӂT QUҦ MÔ PHӒNG ÿã ÿӅ xuҩt ÿӇ lѭu trӳ các nӝi dung phù hӧp cǊng nhѭ loҥi bӓ
Chѭѫng trình mô phӓng ÿѭӧc xây dӵng nhҵm ÿo lѭӡng các nӝi dung không cҫn thiӃt ViӋc này ÿѭӧc thӵc hiӋn dӵa vào
hiӋu quҧ cӫa các thuұt toán ÿã ÿӅ xuҩt. ViӋc ÿánh giá sӁ dӵa ContentID cӫa mӛi nӝi dung m. Sau khoҧng thӡi gian khӣi
trên kӃt quҧ cӫa ba thông sӕ: tӍ lӋ hit, tӍ lӋ miss và lѭu lѭӧng ÿӝng này, danh sách nӝi dung cӫa nút mҥng ÿã ÿѭӧc cұp nhұt
nӝi dung truyӅn tҧi. Trong quá trình mô phӓng, chúng tôi giҧ tѭѫng ÿӕi әn ÿӏnh.
ÿӏnh rҵng tӗn tҥi các nút mҥng ÿѫn và mӝt cөm các nút mҥng.
ContentID trong các gói tin yêu cҫu ÿѭӧc tҥo ra mӝt cách
Cөm nút mҥng này có thӇ trҧ lӡi cho tҩt cҧ các yêu cҫu tӯ
ngүu nhiên theo phân phӕi xác suҩt, cө thӇ là theo hàm phân
ngѭӡi dùng. Ĉây là nѫi ÿҥi diӋn cho các máy chӫ lѭu trӳ trên
phӕi Zipf, ÿây là mӝt phân phӕi quy tҳc lǊy thӯa vӟi thông sӕ
Internet. Còn nút mҥng ÿѫn sӁ là nѫi nhұn tҩt cҧ các yêu cҫu
ߙ thay ÿәi. ߙ càng lӟn thì tҫn sӕ xuҩt hiӋn mӝt sӕ ContentID
nӝi dung ÿӃn tӯ các ngѭӡi dùng khác nhau. Nó ÿҥi diӋn cho
càng lӟn. Trong chѭѫng trình mô phӓng, chúng tôi sӱ dөng giá
các máy chӫ biên ӣ gҫn vӟi ngѭӡi dùng nhҩt. Khi các gói tin
trӏ ߙ trong khoҧng tӯ 0.4 ÿӃn 1.1 ÿӇ xác ÿӏnh tӍ lӋ hit, tӍ lӋ miss
yêu cҫu tӯ ÿѭӧc chuyӇn tӟi sӁ thông qua các máy chӫ biên ÿӇ
và lѭu lѭӧng nӝi dung. Trên Inernet, hàm phân phӕi Zipf có
ra ngoài mҥng, do ÿó ÿây là nѫi ÿҫu tiên nhұn ÿѭӧc các yêu
tҫn suҩt xuҩt hiӋn rҩt lӟn. Nó có mһt trong mҥng Internet tӯ
cҫu vӅ nӝi dung trong mӛi AS. Và nó cǊng sӁ nhұn nӝi dung
cҩp ÿӝ ÿӏnh tuyӃn nӝi dung giӳa các vùng khác nhau cho ÿӃn
hӗi ÿáp tӯ các cөm nút mҥng khác ÿӇ trҧ vӅ cho ngѭӡi dùng
kinh tӃ xã hӝi. Ĉây là lý do các ContentID ÿѭӧc tҥo ra theo
hoһc trҧ lӡi bҵng nӝi dung nó ÿang lѭu trӳ nӃu trùng khӟp vӟi
hàm Zipf. Các ContentID này ÿóng vai trò là các yêu cҫu tӯ
yêu cҫu cӫa ngѭӡi dӫng. Do vұy, viӋc lѭu trӳ nӝi dung ӣ các
ngѭӡi dùng gӱi tӟi nút mҥng trong quá trình mô phӓng. TӍ lӋ
nút mҥng ÿѫn ÿóng vai trò rҩt quan trӑng trong quá trình hoҥt
hit, miss và lѭu lѭӧng nӝi dung cӫa thuұt toán ÿѭӧc tính toán
ÿӝng cӫa mҥng ICN. Trong quá trình mô phӓng, chúng tôi giҧ
dӵa trên sӕ lҫn trùng khӟp cӫa ContentID yêu cҫu và
sӱ rҵng cөm nút mҥng chӭa ÿӃn 10.000 thông tin nӝi dung.
ContentID trong danh sách nӝi dung lѭu trӳ cӫa nút mҥng. KӃt
Khҧ năng lѭu trӳ cӫa mӛi nút mҥng ÿѫn là 10 TB và kích
quҧ thu ÿѭӧc tӯ hai thuұt toán ÿӅ xuҩt sӁ so sánh vӟi nhӳng
thѭӟc cӫa mӛi nӝi dung là mӝt sӕ nҵm trong khoҧng 1 ÿӃn 10
GB. Ban ÿҫu nút mҥng ÿѫn có thӇ chӭa mӝt danh sách các nӝi

21
thuұt toán lѭu trӳ ÿang ÿѭӧc sӱ dөng hiӋn nay ÿó là LCE-LRU (min_transit) có lѭu lѭӧng truyӅn tҧi thҩp nhҩt trong bӕn thuұt
và LCE-LFU. toán. Nhìn mӝt cách tәng quan, hiӋu suҩt lѭu trӳ nӝi dung tҥi
nút mҥng ÿѫn sӁ tăng khi Ƚ tăng. Vӟi giá trӏ Ƚ lӟn thì sӵ chênh
Sau khi thӵc hiӋn mô phӓng, kӃt quҧ thu ÿѭӧc cho thҩy
lӋch giӳa các thuұt toán là không nhiӅu. Ta cǊng nhұn thҩy
hai thuұt toán ÿӅ xuҩt hoҥt ÿӝng tӕt hѫn so vӟi giҧi thuұt LCE-
rҵng thuұt toán lѭu trӳ LCE vӟi LRU luôn thӇ hiӋn hiӋu quҧ
LRU và LCE-LFU. Trong Hình 1, thuұt toán (max_hit) có tӍ lӋ
thҩp nhҩt trong tҩt cҧ các trѭӡng hӧp. Riêng thuұt toán LCE
hit cao hѫn hҷn so vӟi ba thuұt toán còn lҥi. Vì vұy tӍ lӋ miss
vӟi LFU mһc dù cho kӃt quҧ thҩp hѫn (max_hit) nӃu mөc tiêu
cӫa thuұt toán (max_hit) luôn luôn thҩp nhҩt trong các thuұt
là tӕi ÿa tӍ lӋ hit, nhѭng lҥi tӕt hiӋu quҧ hѫn (min_transit). Còn
toán lѭu trӳ ÿang ÿѭӧc mô phӓng (xem Hình 2). Ví dө, vӟi
nӃu mөc tiêu ÿһt ra là tӕi thiӇu hóa lѭu lѭӧng nӝi dung truyӅn
Ƚ ൌ ͲǤͷ, tӍ lӋ hit cӫa (max_hit) là 53.1%, trong khi LCE+LRU
tҧi thì LCE+LFU tӋ hѫn (min_transit) nhѭng lҥi tӕt hѫn
là 28.8% và LFU là 42.5%.
(max_hit). Vì vұy, LCE+LFU có thӇ xem nhѭ là phѭѫng pháp
tҥm thӡi ÿӇ lѭu trӳ nӝi dung nӃu nhѭ nút mҥng chѭa ÿѭӧc triӇn
khai mô hình tӕi ѭu hóa lѭu trӳ thông tin, nӝi dung.
Hình 1. T͑ l͏ hit theo ߙ
Hình 3. L˱u l˱ͫng n͡i dung theo ߙ.
V. KӂT LUҰN
Khi mà lѭu lѭӧng nӝi dung ÿang ngày mӝt tăng lên thì viӋc
xây dӵng mӝt bài toán tӕi ѭu cho viӋc lѭu trӳ nӝi dung phân tán
là mӝt vҩn ÿӅ cҩp thiӃt khi xây dӵng mô hình mҥng ICN. Bài
báo này ÿѭa ra nhӳng nghiên cӭu ÿӇ xây dӵng mӝt thuұt toán
có khҧ năng tính toán tӕi ѭu cho viӋc lѭu trӳ phân tán nӝi dung
trên các node mҥng cӫa ICN. Chúng tôi ÿã ÿӅ xuҩt mô hình tӕi
ѭu hóa trong viӋc lѭu trӳ nӝi dung trong kiӃn trúc mҥng ICN.
Mөc ÿích cӫa các thuұt toán ÿѭӧc ÿӅ xuҩt là tӕi ѭu hóa tӍ lӋ hit
và giҧm thiӇu lѭu lѭӧng vұn chuyӇn khi nӝi dung ÿѭӧc yêu cҫu.
Dӵa trên viӋc giҧi quyӃt bài toán Knapsack, chúng tôi giӟi thiӋu
Hình 2. T͑ l͏ miss theo ߙ.
hai thuұt toán lѭu trӳ cho mӝt nút mҥng ÿó là (max_hit) và
Hình 3 mô tҧ lѭu lѭӧng nӝi dung truyӅn tҧi trong suӕt quá
(min_transit). Tӯ các kӃt quҧ sӕ liӋu cho thҩy hai thuұt toán
trình thӵc hiӋn mô phӓng cӫa bӕn thuұt toán vӟi các giá trӏ Ƚ ÿѭӧc ÿӅ xuҩt có hiӋu quҧ nәi trӝi hѫn so vӟi các thuұt toán lѭu
khác nhau. KӃt quҧ thu ÿѭӧc cǊng cho thҩy rҵng thuұt toán trӳ truyӅn thӕng là LCE+LRU và LCE+LFU.

22
HộiHội
Thảo Quốc
Thảo QuốcGia
Gia2015
2015về
về Điện Tử, Truyền
Điện Tử, ThôngvàvàCông
Truyền Thông CôngNghệ
Nghệ Thông
Thông Tin Tin (ECIT
(ECIT 2015)
2015)
ACKNOWLEDGMENT forest for the trees,” in ACM Workshop on Hot Topics in

Networks (HotNets), 2011.
TS. Võ Th Lu Phng là tác gi chu trách nhim. Nghiên
[12] N. Laoutaris, H. Che, I. Stavrakakis, “The LCD interconnection
cu c tài tr bi i hc Quc gia Thành ph H Chí Minh
(HQG-HCM) trong khuôn kh  tài mã s C2015-28-01. of LRU caches and its analysis,” Performance Evaluation, vol.
63, no. 7, pp. 609–634, 2006 S. Ihm and V. S. Pai, “Towards
understanding modern web traffic,” in ACM Workshop on
Information-Centric Networking (ICN), 2011.
[13] W. K. Chai, D. He, I. Psaras, and G. Pavlou, “Cache “less for
TÀI LIU THAM KHO
more” in information-centric networks,” in Proc. of the IFIP-
[1] Stanford University TRIAD project. [Online]. Available:
TC6 Networking Conference, 2012.
http://www-dsg.stanford.edu/triad/.
[14] I. Psaras, W. K. Chai, and G. Pavlou, “Probabilistic in-network
[2] M. Caesar, T. Condie, J. Kannan, K. Lakshminarayanan, and I.
caching for information-centric networks,” in ACM Workshop
Stoica, “ROFL: routing on flat labels,” in ACM SIGCOMM, 2006,
on Information-Centric Networking (ICN), 2012.
pp. 363–374.
[15] G. Carofiglio, V. Gehlen, and D. Perino, “Experimental
[3] T. Koponen, M. Chawla, B. Chun, A. Ermolinskiy, K. H. Kim, S.
evaluation of memory management in content-centric
Shenker, and I. Stoica, “A data-oriented (and beyond) network
networking,” in International Conference on Communications
architecture,” in ACM SIGCOMM, 2007, pp. 181–192.
(ICC), 2011.
[4] FP7 PSIRP project. [Online]. Available: http://www.psirp.org/
[16] M. Caesar, T. Condie, J. Kannan, K. Lakshminarayanan, and I.
[5] V. Jacobson, D. K. Smetters, J. D. Thornton, M. F. Plass, N. H.
Stoica, “ROFL: routing on flat labels,” in ACM SIGCOMM,
Briggs, and R. L. Braynard, “Networking named content,” in
2006, pp. 363–374.
ACM CoNEXT, 2009.
[17] L. Rizzo and L. Vicisano, “Replacement policies for a proxy
[6] FP7 COMET project. [Online]. Available: http://www.comet-
cache,” IEEE/ACM Transactions on Networking (ToN), vol.8,
project.org/
no.2, pp. 158-170, 2000.
[7] FP7 CONVERGENCE project. [Online].
[18] D. Lee, J. Choi, J. H. Kim, S. H. Noh, S. L. Min, Y. Cho, C. S.
Available:http://www.ictconvergence.eu/
Kim, “LRFU: A spectrum of policies that subsumes the least
[8] NSF Named Data Networking project. [Online]. Available:
recently used and least frequently used policies,” IEEE
http://www.named-data.net/
Transactions on Computers, vol. 50, no. 12, pp. 1352-1361,
[9] FP7 SAIL project. [Online]. Available: http://www.sail-
2001.
project.eu/.
[19] H. Kellerer, U. Pferschy, and D. Pisinger, Knapsack problems.
[10] FP7 PURSUIT project. [Online].
Springer Science & Business Media, 2004
Available:http://www.fp7pursuit.eu/PursuitWeb/
[11] A. Ghodsi, S. Shenker, T. Koponen, A. Singla, B. Raghavan,
and J. Wilcox, “Information-centric networking: seeing the
23
23
iu Phi Tác V Trong H Thng MAP-REDUCE

Da Trên Tính a Phưng Ca D Liu
Hunh Tn t Bùi Xuân Lc
Hc viên Khoa Công Ngh Thông Tin II Khoa K Thut
Hc Vin Công Ngh Bưu Chính Vin Thông i Hc Tân To
Email: dathuynhtan@gmail.com Email: locbui@ieee.org
Abstract— Vn  d liu a phưng là mt vn  quan trng thêm  to ra kt qu cui cùng. Khi thc hin các tác v
cn xem xét khi thit k thut toán iu phi công vic cho h “map”, mt trong nhng xem xét quan trng là vic phân b
thng Map-Reduce. Gn ây, bài báo k thut [13] ã gii quyt tác v gn vi máy tính lưu tr khi d liu u vào cho tác v
ưc vn  d liu a phưng bng vic  xut mt kin trúc ó; vn  này còn ưc gi là vn  d liu a phưng.
hàng i mi và mt thut toán iu phi tác v ánh x (map
task) da trên chính sách JSQ (Join the Shortest Queue) kt hp i vi mi tác v, chúng ta gi mt máy tính là mt máy
vi chính sách MaxWeight. Tuy nhiên, bài báo [13] ch xem xét tính a phưng cho tác v nu on d liu liên quan n tác
trưng hp  sao lưu d liu là mt giá tr c th bng 3. Trên v này ưc lưu tr ngay ti máy tính ó, và chúng ta gi tác
thc t, tu thuc vào cu hình h thng,  sao lưu d liu có th v này là mt tác v a phưng trên máy tính. Trong trưng
ln hn hoc nh hn 3. Trong bài báo này, chúng tôi m rng
nghiên cu ca bài báo [13] và so sánh hiu sut h thng trong
hp còn li (ngha là d liu cn thit cho tác v không ưc
các trưng hp  sao lưu d liu có giá tr khác nhau, t ó lưu tr ti máy tính), máy tính ó ưc gi là máy tính t xa
giúp ngưi vn hành h thng Map-Reduce có thêm mt tiêu chí cho tác v, và tưng ng vi tác v này ưc gi là tác v t
 chn các thông s h thng phù hp. xa trên máy tính. Tính a phưng nên ưc xem xét n trong
vic phân b các tác v “map” chy trên các máy tính. Vic
Keywords- in toán ám mây, Map-Reduce, d liu a ci thin tính a phưng có th gim thi gian x lý ca các
phưng, Hadoop. tác v “map” và lưu lưng ti t mng khi mt vài tác v
“map” cn ly d liu t xa. Tuy nhiên, vic gán tt c các tác
I. GII THIU
v n các máy tính a phưng có th dn n mt s phân
Ngày nay, chúng ta ang sng trong thi i thông tin, vi phi không ng u ca các tác v gia các máy, tc là mt
s tng trưng bùng n thông tin theo cp s nhân. Nhng s máy b tc nghn trong khi các máy khác nhàn ri. Vì vy
công ty hàng u v công ngh thông tin như Google, Yahoo!, chúng ta cn phi cân bng gia các d liu a phưng và cân
Amazon, Microsoft, Facebook, Twitter… ang i mt vi bng ti trong Map-Reduce. ây chính là ng lc thúc y
mt khi lưng d liu khng l. S tng trưng này òi hi các nhà nghiên cu tìm hiu, ci tin,  xut các thut toán
các chin lưc mi  x lý và phân tích d liu. in toán mi nhm nâng cao hiu qu s dng và hiu sut h thng.
ám mây ưc phát trin và Map-Reduce/Hadoop ang là mt Mt s thut toán iu phi ưc  xut trưc ây trong h
mô hình tính toán mnh m ưc ng dng trong in toán thng Map-Reduce/Hadoop  ci thin d liu a phưng.
ám mây. Vic x lý các tp d liu quy mô ln ã tr thành Thut toán FIFO scheduler trong Hadoop [12] vi vic iu
mt vn  ngày càng quan trng và y thách thc vi s phi mt máy sn sàng  phc v tác v “map” t công vic
lưng d liu ưc to ra bi các mng xã hi trc tuyn, head-of-line vi d liu gn nht n máy tính. Mc dù mt vài
nghiên cu khoa hc… Map-Reduce/Hadoop [9]-[15] là mt ti ưu hoá a phưng ã ưc thc hin, vn  head-of-line
framework n gin nhưng mnh m  x lý các tp d liu blocking  a phưng vn tn ti và hiu sut thông lưng vn
quy mô ln trong môi trưng phân tán và x lý song song, và b hn ch. Thut toán Fair Scheduler trong Hadoop [6] vi k
ang ưc s dng rng rãi trong thc t. Mt cm máy tính thut iu phi chm tr ưc s dng  ci thin a phưng.
Map-Reduce có th bao gm hàng chc ngàn máy tính [2]. Các Khi mt máy tính yêu cu mt tác v mi, nu công vic ưc
d liu ưc lưu tr thưng ưc t chc trên h thng phân iu phi tip  công bng không có tác v a phưng sn có
phi tp tin (ví d h thng tp tin Google (GFS) [10], h thng cho máy tính này, thì công vic tm thi b qua và máy tính
tp tin phân tán Hadoop (HDFS) [4]) trong ó phân chia mt kim tra các công vic tip theo trong danh sách. K t khi
tp d liu ln thành nhiu on d liu và lưu tr thành nhiu máy tính ưc gii phóng nhanh, nhiu tác v a phưng ưc
bn sao (mc nh là 3 bn sao) ca mi on d liu trên các phc v. Tuy nhiên, máy tính ang rnh s ưc gii thiu t
máy tính khác khau. Mt yêu cu x lý d liu trong mt máy sn sàng có th b qua tt c các công vic khi nó
framework Map-Reduce ưc gi là mt công vic (job) bao không th tìm mt tác v a phưng và vic cân bng gia
gm hai loi tác v: “map” (“ánh x”) và “reduce” (“gim”). thi gian rnh và a phưng là không rõ ràng. Thut toán iu
Mt tác v “map” c mt on d liu và x lý nó  to ra phi Quincy ưc thit k cho Dryad [7] vi mt mô hình phân
kt qu trung gian (các cp khoá – giá tr). Sau ó tác v phi máy tính cho phép lưu d liu phc tp hn Map-Reduce.
“reduce” ly kt qu trung gian và thc hin các tính toán Quincy s dng tng s d liu truyn như n v o a
ISBN: 978-604-67-0635-9 24
24
phưng và mã hoá nó vào trong mô hình giá. Sau ó, quyt cn ly d liu u tiên. Các tác v có th phân loi theo các
nh iu phi ưc thc hin bng cách gii quyt vn  chi máy tính a phưng mà chúng liên kt vi nhau. i vi mi
phí thp nht. Ngoài ra, còn có rt nhiu công trình nghiên cu tác v chúng tôi gán ch s ca K máy tính cc b theo mt
ã  xut thut toán iu phi  gii quyt vn  ci thin trt t tng dn vào trong mt vector  hình thành các loi tác
d liu a phưng trong Map-Reduce và ưc trin khai trong v:
thc t. Tuy nhiên chưa có công trình nghiên cu nào ưa ra  ∈   ,  , … ,    ∈ 1,2, … ,  ,  <  < ⋯
thut toán iu phi công vic có th t ưc min dung
<  .
lưng y  (full capacity region)  gim thiu thi gian ch
i và tc nghn trong mt cm máy tính Map-Reduce. Các ký hiu  ∈  ch rng máy tính m là mt máy tính a
Vi tình hình ó, mt kin trúc hàng i mi và mt thut phưng cho kiu tác v . Chn ký hiu ℒ biu th cho tp
toán iu phi tác v “map” ã ưc  xut gn ây trong bài hp các kiu công vic tn ti trong cm và  = ℒ.
báo k thut [13]. Kin trúc và thut toán này gii quyt ưc A. Quá trình n và quá trình phc v
vn  d liu a phưng bng vic t ưc min dung lưng
y  nhm gim thiu thi gian ch i và tc nghn trong Cho   biu din tng s lưng kiu công vic  n h
mt cm máy tính Map-Reduce. Kin trúc hàng i này gm thng cho n thi im bt u ca khe thi gian t. Chúng tôi
mt hàng i a phưng tưng ng vi tng máy tính  lưu gi s rng quá trình n là hàm tng theo thi gian vi tc 
tr các tác v a phưng cho các máy này và mt hàng i n  . Ti mi máy tính thi gian phc v công vic ưc gi
chung cho tt c các máy tính. Da trên kin trúc hàng i này, s là tuân theo phân phi hình hc (geometric distribution).
các tác gi nghiên cu mt thut toán iu phi tác v ánh x Tham s phân phi hình hc cho mt công vic ti mt máy
(map) vi hai giai on: khi mt tác v mi n nó s ưc tính a phưng là  và ti máy tính t xa là . Quá trình phc
chuyn n mt trong 3 hàng i tưng ng vi 3 máy tính a v ca mt công vic có th ưc xem như là mt chui các
phưng hoc hàng i chung bng chính sách Join the Shortest s kin c lp vi xác sut thành công  (hoc ) và chui s
Queue (JSQ) và khi mt máy tính rnh nó s chn mt tác v kin s dng mt khi chúng ta có mt s thành công tc là
t hàng i a phưng tưng ng vi nó hoc hàng i chung mt công vic ã hoàn thành. Trong mô hình này chúng tôi gi
bng cách s dng chính sách MaxWeight [14]. s  > , ngha là, thi gian phc v trung bình ca công vic
a phưng là ít hn thi gian phc v công vic t xa. Chú ý
Có th d dàng thy rng các tác gi ca [13] ch xem xét
rng các giá tr khác nhau ca  và  th hin hiu qu x lý
trưng hp  sao lưu d liu bng 3 (ngha là mi on d
khác nhau i vi d liu a phưng.
liu có 3 bn sao ưc lưu tr  3 máy tính khác nhau). Trên
thc t, tu thuc vào cu hình h thng,  sao lưu d liu có B. Thut toán iu phi công vic (task scheduling algorithm)
th ln hn hoc nh hn 3. Trong bài báo này, chúng tôi m
rng nghiên cu ca bài báo [13] bng vic xem xét và so sánh iu phi công vic là vic gán các công vic n các máy
hiu sut h thng trong các trưng hp  sao lưu d liu có tính  x lý. Vi vn  d liu a phưng, thut toán iu
giá tr khác nhau. C th, chúng tôi chng minh lý thuyt và phi công vic có th nh hưng áng k n hiu qu ca h
mô phng h thng dùng công c mô phng OMNeT++ cho thng. Trong bài báo này, chúng tôi xem xét mt thut toán
trưng hp  sao lưu d liu K có giá tr tng quát; ng thi iu phi công vic bao gm hai phn, nh tuyn và iu
so sánh hiu sut ca h thng vi các trưng hp dưi ti phi, ưc  xut trong bài báo k thut [13]. H thng iu
(underload), gn ti (load), và quá ti (overload). Chúng tôi tin phi bao gm mt kin trúc hàng i ưc minh ho bi Hình
rng nhng kt qu có ưc s giúp ngưi vn hành h thng 1. Máy Master duy trì mt hàng i các công vic cc b cho
Map-Reduce có thêm mt tiêu chí  chn các thông s h mi máy tính m, ưc ký hiu là  và ưc gi là hàng i
thng phù hp. cc b. Có mt hàng i chung cho tt c các máy tính ưc
ký hiu là  (hoc ôi khi ngưi ta ký hiu  ) và ưc
Phn còn li ca bài báo ưc t chc như sau. Trong phn gi là hàng i chung t xa (common remote queue). Chúng
II, chúng tôi miêu t mô hình h thng. Trong phn III, chúng tôi dùng mt vector chiu dài hàng i  =   , … ,
tôi trình bày chng minh lý thuyt v ti ưu hoá thông lưng.  ,    ký hiu cho chiu dài các dàng i ti thi
Phn IV cung cp các kt qu mô phng. Cui cùng, chúng tôi im bt u ca khe thi gian t. Khi mt công vic n, máy
kt lun bài báo trong phn V. Master nh tuyn công vic này n mt hàng i trong h
thng hàng i. Khi mt máy tính là idle, nó chn mt công
II. MÔ HÌNH H THNG
vic t hàng i a phưng tưng ng hoc hoc t hàng i
Chúng tôi xem xét mt mô hình thi gian ri rc cho mt cm chung t xa  phc v. Hai bưc này ưc minh ho trong
máy tính bao gm M máy tính, ưc ánh s th t 1, 2, …, Hình 1. Chúng ta gi bưc u tiên là nh tuyn (routing) và
M. Chúng tôi gi nh rng mi công vic n yêu cu mt tác bưc th hai là iu phi (scheduling). Thut toán c th như
v “map”, và mi tác v “map” yêu cu mt mu d liu u sau.
vào. Chúng tôi cng gi s rng mi mt mu d liu ưc
Bưc 1 - Join the Shortest Queue (JSQ) Routing: Khi mt
sao lưu  K (K > 1) máy tính khác nhau. Vì vy mi tác v
công vic n, máy tính Master s so sánh chiu dài hàng i
liên quan n K máy tính a phưng. Phi mt mt thi gian
ca K hàng i cc b và hàng i chung t xa và sau ó nh
dài hn cho mt máy tính  x lý mt tác v nu on d liu
cn thit không ưc lưu tr ti a phưng k t khi máy tính tuyn n mt hàng i có chiu dài ngn nht. Cho , 
2525
và   biu din các công vic  ưc giao tưng ng vi nu máy tính m là idle tc là   = ,   là 1 hoc 2
 và  . Các công vic ưc giao n cho mi hàng i có ưc quyt nh bi máy tính Master bng thut toán
th ưc biu din bng vector n MaxWeight. Chúng tôi dùng vector iu phi  =
 =  , … ,  ,  ưc nh ngha như sau:  ,  , … ,    biu din quyt nh iu phi cho
tt c các máy tính.
  =   , ,  = 1,2, … , , C. ng hc hàng i (queue dynamics)
 ∈

Trong khe thi gian t, u tiên máy tính Master kim tra thông
 =    . tin trng thái làm vic  và chiu dài hàng i . Sau ó


các công vic n ti máy tính Master và máy tính Master
thc hin nh tuyn và iu phi, cho ta thông tin
. Chúng tôi nh ngha:
   = ,  
=   = 1,
    
 = ,  =   = 2.
Vi nh ngha trên, dch v t máy tính m cho hàng i a
phưng  và hàng i t xa  là hai bin Bernoulli
 

 và   
 . Do ó, các
dch v ưc áp dng cho mi hàng i có th ưc biu din
 , 
bng vector dch v  =  , … ,   
 vi
tc  dch v  hoc . Khi ó chiu dài các hàng i tho
mãn các phưng trình sau:
Hàng i a phưng (Local queues): vi m=1,2, …, M,
 
   1 =            ,
trong ó:
Hình 1: Kin trúc hàng i và thut toán iu phi        1,
  =   
Bưc 2 - MaxWeight Scheduling: Nu mt máy tính m va       = .
hoàn thành mt công vic ti khe thi gian t-1, thì trng thái Hàng i t xa (Remote queue)
làm vic ca nó là idle. Nu không, máy tính phi thc hin 
mt công vic a phưng hoc mt công vic t xa. Cho   1 =         
 ,
 

  = , 1, 2 biu din tưng ng cho 3 trng thái: idle,
ang thc hin mt công vic a phưng, và ang thc hin trong ó:
mt công vic t xa. Vector trng thái làm vic   = 
 =  
 
    
 ,
 ,  , … ,   và vector chiu dài hàng i   ∈
ưc báo cáo v cho máy tính Master ti thi im bt u ca
khe thi gian t và máy tính Master quyt nh iu phi cho vi là tp các máy tính mà nó phc v mt vài công vic
tt c các máy tính da trên  và . Các máy tính idle t hàng i t xa ti slot thi gian t. Chú ý rng có th có mt
ưc iu phi bi thut toán MaxWeight: gi s máy tính m vài máy tính c gng phc v hàng i t xa nhưng tht bi do
là idle ti slot thi gian t, thì nó phc v mt công vic a thiu công vic.
phưng nu     và phc v mt công vic t Chúng ta có th vit li phưng trình ng hc hàng i như
xa cho các trưng hp khác. Các máy tính khác tip tc thc sau:
hin các công vic chưa hoàn thành tc là thc hin các công
vic không ưu tiên. Cho   biu din quyt nh iu phi   1 =       , (1)
ca máy tính m ti slot thi gian t, thì nó là mt hàm ca 
.
vi  =  , … ,  , 
và   và
Trong trưng hp thi gian phc v là xác nh, quá trình
1
hàng i ,    là chui Markov. Tuy nhiên thi gian
  =   ,
phc v trong mô hình này là ngu nhiên và không ng nht
2. do vn  d liu a phưng. Do ó chúng ta cn xem xét
Lưu ý rng   cho bit hàng i máy tính m ã ưc iu thêm các vector trng thái làm vic ; c th,  cùng
phi  phc v. Nó ch có giá tr 1 hoc 2 k t khi ưc iu vi  s to thành chui Markov , ,    .
phi  phc v mt công vic a phưng hoc mt công vic Chúng ta gi nh trng thái ban u là ,  =
t xa. Nu máy tính m không idle tc là   = 12 ,  ,   và không gian trng thái     
chúng ta thit lp iu phi   bng vi  . Tuy nhiên, ,1,2 bao gm tt c các trng thái mà nó có th t ưc
26
26
t trng thái ban u, vi  là tp s nguyên không âm. D chn ngoài Ʌ. Do ó thut toán này là ti ưu thông lưng và Ʌ
thy rng chui Markov này là ti gin (irreducible) và không cng là min dung lưng ca h thng.
tun hoàn (aperiodic).
Chng minh:
III. TI U HOÁ THÔNG LNG Chng minh này tưng t như chng minh ca nh lý 1
trong bài báo k thut [13], tuy nhiên, [13] ch xét trưng hp
Trong phn này, chúng tôi s chng minh tính nng ti ưu hoá K=3. Vi trưng hp K tng quát, ta thy rng tp ℒ (tp hp
thông lưng ca thut toán iu phi ưc trình bày  phn các kiu công vic) s thay i, và  = ℒ cng thay i. Tuy
trưc. Chú ý rng tính nng này ã ưc chng minh trong bài nhiên, chng minh ca nh lý 1 trong [13] vn có th ưc
báo k thut [13] vi trưng hp K=3; trong phn này chúng m rng cho trưng hp K tng quát. Vì lý do gii hn v 
tôi m rng chng minh vi trưng hp K tng quát. dài bài báo, chúng tôi ch nêu ý tưng chng minh  ây và
Ý tưng ca chng minh như sau: Trưc tiên chúng ta xác mi ngưi c tham kho bài báo [13] v chi tit. Ý tưng ca
nh min chn ngoài (outer bound) ca min dung lưng ca chng minh như sau: Vì , ,    là mt chui
h thng. Sau ó chúng ta chng minh rng thut toán iu Markov ti gin và không tun hoàn, s n nh ưc nh
phi trên có th n nh hoá bt k vector tc  n nào ngha là s hi quy dưng (positive recurrence) ca chui
thuc min chn ngoài này (n nh hoá theo ngha các hàng Markov này. Da theo nh lý Foster-Lyapunov m rng, ta
i u n nh và không tng theo thi gian). iu ó có ch cn tìm mt s dưng T và mt hàm Lyapunov sao cho 
ngha là thut toán iu phi trên là ti ưu thông lưng, và trôi ca hàm Lyapunov (Lyapunov drift) sau T khe thi gian b
min dung lưng cng trùng vi min chn ngoài. chn nu  bên trong mt tp con hu hn ca không gian
trng thái và là âm nu  bên ngoài tp con này. C th hàm
A. Min dung lng (capacity region) Lyapunov ưc chn có dng:
i vi bt k kiu công vic  ∈ ℒ, chúng ta gi nh rng s 
lưng kiu công vic  n ưc phân b n máy m có tc  ,  =   =  
 
   
, , vi  =   , . Tp tc  
  , 

 ∈ℒ,,…,
ưc gi là mt phân tích (decomposition) ca vector tc  Khi ó ta có th chng minh rng (tham kho chi tit trong
 =   ,  , … ,  . Vi vector tc  n , xét mt máy [13])  trôi Lyapunov sau T khe thi gian t t0 ưc chn bi
 ,    ≤ 2     vi hng s  > . nh
tính m bt k, iu kin cn  h thng ưc n nh là khi 
lưng tác v trung bình ưc phân b cho máy tính m trong ngha tp ß = ,  ∈   ⋯    ≤    vi
mt khe thi gian có th ưc phc v ht trong khe thi gian  >  bt k. Khi ó ß là mt tp con hu hn ca không
ó, có ngha là: gian trng thái vi ,  ∈ ß , ,  ≤  và ,  ∈
, , ß, ,  ≤ . iu này tho mãn nh lý Foster-Lyapunov
    ≤ 1, (2) m rng và hoàn thành chng minh.
 
∈
   ∉
 
IV. KT QU MÔ PHNG
trong ó v trái là thi gian máy tính m cn có  phc v
Trong phn trưc chúng tôi ã chng minh tính ti ưu hoá
lưng tác v trung bình phân b cho nó trong mt khe thi
thông lưng ca thut toán iu phi ưc  xut ngay c vi
gian, vi tc  dch v  cho công vic a phưng và  cho
 sao lưu d liu K tng quát. Tuy nhiên, câu hi ưc t ra
công vic t xa.
là hiu sut h thng ca thut toán iu phi thay i th nào
Gi Ʌ là tp giá tr tc  n mà mi phn t phân tích ca nó vi các giá tr K khác nhau. Chúng tôi s tr li câu hi ó
tho mãn (2). C th: trong phn này vi các kt qu mô phng.
Ʌ =   =  ,  , … ,  
 Chúng tôi mô phng thut toán vi các giá tr  sao lưu
 =   , , ∀ ∈ ℒ, (3) d liu: K = 2, 3, 4, 6, 8, 10, và so sánh hiu sut ca h thng
vi các trưng hp dưi ti (underload), trong ti (load) và

,  , ∀ ∈ ℒ, ∀ = 1, … ,  quá ti (overload). Tiêu chun ánh giá da vào tng s lưng
các tác v còn tn ti trong các hàng i a phưng và hàng
, , i t xa sau mi khe thi gian.
    ≤ 1, ∀ = 1, … ,  .
  Chúng tôi thc hin mô phng trên h thng vi 400 máy
 ∈
  ∉
 
tính và mt tp d liu ưc phân b ng u trên 320 máy
D thy rngɅ chính là min chn ngoài ca min dung lưng trong s ó. Thi gian phc v cho tác v a phưng và tác
ca h thng. v t xa tuân theo phân phi hình hc vi tham s tưng ng
là  = .8 và  = .2. Vì vy tng dung lưng ca h thng
B. Tính ti u thông lng (throughput optimality) (tính theo s tác v n trong mt n v thi gian) bng  =
nh lý 1: Thut toán iu phi ưc  xut  Phn II.B có 320 α + 80γ = 272. Tng thi gian chy ca h thng là 2000
th n nh h thng vi vector tc  n bt k thuc min n v thi gian.
27
27
HộiHội
Thảo Quốc
Thảo GiaGia
Quốc 2015
2015vềvềĐiện
ĐiệnTử,
Tử,Truyền
TruyềnThông và Công
NghệThông
ThôngTinTin (ECIT
(ECIT 2015)
2015)
Bng 1 cho thy kt qu trung bình theo thi gian ca tng A. Trng hp di ti (underload)
s lưng tác v còn trong hàng i (tưng ng vi tng chiu
Vi trưng hp này chúng ta cho h thng chy vi tc 
dài ca tt c các hàng i) vi các giá tr khác nhau ca tc
tác v n  = 100 (tác v trong mt n v thi gian). Chy
 tác v n () và  sao lưu d liu (K). Kt qu này cng
vi K = 2, 3, 4, 6, 8, 10 vi thi gian 2000 n v thi gian.
ưc th hin trong  th Hình 2. C th, Hình 2 biu din
s bin thiên ca tng chiu dài trung bình hàng i theo s Chúng ta theo dõi tng s lưng tác v tc thi trong h
thay i ca tc  tác v n ng vi các trưng hp K = 2, thng  quan sát s n nh. Hình 3 cho thy con s i din
3, 4, 6, 8, 10. Ta có th thy rng khi tc  n nh (dưi ti này n nh theo thi gian, qua ó thy rõ s n nh ca h
– underload), tng chiu dài trung bình hàng i tng dn khi thng. Vi kt qu như Hình 3 chúng ta thy rng hiu sut h
K tng dn, ngha là giá tr K nh s có hiu sut cao hn trong thng vi  sao chép d liu K = 2, 3, 4, 6, 8, 10 luôn luôn n
trưng hp này. Tuy nhiên, khi tc  n tng dn (ti tng nh theo thi gian. Tuy nhiên vi trưng hp này  sao chép
dn), tng chiu dài trung bình hàng i ng vi giá tr K nh d liu K = 2 tt hn các trưng hp khác.
tng nhanh hn tng chiu dài trung bình hàng i ng vi giá
tr K ln. c bit, khi tc  n gn ti (gn dung lưng h
thng), tng chiu dài trung bình hàng i gim dn khi K
tng dn, ngha là giá tr K ln s cho hiu sut cao hn.
Hình 3: Kt qu trưng hp  = 100

B. Trng hp gn ti (load)
Vi trưng hp này chúng ta cho h thng chy vi tc  tác
v n ln lưt là  = 200 (tác v trong mt n v thi gian),
 = 250 (tác v trong mt n v thi gian),  = 260 (tác v
trong mt n v thi gian), và  = 270 (trong mt n v thi
gian). Chy vi K = 2, 3, 4, 6, 8, 10 vi thi gian 2000 n v
Hình 2: Hiu sut thông lưng h thng thi gian.
Bng 1: Kt qu s lưng công vic trung bình trong h thng Vi kt qu như Hình 4, Hình 5 chúng ta thy rng tng s
CCCCCCSSCC
K lưng tác v tc thi trong h thng vn n nh theo thi
K=2 K=3 K=4 K=6 K=8 K=10
 gian. Kt qu Hình 6, Hình 7 cho thy tng s lưng tác v
100 42 48 55 68 77 85 tc thi trong h thng có chiu hưng quá ti. Tuy nhiên vi
120 65 66 75 90 101 110 các trưng hp này  sao chép d liu K = 10 tt hn các
140 114 89 96 113 127 136
trưng hp khác.
160 371 122 122 138 153 163
180 503 330 159 166 180 191
200 596 445 347 203 211 220
220 713 530 444 344 270 258
230 798 584 490 390 349 316
240 937 663 555 444 398 371
250 1613 849 690 544 482 437
260 8277 7673 7608 7209 7280 6788
272 22941 22514 22456 22042 22205 21752
300 57792 57420 57438 57050 57246 56792
K tip, chúng tôi xem xét quá trình thay i ca tng chiu
dài hàng i theo thi gian ng vi các giá tr khác nhau ca 
và K.
Hình 4: Kt qu trưng hp  = 200
28
28
HộiHội
V. KT LUN
Trong bài báo này chúng tôi ã k tha và m rng kt qu
nghiên cu ca các tác gi W. Wang, K. Zhu, L. Ying, J. Tan,
và L. Zhang trong bài báo k thut [13] cho trưng hp  sao
lưu d liu có giá tr tng quát. Trong h thng Map-Reduce
thc t,  sao lưu d liu là mt thông s quan trng và
chúng tôi tin rng nhng kt qu có ưc trong bài báo này s
giúp ngưi vn hành h thng Map-Reduce có thêm mt tiêu
chí  chn các thông s h thng phù hp.
TÀI LIU THAM KHO
Hình 5: Kt qu trưng hp  = 250 [1] C. Abad, Y. Lu, and R. Campbell (2011), “DARE: Adaptive data
replication for efficient cluster scheduling” in IEEE Int. Conf. Cluster
Computing (CLUSTER), pp. 159–168.
[2] G. Ananthanarayanan, S. Agarwal, S. Kandula, A. Greenberg, I. Stoica,
D. Harlan, and E. Harris (2011), “Scarlett: coping with skewed content
popular in MapReduce clusters” in Proc. European Conf. Computer
Systems (EuroSys), pp. 287–300.
[3] J. Dean and S. Ghemawat (2008), “MapReduce: simplified data
processing on large clusters” ACM Commun, vol 51 (no. 1), pp. 107–
113.
[4] K. Shvachko, H. Kuang, S. Radia, and R. Chansler (2010), “The hadoop
distributed file system” in IEEE Symp. Mass Storage Systems and
Technologies (MSST), pp. 1–10.
[5] L. Tassiulas and A. Ephremides (1992), “Stability properties of
constrained queueing systems and scheduling policies for maximum
throughput in multihop radio networks” IEEE Trans. Autom. Control,
vol 4, pp. 1936–1948.
Hình 6: Kt qu trưng hp  = 260 [6] M. Zaharia, D. Borthakur, J. Sen Sarma, K. Elmeleegy, S. Shenker, and
I. Stoica (2010), “Delay scheduling: a simple technique for achieving
locality and fairness in cluster scheduling” in Proc. European Conf.
Computer Systems (EuroSys), pp. 265–278.
[7] M. Isard, V. Prabhakaran, J. Currey, U. Wieder, K. Talwar, and A.
Goldberg (2009), “Quincy: fair scheduling for distributed computing
clusters” in Proc. ACM Symp. Operating Systems Principles (SOSP),
Big Sky, MT, pp. 261-276.
[8] S. T. Maguluri and R. Srikant (2013), “Scheduling jobs with unknown
duration in clouds” in Proc. IEEE Int. Conf. Computer Communications
(INFOCOM), Turin, Italy.
[9] S. T. Maguluri, R. Srikant, and L. Ying (2012), “Heavy traffic optimal
resource allocation algorithms for cloud computing clusters” in Int.
Teletraffic Congr. (ITC), Krakow, Poland.
[10] S. Ghemawat, H. Gobioff, and S.-T. Leung (2003), “The google file
system” in Proc. ACM Symp. Operating Systems Principles (SOSP), pp.
Hình 7: Kt qu trưng hp  = 270 29–43.
[11] S. Kavulya, J. Tan, R. Gandhi, and P. Narasimhan (2010), “An analysis
C. Trng hp quá ti (overload) of traces from a production MapReduce cluster” in Proc. IEEE/ACM Int.
Conf. Cluster, Cloud and Grid Computing (CCGRID), pp. 94–103.
Vi trưng hp này chúng ta cho h thng chy vi tc  tác [12] T. White (2010), Hadoop: The definitive guide, Yahoo Press.
v n ln lưt  = 272 (tác v trong mt n v thi gian),  [13] W. Wang, K. Zhu, L. Ying, J. Tan, and L. Zhang, (2013), “MapTask
= 300 (tác v trong mt n v thi gian). Chy vi K = 2, 3, scheduling in MapReduce with data locality: Throughput and heavy-
4, 6, 8, 10 vi thi gian 2000 n v thi gian. traffic optimality”, in Proc. IEEE Int. Conf. Computer Communications
(INFOCOM), Turin, Italy.
Vi kt qu Bng 1 chúng ta thy rng ng vi c hai giá tr  [14] L. Tassiulas and A. Ephremides (1993), “Dynamic server allocation to
trong trưng hp này tng s lưng tác v trung bình theo thi parallel queues with randomly varying connectivity” IEEE Trans. Inf.
Theory, vol. 39, pp. 466–478.
gian là tưng ưng nhau cho tt c các giá tr ca K, và h
[15] http://hadoop.apache.org.
thng luôn luôn quá ti.
[16] https://omnetpp.org.
29
29
HộiHội Thảo
Thảo Quốc
Quốc Gia2015
Gia 2015về
vềĐiện
Điện Tử,
Tử,Truyền
Truyền Thông
Thông và
vàCông
CôngNghệ
NghệThông TinTin
Thông (ECIT 2015)
(ECIT 2015)
Ứng dụng tối ưu hóa đa mục tiêu trong bài toán tự

động phân loại thư rác
Nguyễn Xuân Thắng1, Trần Quang Anh2 , Trịnh Bảo Ngọc1 và Nguyễn Thanh Hà2
1
: Đại học Hà Nội. Email: {nxthang, ngoctb}@hanu.edu.vn
2
: Học Viện Công Nghệ Bưu Chính Viễn Thông. Email: tqanh@ptit.edu.vn; thanhha140589@gmail.com
Abstract— Một vấn đề còn tồn tại trong các hệ thống phân loại tự Hiện tại quy trình thiết kế bộ lọc thư rác theo phương pháp
động thư rác dựa trên nội dung là làm sao để cân bằng giữa độ học máy gồm các bước như sau:
chính xác phân loại thư rác và tỉ lệ chặn nhầm thư hợp lệ khi - Sử dụng các tập mẫu để huấn luyện bộ phân loại tự động.
thiết kế các bộ lọc thư rác. Bài báo trình bày một giải pháp cho - Chọn một ngưỡng T dùng để xác định xem một thư mới có
vấn đề này dựa trên việc ứng dụng mô hình tối ưu hóa đa mục
phải là thư rác hay không. Thư mới được tách thành các
tiêu trong thiết kế các bộ lọc thư rác. Để đánh giá giải pháp,
nhóm tác giả đã thực hiện thí nghiệm thiết kế các luật lọc thư rác đặc trưng và so sánh với các đặc trưng đã được ghi nhận
cho phần mềm SpamAssassin sử dụng dữ liệu thư điện tử tiếng bởi bộ huấn luyện. Nếu tổng trọng số của các đặc trưng
Việt. Kết quả thí nghiệm cho thấy phương pháp mới không chỉ này lớn hơn giá trị T thì thư mới sẽ được phân loại là thư
cho kết quả tốt hơn so với các phương pháp hiện có mà còn cho rác.
phép đánh giá “sự thỏa hiệp” (tradeoff) giữa hai tỉ lệ nói trên khi - Tính toán các tham số SDR và FAR để đánh giá hiệu quả
thiết kế bộ lọc thư rác. của bộ lọc.
Theo quy trình trên giá trị của SDR và FAR phụ thuộc vào
Keywords- Lọc thư rác, tối ưu hóa đa mục tiêu, giải thuật di ngưỡng T và trọng số của các đặc trưng. Để tìm ra bộ lọc có
truyền, SpamAssassin.
SDR và FAR phù hợp người dùng phải thử các giá trị T và
I. GIỚI THIỆU trọng số khác nhau rồi lặp lại cả quy trình. Lưu ý là quá trình
huấn luyện bộ phân loại thường rất tốn thời gian do tập mẫu
Ngày nay, thư điện tử đã trở thành một công cụ đắc lực
lớn. Hơn nữa, quy trình chưa hỗ trợ việc đánh giá “sự thỏa
phục vụ cho nhu cầu trao đổi thông tin của các cơ quan, tổ
hiệp” giữa SDR và FAR.
chức, doanh nghiệp cũng như mỗi cá nhân. Tuy nhiên, thư điện
Nhóm tác giả đề xuất giải pháp cho vấn đề trên bằng cách
tử cũng đang bị lợi dụng để phát tán thư rác, lây lan virus máy
coi yêu cầu thiết kế bộ lọc thư rác là một bài toán tối ưu hóa đa
tính và lừa đảo trực tuyến, gây thiệt hại lớn cho người sử dụng.
mục tiêu trong đó ta cần tìm giá trị ngưỡng T và các trọng số
Nhiều giải pháp đã được đưa ra để đối phó với vấn nạn thư rác,
của mỗi đặc trưng sao cho tham số SDR và FAR của bộ lọc thư
trong đó đáng kể nhất là các giải pháp tự động phân loại thư
rác là tối ưu. Giải pháp này được áp dụng để thiết kế bộ lọc thư
rác dựa trên nội dung thông qua học máy. Phương pháp này
rác trên nền tảng phần mềm SpamAssassin [1] với các đặc
cần có hai tập mẫu riêng biệt chứa các thư rác và các thư hợp lệ
trưng được trích chọn là các luật và trọng số của mỗi đặc trưng
đã được phân loại chính xác từ trước. Từ các tập mẫu này, một
là điểm của luật tương ứng. Do đặc thù của bài toán tối ưu đa
thuật toán học máy được sử dụng để trích chọn các đặc trưng
mục tiêu được mô tả trong bài báo là có không gian tìm kiếm
nội dung (thường là từ hoặc cụm từ) của thư rác, đánh trọng số
lớn và nhiều chiều nên nhóm tác giả đề xuất sử dụng giải thuật
cho các đặc trưng và huấn luyện bộ phân loại tự động cho phép
tiến hóa đa mục tiêu (multi-objective evolutionary algorithm –
phân loại các thư mới chưa xuất hiện trong hai tập mẫu. Ưu
MOEA) [9], cụ thể là giải thuật SPEA-II [10,11], để giải bài
điểm của các giải pháp này là có tính linh hoạt và có hiệu quả
toán này. Tuy SPEA-II không cho ra lời giải chính xác nhất,
cao.
nhưng giải thuật này cho kết quả là tập các phương án thỏa
Để đánh giá hiệu quả của một bộ lọc thư rác người ta
thường sử dụng hai tham số chính là độ chính xác phân loại thư hiệp (hay còn gọi là tập phương án tối ưu Pareto) [12]. Từ đó,
rác (Spam Detection Rate – SDR) và tỉ lệ chặn nhầm thư hợp lệ kết hợp thêm các tiêu chí khác, ta chọn được lời giải tốt nhất
(False Alarm Rate – FAR). Trong đó, SDR là tỉ số giữa số thư cho bài toán. So sánh với các giải pháp hiện tại, giải pháp do
rác mà bộ lọc phân loại được và tổng số thư rác đầu vào còn nhóm tác giả đề xuất có hai ưu điểm như sau:
FAR là tỉ lệ giữa số thư hợp lệ bị bộ lọc phân loại nhầm là thư - Tìm được các bộ giá trị khác nhau của ngưỡng T và điểm
rác và tổng số thư hợp lệ đầu vào. Một bộ lọc thư rác lý tưởng của mỗi luật để xây dựng bộ lọc thư rác có tham số SDR
sẽ có tỉ lệ SDR và FAR lần lượt là 100% và 0%. Tuy nhiên các và FAR phù hợp với yêu cầu của người dùng mà không
quan sát thực tế trong quá trình xây dựng các bộ lọc thư rác cho tốn thời gian huấn luyện lại bộ phân loại tự động.
thấy các điều chỉnh để tăng tỉ lệ SDR cũng đồng thời làm tăng - Đưa ra tập nghiệm “thỏa hiệp” giữa các hai mục tiêu đem
tỉ lệ FAR và ngược lại việc giảm tỉ lệ FAR sẽ kéo theo giảm tỉ lại sự lựa chọn dễ dàng hơn cho người dùng khi phải cân
lệ SDR. Do đó vấn đề đặt ra khi thiết kế các bộ lọc thư rác là nhắc giữa SDR và FAR.
cân nhắc “sự thỏa hiệp” (tradeoff) giữa hai tham số SDR và Phần còn lại của bài báo được tổ chức như sau: phần II
FAR để tìm ra giải pháp phù hợp cho mỗi tình huống cụ thể. trình bày về hệ thống lọc thư rác SpamAssassin. Phần III phát
ISBN: 978-604-67-0635-9 30
30
HộiHội
Thảo Quốc
Thảo Gia
Quốc Gia2015
2015về
vềĐiện
Điện Tử,
Tử,Truyền
Nghệ Thông
Thông TinTin (ECIT
(ECIT 2015)
2015)
biểu bài toán và đề xuất phương pháp giải. Phần IV trình bày cho tham số SDR của bộ lọc là lớn nhất khi tiến hành phân loại
các kết quả thí nghiệm và đánh giá hiệu quả của giải pháp. các thư trong tập huấn luyện.
Phần V tóm tắt các kết quả nghiên cứu liên quan đến chủ đề Đối chiếu với các bước của giải pháp tự động phân loại thư
trình bày trong bài báo. Cuối cùng, các kết luận được trình bày rác dựa trên nội dung thông qua học máy đã mô tả ở phần I thì
trong phần VI. giai đoạn một thực hiện việc trích trọn đặc trưng của thư rác
thể hiện ở mỗi luật trong tập luật, còn giai đoạn hai thực hiện
II. BỘ LỌC SPAMASSASSIN xác định trọng số của các đặc trưng này thể hiện ở điểm số của
SpamAssassin là một hệ thống lọc thư rác được sử dụng mỗi luật. Dễ thấy khi xây dựng bộ lọc thư rác trên nền tảng
khá phổ biến do Apache Foundation phát triển. SpamAssassin SpamAssassin, điểm số của các luật có ảnh hướng lớn đến hiệu
phân loại thư rác dựa trên một tập các luật đã được định nghĩa quả của bộ lọc vì điểm số của luật thể hiện độ quan trọng của
sẵn. Mỗi luật được gán một điểm số cho trước. Trong quá trình luật đó trong quá trình phân loại thư. Xác định điểm số cho các
lọc thư rác, tập luật này sẽ được áp dụng một cách tuần tự trên luật càng chính xác thì hiệu quả của bộ lọc thư rác càng cao và
mỗi thư cần phân loại để chấm điểm. Khi tổng số điểm của một ngược lại.
thư vượt quá ngưỡng cho trước thì thư này sẽ bị phân loại là Gọi SDR0 và FAR0 là các giá trị mong muốn của hai tham
thư rác. Một ví dụ về luật dùng trong Spamassassin được mô tả số SDR và FAR của bộ lọc thư rác cần thiết kế (với ý nghĩa bộ
trong danh sách (1): lọc đạt yêu cầu là bộ lọc có SDR ≥ SRD0 và FAR ≤ FAR0).
Trong phương pháp xác định điểm số hiện tại, sau khi xác định
Body DEAR_FRIEND /^\s*Dear Friend\b/i ngưỡng T, điểm số của mỗi luật sẽ được tính toán để cho tham
Describe DEAR_FRIEND Dear Friend? That’s not very dear số SDR của bộ lọc thu được là lớn nhất. Tuy nhiên các khả
Score DEAR_FRIEND 0.542 năng sau có thể xảy ra sau khi thực thi xong thuật toán tính
Danh sách 1: Ví dụ một luật trong SpamAssassin điểm số:
(1) Giá trị SDR của bộ lọc thu được không đạt yêu cầu
Ví dụ trên định nghĩa một luật có tên DEAR_FRIEND, khi (2) Giá trị FAR của bộ lọc thu được không đạt yêu cầu
SpamAssassin áp dụng luật này trên một thư cần phân loại, (3) Giá trị SDR và FAR đạt yêu cầu nhưng chưa phải là tối ưu
phần mềm sẽ kiểm tra xem thư có chứa mẫu chuỗi ký tự được Để giải quyết vấn đề trên người dùng phải thử chọn các giá trị
quy định trong biểu thức chính quy /^\s*Dear Friend\b/i hay ngưỡng T khác, thực hiện lại thuật toán tính điểm và tiếp tục
không. Nếu thư có chứa chuỗi này thì số điểm 0.542 sẽ được kiểm tra xem các tham số SDR và FAR của bộ lọc đã đạt yêu
cộng vào tổng điểm số dùng để phân loại thư. Cấu trúc cụ thể cầu chưa. Quy trình này không chỉ gây tốn thời gian, tốn tài
của luật dùng trong SpamAssassin được trình bày cụ thể trong nguyên hệ thống mà còn chưa giải quyết triệt để vấn đề (3) do
[1,3]. Một tập các luật như vậy cùng với điểm số của chúng sẽ chưa xem xét đến giá trị của FAR trong quá trình tính điểm.
tạo thành một bộ lọc thư rác trên nền SpamAssassin. Từ những phân tích nêu trên, nhóm tác giả đề xuất giải pháp
Quá trình xây dựng một bộ lọc thư rác cho SpamAssassin coi bài toán xác định điểm cho các luật lọc thư rác là một bài
được chia thành hai giai đoạn: xác định nội dung của các luật toán tối ưu hóa đa mục tiêu trong đó ta cần tìm giá trị ngưỡng
(các mẫu chuỗi ký tự dùng trong biểu thức chính quy) và gán T và các giá trị điểm số của mỗi luật sao cho giá trị tham số
điểm số cho mỗi luật. Ở giai đoạn thứ nhất căn cứ vào hai tập SDR và FAR của bộ lọc thu được là tối ưu. Lưu ý rằng do mối
mẫu cho trước các đặc trưng của thư rác (từ hoặc cụm từ) được quan hệ “thỏa hiệp” giữa SDR và FAR như đã nêu trong phần I
trích chọn để hình thành nên nội dung của các luật của bộ lọc. nên sẽ rất khó tìm được một bộ giá trị của T và các điểm số sao
Mỗi luật tương ứng với một từ hoặc cụm từ đặc trưng của thư cho SDR và FAR thực sự tối ưu (SDR=100% và FAR=0%),
rác. Dễ thấy nội dung của các luật sẽ phụ thuộc vào loại ngôn thay vào đó nhóm tác giả hướng tới việc tìm ra tập các phương
ngữ sử dụng trong các thư ở tập mẫu, do đó sẽ có các luật khác án thỏa hiệp (hay còn gọi là tập phương án tối ưu Pareto) [12].
nhau dành riêng cho lọc thư rác tiếng Anh và lọc thư rác tiếng Từ đó, kết hợp thêm các tiêu chí khác, ta chọn được lời giải tốt
Việt. Trong các nghiên cứu trước đây[2,5,6], nhóm tác giả đã nhất cho bài toán.
trình bày cụ thể về vấn đề xây dựng các luật lọc thư rác tiếng
Việt và thư rác đa ngôn ngữ. Bài báo này sử dụng các kết quả III. PHÁT BIỂU BÀI TOÁN VÀ PHƯƠNG PHÁP GIẢI
tập luật lọc thư rác thu được từ các nghiên cứu đó. A. PHÁT BIỂU BÀI TOÁN
Ở giai đoạn thứ hai điểm số được gán cho mỗi luật, quá
Giả sử tập mẫu ban đầu bao gồm tập thư rác S=(s1, s2, …,
trình này có ý nghĩa tương tương với việc gán trọng số cho mỗi
sK) và tập thư hợp lệ H=(h1, h2, …, hL). Giả sử bộ lọc thư rác
đặc trưng đã được trích chọn. Hiện tại SpamAssassin sử dụng
cần xây dựng bao gồm tập luật R=(r1, r2, …, rN), mỗi luật cần
một thuật toán học máy trên nền tảng mạng neural một
được xác định điểm tương ứng là một phần tử trong tập điểm
lớp[2,3]. Trong đó mỗi nút mạng mô tả một luật, mỗi đầu vào
X=(x1, x2, …, xN). Với mỗi luật r và mỗi thư điện tử e ta có thể
của mỗi nút thể hiện luật đó có xuất hiện trong một thư rác,
xác định hàm so khớp m(r,e) như sau:
trọng số của mỗi nút là điểm của luật. Sau khi kết thúc quá
trình huấn luyện toàn bộ tập luật sẽ được gán một điểm số
tương ứng. Về cơ bản quá trình này có thể mô hình hóa dưới 1 nếu đặc trưng r xuất hiện trong e
mr,e=  (1)
dạng một bài toán tối ưu hóa đơn mục tiêu, với một ngưỡng T 0 ngược lại
cho trước quá trình huấn luyện sẽ gán điểm cho mỗi luật sao
Tiếp theo tổng điểm của thư điện tử e được tính theo công thức
sau:
31
31
HộiHội
Thảo Quốc
Thảo Gia
Quốc 2015
Gia 2015về
vềĐiện
ĐiệnTử,
Tử,Truyền
NghệThông
ThôngTinTin (ECIT
(ECIT 2015)
2015)
N thể của tập tối ưu Pareto, một tập các phương án như vậy được
Scoree=  m(ri ,e)xi (2) gọi là tập Pareto được biết tốt nhất (Best-known Pareto set).
i=1 Ba tiêu chí sau đây thường được dùng để đánh giá một tập
Pareto được biết tốt nhất:
Với mỗi giá trị ngưỡng T xác định, bộ lọc SpamAssassin sẽ kết - Là một tập con của tập tối ưu Pareto.
luận e là thư rác hay thư hợp lệ dựa trên công thức: - Các giá trị của hàm mục tiêu tương ứng của các phương án
phải phân bố đều và đa dạng trên đường biên Pareto trong
1 nếu Score(e) ≥ T không gian mục tiêu.
Spame=  (3)
0 ngược lại
- Các giá trị của hàm mục tiêu tương ứng phải biểu thị toàn
Từ đó các tham số SDR và FAR của bộ lọc thư rác được tính cảnh của đường biên Pareto.
theo các công thức:
K C. CÁC GIẢI THUẬT TIẾN HÓA ĐA MỤC TIÊU
1
SDR=  Spam(si ) (4) Với cách tiếp cận nói trên, việc giải bài toán tối ưu hóa đa
K mục tiêu được thực hiện thông qua quá trình tìm kiếm tập
i=1
Pareto được biết tốt nhất. Do đó các giải thuật tìm kiếm meta-
L heuristic mà cụ thể là các giải thuật tiến hóa sẽ là các công cụ
1
FAR=  Spam(hi ) (5) đặc biệt phù hợp để giải quyết lớp bài toán này. Thực tế các
L giải thuật tiến hóa đa mục tiêu như NSGA hay SPEA có thể
i=1
thực hiện tìm kiếm tập Pareto được biết tốt nhất chỉ trong một
Do bản thân giá trị ngưỡng T cũng là một biến số nên ta sử lượt chạy. Theo thống kê trong [13], các giải thuật tiến hóa
dụng x0 để ký hiệu thay cho T. Cuối cùng bài toán tối ưu hóa chiếm 70% trong tổng số các phương pháp tối ưu hóa đa mục
đa mục tiêu được phát biểu như sau: tiêu dựa trên meta-heuristic.
Đã có nhiều giải thuật tiến hóa đa mục tiêu (MOEA) được
z1 = SDR(X)  Max công bố, trong [14] các tác giả trình bày tổng quan về các giải
z2 = FAR(X)  Min, X=(xo, x1, …, xN) ∈ RN+1 thuật này. Điểm khác biệt chủ yếu giữa các giải thuật tiến hóa
với các ràng buộc: ximin ≤xi ≤ximax ; i0...N (6) đa mục tiêu nằm ở cách tính độ thích nghi cho mỗi cá thể
(Fitness assignment), cách duy trì quần thể ưu tú (Elitism) và
Trong đó các giá trị SDR(X) và FAR(X) được tính theo các phương pháp để đa dạng hóa quần thể.
công thức (4) và (5). Các giá trị ximin và ximax thể hiện khoảng Xếp hạng Pareto (Pareto ranking) là một phương pháp
giá trị cho phép của biến xi. thường dùng để tính độ thích nghi của cá thể bằng cách gán thứ
hạng 1 (độ thích nghi cao nhất) cho các cá thể không bị vượt
B. TỐI ƯU HÓA PARETO
trội trong quần thể và loại chúng ra khỏi danh sách xếp hạng,
Thực tế hai mục tiêu của bài toán tối ưu hóa (6) không thể rồi tìm các cá thể không bị vượt trội mới để gán thứ hạng 2 và
đạt được đồng thời, do đó phương pháp tối ưu hóa Pareto [12] tiếp tục như vậy cho đến khi toàn bộ quần thể được xếp hạng.
được áp dụng để giải bài toán. Ta xem xét bài toán tối ưu hóa Duy trì quần thể ưu tú là một vấn đề quan trọng trong tối ưu
đa mục tiêu tổng quát với yêu cầu phải đồng thời tối thiểu hóa hóa đa mục tiêu sử dụng MOEA. Trong ngữ cảnh của giải thuật
P hàm mục tiêu – các mục tiêu loại tối đa hóa có thể được MOEA, tất cả những cá thể không bị vượt trội được phát hiện
chuyển thành loại tối thiểu hóa bằng cách nhân với -1: bởi MOEA được coi như là những thành viên của quần thể ưu
tú. Có hai chiến lược thường dùng để hiện thực việc duy trì
zi = fi(X)  Min, X=(x1, x2, …, xN) ∈ RN , i=1, 2, … P (P≥2) quần thể ưu tú: (i) lưu trữ các cá thể ưu tú trong chính quần thể
với các ràng buộc: g j X ; j=1...m và (ii) lưu trữ các cá thể ưu tú trong một danh sách thứ cấp bên
ngoài quần thể và đưa chúng trở lại quần thể.
Một phương án khả thi X được gọi là vượt trội so với phương Phương pháp chia sẻ độ thích nghi (Fitness sharing) được
án khả thi Y (ký hiệu X ≽ Y), nếu và chỉ nếu, zi(X) ≤ zi(Y) dùng để đa dạng hóa quần thể. Phương pháp này khuyến khích
(i=1, ... , P) và zj(X) < zj(Y) ở ít nhất một mục tiêu j. Một tìm kiếm trên những vùng chưa biết của đường biên Pareto
phương án được gọi là phương án tối ưu Pareto nếu nó không bằng cách giảm bớt độ thích nghi của các cá thể ở những vùng
bị vượt trội bởi bất cứ phương án nào khác trong không gian có mật độ cao. Các kỹ thuật khác nhau thường được dùng để
phương án {X}. Các giá trị hàm mục tiêu tương ứng của các ước lượng mật độ các cá thể xung quanh một cá thể đang xét
phần tử trong tập các phương án tối ưu Pareto nói trên tạo như kỹ thuật đếm số vùng lân cận (niche count) hay kỹ thuật
thành đương biên Pareto (Pareto Front) trong không gian mục tính khoảng cách mật độ trong đó ước tính giá trị khoảng cách
tiêu. Euclide trung bình trong không gian mục tiêu của cá thể đang
Các giải thuật tối ưu hóa đa mục tiêu lý tưởng sẽ tìm ra tất xét tới các láng giềng gần nhất thứ k (k-th nearest neighbor)
cả các phương án trong tập tối ưu Pareto. Tuy nhiên việc chứng của nó. Khoảng cách mật độ cũng được dùng trong cơ chế
minh một tập hợp các phương án tìm được là tập tối ưu Pareto chọn cha mẹ như sau: lấy ngẫu nhiên hai cá thể x và y; nếu
thường không khả thi. Do đó một cách tiếp cận thực tế thường chúng có cùng thứ tự (non-domination rank) thì cá thể nào có
được chọn là tìm kiếm tập các phương án là thể hiện tốt nhất có
32
32
HộiHội
Thảo Quốc
Thảo QuốcGia
Gia2015
2015về
Nghệ Thông
(ECIT 2015)
2015)
khoảng cách mật độ cao hơn sẽ được chọn; ngược lại cá thể có tập kiểm tra. Tập mẫu được dùng trong quá trình tìm kiếm bộ
mức thứ tự thấp hơn sẽ được chọn. lọc có các tham số SDR và FAR tối ưu, còn tập kiểm tra được
dùng để đánh giá bộ lọc khi hoạt động thực tế. Cả tập mẫu và
D. SỬ DỤNG MOEA ĐỂ GIẢI BÀI TOÁN
tập kiểm tra đều chứa các thư rác và các thư hợp lệ. Bảng 1 mô
Nhóm tác giả lựa chọn giải thuật tiến hóa đa mục tiêu SPEA-II tả số lượng thư cụ thể dùng trong mỗi kịch bản.
để giải bài toán. Trong phần tiếp theo chúng tôi mô tả một số
điểm chính trong quá trình sử dụng SPEA-II để giải bài toán. Kịch bản 1 (300 thư) Kịch bản 2 (750 thư)
Biểu diễn nhiễm sắc thể: Bài toán yêu cầu tìm kiếm giá trị Mẫu Kiểm tra Mẫu Kiểm tra
ngưỡng T và điểm cho từng luật có trong bộ lọc thư rác Thư rác 120 60 300 150
SpamAssassin sao cho các tham số SDR và FAR của bộ lọc Thư hợp lệ 80 40 200 100
thu được là tốt nhất. Do đó mỗi nhiễm sắc thể sẽ biểu diễn một Bảng 1: Số lượng thư điện tử dùng trong các kịch bản
phương án khả thi để gán giá trị cho ngưỡng T và các luật có
trong bộ lọc. Cụ thể mỗi nhiễm sắc thể sẽ là một vecto chứa Trong mỗi kịch bản thử nghiệm chúng tôi thực hiện thiết kế
N+1 số thực (các gen) tương ứng với một phương án X=(xo, x1, bộ lọc gồm 30 luật và 100 luật để đảm bảo các thực nghiệm
…, xN) ∈ RN+1 trong không gian phương án. Giá trị của mỗi xi được thực hiện với số lượng thư và số lượng luật ở quy mô nhỏ
phải nằm trong ngưỡng cho phép ximin ≤xi ≤ximax đã xác định và quy mô lớn. Dải giá trị hợp lệ được chọn cho ngưỡng T là
trước. Phương pháp mã hóa số thực (real-coded method) [14] [0,5]; cho điểm của mỗi luật là [0,2]. Thuật toán SPEA-II được
được chúng tôi sử dụng để biểu diễn mỗi nhiễm sắc thể. cài đặt để tính điểm cho mỗi luật có trong bộ lọc, các tham số
Tính toán giá trị hàm mục tiêu: Giá trị hàm mục tiêu của mỗi của SPEA-II được mô tả trong bảng 2 (N có giá trị lần lượt là
nhiễm sắc thể được tính toán thông qua phần mềm 30 và 100).
SpamAssassin. Bộ lọc SpamAssassin tương ứng với nhiễm sắc
thể sẽ được sử dụng để kiểm tra các thư có trong tập mẫu bao Tham số Giá trị Tham số Giá trị
gồm tập thư rác S và tập thư hợp lệ H. Từ kết quả kiểm tra ta Kích thước quần thể 100 Cận dưới của 0
có thể tính được các tham số SDR và FAR của bộ lọc và từ đó biến N+1
xác định được các giá trị hàm mục tiêu của nhiễm sắc thể. Lưu Số lượng thế hệ 1000 Cận trên của 2
ý để cho đơn giản ta chọn giá trị hàm mục tiêu 1-SDR thay vì biến N+1
SDR, như thế mục tiêu của bài toán sẽ là tối tiểu hóa hai hàm
Số mục tiêu 2 Xác suất lai tạo 0,9
mục tiêu FAR và 1-SDR.
Số biến thực N+1 Xác suất đột biến 1/(N+1)
Cơ chế chọn lọc: Được được dùng để chọn các nhiễm sắc thể
Cận dưới của biến 1 0
cha mẹ cho việc sinh ra thế hệ tiếp theo. Chúng tôi sử dụng cơ
chế chọn lọc dựa trên đấu loại trực tiếp (Binary Tournament Cận trên của biến 1 5
Bảng 2: Các tham số của thuật toán SPEA-II
Selection) trong đó hai nhiễm sắc thể được chọn ngẫu nhiên từ
quần thể để tham gia đấu loại, nhiễm sắc thể nào có giá trị hàm
Các thử nghiệm được chạy trên máy tính có cấu hình Intel
thích nghi tốt hơn sẽ là người chiến thắng.
Core i3-3120M 2.5GHz, RAM 4GB, OS Ubuntu 14.04. Để
Phép toán lai tạo (Crossover operator): Hai nhiễm sắc thể cha
đảm bảo tính khách quan mỗi thử nghiệm được chạy 20 lần với
mẹ được chọn sẽ tạo ra hai nhiễm sắc thể con mới cho quần
các nhân ngẫu nhiên khác nhau, các số liệu trình bày trong bài
thể. Chúng tôi sử dụng phép toán lai tạo giả nhị phân
báo là giá trị trung bình của kết quả thu được sau mỗi lần chạy.
(Simulated Binary Crossover) để thực hiện quá trình này.
Kết quả thử nghiệm được so sánh với phương pháp tính điểm
Phép toán đột biến (Mutation operator): Chúng tôi chọn phép
tối ưu hóa đơn mục tiêu (SOOA) [2] của SpamAssassin trên
đột biến đa thức (polynomial mutation operator) để biến đổi
cùng mẫu dữ liệu thư điện tử. Để thực hiện so sánh, chúng tôi
nhiễm sắc thể nhằm tăng tính đa dạng của quần thể.
chọn 10 giá trị ngưỡng T phân bố đều trong khoảng [0,5], với
Gán độ thích nghi: Phương pháp xếp hạng Pareto được dùng
mỗi giá trị ngưỡng phương pháp tính điểm hiện tại sẽ tính toán
để gán độ thích nghi cho mỗi nhiễm sắc thể có trong quần thể.
điểm của các luật để tối ưu hóa tham số SDR, giá trị của tham
Duy trình quần thể ưu tú: SPEA-II sử dụng một danh sách thứ
số FAR của bộ lọc cũng được tính toán và so sánh với phương
cấp để lưu trữ các nhiễm sắc thể ưu tú (là các phương án không
pháp đề xuất trong bài báo.
bị vượt trội như mô tả trong phương pháp tối ưu Pareto) của
Các kết quả thử nghiệm theo kịch bản thứ nhất (với tập
quần thể. Danh sách này sẽ được đưa lại vào quần thể trong
chứa 300 thư) được trình bày trong hình 1 (bộ lọc có 30 luật)
quá trình chọn lọc.
và hình 2 (bộ lọc có 100 luật). Các kết quả thu được khi thiết
Chia sẻ độ thích nghi: Sử dụng kỹ thuật tính khoảng cách mật
kế bộ lọc bằng phương pháp SOOA cũng được trình bày trong
độ đã trình bày ở phần trên.
các hình vẽ này để tiện so sánh. Các số liệu cho thấy bộ lọc
thiết kế sử dụng SPEA-II có các tham số SDR và FAR tốt hơn
IV. KẾT QUẢ so với bộ lọc thiết kế bằng phương pháp SOOA. Cụ thể đối với
bộ lọc có 30 luật, giả sử ta muốn thiết kế bộ lọc có FAR = 0%,
Nhóm tác giả thử nghiệm xây dựng bộ lọc thư rác
thì kết quả tốt nhất mà phương pháp SOOA tìm được là
SpamAssassin với hai kịch bản sử dụng hai cơ sở dữ liệu thư
(SDR=40,8%, FAR=0%). Trong khi đó sử dụng SPEA-II ta thu
điện tử khác nhau chứa 300 thư và 750 thư do nhóm tác giả thu
được bộ lọc có (SDR=60%, FAR=0%). Tương tự nếu ta chỉ
thập từ nhiều nguồn khác nhau. Trong mỗi kịch bản, tập thư
quan tâm đến những bộ lọc có FAR ≤ 10% thì các kết quả tốt
điện tử ban đầu được chia thành hai tập con gọi là tập mẫu và
33
33
HộiHội
Thảo Quốc
Thảo Gia
Quốc 2015
Gia 2015về
vềĐiện
ĐiệnTử,
Tử,Truyền
NghệThông
ThôngTinTin (ECIT
(ECIT 2015)
2015)
nhất mà SOOA tìm được là (67,7%, 10%) và (55,8%, 1,25%) tích kỹ hơn số liệu trình bày trong bảng 3 ta thấy khi bộ lọc
trong khi SPEA-II tìm ra những kết quả tốt hơn như (60%, chứa nhiều luật hơn thì SPEA-II cũng tìm được những kết quả
0%), (64,2%, 1,3%) và (68,3%, 5%). tốt hơn. Điều này thể hiện ở số lượng điểm tìm được trong tập
đường biên Pareto (18 điểm và 31 điểm ứng với các trường
hợp sử dụng 30 luật và 100 luật) và giá trị trung bình của
khoảng cách D (51,3 và 47 ứng với các trường hợp sử dụng 30
luật và 100 luật).
Phương pháp SOOA

Bộ lọc 30 luật Bộ lọc 100 luật
Thiết kế Thực tế Thiết kế Thực tế
SDR FAR SDR FAR SDR FAR SDR FAR
1 67,7 10,0 65,0 12,5 81,3 15 81,7 17,5
2 55,8 1,25 56,7 2,5 78,3 12,5 78,3 12,5
3 40,8 0 45,0 2,5 68,3 3,8 66,7 5,0
Phương pháp SPEA-II
Thiết kế Thực tế Thiết kế Thực tế
SDR FAR SDR FAR SDR FAR SDR FAR
1 72,5 12,5 71,7 12,5 82,5 13,8 83,3 15,0
Hình 1. Kết quả kịch bản thử nghiệm 1 với bộ lọc 30 luật
2 71,0 10,0 71,7 10,0 80,8 12,5 80,0 12,5
3 73,3 16,3 73,3 17,5 80,0 11,3 80,0 10,0
Bảng 3: So sánh kết quả thu được khi sử dụng hai phương pháp SSOA
và SPEA-II trong kịch bản 1
Các kết quả thu được khi thử nghiệm theo kịch bản thứ hai với
số lượng thư mẫu lớn hơn cũng cho thấy các kết luận tương tự
như trong kịch bản thứ nhất:
- SPEA-II cho các kết quả tốt hơn so với SOOA trên cả hai
phương diện tối ưu hóa FAR hay SDR.
- SPEA-II cho phép người dùng lựa chọn các thiết kế phù
hợp nhất căn cứ vào đường biên Pareto tìm được.
- Với bộ lọc sử dụng nhiều luật hơn thì SPEA-II tìm được
các kết quả tốt hơn.
Hình 3 và 4 mô tả kết quả thử ngiệm theo kịch bản thứ hai khi
sử dụng bộ lọc có 30 luật và 100 luật. Bảng 4 tóm tắt các kết
quả tốt nhất do SOOA và SPEA-II tìm ra trong thực nghiệm.
Hình 2. Kết quả kịch bản thử nghiệm 1 với bộ lọc 100 luật
Khi tăng số luật của bộ lọc lên thành 100 luật ta cũng thu được
các kết quả tương tự. Phương pháp SPEA-II cho kết quả tốt
hơn SOOA trên cả hai phương diện tối ưu hóa riêng FAR hoặc
SDR. Hơn nữa bằng việc khảo sát đường biên Pareto, người
dùng có thể cân nhắc việc đánh đổi giữa SDR và FAR để từ đó
tìm được giải pháp phù hợp với yêu cầu.
Trên mặt phẳng tọa độ Đề-các tạo bởi hai trục SDR và
FAR, dễ thấy bộ lọc lý tưởng tương ứng với điểm có tọa độ
I(100,0). Gọi D là khoảng cách Euclide từ một điểm trên
đường biên Pareto đến điểm I, khi đó giá trị của D sẽ cho ta
thông tin ước lượng tương đối về chất lượng của bộ lọc thu
được (D càng nhỏ thì chất lượng bộ lọc càng cao). Bảng 3
trình bày 03 bộ lọc tốt nhất do SPEA-II tìm được và so sánh
chúng với phương pháp SOOA. Các số liệu về SDR và FAD
khi thiết kế (sử dụng tập thư mẫu) và khi hoạt động thực tế (sử
dụng tập thư kiểm tra) cũng được trình bày trong bảng 3. Phân Hình 3. Kết quả kịch bản thử nghiệm 2 với bộ lọc 30 luật
34
34
.
VI. KẾT LUẬN

Trong bài báo này, chúng tôi đề xuất phương pháp mới để tính
điểm cho các luật trong quá trình thiết kế bộ lọc thư rác
SpamAssassin. Trong đó việc gán điểm cho mỗi luật được thực
hiện thông qua giải bài toán tối ưu hóa đa mục tiêu đồng thời
tối đa hóa tham số SDR và tối thiểu hóa tham số FAR của bộ
lọc. So sánh với phương pháp cũ, phương pháp mới có ưu điểm
hơn vì nó không những tìm ra những kết quả tốt hơn mà còn
cho phép người dùng lựa chọn những kết quả “thỏa hiệp” theo
các tiêu chí cho trước. Các thực nghiệm cũng được tiến hành
với các kích thước khác nhau của tập thư điện tử mẫu và tập
luật dùng trong bộ lọc. Kết quả thực ngiệm đã minh chứng rõ
các kết luận trình bày trong bài báo.
Hình 4. Kết quả kịch bản thử nghiệm 2 với bộ lọc 100 luật TÀI LIỆU THAM KHẢO
[1] The Apache SpamAssassin Project. SpamAssassin: The Powerful #1
Phương pháp SOOA Open-Source Spam Filter. [Online] 2015. [Cited: 16 July 2015]
http://spamassassin.apache.org/index.html
[2] Tran, Q. A., Duan, H. X. Li, X., “Real-time statistical rules for spam
Thiết kế Thực tế Thiết kế Thực tế detection”, IJCSNS International Journal of Computer Science and
SDR FAR SDR FAR SDR FAR SDR FAR Network Security, VOL.6 No.2B, pp 178–184, 2006.
1 79,0 15,5 78,7 15,0 75,7 4,0 75,0 5,0 [3] Schwartz A. SpamAssassin. O’Reilly, 2004.
2 81,3 19,0 81,3 19,0 84,3 20,0 84,5 21,0 [4] Joseph S. Kong, Behnam Attaran Rezaei, Nima Sarshar, Vwani P.
Roychowdhury, P. Oscar Boykin, “Collaborative Spam Filtering Using
3 74,7 8,5 74,7 9,0 78,3 14,0 78,5 14,0 E-Mail Networks”. IEEE Computer 39(8): 67-73, 2006.
Phương pháp SPEA-II [5] Minh Tuan Vu and F. Jiang V.Q. Tran Tran, Quang Anh, “Multilingual
Bộ lọc 30 luật Bộ lọc 100 luật rules for spam detection”. Proceedings of IB2COM 2012, pages 106–
Thiết kế Thực tế Thiết kế Thực tế 110, 2012.
SDR FAR SDR FAR SDR FAR SDR FAR [6] Nguyen T.A., Tran Q.A., Nguyen N.B., “Vietnamese spam detection
1 79,3 11,0 79,3 11,0 83,3 10,0 83,3 10,0 based on language classification”, HUT-ICCE 2008 - 2nd International
2 77,3 9,0 77,3 9,0 78,3 6,0 78,7 6,0 Conference on Communications and Electronics, 2008.
3 76,3 7,5 76,7 8,0 81,7 13,5 82,0 14,0 [7] V. Fernandes, I. Yevseyeva, R. Frantz, C. Grilo, N. Díaz, M. Emmerich,
Bảng 3: So sánh kết quả thu được khi sử dụng hai phương pháp SSOA “An Automatic Generation of Textual Pattern Rules for Digital Content
Filters Proposal, Using Grammatical Evolution Genetic Programming”,
và SPEA-II trong kịch bản 2 Procedia Technology, Volume 16, Pages 806-812, 2014.
V. CÁC NGHIÊN CỨU LIÊN QUAN [8] I. Yevseyeva, V. Fernandes, D. Ordás, J. Méndez “Optimising anti-
spam filters with evolutionary algorithms”. Expert Systems with
Cho tới nay đã có nhiều công trình nghiên cứu liên quan Applications, 2013.
đến vấn đề lọc thư rác như sử dụng các bộ lọc địa chỉ thư, các [9] C. A. C. Coello, “Evolutionary multi-objective optimization: A
bộ lọc nội dung sử dụng Bayesian hoặc SVM, sử dụng phương historical view of the field”. IEEE Computational Intelligence
Magazine, 1(1):28–36, 2006.
pháp học máy [3], sử dụng mạng phức hợp [4]. Trong vấn đề
[10] E. Zitzler, L. Thiele, and K. Deb, “Comparision of multiobjective
phân loại thư rác dựa trên nội dung, ngôn ngữ sử dụng trong evolutionary algorithms: Emprical results”. Evolutionary Computation,
thư điện tử có vai trò rất quan trọng. Nhóm tác giả đã xuất bản 8(1):173–195, 2000.
một số công trình nghiên cứu liên quan đến việc xây dựng các [11] E. Zitzler, M. Laumanns, and L. Thiele, “SPEA2: Improving the
bộ lọc thư rác cho từng loại ngôn ngữ (tiếng Trung [2], tiếng strength pareto evolutionary algorithm for multiobjective optimization”.
In Evolutionary Methods for Design Optimization and Control with
Việt [6]) cũng như thiết kế các luật lọc thư đa ngôn ngữ [5]. Applications to Industrial Problems, pp. 95–100, 2001.
Trong phần lớn các nghiên cứu hiện tại, việc tính điểm cho [12] Marler, R.T. and J.S. Arora, “Survey of multi-objective optimization
các luật dùng trong bộ lọc SpamAssassin được thực hiện thông methods for engineering”. Structural and Multidisciplinary
qua việc giải bài toán tối ưu hóa đơn mục tiêu sử dụng giải Optimization, 26(6): pp. 369-395, 2004.
thuật di truyền hoặc mạng neural [2]. Phương pháp tính điềm [13] A. Konak, D. W. Coit, A. E. Smith, “Multi-objective optimization using
do nhóm tác giả đề xuất trong bài báo thực hiện giải bài toán genetic algorithms: A tutorial” J. Reliability Engineering and System
Safety, No. 91, pp. 992-1007, 2006.
tối ưu hóa đa mục tiêu nên có nhiều ưu điểm hơn so với
[14] V. Lücken, Christian, B. Barán, C. Brizuela, "A survey on multi-
phương pháp cũ. objective evolutionary algorithms for many-objective problems."
Các giải thuật tiến hóa đa mục tiêu cũng được đã sử dụng Computational Optimization and Applications pp. 707-756, 2014.
hiệu quả trong vấn đề lọc thư rác tiêu biểu là các nghiên cứu
ứng dụng MOEA để xác định các đặc trưng của mỗi luật [7]
hoặc tạo ra các luật phức hợp từ các luật cơ bản [8].
35
35
Hội Hội
Nâng cao cht lng to nh siêu âm sóng bin dng
s dng hai bc lc
Lơng Quang Hi 1 , Nguyn Linh Trung 2 , Trn c Tân 2
1
Hc Vin K thut Quân s
Trng H Công ngh - H Quc gia Hà Ni
2
Email: luonghai@mta.edu.vn, linhtrung@vnu.edu.vn, tantd@vnu.edu.vn.
Tóm tt— c tính c ca mô ( àn hi,  nht) là mt trong dng MLEF  c lng CSM trong môi trng không ng
nhng thông tin có ích ưc s dng  phát hin các khi u. To nht 1D [5]. Sau ó, tác gi ã phát trin phơng pháp này cho
nh siêu âm sóng bin dng (Ultrasound shear wave imaging) là vic phát hin i tng 2D [8]. Tuy nhiên, nh 2D to c
mt phưng pháp mi có th nh lưng ưc  àn hi mô chu nh hng nng bi hiu ng nhiu m do vic s dng
thông qua ưc lưng các tham s ca module shear phc quyt nh cng trong vic xác nh v trí ca khi u. D thy
(complex shear modulus – CSM) hay ưc lưng s sóng và s suy
gim truyn sóng ca sóng bin dng (ShearWave) trong mô.
rng trong môi trng nhiu ln thì tác ng ca loi nhiu
Maximum Likelihood Ensemble Filter (MLEF) là b lc ưc áp này càng trm trng hơn. Vì th, trong bài báo này, bc u
dng hiu qu trong vic ưc lưng gián tip các tham s ca chúng tôi vn tip tc s dng MLEF  phát hin các i
CSM. u tiên, b lc MLEF ưc s dng  ưc lưng các tng 2D trong môi trng có nhiu Gauss - loi nhiu sinh ra
tham s CSM trên tng tia (ưc lưng 1D), t ó xây dng nh 2 trong quá trình thu nhn Doppler. Tip theo, chúng tôi có th
chiu (2D) dùng phưng pháp quét tia và quyt nh dùng khai thác tính cht y – sinh t nhiên ca u và môi trng xung
ngưng cng. Tuy nhiên nh 2D ưc tái to trong môi trưng quanh u là ng nht. Vic s dng lc trung v (có  phc
nhiu ln s chu nh hưng nng bi hiu ng nhiu m tp thp) nhng vn có kh nng gim loi nhiu này c 
(Speckle noise). Tip theo, da vào c tính ng nht ca mô và xut. Mt s kch bn th nghim ã c tin hành  khng
môi trưng xung quanh, tác gi  xut s dng thêm lc trung
nh cht lng và tính kh thi ca phơng pháp  xut.
v  loi b nhiu này nhm ci thin cht lưng nh khôi phc.
Mt s th nghim ã ưc tin hành  khng nh cht lưng II. PHƠNG PHÁP
ca phưng pháp  xut.
u tiên, shear wave c to ra và o theo sơ  Hình 1. Mt
T khóa- To nh siêu âm sóng bin dng, B lc t hp cái kim bng thép không g có ng kính 1.5mm, dài 13 cm
hp l cc i (MLEF), module shear phc (CSM), to nh c gn vào b chp hành (actuator). B chp hành này c
àn hi, b lc trung v. iu khin bng b phát sóng có tn s t 50 Hz n 450 Hz,
biên  in áp khong t 5V n 15V. Theo ó, kim s rung
I. GII THIU dc theo trc z và truyn sóng bin dng vào mô. Vn tc ca
c tính cơ ca mô mm ( àn hi và  nht) là mt sóng bin dng ti mt v trí c o bng mt máy siêu âm
thông tin có ích cho vic chn oán tình trng bnh lý ca mô. Doppler [1].
Các phơng pháp to nh àn hi bao gm: MRI, siêu âm to
nh àn hi tnh, siêu âm to nh àn hi ng (bao gm c
phơng pháp to nh àn hi sóng bin dng - SWEI). SWEI
c phát trin  c lng các tham s ca module shear
phc – CSM (tính àn hi và tính nht). Vì vy, SWEI c
b sung trên nn máy siêu âm truyn thng  h tr chn
oán bnh (phát hin các khi u).
Nm 1998, Sarvazyan ã gii thiu v k thut to nh àn
hi sóng bin dng dùng trong chn oán y t [7]. Nm 2004,
Chen và các cng s ã a ra công thc cho thy vn tc
truyn sóng bin dng có liên quan n  àn hi và  nht
ca môi trng [4]. Theo ó, h  xut phơng pháp nh
lng  àn hi và  nht mô thông qua vic o s phân tán
vn tc sóng bin dng. Nm 2010, Orescanin Marko và các Hình 1. Sơ  thc nghim to và o sóng bin dng [1].
cng s ã áp dng MLEF  c lng các tham s CSM
Th hai, phơng pháp quét tia c dùng làm mô hình các
cho môi trng ng nht da trên mô hình Kelvin – Voigt
[2].  Vit Nam, nm 2012, Tân TD và các cng s ã áp hng truyn sóng. Biu din  và ks là h s suy gim và s
36
ISBN: 978-604-67-0635-9 36
HộiHội
Thảo Quốc
Thảo Gia
Quốc 2015
Gia 2015về
vềĐiện
Điện Tử,
Tử,Truyền
Nghệ Thông
Thông TinTin (ECIT
(ECIT 2015)
2015)
sóng ti im r trên mi tia; r   e j là ta  cc. Th ba, thí nghim; theo ó n  n1 nh c ch ra trong Phơng
s dng MLEF  c lng  và ks ti v trí r , t ó c trình (5); Phơng trình (4) c vit di dng phơng trình
trng thái sau:
lng c tham s CSM ca mô ti v trí r da trên mô hình
Kelvin – Voigt cho môi trng nht [2]. Th t, tái to nh 2D v   vn   w 
yn   n    I , 0     n  (6)
bng vic bin i các tham s CSM ã c c lng t ta    
0  n  0 
 cc sang ta  -các. Cui cùng, s dng b lc trung v
T Phơng trình (5) và (6), h s suy gim  và s sóng
 gim nhiu nh 2D thu c.
ks ca sóng bin dng ca mi tia c c lng bng vic s
A. Phng trình truyn sóng bin dng dng MLEF theo thut toán trong [3].
Vn tc riêng vi (r , t ) ca tia th i là mt hàm không gian - thi C. c lng các tham s CSM da trên mô hình Kelvin –
gian ca ta  r và thi gian t, nó c biu din bng Voigt.
phơng trình sau:
S sóng phc k s' ca sóng bin dng c xác nh theo
1 phơng trình sau:
v i (r , t )  Aer cos(t  k s r ), i  1,..., L (1)
r k s'  ks  i (7)
Nh ã trình bày  trên,  và k s c c lng bng vic s
Trong ó L là s tia quét, A là biên  ca sóng bin dng ti v dng MLEF.
trí gc,  là tn s góc sóng bin dng. Biu din ri rc ca Mt khác, theo mô hình Kelvin – Voigt [2], ta có:
tín hiu vn tc riêng trong phơng trình (1) ta có:

cs  (8)
1  ( r r0 )

v n (r ) 
i
Ae cos( nt  k s ( r  r0 )   ) (2)
r  r0   1  i (9)
Trong ó: cs là vn tc sóng bin dng;  là mt  khi môi
Trong ó, ch s n là thi gian ri rc, r0 là ta  ban u, t trng;  là  àn hi nht ca môi trng; 1 là  àn hi
là bc thi gian ri rc và  là phase thi gian ban u. và  là  nht ca môi trng.
Theo nh ngha s sóng,
Qua mt s phép bin i lng giác, Phơng trình (2) có th 2 f
c vit li nh sau: k s'  (10)
cs
T Phơng trình (8) và (10), ta có:
1
vi n (r )  vi n1 (r ) cos(t )  Ae ( r r ) x
0
ks'   2 /  (11)
r  r0
T các Phơng trình (7), (9) và (11), ta tính c  àn hi
1 và  nht  ca môi trng.
sin( (n 1)t  k s (r  r0 )   ) sin(t ) (3)
 2 ( ks2   2 )
Trên thc t, vn tc sóng bin dng o c ti mi im 1  (12a)
(ks2   2 ) 2
trong không gian bao gm thành phn vn tc tính theo
Phơng trình truyn sóng (3) cng vi thành phn nhiu 2 k s 
 (12b)
Gaussian w in (r ) . Do ó ta có mô hình sau: (ks2   2 ) 2
vi n (r ) : vi n (r )  w in ( r ) (4) D. To nh 2D ca i tng (khi u)
B. c lng h s suy gim và s sóng bng MLEF Ti mi im trong không gian, các tham s CSM 1 và
 c c lng. ng vi mi quá trình c lng các tham
 có th s dng MLEF cho vic c lng h s suy gim
 và s sóng k s , Phơng trình (3) c vit di dng s CSM cho tt các im trong không gian kho sát, chúng ta
thu c 2 nh: 1) nh  àn hi ca môi trng; 2) nh 
phơng trình trng thái sau:
nht ca môi trng.
vn   F (vn1 , n1 ) Hình 2 là nh  àn hi, trong ó khi u c phát hin có
xn       (5)
   n1  màu .
 n  
Trong ó n  T , ksT , , r , A , F là mt hàm phi tuyn làm
T
 
mô hình ng hc trong không gian ca sóng bin dng.  dài
ca các vector vn ,  và k s bng s v trí trong không gian.
Chúng ta gi thuyt rng n là không i trong sut thi gian
37
37
(10 mm, 8 mm) vi bán kính 3 mm. Các tham s CSM ca các
i tng 1 = 650 Pa và  =0.1 Pa/s. Mt  môi trng
 =1000 Kg/m3, tn s dao ng ca kim rung f=100 Hz,
r0 =0.4 mm.
Các s liu  xut trong kch bn mô phng c xây dng
da trên các s liu tin hành thc nghim c mô t trong
[1]. nh tham s CSM mô phng ca hai i tng có s bin
i t t  khu vc biên (th hin bng màu sc)  th hin sát
vi thc tin hơn (tc là s thay i c tính CSM là dn dn
t môi trng bên ngoài cho n khi vào trong u) so vi công
Hình 2. nh siêu âm o  àn hi ca mt khi u [6]. b trc ây ca chúng tôi [8].
 xác nh c s tn ti ca khi u thì cn phi xác nh
giá tr ngng 1* và  * phân bit gia mô thng và khi u.
Thông thng các khi u c phát hin có 1 > 1* và  >  * .
Da vào  chênh lch giá tr so vi ngng ca 1 và  ,
chúng ta xây dng c nh  àn hi và nh  nht vi
mã màu phù hp. nh u ra cui cùng là kt ca ca phép
cng nh  àn hi vi nh  nht.
E. Lc nhiu nh 2D bng b lc Trung v
Trên thc t, nh sau khi tái to vn còn nhiu. Các loi nhiu
thng gp gm nhiu m, nhiu mui – tiêu. Trong bài báo Hình 4. nh gc mô phng
này, tác gi s dng b lc trung v  gim các nhiu nói trên
(làm trơn nh). Thut toán quá trình lc nhiu gm các bc Th hai, xây dng kch bn quét tia mô phng s truyn sóng
sau: bin dng. Toàn b nh gc c quét bi góc  khác nhau, t
- S dng ca s lc 3×3, quét qua tng phn t ca nh 0o  90o , bc quét 1o to ra 90 tia quét. Dc theo mi tia,
ti v trí chính gia ca ca s lc.
chn 43 khong bng nhau (trong thc nghim s dng máy
- L y tt c các phn t nh xut hin trên ca s lc và
siêu âm Doppler có 43 phn t transducer).
sp xp chúng theo th t tng dn hoc gim dn.
- L y phn t trung v ca dãy mi c sp xp gán cho
phn t nh ban u (ti trung v ca ca s lc).
Hình 5. Minh ha vic quét tia [8]
Tin hành mô phng vi các trng hp:

1. B lc MLEF có kích thc (s) là 43,
cng thêm nhiu vi t s công sut tín hiu trên công sut
Hình 3. Minh ha các bc thc hin b lc trung v
tp âm (SNR) = 30;35;39;42;45;50;55 dB
2. B lc MLEF có kích thc là 86,
III. KT QU VÀ BÀN LUN cng thêm nhiu vi SNR = 30;35;39;42;45;50;55 dB
 kim tra phơng pháp c  xut, chúng tôi ã xây dng 3. Áp dng b lc trung v vi kích thc ca s lc 3×3.
mt kch bn mô phng. Th nht, chúng tôi to mt môi
trng (nh gc ban u có kích thc 43×90) có 2 i tng Mt s kt qu nhn ưc như sau:
hình tròn (gi nh là 2 u khác nhau). i tng 1 t ti v trí i vi các trng hp s dng b lc MLEF có kích thc là
(6 mm, 1.4 mm) vi bán kính 1.4 mm. i tng 2 t ti v trí 86, mt s kt qu nh tái to c th hin trong Hình 6.
38
38
HộiHội
Thảo Quốc
Thảo Gia
Quốc Gia2015
2015về
vềĐiện
Điện Tử,
Tử,Truyền
Nghệ Thông
Thông TinTin (ECIT
(ECIT 2015)
2015)
a) b) a) b)
c) d)
c) d)
Hình 8. Các nh c tái to dùng b lc MLEF vi s = 43 và b lc
trung v kích thc 3×3: khi có nhiu Gauss vi SNR = 39 dB (a),
khi có nhiu Gauss vi SNR = 42 dB (b), khi có nhiu Gauss vi
SNR = 45 dB (c), khi có nhiu Gauss vi SNR = 50 dB (d).
e) f)
Hình 6. Các nh c tái to dùng MLEF vi s = 86: khi cha có
nhiu (o lý tng) (a), khi có nhiu Gauss vi SNR = 30 dB (b), khi
có nhiu Gauss vi SNR = 35 dB (c), khi có nhiu Gauss vi SNR =
39 dB (d), khi có nhiu Gauss vi SNR = 45 dB (e), khi có nhiu
Gauss vi SNR = 50 dB (f).
a) b)
Hình 7 mô t quan h gia SNR và PSNR (T s tín hiu cc
i trên nhiu) vi các kích thc b lc MLEF khác nhau
(tơng ng vi  phc tp tính toán khác nhau).
c)
Hình 9. Các nh c tái to dùng MLEF vi s = 86 và b lc trung
v kích thc 3×3: khi có nhiu Gauss vi SNR = 39 dB (a), khi có
nhiu Gauss vi SNR = 45 dB (b), khi có nhiu Gauss vi SNR = 55
dB (c).
Qua các kt qu mô phng, chúng ta có th nhn thy khi s
dng b lc MLEF có kích thc s = 86 và b lc trung v có
kích thc 3×3, nh tái to s có cht lng tơng i tt, gn
ging vi nh gc.
Hình 7. SNR và PSNR trong hai trng hp s dng MLEF có s = 43 Bàn lun
và s = 86. Vn  quan trng trong vic phát các khi u trong nh àn
Khi s dng b lc Trung v, các kt qu mô phng th hin hi là xác nh c các giá tr ngng 1* và  * phù hp vi
trong Hình 8 và Hình 9. tng loi mô. Trên thc t, không phi mô bnh nào cng có
39
39
HộiHội
tham s CSM khác bit vi mô không bnh. Trong [6], tác gi [2] Orescanin M., et a, “Model-based complex shear modulus
reconstruction: A Bayesian approach”, In: IEEE Int'l Ultrasonics
dn ra tham s 1 ca mt s loi mô trong Bng 1. Symposium, pp. 61-64. IEEE Press (2010).
[3] Zupanski, M., “Maximum Likelihood Ensemble Filter: Theoretical
Bng 1: Aspects”, Monthly Weather Review. 133, 1710-1726 (2005).
Sut àn [4] Chen, Shigao, Mostafa Fatemi, and James F. Greenleaf, "Quantifying
Kiu mô mm Mt  mô elasticity and viscosity from measurement of shear wave speed
hi
(kg/m3) dispersion", The Journal of the Acoustical Society of America 115.6
(kPa) (2004): 2781-2785.
M bình thng 18-24 [5] Tan Tran-Duc, et al, “Complex shear modulus estimation using the
maximum likelihood ensemble filter”, BME’04, 2012.
Tuyn Tuyn bình thng 28-66 [6] Jeremy Bercoff, “ShearWave Elastography”, White paper, supersonic
vú imagine (2008).
Mô xơ 96-244 [7] Sarvazyan, Armen P., et al, "Shear wave elasticity imaging: a new
Ung th biu mô 22-560 ultrasonic technology of medical diagnostics", Ultrasound in medicine
& biology 24.9 (1998): 1419-1435.
Phía trc bình 1000 ±8% [8] Hao, N. T., Thuy-Nga, T., Dinh-Long, V., Duc-Tan, T., Linh-Trung,
55-63
thng N., “2D Shear Wave Imaging Using Maximum Likelihood Ensemble
Phía sau bình Filter”, International Conference on Green and Human Information
Tuyn 62-71 Technology (ICGHIT 2013), pp. 88-94.
tin lit thng
U lành tính 36-41
Ung th biu mô 96-244
Bình thng 0.4-6
Gan
Xơ gan 15-100
Nhìn vào Bng 1, ta thy ch có tham s 1 ca Gan là có s

khác bit gia mô bình thng và mô xơ gan. ây có th là
mt nguyên nhân lý gii ti sao các máy siêu âm th h mi
bc u ã áp dng công ngh to nh àn hi sóng bin
dng (SWEI) trong ánh giá bnh gan. Vic ánh giá trên các
cơ quan khác (tuyn vú, tuyn yên, tuyn giáp, ...) vn ang
c nghiên cu phát trin.
Trong bài báo này, tác gi ã c lng c tham s 1 và 
 to nh  àn hi nht, làm tng kh nng phát hin các
khi u. Bc x lý tip theo, tác gi s dng b lc Trung v 
gim nhiu. Trên thc t, các nh siêu âm thng xut hin các
loi nhiu nh: nhiu m, nhiu mui - tiêu. Ngoài ra, khi kt
hp nh t hai tham s 1 và  , nh tng hp có nhiu thành
phn ơn l ri rác (nh nhiu m). B lc Trung v, c bit,
có hiu qu trong vic lc các loi nhiu nói trên.
IV. KT LUN
Trong bài báo này, bng vic s dng MLEF, chúng tôi ã c
lng c các tham s CSM và to nh 2D i tng trong
môi trng có nhiu. Phân tích nh lng khi có s nh hng
ca các mc nhiu khác nhau. Ngoài ra, chúng tôi s dng b
lc trung v  gim nhiu (các nhiu m) trên nh 2D tái to
c. Trong tơng lai, chúng tôi s áp dng và ci tin phơng
pháp trên cho b d liu thc. Bên cnh ó, tip tc nghiên cu
a ra các cp giá tr ngng 1* và  * phù hp vi tng môi
trng (các kiu mô khác nhau), ng thi nghiên cu nâng
cao cht lng ca các b lc trong quá trình to nh.
TÀI LIU THAM KHO
[1] Orescanin M., et al, “Shear Modulus Estimation With Vibrating With
Needle Stimulation”, IEEE Trans. Ultrasonics, Ferroelectrics, and
Frequency Control. 57, 1358-1367 (2010).
40
40
HộiHội
Thảo Quốc
Thảo Gia
Quốc 2015
Gia 2015vềvềĐiện
ĐiệnTử,
Tử,Truyền
NghệThông
ThôngTinTin (ECIT
(ECIT 2015)
2015)
Thủy vân trên mô hình 3D

Nguyễn Lương Nhật1, Đào Duy Liêm2, Lương Xuân Dẫn3
Học Viện Công Nghệ Bưu Chính Viễn Thông, cơ sở TP Hồ Chí Minh
1
2
Trường Đại học Công Nghệ Sài Gòn
3
Công ty TNHH Truyền hình Kỹ thuật số Miền Nam
Email: nhatnl@ptithcm.edu.vn, liem.daoduy@stu.edu.vn , danlx@sdtv.vn
Abstract— Trong bài báo này chúng tôi trình bày một phương
pháp chứng thực bản quyền cho các mô hình lưới 3D thông qua II. MÔ HÌNH LƯỚI 3D
thủy vân. Ý tưởng của phương pháp này là nhúng thông tin thủy
vân vào các lưới 3D bằng cách thay đổi phân bố các chuẩn đỉnh
trong hệ tọa độ cầu. Hệ thống hoàn chỉnh bao gồm hai chức năng Hóa trị = 6
là giấu và tách thông tin thủy vân. Quá trình tách thủy vân có thể
thực hiện mà không cần mô hình gốc. Kết quả thử nghiệm cho thấy
tính bền vững của thủy vân và tính trong suốt của mô hình có thể
được điều chỉnh bằng cách thay đổi hệ số nhúng.
Keywords- Mô hình lưới 3D, thủy vân mù, bảo vệ bản quyền, tọa
độ cầu.
I. GIỚI THIỆU
Độ = 3
Trong những năm gần đây kỹ thuật thủy vân số trở thành một
phương pháp được ưa chuộng để bảo vệ bản quyền dữ liệu số. (a) (b)
Thủy vân được tạo ra và nhúng vào dữ liệu, không thể tách rời Hình 1. (a) Mô hình lưới 3D mannequin, (b) Hóa trị (valence) của
thủy vân khỏi dữ liệu nếu không có đúng phương pháp và khóa. đỉnh và độ (degree) của mặt
Bằng việc nhúng thủy vân vào mô hình lưới 3D (Three-
Dimensional), sau đó có thể tách thủy vân ra để khẳng định chủ Trong thực tế các mô hình 3D thường được đại diện bởi các
quyền của mô hình 3D. lưới đa giác. Một lưới 3D được đặc trưng bởi ba thành phần:
Các phương pháp thủy vân trên mô hình 3D chủ yếu dựa trên đỉnh, cạnh và mặt (thường là hình tam giác hoặc tứ giác). Trong
sự thay đổi hình học (tọa độ đỉnh) của mô hình. Trong [1] các khi tọa độ của các đỉnh tạo nên thông tin hình học của lưới thì
tác giả nhúng thủy vân vào mô hình lưới 3D bằng cách điều các cạnh và các mặt mô tả các mối quan hệ liền kề giữa các đỉnh
chỉnh thứ tự các đỉnh trong mỗi tam giác theo khoảng cách giữa và tạo thành thông tin kết nối của lưới [3]. Mô tả theo toán học,
ba đỉnh và trọng tâm của tam giác đó. Trong [2] các tác giả đề một lưới M chứa NV đỉnh và NE cạnh có thể được mô hình hóa
xuất một thuật toán nhúng thủy vân bằng cách thay đổi chiều dài bởi M={V, E}, trong đó:
vector nối từ đỉnh đến trọng tâm của mô hình 3D. Kết quả thực V 
 vi  xi , yi , zi  i  1, 2,..., NV  (1)
nghiệm cho thấy, trong cả hai phương pháp này mô hình đã
nhúng thủy vân ít có sự biến dạng và bền vững trước một số tấn E
 
e P
i 1
(j) ( j)
, P2  j 1, 2,..., N ; P
E 1
( j)

, P2  1, 2,..., NV  (2)
( j)
công đơn giản. Mỗi đỉnh vi được mô tả bởi tọa độ ba chiều xi, yi, zi của nó,
Kỹ thuật thủy vân có thể phân loại theo nhiều cách khác mỗi phần tử trong E biểu diễn một cạnh nối hai đỉnh khác nhau
nhau: thủy vân mù, không mù hay bán mù, thủy vân miền không được đánh số P1(j) và P2(j) tương ứng. Hình 1 minh họa về lưới
gian hay miền biến đổi,… Các phương pháp thủy vân mù thường 3D với “hóa trị” của một đỉnh là số cạnh nối đến đỉnh đó và “độ”
ít bền vững hơn so với phương pháp không mù, nhưng chúng lại của một mặt là số cạnh tạo nên mặt đó. Các đỉnh lân cận là các
được ứng dụng trong thực tế nhiều hơn khi không cần mô hình đỉnh được kết nối trực tiếp với đỉnh đó bằng một cạnh.
ban đầu để trích xuất thủy vân. Trong bài báo này chúng tôi trình
bày một thuật toán thủy vân mù được thực hiện trên miền không III. THỦY VÂN TRÊN MÔ HÌNH 3D
gian tại hệ tọa độ cầu, với việc chọn lựa hệ số nhúng phù hợp có Thủy vân trên mô hình 3D là một lĩnh vực mới của kỹ thuật
thể nâng cao tính trong suốt của mô hình 3D hay tính bền vững thủy vân số. Cấu trúc dữ liệu khác thường của mô hình 3D do
của thông tin thủy vân. quá trình lấy mẫu không đều là một thách thức đối với các nhà
Trong phần II chúng tôi sẽ mô tả kiến trúc thực tế của mô nghiên cứu về kỹ thuật thủy vân, vì vậy hướng nghiên cứu này
hình lưới 3D, phần III sẽ trình bày về thuật toán thủy vân trên nhận được ít sự quan tâm của các nhà khoa học. Trong những
các lưới 3D. Phần IV cung cấp các kết quả thực nghiệm của thuật năm gần đây, công nghệ thực tại ảo liên tục phát triển phục vụ
toán, còn phần V sẽ thực hiện các thí nghiệm tấn công và tổng cho nhu cầu ngày càng cao của con người [4], [5] nên việc sở
kết được trình bày ở phần VI. hữu bản quyền trí tuệ của các sản phẩm 3D cần được quan tâm
nhiều hơn nữa.
ISBN: 978-604-67-0635-9 41
41
  arctan yi
Mô hình gốc Watermark  i xi


  i  xi  yi  zi
2 2 2
(3)
Đọc tọa độ Chuyển sang Nhúng Chuyển sang tọa  z
các đỉnh tọa độ cầu Watermark độ Descartes i  arccos i
 i
Trong đó i (thành phần bán kính) được gọi là chuẩn đỉnh
NHÚNG thứ i, và:
Mô hình đã
Nhúng thủy vân  xi   i cos  i sin i
TÁCH 
 yi   i sin  i sin i (4)
Watermark  z   cos 
Tách được  i i i
Tách Chuyển sang Đọc tọa độ A. Quá trình nhúng

Watermark tọa độ cầu các đỉnh
Giá trị các đỉnh viD đọc được từ mô hình gốc trước tiên sẽ
Hình 2. Lưu đồ nhúng và tách thủy vân được chuyển sang tọa độ cầu viS theo (3). Các chuẩn đỉnh i được
sử dụng để nhúng thủy vân, còn hai thành phần i và i được giữ
Thuật toán thủy vân được đề xuất trong bài báo này gồm các nguyên. Thủy vân đầu vào sẽ được chuyển thành các bit nhị phân
khối chức năng chính được thể hiện như trong hình 2 bao gồm và nhúng vào các chuẩn đỉnh của mô hình 3D.
hai quá trình: nhúng và tách thông tin thủy vân để chứng thực Mỗi bit thủy vân wi được nhúng vào một chuẩn đỉnh i và
bản quyền. Thủy vân (Watermark) được sử dụng có thể là các tạo thành i* theo công thức:
bit nhị phân, một logo hay vài ký tự đặc biệt nào đó sẽ được
nhúng vào các đỉnh của mô hình lưới 3D tại hệ tọa độ cầu.
i

*
  .2   2 .  mod 2   w  .2
i
k k
i i
k
(5)
Giá trị tọa độ các đỉnh đại diện cho khoảng cách giữa mỗi Sau cùng, chuẩn đỉnh i cùng với các thành phần i và i
*
đỉnh tới trọng tâm mô hình 3D. Gọi viD = {xi, yi, zi} là đỉnh thứ i được chuyển lại tọa độ Descartes theo (4) và lưu lại thành mô
trong hệ tọa độ Descartes và viS = {i, i, i} là đỉnh tương ứng hình 3D đã nhúng thủy vân. Hệ số nhúng k sử dụng để cân bằng
trong hệ tọa độ cầu [6]. Mối quan hệ giữa viD và viS được mô tả tính trong suốt và bền vững của thuật toán. Trong khi tính trong
bởi (3), (4) và hình 3. suốt sẽ giữ cho mô hình 3D sau khi nhúng ít sai khác nhất so với
mô hình gốc, cũng như giữ được độ tinh xảo trong các sản phẩm
3D thì tính bền vững sẽ đảm bảo đầu thu luôn tách được thủy
vân đúng trước những tấn công khác nhau lên mô hình. Giá trị k
sẽ được lựa chọn tùy theo từng ứng dụng cụ thể, k càng tăng thì
tính trong suốt càng tăng, tính bền vững càng giảm và ngược lại.
B. Quá trình tách
Để chứng thực bản quyền cho mô hình 3D, người chủ sở hữu
sẽ tiến hành tách thủy vân từ mô hình. Quá trình tách diễn ra
tương tự như khi nhúng, giá trị các đỉnh viD* đọc được từ mô hình
đã nhúng sẽ chuyển sang toa độ cầu viS*. Các bit thủy vân wi* sẽ
được tách từ các chuẩn đỉnh i* theo công thức:

wi   2 .i mod 2 
* k *
 (6)
Với x là toán tử lấy phần nguyên của x và hệ số k giống với
quá trình nhúng.
Các bit thủy vân tách được wi* sau đó sẽ được sắp xếp lại
theo định dạng ban đầu để chứng thực bản quyền cho mô hình
3D.
IV. KẾT QUẢ THỰC NGHIỆM
Các kết quả sau đây được thực hiện trên Matlab 2015a với
thông tin thủy vân là một logo nhị phân kích thước 60 x 60 bit,
Hình 3. Mối quan hệ giữa tọa độ Descartes và tọa độ cầu các mô hình lưới 3D thí nghiệm lần lượt là dragon 50.000 đỉnh,
bunny 34835 đỉnh, crank 50012 đỉnh và casting 5096 đỉnh (như
hình 4). Để đánh giá chất lượng của các lưới 3D sau khi nhúng
42
42
HộiHội
Thảo Quốc
Thảo Gia
Quốc 2015
ĐiệnTử,
Tử,Truyền
NghệThông
ThôngTinTin (ECIT
(ECIT 2015)
2015)
chúng tôi sử dụng thước đo độ biến dạng cấu trúc lưới MSDM
(Mesh Structural Distortion Measure) được đề xuất bởi Lavoué
[7]. Tham số này bằng 0 khi hai mô hình giống hệt nhau và tiến
tới 1 khi hai mô hình rất khác nhau.
1
1
MSDM  X, Y    LMSDM  x
n
, yj 
3  3
  0,1 (7)

n 
j
j 1
Với X và Y là hai mô hình lưới cần so sánh; n là số đỉnh của

mô hình; xj, yj là lưới cục bộ thứ j đang xét. Giá trị LMSDM
được cho bởi:
1

LMSDM  x, y   0.4 L  x, y   0.4C  x, y   0.2 S  x, y 
3 3 3
 3
(8)
Trong đó L, C và S tương ứng là hàm so sánh độ cong, độ Hình 6. Giá trị MSDM và NHS khi nhúng thủy vân trên bốn mô hình
với các hệ số k khác nhau
tương phản và cấu trúc của hai lưới:
x  y Giá trị tham số MSDM sau khi nhúng của bốn mô hình trên
L  x, y   (9)
max   x ,  y  lần lượt là 0.157605; 0.263408; 0.222072; 0.225251 đảm bảo
tính trong suốt cao của thuật toán. Để lựa chọn hệ số k thích hợp,
x y chúng tôi thực hiện nhúng thủy vân vào các mô hình 3D với các
C  x, y   (10)
max   x ,  y  hệ hố k khác nhau, sau đó tách thủy vân từ mô hình đã nhúng.
Kết quả ghi nhận được qua hai tham số MSDM và NHS được
 x y   xy trình bày như trong hình 6.
S  x, y   (11)
Từ các kết quả trên chúng tôi nhận thấy với k ≥ 8.3 thì các
 x y
mô hình sau khi nhúng đạt được tính trong suốt cao (MSDM
Với x, x và xy tương ứng là giá trị trung bình, độ lệch <0.3) và với k ≤ 19 thì thủy vân tách được hoàn toàn chính xác
chuẩn và hiệp phương sai của độ cong trên hai lưới cục bộ x, y (NHS = 1), đây là cơ sở chọn lựa hệ số k để cân bằng tính trong
(chi tiết về MSDM và LMSDM xin xem thêm trong [7]). suốt và tính bền vững sẽ được trình bày trong phần sau.
Theo [8] giá trị ngưỡng của MSDM là 0.3 sẽ đảm bảo tính
trong suốt cho mô hình đã nhúng thủy vân. Có nghĩa là khi thực V. CÁC THÍ NGHIỆM TẤN CÔNG
hiện nhúng thủy vân vào các lưới 3D không gây ra quá nhiều sự Các loại tấn công lên mô hình 3D được trình bày trong [8]
biến dạng trên mô hình gốc. bao gồm làm nhẵn, thêm nhiễu, chia nhỏ, cắt xén, lượng tử
Để so sánh giữa thủy vân gốc W và thủy vân tách được W*, đỉnh,…, mỗi loại tấn công đều có các biên độ biến dạng khác
chúng tôi sử dụng tham số NHS (Normalized Hamming nhau. Để đánh giá tính bền vững của thuật toán thủy vân, chúng
Similarity). Giá trị NHS sẽ nằm trong khoảng từ 0 (hai chuỗi tôi thực hiện một số tấn công lên mô hình 3D đã nhúng, sau đó
khác nhau hoàn toàn) đến 1 (hai chuỗi giống hệt nhau). tiến hành tách thủy vân từ mô hình bị tấn công và so sánh với
*
HD (W, W ) thủy vân gốc. Từ đó xác định hệ số nhúng cân bằng giữa tính
NHS  1  (12) trong suốt và tính bền vững.
N .M
Hình 7 cho thấy các mô hình 3D (đã nhúng thủy vân) sau khi
HD (W , W
*
)   xor W  i , j  , W * (i, j)  (13) qua các tấn công khác nhau và hình 8 là kết quả tách thủy vân từ
i j
các mô hình bị tấn công tương ứng. Bảng 1 sẽ trình bày rõ hơn
Hình 5 cho thấy kết quả nhúng thủy vân vào các mô hình 3D các giá trị NHS của thủy vân tách được trên mô hình bị tấn công
với hệ số k = 9 và thủy vân tách được từ các mô hình đã nhúng so với thủy vân gốc. Các thí nghiệm tấn công với nhiều biên độ
hoàn toàn giống với thủy vân ban đầu (NHS = 1). tác động được thực hiện trên hai mô hình crank.off và bunny.off
(a) logo.png (b) dragon.off (c) bunny.off (d) crank.off (e) casting.off
Hình 4. Thủy vân gốc và các mô hình 3D ban đầu sử dụng trong các
(a) Chưa tấn công (b) Chia nhỏ (c) Cắt xén 30% (d) Đơn giản hóa
thí nghiệm
(a) tach.png (b) w_dragon.off (c) w_bunny.off (d) w_crank.off (e) w_casting.off (e) Lượng tử đỉnh (f) Làm mịn (g) Nhiễu 0.25% (h) Biến đổi tương tự
Hình 5. Thủy vân tách được và các mô hình đã nhúng với k = 9 Hình 7. Các loại tấn công lên mô hình 3D với k = 9
43
43
HộiHội
Thảo Quốc
Thảo Gia
Quốc 2015
ĐiệnTử,
Tử,Truyền
NghệThông
ThôngTinTin (ECIT
(ECIT 2015)
2015)
VI. TỔNG KẾT

Trong bài báo này chúng tôi giới thiệu một thuật toán thủy
vân trên mô hình lưới 3D, từ đó có thể ứng dụng trong việc bảo
(a) NHS=1 (b) NHS=1 (c) NHS=0.72 (d) NHS=0.74 vệ bản quyền cho các mô hình 3D. Thủy vân được nhúng trực
tiếp vào mô hình trên miền không gian với hệ số nhúng k có thể
thay đổi được để giữ tính trong suốt cho mô hình, đảm bảo rằng
mô hình 3D sau khi nhúng có rất ít sự biến đổi so với ban đầu.
Chúng tôi cũng đã thực hiện rất nhiều loại tấn công với nhiều
biên độ khác nhau lên các mô hình đã nhúng, sau đó tiến hành
(e) NHS=0.99 (f) NHS=0.68 (g) NHS=1 (h) NHS=0.51
tách thủy vân để kiểm tra tính bền vững của phương pháp. Kết
quả cho thấy khi giảm dần hệ số k thì tính bền vững của thủy vân
Hình 8. Thủy vân tách được từ các mô hình bị tấn công tương ứng càng tăng trước một số loại tấn công khác nhau. Từ đó có thể lựa
với k = 9 chọn hệ số k phù hợp với các ứng dụng cụ thể nhằm cân bằng
giữa tính trong suốt và tính bền vững của thủy vân. Hướng
BẢNG 1. GIÁ TRỊ THAM SỐ NHS CỦA THỦY VÂN TÁCH
ĐƯỢC SAU TẤN CÔNG VÀ THỦY VÂN BAN ĐẦU nghiên cứu tiếp theo của chúng tôi là thực hiện nhúng thủy vân
trên các miền biến đổi để tăng tính bền vững của thủy vân trước
nhiều loại tấn công khác nhau.
K=9 K=19
Loại tấn công TÀI LIỆU THAM KHẢO
Crank.off Bunny.off Crank.off Bunny.off
[1] Xiaoqing Feng, Yanan Liu, “A Robust, Blind and Imperceptible
Chưa tấn công 1 1 1 1 Watermarking of 3D Mesh Models Base on Redundancy
Information”, International Journal of Digital Content Technology
Chia nhỏ 1 1 1 1 and its Applications (JDCTA), vol.6, no.2, February 2012.
[2] Yu Zhi-qiang, Horace H. S. Ip, L. F. Kowk, “Robust Watermarking
Cắt xén 30% 0.7253 1 0.6136 0.7133 of 3D Polygonal Models Based on Vertice Scrambling”, Proceedings
of the Computer Graphics International, 2003.
Đơn giản hóa 0.7486 0.7253 0.6939 0.6856 [3] K. Wang, G. Lavoué, F. Denis, and A. Baskurt, “Blind Watermarking
of Three-Dimensional Meshes Review: Recent Advances and Future
Lượng tử 0.9983 1 0.5041 0.5003 Opportunities”, IGI Global, 2010.
[4] Mingsong Dou, H. Fuchs, “Temporally enhanced 3D capture of
Làm mịn 0.7311 0.7858 0.4983 0.4886 room-sized dynamic scenes with commodity depth cameras”, Virtual
Reality (VR), 2014 IEEE , pp.39-44, March 29 2014-April 2.
Nhiễu 0.25% 1 1 0.4992 0.4956 [5] A. Rizzo, A. Hartholt, M. Grimani, A. Leeds, M. Liewer, "Virtual
Reality Exposure Therapy for Combat-Related Posttraumatic Stress
Nhiễu 0.5 % 0.6467 0.7022 0.4975 0.5103 Disorder," Computer , vol.47, no.7, pp.31-37, July 2014.
[6] Mohsen Ashourian, Reza Enteshari, Jeonghee Jeon, “Digital
Biến đổi tương Watermarking of Three-dimensional Polygonal Models in the
tự
0.5092 0.5108 0.5012 0.4953 Spherical Coordinate System”, Proceedings of the Computer
Graphics International (CGI’04), IEEE 2004, pp. 590-593.
[7] G. Lavoué, E. D. Gelasca, F. Dupont, A. Baskurt, and T. Ebrahimi,
Dựa vào các kết quả trên, chúng tôi nhận thấy với k ≈ 9 thuật “Perceptually driven 3D distance metrics with application to
toán thủy vân bền vững trước các loại tấn công như: chia nhỏ, watermarking,” in Proc. of the SPIE Electronic Imaging, 2006, vol.
thêm nhiễu, lượng tử và cắt xén, đặc biệt trước tấn công chia nhỏ 6312, pp. 63120L.1–63120L.12.
điểm giữa. Thuật toán cũng kém bền vững trước những tấn công: [8] K. Wang, G. Lavoué, F. Denis, and A. Baskurt (2010), “A benchmark
chuyển đổi tương tự, làm mịn và đơn giản hóa. Tuy nhiên khi k for 3D mesh watermarking”, IEEE International Conference on
Shape Modeling and Applications (SMI) 2010, pp. 231-235, Aug.
tăng lên thì tính bền vững sẽ kém đi trước các tấn công thêm 2010.
nhiễu, lượng tử và cắt xén.
44
44
Phát hiện và ước lượng khoảng cách tới vật cản

trợ giúp cảnh báo cho người khiếm thị
Nguyễn Quốc Hùng∗† , Trần Thị Thanh Hải∗ Vũ Hải∗ Hoàng Văn Nam∗ Nguyễn Quang Hoan‡
Viện nghiên cứu quốc tế MICA - Đại học Bách Khoa Hà Nội - CNRS/UMI - 2954 - INP Grenoble;
∗
† Trường cao đẳng Y tế Thái Nguyên;
‡ Khoa CNTT – Đại học sư phạm kỹ thuật Hưng Yên
Email: {Quoc-Hung.NGUYEN, Thanh-Hai.TRAN, Hai.Vu, Van-Nam.Hoang}@mica.edu.vn; quanghoanptit@yahoo.com.vn
Tóm tắt—Bài báo này trình bày về các công việc liên cho NKT có thể tránh được các nguy hiểm sắp xảy ra
quan đến phát hiện và ước lượng khoảng cách vật cản. minh họa như Hình 1.
Ngữ cảnh chính của bài toán là sử dụng Robot dẫn đường
trợ giúp người khiếm thị di chuyển tới các vị trí định nghĩa
trong môi trường. Vật cản ở đây được chia ra làm hai loại
vật cản cố định ít thay đổi trong môi trường và vật cản
• Ngöôøi
chuyển động xuất hiện bất ngờ. Các công việc thực hiện
bao gồm mô hình hóa môi trường; đề xuất phương pháp
phát hiện nhanh đối tượng; ước lượng khoảng cách từ đối
tượng tới robot trên cơ sở xây dựng bản đồ chênh lệch từ
hai quan sát thu thập từ camera gắn trên robot chuyển • Bình cöùu hoûa
động; đưa tra các cảnh báo kịp thời. Phần đánh giá được
thực hiện đánh giá với 14 học sinh khiếm thị (100% không
nhìn thấy ánh sáng) tại trường THCS Nguyễn Đình Chiểu
– thành phố Hà Nội. Kết quả cho thấy hệ thống đề xuất là • Chaäu hoa
khả thi, an toàn và giúp cho người khiếm thị có thể nhận • Thuøng raùc
biết được các vật cản nguy hiểm trong khi di chuyển.
Từ khóa—Người khiếm thị; Vật cản; Robot; Môi trường
diện hẹp. Hình 1. Hệ thống phát hiện và ước lượng khoảng cách vật cản trợ
giúp Người khiếm thị bằng robot
I. GIỚI THIỆU
Bài báo này được bố cục như sau. Phần I giới thiệu
Phát hiện và ước lượng khoảng cách vật cản là một bài toán phát hiện và ước lượng khoảng cách vật cản.
chủ đề thu hút sự quan tâm của các nhà khoa học trong Phần II trình bày các nghiên cứu liên quan đến bài toán
thời gian dài bởi ý nghĩa và tính ứng dụng của nó trong phát hiện và ước lượng khoảng cách vật cản. Phần III đề
các bài toán dẫn đường tránh vật cản cho robot, xe tự
xuất khung làm việc tổng quát hệ thống, trong đó trình
hành. Đã có rất nhiều phương pháp đề xuất sử dụng bày chi tiết hai phương pháp là phát hiện đối tượng và
công nghệ khác nhau như GPS, LIDAR, RFID, Camera ước lượng khoảng cách vật cản. Trong phần IV mô tả
nhằm tăng độ chính xác phát hiện, giảm độ sai số ước
kịch bản thử nghiệm đánh giá hệ thống đề xuất với 14
lượng nhỏ nhất hay hoạt động trong thời gian thực. học sinh khiếm thị (100% không nhìn thấy) tham gia.
Mục tiêu của chúng tôi là nghiên cứu và phát triển Phần V tóm lược lại các công việc đã thực hiện và đưa
hệ thống thông minh di dộng, có khả năng trợ giúp dẫn ra hướng phát triển trong tương lai.
đường cho NKT trong một số tình huống cụ thể khi di
chuyển tại các vị trí trong môi trường. Các nghiên cứu II. CÁC NGHIÊN CỨU LIÊN QUAN
liên quan đến việc biểu diễn môi trường, định vị, dẫn
hướng đã được trình bày trong các bài báo trước của Trong phần này, chúng tôi trình bày một số nghiên
chúng tôi [1]. Trong bài báo này, chúng tôi trình bày cứu liên quan đến phát hiện và ước lượng khoảng cách
một phương pháp phát hiện vật cản nhằm hoàn thiện hệ vật cản trong ứng dụng dẫn đường cho robot. Các hướng
thống cuối cùng là dẫn hướng và cảnh báo vật cản, giúp tiếp cận được chia thành ba nhóm chính: (i) sử dụng 01
ISBN: 978-604-67-0635-9 45
45
camera ; (ii) sử dụng camera kép (camera-stereo); (iii) giải quyết 02 bài toán cơ bản là xác định vị trí, hướng
sử dụng cảm biến kinect (RGB-D). của robot và xác định kích thước, hình dạng, khoảng
cách phạm vi của vật cản có trong môi trường. Nhóm
1) Hướng tiếp cận sử dụng 01 camera: Jeongdae
tác giả đã đề xuất sử dụng phương pháp tam giác tính
Kim et.al 2012 [2] sử dụng 01 camera xây dựng bản
toán giữa ba điểm sử dụng kỹ thuật tiên tiến hình học
đồ chênh lệch nhằm phát hiện đối tượng động (đối
của camera-stereo khai nhằm tái tạo lại cấu trúc 3D của
tượng người) có trong môi trường gần vị trí robot bằng
đối tượng có trong môi trường.
cách dự đoán chuyển động khối phát hiện được. Phương
pháp phát hiện đối tượng có tên BBME (Block-Based 3) Hướng tiếp cận sử dụng cảm biến Kinect: Diogo
Motion Estimation) sẽ tính toán trên 02 ảnh thu nhận tại Santos et.al 2012 [10] đề xuất phương pháp nhận dạng
hai thời điểm khác nhau. Iwan Ulrich et.al 2000 [3] sử môi trường trong nhà. Hệ thống này gồm: hệ thống điều
dụng thông tin màu trên 01 camera đơn trước thực hiện khiển có phản ứng trong đó robot chánh vật cản trong
trong thời gian thực và cung cấp một hình ảnh vật cản nhà sử dụng cảm biên khoảng cách kinect; hệ thống
dạng nhị phân ở độ phân giải cao. Hệ thống được thử mạng nơ ron nhân tạo (ANN) để nhận dạng ra cấu trúc
nghiệm ở nhiều môi trường như trong nhà và ngoài trời. khác nhau của môi trường như con đường phía trước,
Taylor et.al 2004 [4] đề xuất phương pháp ROP (Radial bên phải, bên trái... Robot sẽ chuyển động theo mô hình
Obstacle Profile) xây dựng bản đồ vật cản sử dụng 01 topo và kếp hợp với khả năng tránh vật cản, áp dụng
camrea nhằm xác định phạm vi vật cản gần nhất trong trong môi trường trong nhà, không phụ thuộc vào điều
bất kỳ hướng nào khi robot di chuyển. Erik Einhorn et.al kiện ánh sáng. Sharon Nissimov et.al 2015 [11] đề xuất
2009 [5] trình bày phương pháp sử dụng các đặc trưng mô hình xe gắn cảm biến kinect 3D để phát hiện vật
SIFT, SURF bất biến với các phép biến đổi kết hợp với cản phía trước sử dụng đồng bộ thông tin màu (RGB)
bộ lọc kalman mở rộng (EKF) xử lý một chuỗi các hình và độ sâu (Depth). Việc quyết định vùng chứa vật cản
ảnh chụp bằng máy ảnh duy nhất được gắn ở phía trước được thực hiện bằng cách sử dụng thông tin cường độ
của một robot di động nhằm tái tạo lại môi trường phục điểm ảnh nằm trong vùng độ dốc xác định so với các
vụ cho bài toán phát hiện đối tượng. điểm ảnh lân cận. Brian Peasley et.al 2013 [12] trình
bày phương pháp phát hiện vật cản sử dụng cảm biến
2) Hướng tiếp cận sử dụng camera kép: Lazaros
kinect theo hướng tiếp cận chiếu các điểm 3D lên mặt
Nalpantidis et.al 2009 [6] trình bày thuật toán ra quyết
phẳng được ước lượng trong quá trình hiệu chuẩn nhằm
định (Decision Making) tránh vật cản dựa vào thông tin
xây dựng một bản đồ 2D occupancy sử dụng để xác
hình ảnh thu nhận từ camera-stereo. Thuật toán này gồm
định xem có tồn tại vật cản trên bề mặt, từ vận tốc tịnh
có hai khối cơ bản: khối thứ nhất có khả năng cung cấp
tiến và quay để tính toán quỹ đạo tránh vật cản. Các
một bản đồ độ sâu đáng tin cậy của các khung cảnh
thử nghiệm với nhiều kịch bản trong nhà bao gồm các
phù hợp với tốc độ di chuyển của robot; phần thứ hai
vật cản cố định và di chuyển với độ cao khác nhau, đặc
là giải thuật ra quyết định sẽ phân tích bản đồ độ sâu
biệt hệ thống không phụ thuộc nhiều vào điều kiện môi
và suy luận hướng di chuyển tránh vật cản. Ming Bai
trường như ánh sáng và hoạt động trong thời gian thực.
et.al 2010 [7] trình bày phương pháp phát hiện vật cản
cho phép robot tìm đường an toàn trong các tình huống
phức tạp sử dụng thông tin hình ảnh được thu thập từ
camera-stereo. Phương pháp thực hiện thông qua hai giai III. HỆ THỐNG ĐỀ XUẤT
đoạn: xây dựng bản đồ chênh lệch từ hai quan sát của
camera và xác định vị trí vật cản dựa vào sự biến đổi Căn cứ vào các phân tích đánh giá phía trên, bài báo
độ sâu điểm ảnh. Rostam Affendi Hamzah et.al 2011 [8] chọn hướng tiếp cận thứ nhất sử dụng 01 camera với
sử dụng phương pháp xây dựng bản đồ chênh lệch từ mục đích thu nhận được hình ảnh có góc nhìn tốt nhất
hai quan sát nhằm ước lượng khoảng cách vật cản phía và thời gian tính toán nhanh cho cả hai bài toán phát
trước giúp robot tránh được va chạm khi di chuyển. Giải hiện và ước lượng khoảng cách trong đó. Hình 2 minh
thuật truyền thống như so sánh vùng (block matching) họa robot gắn camera di chuyển với tốc độ nào đó. Trong
cho việc so sánh vùng dữ liệu của hình ảnh bên trái tham quá trình di chuyển, robot có thể gặp các vật cản cố định
chiếu tới vùng dữ liệu bên phải, đầu ra là một bản đồ trong môi trường (chậu hoa, bình cứu hỏa, thùng rác)
chênh lêch trong đó bao gồm thông tin độ sâu của các hoặc các vật cản động xuất hiện bất ngờ (người). Giả
điểm ảnh. Lagisetty et.al 2013 [9] đề xuất phương pháp thiết của bài toán là robot di chuyển trên 01 mặt sàn
phát hiện và tránh vật cản sử dụng camera-stereo gắn bằng phẳng. Chuyển động của robot theo một lộ trình
trên robot di động trong môi trường có cấu trúc nhằm đã được xác định.
46
46
các đối tượng có trong môi trường trong thời gian

nhanh nhất sử dụng phương pháp đối sánh mẫu.
Öôùc löôïng Hai loại vật cản quan tâm là vật cản cố định và vật
~ 2.5m ~ 2.5 m
cản động.
~ 1.5m − Ước lượng khoảng cách vật cản: Sau khi phát
Öôùc löôïng hiện các vật cản và vị trí của chúng trên ảnh, thực
~ 1.5 m
hiện ước lượng khoảng cách từ vật cản đến camera.
Öôùc löôïng
Trong các phần sau, chúng tôi trình bày chi tiết kỹ thuật
phát hiện vật cản trên ảnh và ước lượng khoảng cách vật
Phaùt hieän
~ 0.5 m vaät caûn
cản tới robot.

Vuøng hình aûnh
Robot B. Phát hiện vật cản

Trong ngữ cảnh của bài toán robot dẫn đường, chúng
Hình 2. Mô hình phát hiện và định vị vật cản ước lượng khoảng cách tôi chia ra làm 02 loại: vật cản cố định và vật cản động.
1) Phát hiện vật cản cố định: Vật cản cố định là các
A. Khung làm việc tổng quát đồ vật đặt trong môi trường như chậu hoa, bình cứu hỏa,
thùng rác. Mục tiêu là phát hiện các độ vật này chính
Tại thời điểm k, camera trên robot thu nhận hình ảnh
xác và nhanh nhất có thể. Ý tưởng cơ bản của chúng tôi
Ik . Với hình ảnh này, vị trí của robot trong môi trường
là học trước các vật cản cũng như vị trí của chúng trong
đã được xác định bởi mô đun định vị (xem chi tiết trong
hệ quy chiếu đã định nghĩa. Các thông tin này sẽ được
bài báo [1]). Vị trí đó là một điểm P(x,y,z=0) trong hệ
lưu lại trong CSDL biểu diễn môi trường. Với ảnh đầu
quy chiếu đã được định nghĩa từ trước. z = 0 vì giả
vào, sau khi đã xác định một cách tương đối vị trí của
thiết robot chuyển động trên một mặt phẳng. Bài toán
robot trên bản đồ bằng giải thuật định vị, tương ứng với
phát hiện và ước lượng khoảng cách vật cản được thể
nó là các đối tượng trong môi trường. Pha phát hiện vật
hiện như sau:
cản tĩnh chỉ kiểm tra và định vị lại cho chính xác hơn.
+ Đầu vào: ảnh Ik , vị trí của robot P(x,y,z=0) . Vì vậy giải thuật đối sánh ảnh được sử dụng.
+ Đầu ra: Tập các vật cản và vị trí của nó trong Trong hình 3, bản đồ môi trường là một tập L =
hệ quy chiếu đã định nghĩa từ trước. Oi = {L1 , L2 , ...Lk , ...LN } là tập N vị trí quan trọng đã được
{Oi (x, y), i = 1, n}. xây dựng từ trước. Tại sử tại thời điểm k, quan sát tương
ứng Ik . Hệ thống định vị xác định robot ở vị trí Lj tương
SƠ ĐỒ CÁC BƯỚC TÍNH TOÁN
LN (thời gian) ứng với quan sát Ij .
Vị trí Lk :
Lk = {(xk , yk ), Z k , (O1 , O2 , ...Ok )}
Ảnh huấn luyên trong CSDL Bản đồ môi trường Ik

Kết quả định vị
L = {L1 , L2 , ...Lk , ...LN }
Ảnh Ik∗
Ảnh mẫu Phương pháp đối sánh ảnh mẫu (template matching)
Robot Ik∗
Lk
Phát hiện vật cản tĩnh 1 2 3
Quan sát hiện tại
Đối sánh các điểm Phát hiện Lựa chọn các
Ảnh Ik đặc trưng (Ik , Ik∗ ) Trích chọn Đối sánh điểm cặp điểm liên kết Tính ma trận
các vật cản: Oi
Đặc trưng đặc trưng xung quanh tâm chuyển tọa độ H
Phát hiện người (t: giây)
HoG-SVM Ảnh hiện thời Khoanh vùng

Lk−t
Ik chứa đối tượng
L2
Dự đoán khoảng cách L1
Quan sát trước t(giây) Hình 4. Các bước phát hiện vật cản tĩnh
Xây dựng bản đồ Tính khoảng cách
Ảnh Ik−t chênh lệch Ik , Ik−t (từ Oi ֌ Robot)
(t: giây)
Đầu tiên, các điểm đặc trưng sẽ được phát hiện trên
ảnh hiện tại Ik và ảnh có trong CSDL Ij . Sau đó kỹ
Hình 3. Các bước phát hiện và ước lượng khoảng cách vật cản thuật Flann được sử dụng để tìm điểm các cặp điểm
giống nhau trên hai ảnh này. Bản chất quá trình này là
Mô hình phát hiện vật cản đề xuất gồm hai pha như tìm cặp vector đặc trưng tương ứng trên hai ảnh sao cho
minh họa trong Hình 3: khoảng cách giữa chúng là nhỏ nhất. Sau khi có các cặp
− Phát hiện vật cản trên ảnh: Mục đích là tại mỗi điểm đặc trưng, chúng tôi sử dụng kỹ thuật RANSAC
một quan sát hiện thời tìm ra vùng hình ảnh chứa [13] để loại bỏ một số cặp đối sánh nhầm. Cuối cùng
47
47
các cặp điểm đặc trưng sẽ được đưa vào để tính toán x0
ma trận chuyển hệ tọa độ H chứa vị trí bao đóng của

vật cản trong ảnh hiện tại.
Ảnh Ij chứa các đối tượng định nghĩa sẵn
{O1 , O2 ...On } với n : tập các đối tượng có trong ảnh.
Các vị trí đối tượng {O1′ , O2′ ...On′ } ánh xạ lên ảnh Ik .
Kết quả của quá trình này là đối tượng {O1′ , O2′ ...On′ } D
có trong ảnh Ik được khoanh vùng. ϕ1 ϕ2

2) Phát hiện vật cản động: Ngoài các vật cản cố định
trong môi trường, các vật cản động, đột ngột xuất hiện
như người là mối lo lắng của NKT trong quá trình di ϕ0 ϕ0
chuyển. Để phát hiện người, chúng tôi sử dụng kỹ thuật B1 B2
kinh điển đã được đề xuất bởi [14] như sơ đồ dưới đây. f

SL
B
SR
Mô hình
Huấn luyện Huấn luyện Hình 6. Mô hình ước lượng khoảng cách vật cản từ hai quan sát
Ảnh
huấn luyện
Tính toán đặc trưng HoG Bộ phân loại SVM
Tính toán Tính HoG Chuẩn hóa

+ ϕ0 góc quan sát đối tượng từ 02 camera, ϕ1 và ϕ2
Tiền xử lý Gradient trên các Cell Block Nhận dạng
là góc giữa trục quang học của camera và các đối
1 2 3 4
tượng quan sát.
Ảnh
nhận dạng + f tiêu cự ống kính hai camera; x0 khoảng cách
Kết quả
vùng quan sát của camera.
Hình 5. Sơ đồ các bước phát hiện vật cản động
Khoảng cách D được tính toán như sau:
Bx
D= ϕ 0 0 (1)
Trong hình 5 trình bày các bước tính toán phát hiện 2 tan 2 (x1 − x2 )
người sử dụng kết hợp HoG-SVM, trong đó mũi tên nét
đứt là quá trình học, mũi tên nét liền là quá trình nhận Với x0 là chiều rộng của ảnh, (x1 − x2 ) là sự chệnh
dạng. Ảnh đầu vào dùng cho huấn luyện và nhận dạng lêch (Disparity) về vị trí của đối tượng quan sát trên
trước khi được tính Gradient, cần phải đưa về kích thước camera thứ nhất và thứ hai cùng tính theo từng điểm
chuẩn. Ngoài ra, để tránh gây khó khăn cho việc nhân ảnh (pixels).
dạng đối tượng sau này các ảnh cần phải được chuẩn 2) Xây dụng bản đồ chênh lệch: Theo [15] mô hình
hóa màu, chuẩn hóa gamma (bước tiền xử lý) của giải đề xuất sử dụng camera kép (camera-stereo) dựa theo
thuật. nguyên lý cơ bản xây dựng bản đồ chênh lệch:
C. Ước lượng khoảng cách vật cản tới robot Ảnh Ik Ảnh Ik
1 2 3
1) Nguyên lý phương pháp ước lượng khoảng cách: Ảnh đầu vào Hiệu chỉnh Đối sánh
Mục đích của việc dự đoán khoảng cách là tái tạo lại
không gian 3 chiều (3D), mô phỏng lại hệ thống thị giác Camera Ảnh Ik−1 Ảnh Ik−1
Độ sâu
của con người thông qua việc lấy đồng thời ảnh từ hai Bộ tham số
hiệu chuẩn
camera cùng quan sát một khung cảnh từ các góc nhìn
4
Các mẫu hiệu chỉnh Tính toán
(Mẫu ô bàn cờ) độ sâu
khác nhau. Từ đó bằng cách phép biến đổi hình học sẽ Mô hình
hiệu chuẩn
tính toán được khoảng chênh lệch giữa hai quan sát trên
ảnh để từ đó ước lượng ra khoảng cách trên thực địa, Thực hiện trước khi thu thập dữ liệu
Bản đồ chênh lệch
được minh họa hình 6.
Trong đó:
Hình 7. Sơ đồ các bước tính toán bản đồ chênh lệch và ước lượng
+ SL và SR hai camera được đặt đồng trục trên cùng khoảng cách
một mặt phẳng.
+ B khoảng cách nối tâm hai camera; B1 khoảng Các bước tính toán xây dựng bản đồ chênh lệch tổng
cách từ tâm chiếu đối tượng tới camera thứ nhất, quát bao gồm 6 giai đoạn thực hiện:
B2 khoảng cách đối camera thứ hai. 1) Thu thập dữ liệu.
48
48
2) Hiệu chỉnh cải thiện. Nội. Chiều dài của hành lang là 60m, với lộ trình di
3) Đối sánh hình ảnh. chuyển. Trong đó các vị trí quan trọng được định nghĩa
4) Tính toán độ sâu. từ trước: A: trước của Phòng Thị giác máy tính, B: cầu
Trong phương pháp này chúng tôi sử dụng 01 camera thang máy, C: phía trước nhà vệ sinh, D: lớp học). Vật
thu thập hình ảnh ở các thời điểm khác nhau: (i) quan cản trong môi trường bao gồm người (chuyển động),
sát hiện tại Lk ; (ii) quan sát trước một khoảng thời gian thùng rác, chậu hoa và bình cứu hỏa (cố định) mô tả
Lk−t , với t là một khoảng thời gian xác định trước đủ hình 9.
để phân biệt hai ảnh Ik và Ik−t , mô tả hình 8. B. Kết quả đánh giá
1) Độ đo đánh giá:
+ Độ đo khung giới hạn (Bounding Box) a0 [16]
Aûnh Aûnh
I I
area(Bp ∩ Bgt )
L L L a0 = (2)
area(Bp ∪ Bgt
Quan saùt L
Trong đó: a0 : là tỷ lệ xếp chồng giữa vùng dự
Quan saùt L
Hình 8. Minh họa quan sát thu thập dữ liệu khi camera chuyển động
đoán Bp và vùng đánh dấu đối tượng sao cho a0 ≥
50%; Bp ∩ Bgt giao nhau giữa hai cùng xếp chồng;
Tóm tắt phương pháp xây dựng bản đồ chênh lệch: từ Bp ∪ Bgt ngược lại.
biến dạng xuyên tâm và tiếp tuyến của ống kính được + Độ đo triệu hồi (Recall công thức 4) và Độ đo
loại bỏ bằng cách hiệu chỉnh máy ảnh bởi các thông số chính xác (Precision công thức 3).
bên trong và bên ngoài máy ảnh. Để làm được điều này tp
cần có sự hiểu biết về các thông số máy ảnh với mục Chính xác (P recision) = (3)
tp + f p
đích khắc phục cả hai hình ảnh. Sau khi hiệu chỉnh, hình
ảnh được tách ra thành các khu vực bằng cách sử dụng tp
Triệu hồi (Recall) = (4)
các thuật toán phân chia lai được đề xuất. Cuối cùng, tp + f n
thuật toán đối sánh (matching) được áp dụng trên các + Độ đo sai số tiêu chuẩn (RMSE) trong việc ước
hình ảnh phân đoạn trái và phải với mục đích để tìm tất lượng khoảng cách vật cản.
cả các tương quan (điểm phù hợp) và gán chiều sâu cho
n
từng phân đoạn. Đầu ra của thuật toán đối sánh ảnh là 1
các bản đồ chênh lệch chứa độ sâu điểm ảnh. RM SE = (θ̂ − θ)2 (5)
n i=1
IV. ĐÁNH GIÁ THỰC NGHIỆM
Trong đó θ̂ là khoảng cách đo thực địa tới vật cản;
A. Môi trường thử nghiệm
θ là khoảng cách dự đoán trên bản đồ chênh lệch.
2) Kết quả đánh giá: Chúng tôi tiến hành thu thập
đồng thời 02 luồng dữ liệu hình ảnh khung cảnh và
đường đi vào 3 thời điểm khác nhau (sáng, trưa, tối) với
robot di chuyển ở các tốc độ v khác nhau.
Vieän nghieân cöùu quoác teá MICA
Bảng I
• Ñieåm A: Phoøng aûnh
• Ñieåm B: Thang maùy K ẾT QUẢ THU NHẬN DỮ LIỆU KHUNG CẢNH/ĐƯỜNG ĐI
• Ñieåm C: Nhaø veä sinh (WC)
• Ñieåm D: Lôùp hoïc
Tuyeán ñöôøng
Khoaûng caùch: 60 m Khung hình (frames)/ vận tốc (v)
Robot Thời gian
(Xuaát phaùt) v = 100mm/s v = 200mm/s v = 300mm/s
Sáng (L1) 481 256 175
Trưa (L2) 426 243 164
• Bình cöùu hoûa • Thuøng raùc • Chaäu hoa • Ngöôøi Chiều (L3) 431 251 170
Tổng số 1338 750 509
Hình 9. Môi trường thử nghiệm robot dẫn đường tránh vật cản
- Dữ liệu đánh giá phát hiện đối tượng: khoanh vùng
Môi trường thử nghiệm được tiến hành tại hành lang các đối tượng có trong chuỗi hình ảnh khung cảnh bao
tầng 10 – Viện MICA – Trường Đại học Bách khoa Hà gồm: chậu hoa, bình cứu hỏa, thùng rác, người. Kết quả
49
49
cho ra danh sách tọa độ các đối tượng có trong chuỗi LỜI CẢM ƠN
hình ảnh liên tiếp. Nghiên cứu này được tài trợ bởi Quỹ phát triển khoa
- Dữ liệu đánh giá ước lượng khoảng cách: tiến hành học và công nghệ quốc gia (NAFOSTED) trong đề tài
đo và đánh dấu khoảng cách vị trí vật cản sử dụng dữ mã số FWO.102.2013.08.
liệu đường đi so với gốc tọa độ (tọa độ ảnh 2D).
Bảng II [1] Q.-H. Nguyen, H. Vu, T.-H. Tran, and Q.-H. Nguyen, “A vision-
K ẾT QUẢ PHÁT HIỆN ĐỐI TƯỢNG based system supports mapping services for visually impaired
people in indoor environments,” in Control Automation Robotics
Độ triệu hồi Độ chính xác Thời gian & Vision (ICARCV), 2014 13th International Conference on.
Tên lớp
Recall (%) Precision (%) (giây) IEEE, 2014, pp. 1518–1523.
00. Chậu hoa 98.30 90.23 [2] J. Kim and Y. Do, “Moving obstacle avoidance of a mobile robot
01. Bình cứu hỏa 94.59 89.42 using a single camera,” Procedia Engineering, vol. 41, pp. 911–
0.47
02. Thùng rác 85.71 92.31 916, 2012.
03. Người 92.72 89.74 [3] I. Ulrich and I. Nourbakhsh, “Appearance-based obstacle detec-
tion with monocular color vision,” in AAAI/IAAI, 2000, pp. 866–
Bảng II trình bày chi tiết đánh giá phát hiện vật cản 871.
[4] T. Taylor, S. Geva, and W. W. Boles, “Monocular vision as
của phương pháp đề xuất với độ triệu hồi recall ∼ a range sensor.” International Conference on Computational
96.44% và độ chính xác P recision ∼ 90.35% với thời Intelligence for Modelling, Control and Automation, 2004.
gian tính toán t ∼ 0.47 giây. [5] E. Einhorn, C. Schroeter, and H.-M. Gross, “Monocular obstacle
detection for real-world environments,” in Autonome Mobile
Systeme 2009. Springer, 2009, pp. 33–40.
Bảng III [6] L. Nalpantidis, I. Kostavelis, and A. Gasteratos, “Stereovision-
K ẾT QUẢ DỰ ĐOÁN ĐỘ SAI SỐ ƯỚC LƯỢNG KHOẢNG CÁCH VẬT based algorithm for obstacle avoidance,” in Intelligent Robotics
CẢN and Applications, 2009, vol. 5928, pp. 195–204.
[7] M. Bai, Y. Zhuang, and W. Wang, “Stereovision based obstacle
Sai số tiêu chuẩn Khoảng cách detection approach for mobile robot navigation,” in Intelligent
Mã Tên lớp
RMSE(m) phát hiện vật cản(m) Control and Information Processing (ICICIP), 2010 Interna-
00 Chậu hoa 0.41 2.22 tional Conference on. IEEE, 2010, pp. 328–333.
01 Bình cứu hỏa 0.65 3.75 [8] R. A. Hamzah, H. N. Rosly, and S. Hamid, “An obstacle detec-
02 Thùng rác 0.47 4.04 tion and avoidance of a mobile robot with stereo vision camera,”
03 Người 0.44 4.12 in Electronic Devices, Systems and Applications (ICEDSA), 2011
Trung bình 0.49 3.53 International Conference on. IEEE, 2011, pp. 104–108.
[9] R. Lagisetty, N. Philip, R. Padhi, and M. Bhat, “Object detection
and obstacle avoidance for mobile robot using stereo camera,”
Bảng III trình bày kết quả ước lượng khoảng cách vật in Control Applications (CCA), 2013 IEEE International Con-
cản, trong đó khoảng cách trung bình ∼ 3.35m với sai ference on. IEEE, 2013, pp. 605–610.
số tiêu chuẩn RM SE ∼ 0.48m mà robot phát hiện và [10] D. S. O. Correa, D. F. Sciotti, M. G. Prado, D. O. Sales, D. F.
Wolf, and F. S. Osório, “Mobile robots navigation in indoor
dự đoán được khoảng cách tốt nhất. environments using kinect sensor,” in Critical Embedded Systems
V. KẾT LUẬN (CBSEC), 2012 Second Brazilian Conference on. IEEE, 2012,
pp. 36–41.
Bài báo trình bày một phương pháp nhận dạng và [11] S. Nissimov, J. Goldberger, and V. Alchanatis, “Obstacle de-
ước lượng khoảng cách vật cản dựa vào kỹ thuật xử lý tection in a greenhouse environment using the kinect sensor,”
Computers and Electronics in Agriculture, vol. 113, pp. 104–
ảnh sử dụng một camera (thông thường) duy nhất. Công 115, 2015.
việc chính là nghiên cứu các phương pháp phát hiện [12] B. Peasley and S. Birchfield, “Real-time obstacle detection and
nhanh đối tượng sử dụng phương pháp đối sánh mẫu avoidance in the presence of specular surfaces using an active
3d sensor,” in Robot Vision (WORV), 2013 IEEE Workshop on.
(template maching) trên bộ dữ liệu vị trí quan trọng đã IEEE, 2013, pp. 197–202.
được đánh dấu các vị trí huấn huyện từ trước. Kết quả [13] D. Nistér, “Preemptive ransac for live structure and motion
của phần này làm nền tảng để dự đoán khoảng cách trên estimation,” Machine Vision and Applications, vol. 16, no. 5,
pp. 321–329, 2005.
vùng phát hiện được bằng phương pháp xây dựng bản [14] N. Dalal and B. Triggs, Histograms of oriented gradients for
đồ chênh lệch (Disparity map) từ hai quan sát chuyển human detection, 2005, vol. 1.
động tịnh tiến. Hệ thống đánh giá trên tập người dùng [15] M. Pollefeys, R. Koch, and L. Van Gool, “A simple and efficient
rectification method for general motion,” in Computer Vision,
với số lượng 14 học sinh khiêm thị tham gia gia các 1999. The Proceedings of the Seventh IEEE International Con-
kịch bản di chuyển gặp vật cản động bất ngờ và các vật ference on, vol. 1. IEEE, 1999, pp. 496–501.
cản cố định. Kết quả khả thi giúp cho người khiếm thị [16] M. Everingham, L. Van Gool, C. K. Williams, J. Winn, and
A. Zisserman, “The pascal visual object classes (voc) challenge,”
tránh được các nguy hiểm sắp xảy ra, kết quả này cũng International journal of computer vision, vol. 88, no. 2, pp. 303–
góp phần quan trọng trong hệ thống trợ giúp định hướng 338, 2010.
người khiếm thị sử dụng robot.
50
50
Khảo sát giải thuật điều khiển tắc nghẽn cho luồng
TCP
Nguyễn Xuân Khánh
Khoa Viễn Thông II,
Học Viện Công Nghệ Bưu Chính Viễn Thông
Email: xuankhanh@ptithcm.edu.vn
Abstract— TCP (Transmisssion Control Protocol) mang hầu hết lưu trữ gói truyền tại hàng đợi đầu ra của router tạm thời có
các lưu lượng trên Internet, vì thế hiệu năng của Internet phụ thể bị tràn và gây ra tình trạng mất gói (mất segment TCP).
thuộc rất lớn vào TCP thực hiện như thế nào khi truyển qua Mặc dù, một nguyên nhân khác gây ra hiện tượng mất gói
Internet, nhất là hiệu quả của giải thuật điều khiển tắc nghẽn mà cũng có thể do lỗi sai truyền dẫn nhưng hiện nay lý do chính
TCP sử dụng. Bài báo này khào sát một số giải thuật điều khiển
là vẫn do tình trạng tắc nghẽn trên mạng (hiện nay mạng sử
tắc nghẽn thông dụng dùng trong các hệ điều hành window và
Linux như TCP-Tahoe, TCP-Reno, TCP-NewReno, BIC-TCP và dụng phương tiện truyền dẫn quang rộng rãi nên lỗi truyển dẫn
CUBIC. Trong từng giải pháp, các cơ chế điều khiển cửa sổ tắc thấp).
nghẽn sử dụng các hàm khác nhau được phân tích và so sánh Luồng TCP qua mạng Internet thường đi qua nhiều đường
dựa vào mức độ tận dụng tài nguyên mạng của từng giải pháp.
truyền, liên kết có tốc độ khác nhau. Do đó, tốc độ truyền
Keywords- TCP, Điều khển tắc nghẽn, giải thuật tránh tắc segment trên toàn bộ tuyến được xác định bởi liên kết có tốc
nghẽn, Khởi động chậm . độ thấp nhất. Tắc nghẽn có thể xảy ra ở phía phát của liên kết
này (hàng đợi đầu ra) khi có nhiều segment trong nhiều kết nối
I. GIỚI THIỆU TCP đồng hiện hành cùng tới với tốc độ nhanh hơn tốc độ
Các giải thuật điều khiển tránh tắc nghẽn trong TCP nhằm truyển trên liên kết này. Trong tình huống này, số lượng gói
giải quyết vấn đề sử dụng tài nguyên mạng một cách hiệu quả, trong hàng đợi đầu ra này tăng dần lên cho đến khi bộ đệm
công bằng và giảm thiểu sự mất gói xảy ra. Mỗi kết nối TCP sẽ đầy và xảy ra hiện tượng gói bị loại bỏ. Điều này cũng ảnh
phản ứng với hiện tượng này bằng cách điều chỉnh tải đưa vào hưởng đến các ACK liên quan đến những gói đã mất và như
mạng sao cho vẫn đảm bảo được ở một mức độ hợp lý chất vậy nó có một ảnh hưởng đáng kể đến tổng thời gian truyền
lượng kết nối TCP, giảm thiểu mức độ tắc nghẽn xảy ra trên một bản tin.
mạng và ảnh hưởng của nó. Bên cạnh đó, các giải thuật này Để giảm khả năng xảy ra mất segment, mỗi host TCP phát có
còn đảm bảo sự công bằng trong việc sử dụng tài nguyên mạng một thủ tục điều khiển tắc nghẽn cho mỗi kết nối TCP, thủ tục
giữa các kết nối. Tuy nhiên trong bài báo này chỉ đề cập đến này sử dụng tốc độ đến của các ACK trong một kết nối để ổn
góc độ điều chỉnh mức độ phát của bên phát thông qua điều định tốc độ đưa segment vào Internet. Bên cạnh thủ tục điều
chỉnh cửa sổ tắc nghẽn khiển lưu lượng dùng cửa sổ trượt, mỗi kết nối TCP cũng có
một biến cửa sổ tắc nghẽn Wc kết hợp với thủ tục điều khiển
Phần còn lại của bài báo được tổ chức như sau: trong phần tắc nghẽn này. Mỗi kết nối đều phải duy trì cả 2 biến này và
II, miêu tả về các hoạt động cơ bản trong điều khển tắc nghẽn. chỉ có thể thực hiện truyền một segment trong kết nối khi cả 2
Phần III, IV và V giới thiệu các giải pháp TAHOE, RENO, cửa số này đều trong trạng thái mở (con hạn mức truyền).
NEWRENO. Phần VI và VI giới thiệu các giải thuật cho mạng
tộc độ cao và độ trễ lớn BIC-TCP và CUBIC. Phần VIII cung Như trên đã trình bày, thủ tục điều khiển tắc nghẽn có tác
cấp các kết quả mô phỏng và phân tích lý thuyết. Cuối cùng, là dụng khi xảy ra trường hợp mạng nặng tải và trạng thái luồng
kết luận bài báo trong phần IX. segment được điều khiển chính bởi cửa sổ tắc nghẽn Wc. Còn
trong trường hợp mạng có tải nhẹ thì nó được điều khiển chính
II. ĐIỀU KHIỂN TẮC NGHẼN TRONG TCP bởi cửa sổ phát Ws. Tuy nhiên, một kết nối TCP khi bắt đầu
Cơ chế điều khiển lưu lượng của TCP nhằm tránh hiện tượng truyền do chưa nhận các ACK nên TCP phát không biết được
quá tải/tắc nghẽn ở phía TCP nhận khi tốc độ TCP phát cao mức độ tải hiện hành của mạng. Nên để ngăn tránh việc truyền
hơn tốc độ xử lý ở TCP nhận. Tuy nhiên, nó không giải quyết một khối lượng lớn các segment (lên đến kích thước cửa sổ
được tình trạng tắc nghẽn trên đường truyển khi luồng TCP Ws cực đại đã thỏa thuận giữa 2 đầu phát và nhận) thì kích
được truyền qua mạng (ví dụ Internet). Hiện tượng tắc nghẽn thước của sổ tắc nghẽn Wc được thiết lập ban đầu là 1
trên mạng gây ra do một router hay một gateway trên con segment. Do kích thước Wc tính theo đơn vị byte nên giá trị
đường đi của luồng TCP bị tắc nghẽn trong khoản thời gian tải ban đầu này sẽ bằng với kích thước segment lớn nhất MSS
nặng. Trong khoản thời gian tắc nghẽn này, các bộ đệm dùng (Maximum Segment Size) đã được thỏa thuận giữa 2 đầu thu
phát của kết nối TCP vào lúc thiết lập kết nối.
ISBN: 978-604-67-0635-9 51
51
HộiHội
Thảo Quốc
Thảo GiaGia
Quốc 2015
2015vềvềĐiện
ĐiệnTử,
Tử,Truyền
NghệThông
ThôngTinTin (ECIT
(ECIT 2015)
2015)
Thủ tục điều khiển cửa sổ tắc nghẽn thực hiện khi TCP phát Trong trường hợp mạng có tải nhẹ - có nghĩa là không có liên
bắt đầu pha truyền dữ liệu của một kết nối bằng cách gởi một kết nào trên con đường qua mạng bị tắc nghẽn - thì luồng
segment với kích thước MSS. Sau đó nó khởi tạo một bộ định segment trên kết nối được điều khiển chính bởi Ws miễn sao
thời phát lại RTO (Retransmission TimeOut) cho segment này Wc luôn lớn hơn Ws cực đại. Trong trạng thái này tất cả các
và chờ nhận ACK cho segment này. Nếu thời gian định thời segment được truyền với một độ biến động trễ và độ trễ tương
phát lại hết hạn thì nó sẽ phát lại segment này. Nếu nó nhận đối là hằng số. Tuy nhiên, khi số lượng kết nối trên mạng tăng
được ACK trước thời hạn này thì Wc được tăng lên 2 segment dẫn đến mức độ lưu lượng tăng đến một mức bắt đầu xảy ra
với kích thước mỗi segment là MSS. TCP phát sau đó có thể mất gói thì thủ tục điều khiển tránh tắc nghẽn trên mỗi kết nối
phát 2 segment và mỗi ACK nhận được cho các segment này sẽ bắt đầu điều chỉnh cửa sổ Wc của kết nối sao cho phản ánh
Wc được tăng lên 1 segment (MSS byte). Do đó, TCP phát được mức độ tắc nghẽn.
bây giờ có thể phát 4 segment và cứ tiếp tục như thế Wc sẽ
Khi xảy ra mất gói thủ tục điểu khiển tắc nghẽn ở TCP phát sẽ
tăng theo qui luật hàm mũ. Mặc dù, Wc tăng nhanh như vậy,
phản ứng lại bằng cách điều chỉnh Wc (giảm Wc) tùy vào
nhưng pha này vẫn được gọi là khởi đầu chậm (slow start) vì
trường hợp cụ thể phát hiện ra sự mất gói do nhận được các
nó được tăng từ 1 segment. Việc tăng này được tiếp tục cho
ACK nhân bản hay hết thời hạn của bộ định thời phát lại
đến khi có một sự hết hạn thời gian phát lại của một segment
bị mất, hoặc TCP phát nhận được một ACK nhân bản (nhiều Trường hợp thứ nhất : phát hiện ra mất gói khi nhận được các
ACK giống nhau xác nhận cho cùng một segment), hoặc đạt ACK nhân bản. Việc nhận được ACK nhân bản cho thấy ở
đến mức cao hơn mức ngưỡng SST (Slow Start Threshold). host đích vẫn nhận được các segment. Do đó mức độ tắc
Với mỗi kết nối TCP, SST được thiết lập 64 kbyte. Tuy nghẽn có thể được giả định là nhẹ và vào lúc nhận được ACK
nhiên, trong ví dụ hình 1 giá trị này được giả định ban đầu là nhân bản thứ 3 liên quan đến segment bị mất (thủ tục fast
32 kbyte và nếu MSS là 1 kbyte thì nó bằng với 32 segment. retransmit) thì kích thước của Wc sẽ được giảm phân nữa và
a)
Wc thủ tục tránh tắc nghẽn được thực hiện bắt đầu từ giá trị này.
3 nhân bản
(segment/kbyte)
ACK đầu tiên Thủ tục này được gọi là khôi phục nhanh (fast recovery).
Trong ví dụ trong hình 1 (a) , vào lúc nhận ACK nhân bản thứ
64
3, segment bị mất được phát lại và Wc được thiết lập lại bằng
phân nữa - 32 kbyte - giá trị hiện hành (64 kbyte). Sau đó Wc
được tăng trở lại theo như thủ tục tránh tắc nghẽn. Tuy nhiên,
3 nhân bản
ACK thứ 2
Wc =
khi đạt đến 34 segment (34 kbyte) một segment thứ 2 bị mất
SST= 32
32 34 (giả sử do nhận được ACK nhân bản ACK thứ 3 lần 2) làm
cho Wc lại bị thiết lập lại phân nữa là 17 segment và thủ tục
16 SST= 17 tránh tắc nghẽn lại khởi động lại. Lần này ở giá trị Wc=17
8
segment.
4
2
5 10 20 30 37 40 50
RTT
Trường hợp thứ hai : mất gói được nhận ra do quá hạn bộ định
b) thời phát lại RTO. trong trường hợp này được giả định là mức
Wc
(segment/kbyte)
độ tắc nghẽn xảy ra đến nổi không có segment nào thuộc kết
RTO đầu tiên
nối có thể đi qua mạng. Như ví dụ trong hình 1(b), khi bộ định
64
thời phát lại hết hạn (RTO), Wc được thiết lập lại 1 segment
RTO thứ 2
bất chấp giá trị hiện hành của nó là bao nhiêu và thủ tục slow
start được khởi động lại. Như vậy, khi mức độ tắc nghẽn đạt
đến mức làm quá hạn bộ định thời phát lại thì luồng segment
32 SST= 32
được điều khiển chính bằng Wc
RTO thứ 3
16
8 III. GIẢI PHÁP TCP-TAHOE

4
2
5 10 20 30 40 50
RTT
Hình 1. Điều chỉnh cửa sổ tắc nghẽn : a) Vào lúc nhận các TCP Tahoe là một trong những giải pháp điều khiển tắc nghẽn
ACK nhân bản ; b) Vào lúc hết hạn bộ định thời phát lại RTO trong TCP có sớm nhất do V. Jacobson đề xuất [3]. Giải pháp
này dựa trên đặc tả RFC 793 (TCP chuẩn) và bao gồm một số
Giả sử Wc đạt đến SST cho thấy đường truyền không bị tắc giải thuật được chia thành 3 nhóm : Khắc phục vấn đề ước
nghẽn và do đó thủ tục sẽ bước vào giai đoạn 2. Trong giai lượng thời hạn phát lại (RTO), Tăng cường nhận diện sự mất
đoạn 2 thay vì Wc tăng 1 segment, thì nó chỉ tăng 1/Wc gói nhanh hơn và Các giải thuật tránh tắc nghẽn (CA-
segment cho mỗi ACK nhận được. Như vậy, giai đoạn này Congestion Avoidance) và khởi động chậm (SS-Slow Start).
Wc sẽ tăng 1 segment khi nhận được một tập Wc ACK. Pha
này được gọi là pha tránh tắc nghẽn và trong pha này việc tăng Cải tiến đầu tiên : Nếu giá trị RTO được ước lượng quá cao thì
Wc mang tính cộng. Giai đoạn này tiếp tục cho đến khi Wc viện nhận ra sự mất gói sẽ quá bảo toàn và hiệu suất của các
đạt được đến một mức ngưỡng thứ 2 – trong ví dụ này là 64 luồng TCP riêng biệt có thể suy giảm nghiêm trọng. Trong
kbyte – thì Wc sẽ được duy trì không đổi ở giá trị này. trường hợp ngược lại, khi giá trị RTO được ước lượng không
52
52
HộiHội
Thảo Quốc
Thảo QuốcGia
Gia2015
2015về
vềĐiện
Điện Tử,
Tử, Truyền
Nghệ Thông
(ECIT 2015)
2015)
đúng mức thì cơ chế phát hiện lỗi có thể gây ra tình trạng phát không đáng kể (<< 1%), đầu phát có thể xử lý tất cả các sự
lại không cần thiết, lãng phí các tài nguyên mạng dùng chung mất gói nhận biết được như là các chỉ thị tắc nghẽn. Hơn nữa,
và làm cho sự tắc nghẽn trên toàn mạng tồi tệ hơn. Do thực tế việc nhận được bất kỳ một gói ACK nào đều cho biết mạng có
không thể phân biệt giữa một ACK cho gói phát lần đầu hay thể nhận và truyền ít nhất một gói mới (vì một gói được ACK
cho gói phát lại nên việc tính toán RTO phức tạp hơn. đã rời mạng). Như vậy, đầu phát có thể gởi ít nhất một số
lượng dữ liệu vừa được xác nhận. Sự cân bằng vào-ra này
Giải thuật ước lượng sự biến động độ trễ đi-về rttvar (round- được gọi là nguyên lý bảo toàn gói và là nguyên lý cốt lõi của
trip variance) cố gắng giảm bớt vấn đề ước lương quá cao. 2 giải thuật SS và CA.
Thay vì sử dụng mối quan hệ tuyến tính giữa RTO và giá trị
ước lượng RTT βxSRTT (RFC 793) sau Trong giải thuật SS, khi nhận được một ACK đầu phát có thể
gởi gấp đôi số lượng dữ liệu đã được xác nhận bởi ACK này
RTO = min[Ubound,max[Lbound,( β x SRTT)]] (1) (tăng theo cấp bội). Như vậy, thay vì phát triển một bước theo
Với số lượng gói tồn đọng (hình 2) giống như trong đặc tả ban đầu
SRTT = ( α x SRTT ) + ((1- α ) x RTT) (2) (RFC 793) thì giải thuật SS phát triển cửa sổ theo một hàm mũ
SRTT : Smoothed RTT (hình 3). Nếu nhận ra một gói bị mất(có nghĩa mạng đang
Ubound : giới hạn trên của thời hạn phát lại trong tình trạng tắc nghẽn) thì của số tắc nghẽn sẽ được thiết
Lbound : giới hạn dưới của thời hạn phát lại lập lại giá trị ban đầu (bằng một) để đảm bảo giải tỏa các tài
α : hằng số nhuyễn ( 0,8 – 0,9) nguyên mạng. Đồ thị trong hình 3 cho thấy 2 trường hợp biến
β : hằng số biến động trễ ( 1,3-2,0) động cửa sổ tắc nghẽn : đồ thị a biểu diễn trường hợp khi đầu
nhận không thể xử lý theo tốc độ nhận và đồ thị b cho thầy
TCP Tahoe tính toán ước lượng biến động RTT thiết lập một những biến động cửa sổ tắc nghẽn khi mạng không thể phân
giới hạn trên cho RTO (SRTT + 4rttvar) như sau phối mọi gói thành công ở tốc độ truyền dẫn.
RTO = min [SRTT+4rttvar, max[Lbound, [β x SRTT)]] (3)

Giới hạn đầu nhận
Sự ước lượng RTO không đúng mức được giải quyết bằng (cửa sổ)
cách nhân đôi giá trị RTO khi có mỗi sự kiện phát lại. Nói
cách khác, trong quá trình xảy ra tắc nghẽn nghiêm trọng, khi
Số gói tồn đọng
nhận ra chuỗi mất gói liên tục thì RTO được tăng theo hàm
cực đại
Chuyển dữ liệu
mũ . Việc này làm giảm đáng kể tổng số gói phát lại và giúp cực đại
ổn định trạng thái mạng
Cải tiến thứ 2 : Tăng cường việc nhận ra mất gói. đặc tả TCP Thời gian
đầu tiên dùng RTO là cơ chế nhận ra mất gói duy nhất. Mặc Hình 2. Biến động số lượng gói tồn đọng trong RFC 793
dù RTO đủ tin cậy để nhận ra sự mất gói nhưng nó không đủ
nhanh để phản ứng lại sự mất gói này. Rõ ràng, thời gian tối Giới hạn đầu nhận
thiểu để nhận ra mất gói là RTT, nghĩa là nếu đầu nhận TCP
Giới hạn mạng Giới hạn mạng
có thể nhận ra tức thời và báo cáo một sự kiện mất gói cho đầu
phát TCP thì báo cáo này sẽ đến đầu phát trong thời gian Giới hạn đầu nhận
Cửa sổ tắc nghẽn
chính xác một RTT sau khi đầu phát gởi gói bị mất. RTO, theo
định nghĩa, lớn hơn RTT. Mặt khác, nếu đầu thu được yêu
cầu đáp ứng lại ngay tức thời tất cả những gói dữ liệu đến
không đúng thứ tự bằng cách báo cáo gói đúng thứ tự nhận
được sau cùng (ACK nhân bản) thì sự mất gói có thể nhận biết
được hầu như trong khoản thời khoản RTT (nhỏ hơn RTO).
Nói cách khác, giả định xác suất sắp xếp lại thứ tự và nhân
bản gói trong mạng không đáng kể thì các ACK nhân bản có Thời gian Thời gian
thể được xem như là một chỉ thị mất gói tin cậy. Như vậy với
a) b) Nhận ra mất gói
chỉ thị mất gói mới này thì đầu phát có thể phát lại gói mất mà
không cần phải chờ đến sự kiện quá hạn RTO.
Hình 3. Biến động cửa số tắc nghẽn của SS nếu giới hạn
Cải tiến thứ 3 : đây là cải tiến quan trọng nhất. Nó bao gồm được tác động bởi điều khiển lưu lượng cũ (a) và bởi mạng (b)
các giải thuật khởi động chậm (SS) và Tránh tắc nghẽn (CA) .
Những giải thuật này cho phép một đầu phát TCP nhận ra các Tính hiệu quả của giải thuật có thể được định nghĩa là tỉ số
tài nguyên mạng khả dụng và điều chỉnh tốc độ truyền của giữa vùng bên dưới của đồ thị cửa sổ tắc nghẽn và vùng bên
luồng TCP đến các giới hạn tài nguyên mà nó nhận biết được. dưới đường giới hạn mạng (hình 3). Rõ ràng khi tài nguyên
Giả sử xác suất hư hỏng gói ngẫu nhiên trong truyền dẫn là mạng khả dụng thấp hơn giới hạn ấn định bởi đầu nhận (đồ thị
53
53
HộiHội
Thảo Quốc
Thảo Gia
Quốc 2015
Gia 2015về
vềĐiện
ĐiệnTử,
Tử,Truyền
NghệThông
ThôngTinTin (ECIT
(ECIT 2015)
2015)
b trong hình 3), hiệu suất của giải thuật SS trong một khoản Nhận ra mất gói
thời gian dài rất thấp. Giới hạn mạng

Giải thuật thứ hai trong nhóm này là tránh tắc nghẽn CA. Mục
đích của giải thuật này nhằm cải tiến hiệu suất của TCP trong
trường hợp tài nguyên mạng giới hạn, có khả năng xảy ra hiện
tượng cổ trai truyền dẫn. So với giải thuật khởi động chậm thì
giải thuật này dè dặt nhiều hơn trong đáp ứng cho những gói
ACK nhận được và với việc nhận ra mất gói. Nếu tất cả các
gói đã được giao thành công trong khoản thời gian RTT thì Thời gian
SS SS CA SS
thay vì nhân đôi cửa sổ tắc nghẽn như trong giai đoạn SS thì
giải thuật CA chỉ tăng 1 (tăng cộng). Và khi có sự mất gói xảy
ra, thay vì khởi động lại với kích thước 1 gói thì cửa sổ tắc Hình 5. Biến động cửa sổ tắc nghẽn của tổ hợp 2 giải thuật SS
nghẽn chỉ đơn giản giảm phân nữa so với kích thước hiện và CA
hành (ngay trước khi sự mất gói xảy ra). Theo phân tích của
Jacobson [3] để đạt được mạng không có tắc nghẽn thì việc IV. GIẢI PHÁP TCP RENO
giảm phân nữa cửa sổ tắc nghẽn bởi các luồng riêng biệt là đủ. Trong TCP Tahoe, việc giảm cửa sổ tắc nghẽn về 1 khi có sự
Cách giảm có tính nhân này giống như hành vi hàm mũ khi mất gói xảy ra là một việc khá hà khắc và trong một vài
nhiều gói liên tiếp bị mất (trạng thái tắc nghẽn kéo dài). Theo trường hợp có thể dẫn đến sự suy giảm độ thông xuất nghiêm
như trong hình 4, Giải thuật CA này đúng là có hiệu quả trong trọng. Ví dụ, với tỉ lệ mất gói 1% có thể gây ra sự suy giảm
thời gian dài nhưng bù lại thì thời gian tìm ra tài nguyên mạng đến 75% độ thông xuất của một luồng TCP chạy giải thuật
của nó lại chậm do tốc độ tăng kích thước cửa sổ của nó mang Tahoe [4]. Để giải quyết vấn đề này, Jacobson đã đưa ra khái
tính dè dặt. niệm về sự khác biệt giữa những sự kiện tắc nghẽn nhẹ và tắc
nghẽn nghiêm trọng và đồng thời đã hiệu chỉnh lại các giải
thuật khởi động chậm và tránh tắc nghẽn.
Nhận ra mất gói
Sự nhận ra mất gói thông qua thời hạn phát lại RTO cho thấy
Giới hạn mạng
trong một khoản thời gian nhất định (ví dụ RTO-RTT) một sự
kiện tắc nghẽn nghiêm trọng nào đó đã ngăn cản việc truyền
bất kỳ gói nào trên mạng. Vì vậy, bên phát TCP sẽ áp dụng
chính sách bảo toàn thiết lập lại cửa sổ tắc nghẽn tới một giá
trị tối thiểu.
Một cách khác có thể nhận ra mất gói bằng các ACK nhân
Thời gian bản. Giả sử bên phát TCP nhận được 4 ACK, ACK đầu tiên
xác nhận cho gói dữ liệu mới nào đó, 3 ACK còn lại là các bản
copy chính xác của ACK đầu tiên. Các ACK nhân bản cho
Hình 4. Biến động cửa sổ tắc nghẽn và hiệu quả của giải thuật
thấy những gói nào đó đã bị lỗi. Tuy nhiên, sự hiện diện của
tránh tắc nghẽn CA
mỗi gói ACK (bao gồm ACK nhân bản) cho biết một gói dữ
liệu đã đến đích thành công. Hơn nữa, phía phát bên cạnh việc
Giải thuật TCP Tahoe gồm cả 2 giải thuật SS và CA hoạt động
nhận ra mất gói nó cũng quan sát khả năng của mạng trong
riêng biệt. Nó tổ hợp cả khám phá nhanh tài nguyên mạng
việc phân phối dữ liệu. Như vậy, trong trường hợp này trạng
(SS) và hiệu suất dài hạn (CA). Để chuyển giữa 2 pha giải
thái của mạng có thể được xem là bị tắc nghẽn nhẹ, và phản
thuật này, một mức ngưỡng ssthresh được định nghĩa. Mức
ứng với sự kiện mất gói có thể lạc quan hơn. Trong TCP
ngưỡng này xác định kích thước cực đại của cửa sổ tắc nghẽn
Reno, phản ứng lạc quan này là sử dụng giải thuật khôi phục
trong pha khởi động chậm SS, và nếu có bất kỳ sự mất gói xảy
nhanh FR (Fast Recovery).
ra thì ssthreh được điều chỉnh về phân nữa kích thước cửa sổ
tắc nghẽn hiện hành. Khi nằm trong giai đoạn của giải thuật
Ý định của FR là giảm phân nữa cửa sổ tắc nghẽn và thực hiện
SS và có một sự mất gói được nhận biết thì bản thân cửa sổ
thăm dò tài nguyên mạng cho đến khi lỗi được khắc phục. Hay
luôn thiết lập lại ở giá trị tối thiểu (=1). Ngay khi giá trị cửa sổ
nói một cách khác, bên phát nằm trong trạng thái khôi phục
tắc nghẽn thấp hơn ssthreh, pha SS được thực hiện. Khi cửa sổ
nhanh cho đến khi nó nhận được gói ACK không nhân bản.
lớn hơn mức ngưỡng này, giải thật CA được sử dụng. Đây là
Các giai đoạn của giải thuật được minh họa trong hình 6. Các
gọi là chu trình SS-CA (hình 5)
kích thước cửa sổ tắc nghẽn trong các trạng thái khác nhau
được biểu thị bởi các đoạn bên trên các đường trạng thái, và
các mũi tên biểu thị kích thước cửa sổ hiệu lực hay số lượng
gói đang được chuyển tiếp.
54
54
HộiHội
Thảo Quốc
Thảo QuốcGia
Gia2015
2015về
vềĐiện
Điện Tử,
Tử,Truyền
Nghệ Thông
Thông TinTin (ECIT
(ECIT 2015)
2015)
Sự chuyển từ trạng thái 1 sang trạng thái 2 biểu thị sự giảm Kết quả những biến động cửa sổ tắc nghẽn lý thuyết của TCP
việc sử dụng tài nguên mạng dùng chính sách giảm gấp bội. Reno biểu diễn trong hình 7. So với nững biến động của TCP
Sau khi giảm phân nữa (Wc/2), giải thuật không chỉ phát lại Tahoe, bằng cách thay các giai đoạn khởi động chậm SS sau
gói dữ liệu chưa được xác nhận cũ nhất mà còn’thổi phồng’ mỗi sự kiện mất gói bằng các giai đoạn phát lại nhanh FR
cửa sổ theo số lượng gói ACK nhân bản (trang thái 2 sang ngắn hơn, TCP Reno đạt hiệu quả trong trạng thái ổn định cải
trạng thái 3). Như chúng ta đã biết, một ACK sẽ chỉ thị ít nhất thiện đáng kể.
một gói dữ liệu đã được giao thành công. Như vậy, nếu chúng
ta muốn duy trì một số lượng gói không đổi đang được chuyển Thực ra, Việc khôi phục từ một sự mất gói đơn sẽ luôn hoàn
tiếp, chúng ta phải thổi phồng cửa sổ tắc nghẽn để mở một vị thành trong một RTT. Tuy nhiên, hiệu suất được cải thiện
trí gởi dữ liệu mới (trạng thái 4). Nếu không có sự tăng này thì không chỉ bởi rút ngắn giai đoạn khôi phục, mà còn bởi việc
các gói dữ liệu mới không thể được gởi trước khi lỗi được cho phép truyền dữ liệu trong giai đoạn khôi phục
khắc phục, và số lượng gói đang được chuyển tiếp có thể giảm
nhiều hơn mong đợi. V. GIẢI PHÁP TCP NEWRENO
Dữ liệu đã Dữ liệu đã phát chờ Dữ liệu được Một trong những điểm yếu của giải thuật FR trong TCP Reno
được ACK ACK đệm chờ phát
sẽ bộc lộ khi nhiều gói mất xảy ra trong một sự kiện tắc nghẽn
Wc
Ngay trước khi đơn lẽ. Điều này làm giảm đáng kể hiệu năng của TCP Reno
Trạng thái 1 nhận ra mất gói
trong những môi trường tải nặng. Khi một một sự kiện tắc
Wc/2 Ngay sau khi nghẽn đơn lẽ (đột biến lưu lượng trong một khoản thời gian
nhận ra mất gói
Trạng thái 2 ngắn) gây ra mất nhiều gói dữ liệu. Phản ứng giảm phân nữa
Wc/2+#dup Wc “phình ra” theo số lượng cửa số tắc nghẽn của FR đột nhiên chuyển thành một sự giảm
Trạng thái 3
ACK nhân bản nhận được
cửa cổ tắc nghẽn theo quy luật hàm mũ mang tính thận trọng.
Wc/2+#dup
Các ACK nhân bản có thêm Sự mất gói đầu tiên gây ra giải thuật bắt đầu vào giai đoạn
Trạng thái 4 làm Wc “phình ra” thêm khôi phục và giảm phân nữa cửa sổ tắc nghẽn. sau đó nếu
Wc/2 nhận được một ACK không nhân bản thì giải thuật sẽ kết thúc
Trạng thái 5
Sau khi khôi phục thành công qua trình khôi phục. Tuy nhiên, các sự mất tiếp theo sẽ gây ra
cửa sổ tắc nghẽn tiếp tục giảm thêm nữa theo cùng một cơ chế
Dữ liệu tồn đọng không được phép phát lại vào và thoát trạng thái khôi phục như trường hợp mất gói đầu
Số lượng dữ liệu mới được phép gởi đi do tiên trong chuỗi mất gói này.
cửa sổ tắc nghẽn “xã hơi”
Số lượng dữ liệu tới đầu nhận thành công,
suy ra từ các ACK nhân bản nhận được
Kích thước cửa sổ tắc
nghẽn là tổng của 2 thành
Theo một ý nghĩa nào đó, việc phản ứng theo quy luật hàm mũ
Số lượng gói đang chuyển tiếp phần này này đối với nhiều sự mất gói là mong muốn của các giải thuật
tránh tắc nghẽn với mục đích giảm sự tiêu thụ tài nguyên
Hình 6. Các trạng thái tiêu biểu của FR mạng trong những tình trạng tắc nghẽn nghiêm trọng. Nhưng
sự mong muốn này dựa trên giả định các trạng thái tắc nghẽn
Trong trạng thái cuối cùng (trạng thái 5), khi một gói ACK độc lập nhau và trong ví dụ trên thì điều này không đúng. Có
không nhân bản được nhận, chúng ta muốn khôi phục lại hoạt khả năng cao tất cả sự mất gói trong nhóm dữ liệu ban đầu
động tránh tắc nghẽn với phân nữa cửa sổ tắc nghẽn ban đầu. (những gói dữ liệu còn tồn đọng vào lúc xảy ra sự mất gói)
Với xác suất cao, các ACK không nhân bản này sẽ xác nhận được gây ra bởi cùng một sự kiện mất gói đơn lẽ. Như vậy,
việc giao thành công tất cả các gói dữ liệu tồn đọng suy luận các sự mất gói thứ hai, thứ ba trong ví dụ trên nên được xử lý
từ các ACK nhân bản nhận được trước đây. Ở thời điểm này, như là một yêu cầu phát lại dữ liệu chứ không phải như là
việc giảm cửa số tắc nghẽn tới Wc/2 (giá trị ngay trước khi những chỉ báo tắc nghẽn. Hơn nữa, việc giảm cửa sổ tắc nghẽn
vào giai đoạn khối phục -trang thái 2) là một cách thức tin cậy không đảm bảo sẽ giải phóng tài nguyên mạng ngay tức thời
và đơn giản để đảm bảo mục tiêu thoát trạng thái khôi phục do tất cả gói dữ liệu được phát trước khi giảm cửa sổ vẫn đang
nhanh FR. được chuyển tiếp. Vì vậy, trước khi kích thước cửa sổ tắc
nghẽn mới có hiệu lực, ta không nên áp dụng thêm bất kỳ
Nhận ra mất gói
chiến lược giảm nào nữa. Điều này có thể hiểu là việc giảm
cửa sổ tắc nghẽn không nên thường xuyên hơn một lần trong
Giới hạn mạng

khoản thời gian độ trễ lan truyền một chiều hay xấp xỉ RTT/2.
ssthresh Floyd et al. [7] đưa ra một sự cải tiến đơn giản giải thuật khôi
phục nhanh FR. Sự cải tiến này nhằm giải quyết sự không
tường minh của các sự kiện tắc nghẽn bằng cách trì hoãn việc
thoát khỏi giai đoạn khôi phục cho tới khi tất cả các gói dữ
Thời gian
SS FR CA liệu trong giới hạn cửa sổ tắc nghẽn ban đầu (ngay khi tắc
nghẽn xảy ra) được xác nhận. Giải thuật NewReno bổ sung
Hình 7. Những biến động cửa sổ tắc nghẽn của TCP Reno thêm một biến trạng thái đặc biệt để nhớ số thứ tự của gói dữ
55
55
HộiHội
Thảo Quốc
Thảo QuốcGia
Gia2015
2015về
vềĐiện
Điện Tử,
Tử,Truyền
Nghệ Thông
Thông TinTin (ECIT
(ECIT 2015)
2015)
liệu sau cùng được gởi đi trước khi vào trạng thái khôi phục BIC-TCP (Binary Increase Congestion Control – TCP) mở
nhanh FR. Giá trị này giúp phân biệt giữa ACK nội bộ (ACK rộng NewReno thêm một một giai đoạn hội tụ nhanh RC
cho các gói tồn đọng) và ACK cho dữ liệu mới. Việc nhận (Rapid Convergence). Trong giai đoạn này, BIC-TCP sử dụng
được một ACK cho gói dữ liệu mới có nghĩa là tất cả các gói cách thức tìm kiếm nhị phân để khám phá nhanh kích thước
được gởi trước khi nhận ra lỗi đã được giao thành công và bất cửa sổ tắc nghẽn tối ưu (giá trị tương ứng với tài nguyên mạng
kỳ một sự mất gói mới nào sẽ chỉ báo một sự kiện tắc nghẽn khả dụng) bằng cách xem sự nhận biết mất gói như là một chỉ
mới. Một ACK nội bộ xác nhận sự khôi phục từ chỉ một lỗi sai báo cửa sổ tắc nghẽn có kích thước qua mức.
đầu tiên và chỉ báo thêm nhiều sự mất gói trong bó gói đầu
tiên.
Wmax

Dữ liệu đã Dữ liệu đã phát chờ Dữ liệu được
được ACK ACK đệm chờ phát
XX
Wc
Ngay trước khi
Trạng thái 1 nhận ra mất gói Giới hạn mạng
Wc/2 Ngay sau khi Wmin

Trạng thái 2 nhận ra mất gói
#dup+Wc/2 Phát lại gói mất . Mỗi ACK

nhân bản ‘thổi phồng’ Wc
Trạng thái 3
Thời gian
#dup+Wc/2-ACK ACK nội bộ làm giàm cwnd,
các gói trước khi nhận
Trạng thái 4
Hình 9. Tìm kiếm nhị phân để đạt kích thước cửa sổ tối ưu.
#dup+Wc/2-ACK Phát lại gói bị mất ( ). Wc vẫn
duy trì không đổi
Trạng thái 5
Trong khi mạng giao các gói dữ liệu thành công (bên phát
#dup+Wc/2-ACK
Các ACK nhân bản chỉ làm
nhận được ACK trong khoảng RTT) cửa sổ tắc nghẽn được
Trạng thái 6 Wc “phình ra” thêm cập nhật đến điểm giữa (giá trị trung bình) trong dãy tìm kiếm
Wc/2 giữa kích thước cửa sổ tối thiểu Wmin (không có sự mất gói
Thoát trạng thài khôi phục và làm
Trạng thái 7 giảm Wc khi nhận được trong khoản RTT) và kích thước cửa sổ cực đại Wmax (giá trị
có sự mất gói xảy ra). Khi có một chỉ báo giao dữ liệu thành
X Mất gói do sự kiện tắc nghẽn thấp công (nhận được ACK không nhân bản) thì Wmin được tăng
Nhận ra mất gói (3 ACK nhân bản) lên giá trị cửa sổ trước đó (gía trị cửa sổ khi mạng không có
Phát lại gói tắc nghẽn). Sau khi cửa sổ tăng đến điểm giữa, nếu mạng
ACK không nhân bản
không có mất gói xảy ra thì có nghĩa rằng mạng có thể xử lý
nhiều lưu lượng hơn và như vậy có thể thiết lập điểm giữa là
Số lượng dữ liệu tới đầu nhận thành công,
biết được từ các ACK nhân bản nhận được
Kích thước cửa sổ tắc
nghẽn là tổng của 2 thành
một giá trị Wmin mới. và thực hiện một sự tìm kiếm khác với
Số lượng gói đang chuyển tiếp phần này giá trị Wmin và Wmax mới. Ngay khi nhận ra mất gói ( ví dụ
nhận được 3 ACK nhân bản) thì Wmax được thiết lập bằng gía
trị cửa sổ hiện hành (giá trị khi mạng có tắc nghẽn) và vào giai
Hình 8. Các trạng thái của giải thuật khôi phục nhanh FR của đoạn khôi phục nhanh như trong NewReno. Với cách thực
TCP NewReno hiện này, cửa sổ tăng rất nhanh khi kích thước cửa sổ hiện
Hình 8 minh họa sự biến động kích thước cửa sổ tắc nghẽn hành cách xa giá trị tương ứng với dung lượng của đường
trong NewReno. Tương tự với giải thuật Reno, việc nhận bất truyền (giá trị xảy ra mất gói trước đó). Còn nếu gần với giá trị
kỳ các gói ACK nhân bản đều chỉ kích khởi việc ‘thổi phồng’ này thì nó sẽ giảm chậm mức độ tăng kích thước . Mức độ
cửa sổ tắc nghẽn (các trạng thái 3,4,6) . Một ACK nội bộ cho tăng cửa sổ nhỏ nhất ở điểm bảo hòa và số lượng quá mức của
biết chính xác về phần nào đó dữ liệu đã được giao thành nó vượt qua điểm bảo hòa với sự mất gói rất nhỏ. Toàn bộ
công. Như vậy, phản ứng với ACK nội bộ chỉ là một sự giảm hàm phát triển cửa sổ này đơn giản là một hàm logarit lõm.
bớt cửa sổ tắc nghẽn (trạng thái 4) và một sự phát lại gói dữ Hàm lõm này giữ cho cửa sổ tắc nghẽn ở điểm bảo hòa lâu và
liệu chưa được xác nhận kế tiếp (trạng thái 5). Cuối cùng, cân bằng hơn nhiều so với các hàm tuyến tính và hàm lồi (các
việc thoát khỏi giai đoạn khôi phục nhanh FR chỉ có thể thực hàm này có mức tăng cửa sổ lớn nhất ở điểm bảo hòa và như
hiện khi bên phát nhận được một ACK cho gói dữ liệu mới vậy gây ra sự quá mức lớn nhất về kích thước cửa sổ ở thời
và kèm theo đó là việc giảm kích thước cửa sổ hoàn toàn. điểm mất gói xảy ra. Đặc tính này giúp cho BIC-TCP rất ổn
định.
VI. GIẢI PHÁP BIC-TCP
Tuy nhiên, việc tăng đến điểm giữa có thể tăng quá nhiều
trong một RTT, vì thế nếu khoảng cách giữa điểm giữa và
Wmin hiện hành lớn hơn một hằng số cố định nào đó Smax thì
BIC-TCP sẽ tăng cửa sổ theo Smax. Nếu không có sự mất gói
xảy ra ở kích thước cửa sổ cập nhật này, thì kích thước cửa sổ
này trở thành giá trị Wmin mới. Tiến trình này tiếp tục cho
56
56
HộiHội
Thảo Quốc
Thảo QuốcGia
Gia2015
2015về
vềĐiện
Điện Tử,
Tử,Truyền
Nghệ Thông
Thông TinTin (ECIT
(ECIT 2015)
2015)
đến khi độ tăng cửa sổ này ít hơn một hằng số nhỏ Smin nào VII. GIẢI PHÁP CUBIC
đó và lúc này kích thước cửa sổ được thiết lập tới giá trị cực
đại hiện hành (Wmax). Như thế, sau khi thực hiện giảm cửa sổ CUBIC là một biến thể của BIC-TCP. Tên gọi của giải thuật
do tắc nghẽn, hàm phát triển cửa sổ này sẽ hầu như phù hợp này xuất phát từ hàm phát triển cửa sổ của nó là một hàm
với một hàm tuyến tính (giai đoạn tăng cộng) theo sau bởi một cubic. Dạng của hàm này rất giống với hàm phát triển cửa sổ
hàm logarithmic (giai đoạn tìm kiếm nhị phân). của BIC-TCP. CUBIC sử dụng hàm cubic theo thời gian trôi
qua từ sự kiện tắt nghẽn mới nhất. Trong khi hầu hết các giải
Nếu kích thước cửa sổ tăng quá giá trị cực đại, kích thước cửa thuật sử dụng hàm tăng lồi khi có sự kiện mất gói xảy ra, mức
số cân bằng phải lớn hơn giá trị cực đại hiện hành và một giá độ tăng cửa sổ là luôn luôn tăng, CUBIC sử dụng cả 2 giai
trị cực đại mới được thiết lập. BIC-TCP vào một giai đoạn đoạn lõm và lồi của hàm CUBIC.
mới gọi là thăm dò giá trị cực đại. Giai đoạn thăm do cực đại
sử dụng một hàm phát triển cửa sổ đối xứng chính xác với sự Chi tiết của hoạt động của CUBIC như sau. Khi có sự mất gói
phát triển trong giai đoạn tăng cộng và tìm kiếm nhị phân. xảy ra CUBIC thiết lập Wmax bằng kích thước cửa sổ nơi sự
Hình-10a biểu diễn hàm phát triển này trong giai đoạn thăm kiện mất gói xảy ra và thực hiện giảm kích thước cửa sổ theo
dò giá trị cực đại. Trong quá trình thăm dò, kích thước cửa sổ bội số với hệ số β ( hằng số giảm kích thước cửa sổ), thực hiện
ban đầu phát triển chậm để tìm giá trị cực đại cận kề, và sau giai đoạn khôi phục nhanh thông thường và phát lại của TCP.
một khoản thời gian phát triển chậm mà không tim thấy giá trị Sau đó nó vào giai đoạn tránh tắc nghẽn, bắt đầu tăng cửa sổ
cực đại mới (không có sự mất gói xảy ra) thì nó đoán giá trị dùng giai đoạn lõm của hàm cubic. Hàm cubic được thiết lập
cực đại mới nằm xa vị trí hiện hành và nó chuyển sang tăng có giai đoạn bằng phẳng của nó ở Wmax, như vậy hàm lõm sẽ
nhanh hơn bằng cách chuyển sang tăng cộng. Trong quá trình phát triển tiếp tục cho tới khi kích thước cửa sổ bằng Wmax.
này kích thước cửa sổ được tăng với mức tăng cố định. BIC- Giải thuật tiếp tục chuyển sang phần lồi của hàm cubic và bắt
TCP có hiệu năng tốt là nhờ sự tăng chậm quanh giá trị Wmax đầu giai đoạn phát triển cửa sổ lồi. Cách điều chỉnh cửa sổ này
và tăng tuyến tính trong quá trình tăng công và thăm dò giá trị (lõm và sau đó lồi) cải thiện giao thức và độ ổn định của mạng
cực đại. nhưng vẫn duy trì sự tận dụng mạng cao [8]. Điều này là do
Tăng
cộng
Tìm kiếm kích thước cửa sổ duy trì hầu như là hằng số, hình thành một
nhị phân
sự bình ổn quanh giá trị Wmax nơi mà được xem như hiệu quả
sử dụng mạng cao nhất và trong trạng thái ổn định, hầu hết
Wmax những mẫu kích thước cửa sổ của CUBIC là gấn với Wmax,
như vậy nó đẩy mạnh việc tận dụng mạng cao và ổn định giao
thức.
Thăm dò cực đại
Hàm phát triển cửa sổ CUBIC sử dụng hàm sau :

a) Hàm phát triển cửa số BIC-TCP
𝑊𝑊(𝑡𝑡) = 𝐶𝐶(𝑡𝑡 𝑡 𝑡𝑡)3 + 𝑊𝑊𝑊𝑊𝑊𝑊𝑊𝑊 (4)
Trạng thài ổn định
C: là một thông số CUBIC
t : thời gian trôi qua từ sự giảm kích thước cửa sổ gần
Wmax nhất
K : khoản thời gian hàm W(t) tăng W đến Wmax khi
Thăm dò cực đại không có thêm sự mất gói xảy ra
Wmax : Kích thước cửa sổ tắc nghẽn ngay trước khi nhận
ra sự kiện mất gói gần nhất
b) Hàm phát triển cửa số CUBIC
Hình 10. Các hàm phát triển cửa sổ BIC-TCP và CUBIC K được tính theo công thức sau ;
BIC-TCP đạt được tính linh hoạt tốt trong mạng tốc độ cao, 3 Wmaxβ
công bằng giữa các luồng và ổn định do sự dao động cửa sổ K= √ (5)
C
thấp. Tuy nhiên, hàm phát triển của nó có thể vẫn quá mạnh β : Hệ số giảm bội số
đối với TCP., đặc biệt trong trường hợp mạng tốc độ chậm và
có RTT nhỏ. Hơn nữa nhiều giai đoạn khác nhau (tăng nhị Vào lúc nhận một ACK trong giai đoạn tắc nghẽn, CUBIC
phân, tham dò giá trị cực đại, Smax và Smin) của quá trình tính toán tốc độ phát triển cửa sổ trong giai đoạn RTT kế dùng
điều khiển cửa sổ làm tăng độ phức tạp khi thực hiện giao thức công thức (4). Nó thiết lập W(t+RTT) như là giá trị mục tiêu
và phân tích hiệu năng của nó. Để giải quyết những vần đề dự kiến của cửa sổ tắc nghẽn. Giả sử kích thước cửa sổ tắc
này, CUBIC đã được giới thiệu như là một biến thể của BIC- nghẽn hiện hành là Wc. Phụ thuộc vào giá trị của Wc, CUBIC
TCP với sự điều khiển cửa sổ đơn giản và tăng cường tình thực hiện trong 3 phương thức khác nhau. Đầu tiên, nếu Wc
công bằng giữa các luồng TCP trong việc sử dụng tài nguyên nhỏ hơn kích thước cửa sổ mà TCP chuẩn đạt được ở thời
mạng khi có tắc nghẽn xảy ra điểm t sau sự kiện mất gói gần nhất, thì CUBIC nằm trong mô
57
57
HộiHội
hình TCP. Ngược lại, nếu Wc thấp hơn Wmax, thì CUBIC chỉ thị bởi một RTO, giải thuật khởi động chậm (SS) và Wc
năm trong vùng lõm, và nếu Wc lớn hơn Wmax thì CUBIC được thiết lập về một segment.
nằm trong vùng lồi. Đồ thị trong hình-13 biểu diễn biến động của kích thước cửa
sổ tắc nghẽn trong ngữ cảnh Reno. Trong giải thuật Reno khi
Khi nhận được một ACK trong giai đoạn tránh tắc nghẽn, tắc nghẽn xảy ra thì giải thuật khôi phục nhanh (FR) được
CUBIC sẽ kiểm tra xem giao thức có nằm trong vùng TCP thực hiện nên Wc không thiết lập lại ở giá trị 1 segment như
hay không. Để trả lời câu hỏi này, đầu tiên phải phân tích kích trong Tahoe mà được thiết lập giá trị 3 segment (4886 byte ).
thước cửa sổ của TCP theo thời gian trôi qua t . Kích thước
cửa sổ trung bình của giải thuật tăng công giảm bội số AIMD
(sử dụng trong TCP chuẩn Reno) với hệ số cộng α, hệ số nhân
β và xác suất mất gói p được tính theo công thức sau.
1 α 2−β 1
x√ x x (6)
RTT 2 β p
Kích thước cửa sổ trung bình của TCP với α = 1 và β = 0,5 là
1 3 1
x√ x (7)
RTT 2 p
Hình-12 biến động cửa sổ tắc nghẽn của giải thuật Tahoe
Như vậy để phương trình (6) giống với (7) thì α phải bằng
3β/2-β . Nếu TCP tăng cửa sổ lên α trong khoảng RTT thí kích
thước cửa sổ theo thời gian trôi qua t sẽ là
β t
Wtcp(t) = Wmax(1 − β) + 3 x (8)
2−β RTT
Nếu Wc nhỏ hơn Wtcp(t), thì giao thức nằm trong phương
thức TCP và Wc được thiết lập giá trị Wtcp(t) mỗi lần nhận
được ACK
VIII. KẾT QUẢ

Hình-13 Biến động cửa sổ tắc nghẽn của giải thuật Reno
Mô phỏng được thực hiện trên một mạng giả lập gồm 2 subnet Trong ngữ cảnh Cubic độ mất gói trong mạng Internet vẫn là
(HN và HCMC) và mạng Internet. Subnet HCMC bao gồm 0,5% những độ trễ lan truyền một chiều được thiết lập 100ms
một FPT server kết nối vào mạng Internet thông qua một (mạng độ trễ cao, ví dụ vệ tinh). Hình-14 biểu diễn sự biến
Router . Tương tự, subnet HN gồm một Client và Router_HN động cửa sổ tắc nghẽn của giải thuật Cubic, kết quả cho thấy
kết nối vào Internet. Luồng lưu lượng trong mô phỏng là hàm cubic được thể hiện qua những vùng lõm hoặc lõm và lồi
luồng FPT truyền qua giao thức TCP từ FPT server đến Client.
Với các giải thuật điều khiển tắc nghẽn khác nhau thì sự biến
động kích thước cửa sổ khác nhau thể hiện tương tự như trong
các phần trên đã trình bày. Vùng lõm Cả 2 vùng
lõm và lồi
Internet
Router Client
Ftp Server Router
Subnet HCMC Subnet HN
Hình-11 Mô hình mạng giả lập Hình-14 Biến động cửa sổ tắc nghẽn của giải thuật Cubic
Mô phỏng gồm 3 ngữ cảnh Tahoe, Reno và Cubic tương ứng IX. KẾT LUẬN
với 3 giải thuật trong phần III,IV và VII. Trong 2 ngữ cảnh
Bài báo đã khảo sát và mô phỏng một số giải thuật điều khiển
Tahoe và Reno, giá trị các thông số SST=64000 và xác suất
tắc nghẽn phổ biến cho luồng TCP dùng trong các hệ điều hành
mất gói trên mạng Internet là 0.5% . Kết quả như sau :
window và linux .
Đồ thị trong hình-12 biểu diễn sự biến động của kích thước
cửa sổ tắc nghẽn trong ngữ cảnh Tahoe. Khi tắc nghẽn được
58
58
LỜI CÁM ƠN [5] S. Floyd and T. Henderson, “RFC2582 – The NewReno modification to
TCP’s fast recovery algorithm,“ RFC, 1999.
Nghiên cứu này được tài trợ bởi Học Viện Công Nghệ Bưu
[6] Alexander Afanasyev, Neil Tilley, Peter Reiher, and Leonard Kleinrock,
Chính Viễn Thông với mã số đề tài 02-HV-2015-RD_VT2. “ Host-to-Host Congestion Control for TCP,“ IEEE Communication
Surveys & Tutorial, Vol.12, No. 3, 2010.
[7] S. Floyd,T. Henderson, A. Gurtov and Y. Nishida, “RFC6582 – The
[1] J.Postel, “ RFC 793- Transmission Control Protocol “, RFC, 1981. NewReno modification to TCP’s fast recovery algorithm,“ RFC, 2012.
[2] S. Floyd,T. Henderson and A. Gurtov, “RFC3782 – The NewReno [8] Cai, H., eun, D., Ha, S., Rhee, I., and xu, L., “Stochastic ordering for
modification to TCP’s fast recovery algorithm,“ RFC, 2004. internet congestion control and its applications,“ In proceedings of IEEE
[3] V. Jacobson, “ Congestion avoidance and control, ” ACM INFOCOM, 2007
SIGCOMM,pp. 314-329, 1988. [9] Peng Yang, Wen Luo, Lisong Xu, Jitender Deogun, and Ying Lu , “TCP
[4] V. Jacobson, “ Modified TCP congestion avoidance algorithm,“ email to Congestion Avoidance Algorithm Identification,“ 31st International
the end2end list, 4/1990 Conference on Distributed Computing System, 2011
59
59
Mô Phỏng Sự Tác Động Của Lượng Mưa

Lên Quá Trình Thủy Triều
Tại Vùng Đồng Bằng Sông Cửu Long
Hoàng Ngọc Hiển 1, Huỳnh Xuân Hiệp 2
1
Khoa Công nghệ Thông tin, Trường Đại học Bạc Liêu
2
Khoa Công nghệ Thông tin & Truyền thông, Trường Đại học Cần Thơ
Nhóm nghiên cứu liên ngành DREAM-CTU/IRD, Trường Đại học Cần Thơ
Email: hnhien@blu.edu.vn, hxhiep@ctu.edu.vn
Abstract— Trong bài viết này chúng tôi đề xuất một tiếp cận mới Trong bài viết này, chúng tôi đề xuất một tiếp cận mới
nghiên cứu sự ảnh hưởng của lượng mưa trong tình trạng nước nghiên cứu sự ảnh hưởng của lượng mưa trong tình trạng nước
biển dâng thủy triều gây ngập địa hình tại vùng Đồng bằng sông biển dâng gây ngập địa hình tại vùng Đồng bằng sông Cửu
Cửu Long. Các mô hình về ảnh hưởng của lượng nước mưa được Long. Chúng tôi tiến hành mô phỏng với hai mô hình có yếu tố
xây dựng trên kỹ thuật đa tác tử và đưa vào mô phỏng dựa trên lượng mưa và không có yếu tố lượng mưa lên quá trình nước
nền tảng mô phỏng GAMA. Chúng tôi tiến hành mô phỏng với biển dâng trên cơ sở dữ liệu trong quá khứ và đưa ra kịch bản
hai mô hình có yếu tố lượng mưa và không có yếu tố lượng mưa dự kiến cho tương lai. Để nhằm làm tiền đề cho các nghiên cứu
lên quá trình nước biển dâng (được thí điểm tại tỉnh Bạc Liêu) sâu hơn nữa các vấn đề nước biển dâng ảnh hưởng đến kinh tế
trên cơ sở dữ liệu trong quá khứ và đưa ra kịch bản dự kiến cho
và xã hội dựa trên cơ sở mô phỏng đa tác tử.
tương lai. Kết quả mô phỏng là bản đồ ngập theo thời gian và các
thống kê mức ngập theo thời gian cho các đơn vị hành chính
(huyện, tỉnh). Các mức độ ảnh hưởng của lượng mưa trong tình II. NGHIÊN CỨU LIÊN QUAN
trạng nước biển dâng cũng được đánh giá nhằm hỗ trợ cho các Vấn đề biến đổi khí hậu trong đó có tình hình nước biển
giải pháp làm giảm thiệt hại của biến đổi khí hậu.
dâng vùng ven biển Đồng bằng sông Cửu Long đã và đang
được nghiên cứu và ứng phó [2][3][5][6][7].
Keywords- mô phỏng, bản đồ ngập, thống kê mức ngập, đa tác
tử, GAMA. Kịch bản biến đổ khí hậu, nước biển dâng cho Việt
Nam[2]: đưa ra những thông tin cơ bản về xu thế biến đổi khí
I. GIỚI THIỆU hậu, nước biển dâng của Việt Nam, trong tương lai tương ứng
với các kịch bản khác nhau về phát triển kinh tế - xã hội toàn
Hiện nay, tình trạng nước biển dâng đang là mối hiểm họa
cầu dẫn đến các tốc độ phát thải khí nhà kính khác nhau. Các
toàn cầu, nước biển dâng đang tác động và ảnh hưởng mạnh kịch bản phát thải của nhiệt độ, lượng mưa, mực nước biển
mẽ tới tài nguyên thiên nhiên, con người, kinh tế - xã hội,
theo kịch bản phát thải thấp / trung bình /cao. Cho thấy được
vv…ở nhiều quốc gia trên thế giới nhất các quốc gia có biển và
mức nước biển dâng trong tương lai thông qua hình ảnh bản đồ
các vùng ven biển[2]. Các nhà khoa học đã đưa ra các kịch bản
và bảng số liệu.
dự đoán, đến năm 2100 có khoảng 2/3 các thành phố lớn trên
thế giới có nguy cơ ngập lụt do mực nước biển dâng cao[18]. Mô phỏng hiện trạng ngập địa hình do nước biển dâng tại
Mực nước biển được dự đoán tăng cao tại Thái Bình Dương và vùng Đồng bằng sông Cửu Long[5]: Nghiên cứu cũng đã tiến
Ấn Độ Dương trong tương lai sẽ gây ra những tổn thất nặng hành xây dựng bản đồ số thể hiện quá trình ngập địa hình do
nề[2]. Các quốc gia trên thế giới đang cùng nhau chung sức nước biển dâng thông qua bản đồ ngập/nguy cơ ngập theo thời
nghiên cứu đưa ra các biện pháp, xây dựng các mô hình nhằm gian. Các thống kê về diện tích ngập theo thời gian theo từng
giảm thiệt hại của nước biển dâng[18]. đơn vị hành chính, cũng đã được mô tả chi tiết trên cơ sở các
kịch bản ngập địa hình do nước biển dâng trong quá khứ và
Ở Việt Nam các khu vực chịu tác động mạnh của tình hình
cho các giai đoạn trong tương lai.
nước biển dâng đó là Đồng bằng sông Hồng[4], dải ven biển
Miền Trung[9] và Đồng bằng sông Cửu Long[5]. Tỉnh Bạc Mô phỏng quá trình xâm nhập mặn tại vùng Đồng bằng
Liêu nằm trong vùng bán đảo Cà Mau thuộc Đồng bằng sông sông Cửu Long[3][6]: Nghiên cứu cũng đã tiến hành xây dựng
Cửu Long là một tỉnh ven biển chịu ảnh hưởng thuỷ triều sâu bản đồ số thể hiện quá trình nhiễm/xâm nhập mặn đã được
sắc của biển Đông. Nền kinh tế ở tỉnh Bạc Liêu chủ yếu là nuôi hình thành và sự thay đổi đường đẳng mặn theo thời gian. Các
trồng thủy sản, đánh bắt cá, trồng lúa, làm muối, ...Nước biển thống kê về diện tích nhiễm mặn theo thời gian và thống kê độ
dâng dẫn đến tình trạng nước mặn xâm nhập[3], diện tích đất bị mặn trung bình theo từng đơn vị hành chính. Kết quả mô
thu hẹp ngày càng ảnh hưởng đến đời sống, định cư, sinh hoạt, phỏng sẽ cho ra các đường đẳng mặn, diện tích mặn, thống kê
kinh tế, sản xuất,…của con người. độ mặn trung bình giữa các vùng, thống kê độ xâm nhập mặn
qua các giai đoạn 2000 – 2010 và 2011 – 2020.
60
ISBN: 978-604-67-0635-9 60
III. XÂY DỰNG MÔ HÌNH VÀ MÔ PHỎNG Xây dựng và thiết kế các tác tử gán cho các cell (bản đồ
được chia thành các ô). Trong cơ sở dữ liệu GIS[18] có độ cao
A. Số liệu địa hình, chia vùng theo đơn vị hành chính cấp huyện được gán
Số liệu mực nước biển được đo lấy ở trạm đo ở trạm thủy cho tác tử cell và được lưu trữ các dữ liệu đó. Các cell tương
văn[10]. Số liệu là số liệu đo mực nước giờ và trung bình ngày ứng với điểm tọa độ bản đồ trên thực tế.
ở các trạm thủy văn với đơn vị tính cm. Với số liệu đo chi tiết
theo từng giờ trong ngày và tất cả các ngày trong tháng.
Figure 1. Số liệu mực nước đo ở trạm thủy văn [10]

Figure 4. Tác tử cell và cơ sở dữ liệu GIS
Số liệu lượng mưa được đo lấy ở trạm đo[11]. Số liệu là số
liệu đo lượng mưa theo từng ngày ở trạm với đơn vị tính mm.
C. Giải thuật cho mô hình
Mô phỏng cho mô hình trên nền mô phỏng GAMA[1] .Các
yếu tố đầu vào tính toán và xử lý cho phù hợp với yêu cầu cụ
thể của bài toán khi mô hình hóa: mực nước biển, lượng mưa;
bản đồ địa hình, bản đồ sông ngòi; độ cao địa hình, đơn vị hành
chính. Được đưa vào GAMA, các dữ liệu và số liệu trên được
tính toán theo các giải thuật và phương trình (viết code trong
GAMA) cho ra kết quả số liệu ngập. Từ số liệu ngập tiến hành
Figure 2. Số liệu lượng mưa đo ở trạm khí tượng [11] tô màu để cho ra bản đồ ngập, sau đó cho ra bản thống kê cho
mức độ ngập. Dựa vào bảng diễn giải phân màu trên bản đồ và
Mục tiêu chúng tôi nghiên cứu là mô phỏng nước biển dâng bản thống kê sẽ thấy được kết quả ngập do nước biển dâng.
chạy theo từng tháng. Nên chúng tôi đã xử lý bằng cách: Từ số
liệu mực nước giờ và trung bình ngày, trích xuất và tính toán
các số liệu đặc trưng theo từng tháng.
 Trích xuất các giá trị số liệu theo ngày (chuỗi A).
 Từ chuỗi A tiếp tục tính: Chọn giá trị cao nhất / trung
bình / thấp nhất của chuỗi.
 Tính toán như trên cho các tháng còn lại của năm và
cho toàn bộ bảng số liệu.
 Dùng các số liệu theo bảng đã tính toán để làm số liệu
đầu vào cho mô hình mô phỏng độ ngập ở mức thấp /
trung bình / mức cao. Figure 5. Sơ đồ thực hiện xử lý mô phỏng
 Kiểm tra tính toán cho mô hình cho đúng thực tế.
B. Công cụ GIS D. Công cụ lập trình
Sử dụng công cụ GIS[19] để xây dựng và thiết kế các tác tử Quá trình mô phỏng cho mô hình được thực hiện trên nền
sông/kênh cho tất cả con sông/kênh[5]. công cụ GAMA.
Figure 6. Các bước lập trình trong GAMA của mô hình
Đầu tiên là nạp dữ liệu bản đồ (địa lý, hệ thống sông ngòi,
cống ngăn mặn) được xây dựng từ GIS. Bản đồ lưu trữ dữ liệu
độ cao địa hình, độ thấm địa hình được tính toán và phân chia
hợp lí cho các vùng khác nhau, các đơn vị huyện khác nhau.
Figure 3. Hệ thống sông/kênh và hệ thống cống trên sông
61
61
Figure 9. Áp dụng phương trình trong GAMA
Xuất kết quả đầu ra cho mô phỏng là bản đồ ngập và nguy

cơ ngập theo từng tháng diễn biến trong từng năm ở 3 mức
thấp, trung bình, cao. Tương ứng theo đó là bản thống kê diện
tích bị ngập ở 3 mức thấp, trung bình, cao cho mô hình.
Figure 7. Đưa dữ liệu bản đồ GIS vào GAMA
Tiếp theo phải khai báo lấy các trường từ dữ liệu là độ cao
địa hình, độ thấm địa hình chính là các biến, được phân chia
các khu vực nhỏ theo hệ thống đê, hệ thống cống ngăn mặn
(đóng hoặc mở) và các đơn vị huyện.
Figure 10. Hiện thị các kết quả đầu ra trong GAMA
A. Khu vực thí điểm nghiên cứu

Trong nghiên cứu, chúng tôi đã chọn tỉnh Bạc Liêu làm thí
Figure 8. Trường từ dữ liệu GIS điểm. Bạc Liêu là tỉnh nằm ở phía tây nam của Việt Nam, trong
khu vực Đồng bằng sông Cửu Long, với tọa độ từ 9000’00’’
Chuyển phương trình thành giải thuật phương trình cụ thể đến 9037’30’’ vĩ độ Bắc và từ 105015’00” đến 105052’30”
của lập trình với các thông số là các biến được nạp vào từ dữ kinh độ Đông. Địa hình thấp, tiếp giáp với biển, hệ thống sông
liệu GIS và cơ sở dữ liệu. Phương trình sẽ tính kết quả khi chạy và kênh chằng chịt, bờ biển dài 56 km. Cho nên vùng này ảnh
mô phỏng theo thời gian, gán và phân chia các mức màu sắc để hưởng nghiêm trọng bởi tình hình nước biển dâng.
cho ra kết quả là các mức độ ngập nước.
B. Ảnh hưởng lượng mưa lên tình trạng nước biển dâng từ
năm 1992-2012
Từ số liệu thực tế đưa vào mô phỏng cho ra kết quả là bản
đồ ngập và kết quả thống kê theo thời gian. Ở 2 bản đồ ngập
chạy mô phỏng của yếu tố lượng mưa và không có lượng mưa
cho thấy được sự khác biệt, chúng tôi cũng chọn mốc thời gian
chẵn năm 2000 và 2010 làm đại diện. Theo kết quả mô phỏng
có được, tháng có mức độ ngập cao nhất là tháng 11-2000 và
tháng 11 – 2010.
Không có yếu tố lượng mưa Có yếu tố lượng mưa
Figure 11. Bản đồ ngập tháng cao nhất năm 2010.
Chạy mô phỏng qua các năm từ số liệu (1992 - 2012), qua tích ngập mức cao – thấp – trung bình cho giai đoạn 1992 –
kết quả chạy mô phỏng cho mô hình ra kết quả thống kê diện 2012 .
62
62
Figure 12. Thống kê diện tích ngập mức cao – thấp – trung bình từ năm 1992 – 2012.
Qua kết quả thống kê khi có yếu tố lượng mưa diện tích bị Nhìn chung, đa phần các mức ngập chỉ do nước biển dâng
ngập mức cao, biên độ thống kê càng đi lên cao cho thấy vào khoảng dưới 40%. Nhưng mức ngập đo kết hợp cả nước
những năm gần đây do biến đổi khí hậu, nước biển ngày càng biển và lượng mưa càng làm tăng cao, mô phỏng ở mức cao có
dâng, lượng mưa cũng tăng thêm làm cho diện tích ngập ngày lúc lên đến 80% (tháng 11-2010) và ở mức trung bình khoảng
càng tăng. Có những năm biên độ đi xuống, lượng mưa cũng ít, 33% (tháng 11-2010), xảy ra hiện tượng nước dâng cao và các
xảy ra hạn hán, nhưng nhìn chung theo thống kê biên độ đi lên trận mưa lớn liên tục. Qua kết quả thống kê cho thấy các tháng
qua các năm. Khi chạy mô phỏng cho mô hình chưa có sự ảnh có lượng mưa lớn làm mức ngập tăng lên làm ảnh hưởng
hưởng của yếu tố lượng mưa từ năm 2000 trở đi biên độ thống không nhỏ đến hoạt động sản xuất kinh tế - xã hội của người
kê diện tích bị ngập mức trung bình mới tăng lên. Ngược lại, dân trên tỉnh Bạc Liêu.
mô phỏng có sự ảnh hưởng yếu tố lượng mưa thì khoảng năm
Từ thống kê diện tích ngập cho toàn tỉnh sau đó thống kê
1993 diện tích bị ngập mức trung bình đã có dấu hiệu tăng lên
từ từ. diện tích ngập cho các đơn vị hành chính huyện của tỉnh từ
năm 1992 – 2012.
Figure 13. Thống kê diện tích ngập các huyện so với toàn tỉnh từ năm 1992 – 2012.
Qua kết quả thống kê cho mô hình trên khi có thêm yếu tố
lượng mưa, thấy mức độ ngập của đơn vị huyện cao nhất là C. Ảnh hưởng lượng mưa lên tình trạng nước biển dâng từ
Đông Hải (trên 25% diện tích), tiếp đến là Hòa Bình và Tp. năm 2013-2020
Bạc Liêu. Các huyện còn lại Phước Long, Vĩnh Lợi có mức độ Đề xuất mới cho xây dựng mô hình và mô phỏng kịch bản
ngập thấp hơn, hầu như không đáng kể. So sánh với mô phỏng cho tương lai từ năm 2013 – 2020, chúng tôi chọn mốc thời
mô hình không có yếu tố lượng mưa chủ yếu do mực nước biển gian chẵn năm 2020 làm đại diện cho ví dụ của kịch bản. Bản
dâng thì mức độ % diện tích bị ngập thấp hơn nhiều. đồ ngập địa hình của tháng có mức độ ngập cao nhất là tháng
10-2020 (mức cao).
63
63
Figure 14. Bản đồ ngập tháng cao nhất tháng 10-2020 mức cao.
Hiện trạng ngập ở năm 2020 khi có và không có ảnh hưởng phòng tránh ngập lụt và quy hoạch định cư trên các đơn vị
của yếu tố lượng mưa có sự chênh lệch và khác biệt. Riêng huyện ven biển nhằm tránh thiệt hại cho người dân, ổn định
tháng 6 đến tháng 10 ở mức cao thì chênh lệch khoảng 20%. phát triển kinh tế.
Từ đó cho thấy lượng mưa ở các tháng này rất cao cùng với sự
Kết quả mô phỏng cho thống kê % diện tích ngập từ kịch
đang lên của nước biển sẽ làm ảnh hưởng xấu đến kinh tế, xã
hội. Vì thế, các cơ quan chức năng cần phải có các biện pháp bản cho mức cao – thấp – trung bình từ năm 2013 – 2020.
Figure 15. Thống kê diện tích ngập mức cao – thấp – trung bình từ năm 2013 - 2020.
Nhìn vào kết quả thống kê cho kịch bản, chúng ta thấy từ hầu như diện tích đất trên toàn tỉnh đều bị ngập ít nhất 20%
năm 2013-2020 biên độ thống kê thay đổi khác biệt ở cả hai đồ diện tích. Cho thấy nguy cơ ngập tăng lên rất nghiêm trọng
thị có và không có tác động của yếu tố lượng mưa. Tuy nhiên ở đáng báo động cho tỉnh Bạc Liêu nói riêng và Đồng bằng sông
đồ thị không có yếu tố lượng mưa thì biên độ cao nhất của mức Cửu Long nói chung.
cao vào khoảng 41% diện tích và thấp nhất có lúc 0% diện tích.
Ngược lại đồ thị có yếu tố lượng mưa biên độ cao nhất của Từ thống kê diện tích ngập cho toàn tỉnh sau đó thống kê %
mức cao vào khoảng 57% diện tích và thấp nhất là khoảng 20% diện tích ngập từ kịch bản cho các đơn vị huyện từ năm 2013-
2020.
diện tích. Qua đó, ta thấy có sự tác động của lượng mưa cao thì
64
64
Figure 16. Thống kê diện tích ngập các huyện so với toàn tỉnh từ năm 2013-2020.
Qua thống kê kịch bản mô phỏng cho các đơn vị huyện, Sông cửu Long, Kỷ yếu Hội nghị FAIR’2014, NXB Khoa học tự nhiên
diện tích bị ngập của các huyện tăng lên cao khoảng 5% diện & Công nghệ, Hà Nội, 2014.
tích ở các huyện ven biển như Đông Hải, Hòa Bình, Tp. Bạc [4] Phạm Tất Thắng, Nguyễn Thu Hiền. Ảnh hưởng của biến đổi khí hậu –
Nước biển dâng đến tình hình xâm nhập mặn dải ven biển Đồng bằng
Liêu khi có tác động của yếu tố lượng mưa so với không có tác Bắc Bộ, Khoa học kỹ thuật thủy lợi và môi trường – số 37, 2012.
động của yếu tố lượng mưa. Các huyện nằm phía trong quốc lộ [5] Hoàng Ngọc Hiển, Triệu Yến Yến, Phan Văn Sa, Huỳnh Xuân Hiệp. Mô
1A còn lại tăng không đáng kể vì đã được quốc lộ 1A và các phỏng hiện trạng ngập địa hình do nước biển dâng tại vùng Đồng bằng
cống ngăn nước biển vào. Riêng huyện Đông Hải từ năm 2015 sông Cửu Long, Kỷ yếu Hội nghị GIS’2014, NXB Đại học Cần Thơ,
– 2020 thì % diện tích bị ngập càng ngày càng tăng và biên độ 2014.
mô phỏng ở mức thấp nhất tăng cao, từ năm 2015 vào khoảng [6] Hoang N.H, Huynh X.H, Nguyen H.T. Simulation of Salinity Intrusion
13% đến năm 2020 vào khoảng 17%. Nếu chiều hướng này in the Context of the Mekong Delta Region (Vietnam). Research,
Innovation, and Vision for the Future (RIVF), IEEE Conference
vẫn tiếp tục có thể huyện Đông Hải vào mùa mưa sẽ có thể bị
Publications, pp. 1-4, 2012.
ngập trên phạm vi toàn huyện. Các huyện Tp. Bạc Liêu, Hòa
[7] Viện Khoa học Khí tượng thủy văn và Môi trường. Biến đổi khí hậu và
Bình mức độ ngập cũng tăng vừa phải ít hơn so với huyện tác động ở Việt Nam, NXB Khoa học và kỹ thuật, Hà Nội, 2010.
Hông Hải. [8] Trần Thanh Xuân, Trần Thục, Hoàng Minh Tuyển, Tác động của biến
Qua kịch bản mô phỏng từ năm 2013-2020, cho thấy ảnh đổi khí hậu đến tài nguyên nước ở Việt Nam, NXB Khoa học công nghệ
, Hà Nội, 2011.
hướng rất xấu đến tỉnh Bạc Liêu, cần có biện pháp khắc phục
[9] Lê Quang Cảnh, Lê Văn Thăng, Nguyễn Huy Anh. Ứng dụng GIS xây
tình trạng ngập lụt như: quy hoạch lại hệ thống kênh, vét kênh dựng bản đồ bị tổn thương do nước biển dâng gây ra đối với diện tích
tạo dòng chảy nhằm chia sẽ lượng nước trên các con sông với đất trồng lúa ở dải ven biển tỉnh Phú Yên, Tạp chí khoa học, Đại học
nhau; xây dựng hệ thống đê điều hợp lý ngăn nước biển và hệ Huế, Tập 74B, Số 5, Trang 17-24, 2012.
thống đập ngăn mặn ngăm nước biển xâm nhập vào đồng [10] Bảng số liệu thống kê mực nước biển từ năm 1992 đến 2012, Trạm thủy
ruộng. văn Gành Hào, Trung tâm Khí tượng Thủy văn Bạc Liêu, 2014.
[11] Bảng số liệu thống kê lượng mưa từ năm 1992 đến 2012, Trung tâm Khí
tượng Thủy văn Bạc Liêu, 2014.
V. KẾT LUẬN
[12] J.Q. Xia, R.A. Falconer, B. Lin, G. Tan, Estimation of future coastal
Chúng tôi đã nghiên cứu mô phỏng mô hình ảnh hưởng của flood risk in the Severn Estuary due to a barrage, J. Flood Risk Manage,
lượng mưa lên quá trình nước biển dâng trên địa bàn khu vực Vol.4, pp. 247-259, 2011.
Đồng bằng sông Cửu Long trong bối cảnh vùng Đồng bằng [13] Donna Kain, Michelle Covi. Visualizing complexity and uncertainty
sông Cửu Long chịu tác động mạnh của biến đổi khí hậu. Tiến about climate change and sea level rise, Communication Design
Quarterly Review , Vol. 1, pp. 46-53, 2013.
hành mô phỏng với hai mô hình có yếu tố lượng mưa và không
[14] Reza Ahmadian, Agnieszka I. Olbert, Michael Hartnett, Roger A.
có yếu tố lượng mưa lên quá trình nước biển dâng trên cơ sở dữ Falconer. Sea level rise in the Severn Estuary and Bristol Channel and
liệu trong quá khứ và đưa ra kịch bản dự kiến cho tương lai. impacts of a Severn Barrage, J. Computers & Geosciences, Vol. 66, pp.
Trên cơ sở kết quả mô phỏng, nghiên cứu cũng đã tiến hành 94-105, 2014.
xây dựng bản đồ số thể hiện quá trình ngập địa hình do nước [15] H.E. Pelling, J.A. Mattias Green, S.L. Ward, Modelling tides and sea-
biển dâng và ảnh hưởng thêm của lượng mưa thông qua bản đồ level rise: to flood or not to flood, Ocean Modelling, Vol. 63, pp. 21-29,
ngập/nguy cơ ngập theo thời gian. Các thống kê về diện tích 2013.
ngập theo thời gian theo từng đơn vị hành chính (cấp tỉnh, cấp [16] Jason R. W. Merrick. Aggregation of forecasts from multiple simulation
models, WSC '13: Proceedings of the 2013 Winter Simulation
huyện) trên địa bàn một tỉnh được chọn thí điểm (tỉnh Bạc Conference: Simulation: Making Decisions in a Complex World, IEEE
Liêu) trên địa bàn khu vực Đồng bằng sông Cửu Long cũng đã Press, pp. 533-542, 2013.
được mô tả chi tiết trên cơ sở các kịch bản ngập địa hình do [17] David J. Lieske. Coping with climate change, Environmental Modelling
nước biển dâng trong quá khứ và cho các giai đoạn trong tương & Software, Vol. 68, pp. 98-109, 2015.
lai. Các so sánh sự có và không có ảnh hưởng của lượng mưa [18] IPCC WGII AR5, Climate Change 2014: Impacts, Adaptation, and
qua bản đồ ngập và thống kê về mức độ ngập trong quá khứ và Vulnerability, 2014.
cho các giai đoạn trong tương lai. [19] Taillandier, P., Drogoul, A. From GIS Data to GIS Agents, Modeling
with the GAMA simulation platform, 2010.
Trong thời gian tới, chúng tôi sẽ mở rộng nghiên cứu mô
phỏng các mô hình toán biến đổi khí hậu cho khu vực Đồng
bằng sông Cửu Long và các khu vực khác của Việt Nam.

[1] IRD/UPMC-UMMISCO. GAMA-platform.
http://code.google.com/p/gama-platform/
[2] Bộ Tài nguyên và Môi trường Việt Nam. Kịch bản biến đổi khí hậu,
nước biển dâng cho Việt Nam. NXB Tài nguyên Môi trường và bản đồ
Việt Nam, 2012.
[3] Hoàng Ngọc Hiển, Dương Việt Hằng, Nguyễn Hiếu Trung, Huỳnh Xuân
Hiệp. Mô phỏng xâm nhập mặn trên hệ thống sông tại vùng Đồng bằng
65
65
HộiHội
66
ISBN: 978-604-67-0635-9 66
HộiHội
Thảo Quốc
Thảo QuốcGia
Gia2015
2015về
vềĐiện
Điện Tử,
Tử,Truyền
Nghệ Thông
Thông TinTin (ECIT
(ECIT 2015)
2015)
67
67
68
68
HộiHội
Thảo Quốc
Thảo QuốcGia
Gia2015
2015về
Điện Tử, Thôngvà
CôngNghệ
Nghệ Thông
(ECIT 2015)
2015)
69
69
HộiHội
Thảo Quốc
Thảo QuốcGia
Gia2015
2015về
vềĐiện
Điện Tử,
Tử,Truyền
Nghệ Thông
Thông TinTin (ECIT
(ECIT 2015)
2015)
70
70
HộiHội
Thảo Quốc
Thảo Gia
Quốc 2015
ĐiệnTử,
Tử,Truyền
NghệThông
ThôngTinTin (ECIT
(ECIT 2015)
2015)
Gán nhãn ngữ nghĩa trong song ngữ Anh-Việt

Huỳnh Quang Đức và Trần Lê Tâm Linh
Trung tâm Tin học, Trường Cao đẳng Nghề Sóc Trăng, Tỉnh Sóc Trăng
Trung tâm Khoa học toán học, Trường Đại học Khoa học Tự nhiên Thành phố Hồ Chí Minh
Email: dhuynhquang@gmail.com, tranletamlinh@yahoo.com.vn
Abstract – Tiếp cận nội dung gán nhãn ngữ nghĩa trong kém về chi phí và thời gian, đòi hỏi phải có đội ngũ chuyên
song ngữ đã được nghiên cứu nhiều trên các ngôn ngữ phổ nghiệp về đánh dấu nhãn ngữ nghĩa trên ngôn ngữ. Những
biến (như Tiếng Anh, tiếng Pháp). Tuy nhiên, việc gán phương pháp học không giám sát trên đơn ngữ có thuận lợi là
nhãn ngữ nghĩa cho những ngôn ngữ ít phổ biến như tiếng sự giả định ít hơn về dữ liệu có giá trị, nhưng khả năng tổng
Việt hiện nay đang còn hạn chế, đặc biệt là tận dụng sự quát thực tiễn thấp [2] [12].
tương đồng ngữ nghĩa trên song ngữ Anh-Việt. Trong nội Sử dụng kho ngữ liệu song ngữ thì những lợi điểm của hai
dung nghiên cứu này, chúng tôi đề xuất một giải pháp cho ngôn ngữ được khai thác một cách phù hợp. Khả năng gán
việc gán nhãn ngữ nghĩa một cách tự động trên kho ngữ nhãn ngữ nghĩa một cách tự động [1] trên phần lớn dữ liệu của
liệu song ngữ Anh-Việt, tận dụng những dịch chuyển từ kho ngữ liệu song ngữ bằng thuật toán học không giám sát có
vựng trong ngôn ngữ chéo, nhưng vẫn đảm bảo yếu tố cốt thể thực hiện được, mà không mất nhiều thời gian và tiết kiệm
lõi về mặt ngữ nghĩa của nó. Hệ thống sử dụng kho ngữ được chi phí. Trong nội dung nghiên cứu này, chúng tôi sử
liệu song ngữ Anh-Việt để xây dựng các tập hợp liên kết có dụng đồng thời việc gán nhãn ngữ nghĩa trên hai ngôn ngữ
khả năng kết hợp từ nhiều từ khác nhau được phát hiện Anh-Việt với một nhãn nghĩa thống kê có sẵn.
trong kho ngữ liệu, đồng thời hệ thống này cũng sử dụng Mục đích của phương pháp tiếp cận này hướng đến là: Thứ
một thuật toán học không giám sát để gán nhãn ngữ nghĩa nhất, cung cấp một số lượng lớn dữ liệu được gán nhãn ngữ
trên tiếng Anh dựa vào sự tương đồng ngữ nghĩa được liên nghĩa trên tiếng Anh mà không cần đánh dấu bằng tay bởi các
kết từ tiếng Việt thông qua ngữ liệu song ngữ Anh-Việt. chuyên gia. Thứ hai, đồng thời cũng gán được nhãn ngữ nghĩa
Sau đó, hệ thống tự động chiếu những nhãn từ tiếng Anh trên tiếng Việt với sự kết hợp hệ thống nhãn đã được đánh dấu
sang tiếng Việt thông qua những liên kết có sẵn. trên tiếng Anh.
Vấn đề cần quan tâm của nghiên cứu này là sự quan sát
Keywords - ngữ liệu song ngữ; học không giám sát; kho ngữ những chuyển đổi có thể đáp ứng qua lại như một cơ sở các
liệu; dịch máy; đặc trưng về mặt ngữ nghĩa [11]. Một từ có nhiều nghĩa trên
tiếng Anh thường được dịch sang một nghĩa cụ thể trên tiếng
I. GIỚI THIỆU Việt với lựa chọn tùy vào người dịch và nghĩa ngữ cảnh. Vì
Hệ thống gán nhãn ngữ nghĩa là một công cụ quan trọng vậy, dịch nghĩa phù hợp được xem như một nghĩa chỉ dẫn cho
trong xử lý ngôn ngữ tự nhiên, đặc biệt là sự phát triển nhanh một ví dụ trong ngữ cảnh của nó. Mặc khác, những ví dụ về kết
chóng của dữ liệu trên Internet. Hiện nay, các nhà nghiên cứu nối ngữ nghĩa được dịch với một vài nhất quán trong một số ít
quan hệ từ trong tiếng Việt. Ngoài ra, một số ít từ rất hiếm gặp
đang tập trung giải quyết câu hỏi trọng tâm của ngôn ngữ học
một tập hợp duy nhất ngay cả với một nghĩa duy nhất, vì những
tính toán là làm sao khử nhập nhằng ngữ nghĩa trong ngôn ngữ
ưu tiên việc dịch khác nhau và yêu cầu về ngữ cảnh tạo ra
tự nhiên, giúp máy tính hiểu rõ được ý nghĩa câu nói của con những từ tương đồng ngữ nghĩa mà khác với sắc thái của nó.
người, nhằm giải quyết những vấn đề thực tế trong cuộc sống
hiện đại, gồm nhiều lĩnh vực khác nhau như: khai thác thông Ví dụ, trong kho ngữ liệu song ngữ Anh-Việt, một từ trong
tin, trả lời câu hỏi, tóm tắt văn bản, dịch máy … Việc phân tiếng Việt là “đông” có thể được dịch tương ứng với từ
tích ngữ nghĩa của văn bản ở mức độ câu, người ta quan tâm “winter” trong tiếng Anh tại một đoạn văn bản, đồng thời cũng
đến đặc điểm của sự kiện như: ai, làm việc gì, ở đâu, khi nào, có thể dịch thành từ “east” trong một đoạn văn bản khác. Trong
như thế nào … những câu hỏi này là đặc điểm chính của việc mỗi từ tiếng Anh như: winter, east bản thân nó cũng có sự
gán nhãn ngữ nghĩa cho ngôn ngữ [6]. nhập nhằng riêng của từng từ. Nhưng chúng ta có thể tận dụng
Bên cạnh đó, những yếu tố quan trọng như: Kỹ thuật máy ưu điểm thực tế mà cả hai ví dụ từ trong tiếng Anh xuất hiện
tương ứng với từ đông trong tiếng Việt để suy đoán rằng hai từ
học, sự lan truyền về hệ thống ngữ nghĩa của WordNet và giá
tiếng Anh có thể có một vài yếu tố riêng biệt về nghĩa trong
trị của kho ngữ liệu lớn cũng được quan tâm trong việc khử từng đoạn văn bản cụ thể. Chúng ta có thể sử dụng những suy
nhập nhằng ngữ nghĩa trong xử lý ngôn ngữ tự nhiên. Phần luận đó để quyết định những nghĩa tiếng Anh nào muốn nói
lớn những hệ thống học giám sát thì việc học từ kho ngữ liệu đến. Điều này phù hợp với mục tiêu ban đầu là chúng ta có thể
đã được gán nhãn ngữ nghĩa một cách chính xác, được thực chiếu sự lựa chọn nghĩa của từ winter trong tiếng Anh của ví
hiện bằng tay do các chuyên gia về ngôn ngữ học thực hiện, dụ này sang từ tiếng Việt đông trong ngữ cảnh này, cũng tương
đồng thời việc học đánh giá trên ngữ liệu huấn luyện cần số tự như từ east được dịch sang từ đông, vì vậy việc gán nhãn
lượng lớn ngữ liệu đã được đánh dấu [9]. Điều này là rất tốn
ISBN: 978-604-67-0635-9 71
71
HộiHội
Thảo Quốc
Thảo Gia
Quốc 2015
ĐiệnTử,
Tử,Truyền
NghệThông
ThôngTinTin (ECIT
(ECIT 2015)
2015)
ngữ nghĩa trong hai ngôn ngữ song song với sự thống kê đơn III. PHƯƠNG PHÁP TIẾP CẬN
nghĩa là hoàn toàn phù hợp và có thể thực hiện được. Để thuận tiện trong việc tiếp cận phương pháp nghiên cứu,
Trong nội dung nghiên cứu, chúng tôi sử dụng một kho ngữ trong kho ngữ liệu song ngữ Anh-Việt chúng tôi thống kê ngữ
liệu song ngữ Anh-Việt với phần lớn dữ liệu được lấy từ ngữ nghĩa trên tiếng Anh, mặc dù không có sự giả định cần thiết
liệu song ngữ EVC và LLOCE. Sau đó sẽ tiến hành xác định trong việc dịch trực tiếp, nhưng chúng tôi xem mặc định kho
ngữ nghĩa trên các cặp câu song ngữ Anh-Việt thông qua độ ngữ liệu tiếng Anh là ngôn ngữ mục tiêu để gán nhãn ngữ
tương đồng ngữ nghĩa và sự dịch chuyển từ vựng trong ngôn nghĩa và kho ngữ liệu tiếng Việt là ngôn ngữ ngồn xác định
ngữ chéo để xác định nhãn ngữ nghĩa trên danh từ tiếng Anh. nhãn nghĩa tương đồng cho ngôn ngữ mục tiêu. Trong phần
Cuối cùng là chiếu nhãn ngữ nghĩa từ tiếng Anh sang tiếng trước, chúng tôi ví dụ từ tiếng Việt đông được dịch sang hai từ
Việt với bộ nhãn trong từ điển ý niệm song ngữ LLOCE khác nhau trong tiếng Anh là winter và east trong hai ngữ cảnh
(Longman Lexicon Of Contemporary English) - LLOCV khác nhau. Quá trình thực hiện hướng tiếp cận này được mô tả
(Longman Lexical Of Contemporary Vietnamese). chi tiết như sau:
Các phần còn lại của nghiên cứu này bao gồm: A. Xác định danh từ
 Công việc liên quan: Một số công trình nghiên cứu có Xác định những từ trong ngữ liệu tiếng Anh (ngữ liệu khả
liên quan đến gán nhãn ngữ nghĩa trên đa ngữ. năng - ngôn ngữ mục tiêu) có nghĩa được dịch thích hợp trong
 Đề xuất phương pháp tiếp cận: Mô tả những nội dung ngữ liệu tiếng Việt (ngữ liệu nguồn). Ví dụ cho trường hợp
thực hiện để gán nhãn ngữ nghĩa trong kho ngữ liệu song ngữ này là tập các khả năng của kho ngữ liệu tiếng Anh {winter,
Anh-Việt. east}, và từ trong kho ngữ liệu tiếng Việt {đông}.
 Đánh giá kết quả phương pháp tiếp cận vấn đề: Trình Chúng tôi giả sử lấy một câu hoặc một đoạn đã được dịch
bày những yêu cầu cần thiết trong đánh giá kết quả thực song song trong kho ngữ liệu, dữ liệu song song có sẵn và phù
hợp là từ những trang Web trên mạng Internet. Sau đó, nhận
nghiệm mà chúng tôi sử dụng để gán nhãn ngữ nghĩa.
dạng và đánh dấu các từ có thể liên kết, chúng ta thu được
 Thảo luận vấn đề tận dụng lợi điểm của kho ngữ liệu những câu ở mức độ liên kết từ. Với mỗi từ trong tiếng Việt
song ngữ. Kết luận và hướng phát triển trong thời gian tới. chẳng hạn như w, chúng ta thu thập một từ ví dụ như v mà nó
II. CÔNG TRÌNH LIÊN QUAN được liên kết. Vị trí của từ trong ví dụ được lưu lại để trong
phần sau chúng ta có thể chiếu trở lại nhãn ngữ nghĩa cuối
Trong nghiên cứu của mình Paul Rayson và cộng sự đã xây cùng từ v sang w. Ví dụ ta có một cặp câu song ngữ Anh-Việt
dựng công cụ phân tích ngữ nghĩa sử dụng bộ nhãn ý niệm với liên kết như hình 1.
LLOCE được chia thành 21 chủ đề, và trong 21 chủ đề này
được chia thành 232 loại ý niệm khác nhau [14]. Trong đó, các
Thời tiết đã chuyển sang đông
tác giả đã dựa vào nhiều loại tri thức khác nhau để xác định
nhãn ngữ nghĩa cho từ trong câu như: từ loại (POS tag), từ có
nhiều chữ (MWEs), từ điển tần suất, phạm vi văn bản (domain
of discourse) … The weather turned to the winter
Dựa trên từ điển ý niệm LLOCE, Scott Piao et all đã phát Hình 1. Một ví dụ về liên kết danh từ
triển một hệ thống gán nhãn ngữ nghĩa trên nhiều ngôn ngữ
như: tiếng Anh, tiếng Bồ Đào Nha, tiếng Trung Quốc và tiếng Sự liên kết có thể xảy ra giữa từ đông và từ winter trong
Ý [15] với kiến trúc hệ thống dựa vào luật ngữ cảnh (context cặp câu song ngữ trên, có nghĩa là hệ thống sẽ dịch từ đông
rules), từ vựng từ (word lexicon), từ vựng nhiều từ (mwe trong tiếng Việt thành từ winter trong tiếng Anh, từ thời tiết
lexicon). Trong đó có sử dụng TreeTagger cho tiếng Ý và Bồ trong tiếng Việt được dịch thành từ weather trong tiếng Anh.
Đào Nha và Stanford POS tagger cho tiếng Trung Quốc. B. Gom nhóm – Xây dựng tập các khả năng
Bên cạnh đó, chúng tôi cũng tham khảo cách thức tổ chức Gom nhóm những từ trong ngôn ngữ mục tiêu tạo thành
từ điểm ý niệm LLOCE được xây dựng bởi Mc Arthur năm những tập các khả năng về nghĩa được dịch cùng một hình thức
1981 (Mc Arthur, 1981) với cách tổ chức nhãn được gắn thêm chính tả trong ngôn ngữ nguồn. Tức là sử dụng kho ngữ liệu để
các yếu tố phụ nhằm giúp tăng độ chính xác của nhãn ngữ xây dựng các tập khả năng của tất cả các từ (danh từ) mà có
nghĩa khi thực hiện gán nhãn cho văn bản. Ví dụ như: giới tính liên kết với nhiều từ khác nhau (từ hai từ trở lên) được phát
(sex) nhãn được ghi thêm m/f (male/female) hoặc +/- hiện trong kho ngữ liệu. Chúng tôi thu thập mỗi loại từ vi trong
(positive/negative) được bổ sung vào nhãn “happy” hoặc “sad” tiếng Việt gồm tập hợp tất cả những loại từ trong tiếng Anh mà
với mã “E4.1+” hoặc “E4.1-”. được liên kết với bất cứ từ nào trong kho ngữ liệu và gọi đó là
Trong đánh giá kết quả thực nghiệm [15] tác giả cũng chỉ ra tập khả năng của vi. Ví dụ trong trường hợp này ta có từ trong
những lỗi từ vựng xảy ra trong quá trình dịch từ tiếng Anh sang câu tiếng Việt là đông có thể bao gồm những loại từ trong tiếng
ngôn ngữ khác như: Từ tiếng Anh father với nhãn S4m, S9, Anh winter, east, frozen. Trong tập các khả năng ta thấy xuất
S2m hoặc từ dad, dada, baba, da, daddy với nhãn S4m, papa hiện thêm từ frozen mà trong hai ví dụ trước ta thấy không có,
(S4m) … điều đó được lý giải như sau:
Sở dĩ có từ frozen trong tập các khả năng là vì trong một số
trường hợp trong kho ngữ liệu có đoạn dịch câu “thời gian này
thời tiết đã chuyển sang đông” thành câu “this time the weather
72
72
HộiHội
has shifted frozen”. Ngoài ra, trong tập các khả năng còn có thể nghĩa như trên, theo cách tự nhiên thì việc nhận ra đặc điểm vai
chứa thêm từ khác, nếu như trong kho ngữ liệu song ngữ Anh- trò ngữ nghĩa của từ thuộc lớp ngữ nghĩa như là đối số của nó
Việt chương trình còn phát hiện câu dịch có từ đông được dịch được phân bố bằng mối quan hệ cho việc ưu tiên lựa chọn về
sang từ khác trong câu tiếng Anh ở một đoạn khác. Ví dụ: Với độ đo. Đặc biệt, là những lớp có vai trò ngữ nghĩa phù hợp nhất
câu tiếng Việt “Tại thành phố Hồ Chí Minh số lượng người rất sẽ có xác suất cao hơn được so với từ đứng trước nó. Cụ thể,
đông” được dịch trong ngữ liệu tiếng Anh thành câu “The kết nối được lựa chọn thông qua công thức:
number of people are crowded in Ho Chi Minh City”, khi đó 1 Pr(c | p)
tập các khả năng của từ đông sẽ được bổ sung thâm từ AR ( p, c)  * Pr(c | p) * log (2)
crowded. S R ( p) Pr(c)
Quan sát hình 3, ta thấy phân bố tỷ lệ xác suất sẽ thay đổi
Thuật toán 1: CAS - Create Ability Set khi từ tiếp theo xuất hiện với một từ cho trước.
Đầu vào: Văn bản song ngữ Anh-Việt
Đầu ra: Tập các khả năng một từ tiếng Việt được dịch
Pr(c|buzz) sau
sang tiếng Anh. trước
Bước 1: Tìm danh từ vi. Gọi là tập các ứng viên V;
Pr(c)
Bước 2: Tạo tập rỗng S để lưu tập các khả năng cho mỗi
từ vi;
Bước 3: k = 1;
Bước 4: Mỗi từ vi trong V thực hiện person insect … person insect …
Tạo tập rỗng Sk
Mỗi cặp câu song ngữ thực hiện
Hình 3. Sự phân bố xác suất trước và sau thông qua đối số
Tìm mỗi cặp (we, wv) có wv = = vi bổ sung từ tiếng
Anh vào Sk;
Lưu lại liên kết; Bảng 1 thể hiện sự so sánh một từ được lựa chọn để gán
Bước 5: Thêm (vi, Sk) vào S; nhãn ngữ nghĩa thuộc lớp nào trong LLOCE với đối số theo
Bước 6: k = k + 1; quan điểm của con người.
Bước 7: Quay lại bước 4.
BẢNG 1. SỰ KẾT HỢP DANH TỪ PHÙ HỢP
Hình 2. Một số bước cơ bản của thuật toán xây dựng tập khả năng Verb Noun AR(verb,noun) Semanitc classes
turn winter 4,94 L238
C. Tính xác suất xác định nhãn ngữ nghĩa go east 4,15 L13
become frozen 3,02 B140
Xem xét tất cả các cặp từ có nghĩa có thể có trong phạm vi be crowded 2,11 N250
mỗi tập mục tiêu và chọn những từ có nghĩa được cung cấp bởi
sự tương đồng ngữ nghĩa của những từ khác trong nhóm thông Ví dụ với từ winter có 3 nghĩa khác nhau thuộc 18 lớp ngữ
qua độ tin cậy về mặt nghĩa của nó. Ví dụ như trong phạm vi nghĩa trong từ điển LLOCE, để tính xấp xỉ phù hợp động từ
tập các khả năng {winter, east, frozen} và tập nguồn {đông}, ta
cho từ winter, sự lựa chọn kết hợp từ go sẽ được tính toán trên
sẽ xem xét các cặp (winter, đông), (east, đông), (frozen, đông),
18 lớp ngữ nghĩa và được trả về giá trị cao nhất, trong trường
mỗi cặp sẽ được gán một giá trị độ tin cậy về mặt ngữ nghĩa.
Trong bước này, tập các khả năng được xem như là vấn đề gán hợp này nếu winter có một nghĩa duy nhất thì lớp nhãn ngữ
nhãn ngữ nghĩa trên đơn ngữ đối với sự thống kê ngữ nghĩa nghĩa được tạo ra cho từ winter. Cách tiếp cận này quyết định
trên ngôn ngữ mục tiêu. Chúng ta quan tâm đến tập các khả đối số phù hợp thông qua thuật toán khử nhập nhằng thông
năng {winter, east, frozen}. Đối với con người thì việc chọn qua sự ưu tiên lựa chọn được mô tả như sau:
nghĩa của các từ này nằm cạnh nhau sẽ hiểu ngay ý nghĩa đặc Cho n là một danh từ có quan hệ R với động từ p, cho một
trưng của từng từ. Nhưng với máy tính thì việc xác định nghĩa tập {s1, s2 …. sk} là những nghĩa có thể có của nó. Khi đó:
sẽ được thực hiện bằng thống kê thông qua thuật toán tính xác cho i chạy từ 1 đến k và tính:
suất. Điều này được Philip Resnik khai thác rất hiệu quả trong
Ci = {c | c là gốc của nghĩa si};
thuật toán khử nhập nhằng ngữ nghĩa thông qua những mối
quan hệ của nó [13]: ai  max ( AR ( p, c)) ;
cCi
S R ( p)  D(Pr(c | p) || Pr(c) gán ai như là điểm số đại diện ngữ nghĩa của si.
Pr(c | p) Trong nghiên cứu về sự phù hợp ngữ nghĩa [5] cách đơn
  Pr(c | p) * log (1)
giản nhất là sử dụng kết quả điểm số được tính toán như trên.
c Pr(c)
Nếu n có nghĩa duy nhất thì chọn nghĩa đó, ngược lại thì lựa
Trong đó, S R ( p) là độ đo thông tin, từ p cho biết lớp chọn nghĩa si mà có ai tốt nhất.
nguyên lý về đối số của nó, Pr(c) là khả năng tính xấp xỉ cao Minh họa cụ thể vào cách tiếp cận mà chúng tôi nghiên
hơn Pr(c | p) , trong trường hợp này từ p sẽ có ít khả năng hơn cứu. Cho một tập hợp các khả năng {w1, w2 … wn}, thuật toán
sẽ xây dựng trên mỗi cặp (wi,wj) với i ≠ j và xác định nghĩa nào
đối số của nó, nên khả năng lựa chọn sẽ ít hơn c. Với cách định
73
73
HộiHội
Thảo Quốc
Thảo Gia
Quốc 2015
ĐiệnTử,
Tử,Truyền
NghệThông
ThôngTinTin (ECIT
(ECIT 2015)
2015)
cho cặp từ (wi,wj) với sự tương đồng ngữ nghĩa lớn nhất. Và từ-trên 16.000 mục từ có quan hệ về nghĩa [3].
những nghĩa này sẽ được đại diện bằng một con số tương ứng Hệ thống của chúng tôi tiếp cận gán nhãn ngữ nghĩa cho
với mức độ hợp lý nghĩa của từ. Sau khi xây dựng được tất cả danh từ với lớp ngữ nghĩa của nó trong cặp câu song ngữ Anh-
các cặp trong tập hợp các khả năng, chúng ta sẽ bắt đầu so sánh Việt, tức là gán nhãn ngữ nghĩa thuộc 2449 lớp ngữ nghĩa
trên mỗi cặp, với mỗi nghĩa của từ được ký hiệu bằng một số trong từ điển song ngữ LLOCE-LLOCV (xem hinh 5, hình 6).
xi,k cho mỗi từ wi và được kết hợp với nó là một độ tin cậy
c(xi,k)  [0, 1], khi đó sẽ gắn với một nhãn ngữ nghĩa cụ thể. Ví
vụ cho trường hợp này, với một cặp câu song ngữ như sau: LLOCE
“thời tiết đã chuyển sang đông từ tháng 10” được liên kết với
câu “the weather turned to the winter from October ”, tức là A B C … L M N
cặp (đông, winter) sẽ có độ tin cậy cao hơn cặp (east, đông).
Phần cuối của bước này, hệ thống sẽ đánh dấu biến đổi quan L2 L3 …
L1
trọng trong bản dịch nhờ vào những tương đồng ngữ nghĩa của
nhiều từ trong tập các khả năng.
L21 L22 L23 L24 …
Thuật toán 2: CP - Calculate Probability
Bước 1: Tạo tập C; L231 L232 … L238 L239
Bước 2: Với mỗi cặp (vi, Sk) trong S thực hiện
Tạo tập Ci; … winter …
Với mỗi từ tiếng Anh En trong Sk
Tạo tập Ck;
Hình 5. Một nhánh nhãn trong LLOCE
Với mỗi cặp câu song ngữ trong kho ngữ liệu
Tìm cặp (wv,we) có wv == vi hoặc we == En
Thêm từ tiếng Anh đứng trước we vào Ck Hệ thống thu thập dữ liệu song ngữ từ nhiều nguồn khác
Thêm (vi, En, Ck) vào C; nhau như: kho ngữ liệu song ngữ EVC, kho ngữ liệu song ngữ
Tính xác suất xi,k chuẩn hóa với độ tin cậy c(xi,k) dành cho dịch máy, kho ngữ liệu của LLOCE ... Sau đó, đánh
Bước 3: Với mỗi cặp câu song ngữ giá và xử lý tách câu, xác định những câu là bản dịch của
Với mỗi từ tiếng Anh trong Sk nhau, tiếp theo sẽ tiến hành gióng hàng từ và gán nhãn từ loại
Xác định xi, k lớn nhất; [4]. Sau đó, xây dựng các tập khả năng được dịch từ kết quả
Xác định độ tương đồng nhãn trong LLOCE; gióng hàng. Kiến trúc hệ thống tổng quát của mô hình xem chi
Gán nhãn cho danh từ trong tiếng Anh; tiết trong hình 7.
Hình 4. Một số bước cơ bản của thuật toán tính xác suất LLOCV
D. Chiếu nhãn
Chiếu những nhãn ngữ nghĩa từ tập các khả năng sang tập A B C … L M N
nguồn của kho ngữ liệu song ngữ. Chúng tôi tận dụng những
ưu điểm trong việc gán nhãn ngữ nghĩa trong tiếng Anh và L1 L2 L3 …
mức độ kết nối từ để chiếu những nhãn ngữ nghĩa này với một
sự tương đồng trong tiếng Việt. Ví dụ, với cặp câu song ngữ L21 L22 L23 L24 …
Anh-Việt “the weather turned to the winter from October” và
“thời tiết đã chuyển sang đông từ tháng 10”, sau các bước
được thực hiện ở trên, ta thu được một câu trong tiếng Anh với L231 L232 … L238 L239
nhãn ngữ nghĩa được gán như sau “the weather turned to the
winter/L238 from October” kết quả trong câu tiếng Việt “thời tiết … mùa đông …
đã chuyển sang đông/L238 từ tháng 10”. Nhãn L238 trong hệ
thống nhãn ngữ nghĩa LLOCE – LLOCV được trình bày trong Hình 6. Một nhánh nhãn trong LLOCV
phần tiếp theo.
Do hiện nay chưa có kho ngữ liệu song ngữ Anh-Việt đủ
IV. ĐÁNH GIÁ PHƯƠNG PHÁP TIẾP CẬN lớn và đạt tiêu chuẩn đã được gán nhãn ngữ nghĩa trên danh từ
Để đánh giá cho phương pháp tiếp cận này, chúng tôi dựa bởi các chuyên gia để làm cơ sở đánh giá và so sánh kết quả
vào hệ thống nhãn ngữ nghĩa trên từ điển ý niệm LLOCE (1) trên hệ thống tiếp cận của chúng tôi. Nên kết quả thực nghiệm
song ngữ Anh-Việt. Từ điển LLOCE được tổ chức và sắp xếp của chúng tôi chỉ mô tả cách thức tiến hành và số lượng nhãn
thành các chủ đề-14 chủ đề, mỗi chủ đề được chia thành nhiều ngữ nghĩa được gán trên kho ngữ liệu song song Anh-Việt mà
nhóm-129 nhóm, mỗi nhóm được chia thành nhiều lớp-2449 được chúng tôi tự xây dựng bằng máy học thống kê. Chất
lớp (được gọi là các lớp ngữ nghĩa) và mỗi lớp gồm các mục lượng các câu dịch tự động phụ thuộc vào so sánh độ tương
đồng ngữ nghĩa [12] và thống kê dịch chuyển từ vựng trong
(1) Tham khảo thêm tại đường link http://ucrel.lancs.ac.uk/usas/ hệ thống
sử dụng nhãn ngữ nghĩa LLOCE
74
74
HộiHội
ThảoThảo Quốc
Quốc Gia
2015 ĐiệnTử,
Tử,Truyền
TruyềnThông
Thông và
và Công
CôngNghệ
NghệThông
ThôngTinTin
(ECIT 2015)
(ECIT 2015)
ngôn ngữ chéo [10]. Chúng tôi thực nghiệm cho phương pháp
tiếp cận với kho ngữ liệu tự xây dựng từ nhiều nguồn khác BẢNG 3. NHÃN NGỮ NGHĨA ĐƯỢC GÁN
nhau trên các bản song ngữ Anh-Việt được tổng hợp trong
bảng 2. Số lượng Số danh từ Phần trăm từ
Ngữ liệu
danh từ được gán vựng
EVC 357.098 220.087 61,63%
Dịch máy 218.367 109.777 50,27%
Ngữ liệu LLOCE 107.009 65.711 61,41%
Giza++ song ngữ
Để đánh giá cho phương pháp tiếp cận, chúng tôi giữ lại
Tách từ 600 cặp câu song ngữ, 382 danh từ trong kho ngữ liệu huấn
Tiền xử lý luyện (mà nó không được sử dụng trong quá trình huấn luyện
Gán nhãn trước) và chúng tôi thu được kết qua như trong Bảng 4.
từ loại Dịch chuyển
từ vựng BẢNG 4. KẾT QUẢ ĐÁNH GIÁ THỰC NGHIỆM
Số nhãn Nhãn Độ chính Độ bao

Gán nhãn Tương đồng
được gán đúng xác phủ
ngữ nghĩa ngữ nghĩa 311 202 64,95% 52,88%
LLOCE
LLOCV Về kiểm tra chất lượng tập các khả năng lựa chọn dịch từ
tiếng Việt (ngôn ngữ nguồn) chúng tôi thấy vẫn còn một số từ
bên ngoài không liên quan đến nghĩa cần dịch, ví dụ như từ
Ngữ liệu tiếng Việt {xe đạp} có tập các khả năng {bicycle, tricycle, bike,
gán nhãn motocycle, velocipede, cyclist}, hoặc từ {văn phòng} có tập
khả năng {office, living room, meeting, placement}.
Hình 7. Kiến trúc tổng quát hệ thống gán nhãn Trong khuôn khổ nội dung nghiên cứu này, chúng tôi trình
bày một cách tiếp cận sử dụng thuật toán học không giám sát
Trong thực hiện bước tiền xử lý, chúng tôi sử dụng công cụ để gán nhãn vai trò ngữ nghĩa cho danh từ trong câu song ngữ
tách từ vnTokenizer, POS tagger cho văn bản tiếng Việt, POS Anh-Việt. Khai thác sự dịch chuyển từ vựng trong ngôn ngữ
tagger cho văn bản tiếng Anh. Sau đó, sử dụng công cụ chéo để gán nhãn, bên cạnh đó, cũng tận dụng được một số
GIZA++ cho giai đoạn gióng hàng ở mức từ. Tiếp theo sẽ tiến đặc trưng trong ngữ cảnh song ngữ để hỗ trợ ra quyết định gán
hành xác định và nhận dạng danh từ cần gán nhãn (loại bỏ các nhãn vai trò ngữ nghĩa thích hợp trong câu.
nhãn không cần thiết như động từ, trạng từ, tính từ …). Quá Với cách tiếp cận này, ngoài việc quan sát kết quả đạt
trình gán nhãn ngữ nghĩa sẽ dựa vào độ tương đồng ngữ nghĩa được chúng tôi nhận thấy rằng những từ mà có những dịch
và sự dịch chuyển từ vựng trong ngôn ngữ chéo để xác định chuyển tương tự thường được dùng để chia sẽ một vài yếu tố
nhãn hợp lý trong quá trình tính toán xác suất để thống kê ngữ ngữ nghĩa giúp cho thuật toán cũng cố nghĩa của từ bằng sự
nghĩa. tương đồng ngữ nghĩa với từ khác đảm bảo độ chính xác cao
hơn.
BẢNG 2. KHO NGỮ LIỆU ANH-VIỆT
V. KẾT LUẬN VÀ HƯỚNG PHÁT TRIỂN
Số cặp câu
Nguồn ngữ liệu Số từ
song ngữ Mặc dù kết quả thực nghiệm của chúng tôi không có kho
Ngữ liệu EVC 60.032 1.601.183 ngữ liệu để so sánh và đánh giá, nhưng hiệu suất của cách tiếp
Ngữ liệu dịch máy 20.000 1.109.564
cận này cũng đáng được ghi nhận với việc xây dựng một hệ
Ngữ liệu LLOCE 31.951 704.564
thống học không giám sát gán nhãn ngữ nghĩa, dựa trên độ
tương đồng ngữ nghĩa trong từ vựng của ngôn ngữ chéo, đây
Dữ liệu trong Bảng 2 sau đó được chúng tôi chuẩn hóa
là yếu tố cơ bản trong việc dịch thống kê, mặc dù độ tương
theo chuẩn kho ngữ liệu song ngữ, mã ký tự theo bảng mã
đồng được bắt đầu từ bản dịch máy, không phải là bản dịch rõ
Vietnam unicode, phong ký tự Time New Roman. Sau đó, căp
ràng của con người. Do đó, trong kết quả thực nghiệm chúng
câu song ngữ sẽ được gióng hàng và được kiểm tra bán tự
tôi chỉ quan tâm đến những vấn đề về độ bao phủ (recall) và
động. Việc làm này sẽ giúp chúng tôi cải thiện được hiệu suất
độ chính xác (precision) khi thực hiện mô hình dịch máy
gán nhãn cũng như giảm bớt phát sinh lỗi trong quá trình
thống kê để đánh giá độ tương đồng khi gán nhãn.
gióng hàng bằng phương pháp thống kê gây ra.
Trong kết quả đạt được có một vài câu quá dài với sự khác
Ví dụ cho một trường hợp được chuẩn hóa cặp câu song
biệt về bản chất ngôn ngữ, một số ngoại lệ, ký hiệu riêng khi
ngữ như sau:
dịch từ ngôn ngữ này sang ngôn ngữ khác, thì hệ thống sẽ
D5335: He swims every day during the summer
không tự động gióng hàng và gán nhãn được cho những cặp
D5335: Anh ấy bơi mỗi ngày suốt mùa hè
câu này. Thời gian tới chúng tôi sẽ cố gắng tăng độ dài của
Để kiểm tra quá trình gán nhãn danh từ trong kho ngữ liệu
câu dịch đến mức độ chấp nhận được hoặc có thể sử dụng một
chúng tôi thực hiện trên kho ngữ liệu trong bảng 2 với kết quả
số kỹ thuật để tách một câu dài hay với cú pháp đặc biệt thành
gán nhãn như trong bảng 3.
75
75
những câu ngắn hơn với sự liên kết đặc biệt, để khi cần thiết [2] Dekang Lin. 2000. Word Sense Disambiguation with a Similarity
Smoothed Case Library, Computers and the Humanities, 34: 147-152,
có thể kết hợp lại thành câu hoàn chỉnh đúng với ý nghĩa ban 2000.
đầu của nó. [3] Đinh Điền, 2006. Xử lý ngôn ngữ tự nhiên. Nhà xuất bản Đại học Quốc
Vấn đề thứ hai chúng tôi quan tâm đó là việc xây dựng một gia thành phố Hồ Chí Minh-2006.
kho ngữ liệu song ngữ Anh-Việt với các văn bản được dịch [4] Dinh Dien, Hoang Kiem. 2003. POS-Tagger for English-Vietnamese
song song chính xác bởi các chuyên gia, để làm cơ sở đánh giá Bilingual Corpus, Proceedings of the HLT-NAACL 2003 Workshop on
hiệu suất gán nhãn của hệ thống mà chúng tôi tiếp cận, khi đó Building and Using Parallel Texts: Data Driven Machine Translation
and Beyond.
việc cải tiến hiệu suất tiếp cận sẽ được ưu tiên hàng đầu trong
[5] George Miller, Martin Chodorow, Shari Landes, Claudia Leacock, and
việc gán nhãn ngữ nghĩa trong thời gian tới của chúng tôi. Bên Robert Thomas. 1994. Using a semantic concordance for sense
cạnh đó, hệ thống sử dụng dịch tự động, nên một số từ vừa identification. In ARPA Workshop on human Language Technology,
nhập nhằng trong tiếng Anh, vừa nhập nhằng trong tiếng Việt, Plainsboro, NJ, March.
hệ thống chỉ dựa vào thống kê theo xác suất nên thiếu thống [6] Lluís Marquez, Xavier Carreras, Kenneth C.Litkowski, Suzanne
tin về ngữ cảnh trong việc lựa chọn từ vựng để dịch. Thời gian Stevenson. 2008. Semantic Role Labeling: An Introduction to the
Special Issue, 2008 Association for Computational Linguistics. Volume
tới chúng tôi sẽ xây dựng và mở rộng kho ngữ liệu văn bản 34, number 2.
song ngữ Anh-Việt mà được dịch bởi các chuyên gia hoặc kết [7] Mc Arthur, Tom (1981). Longman Lexcicon of Contemporary English.
hợp thêm nhiều yếu tố trong ngôn ngữ nguồn, giúp sự lựa Longman London.
chọn từ vựng dịch từ tiếng Việt sang tiếng Anh đạt hiệu quả [8] Mona Diab. 2000. An Unsupervised Method for Multilingual Word
cao hơn. Sense Tagging Using Parallel Corpora: A Preliminary Investigation. In
SIGLEX2000: Word Sense and Multi-linguality, Hong Kong, October.
Mặc dù nội dung của bài báo còn nhiều hạn chế nhưng
cũng góp phần cung cấp thêm một hướng tiếp cận trong việc [9] Mona Diab, Philip Resnik. 2002. An Unsupervised Method for Word
Sense Tagging using Parallel Corpora, Proceeding of the 40th Annual
gán nhãn ngữ nghĩa trong xử lý ngôn ngữ tiếng Việt nhằm hỗ Meeting of the Association for Computational Linguistics (ACL),
trợ trong việc dịch tự động, truy vấn thông tin, tóm tắc văn Philadelphia, July 2002, pp. 255-262.
bản… Thời gian tới, chúng tôi cố gắng nghiên cứu nâng cao [10] Mikhail Kozhevnikov, Ivan Titov. 2013. Cross-lingual Transfer of
hiệu suất cho hệ thống và gán thêm nhãn cho động từ, tính từ Semantic Role Labeling Models, Proceedings of the 51st Annual
và trạng từ nhằm hoàn chỉnh hệ thống gán nhãn ngữ nghĩa cho Meeting of the Association for Computational Linguistics, pages 1190–
1200, Sofia, Bulgaria, August 4-9 2013.
các từ trong câu.
[11] Nancy Ide. 2000. Cross-Lingual Sense Determination: Can It Work?
Computers and the Humanities, 34: 223-234, 2000.
LỜI CẢM ƠN [12] Philip Resnik. 1999. Semantic Similarity in a Taxonomy: An
Chúng tôi xin chân thành cám ơn PGS.TS Đinh Điền đã hỗ Information-Based Measure and its Application to Problems of
Ambiguity in Natural Language, Journal of Artificial Intelligence
trợ định hướng chuyên môn cho nghiên cứu này và các đồng Research 11 (1999) 95-130.
nghiệp tại Phd.Lab của Khoa Công nghệ Thông tin Trường Đại [13] Philip Resnik. 1997. Selectional Preference and Sense Disambiguation.
học Khoa học Tự nhiên thành phố Hồ Chí Minh trong việc hỗ In ANLP Workshop on Tagging Text with Lexical Semantics,
trợ sử dụng các công cụ tính toán cho kết quả thực nghiệm của Washington, D.C., April.
chúng tôi. [14] Rayson, Paul, Dawn Archer, Scott Piao, Tony McEnery (2004). The
UCREL semantic analysis system. In proceedings of the workshop on
Beyon Named Entity Recognition Semantic labelling for NLP tasks in
TÀI LIỆU THAM KHẢO association with 4th International Conference on Language Resources
and Evaluation (LREC 2004), Lisbon, Portugal, pp.7-12.
[1] Daniel Gildea, Daniel Jurafsky. 2002. Automatic Labeling of Semantic [15] Scott Piao, Prancesca Bianchi, Carmen Dayrell, Angela D’Egidio, Paul
Roles, 2002 Association for Computational Linguistics. Volume 23, Rayson. 2015. Development of the Multilingual Semantic Annotation
number 3. System. The 2015 Conference of the North American Chapter of the
Association for Computatioal Linguistics - Human Language
Technologies (NAACL HLT 2015), May 31 to June 5 in Denver
Colorado.
76
76
Xây Dựng Giải Pháp Điều Khiển Thích Nghi Hội

Tụ Nhanh Để Thiết Kế Bộ Lọc Tích Cực 3 Pha
Huỳnh Lê Minh Thiện(*), Hồ Văn Cừu(**), Trần Thanh Vũ(***), Đỗ Đăng Trình(****)
Tóm tắt - Điều khiển bộ lọc tích cực nhằm đảm bảo ổn
định nguồn năng lượng điện được sử dụng trong công
nghiệp, trong các khu dân cư và đặc biệt là trong hàng
không và quân sự, là một trong những vấn đề cấp thiết
của ngành công nghiệp sản xuất năng lượng điện. Mục
đích chính của việc điều khiển bộ lọc là tạo ra sự ổn định
nhanh cho hệ thống năng lượng điện trong trường hợp
tải đột ngột tăng hoặc giảm cần phải có sự hộ trợ của bộ
nguồn dự phòng, bài viết chủ yếu phân tích các giải pháp
điều khiển bộ lọc để đáp ứng nhanh nhất sự ổn định
nguồn điện nhằm tránh các sự cố gây ra do tác động của
hệ thống điện năng. Hình 1. Sơ đồ nguyên lý của bô ̣ điề u khiể n ma ̣ch lo ̣c
tích cực mắ c shunt
Từ khóa - FFT, RDFT, APF, bộ lọc nguồn tích cực, ANN,
nghịch lưu đa bậc, sóng hài, PWM, hội tụ nhanh, chất Các kỹ thuâ ̣t ta ̣o tham chiế u truyề n thố ng có thể
lượng nguồn điện dự phòng. đươ ̣c phân loa ̣i gồm: phương pháp tiế p câ ̣n trong miề n
I. GIỚI THIỆU thời gian, phương pháp miề n tầ n số và gầ n đây là
phương pháp dùng bô ̣ lo ̣c thích nghi và tính toán
Năm 1984, Akagi phát triển lý thuyế t toán về công mề m. Hình 2 [1] mô tả phân loại chung của những kỹ
suấ t tức thời, đã mở ra cuộc cách mạng trong nghiên thuật quan trọng có trong hệ tham chiế u.
cứu và phát triển liñ h vực điề u khiể n nguồ n điện trên
toàn thế giới, trong đó việc điề u khiể n ma ̣ch lo ̣c tích
cực để tố i ưu hê ̣ thố ng nguồ n điện là mô ̣t trong những
hướng nghiên cứu mới nhằ m tố i ưu viê ̣c sử du ̣ng năng
lươ ̣ng điê ̣n, tuy nhiên, trong thực tế nguồn năng lượng
điện cung cấp từ mạng lưới điện luôn bị mất ổn định,
mấ t cân bằ ng pha, méo hài, để thiế t kế tối ưu các bộ
nguồn thì việc ứng dụng lý thuyế t công suấ t tức thời để
nghiên cứu xây dựng giải thuật hội tụ nhanh cho các bô ̣
lo ̣c tích cực dựa trên nề n các bô ̣ nghicḥ lưu đa bâ ̣c 3
pha là vấn đề trọng tâm cấp thiết và khả thi [1] – [2]. Hình 2. Phân loa ̣i kỹ thuâ ̣t hê ̣ tham chiế u
Vì vâ ̣y, trong bài báo này, chúng tôi trình bày một
hướng nghiên cứu và xây dựng giải pháp điều khiển Bài viết này trình bày bộ lọc ứng dụng kỹ thuâ ̣t ta ̣o
thích nghi hội tụ nhanh để điều khiển tối ưu bộ lọc tích tham chiế u theo phương pháp miề n thời gian.
cực 3 pha, nhằm đáp ứng yêu cầu đa dạng của người sử Lý thuyế t p-q: Cho tới nay, hầ u hế t các bô ̣ APF
dụng năng lượng điện và của thị trường công nghiệp. đươ ̣c thiế t kế dựa vào công suấ t phản kháng để tính
dòng bù sóng hài tham chiế u, mô tả như hình 3 [1], ưu
II. BỘ LỌC NGUỒN TÍCH CỰC - APF thế của phương pháp này là ổn định trạng thái và dễ
thiết kế nhưng nhươ ̣c điể m là cần có nhiều bộ chuyển
Vấ n đề tải không cân bằ ng, tải khản kháng làm cho
đổi và không hiệu quả cao trong việc bù sóng hài, bù
nguồ n điê ̣n đố i mă ̣t với nguy cơ sóng hài lan truyề n
âm và dòng thứ tự 0, nhươ ̣c điể m này đã đươ ̣c khắ c
trên hê ̣ thố ng. Sóng hài làm tăng tổ n hao trong hê ̣
phu ̣c mô ̣t phầ n bằ ng phương pháp công suấ t phản
thố ng, làm xáo trô ̣n và gây bấ t ổ n định trong ma ̣ng
kháng.
truyề n thông, điê ̣n áp, dòng điê ̣n nên cần thiết phải
nghiên cứu và phát triển bô ̣ lo ̣c nguồ n tích cực APF
(Active Power Filter) để cải thiê ̣n chấ t lươṇ g điê ̣n
năng. APF mắ c shunt đươ ̣c sử du ̣ng để loa ̣i bỏ sóng
hài bằ ng cách bù sóng hài điê ̣n áp/ dòng điê ̣n.
A. Kỹ thuật tham chiếu trong mạch lọc tích cực
Có 3 vấ n đề cầ n đươ ̣c xem xét đố i với ma ̣ch lo ̣c
tích cực mắ c shunt (Shunt Active Power Filter –
SAPF): 1. Tính dòng bù; 2. Lựa cho ̣n cấ u trúc bô ̣
chuyể n đổ i nguồ n phù hơ ̣p với nhu cầu sử du ̣ng; 3.
Điề u chế xung. Sơ đồ nguyên lý của bô ̣ điề u khiể n sử Hình 3. Sơ đồ khố i kỹ thuâ ̣t hê ̣ tham chiế u p-q tức
̣ lưu áp như hình 1 [1].
du ̣ng bô ̣ điề u chế xung nghich thời.
ISBN: 978-604-67-0635-9 77
77
Lý thuyế t khung tham chiế u đồ ng bô ̣: Đây là hê ̣ Vdkd=(V0+E0)/Vd;

quy chiế u tiñ h, đươ ̣c xác đinḥ bỡi góc ø với tru ̣c α-β, %Controlling signal modulation
tấ t cả các thành phầ n cơ bản đươ ̣c thể hiê ̣n như thành %Pha A
phầ n mô ̣t chiề u trên hê ̣ d-q và những sóng hài khác sẽ if Vdka>=Vc s11=1; s12=0;
xuấ t hiê ̣n như dơṇ sóng. Sử du ̣ng bô ̣ lo ̣c thông thấ p else s11=0; s12=1;
LPF để tách thành phầ n cơ bản iQ , hình 4 [1] là ma ̣ch end
nguyên lý, thành phầ n này dùng để tính toán dòng bù %Pha B
nế u đươ ̣c yêu cầ u. Ưu điể m của hê ̣ tham chiế u là phù if Vdkb>=Vc s21=1; s22=0;
hơ ̣p với bù sóng hài trong điề u kiê ̣n nguồ n sine nhưng else s21=0; s22=1;
nhươ ̣c điể m là yêu cầ u nhiề u bô ̣ chuyể n đổ i dòng áp end
cũng như trễ bù. %Pha C
if Vdkc>=Vc s31=1; s32=0;
else s31=0; s32=1;
end
%Pha D
if Vdkd>=Vc sn1=1; sn2=0;
else sn1=0; sn2=1;
end
Sa = [s11, s12, s21, s22, s31, s32, sn1, sn2];
Các áp va , vb , vc thỏa các điều kiện của lý thuyết p-
q cũng như các phép biế n đổ i đa ̣i số từ điê ̣n áp/dòng
điê ̣n ở hê ̣ tru ̣c a-b-c sang hê ̣ tru ̣c α-β-0, công thức (1a)
và (1b) [2]:
Hình 4. Sơ đồ khố i kỹ thuâ ̣t hê ̣ tham chiế u d-q
 11 1 
Có thể nhận thấy phương pháp miề n thời gian có  22 2  v (1a)
các ưu điể m là chắ c chắ n và dễ thực hiê ̣n, không bi ̣  v0    a
  2 1 1 
ảnh hưởng bỡi nhiễu băng rô ̣ng và méo truyề n dẫn v 
 1     vb 
nhưng có nhươ ̣c điể m về trễ bù, cầ n nhiề u bô ̣ chuyể n 3 2 2
v     vc 
đổ i dòng áp và khó thực hiê ̣n bù trong trường hơ ̣p áp
   3 3 
0 
nguồ n bi ̣méo da ̣ng.  2 2 
 1 1 1 
B. Thiế t kế bộ điề u khiể n thích nghi hội tụ nhanh  2
 i0  2 2  i (1b)
cho APF dựa trên lý thuyế t p-q.   a
  2 1 1  
Nguyên lý hội tụ nhanh được đưa vào giải thuật i 

3
1 
2

2  
ib
i     ic 
phần mềm, hình 5, dựa theo lý thuyết p-q, sao cho    3 3
công suất tức thời được đảm bảo, tức các quan hệ  0 2

2 
công suất vào/ ra thỏa mãn các đẳng thức của thuyết Công suấ t thứ tự 0 tức thời: p0 = v0.i0 (2)
này, đặc biệt công thức 10. Công suấ t thực tức thời: p = vα.iα + vβ.iβ (3)
Utj Công suấ t ảo tức thời: q = vβ.iα – vα.iβ (4)
Max V0max
-1/3
Min V0min V0 +
+
Uj0 Udkj
Thành phầ n công suấ t p và q quan hê ̣ giố ng
như dòng và áp trên hê ̣ α-β, và có thể viế t chung với
nhau, công thức (5):
Hình 5. Điều khiển nghịch lưu nhiều nhánh áp dụng  p   v v  i  (5)
nguyên lý offset và song mang   v
q
    v  i 
Giải thuật điều khiển bộ nghịch lưu 4 nhánh được điều
Và do đó, chúng ta dễ dàng có:
khiển với giải thuật song mang, có sơ đồ khối mô tả
p0 : giá tri ̣công suấ t thứ tự 0 tức thời
trên hình 5.
function[Sa,Vdka,Vdkb,Vdkc,Vdkd]=fcn(Vac, m, p0 : giá tri ̣nghich
̣ đảo của p0
Vd, Vc) p : giá tri ̣công suấ t tức thời
%Xac dinh ap tai 3 pha p : giá tri ̣nghich
̣ đảo của p
Vta = (200*m)/sqrt(3)*Vac(1);
Vtb = (160*m)/sqrt(3)*Vac(2); q : công suấ t ảo tức thời: q = 3*V*I1 *sinφ1
Vtc = (180*m)/sqrt(3)*Vac(3); Để tính dòng bù tham chiế u (điề u khiể n bù) trên hê ̣
V0= -(Vta+Vtb+Vtc)/3; α-β, ta biế n đổ i công thức (5) và công suấ t cầ n bù
%Xac dinh Eoff (( p - p0 ) và q) thu đươ ̣c công thức (6) [3]:
E0max=Vd-max([Vta,Vtb,Vtc,V0]); ic*  1  v v   p  p0  (6)
E0min=-min([Vta,Vtb,Vtc,V0]); *  2 2   
E0=(E0max+E0min)/2; ic  v  v v v   q 
%Vdk cac pha Khi dòng thứ tự 0 phải đươ ̣c bù, dòng bù tham
Vdka=(Vta+E0)/Vd; chiế u ở tru ̣c 0 cũng chính là i0:
Vdkb=(Vtb+E0)/Vd; ic*0  i0* (7)
Vdkc=(Vtc+E0)/Vd;
78
78
Để có đươ ̣c dò ng bù tham chiế u trên hê ̣ a-b-c, ta Nghich ̣ lưu đa bâ ̣c đươ ̣c sử du ̣ng ở cá c thiế t bi ̣ công
á p du ̣ng công thức (1), sau khi biế n đổ i ta đươ ̣c: suấ t cao bỡi nó có thể ta ̣o ra điê ̣n á p cao và công suấ t
 1
1 0 
 ngõ ra cao bằ ng cách sử du ̣ng cá c đóng ngắ t bán dẫn
 (8)
ica*   2   ic*0  mà không sử du ̣ng biế n áp và ma ̣ch cân bằ ng điê ̣n á p
* 2 1 1 3  *  tiñ h. Khi số bâ ̣c ngõ ra tăng, thì hà i củ a điê ̣n á p và
icb  
3 2

2
 ic
2  *  dò ng điê ̣n ngõ ra cũng như nhiễu điê ̣n tử giả m.
icc*  ic 
     Nguyên lý của nghich ̣ lưu đa bâ ̣c là sử du ̣ng nhiề u
1 1 3
   
 2 2 2  đóng ngắ t bán dẫn công suấ t với điê ̣n á p nguồ n DC
icn*  (ica*  icb*  icc* ) (9) thấ p hơn để thực hiê ̣n chuyể n đổ i công suấ t bằ ng cách
tổ ng hơ ̣p mô ̣t da ̣ng só ng điê ̣n á p bậc thang, để có đươ ̣c
Hình 6 [4] mô tả sơ đồ nguyên lý điề u khiể n bô ̣ mô ̣t da ̣ng só ng ngõ ra ít méo da ̣ng, gầ n như sine, tín
SAPF hiê ̣u kích phả i đươ ̣c ta ̣o ra để điề u khiể n tần số đóng
Những tính toá n nà y đươ ̣c á p du ̣ng và o cá c trường ngắ c của cá c van bá n dẫn công suấ t. Tín hiê ̣u kích củ a
hơ ̣p điề u khiể n bô ̣ lo ̣c tích cực mắ c shunt đố i với bô ̣ nhicḥ lưu đa bâ ̣c đươ ̣c ta ̣o ra theo nhiề u cách, ví du ̣
nguồ n cấ p tức thời liên tu ̣c, làm cho dò ng 3 pha trở sử du ̣ng sơ đồ chuyể n đổ i pha.
nên sine hơn, cân bằ ng và đồng pha với điê ̣n á p, tương
đương tải thuầ n trở. Dò ng trung tính bằ ng zero (ngay
cả hà i bâ ̣c 3 cũ ng đươ ̣c bù )
Tổ ng công suấ t tức thời cung cấ p, công thức (10)
[5]: p3s (t) = Va . isa + Vb . isb + Vc . isc (10)
Trong trường hơ ̣p nguồ n không sine, không cân
bằ ng, thì điể m khá c biê ̣t là dò ng cung cấ p sẽ bao gồ m
só ng hà i, nhưng trong thực tế sự méo da ̣ng nà y không
đáng kể . Cá ch điề u khiể n nguồ n dòng sine phải đươ ̣c
sử du ̣ng khi á p bi ̣ méo da ̣ng hoă ̣c không cân bằ ng và
mong muố n dòng đươ ̣c sine.
Hình 8. Mạch kích của bộ lọc tíc cực 3 pha 3 bậc cấu
hình diode kẹp hình 8
Kết quả phân tích 1 nhá nh củ a sơ đồ nguyên lý
nghich
̣ lưu 3 pha 3 bâ ̣c diode ke ̣p, như hình 9.
Hình 6. Nguyên lý điều khiển mạch lọc

C. Nguyên lý bộ nghi ̣ch lưu đa bậc
Hình 7 và hình 8 là mạch nguyên lý và mạch kích
của bộ lọc tích cực 3 pha 3 bậc cấu hình diode kẹp dựa
trên kỹ thuâ ̣t ta ̣o tham chiế u theo phương pháp miề n
Hình 9: Mô ̣t nhá nh nghich
̣ lưu áp 3 pha 3 bâ ̣c
thời gian, có tải RLC giả định.
Nguyên lý thiết kế và vận hành được mô tả bỡi Quy tắ c đố i nghi ̣ch: S21+S21’=1; S11+S11’=1 (10)
hình 9 và hình 10. [6].
Ba tra ̣ng thá i á p nghich
̣ lưu pha 1:
 Vd ; S11 S21 1
V (11)

u10  d 
 ; S 21 0,S11 1
2
 0; S11 S21 0
Do u10 có thể đa ̣t đươ ̣c 3 giá tri ̣là: 0, Vd và Vd nên go ̣i
2
là nghic̣ lưu 3 bâ ̣c.
Giả n đồ kỹ thuâ ̣t CPWM nghich ̣ lưu 3 bâ ̣c như mô tả
trong hình 10
Chú ý: để kích S11, S11’ ta so sá nh C1 với uđk 1 ;
Hình 7. Sơ đồ nguyên lý nghich ̣ lưu 3 pha 3 bâ ̣c diode
ke ̣p.
1; u  c1 (12)
Thiế t bi ̣ nghicḥ lưu đa bâ ̣c là mô ̣t thiế t bi ̣ điê ̣n tử S11   dk1
0; udk1  c1
công suấ t ta ̣o ra điê ̣n á p AC từ nhiề u bâ ̣c điê ̣n á p DC.
Tương tự, để kích S21, S21’ ta so sá nh C2 với uđk 1 ;
79
79
và ngược lại, nếu kết quả mạch so sánh (2) bằng “1”
1; u  c 2 thì ∆Ui > ∆Uc , tăng hệ số khuếch đại k , uđk tăng. Kết
S 21   dk1 (13)
quả so sánh ∆U tiến về 0, hay nói cách khác là uđk tiến
0; udk1  c 2 nhanh về utb .
Điề u điều kiện điều khiể n tuyế n tính là 0 ≤ uđk 1 < 1 và
1 ≤ uđk 1 ≤ 2, E. Giải thuật điều khiển thích nghi hội tụ nhanh
Vd Thông thường, giới hạn điện áp tham chiếu điều khiển
với 0 ≤ uđk 1 < 1 => u10  udk1 trong bộ so sánh (2), hình 11, được phân chia như
2
bảng 1, trong đó có N bậc điều khiển chuẩn, giá trị
V U dk
và 1 ≤ uđk 1 ≤ 2 => u10  d udk1 . (14) mỗi bậc là 
U ci x(i 
1),i 1, 2,.., N
2 N
Á p nghicḥ lưu trung bình thay đổ i tỉ lê ̣ thuâ ̣n với áp
điề u khiể n. Mở rô ̣ng cho bô ̣ nghich
̣ lưu áp n bâ ̣c NPC, Bảng 1. Giới hạn điện áp tham chiếu điều khiển
n>2. Ta có áp nghich ̣ lưu trung bình trên mô ̣t nhánh
Vd TT ∆Uci U (U
 c)
U dk
x(i  1) Hệ số k
pha: u10  udk1 (15) N
n 1 1 ∆Uc1 0
2 ∆Uc2 1
..
8 ∆Uc8 7
Giải thuật điều khiển nhanh, hình 12, là chia bảng điều
khiển thành các miền khác nhau phụ thuộc vào áp so
ánh của bộ so sánh (1) của hình 11.
Hình 10. Kích các van đóng ngắ t mô ̣t nhánh trong 3

nhá nh sơ đồ CPWM 3 bâ ̣c
D. Nguyên lý nghịch lưu đa bậc thích ứng
Kết quả của bài toán nghịch lưu đa bậc tìm được áp
nghịch lưu trung bình đa bậc trên 1 nhánh pha, như
công thức (11). Trong thực tế, tải luôn biến động ngẫu
Hình 12. Lưu đồ giải thuật điều khiển nhanh
nhiên, điện áp trung bình trên tải vì vậy cũng biến
động theo, mà mức độ tùy vào đặc tính tải; bài toán III. KẾT QUẢ MÔ PHỎNG BỘ ĐIỀU KHIỂN APF
điều khiển là tìm ra giá trị thông số ∆U giữa u10 và uđk
Trên cơ sở đã trình bày phần II, mục tiêu của APF
để điều chỉnh uđk nhằm đạt được ∆U = 0. Mô hình
trong hệ thống này là đảm bảo dạng sine cho nguồn
điều khiển thích ứng thực hiện như hình 11.
điện trong trường hợp tải không cân bằng, và do đó,
APF vẫn làm việc với nguyên lý của bộ nghịch lưu 3
pha 3 bậc, nhưng được điều khiển các IGBT để tái cấu
trúc dạng sóng điện áp/dòng điện nguồn để nó đạt sine
bằng cách nhận phản hồi từ phía tải theo sơ đồ nguyên
lý hình 13.
Hình 11. Mô hình điều khiển thích ứng

Mạch so sánh (1) so sánh áp trung bình và áp điều
khiển, kết quả so sánh là tạo ra áp ∆U . Mạch so sánh
(2) so sánh mức ngưỡng tham chiếu với ∆U được đưa
qua từ mạch so sánh (1). Trong giới hạn sai số điều
chỉnh chia ra nhiều bậc tham chiếu. Dựa vào kết quả
so sánh (2) để điều khiển bộ khuếch đại nhằm tạo hệ
số khuếch đại k phù hợp để đưa ra áp điều khiển thích Hình 13. Sơ đồ nguyên lý mô hình thực nghiệm mạch
nghi. Nguyên lý nếu kết quả mạch so sánh (2) bằng lọc tích cực
“0” thì ∆Ui < ∆Uc , giảm hệ số khuếch đại k , uđk giảm
80
80
Toàn bộ hệ thống gồm các khối cơ bản sau: Hướng nghiên cứu tiếp theo là xây dựng giải thuật
Khối cảm biến: xác định 3 áp pha nguồn, 3 dòng tải điều khiển hội tụ nhanh theo phương pháp tăng tốc độ
IL, 3 dòng ngõ ra bộ nghịch lưu IF, 1 áp VDC trên tụ lấy mẫu để điều khiển nhanh hơn.
DC.
Khối điều khiển mà hạt nhân là DSP TMS320F28335,
nhận tín hiệu từ cảm biến sau đó tính toán đưa ra 6
hoặc 8 xung kích tùy vào cấu hình 3 bậc 4 dây phân
đôi điện áp tụ hay cấu hình 3 bậc 4 nhánh. [1] Park Ki Won, R&D Center , POSCON, A review of Active
Khối mạch lái với nhiệm vụ chính là cách ly khối điều Power Filter, 2001
[2] Oleg Vodyakho, and Chris C. Mi, Three-Level Inverter-Based
khiển và công suất. Shunt Active Power Filter in Three-Phase Three-Wire and
Khối công suất chính là bộ nghịch lưu 3 bậc nguồn áp, Four-Wire Systems, 2009.
12 hoặc 16 IGBT được điều khiển bởi xung kích từ [3] N.V.Nho, M.J. Youn, Carrier PWM algorithm with optimized
mạch lái switching loss for three-phase four-leg multilevel
inverters, IEEE Letters, UK, vol.41, pp.43-44, vo.1, ISSN
Kết quả mô phỏng cho thấy khi hệ thống làm việc với 0013-5194, Jan. 2005
bộ lọc tác động, các thông số dòng áp đo tại tải, hình [4] Nguyễn Văn Nhờ, Myung- Bok Kim, Gun- Woo Moon,
14, đạt sine. Myung- Joong Youn, “A Novel Carrier Based PWM Method in
Three-phase Four-Wire Inverters”, IEEE 2004.
[5] H. Akagi, Y. Kanazawa, A. Nabae, “Generalized Theory of the
Instantaneous Reactive Power in Three-Phase,” IPEC'83 - Int.
Power Electronics Conf., Tokyo, Japan, 1983, pp. 1375-1386.
[6] N.V. Nho, N.X. Bac and H-H. Lee, "An Optimized
Discontinuous PWM Method to Minimize Switching Loss for
Multilevel Inverters,” IEEE Transactions on Industrial
Electronics, vol.58, no. 9, Sep. 2011.
TÁC GIẢ
(*), Huỳnh Lê Minh Thiện, sinh năm 1979, tại Bình Thuận, năm
2004, nhận bằng tốt nghiệp kỹ sư Điện – Điện Tử tại trường Đại học
Hình 14. Da ̣ng sóng nghich
̣ lưu tại tải sau điều khiển Sư Phạm Kỹ Thuật Thành Hồ Chí Minh, năm 2011, nhận bằng Thạc
sỹ kỹ thuật điện tử tại trường Đại học Sư Phạm Kỹ Thuật Thành Hồ
của bô ̣ CPWM 3 pha 3 bâ ̣c
Chí Minh. Hiện nay công tác tại khoa Điện tử viễn thông trường đại
Trong hình 12, c1 và c2 được gọi là sóng mang học Sài Gòn.
tam giác, tần số dùng trong mô phỏng này là 1 kHz; (**), Hồ Văn Cừu, sinh năm 1964, tại Quảng Ngãi, năm 1987, nhận
VcarrA, VcarrB và VcarrC được gọi là sóng sine tham bằng tốt nghiệp kỹ sư vô tuyến tại trường đại học Bách Khoa thành
chiếu (50 hz hoặc 60 hz có thể tùy chỉnh); Vab là dạng Hồ Chí Minh, năm 1997, nhận bằng Thạc sỹ kỹ thuật ngành điện tử
viễn thông tại trường đại học Bách Khoa, năm 2006, nhận bằng tiến
sóng 3 bậc trên tải RLC giữa pha A và pha B;
sỹ kỹ thuật ngành mạng và kênh thông tin. Hiện nay công tác tại
I(RLC_Loada), I(RLC_Loadb) và I(RLC_Loadc) là
khoa Điện tử viễn thông trường đại học Sài Gòn.
dòng điện qua tải trên các pha A, B và C. Tỉ số điều (***),Trần Thanh Vũ, sinh năm 1980, tại Việt Nam, nhận bằng tốt
chế trong trường hợp này là m=0.8. nghiệp kỹ sư Điện và bằng Thạc sỹ kỹ thuật Điện tại trường Đại học
IV. TỔNG KẾT VÀ BÀN LUẬN Bách Khoa TP.HCM năm 2005 và năm 2008, nhận bằng tiến sỹ kỹ
thuật ngành Điện năm 2013 và hoàn thành chương trình Postdoc
Kỹ thuâ ̣t điề u khiể n dùng bô ̣ lo ̣c thích nghi để điề u năm 2014 tại Đại học Ulsan, Ulsan, Hàn Quốc. Hiện nay công tác
khiể n bô ̣ APF mắ c shunt (SAPF), làm sine hóa dòng tại khoa Điện - Điện tử - Viễn thông trường đại học Giao Thông
tải, hội tụ nhanh, và gầ n như không ta ̣o sóng hài điê ̣n Vận Tải TP.HCM.
áp, nhưng rất nha ̣y cảm với sự thay đổ i tầ n số nguồ n. (****), Đỗ Đăng Trình, sinh năm 1980, tại Bình Thuận, năm 2004,
Thiế t bi ̣ nghicḥ lưu đa bâ ̣c đươ ̣c sử du ̣ng ở các thiế t bi ̣ nhận bằng tốt nghiệp cử nhân vật lý ứng dụng tại trường Đại Học
Khoa Học Tự Nhiên TP.HCM, nhận bằng thạc sỹ vật lý kỹ thuật
công suấ t cao bỡi nó có thể ta ̣o ra điê ̣n áp cao và công
năm 2010 tại Đại Học Cần Thơ, hiện đang công tác tại khoa cơ bản
suấ t ngõ ra cao bằ ng cách sử du ̣ng các đóng ngắ t bán
trường Đại Học Tây Đô, Quận Cái Răng, Thành phố Cần Thơ.
dẫn mà không sử du ̣ng biế n áp và ma ̣ch cân bằ ng điê ̣n
áp tiñ h. Khi số bâ ̣c ngõ ra tăng, thì hài của điê ̣n áp và
dòng điê ̣n ngõ ra cũng như nhiễu điê ̣n tử giảm.
Kết quả nghiên cứu kỹ thuâ ̣t điề u khiể n thích nghi
hội tụ nhanh để thiết kế bô ̣ lo ̣c tích cực 3 pha dựa trên
nguyên lý nghich ̣ lưu 3 bâ ̣c áp du ̣ng vào hê ̣ thố ng
nguồ n điê ̣n dựa theo ràng buộc về tham số chất lượng
của bô ̣ nguồ n, đây là bài toán sử dụng hiệu quả tài
nguyên năng lươ ̣ng điê ̣n trong môi trường nguồn điện
có tải biến động phức tạp, kết quả phân tích lý thuyết
và mô phỏng tìm được giải pháp điều khiển nhanh hơn
trong bài toán cân bằng tải động, tuy nhiên cần tiếp
tục nghiên cứu để tìm ra kết quả mới và hoàn thiện
thực nghiê ̣m và đánh giá kế t quả cũng như khẳng định
tính mới của nghiên cứu.
81
81
Một phương pháp trích trọn thuộc tính hiệu quả cho
dữ liệu có số chiều lớn
Hà Văn Sang1, Đồng Thị Ngọc Lan1 và Ngô Thị Thu Trang2
1 Khoa
Hệ thống thông tin Kinh tế, Học Viện Tài chính
Viễn thông, Học viện Công nghệ Bưu chính Viễn thông
2 Khoa
Email: sanghv@hvtc.edu.vn, landn0101@gmail.com, trangntt1@gmail.com
Abstract— Phân lớp là một trong những bài toán cơ bản trong pháp này có ảnh hưởng ngay lập tức đến các ứng dụng như
khai phá tri thức và dữ liệu. Một thách thức của bài toán phân tăng tốc độ của các thuật toán khai phá dữ liệu, cải thiệu chất
lớp là số lượng thuộc tính thường rất lớn, việc phân lớp sao cho lượng dữ liệu và vì vậy tăng hiệu suất khai phá dữ liệu, kiểm
chính xác và hiệu quả hiện vẫn là một nghiên cứu thú vị cho các soát được các kết quả của thuật toán.
nhà khoa học trong lĩnh vực khoa học máy tính. Bài báo đi sâu
vào nghiên cứu giải thuật phân lớp thuộc tính random forest
Trong bài báo này chúng tôi sẽ trình bày một đề xuất mới
(RF). Đây là một giải thuật đã được nhiều nghiên cứu chứng để dựa vào đó xây dựng mô hình trích chọn đặc trưng tối ưu
minh là rất hiệu quả trong phân lớp thuộc tính đối với bộ dữ liệu giúp giảm kích cỡ của dữ liệu theo hướng chỉ giữ lại các thuộc
có số lượng thuộc tính lớn. Trên cơ sở đó bài báo đề xuất một tính đặc trưng, loại bỏ những thuộc tính không liên quan và
phương pháp học máy cho giải thuật phân lớp này nhằm tăng những thuộc tính nhiễu nhằm tăng tốc độ các thuật toán phân
hiệu quả phân lớp của thuật toán. Cách tiếp cận này về cơ bản đã lớp cải thiện chất lượng dữ liệu và vì vậy sẽ tăng hiệu suất của
làm tăng khả năng phân lớp của giải thuật RF, phương pháp đề việc khai phá dữ liệu. Cụ thể, phương pháp đề xuất sẽ chọn ra
xuất còn cho thấy khả năng phân lớp tốt hơn một số phương những thuộc tính tốt nhất để làm tăng năng suất của thuật toán
pháp trích chọn đã được công bố. Như vậy, hướng cải tiến mà bài phân lớp Random Forest.
báo đề xuất là có khả thi và thu được kết quả tương đối cao.
II. CƠ SỞ LÝ THUYẾT
Keywords- randomforest, trích chọn thuộc tính, phân lớp dữ
liệu, khai phá dữ liệu.
A. Trích chọn thuộc tính
Trích chọn thuộc tính là một bước cơ bản nhất trong việc
I. GIỚI THIỆU tiền xử lý dữ liệu, nó làm giảm bớt số chiều của mẫu. Lựa chọn
Trong xu hướng hội nhập quốc tế, thời đại thông tin bùng thuộc tính có thể là một phần vốn có của trích chọn thuộc tính
nổ, chúng ta đang “ngập lụt” trong dữ liệu nhưng lại “đói” về ví dụ như phương pháp phân tích thành phần cơ bản hoặc thậm
tri thức, cho nên một trong các vấn đề cấp thiết đó là làm sao chí là một thiết kế xử lý thuật toán ví dụ như trong thiết kế cây
phân tích và xử lý một khối lượng thông tin khổng lồ liên tục quyết định. Tuy nhiên, lựa chọn thuộc tính thường là một bước
được cập nhật để đáp ứng các yêu cầu về phát triển mọi mặt cô lập riêng biệt trong một chuỗi xử lý [7].
văn hoá, kinh tế, chính trị, xã hội của đất nước. Hiện nay phần Có thể định nghĩa lựa chọn thuộc tính là một quá trình tìm
lớn các thuật toán phân lớp đã phát triển chỉ có thể giải quyết ra M thuộc tính từ tập N thuộc tính ban đầu, như vậy phải xác
được một lượng số liệu giới hạn cũng như một độ phức tạp dữ định tiêu chuẩn lựa chọn thuộc tính [8]. Theo cách này, kích cỡ
liệu biết trước. Trong khi đó nhờ sự phát triển mạnh mẽ của của không gian đặc trưng được rút ngắn tối đa theo một tiêu
khoa học và kỹ thuật, khối lượng dữ liệu mà chúng ta thu thập chuẩn định lượng nhất định. Khi kích cỡ của một lĩnh vực được
được ngày càng phong phú và đa dạng. Hơn nữa, tuỳ thuộc vào mở rộng, số phần tử của tập N sẽ tăng lên, vì vậy việc tìm ra
từng loại dữ liệu và ứng dụng cụ thể mà mỗi thuật toán có độ một tập đại diện tốt nhất thường gặp khó khăn và có nhiều vấn
tốt xấu không giống nhau. Các nghiên cứu cho thấy có rất đề liên quan đến tập được chọn. Nhìn chung, một thuật toán
nhiều hướng cải tiến các thuật toán phân lớp như áp dụng các trích chọn gồm 4 bước cơ bản: Sinh tập con, lượng giá tập con,
thuật toán lai ghép (ensemble method), các thuật toán dựa vào điều kiện dừng và xác nhận kết quả.
phương pháp nhân (kernel-based method), hoặc áp dụng các Quá trình sinh tập con là một thủ tục tìm kiếm, về cơ bản
phương pháp trích chọn đặc trưng (feature extraction/ selection nó sinh ra những tập con dùng cho việc lượng giá. Gọi N là số
method). Với các phương pháp kể trên phương pháp trích chọn các đại diện (đặc trưng) của tập dữ liệu gốc ban đầu, thì tổng số
đặc trưng trở nên nổi trội và có một số ưu điểm phù hợp trong các tập con có thể được sinh ra sẽ là 2 n, 2n tập này sẽ liệt kê
việc xử lý dữ liệu có số lượng thuộc tính lớn (vài nghìn đến vài toàn bộ các tập con của không gian. Mỗi tập con được sinh ra
trăm nghìn thuộc tính) nhưng đồng thời chỉ có một số lượng bằng thuật toán cần được lượng giá trị bằng một tiêu chuẩn
khá nhỏ các mẫu phân tích (vài chục hoặc vài trăm). Trong lượng giá trị nhất định và được so sánh với tập con tốt nhất đã
khai phá dữ liệu thì phương pháp trích chọn đóng một vai trò tìm được trước nó. Nếu không có điều kiện dừng phù hợp,
quan trọng để trích chọn và chuẩn bị dữ liệu. Hướng tiếp cận thuật toán này có thể sẽ chạy mãi không dừng. Điều kiện dừng
này làm tăng hiệu năng thu nhận tri thức trong các ngành như của một quá trình sinh phải rơi vào một trong số các trường
tin sinh, xử lý dữ liệu web, xử lý tiếng nói, hình ảnh,... Phương hợp sau:
ISBN: 978-604-67-0635-9 82
82
HộiHội
Thảo Quốc
Thảo Gia
Quốc 2015
Gia 2015về
vềĐiện
ĐiệnTử,
Tử,Truyền
TruyềnThông vàCông
Nghệ Thông
Thông TinTin (ECIT
(ECIT 2015)
2015)
- Toàn bộ các phần tử của tập hợp đều được chọn. cây trong các tập nói trên. Đối với cây thứ k trong tập các cây,
một véc tơ ngẫu nhiên Θk được tạo ra, véc tơ này độc lập với
- Các phần tử chưa chọn bị lặp lại. các véc tơ được tạo ra trước đó Θ1, Θ2, …, Θk-1 nhưng sự
- Sinh thêm một tập con nữa cũng không cho kết quả phân bố của các véc tơ này là tương tự nhau. Một cây được
tốt hơn. phát triển dựa vào tập huấn luyện và véc tơ Θk kết quả là được
một phân lớp h(x, Θk) trong đó x là véc tơ đầu vào. Sau khi
- Đã chọn đủ số tập con thoả mãn điều kiện tiêu chuẩn. một số lượng lớn các cây được tạo ra các cây này “bỏ phiếu”
Tập con tốt nhất được chọn ra phải được lượng giá trong cho lớp phổ biến nhất.
những trường hợp khác nhau và nó cùng với tập gốc phải biểu Random forest được định nghĩa như sau [8]: Một random
diễn được với dữ liệu thực tế. Lựa chọn các thuộc tính có thể forest là một phân lớp bao gồm một tập các phân lớp có cấu
tiến hành theo hai cách: cách thứ nhất là xếp loại các thuộc tính trúc cây {h(x, Θk), k=1,… trong đó {Θk} là những véc tơ độc
theo một tiêu chuẩn nào đó và lấy ra k thuộc tính đầu tiên, cách lập, tương tự nhau được phân bố một cách ngẫu nhiên và mỗi
này là dựa vào ngưỡng để chọn thuộc tính. Cách thứ hai là cây sẽ bỏ một phiếu bầu cho lớp phổ biến nhất ở véc tơ đầu vào
chọn ra tập con nhỏ nhất mà không làm giảm đi quá trình học, x.
cách này tự động xác định số lượng thuộc tính.
Ý tưởng chính của giải thuật random forest:
Lựa chọn thuộc tính có thể dựa vào các mô hình, các chiến
lược tìm kiếm, thước đo chất lượng thuộc tính và ước lượng. • Ở mỗi lần phân chia cây một tập ngẫu nhiên m thuộc
Có ba loại mô hình như Filter, Wrapper, Embedded. Các chiến tính được lấy ra và chỉ m thuộc tính này tham gia vào việc phân
lược tìm kiếm bao gồm: forward, backward, floating, branch chia cây.
and bound, randomized. • Đối với mỗi cây phát triển dựa trên một mẫu boostrap,
Ước lượng của việc chọn lựa thuộc tính bao gồm hai nhiệm tỷ lệ lỗi của các phần tử không thuộc vào bootstrap là được
vụ: một là so sánh hai giai đoạn: trước và sau khi lựa chọn kiểm soát. Tỷ lệ lỗi này được gọi là tỷ lệ lỗi “out-of-bag”
thuộc tính. Hai là so sánh hai thuật toán lựa chọn thuộc tính [1]. (OOB).
Tóm lại lựa chọn thuộc tính được xem như là sự tổng hợp của
Qua những tìm hiểu trên về giải thuật RF ta có nhận xét
ba thành phần chính: tìm kiếm, đánh giá, chọn lựa mô hình. Về rằng RF là một phương pháp phân lớp tốt do: (1) Trong RF các
cơ bản có thể phân loại các phương pháp lựa chọn thuộc tính sai số (variance) được giảm thiểu do kết quả của RF được tổng
gồm có Filter, Wrapper và Embedded. hợp thông qua nhiều bộ học (learner), (2) Việc chọn ngẫu
Hướng tiếp cận Filter (Các thuộc tính được chọn độc lập nhiên tại mỗi bước trong RF sẽ làm giảm mối tương quan
với thuật toán khai phá dữ liệu)[13] (correlation) giữa các người học trong việc tổng hợp các kết
quả. Ngoài ra, chúng ta cũng thấy rằng lỗi chung của một rừng
Hướng tiếp cận Wrapper (Các thuộc tính được chọn phụ các cây phân lớp phụ thuộc vào lỗi riêng của từng cây trong
thuộc theo 1 nghĩa nào đó với thuật toán khai phá dữ liệu)[13] rừng cũng như mỗi tương quan giữa các cây.
Để thực hiện được các thuật toán trích chọn chúng ta phải
thực hiện được một số công việc sau: III. MÔ HÌNH ĐỀ XUẤT
- Phương pháp để sinh ra tập thuộc tính đặc Bài báo sử dụng mô hình Wrapper với hàm mục tiêu để đánh
trưng(tương ứng với các chiến lược tìm kiếm) giá ở đây là thuật toán toán Random Forest được biểu diễn như
- Định nghĩa hàm đánh giá (Đưa ra tiêu chí để xác định hình 3.1 dưới đây.
1 thuộc tính hay 1 nhóm thuộc tính là tốt hay xấu)
- Ước lượng hàm đánh giá (Kiểm chứng hàm đánh giá
có thực sự phù hợp và hiệu quả với bộ dữ liệu không).
B. Thuật toán Random Forest

Random Forest (rừng ngẫu nhiên) [14, 15, 16] là phương
phân lớp thuộc tính được phát triển bởi Leo Breiman tại đại
học California, Berkeley. Về bản chất RF sử dụng kỹ thuật có
tên gọi là bagging. Kỹ thuật này cho phép lựa chọn một nhóm
nhỏ các thuộc tính tại mỗi nút của cây phân lớp để phân chia
thành các mức tiếp theo. Do đó, RF có khả năng phân chia
không gian tìm kiếm rất lớn thành các không gian tìm kiếm
nhỏ hơn, nhờ thế thuật toán có thể thực hiện việc phân loại một
cách nhanh chóng và dễ dàng.
Trong random forest, sự phát triển của một tập hợp các cây
đã làm cải thiện một cách đáng kể độ chính xác phân lớp, mỗi
cây trong tập hợp sẽ “bỏ phiếu” cho lớp phổ biến nhất. Để phát Hình 3.1: Mô hình đề xuất
triển các tập hợp cây này thông thường các véc tơ ngẫu nhiên Kiến trúc của hệ thống gồm hai phần chính:
được tạo ra, các véc tơ này sẽ chi phối sự phát triển của mối
83
83
HộiHội
ThảoThảo Quốc
Quốc Gia
2015 ĐiệnTử,
Tử,Truyền
TruyềnThông
Thông và
và Công
CôngNghệ
NghệThông
ThôngTinTin
(ECIT 2015)
(ECIT 2015)
Phần 1 được sử dụng để tìm ra bộ thuộc tính tốt nhất. Một 2.69 GHz, RAM 4GB. Phương pháp học máy được thực hiện
cách tổng quát là hệ thống sinh ra các bộ thuộc tính con, sau đó trên ngôn ngữ R, đây là ngôn ngữ chuyên dùng trong xác suất
sử dụng thuật toán học máy RF để đánh giá các bộ thuộc tính thống kê, có thể tải về từ địa chỉ www.r-project.org, gói
con này. Quá trình này lặp đi lặp lại tới khi thỏa mãn điều kiện random forest cũng được tải về từ địa chỉ này, các mô đun khác
dừng hệ thống sẽ thu được bộ thuộc tính tối ưu nhất. là hoàn toàn tự xây dựng, không sử dụng hay kế thừa lại của
bất cứ nguồn nào.
Phần 2 để kiểm chứng lại xem mô hình đưa ra có phù hợp
không. 4.2 Quá trình thực nghiệm và kết quả
Thuật toán đề xuất Chúng tôi đã sử dụng bộ dữ liệu có trên thực tế để kiểm
nghiệm hệ thống là bộ dữ liệu mô tả về bệnh ung thư dạ dày.
Chúng tôi đề xuất thuật toán để đánh giá và tìm ra tập các Kết quả thực nghiệm được trình bày dưới đây.
thuộc tính tốt từ tập các thuộc tính ban đầu như sau:
Bộ dữ liệu ung thư dạ dày (Stomach)
Bước 1: Tạo ra m bộ thuộc tính từ tập n thuộc tích ban đầu.
Bộ dữ liệu Stomach Cancer gồm 137 mẫu bao gồm
Mỗi bộ chứa 2*n/m thuộc tính. Gồm: các thông tin về gen của các bệnh nhân bị bệnh và không bị
n/m thuộc tính đều nhau bệnh. Trong đó có 67 mẫu của bệnh nhân bình thường và 70
mẫu của người bị bệnh. Bộ dữ liệu này được cung cấp bởi
n/m thuộc tính ngẫu nhiên Trung tâm nghiên cứu về bệnh ung thư của Đại học Quốc gia
Bước 2: Tính thang điểm ước lượng cho từng bộ thuộc tính Seoul tại Seoul, Hàn Quốc [17].
- Dùng RF tính thang điểm ước lượng cho các bộ thuộc Bộ dữ liệu là bảng hai chiều 137 x 119, gồm 137 bản ghi,
tính. mỗi bản ghi có 119 thuộc tính. Các bản ghi trong bộ dữ liệu
được phân thành hai lớp ký hiệu là normal (bệnh nhân bình
= > Được tập các giá trị ước lượng f(i) (i=1,..,m) thường) và cancer (bệnh nhân bị ung thư).
Bước 3: Tính ranking theo trọng số của từng thuộc tính. Kết quả và phân tích thực nghiệm trên bộ dữ liệu Stomach
Trọng số của mỗi thuộc tính i được tính theo công Phần 1: Thực thi thuật toán RF trên bộ dữ liệu
thức: Stomach gốc 20 lần, mỗi lần chạy lại thực hiện kiểm chứng
chéo 5 lần với số cây lần lượt là 100,300,500,800,1000 ta được
kết quả như sau :
(1) Bảng 4.1 Giá trị trung bình, độ lệch chuẩn khi chạy RF 20
kij = 0 nếu thuộc tính thứ i không được chọn trong bộ thuộc lần trên bộ dữ liệu Stomach với số cây lần lượt bằng
tính thứ j 100,300,500,800,1000.
kij = 1 nếu thuộc tính thứ i được chọn trong bộ thuộc tính Giá
thứ j Số Giá trị Giá trị trị
cây trung Độ lệch nhỏ lớn
Bước 4: Xây dựng tập mới gồm p% thuộc tính tốt nhất bình chuẩn nhất nhất
Quay lại B1. Điều kiện dừng: 100 0.7765 0.02539685 0.73 0.82
a) Số thuộc tính < ngưỡng cho phép, hoặc bộ thuộc tính 300 0.781 0.0148324 0.76 0.81
mới có độ thích hợp không lớn hơn bộ thuộc tính vừa xác định
trước đó. 500 0.7875 0.01996708 0.76 0.83
b) Số vòng lặp xác định 800 0.795 0.01538968 0.77 0.81
Trên đây là hướng đề xuất để tìm ra bộ thuộc tính tối ưu nhỏ 1000 0.796 0.0146539 0.76 0.82
nhất, cách làm này mục đích là để hạn chế số lượng thuộc tính Ta thấy số cây tăng lên thì độ chính xác phân lớp của RF
đầu ra. Các thuộc tính ban đầu được phân chia đều để đảm bảo cũng tăng lên, độ lệch chuẩn nhỏ dần, điều đó rõ ràng là đúng
tất cả các thuộc tính đều được chọn, rồi kết hợp với cách phân với tư tưởng của thuật toán, vì RF thực hiện phân lớp bằng
chia các thuộc tính ngẫu nhiên để tạo được các bộ con thuộc phương pháp xây dựng cây, mỗi cây sẽ bỏ phiếu cho một phân
tính mới. Sau đó dùng thuật toán học máy RF tính độ phù hợp lớp, số lượng cây càng lớn thì số phiều bầu cho phân lớp càng
của các bộ thuộc tính. Dựa trên các giá trị độ phù hợp vừa tính nhiều, do độ độ chính xác phân lớp càng cao. Từ kết quả độ
được chúng ta tìm ra bộ thuộc tính có số lượng thuộc tính ít lệch chuẩn tính được chứng tỏ RF chạy tương đối ổn định.
hơn mà vẫn đảm bảo được mục tiêu của bài toán.
IV. KẾT QUẢ
4.1 Môi trường thực nghiệm
Tất cả các thực nghiệm được thực hiện trên máy Laptop với
bộ xử lý Intel (R) Core (TM) i7 -2620 M CPU @ 2.70 GHz
84
84
Bảng 4.2 Thời gian (phút) trung bình,nhỏ nhất, lớn nhất khi Bảng 4.4 Thời gian trung bình,nhỏ nhất, lớn nhất khi huấn
huấn luyện và kiểm tra RF 20 lần trên Stomach với số cây lần luyện và kiểm tra RF 20 lần trên Stomach tối ưu với số cây lần
lượt bằng 100,300,500,800,1000. lượt bằng 100,300,500,800,1000.
Thời Thời Thời Thời Thời Thời Thời Thời Thời Thời Thời Thời
gian gian gian gian gian gian gian gian gian gian gian gian
Số huấn huấn huấn kiểm kiểm kiểm Số huấn huấn huấn kiểm tra kiểm kiểm
cây luyện luyện luyện tra tra tra cây luyện luyện luyện trung tra tra
trung nhỏ lớn trung nhỏ lớn trung nhỏ lớn bình nhỏ lớn
bình nhất nhất bình nhất nhất bình nhất nhất nhất nhất
100 0.379 0.366 0.402 0.0294 0.018 0.04 100 0.1235 0.11 0.16 0.011 0 0.02
300 0.9621 0.946 0.986 0.0339 0.024 0.046 300 0.319 0.29 0.39 0.0165 0 0.03
500 1.5574 1.502 1.846 0.0386 0.03 0.046 500 0.5445 0.51 0.61 0.0205 0.01 0.05
800 2.4123 2.366 2.482 0.0361 0.03 0.042 800 0.8555 0.81 0.92 0.0275 0.01 0.05
1000 3.0899 3.01 3.146 0.0391 0.032 0.048 1000 1.031 0.99 1.08 0.03 0.01 0.06
4.3 Nhận xét
Số lượng cây càng lớn thì thời gian huấn luyện và kiểm tra So sánh bảng 4.1 với bảng 4.3 ta thấy tỉ lện đoán nhận của
càng tăng vì số cây càng lớn thì số phép toán thực hiện càng RF với bộ thuộc tính mới tăng lên rõ ràng, ước tính tăng
nhiều nên thời gian thực hiện cũng tăng theo. khoảng 5%, thuật toán RF cho kết quả đoán nhận trung bình là
78% trên bộ dữ liệu ban đầu, còn RF chạy trên bộ dữ liệu sau
Phần 2: Tiến hành lựa chọn bộ dữ liệu tối ưu từ bộ dữ khi lựa chọn các thuộc tính bằng thuật toán đề xuất cho kết quả
liệu Stomach ban đầu bằng phương pháp đề xuất ở trên. Với đoán nhận trung bình là 83%. Từ bảng 4.2 và 4.4 ta cũng thấy
tập các thuộc tính ban đầu, chúng ta thực hiện chia thành m bộ thời gian huấn luyện và thời gian kiểm tra đều giảm đi đáng kể.
thuộc tính con bằng cách sử dụng hàm sample( , ,replace=True) Tỉ lệ đoán nhận trên bộ thuộc tính mới tăng lên cho thấy bộ
sao cho mỗi bộ chứa n/m thuộc tính phân phối đều và n/m
thuộc tính mới đã loại bỏ được một số thuộc tính nhiễu, thuộc
thuộc tính ngẫu nhiên, với n là tổng số thuộc tính, m là tham số tính dư thừa. Còn thời gian giảm đi là vì số lượng thuộc tính đã
phân chia(cụ thể thực nghiệm chọn m=10). Mất khoảng 20 giảm xuống tương đối nhiều, cụ thể từ 119 thuộc tính ban đầu,
phút để lựa chọn được một bộ thuộc tính mới có độ chính xác sau khi lựa chọn bộ thuộc tính mới còn là 36 thuộc tính, như
đoán nhận gần 84% . Cụ thể, file kết quả BestDPos cho biết bộ vậy số thuộc tính đã giảm khoảng 69% số thuộc tính ban đầu.
thuộc tính mới gồm 36 thuộc tính có vị trí tương ứng trong số
Điều đó chứng tỏ phương pháp thực nghiệm mà bài báo đưa ra
119 thuộc tính ban đầu là : cho hiệu quả tương đối tốt. Tuy nhiên, để tìm ra một bộ thuộc
2 8 15 16 19 26 27 28 34 tính mới chúng ta đã tiêu tốn một khoảng thời gian tương đối
45 50 53 57 58 59 61 64 66 68 lớn. Với bộ dữ liệu Stomach chúng ta mất khoảng 20 phút để
69 71 77 80 82 90 93 95 tìm ra được một bộ thuộc tính tối ưu hơn, và với các bộ dữ liệu
101 102 103 107 109 110 116 118 119 lớn hơn thì thời gian đó lại tăng lên, nhưng chúng ta chỉ mất
thời gian 1 lần tìm bộ thuộc tính tối ưu. Sau đó, tất cả các bài
Với bộ thuộc tính mới tìm được ta lại thực hiện lại phần 1 toán sử dụng bộ dữ liệu này khi thực thi trên bộ thuộc tính mới
đã trình bày ở trên được kết quả đoán nhận của RF khi chạy 20 sẽ giảm thời gian tính toán trên tất cả các lần chạy. Và từ đó,
lần trên bộ thuộc tính mới biểu diễn bởi bảng 4.3 thì thời gian làm việc sẽ giảm đi đáng kể.
Bảng 4.3 Giá trị trung bình, độ lệch chuẩn khi chạy RF 20 Bộ thuộc tính mới tìm được theo phương pháp đề
lần trên Stomach tối ưu với số cây lần lượt bằng xuất, đáp ứng được các mong muốn của chúng ta là nâng cao
100,300,500,800,1000. hiệu suất phân lớp và giảm thời gian học và thời gian kiểm thử.
Giá trị Đặc biệt, trên các bảng 4.1, 4.3 ta thấy độ lệch chuẩn khi chạy
Số RF trên bộ thuộc tính mới chỉ bằng 1/4 đến 1/3 độ lệch chuẩn
trung Độ lệch Giá trị Giá trị
cây khi chạy RF trên bộ dữ liệu ban đầu, chứng tỏ chạy RF trên bộ
bình chuẩn nhỏ nhất lớn nhất
dữ liệu mới ổn định hơn trên bộ dữ liệu ban đầu. Những điều
100 0.825288 0.009637 0.803843 0.846115 vừa nhận xét được minh họa rõ nét hơn trên các hình 4.1-4.2
300 0.822774 0.007596 0.806182 0.836424 sau đây. Các hình vẽ đó phản ánh cho chúng ta thấy chạy RF
trên bộ dữ liệu mới cho kết quả cao hơn và ổn định hơn và
500 0.826391 0.008341 0.803342 0.842774 chạy nhanh hơn khi chạy RF trên bộ dữ liệu Stomach ban đầu.
800 0.832055 0.007423 0.821053 0.846784
1000 0.833693 0.00556 0.824561 0.840769
85
85
HộiHội
việc thay đổi một số tham số còn làm thuật toán tiêu tốn thời
gian hơn nữa.
Để giải quyết hạn chế của phương pháp học máy được đề
xuất ở trên trong thời gian tới chúng tôi sẽ chú trọng tìm hiểu,
cải tiến nhằm tăng tốc độ phân lớp của giải thuật. Đồng thời,
chúng tôi cũng tiến hành thử nghiệm phương pháp trên nhiều
bộ dữ liệu khác nhau nhằm đánh giá độ chính xác và ổn định
của phương pháp đối với từng loại dữ liệu cụ thể. Chúng tôi sẽ
tìm hiểu một số phương pháp phân lớp khác như cây quyết
định hoặc phương pháp véc tơ hỗ trợ (SVM), để thay thế thuật
toán Random Forest khi đánh giá kết quả dự đoán. Rồi tiến
Hình 4.1 Biểu đồ so sánh kết quả chạy RF 20 lần trên bộ dữ hành so sánh giữa các phương pháp này với nhau. Qua đó,
liệu mới và bộ dữ liệu ban đầu với số cây bằng chúng tôi hy vọng có thể đóng góp thêm một chọn lựa cho các
100,300,500,800,1000. nhà phát triển ứng dụng khi phát triển các ứng dụng liên quan
đến phân lớp dữ liệu.

[1] Nguễn Hà Nam, tối ưu hóa KPCA bằng GA để chọn các thuộc tính đặc
trưng nhằm tăng hiệu quả phân lớp của thuật toán Random Forest, Tạp
chí Khoa học ĐHQGHN, Khoa học Tự nhiên và Công nghệ 25 (2009)
84-93
[2] Nguyễn Đình Thúc, Lập trình tiến hóa, Nhà xuất bản giáo dục, 2001
[3] Huan Liu and Hiroshi Motoda, Co mputational Methods of Feature
Selection, Chapman & Hall/CRC, 2008
[4] YongSeog Kim and Filipppo Meczenc, Feature Selection in Data
Mining, 2005
[5] Jacek Jarmu lak and Susan Craw, Genetic Algorith ms for Featu re
Selection and Weighting, IJCAI 99 workshop, 1999
[6] Jihoon Yang and Vasant Honavar, Feature Subset Selection Using a
Genetic Algorithm, Artifical Intelligence Research Group
Hình 4.2 Biểu đồ so sánh thời gian chạy trung bình của 20
[7] Krzysztof J.Cios, Witold Deddrycz, Ro man W.Swin iarski, Lu kasz
lần chạy RF trên bộ dữ liệu mới và bộ dữ liệu ban đầu với số A.Kurgan, Data M ining A Knowledge Discovery Approach, Springer,
cây bằng 100,300,500,800,1000. 2007
[8] Lu is Carlos Molina et at, Feature Selection for A lgorith ms: A Survey
V. KẾT LUẬN and Experimental Evaluation, 2000
[9] Ron Kohavi and George H. John, Wrapper for Feature Subset Selection,
Trong bài báo này chúng tôi đã tập trung nghiên cứu, tìm hiểu AIJ special issuse on relevance, 1996
về thuật toán di truyền và Random Forest cùng với một số [10] Sancho Salcedo –Sanz etc, Feature Select ion via Genetic Optimization,
phương pháp tiền xử lý dữ liệu khác. Từ những tìm hiểu này, 2000
bài báo đề xuất hướng cải tiến hiệu quả phân lớp của thuật toán [11] Ha Nam Nguyen, Syng Yup Ohn, A Learning Algorith m based for
RF theo phương pháp tìm ra bộ thuộc tính tối ưu nhỏ nhất từ Searching Optimal Co mb ined Kernal Function in Support Vector
Machine, 2005
một bộ thuộc tính rất lớn của dữ liệu ban đầu.
[12] Translation of M icroarray Data into Clin ically Relevant Cancer
Bài báo đã trình bày chi tiết các bước trong nội dung thuật toán Diagnostic Tests Using Gege Exp ression Ratios in Lung Cancer And
đề xuất, sau đó tiến hành thực nghiệm để chứng minh tính đúng Mesothelioma, Cancer Research, 2002
đắn của thuật toán. Thực nghiệm đã sử dụng bộ dữ liệu được [13] R. Kohavi, G.H. John, Wrappers for FeatureSubset Selection, Artificial
lấy từ các công trình nghiên cứu trước đó là dữ liệu gen của các Intelligence Vol 97(1997) 273.
bệnh nhân bị ung thư dạ dày (Stomach). Trong quá trình thực [14] L. Breiman (2002), Manual On Setting Up, Using, And Understanding
Random Forests V3.1, Available:
nghiệm chúng tôi tiến hành chạy rất nhiều lần, sau đó đánh giá
kết quả nhận được giữa chương trình RF nguyên bản và http://oz.berkeley.edu/users/breiman/Using_random_forests_V3.1.pdf
phương pháp đề xuất, có phân tích và vẽ biểu đồ so sánh. Từ [15] L. Breiman (2001), "Random Forests", Machine Learn ing Journal Paper,
vol. 45.
đó, chúng ta thấy được kết quả thực nghiệm trên cả hai bộ dữ
[16] A. C. Leo Breiman, Random Forests, Available:
liệu đều phản ánh rằng phương pháp đề xuất làm cho thuật toán http://www.stat.berkeley.edu/~breiman/RandomForests/cc_home.htm
phân lớp RF chạy nhanh hơn, ổn định hơn và có khả năng đoán [17] Ha Nam Nguyen, Syng Yup Ohn (2005), A Learning A lgorith m based
nhận chính xác hơn. Tuy nhiên, phương pháp đề xuất này có for Search ing Optimal Co mbined Kernal Function in Support Vector
nhược điểm là phải tiêu tốn một khoảng thời gian chạy để tìm Machine.
ra bộ thuộc tính tối ưu tương đối lớn. Nhưng lại giảm được thời
gian huấn luyện và kiểm thử cho tất cả các lần sử dụng bộ dữ
liệu về sau này. Nếu muốn kết quả dự đoán chính xác hơn thì
86
86
Giao thức định tuyến IPv6 có sự nhận thức về năng

lượng cho mạng cảm biến không dây
Vũ Chiến Thắng, Nguyễn Văn Tảo Vũ Văn San, Lê Nhật Thăng
Trường Đại học Công nghệ thông tin và Truyền thông Học viện Công nghệ Bưu chính Viễn thông
Thái Nguyên, Việt Nam Hà Nội, Việt Nam
Email: vcthang, nvtao@ictu.edu.vn Email: sanvv, thangln@ptit.edu.vn
Tóm tắt—Trong bài báo này, chúng tôi đề xuất giao thức định dữ liệu. Các nút mạng sử dụng bản tin DIO để gửi thông tin về
tuyến IRPL cải tiến. Giao thức IRPL sử dụng kết hợp hai thước trạng thái năng lượng còn lại đến các nút lân cận. Do vậy, các
đo định tuyến là chất lượng liên kết và trạng thái năng lượng còn nút lân cận có thể nhận thức được những nút gần hết năng
lại của nút chuyển tiếp để lựa chọn tuyến đường tối ưu. Chúng lượng và không lựa chọn những nút đó để chuyển tiếp bản tin
tôi đề xuất hai giải pháp kết hợp các thước đo định tuyến này. Từ dữ liệu. Chúng tôi thay đổi ngưỡng cho trước để đánh giá
đó, chúng tôi đã thực thi và đánh giá mô phỏng hai giải pháp đề những ảnh hưởng của việc lựa chọn ngưỡng chỉ số năng lượng
xuất nhằm xác định được ưu nhược điểm của từng giải pháp. Kết còn lại đến hiệu năng của toàn mạng.
quả đánh giá mô phỏng cho thấy, cả hai giải pháp mà chúng tôi
đề xuất đều cho phép tăng thời gian sống của mạng so với giao Phần còn lại của bài báo được bố cục như sau: Đầu tiên,
thức RPL ban đầu. chúng tôi giới thiệu về một số nghiên cứu có liên quan; Tiếp
theo, chúng tôi đề xuất giải pháp thiết kế giao thức IRPL; Một
Từ khóa—Giao thức định tuyến RPL cải tiến; mạng cảm biến số kết quả đánh giá hiệu năng của giao thức định tuyến IRPL
không dây; hệ điều hành Contiki; đánh giá hiệu năng mạng được trình bày trong mục IV của bài báo; Cuối cùng, chúng tôi
đưa ra một số kết luận cho bài báo.
I. GIỚI THIỆU
Hiện nay, IoT (Internet of Things) đang là một chủ đề nóng II. CÁC NGHIÊN CỨU CÓ LIÊN QUAN
thu hút được nhiều sự quan tâm của các nhà khoa học trên thế Năm 2008, tổ chức IETF đã hình thành nhóm công tác
giới. Nhiều chuẩn giao thức khác nhau đã được đề xuất cho mô RoLL nhằm đưa ra những quy định cụ thể về các giải pháp
hình mạng IoT. Một trong những chuẩn đó chính là việc sử định tuyến cho các mạng tổn hao công suất thấp. Nhóm RoLL
dụng giao thức IPv6 trên môi trường liên kết vô tuyến theo đã xác định phạm vi giới hạn công việc tập trung vào bốn ứng
chuẩn IEEE 802.15.4. dụng: Các mạng đô thị [1], tự động hóa tòa nhà [2], tự động
hóa công nghiệp [3] và ngôi nhà tự động [4]. Dựa vào yêu cầu
Để chuẩn hóa về mặt giao thức, tổ chức chuẩn hóa quốc tế
định tuyến được quy định trong các tài liệu ứng dụng, giao thức
IETF đã hình thành hai nhóm công tác đó là nhóm 6LoWPAN
định tuyến RPL đã được thiết kế để có tính môđun hóa rất cao.
và nhóm RoLL. Nhóm 6LoWPAN thực hiện chuẩn hóa lớp
Trong đó, phần cốt lõi của giao thức sẽ thực hiện những phần
thích ứng cần thiết với giao thức IPv6 trên các mạng sử dụng
giống nhau giữa các yêu cầu định tuyến của từng ứng dụng cụ
lớp vật lý IEEE 802.15.4. Nhóm RoLL thực hiện nhiệm vụ
thể và các môđun bổ sung sẽ được thêm vào khi cần thiết phải
chuẩn hóa giao thức định tuyến IPv6 cho các thiết bị có tài
giải quyết các yêu cầu riêng.
nguyên hạn chế trên môi trường liên kết vô tuyến có tổn hao và
công suất thấp. Nhóm RoLL đã đề xuất giao thức định tuyến Giao thức định tuyến RPL đã được thực thi trên nhiều hệ
RPL (IPv6 Routing Protocol for Low-Power and Lossy điều hành khác nhau như Contiki [5], TinyOS [6]... Trong bài
Networks) nhằm xây dựng một cấu trúc liên kết mạng bền báo [5], các tác giả đã giới thiệu những kết quả đánh giá mô
vững qua các liên kết tổn hao công suất thấp với các yêu cầu phỏng và thực nghiệm với giao thức RPL trên hệ điều hành
trạng thái liên kết tối thiểu. Contiki. Giao thức RPL hiện tại chỉ sử dụng thước đo định
tuyến chất lượng liên kết (ETX – Expected Transmission) với
Trong bài báo này, chúng tôi đề xuất và thiết kế một giao
hàm mục tiêu MRHOF (Minimum Rank Objective Function
thức định tuyến IRPL (Improved RPL) cải tiến. Giao thức
with Hysteresis) để xây dựng cấu trúc liên kết mạng. Các kết
IRPL sử dụng kết hợp hai thước đo định tuyến là chất lượng
quả đánh giá thực nghiệm cho thấy các nút cảm biến Tmote
liên kết ETX (Expected Transmission) và trạng thái năng lượng
Sky có thời gian sống kéo dài đến vài năm khi hoạt động với
còn lại của nút chuyển tiếp để lựa chọn tuyến đường tối ưu.
giao thức định tuyến RPL.
Mỗi nút mạng sẽ ước lượng được chỉ số năng lượng còn lại (EI
– Energy Indicator). Chỉ số năng lượng còn lại này được so Trong bài báo [7], chúng tôi đã đưa ra một số kết quả đánh
sánh với một ngưỡng chỉ số năng lượng còn lại cho trước. Khi giá mô phỏng và thực nghiệm với giao thức RPL cho mạng
chỉ số năng lượng còn lại của một nút mạng dưới một ngưỡng cảm biến không dây. Các kết quả đánh giá cho thấy một nhược
cho trước tương ứng với trạng thái gần hết năng lượng, nút điểm của giao thức RPL hiện tại đó là sự mất cân bằng năng
mạng đó sẽ không tham gia vào quá trình chuyển tiếp bản tin lượng giữa các nút mạng. Các nút mạng thuộc những tuyến
ISBN: 978-604-67-0635-9 87
87
đường có chất lượng liên kết tốt được sử dụng nhiều trong quá BẢNG 1. MÔ HÌNH NĂNG LƯỢNG CỦA TUMOTE
trình chuyển tiếp bản tin dữ liệu đến nút gốc. Các nút này sẽ Thành phần Trạng thái Dòng tiêu thụ
hết năng lượng nhanh hơn và tạo thành các lỗ hổng trong Tích cực 1,95 mA
mạng, làm giảm thời gian sống của mạng. MSP430 F1611 [10]
Công suất thấp 0,0026 mA
Trong bài báo này, chúng tôi đề xuất các giải pháp thiết kế Truyền (0 dBm) 17,4 mA
CC2420 [10]
giao thức định tuyến IRPL cải tiến có sự nhận thức về năng Nhận 19.7 mA
lượng nhằm khắc phục điểm yếu này của giao thức RPL hiện SHT11 [11] Tích cực 0,55 mA
tại.
Trong mô hình năng lượng của TUmote, chúng tôi chỉ quan
III. THIẾT KẾ GIAO THỨC IRPL tâm đến các thành phần tiêu thụ năng lượng chính và bỏ qua
A. Mục tiêu thiết kế và những thách thức các thành phần tiêu thụ năng lượng nhỏ khác.
Mục tiêu chính khi thiết kế giao thức IRPL là nhằm đảm Chỉ số năng lượng còn lại EI (Energy Indicator) trên mỗi
bảo sự cân bằng năng lượng giữa các nút mạng thuộc những nút cảm biến có thể được xác định theo công thức sau:
tuyến đường có chất lượng liên kết tốt và nâng cao thời gian E residual
sống của các nút mạng. Một số thách thức đặt ra khi thiết kế EI (%)  .100% (3)
giao thức IRPL đó là: E0
Trong bài báo này, chúng tôi đề xuất các giải pháp kết hợp
Thứ nhất, cần phải xác định được chỉ số năng lượng còn lại
hai thước đo định tuyến ETX và EI.
trên mỗi nút mạng. Cách xác định chỉ số năng lượng còn lại
trên mỗi nút mạng cần thực hiện được trên nhiều kiến trúc phần 1) Giải pháp 1:
cứng khác nhau và không làm phát sinh thêm bất kỳ một chi Chỉ số năng lượng còn lại EI được so sánh với một ngưỡng
phí nào về phần cứng. Chỉ số năng lượng còn lại này được so cho trước. Nếu chỉ số năng lượng còn lại thấp hơn ngưỡng cho
sánh với một ngưỡng cho trước để xác định trạng thái năng trước tương ứng với trạng thái gần hết năng lượng thì nút cảm
lượng của một nút mạng. biến sẽ không tham gia vào quá trình chuyển tiếp bản tin dữ
Thứ hai, cần phải đề xuất một thuật toán lựa chọn tuyến liệu trong mạng. Trạng thái năng lượng của nút cảm biến được
đường mới dựa trên hai thước định tuyến là chất lượng liên kết mã hóa bằng 1 bit và được mang đi bởi trường cờ (Flags) trong
ETX và trạng thái năng lượng của nút chuyển tiếp. Tuyến bản tin điều khiển DIO. Hình 1 mô tả cấu trúc bản tin điều
đường chuyển tiếp bản tin dữ liệu được lựa chọn phải đảm bảo khiển DIO [12].
có chất lượng liên kết tốt đồng thời tránh được những nút mạng
gần hết năng lượng.
B. Giải pháp thiết kế
Năng lượng còn lại trên mỗi nút cảm biến được xác định
theo công thức:
Eresidual E0  Econsumption (1)
Trong đó: Eresidual, E0, Econsumption lần lượt là năng lượng còn
lại, năng lượng ban đầu và năng lượng tiêu thụ trên nút cảm
Hình 1. Cấu trúc bản tin điều khiển DIO.
biến.
Năng lượng tiêu thụ trên nút cảm biến được tính toán như 2) Giải pháp 2:
sau [8]: Chỉ số năng lượng EI được mang đi bởi trường dự trữ
(Reserved) trong bản tin điều khiển DIO. Chúng tôi kết hợp hai
 U ( I ata  Il tl  It tt  I r tr   I citci )
Econsumption (2) thước đo định tuyến EI và ETX theo công thức sau:
i
ETX
Trong đó: U là điện áp nguồn cung cấp; Ia, ta là dòng tiêu metricETX _ EI (%)   .100  (1   )(100  EI ) (4)
thụ và thời gian mà bộ vi xử lý hoạt động ở chế độ tích cực ETX max
(active mode); Il, tl là dòng tiêu thụ và thời gian mà bộ vi xử lý Trong đó: α là trọng số cho phép điều chỉnh hai thông số
hoạt động ở chế độ công suất thấp (low power mode); It, tt là ETX, EI để tính toán thước đo định tuyến kết hợp, giá trị α nằm
dòng tiêu thụ và thời gian bộ thu phát vô tuyến ở chế độ truyền trong khoảng từ 0 đến 1; ETXmax là giá trị chất lượng liên kết
(transmit); Ir, tr là dòng tiêu thụ và thời gian bộ thu phát vô lớn nhất của tuyến đường trong mạng.
tuyến ở chế độ nhận (receive); Ici, tci là dòng tiêu thụ và thời
gian hoạt động của các bộ phận khác như cảm biến, LED... Tuyến đường tối ưu được lựa chọn là tuyến đường có thước
đo định tuyến kết hợp metricETX_EI nhỏ nhất.
Trong bài báo này, chúng tôi đánh giá giao thức IRPL sử
dụng phần cứng TUmote [9]. Bảng 1 trình bày mô hình năng C. Thực thi thiết kế
lượng cho TUmote. Các số liệu về dòng tiêu thụ được lấy từ tài Chúng tôi thực thi giao thức IRPL trên hệ điều hành
liệu kỹ thuật của các nhà sản xuất linh kiện. Contiki. Contiki là một trong những hệ điều hành cho mạng
88
88
cảm biến không dây phổ biến hiện nay [13]. Giao thức IRPL 2) Sự cân bằng năng lượng giữa các nút trong mạng
được xây dựng trên ngăn xếp truyền thông uIPv6 trong hệ điều Để đánh giá sự cân bằng năng lượng giữa các nút mạng,
hành Contiki. Hình 2 minh họa các thành phần chính của giao chúng tôi dựa vào chỉ số năng lượng còn lại EI trên các nút
thức IRPL. mạng. Thước đo đánh giá sự cân bằng năng lượng EIB (Energy
Indicator Balance) giữa các nút trong mạng được xác định theo
công thức sau:
N
EIB
  ( EI  EI )
i 1
i
2
(6)
Trong đó: EI là chỉ số năng lượng còn lại trung bình trên
các nút mạng.
3) Thời gian sống của mạng:
Thời gian sống của mạng có thể được định nghĩa là khoảng
thời gian bắt đầu một truyền dẫn đầu tiên ở trong mạng và kết
thúc khi tỷ lệ phần trăm các nút hết năng lượng dưới một
Hình 2. Thực thi giao thức IRPL trên Contiki. ngưỡng cho trước. Giá trị ngưỡng được thiết lập tùy thuộc vào
Ngăn xếp truyền thông uIPv6 gọi đến module ContikiRPL từng ứng dụng.
khi nhận được bản tin ICMPv6 (DIO, DIS, DAO) hoặc khi cần
Định nghĩa này có liên quan đến thời gian sống của một nút
tìm kiếm các nút lân cận. Module ContikiRPL gọi đến ngăn
mạng và không xét đến vai trò cụ thể của các nút mạng bị hết
xếp truyền thông uIPv6 để thiết lập tuyến đường trong các
năng lượng. Nếu tỷ lệ phần trăm được thiết lập là 100% thì thời
bảng định tuyến. Chúng tôi mở rộng cấu trúc bảng định tuyến
điểm nút đầu tiên trong mạng hết năng lượng cũng là thời điểm
trong ContikiRPL để lưu thông tin về trạng thái năng lượng
kết thúc thời gian sống của mạng.
còn lại của các nút lân cận. Module ContikiRPL sử dụng thước
đo định tuyến chất lượng liên kết ETX và trạng thái năng lượng B. Kết quả đánh giá
còn lại của các nút lân cận để thiết lập tuyến đường trong Để đánh giá giao thức IRPL dựa trên mô phỏng, chúng tôi
mạng. Thông tin phản hồi về chất lượng liên kết được thực sử dụng công cụ mô phỏng Cooja [14]. Chúng tôi xét một
hiện bởi khối ước lượng chất lượng liên kết. Khối ước lượng DODAG bao gồm 26 nút mạng được phân bố ngẫu nhiên trong
năng lượng tiêu thụ có nhiệm vụ xác định chỉ số năng lượng trường cảm biến có kích thước (100m x 100m). Bảng 2 tóm tắt
còn lại của nút cảm biến. Chỉ số năng lượng còn lại được so kịch bản đánh giá mô phỏng với hai giao thức IRPL và RPL.
sánh với một ngưỡng cho trước để xác định trạng thái năng
lượng còn lại của nút cảm biến. Thông tin về chất lượng liên
BẢNG 2. KỊCH BẢN ĐÁNH GIÁ MÔ PHỎNG
kết và trạng thái năng lượng còn lại này được gửi tới các nút
lân cận thông qua bản tin DIO.
Các tham số Giá trị
IV. ĐÁNH GIÁ GIAO THỨC ĐỊNH TUYẾN IRPL UDI (Unit Disk Graph with
Mô hình truyền thông vô tuyến
Distance Interference)
Trong bài báo này, chúng tôi trình bày một số kết quả đánh
giá mô phỏng với giao thức IRPL. Chúng tôi so sánh hiệu năng Số nút mạng 26
giữa giao thức IRPL với giao thức RPL. Kích thước mạng (m x m) 100 x 100
A. Các tham số đánh giá Phạm vi phủ sóng của nút (m)
Phạm vi truyền hiệu quả: 30
Phạm vi ảnh hưởng của nhiễu: 50
Chúng tôi đánh giá và so sánh hiệu năng giữa giao thức
Năng lượng ban đầu 10J
IRPL và giao thức RPL thông qua một số thước đo đánh giá
sau. Chu kỳ gửi bản tin dữ liệu 15s
1) Tỷ lệ chuyển phát bản tin dữ liệu: Nguồn gửi bản tin dữ liệu Tất cả các nút trong mạng
Tỷ lệ chuyển phát bản tin dữ liệu DDR (Data Delivery Giao thức lớp MAC [15] CSMA/ContikiMAC
Ratio) được xác định bằng tỷ số giữa số bản tin dữ liệu nhận
được tại nút gốc và tổng số bản tin dữ liệu được gửi đi bởi tất
Hình 3 là mô hình triển khai mạng gồm 26 nút. Các nút
cả các nút trong mạng.
mạng định kỳ gửi bản tin dữ liệu về nút gốc (DODAG root) là
N received nút số 1.
DDR(%)  .100% (5)
N data Hình 4, 5, 6 lần lượt là kết quả đánh giá mô phỏng so sánh
tỷ lệ các nút còn sống trong mạng (ANR), tỷ lệ chuyển phát
Trong đó: Nreceived là tổng số bản tin dữ liệu nhận được tại bản tin dữ liệu (DDR), sự cân bằng năng lượng (EIB) giữa giao
nút gốc; Ndata là tổng số bản tin dữ liệu được gửi bởi tất cả các thức IRPL được cải tiến theo giải pháp 1 và giao thức RPL.
nút trong mạng. Tỷ lệ chuyển phát bản tin dữ liệu DDR càng Với giả sử ngưỡng để xác định thời gian sống của mạng
cao thì hiệu quả truyền thông trong mạng càng tốt. bằng 100% thì kết quả đánh giá mô phỏng hình 4 cho thấy thời
89
89
gian sống của các nút mạng khi mạng hoạt động theo giao thức Kết quả mô phỏng ở hình 5 cho thấy tỷ lệ chuyển phát bản
IRPL được cải thiện tốt hơn so với giao thức RPL ban đầu. tin dữ liệu của giao thức IRPL thấp hơn so với giao thức RPL.
Hình 4 cũng cho thấy với ngưỡng chỉ số năng lượng còn lại Giao thức IRPL với ngưỡng chỉ số năng lượng còn lại bằng
bằng 25% thì thời gian sống của mạng được cải thiện tốt nhất 20% và 25% đảm bảo tỷ lệ chuyển phát bản tin dữ liệu DDR ở
(tăng 38% so với giao thức RPL). mức chấp nhận được so với giao thức RPL ban đầu. Giao thức
IRPL với ngưỡng chỉ số năng lượng còn lại ở mức 30% có tỷ lệ
chuyển phát bản tin dữ liệu DDR thấp hơn so với giao thức
IRPL ở ngưỡng 20%, 25% và thấp hơn nhiều so với giao thức
RPL. Trong khoảng thời gian cuối của quá trình mô phỏng, do
tỷ lệ các nút còn sống trong mạng giảm nên tỷ lệ chuyển phát
bản tin dữ liệu DDR cũng giảm theo. Chúng tôi chỉ vẽ đồ thị ở
phút thứ 19 bởi vì ứng với thời điểm này, các nút lân cận của
nút gốc số 1 đã hết năng lượng. Vì vậy, các nút còn lại trong
mạng không tìm được tuyến đường nào để gửi bản tin dữ liệu
về nút gốc.
Kết quả mô phỏng ở hình 6 cho thấy giao thức IRPL đảm
bảo được sự cân bằng năng lượng giữa các nút mạng tốt hơn so
với giao thức RPL ban đầu. Điều này được thể hiện bởi đường
cong EIB của giao thức IRPL trong cả ba trường hợp tương
ứng với các ngưỡng 20%, 25%, 30% đều thấp hơn so với
đường cong EIB giao thức RPL.
Hình 3. Mô hình triển khai mạng gồm 26 nút
Hình 7. So sánh tỷ lệ các nút còn sống trong mạng

Hình 4. So sánh tỷ lệ các nút còn sống trong mạng
Hình 5. So sánh tỷ lệ chuyển phát bản tin dữ liệu Hình 8. So sánh tỷ lệ chuyển phát bản tin dữ liệu
Hình 6. So sánh sự cân bằng năng lượng giữa các nút mạng Hình 9. So sánh sự cân bằng năng lượng giữa các nút mạng
90
90
Tổng hợp các kết quả mô phỏng ở hình 4, 5 cũng cho thấy chúng tôi đề xuất đã đạt được một số tiêu chí quan trọng đó là:
giao thức IRPL với ngưỡng chỉ số năng lượng còn lại bằng Tăng được thời gian sống của mạng (tăng 38% so với giao thức
25% đạt được hiệu quả tốt nhất về thời gian sống của mạng RPL); Đảm bảo được sự cân bằng năng lượng giữa các nút
đồng thời cũng đảm bảo được tỷ lệ chuyển phát bản tin dữ liệu mạng; Đạt được tỷ lệ chuyển phát bản tin dữ liệu trong mạng ở
DDR ở mức chấp nhận được so với giao thức RPL ban đầu. mức cao chấp nhận được so với giao thức RPL ban đầu.
Hình 7, 8, 9 lần lượt là kết quả đánh giá mô phỏng so sánh Trong thời gian tới, chúng tôi sẽ tiếp tục nghiên cứu đánh
tỷ lệ các nút còn sống trong mạng (ANR), tỷ lệ chuyển phát giá ảnh hưởng của tham số alpha trong giải pháp 2 và thực hiện
bản tin dữ liệu (DDR), sự cân bằng năng lượng (EIB) giữa giao một số đánh giá thực nghiệm với giao thức IRPL nhằm kiểm
thức IRPL được cải tiến theo giải pháp 2 (IRPL_alpha với α = chứng lại các kết quả mô phỏng đã thực hiện.
0,9), giao thức IRPL được cải tiến theo giải pháp 1 với ngưỡng
chỉ số năng lượng còn lại bằng 25% (IRPL_25) và giao thức TÀI LIỆU THAM KHẢO
RPL ban đầu. [1] Dohler M, Watteyne T, Winter T, Barthel D, “Routing requirements for
urban low-power and lossy networks”, RFC5548, IETF, May 2009.
Kết quả đánh giá mô phỏng ở hình 7 cho thấy giải pháp cải [2] Martocci J, De Mil P, Vermeylen W, Riou N, “Building automation
tiến thứ 2 cho hiệu quả về thời gian sống của mạng tương routing requirements in low-power and lossy networks”, RFC5867,
đương với giải pháp cải tiến thứ 1. Cả hai giải pháp đều cho IETF, June 2010.
phép tăng thời gian sống của mạng lên đến 38% so với giao [3] Pister K, Thubert P, Dwars S, Phinney T, “Industrial routing
thức RPL ban đầu. requirements in low-power and lossy networks”, RFC5673, IETF,
October 2009.
Kết quả mô phỏng ở hình 8 cũng cho thấy giải pháp cải tiến [4] Brandt A, Buron J, Porcu G, “Home automation routing requirements in
thứ 2 đem lại hiệu quả về tỷ lệ chuyển phát bản tin dữ liệu low-power and lossy networks”, RFC 5826, IETF, April 2010.
DDR cao hơn so với giải pháp cải tiến thứ 1. Điều này được [5] N. Tsiftes, J. Eriksson, and A. Dunkels, “Low-Power Wireless IPv6
thể hiện bởi đường cong ứng với giao thức IRPL_alpha cao Routing with ContikiRPL”, in Proceedings of the International
hơn so với đường cong ứng với giao thức IRPL_25. Conference on Information Processing in Sensor Networks (ACM/IEEE
IPSN), Stockholm, Sweden, April 2010.
Ở giải pháp cải tiến thứ 2, trong khoảng thời gian cuối của [6] JeongGil Ko, Stephen Dawson-Haggerty, Omprakash Gnawali, David
quá trình mô phỏng (từ phút thứ 15 đến phút thứ 19), số lượng Culler, Andreas Terzis, “Evaluating the performance of RPL and
các nút còn sống trong mạng khi hoạt động theo giao thức 6LoWPAN in TinyOS”, in Proceedings of the Workshop on Extending
the Internet to Low power and Lossy Networks (IP+SN), USA, 2011.
IRPL cao hơn so với giao thức RPL ban đầu. Vì vậy, số lượng
[7] Vũ Chiến Thắng, Lê Nhật Thăng, “Đánh giá hiệu năng giao thức định
bản tin dữ liệu nhận được tại nút gốc ứng với giao thức IRPL tuyến IPv6 cho mạng cảm biến không dây”, Tạp chí nghiên cứu khoa
cao hơn so với giao thức RPL. Do đó, trong giải pháp 2 (ứng học công nghệ và quân sự, ISSN 1859-1043, số 38, 8/2015.
với α = 0,9), giao thức IRPL có tỷ lệ chuyển phát bản tin dữ [8] Adam Dunkels, Fredrik Osterlind, Nicolas Tsiftes, Zhitao He,
liệu cao hơn so với giao thức RPL. Đây là ưu điểm của giải “Software-based Online Energy Estimation for Sensor Nodes”,
pháp 2 so với giải pháp 1. Ở giải pháp 1, mặc dù trong khoảng Proceedings of the 4th workshop on Embedded networked sensors,
thời gian cuối của quá trình mô phỏng, giao thức IRPL_25 có 2007.
số lượng các nút còn sống trong mạng cao hơn so với giao thức [9] Vũ Chiến Thắng, Nguyễn Chấn Hùng, Lê Nhật Thăng, “Về một hệ
thống nghiên cứu thực nghiệm cho mạng cảm biến không dây”, Tạp chí
RPL nhưng một số nút mạng có chỉ số năng lượng còn lại < Khoa học và Công nghệ, Đại học Đà Nẵng, số 3(64), trang 103-109,
25% sẽ không tham gia vào quá trình chuyển tiếp bản tin dữ 2013.
liệu trong mạng. Do vậy, số lượng bản tin dữ liệu nhận được tại [10] http://ti.com, [Online].
nút gốc ứng với giao thức IRPL_25 thấp hơn so với giao thức [11] http://www.sensirion.com, [Online].
RPL ban đầu. Điều này được thể hiện bởi đường cong DDR [12] T. Winter et al, “RPL: IPv6 routing protocol for low-power and lossy
của giao thức IRPL_25 thấp hơn so với giao thức RPL. networks,” RFC 6550, March 2012.
Hình 9 cho thấy cả hai giải pháp mà chúng tôi đề xuất đều [13] Thang Vu Chien, Hung Nguyen Chan, Thanh Nguyen Huu, “Operating
System for Wireless Sensor Networks and an Experiment of Porting
đảm bảo sự cân bằng năng lượng giữa các nút trong mạng được ContikiOS to MSP430 Microcontroller”, Journal of Computer Science
tốt hơn so với giao thức RPL ban đầu. and Information, Vol 5, Issue 1, February 2012, ISSN: 2088-7051, pp.
50-56.
V. KẾT LUẬN [14] Fredrik Österlind, Adam Dunkels, Joakim Eriksson, Niclas Finne, and
Trong bài báo này, chúng tôi đã đề xuất và thực thi hai giải Thiemo Voigt, “Cross-level sensor network simulation with cooja”,
In Proceedings of the First IEEE International Workshop on Practical
pháp cải tiến đối với giao thức định tuyến RPL. Các giải pháp Issues in Building Sensor Network Applications (SenseApp 2006),
mà chúng tôi đề xuất nhằm kết hợp hai thước đo định tuyến là Tampa, Florida, USA, November 2006.
chất lượng liên kết và năng lượng còn lại của nút chuyển tiếp. [15] A. Dunkels, “The ContikiMAC Radio Duty Cycling Protocol,” SICS
Kết quả đánh giá mô phỏng cho thấy, cả hai giải pháp mà technical report, December 2011.
91
91
HộiHội
ThảoThảo Quốc Gia 2015 về Điện Tử, Truyền Thông và Công Nghệ Thông Tin (ECIT 2015)
Quốc Gia 2015 về Điện Tử, Truyền Thông và Công Nghệ Thông Tin (ECIT 2015)
Một Phƣơng Thức Phát Hiện Bất Thƣờng Trong

Lƣu Lƣợng Mạng
Nguyễn Hà Dƣơng
Khoa Công nghệ thông tin,
Trƣờng Đại học Xây Dựng Hà Nội
Email: duongnh@nuce.edu.vn
Abstract— Phát hiện lưu lượng mạng bất thường có thể giúp phát ví dụ sự tăng đột biến của lƣu lƣợng ngƣời dùng tới một dịch
hiện sớm những nguy cơ tấn công mạng do hoạt động tấn công vụ hoặc sự suy giảm đột ngột lƣu lƣợng do sự cố liên quan đến
của tin tặc có thể gây ra sự biến đổi không bình thường của lưu thiết bị mạng. Nếu xét riêng trong lĩnh vực an ninh mạng, chức
lượng mạng, nghĩa là những thăng giáng của lưu lượng so với lưu năng của IDS và ADS là nhƣ nhau vì cùng có mục tiêu phát
lượng bình thường của mạng. Trong bài báo này, tác giả đề xuất hiện tấn công vào hệ thống. Trong thực tế, phƣơng pháp phát
một phương thức phát hiện dấu hiệu bất thường (dPCA) trong hiện của IDS thƣờng dựa trên dấu hiệu biết trƣớc của tập mẫu
lưu lượng mạng dựa trên thuật toán phân tích thành phần chính nhƣ đã trình bày ở trên mà các hệ thống điển hình là Snort, Bro
(PCA). Kết quả thử nghiệm của phương thức phát hiện được [10, 11]. Trong khi đó, ADS thƣờng dựa trên các phƣơng pháp
đánh giá dựa trên tập dữ liệu tri thức dành cho phát hiện xâm và mô hình thống kê, khai phá dữ liệu, học máy v.v.. [1-8].
nhập NSL-KDD.
Trong một số nghiên cứu [1-7], phƣơng pháp phát hiện bất
Keywords- lưu lượng bất thường; phát hiện lưu lượng bất thƣờng trong lƣu lƣợng mạng dựa trên thuật toán PCA đã
thường; phát hiện xâm nhập; an ninh mạng. chứng minh khả năng phát hiện với độ chính xác tƣơng đối cao
và có thể ứng dụng trên mạng trực tuyến. Vì vậy, tác giả đã lựa
I. GIỚI THIỆU chọn sử dụng PCA đề đề xuất một thuật toán và phƣơng thức
Phát hiện sớm các nguy cơ tấn công mạng là một nhu cầu phát hiện lƣu lƣợng bất thƣờng trong mục II. Mục III trình bày
cấp thiết trong thực tế. Những hoạt động tấn công thƣờng gây kết quả thử nghiệm của phƣơng thức phát hiện. Mục IV là phần
ra những biến đổi không bình thƣờng, những thăng giáng của kết luận của bài báo.
lƣu lƣợng mạng, thậm chí tạo ra lƣu lƣợng đột biến so với lƣu
lƣợng bình thƣờng trên mạng. Vì vậy việc phát hiện lƣu lƣợng II. PHƢƠNG THỨC ĐỀ XUẤT PHÁT HIỆN LƢU LƢỢNG
bất thƣờng có thể giúp sớm tìm ra những dấu hiệu tấn công, BẤT THƢỜNG DỰA TRÊN PCA
điển hình là các tấn công DoS, Scan, v.v..
A. Cơ sở thuật toán PCA
Một hệ thống phát hiện tấn công hiện nay thƣờng đƣợc gọi
với tên: hệ thống phát hiện xâm nhập (Intrusion Detection Phân tích thành phần chính (Principal Component Analysis
System - IDS) [8-11]. Trong IDS, nhìn chung có hai phƣơng – PCA) là một thuật toán thƣờng sử dụng để giảm số chiều dữ
pháp chính để phát hiện tấn công là: phát hiện dựa trên dấu liệu nhƣng vẫn giữ đƣợc phần lớn đặc tính của dữ liệu. Mỗi trị
hiệu và phát hiện bất thƣờng [8]. Phƣơng pháp phát hiện dựa riêng của thành phần chính tƣơng ứng một phần với sự biến
trên dấu hiệu (signature-based detection) thƣờng đòi hỏi phải thiên của các thuộc tính hay biến trong dữ liệu. Trị riêng càng
biết trƣớc mẫu dấu hiệu tấn công đã lƣu trong cơ sở dữ liệu và lớn thì càng chứa nhiều biến thiên và vector riêng tƣơng ứng
so sánh lƣu lƣợng thu đƣợc từ mạng với các mẫu dấu hiệu lƣu phản ánh quy luật biến thiên càng lớn nên càng quan trọng. Do
sẵn. Tuy nhiên, phƣơng pháp này chỉ có thể phát hiện đƣợc vậy, những thành phần chính quan trọng nhất cần đƣợc xếp
những dấu hiệu tấn công đã biết mà không phát hiện đƣợc các trƣớc các thành phần không quan trọng.
loại tấn công mới. Mặt khác, tin tặc có thể dễ dàng thay đổi Dữ liệu trong PCA đƣợc biểu diễn bởi các trục tạo thành
một vài chi tiết để biến tấn công trở thành một kiểu mới, không bởi các vector riêng. Trong dữ liệu dùng để huấn luyện không
còn chứa dấu hiệu biết trƣớc trong cơ sở dữ liệu tập mẫu để chứa dữ liệu bất thƣờng, những trục tƣơng ứng đƣợc coi là
qua đó vƣợt qua đƣợc khả năng phát hiện của phƣơng thức này. bình thƣờng. Những điểm nằm cách xa những trục bình thƣờng
Phƣơng pháp thứ hai không đòi hỏi mẫu dấu hiệu biết trƣớc, này có thể nghi ngờ là bất thƣờng.
cho phép phát hiện xâm nhập dựa trên hành vi bất thƣờng
(hành vi bất thƣờng đƣợc hiểu là hành vi tấn công). Vì vậy, Gọi X là một tập dữ liệu gồm n quan sát với p biến X1,
phƣơng pháp này cho phép phát hiện đƣợc những kiểu tấn công X2,… Xp đƣợc tổ chức thành ma trận nxp (n hàng, p cột). Mỗi
mới. biến biểu thị một thuộc tính của dữ liệu ban đầu. Mỗi quan sát
x=(x1, x2,…,xp)T chứa p thuộc tính khác nhau. Gọi R là ma trận
Hệ thống chỉ áp dụng phƣơng pháp phát hiện bất thƣờng tƣơng quan pxp tính đƣợc từ X, (k, ek) là các cặp trị riêng và
còn đƣợc gọi với tên hệ thống phát hiện bất thƣờng (Anomaly vector riêng của R đƣợc sắp xếp theo thứ tự giảm dần của trị
Detection System - ADS) [8]. ADS không chỉ phát hiện tấn riêng (1 2 … p>0), khi đó thành phần chính thứ i của
công mà còn có thể phát hiện những sự kiện bất thƣờng khác, một quan sát x sẽ đƣợc tính nhƣ sau:
ISBN: 978-604-67-0635-9 92
92
Hội Hội
Thảo Quốc
Thảo GiaGia
Quốc 2015 vềvềĐiện
2015 ĐiệnTử,
Tử,Truyền
TruyềnThông
và Công NghệThông
ThôngTinTin (ECIT
(ECIT 2015)
2015)
yi eT Một giá trị ngƣỡng dN đƣợc xác định dựa vào hàm phân bố
 i z ei1 z1  ei 2 z2  ...  eip z p (1)
tích lũy thực nghiệm của độ lệch d (empirical cumulative
trong đó: yi là thành phần chính thứ i của quan sát x ban đầu, distribute function - ecdf) và đƣợc tính trên dữ liệu huấn luyện.
i=1…p, ei=(ei1,ei2,…,eip)T là vectơ riêng thứ i Khi có một quan sát mới, giá trị d sẽ đƣợc tính dựa trên
z = (z1, z2,…,zp)T là vectơ đã chuẩn hóa của x theo công thức: những tham số huấn luyện nhƣ sau:
xk  xk  Chuẩn hóa dữ liệu dựa trên giá trị trung bình và căn bậc
zk  (2)
sk hai của phƣơng sai cho mỗi thuộc tính (biến đầu vào).
với xk là giá trị trung bình, sk là phƣơng sai của biến thứ k,  Sử dụng vectơ riêng để chuyển mỗi quan sát mới sang
k = 1…p. các trục của miền con PCA.
Đối với bài toán phát hiện bất thƣờng, khi xử lý một lƣợng  Tính giá trị d dựa trên (3) và so sánh với ngƣỡng đã
dữ liệu lớn nhiều biến sẽ làm tăng thời gian xử lý dữ liệu và tốn thiết lập dN khi huấn luyện
tài nguyên của hệ thống. Vì vậy, áp dụng thuật toán PCA có
thể giảm thiểu số chiều không cần thiết và tăng hiệu quả tận Nếu d > dN, quan sát mới đƣợc coi là bất thƣờng. Ngƣợc lại
dụng tài nguyên hệ thống. quan sát đó đƣợc coi là bình thƣờng. Phƣơng thức phát hiện
này trong bài báo đƣợc đặt tên là dPCA.
B. Phương thức phát hiện đề xuất (dPCA)
Trong [1-3, 6], các tác giả theo dõi sự thay đổi các giá trị III. THỬ NGHIỆM PHƢƠNG THỨC PHÁT HIỆN DPCA
thành phần chính và phát hiện sự thay đổi bất thƣờng trên các
thành phần chính nhất định. Các thành phần chính có thể phân A. Tập dữ liệu NSL-KDD
chia thành những thành phần quan trọng phản ánh quy luật KDD (Knowledge Data Mining Data Set) là những tập dữ
biến thiên của lƣu lƣợng y(m) trong trạng thái bình thƣờng của liệu tri thức thuộc các lĩnh vực khác nhau nhƣ: y tế, an ninh
hệ thống và những thành phần dƣ thừa phản ánh sự biến thiên mạng, kinh tế .. đƣợc tổng hợp từ những điều kiện thực tế và sử
không theo quy luật y(p-m). Trong [1, 6], độ lớn của phần dƣ tái dụng trong các thuật toán, phƣơng pháp khai phá dữ liệu. Một
tạo tƣơng ứng với y(p-m) đƣợc phân tích từ đó phát hiện ra những tập dữ liệu hay sử dụng để kiểm nghiệm các phƣơng thức phát
dấu hiệu bất thƣờng dựa trên mức ngƣỡng. Một cách tƣơng tự hiện xâm nhập là KDD-CUP 99 [12]. Đây là tập dữ liệu đã qua
là tính khoảng cách Euclidean giữa dữ liệu chuẩn hóa z và dữ tiền xử lý từ tập dữ liệu DARPA 1998. KDD-CUP 99 tách ra
liệu tái tạo từ những thành phần chính y(m) [2]. Tuy nhiên sự tái những trƣờng dữ liệu đặc trƣng (thuộc tính) từ các gói tin (một
tạo lại z từ những thành phần chính y(m) làm tăng mức độ xử lý số thuộc tính nhƣ bảng 1) sau đó tổng hợp lại cho từng kết nối.
của hệ thống. Trong [3], khoảng cách Mahalanobis dựa trên Các trƣờng dữ liệu hay thuộc tính trở thành các biến đầu vào
thành phần chính chủ yếu và thứ yếu đƣợc sử dụng để phân cho cơ chế phát hiện tấn công. Tổng cộng có 42 trƣờng dữ liệu
tích dấu hiệu bất thƣờng. trong đó trƣờng số 42 đánh nhãn (labeling) mỗi kết nối là bình
thƣờng hoặc tên một loại tấn công. Dữ liệu đƣợc phân loại
Từ những nghiên cứu trên có thể thấy bằng cách theo dõi sự
thành các lớp: Bình thƣờng (Normal) hoặc các lớp tấn công
biến thiên của các thành phần chính trong miền con của PCA
(DoS, PROBE, R2L, U2R).
hoặc trong miền gốc ban đầu sau khi tái tạo và so sánh với
đƣờng cơ sở đƣợc coi là bình thƣờng, chúng ta có thể phát hiện KDD-CUP 99 tồn tại một số vấn đề mà điển hình là có quá
ra dấu hiệu bất thƣờng trong lƣu lƣợng của mạng. nhiều dữ liệu dƣ thừa và trùng lặp [12]. Điều này ảnh hƣởng
đến kết quả đánh giá hiệu quả của phƣơng thức phát hiện trong
Theo dõi từng giá trị PCA không hiệu quả khi sự biến thiên
những nghiên cứu sử dụng tập dữ liệu này [2, 3, 6, 12].
của các biến ban đầu phân tán sang các thành phần chính khác
nhau của không gian con PCA. Vì vậy cần kết hợp các thành Bài báo này sử dụng tập dữ liệu NSL-KDD cho việc thử
phần chính này lại trong thuật toán phát hiện bất thƣờng. nghiệm thuật toán phát hiện bất thƣờng. NSL-KDD là tập dữ
liệu đƣợc phát triển từ tập KDD-CUP 99 nhƣng đã loại bỏ
Tiếp theo, bài báo đề xuất một thuật toán phát hiện dấu hiệu
những kết nối dƣ thừa hoặc trùng lặp [12]. Do đã khắc phục
bất thƣờng trong không gian con của PCA:
đƣợc một số nhƣợc điểm quan trọng trong KDD-CUP 99,
q NSL-KDD là một tập dữ liệu có độ tin cậy cao hơn KDD-CUP
d   wi yi
c
(3) 99 khi thử nghiệm các phƣơng thức phát hiện bất thƣờng.
ir
Trong đó: 1  r  q  p , wi là trọng số cho thành phần B. Các thông số đánh giá trong thử nghiệm
chính yi đƣợc lựa chọn dựa trên thực nghiệm, d là độ lệch hình True Positive (TP): Sự kiện một mẫu tấn công đƣợc phát
thành từ các thành phần chính yi và trọng số tƣơng ứng wi, c là hiện chính xác
số mũ của yi. c là hằng số, có thể là số thực hoặc số nguyên.
wi , c đƣợc lựa chọn dựa trên thực nghiệm. False Positive (FP): Sự kiện một mẫu bị phát hiện là tấn
công nhƣng thực tế lại là mẫu bình thƣờng
Tập hợp các giá trị của d đƣợc tính trên tất cả các quan sát
với dữ liệu huấn luyện sạch (không chứa bất thƣờng) sẽ tạo nên True Negative (TN): Sự kiện một mẫu bình thƣờng đƣợc
đƣờng cơ sở để phát hiện ngoại lai. Vì vậy có thể coi d là độ phát hiện chính xác
lệch của mỗi quan sát để xét quan sát đó là bình thƣờng hay bất False Negative (FN): Sự kiện một mẫu đƣợc hệ thống phát
thƣờng.
hiện là bình thƣờng nhƣng thực tế lại là mẫu tấn công.
93
93
HộiHội
Thảo Quốc
Thảo QuốcGia
Gia2015
2015về
vềĐiện
Điện Tử,
Tử,Truyền
Nghệ Thông
Thông TinTin (ECIT
(ECIT 2015)
2015)
Precision (Độ chinh xác): Bằng tỷ lệ số mẫu phát hiện tấn rerror_rate % số kết nối có lỗi đồng bộ REJ
công chính xác và tổng số mẫu phát hiện là tấn công trong tập
dữ liệu kiểm tra diff_srv_rate % số kết nối đến cùng dịch vụ đang
xét
TP dst_host_count Số lƣợng địa chỉ đích

Precision  (4) dst_host_srv_count
TP  FP Số lƣợng kết nối đến cùng địa chỉ
đích đang xét và cùng dịch vụ đích
True Positive Rate (TPR) còn gọi là Recall: Tỷ lệ giữa số
mẫu tấn công phát hiện chính xác và số mẫu tấn công thực tế Bảng 2 thống kê kết quả phát hiện với trọng số wi =1 và
trong tập dữ liệu kiểm tra hằng số c =1. Công thức (3) trở thành:
TP d =| yr|+ |yr+1|+ …+ |yq| (8) 

TPR  (5)
TP  FN
B NG II. KẾT QU THỬ NGHIỆM 1

False Positive (FPR): Tỷ lệ giữa số mẫu tấn công phát hiện
sai và số mẫu bình thƣờng trong tập dữ liệu kiểm tra k Precision (%) TPR (%) FPR (%) TA (%)
13 95.3 75.3 3.2 86.8
FP
FPR  (6) 3 94.6 87.2 4.3 92.1
TN  FP
Total Accuracy (TA) : Độ chính xác tổng bằng số mẫu phát Do trị riêng i phản ánh mức biến thiên của các trục thành
hiện chính xác của cả tấn công và bình thƣờng trên số mẫu của phần chính tạo nên bởi vectơ riêng ei nên có thể i đƣa vào
tập dữ liệu trọng số wi của công thức (3).
Bảng 3 thống kê kết quả phát hiện với trọng số wi = i và
TP  TN hằng số c =1. Công thức (3) trở thành:
TA  (7)
TP  FP  TN  FN
C. Thử nghiệm và kết quả d = r |yr|+ r+1 |yr+1|+ …+q|yq| 

Quá trình thử nghiệm đƣợc thực hiện dựa trên phần mềm
Matlab R2013a. Bài báo sử dụng 1000 kết nối bình thƣờng B NG III. KẾT QU THỬ NGHIỆM 2
dùng để huấn luyện; 50000 kết nối cả tấn công và bình thƣờng
đƣợc lựa chọn ngẫu nhiên để kiểm tra độ chính xác của phƣơng k Precision (%) TPR (%) FPR (%) TA (%)
thức phát hiện. Do tập dữ liệu có rất nhiều thuộc tính nên bài 13 96.7 68.4 3.3 83.6
báo chỉ lựa chọn những thuộc tính cần thiết đƣợc liệt kê trong
bảng 1. Quá trình thử nghiệm lựa chọn tất cả các thành phần 3 95.0 85.6 3.8 92.0
chính và một số thành phần chính cuối cùng từ đó thống kê tỷ
lệ phát hiện thành công và cảnh báo sai. Kết quả của phƣơng Bảng 4 thống kê kết quả phát hiện với trọng số wi = i1/ 2 và
thức phát hiện bất thƣờng đƣợc thống kê trong các bảng 2-6.
hằng số c =1. Công thức (3) trở thành:
Giá trị k trong các bảng 2-6 là số thành phần chính.
B NG I. THUỘC TÍNH DÙNG TRONG THỬ NGHIỆM  d r1/ 2 yr  r1/21 yr 1  ...  q1/ 2 yq 
 
Features Meaning
duration Thời gian của kết nối B NG IV. KẾT QU THỬ NGHIỆM 3
protocol_type Loại giao thức
k Precision (%) TPR (%) FPR (%) TA (%)
service Dịch vụ (ví dụ HTTP) 13 95.1 69.9 3.1 84.4
src_bytes Số lƣợng byte gửi từ nguồn đến đích 3 94.8 87.6 4.1 92.1
dst_bytes Số lƣợng byte gửi từ đích về nguồn
num_access_files Số lƣợng truy nhập file điều khiển

Bảng 5 thống kê kết quả phát hiện với trọng số wi =
1/ i và hằng số c =2. Công thức (3) trở thành:
Số lƣợng kết nối đến cùng địa chỉ
count
đích đang xét trong 2s
srv_count Số lƣợng kết nối đến cùng dịch vụ yr2 yr21 yq2
đích đang xét trong 2s  d    ...   
r r 1 q
serror_rate % số kết nối có lỗi đồng bộ SYN
94
94
HộiHội
Thảo Quốc
Thảo Gia
Quốc 2015
ĐiệnTử,
Tử,Truyền
NghệThông
ThôngTinTin (ECIT
(ECIT 2015)
2015)
B NG V. KẾT QU THỬ NGHIỆM 4 IV. KẾT LUẬN

k Precision (%) TPR (%) FPR (%) TA (%) Trên cơ sở những nghiên cứu về phát hiện lƣu lƣợng bất
13 95.4 80.3 3.4 89.1 thƣờng dựa trên thuật toán PCA, bài báo đề xuất một thuật toán
cho đƣờng cơ sở của phƣơng thức phát hiện lƣu lƣợng bất
3 95.1 87.2 3.8 92.1 thƣờng. Kết quả thử nghiệm cho thấy sự thay đổi độ chính xác
của của phƣơng thức đề xuất với những tham số khác nhau của
Bảng 6 thống kê kết quả phát hiện với trọng số wi = thuật toán đƣờng cơ sở cũng nhƣ số lƣợng thành phần chính.
1/ i và hằng số c =1. Công thức (3) trở thành: Ngoài ra, kết quả cũng cho thấy việc phát hiện bất thƣờng của
phƣơng thức đề xuất (dPCA) có thể thực hiện đƣợc với những
thành phần chính cuối cùng đƣợc coi là phần dƣ với điều kiện
lƣu lƣợng mạng dùng cho dữ liệu tập huấn đầu vào không chứa
yr yr 1 yq bất thƣờng (dữ liệu sạch).
 d   ...   
r r 1 q
TÀI LIỆU THAM KH O
[1] A. Lakhina, M. Crovella, and C. Diot, “Diagnosing network-wide traffic
B NG VI. KẾT QU THỬ NGHIỆM 5 anomalies,” in Proc. of ACM SIGCOMM, pp. 219–230, 2004.
[2] W. Wang and R. Battiti, “Identifying Intrusions in Computer Networks
k Precision (%) TPR (%) FPR (%) TA (%) with Principal Component Analysis,” in Proc. of IEEE ARES, 2006.
13 95.6 81 3.2 89.3 [3] M. Shyu, S. Chen, K. Sarinnapakorn, L. Chang, "Principal
Componentbased Anomaly Detection Scheme", Foundations and Novel
3 95.2 87.1 3.8 92.0 Approaches in Data Mining, Vol. 9, pp. 311-329, 2006.
[4] Y. Bouzida, “Efficient intrusion detection using principal component
analysis,” in Proc. of 7th World Multiconference on Systemics,
Nhận xét: Kết quả thử nghiệm cho thấy khi lựa chọn wi = Cybernetics and Informatics, 2003.
1, wi = i, wi = i1/ 2 có sự chênh lệch tỷ lệ TPR rất lớn giữa k = [5] D. Brauckhoff, K. Salamatian, M. May, “Applying PCA for Traffic
3 và k = 13. TPR cho biết khả năng phát hiện tấn công trong Anomaly Detection: Problems and Solutions,” in Proc. of IEEE
INFOCOM, 2009.
tổng số tấn công đƣa vào kiểm tra. Điều đó cho thấy các giá trị
[6] A. Lakhina, M. Crovella, and C. Diot Diot, “Mining anomalies using
ngoại lai thƣờng nằm ở những thành phần chính cuối cùng traffic feature distributions,” in Proc. of ACM SIGCOMM, 2005.
đƣợc coi là phần dƣ. Quy luật biến thiên của hệ thống trong [7] L. Mechtri, F.D. Tolba, N.Ghoualmi, “Intrusion detection using
điều kiện bình thƣờng khi không có tấn công thƣờng nằm ở principal component analysis,” in Proc. of IEEE ICESMA, 2010.
những thành phần chính đầu tiên. Do vậy khi lựa chọn k = 13, [8] M.H.Bhuyan, D.K.Bhattacharyya, J.K.Kalita, “Network Anomaly
nếu khuyếch đại các thành phần chính này bằng wi = i, wi = Detection: Methods, Systems and Tools,” in Proc. of IEEE
c Communications Surveys and Tutorials, Vol. 16, pp. 303 – 336, 2013.
i1/ 2 thì sự chênh lệch của w i yi giữa những thành phần
[9] K. Wankhade, S. Patka, R. Thool, “An Overview of Intrusion Detection
chính đầu tiên và cuối cùng càng lớn và làm mất đi một số giá Based on Data Mining Techniques,” in Proc. of IEEE CSNT, 2013.
trị ngoại lai trong d. So với kết quả trong các nghiên cứu [2, 3, [10] C. Kacha, K. A. Shevade, “Comparison of Different Intrusion Detection
6], tác giả nhận định rằng kết quả đạt đƣợc là tƣơng đƣơng and Prevention Systems,” Intl. Journal of Emerging Technology and
nhƣng giảm đƣợc mức độ tính toán cho thuật toán của đƣờng Advanced Engineering, Vol.2, Iss.12, pp.243-245, 2012.
cơ sở với công thức (8), (11) và (12). Công thức (8) có thể áp [11] S. Myers, J. Musacchio, N. Bao, “Intrusion Detection Systems: A
dụng cho phần dƣ khi sự chênh lệch giữa các thành phần chính Feature and Capability Analysis,” Tech.Report UCSC-SOE-10-12, Jack
Baskin School of Engineering, 2010.
cuối cùng là không nhiều. Thử nghiệm với công thức (11) và
[12] M. Tavallaee, E. Bagheri, W. Lu, A.A. Ghorbani, “A Detailed
(12) cho kết quả tƣơng đƣơng nhau nhƣng áp dụng công thức Analysis of the KDD CUP 99 Data Set,” In the Proc. of IEEE
(12) giảm đƣợc mức độ tính toán vì trọng số wi là cố định trong CISDA 2009.
khi không phải tính bình phƣơng của các thành phần chính. [13] The KDD99 cup data, http://kdd.ics.uci.edu
Khi lựa chọn trọng số wi = 1/ i , wi = 1/ i coi nhƣ chuẩn /databases/kddcup99/kddcup99.html, 1999
[14] The NSL-KDD data, http://nsl.cs.unb.ca/nsl-kdd, 2009.
hóa yi c trong miền con PCA nên sự chênh lệch TPR không quá
nhiều giữa các giá trị k. Đồng thời, kết quả thử nghiệm trong
bài báo có độ tin cậy cao hơn [2, 3, 6] vì sử dụng tập dữ liệu 
NSL-KDD đã khắc phục đƣợc một số nhƣợc điểm quan trọng
ảnh hƣởng đến hiệu quả đánh giá của phƣơng thức phát hiện
với KDD-CUP 99. 
95
95
HộiHội
ThảoThảo Quốc
Quốc Gia
2015 ĐiệnTử,
Tử,Truyền
TruyềnThông
Thông và
và Công
CôngNghệ
NghệThông
ThôngTinTin
(ECIT 2015)
(ECIT 2015)
Đề xuất giải pháp đánh giá cân bằng băng thông

mạng
Nguyễn Chiến Trinh Trần Minh Anh
Khoa Viễn Thông I, VNPT Đà nẵng
Học Viện Công Nghệ Bưu Chính Viễn Thông Email: anhtm.dng@vnpt.vn
Email: trinhnc@ptit.edu.vn
Abstract— Việc tối ưu hóa băng thông mạng luôn là một vấn đề Bên cạnh đó, việc nâng cấp mạng, tăng cường dung lượng,
mà các nhà khai thác, quản lý mạng quan tâm nhằm tiết kiệm chi gia tăng kết nối giữa các nút mạng cũng là một vấn đề cần giải
phí đầu tư, và đảm bảo tốt nhất việc đáp ứng nhu cầu khách quyết đối với các nhà quản lý khi đưa ra quyết định đầu tư
hàng. Trong bối cảnh việc tăng trưởng sử dụng băng thông trên nhằm tối đa hóa lợi nhuận, tối thiểu chi phí. Do đó, bên cạnh
thế giới diễn ra với tốc độ nhanh như hiện nay, thì việc tối ưu
việc nghiên cứu đưa vào thực tế các công nghệ mới, các giải
băng thông mạng luôn đặt ra những thách thức mới. Trên cơ sở
nghiên cứu các phương pháp tối ưu hóa băng thông, và việc tính pháp qui hoạch mạng mới (tương ứng với các thiết bị dự định
toán cân bằng băng thông trong mạng, bài báo đề xuất phương đầu tư), thì việc đưa ra các phương thức đánh giá mạng, đảm
thức đánh giá sử dụng băng thông mạng hiện nay, như là một bảo băng thông và các tham số QoS cũng là một thách thức và
giải pháp giúp cho việc đầu tư, tối ưu và khai thác mạng viễn đồng thời là một nhiệm vụ cần đặt ra.
thông hiệu quả hơn. Đã có nhiều dự án, cũng như nhiều phương pháp được đề
xuất để có thể đánh giá được tính tối ưu, hiệu quả, đáp ứng chất
Keywords- BBM, qui hoạch mạng, tối ưu băng thông, hiệu lượng dịch vụ cho nhu cầu người dùng của mạng. Một số
năng mạng, cân bằng tải; nghiên cứu trong [2,3,4,5,6] đề cập đến việc xây dựng chỉ số
I. ĐẶT VẤN ĐỀ đánh giá mạng, liên mạng, mạng không dây … đều định hướng
đánh giá mạng mang tính chung nhất. Tuy vậy, tùy vào từng
Trong xu thế phát triển mạnh mẽ của nền kinh tế tri thức, hoàn cảnh và mục tiêu cần có những thông số đánh giá phù
nền kinh tế thông tin hiện nay, nhu cầu trao đổi thông tin trong hợp. Đối với mạng đang phát triển nhanh hiện nay, đặc biệt
thời đại công nghệ là điều kiện sống còn của mọi hoạt động của trong bối cảnh nhà mạng phải cam kết đảm bảo chất lượng
xã hội và là điều kiện để phát triển của kinh tế xã hội cũng như đường truyền, chất lượng dịch vụ với khách hàng, thì cần có
sự phát triển của các dịch vụ viễn thông. Theo nghiên cứu của những thông số đánh giá sát hơn với thực tiễn, giúp các nhà
Cisco [1], lưu lượng thông tin trên mạng Internet cho đến năm khai thác nhanh chóng đưa ra quyết định phát triển mạng.
2019 và các năm tiếp theo là một sự bùng nổ rất nhanh chóng, Trong đó, việc đánh giá độ ổn định, cân bằng hay tối ưu mạng
với tốc độ tăng trưởng tổng hợp hàng năm đạt 23%/năm như là một khía cạnh cần nhấn mạnh. Với một hệ thống mạng phức
biểu đồ dự báo sau: tạp, cần sự đánh giá, so sánh cụ thể giữa nhiều phương án thiết
kế, thì việc đưa ra một hệ số, tạm gọi là hệ số đánh giá cân
bằng băng thông mạng sẽ giúp định hướng cho việc quyết định
chọn phương án tốt nhất trong các phương án được đưa ra.
Đóng góp chính của bài báo là đề xuất hệ số đánh giá mạng với
các mục tiêu trên. Các kết quả được kiểm chứng thông qua số
liệu mô phỏng, và các ứng dụng hệ số đề xuất trong một số mô
hình mạng cụ thể.
II. NHU CẦU THỰC TẾ VÀ ĐỀ XUẤT HỆ SỐ ĐÁNH GIÁ
2.1 Một số yêu cầu thực tế cần đảm bảo khi đánh giá cân
bằng băng thông mạng:
Hiện nay, việc mở rộng, nâng cấp mạng trở nên thường
Hình 1.Biểu đồ dự báo tăng trưởng lưu lượng thông tin đến 2019- Nguồn [1] xuyên hơn, do nhu cầu thông tin của xã hội tăng đột biến [7,8].
Các nhu cầu xã hội tăng cao dẫn đến việc đáp ứng chất lượng
Việc tăng trưởng nhu cầu dữ liệu đã dẫn đến việc các nhà
dịch vụ cho người dùng càng trở nên khó khăn và phức tạp
cung cấp mạng phải đối mặt với việc đảm bảo chất lượng cho
hơn rất nhiều. Việc đáp ứng băng thông, chất lượng đường
người sử dụng. Hơn nữa, với yêu cầu phát triển lên mạng thế
truyền về độ trễ (Delay), biến thiên trễ (Jitter), mất gói (Packet
hệ mới, số lượng nút mạng, lưu lượng thông tin rất cao, thì việc
Loss) … trở nên khắt khe hơn với các dịch vụ trực tuyến, dịch
tìm ra các thông số có thể nhanh chóng đánh giá được hiệu suất
vụ thời gian thực như truyền hình số, truyền hình theo yêu
sử dụng tài nguyên mạng, khả năng của mạng trong việc đáp
cầu, truyền hình tương tác … hay là các dịch vụ bán vé qua
ứng nhu cầu người sử dụng là rất thiết thực.
mạng, trò chơi trực tuyến …
ISBN: 978-604-67-0635-9 96
96
HộiHội
Thảo Quốc
Thảo Gia
Quốc Gia2015
2015về
vềĐiện
Điện Tử,
Tử,Truyền
Nghệ Thông
Thông TinTin (ECIT
(ECIT 2015)
2015)
Giải pháp đảm bảo QoS phổ biến nhất hiện nay vẫn là cam (trong trường hợp xem như bỏ qua độ trễ truyền dẫn và trễ
kết của nhà mạng về tốc độ (băng thông) tối thiểu cho đường hàng đợi), và đường nối này có số hop không vượt quá
truyền của khách hàng (thuê bao), tức là cam kết về gói cước (minhopij+d).
của các nhà cung cấp dịch vụ đối với người dùng. Tất nhiên, Áp dụng thuật toán Dijkstra, ta dễ dàng tìm được giá trị
khi băng thông dồi dào, lượng thuê bao không quá lớn, thì minhop, và giá trị này thường được ứng dụng trong các thuật
việc cam kết băng thông này là dễ dàng, và qua đó, chất lượng toán tìm đường, các giao thức định tuyến … Với giá trị độ sâu
đường truyền tốt hơn sẽ đáp ứng tốt các tiêu chí khác của QoS d, nếu tăng d thì số lượng đường kết nối để so sánh tìm ra
như độ trễ, mất gói … Nhưng khi có hạn chế về băng thông, rõ là càng lớn. Trong khuôn khổ bài báo này, ta lựa chọn d = 0
ràng là việc kết nối mạng phải theo một nguyên tắc là thiếu thì (chính là tập các đường ngắn nhất) và d = (N-2) (gọi là giá trị
phải bổ sung, thêm kết nối, tăng dung lượng … nhằm đảm bảo tối đa) để minh họa trong các trường hợp cụ thể.
được cam kết với người dùng khi đăng ký sử dụng dịch vụ. Ta có ma trận Md như sau:
Ngoài ra, cam kết về các thông số QoS khác với băng thông
như trễ, jitter, mất gói… cũng có thể được chuyển đổi sang 1 2 .. N Pj αj γj
băng thông trong một số trường hợp như [9] phân tích.
Vậy vấn đề đặt ra là nâng cấp thế nào, chỗ nào, tiêu chí
nào để đánh giá việc nâng cấp này, tối ưu hơn việc nâng cấp 1 0 .. α1 γ1
kia … Đồng thời, khi cần xây dựng mạng mới, dựa vào đâu để
đánh giá tính tối ưu, tính hiệu quả của mạng được thiết kế.
Trên cơ sở đó, bài báo đề xuất một hệ số đánh giá liên quan 2 0 .. α2 γ2
đến đảm bảo băng thông cho khách hàng đối với các trường
hợp cụ thể, từ đó có thể hỗ trợ đưa ra lựa chọn, phương án .. .. .. .. .. ..
hiệu quả nhất.
2.2 Đề xuất hệ số đánh giá liên quan đến cân bằng băng
N .. 0 αN γN
thông trên mạng :
Để đạt được tính tối ưu băng thông của một mạng cho trước,
thì việc chênh lệch băng thông sử dụng giữa các đường liên
kết (Link) trong mạng đó được xem là nhỏ nhất. Để có được
giá trị nhỏ nhất đó, cần tìm ra một hệ số biểu diễn giá trị chênh Gọi:
lệch băng thông toàn cục của mạng đang xét, là hàm số của tất m: giá trị trung bình của băng thông khả dụng theo số nút
cả giá trị băng thông các đường liên kết, hệ số sử dụng, hệ số B: Trung bình băng thông toàn mạng (bằng tổng băng thông
ưu tiên theo nút mạng và yêu cầu băng thông của tất cả nút xét chia tổng link)
trên một mạng đó. b: Giá trị trung bình băng thông khả dụng theo số kết nối.
Gọi mạng đang xét là G(N,L) với N nút mạng và L đường kết Pj: Tổng giá trị băng thông khả dụng tại mỗi nút.
nối thực tế (có các giá trị băng thông tương ứng giữa hai nút Khi đó Pj là tổng , với mọi i, tức là :
mạng liền kề a và b là Lab) trong mạng G. Nếu giữa hai nút a
và b bất kỳ không có kết nối trực tiếp, thì Lab = 0. Tương ứng (3)
với các nút mạng là yêu cầu băng thông tại các nút đó, ký hiệu
là Ni, i={1,N}. (4)
Lập ma trận Md, với các chỉ số được xác định như sau:
(5)
Xét hai nút mạng i, j bất kỳ trên mạng G. Giả sử giữa hai nút
trên có v đường kết nối khả dĩ. Gọi minhopij là số chặng (hop) b= (6)
ít nhất khi nối hai nút i và j, và d là độ sâu của đường kết nối.
Xét tập Vd(1..v) gồm có v đường kết nối giữa hai nút trên có
số hop không vượt quá (minhopij+d). Các đường kết nối được Với αj, γj là các hệ số ưu tiên cho nút thứ j, liên quan đến mức
hiểu là các đường nối không có nút lặp, minhop ≥1, 0≤d≤(N- độ sử dụng và khả năng phát triển mạng. Trong một mạng có
2). các mức độ ưu tiên tại các nút như nhau thì các hệ số αj, γj
Với mỗi đường kết nối , k={1,v}, gọi minBdk là giá trị băng bằng nhau và bằng 1.
Với các định nghĩa trên, ta sẽ thấy được độ chênh lệnh sử
thông bé nhất trong các đường liên kết cấu thành . Giá trị
dụng băng thông qua toàn mạng, tương ứng với trung bình
chính là giá trị lớn nhất của minBdk xét trong tập Vd, với quân phương của tổng băng thông khả dụng theo từng nút Pj.
độ sâu là d. Nghĩa là: Để có thể áp dụng cho các mạng thực tế, với các hệ số ưu tiên
minBdk = min(Lih1,Lh1h2,…Lhsj) (1) đối với từng nút mạng αj, γj, thì ta có thể đề xuất hệ số BBM
với đường nối thứ k của tập Vd gồm các nút i, h1,h2..hs,j, và (Balanced Bandwidth Metric) được tính bằng công thức sau:
0≤s ≤ (minhopij+d-2); s=0 khi nút i và j nối trực tiếp nhau.
= max(minBdk), với k={1,v} (2)
Để đơn giản hóa, chính là là giá trị băng thông nhỏ nhất
(7)
trong các đường kết nối tốt nhất giữa hai nút mạng i và j
97
97
HộiHội
ThảoThảo Quốc
Quốc Gia
2015 ĐiệnTử,
Tử,Truyền
TruyềnThông
Thông và
và Công
CôngNghệ
NghệThông
ThôngTinTin
(ECIT 2015)
(ECIT 2015)
BBM có thể được viết gọn lại như sau: tỏ nhiều nút mạng chịu tải có mức băng thông cao hơn hoặc
thấp hơn rất nhiều so với mức trung bình.
(8) Giả sử ta đổi kết nối 2-3 thành 1-3. Mạng lúc này sẽ là:
Các giá trị αj:
(9)
Còn giá trị γj được tính tương ứng với dự kiến nhu cầu băng
thông tại các nút. Phân tích cụ thể về việc xác định giá trị ưu
tiên γj tại các nút sẽ được đưa ra trong mục 2.5.2 dưới đây.
Giá trị BBM thu được tại (7) hay (8) nói lên mức độ cân bằng
tải băng thông qua mạng, so với mức băng thông trung bình
toàn mạng, từ đó thể hiện mức độ tối ưu trong việc sử dụng
nguồn lực mạng cho nhu cầu thực tế. Giá trị BBM càng nhỏ
tương ứng việc sử dụng băng thông toàn mạng càng cao, và dĩ
nhiên giá trị tốt nhất vẫn là BBM=0, khi đó mạng được gọi là Hình 3. Mạng giả định 2
cân bằng về băng thông toàn mạng.
Với cách tính trên, rõ ràng, hệ số BBM này có thể áp dụng cho Lập ma trận băng thông kết nối, cụ thể :
các hệ thống mạng phức tạp hơn như hệ thống mạng có các Bảng 2. Ma trận kết nối 2
đường liên kết có băng thông khác nhau, hay các nút mạng
0 1 2 3 4 5 Pj BBM
vẫn có tốc độ tương tự nhau nhưng chưa đảm bảo cung cấp
0 0 5 10 10 10 10 45
lượng băng thông với khách hàng … 1 5 0 5 5 5 5 25
Để làm rõ hơn việc ứng dụng BBM vào mạng thực tế, chúng 2 10 5 0 11 20 11 57
2,14
ta xét ví dụ với hai trường hợp d=0 và d=N-2. Giả định với 3 10 5 11 0 11 11 48
một mạng có topo như sau: 4 10 5 20 11 0 11 57
5 10 5 11 11 11 0 48
Theo công thức tính (8) thì mạng trên có BBM = 2,14. Có
nghĩa là, hệ số băng thông cân bằng mới đạt mức 2,14 < 3,02
so với mô hình đầu, với giá trị trung bình băng thông khả dụng
theo số kết nối b là 9,33M. Rõ ràng, so với mô hình đầu, chỉ
với việc thay đổi kết nối (hoàn toàn như nhau) thì khả năng
đáp ứng của mạng sau đã tốt hơn trước. Và qua chỉ số BBM
đã phản ánh rõ điều này.
2.3 Việc tính toán hệ số BBM khi có quan tâm đến số lượng
hop của đường truyền:
Trong thực tế, việc sử dụng thuật toán tìm đường ngắn nhất
vẫn được sử dụng thường xuyên trong các giao thức Internet
hiện nay, để định tuyến với việc chọn đường có số chặng
Hình 2. Mạng giả định 1 (hop) là nhỏ nhất, tương ứng với trường hợp d=0 và các bước
Mạng trên có N=6 nút, và L=8 đường nối thực tế với các giá chờ tại các nút là nhỏ nhất. Với cách tính này và với mô hình
trị băng thông đi kèm. Giả sử các nút mạng có mức ưu tiên αj, mạng được xét ở phần 2.2 trên, ta sẽ có hệ số BBM cụ thể như
γj và các giá trị bộ định tuyến, độ trễ như nhau. Giao thức định sau:
tuyến theo kiểu chỉ chọn đường có băng thông rộng nhất từ Với mô hình đầu ma trận kết nối là:
nguồn đến đích (tương ứng với trường hợp d=N-2). Bảng 3. Ma trận kết nối 3
Lập ma trận băng thông kết nối, cụ thể: 0 1 2 3 4 5 Pj BBM
Bảng 1. Ma trận kết nối 1 0 0 2(1) 10(1) 5(2) 6(1) 10(2) 33
0 1 2 3 4 5 Pj BBM 1 2(1) 0 3(1) 3(2) 3(2) 3(2) 14
0 0 3 10 5 10 10 38
2 10(1) 3(1) 0 5(1) 20(1) 11(1) 49 3,15
1 3 0 3 3 3 3 15
2 10 3 0 11 20 11 55 3 5(2) 3(2) 5(1) 0 5(2) 11(1) 29
3,02
3 5 3 11 0 11 11 41 4 6(1) 3(2) 20(1) 5(2) 0 11(2) 45
4 10 3 20 11 0 11 55 5 10(2) 3(2) 11(1) 11(1) 11(2) 0 46
5 10 3 11 11 11 0 46
(chỉ số trong ngoặc là minhop)
Theo công thức tính (8) thì mạng trên có BBM = 3,02. Có
nghĩa là, hệ số băng thông cân bằng chỉ đạt mức 3,02, chứng Và hệ số BBM sau khi đổi kết nối 2-3 thành 1-3 là:
98
98
HộiThảo
Hội ThảoQuốc
Quốc Gia
Gia 2015
2015 về
về Điện
ĐiệnTử,
Tử,Truyền
TruyềnThông
ThôngvàvàCông
CôngNghệ Thông
Nghệ Tin (ECIT
Thông 2015)
Tin (ECIT 2015)
Bảng 4. Ma trận kết nối 4 Vấn đề đặt ra là giữa hai chọn lựa kết nối 2-7 và 3-4, nên chọn
0 1 2 3 4 5 Pj BBM cách nào thì tốt hơn. Ta xét ma trận kết nối (chọn đường ngắn
0 0 2(1) 10(1) 2(2) 6(1) 10(2) 30 nhất) khi có kết nối 2-7.
1 2(1) 0 3(1) 5(1) 3(2) 5(2) 18 Lập ma trận băng thông kết nối khi có kết nối 2-7, cụ thể:
2 10(1) 3(1) 0 11(2) 20(1) 11(1) 55
2,97 Bảng 5. Ma trận kết nối 5
3 2(2) 5(1) 11(2) 0 11(3) 11(1) 40
4 6(1) 3(2) 20(1) 11(3) 0 11(2) 51 0 1 2 3 4 5 6 7 8 Pj αj BBM
5 10(2) 5(2) 11(1) 11(3) 11(2) 0 48
0 0 1 2 2 1 1 1 2 2 12 3.07
Kết quả cũng tương đối giống trường hợp trên, tuy nhiên với 1 1 0 1 1 2 1 4 1 1 12 3.07
cách tính khi d=0 thì hệ số BBM đã cao hơn, chứng tỏ việc 2 2 1 0 10 10 4 2 4 2 35 0.57
ứng dụng định tuyến đường ngắn nhất yêu cầu về cân bằng 3 2 2 10 0 10 2 2 2 2 32 0.73
băng thông cao hơn. 4 1 2 10 4 0 4 2 2 2 27 0.37 2.37
5 1 1 4 4 4 0 1 2 1 18 3.07
Tóm lại, việc áp dụng hệ số BBM này để đánh giá sẽ thấy rất
6 1 4 2 2 2 1 0 1 1 14 1.92
rõ ràng việc nâng cấp, thay đổi cấu hình mạng đem lại ý nghĩa 7 2 1 2 2 2 2 1 0 1 13 0.85
thế nào với việc đảm bảo băng thông cho người dùng. 8 2 2 2 2 2 1 2 1 0 14 2.19
2.4 Ảnh hưởng của việc sử dụng các hệ số α, γ:
Như đã giới thiệu trong mục 2.2, α, γ là các hệ số đánh giá Và ma trận khi có kết nối 3-4 là :
mức độ quan trọng của từng nút mạng trong mạng đã cho. Vì Bảng 6. Ma trận kết nối 6
trong thực tế, khi một nút mạng bố trí tại một khu vực thì nó 0 1 2 3 4 5 6 7 8 Pj αj BBM
phải chịu tải tương ứng với nhu cầu tại khu vực đó, do đó, 0 0 1 2 2 1 1 1 2 2 12 3.07
mức yêu cầu càng cao thì mức độ quan trọng càng cao. 1 1 0 1 2 2 1 4 1 2 14 3.07
α: là hệ số đánh giá mức độ yêu cầu băng thông tại nút so với 2 2 1 0 10 10 4 2 2 2 33 0.57
trung bình toàn mạng. 3 2 2 10 0 4 4 2 2 2 28 0.73
γ: là hệ số ưu tiên khu vực. Đây là hệ số mang tính tương lai. 4 1 2 10 4 0 4 2 2 2 27 0.37 2.55
Nếu một nút được cho là có khả năng chịu tải cao hơn trong 5 1 1 4 4 4 0 1 2 1 18 3.07
6 1 4 2 2 2 1 0 1 2 15 1.92
tương lai thì nó có giá trị cao và ngược lại.
7 2 1 2 2 2 2 1 0 1 13 0.85
Trong các ví dụ trên, α, γ đều được đặt bằng 1 để dễ tính toán. 8 2 2 2 2 2 1 2 1 0 14 2.19
Trên thực tế, thì cần tính toán chi tiết trên cơ sở số liệu cụ thể.
Trong đó, αj là hệ số yêu cầu băng thông nút j tương ứng bằng Từ các hệ số BBM trong ví dụ nói trên, chúng ta rút ra một số
tổng băng thông trung bình toàn mạng trên tổng nhu cầu băng nhận xét:
thông tại nút j. Và γj là mức độ ưu tiên khu vực tại nút j. 1. Sự khác biệt giữa hai giải pháp kết nối là không lớn, thể
Các giá trị αj, γj cần được tính toán chi tiết để có thể đưa ra hệ hiện qua các hệ số BBM là 2,37 và 2,55;
số BBM sát với thực tế, đánh giá đúng thực chất mạng để có 2. Các hệ số BBM trên đều lớn so với 0, chứng tỏ hiện tại
quyết định đầu tư hiệu quả nhất. có sự bất cân bằng trong mạng này;
2.5 Ví dụ cho việc ứng dụng các thông số BBM và α, γ trong 3. Khi chọn lựa bổ sung đường truyền dẫn, cách kết nối nút
việc tính toán mạng : (2-7) sẽ tốt hơn so với cách sau.
2.5.1 Xét trường hợp mọi nút có độ ưu tiên như nhau (γ=1) Với số lượng nút mạng trong ví dụ trên chỉ có 9 nút, nên có
thể dễ dàng ước lượng và đưa ra lựa chọn đem lại hiệu quả sử
Xét mạng viễn thông khu vực gồm 9 nút mạng, với các dung
dụng mạng tốt hơn. Đồng thời việc đánh giá sơ lược BBM
lượng băng thông các hướng, lượng thuê bao thực tế tại các
cũng sẽ giúp tối ưu mạng, tiết kiệm những đường truyền
nút chịu tải, tương ứng là hệ số α của các nút đó. Các nút có
không hiệu quả, có quyết định đầu tư tốt hơn. Tuy nhiên, nếu
độ ưu tiên γ là như nhau và bằng 1 (như hình 4)
là mạng khu vực có nhiều nút mạng và hàng triệu thuê bao trở
lên và cần thiết phải di dời, thay đổi, bổ sung hàng loạt nút
mạng, đường truyền, thì việc tính toán, ước lượng sẽ trở nên
khó khăn hơn, và nhiều khi không hiệu quả.
2.5.2 Xét trường hợp các nút có độ ưu tiên khác nhau
Việc ứng dụng hệ số γ vào tính toán BBM cho toàn mạng
được áp dụng tương tự hệ số α có nghĩa là nó cũng được nhân
trực tiếp như α. Tuy nhiên, ý nghĩa của γ sẽ khác là nó sẽ giúp
cho công tác hoạch định, dự báo quy hoạch tại các nút chịu tải
“tương lai” sẽ cao hơn các nút khác.
Ví dụ: Tại nút Quận X đang có lượng chịu tải là T, hệ số α là
a, tương ứng với số thuê bao (hay yêu cầu băng thông) tại nút
là Tb. Tuy nhiên trong dự báo, tỷ lệ băng thông yêu cầu (tương
ứng với số thuê bao dự kiến) sẽ là hệ số b. Vậy hệ số γ sẽ là
Hình 4. Mạng khu vực điển hình b/a. Từ đó, chúng ta sẽ tính BBM toàn mạng theo các hệ số α,
99
99
HộiHội
Thảo Quốc
Thảo Gia
Quốc 2015
ĐiệnTử,
Tử,Truyền
NghệThông
ThôngTinTin (ECIT
(ECIT 2015)
2015)
γ mới. Tại các nút không có các chỉ số ưu tiên thì áp dụng
bằng 1.
2.5.3 Ứng dụng trong việc quyết định đầu tư
Do BBM chỉ là hệ số đánh giá mạng sau khi đã tính toán, dự
tính dung lượng đường truyền … nên BBM chỉ giúp cho biết
là với cách tính đó, thì tính hiệu quả đạt được như thế nàò. Để
ứng dụng trong thực tế, chúng ta cần dự trù trước với mạng cụ
thể A, thì khi bổ sung đường truyền thì tính cân bằng như thế
nào, và cách bố trí nào là hợp lý nhất (so với khả năng đầu tư).
Vì thế, hệ số BBM được xem như là một giải pháp giúp cho
việc đánh giá cân bằng băng thông mạng từ đó giúp đưa ra
quyết định đầu tư cuối cùng.
III. MÔ PHỎNG SỬ DỤNG HỆ SỐ BBM
Để có thể kết luận một mạng có hệ số BBM thấp hơn có chất
lượng truyền dẫn như độ trễ đầu cuối-đầu cuối tốt hơn, ta xét Hình 6. Mạng mô phỏng 2
một mạng tương ứng với ví dụ thực tế ở phần 2.5.1, hình 4.
Sử dụng phần mềm OpNet RiverBed Modeler 17.5, mô phỏng Quá trình mô phỏng cho ta các kết quả sau:
một mạng có 9 nút và các bộ định tuyến như ví dụ trên (giả 1) Thông số trễ toàn mạng
định có độ ưu tiên như nhau, tương ứng với mức nhu cầu băng
thông như nhau), do đó trên mỗi nút ta đặt số máy trạm như
nhau để dễ theo dõi.
Tốc độ giả lập trên mỗi máy trạm là: 10Kbytes/0,5ms, tương
ứng với mức 10.000 (byte/packet)* 8 (bit/byte) *
(1/0,0005)=160Mb/s.
Dung lượng trên toàn mạng (45 máy trạm) là 7,2 Gb/s.
Để so sánh kết quả mô phỏng, ta lập mối liên kết SW3-SW4.
Các thông số so sánh bao gồm:
- Global statistics: Delay Ethernet, Traffic Received (bit/s),
End-End Delay…
- Node Statistics: Delay Ethernet, Traffic Received (bit/s),
Load (bit/s).
Mạng mô phỏng như hình 5.
Hình 7. So sánh thông số trễ toàn mạng
Rõ ràng hai phương án tương ứng với 2 mạng mô phỏng đều

gây trễ trong một khoảng nhất định, trong đó, phương án 2
(mạng mô phỏng thứ 2) sẽ ít gây hiệu ứng trễ hơn.
2) Thông số lưu lượng nhận toàn mạng :
Hình 5. Mạng mô phỏng 1
Sau đó nhân bản hoạt cảnh trên, xóa bỏ nối kết SW3-SW4,
thay vào đó là liên kết SW2-SW7 hoàn toàn tương tự mối liên
kết vừa xóa, ta có mạng mô phỏng thứ 2 như hình 6.
Việc thiết lập các giao thức, các tham số tương ứng cho hai
hoạt cảnh được thực hiện trước khi nhân bản hoạt cảnh, và Hình 8. So sánh lưu lượng nhận toàn mạng
được ứng dụng hoàn toàn như nhau khi so sánh kết quả mô Về tổng thể, so với lưu lượng phát là như nhau nhưng phương
phỏng. án 2 tốt hơn và đảm bảo lượng thông tin thu nhận cao hơn.
100
100
HộiHội
ThảoThảo Quốc
Quốc Gia
2015 ĐiệnTử,
Tử,Truyền
TruyềnThông
Thông và
và Công
CôngNghệ
NghệThông
ThôngTinTin
(ECIT 2015)
(ECIT 2015)
3) Thông số trễ nội bộ các nút bằng băng thông trong một mạng khu vực bất kỳ sẽ đem lại
một hiệu quả lớn cho nhà quản lý trong việc xây dựng kế hoạch
đầu tư ngắn hạn, thậm chí là dài hạn.
Trong khuôn khổ bài báo, việc xây dựng và đưa ra hệ số BBM
liên quan đến đảm bảo cân bằng băng thông trong mạng sẽ hỗ
trợ cho nhà quản lý, khai thác mạng công cụ hiệu quả, nhanh
chóng để có thể xây dựng quyết sách trong việc đầu tư, tái đầu
tư… nhằm đảm bảo cho nhu cầu của khách hàng.
Nội dung và đóng góp của bài báo mới chỉ xây dựng hệ số
BBM liên quan đến cân bằng băng thông, một trong các thông
số của QoS. Trong tương lai, khi mà nhu cầu khách hàng tăng
cao, việc đảm bảo đủ các chỉ số như trễ, jitter … cho khách
hàng trở nên bức thiết, thì việc xây dựng các hệ số khác như
BDM (Balanced Delay Metric), hay BQM (Balanced QoS
Metric) sẽ trở nên quan trọng hơn và đảm bảo đánh giá cụ thể
mức độ đáp ứng của mạng với nhu cầu của khách hàng trong
Hình 9. So sánh thông số trễ nội bộ các nút thời gian tới.
(Ghi chú: Trong cả ba hình 7, hình 8 và hình 9 về so sánh kết TÀI LIỆU THAM KHẢO
quả mô phỏng, đường màu xanh là phương án 1, màu đỏ là [1] http://www.cisco.com/c/en/us/solutions/collateral/service-
phương án 2) provider/visual-networking-index-vni/VNI_Hyperconnectivity_WP.html
Rõ ràng việc nhận thông tin tại các nút theo phương án 2 là tốt [2] J. L. Sobrinho, .Network routing with path vector protocols: Theory and
hơn (ít trễ hơn). applications,. in Proc. ACM SIGCOMM, September 2003.
Các thông số khác về cơ bản là như nhau, thể hiện qua thông [3] Javaid, N.; Bibi, A.; Djouani, K.; "Interference and bandwidth adjusted
ETX in wireless multi-hop networks," GLOBECOM Workshops (GC
số BBM của chúng cũng xấp xỉ nhau. Wkshps), 2010 IEEE, vol., no., pp.1638-1643, 6-10 Dec. 2010.
4) Kết luận và đánh giá [4] Jing Deng, Ping Guo, Qi Li, Haizhu Chen,A Load Balancing Strategy
with Bandwidth Constraint in Cloud Computing, The Open Cybernetics
Trễ của mạng vẫn đáng kể, đặc biệt trong giai đoạn giữa chu & Systemics Journal, 2014, 8: 115-121
trình. Việc gây trễ nội bộ nút cũng gây ảnh hưởng đến việc [5] Abdulbaset H. Mohammad “A new localized network based routing
truyền dữ liệu trong giai đoạn giữa chu trình truyền số liệu. Và model in computer and communication networks” International Journal
với các kết quả xác lập từ việc mô phỏng trên, ta có thể nhận of Computer Networks & Communications (IJCNC) Vol.3, No.2, March
2011.
thấy phương án 2 (mạng mô phỏng 2 với kết nối SW2-SW7)
[6] A.S Sairam and G.Barua, Bandwidth Management using Load
tốt hơn một chút so với phương án 1 (mạng mô phỏng 1 với Balancing,Proc.1st International Conf. on Communication System
kết nối SW3-SW4), tương ứng với hệ số BBM đã tính trong Software and Middleware (COMSWARE 2006), 2006.
phần 2.5, với phương án 2 có giá trị hệ số BBM thấp hơn. [7] http://www.nict.go.jp/nrh/nwgn
Để cải thiện các thông số trên, cần thiết phải bố trí cân bằng [8] David Clark, Karen Sollins, John Wroclawski, Dina Katabi, Joanna
hơn trong toàn mạng để giảm giá trị BBM, tương ứng giảm Kulik, Xiaowei Yang - MIT Computer Science & Artificial Intelligence
các thông số trễ, tổn thất gói tương ứng trong mạng. Lab. Dec 2003. “New Arch: Future Generation Internet Architecture”.
[9] K. Kar, M. Kodialam, T. V. Lakshman, Minimum Interference Routing
IV. KẾT LUẬN VÀ HƯỚNG PHÁT TRIỂN ĐỀ TÀI of Bandwidth Guaranteed Tunnels with MPLS Traffic Engineering
Applications, IEEE Journal on Selected Areas in Communications, Vol.
Việc đánh giá và xây dựng phương pháp đánh giá mạng viễn 18, No. 12, December 2000
thông luôn là bài toán đặt ra cho nhà quản lý, nhà khai thác
mạng. Việc xây dựng một hệ số đánh giá dựa trên thông số cân
101
101
HộiHội
Thảo Quốc
Thảo QuốcGia
Gia2015
2015về
Nghệ Thông
(ECIT 2015)
2015)
Thit K và Ch To B Dao ðng VCO Băng S

Rng Mt Octave
Nguyn Tn Nhân
B Môn Vô Tuyn, Khoa Vin Thông II,
Hc Vin Công Ngh Bưu Chính Vin Thông cơ s Tp. H Chí Minh
Email: tannhan2000@yahoo.com
Abstract—Bài vit này trình bày phương pháp thit k và ch to mt
b dao ñng ñiu khin ñin áp bng phương pháp phn x, hot
ñng  băng S có ñ rng mt octave2GHz ñn 4GHz. Mch s Power
dng transistor BJT cu hình cc base chung ni trc tip xung ñt
ñ to ngun ñin tr âm, kt hp vi diode bin dung gi vai trò như supply
b cng hưng. Ngun cung cp 12 Volts và 5Volts, mc ra nm
trong khong 14,5 dBm ñn 17,5 dBm và nhiu pha 60dBc/Hz cách
sóng mang 10kHz.
Resonator Active device Matching net

I. GII THIU
ΓR
Các b dao ñng VCO là mt b phn không th thiu
trong các máy ño, ra ña và h thng thông tin vô tuyn như các ΓIn
máy phân tích ph, phân tích mng vô hưng, phân tích mng
vector, máy thu phát ña băng… Thách thc ln nht ñi vi Hình 1. Mô hình mch dao ñng ñin tr âm.
các k sư thit k các b dao ñng là ñ sch pha ñưc ñánh
giá bng ñ nhiu pha nht là các b dao ñng VCO có di tn II. THIT K
hot ñng rng, thưng hai ch tiêu này ngưc nhau. Trưc ñây
trong thit b truyn thng ñ ñt ñưc các mc tiêu trên, các Mô hình dao ñng phn x gm có các thành phn trình bày
nhà sn xut thưng dùng dao ñng YIG – Yttrium Iron Garnet trên Hình 1, khi cp ngun, phn t tích cc ñ to ngun
– mt loi vt liu st t ñc bit, khó ch to, kích thưc ln ñin tr âm, b cng hưng xác lp tn s dao ñng ca mch
nên giá thành rt cao dù chúng có ñ tuyn tính tt. và mng phi hp tr kháng ngõ ra. Nhm ñt ñưc di tn
trên, mi phép tính phi ñưc thc hin ti tn s gia di:
Trong bài này trình bày phương pháp thit k và ch to f 0 = 2 × 4 = 2.828 MHz.
mt b dao ñng VCO có di tn rng mt octave nhm khc
phc các yêu cu trên vi vt liu, linh kin thông dng, kích ð mch dao ñng khi ñng ñưc phi tha ñiu kin sau
thưc nh và ñc bit là giá thành r. [3], [4]:
Dao ñng phn x thc cht là dao ñng s dng ngun
ñin tr âm to ra t linh kin tích cc ñ bù li suy hao ca b Γ*R × Γ In ≥ 1, (1)
cng hưng ñã ñưc trình bày nhiu trong các tp chí chuyên *
trong ñó, Γ là h s phn x liên hip phc ca b cng
R
ngành; ñc bit Silver J. P. [1]. Phương pháp thit k tn dng
hưng và Γ In là h s phn x ngõ vào ca phn t tích cc; 
ñc tính không n ñnh ti ưu vn có ca linh kin tích cc
ñưc chn ngay ti tn s thit k; ñng thi s dng cu hình ñây chính là S11 .
cc base chung trc tip ni ñt ñ nâng phm cht n ñnh Nói cách khác, ta có th vit li phương trình (1) như sau:
nhit ca mch. Mch cũng có vài hn ch như phi dùng
ngun ñôi, nhiu pha và ñ tuyn tính thp, tuy nhiên d dàng 1 1
khc phc các hn ch trên ñưc trình bày trong phn kt lun. Γ*R ≥ = , (2)
Γ In S11
Mch ñưc xây dng trên tham s S tín hiu nh ca linh
kin, tuy nhiên vì s dng phn mm AWR [2], nên có th s
hay biên ñ S11 và S22 phi ln hơn và h s n ñnh K phi
dng phương pháp cân bng hài ñ mô phng tuyn tính cũng nh hơn ñơn v, ñng thi ñ mch d khi ñng ti thiu biên
như phi tuyn. ñ S11 ≥ 1, 2 [5].
Phn còn li ca bài báo ñưc t chc như sau: trong phn Mc ñích to dao ñng là làm cho linh kin tích cc hot ñng
II, chúng tôi miêu t phương pháp thit k. Trong phn III, trong min bt n ñnh ca chúng. Như vy phi xét hot ñng
chúng tôi thc hin các thc nghim và ño th. Cui cùng, các ca linh kin  cu hình ñưc chn có tha mãn hay không,
kt lun ca bài báo ñưc trình bày trong phn IV. nu không, phi kt hp vi các linh kin th ñng bên ngoài
102
ISBN: 978-604-67-0635-9 102

HộiHội
Thảo Quốc
Thảo QuốcGia
Gia2015
2015về
vềĐiện
Điện Tử,
Tử,Truyền
Nghệ Thông
Thông TinTin (ECIT
(ECIT 2015)
2015)
ñ ñưa linh kin vào vùng bt n ñnh bng cách phân tích ma B. Phân tích phi tuyn
trn tham s S tín hiu nh ca nó. Trong thit k này, Phân tích tuyn tính ch cho bit hot ñng gn ñúng ca
transistor 2SC4226 [6] ca CEL – California Eastern mch dao ñng, ñ bit chính xác ph ngõ ra, h s nhiu
Laboratories  ñưc s dng làm phn t tích cc ñ to ñin pha... chúng ta cn phân tích mô hình phi tuyn bng phương
tr âm,b cng hưng dùng hai diode bin dung BB833 [7] ca pháp cân bng hài. ðu tiên cũng dùng phn mm AWR ñ
Infineon ni ñu lưng nhau dùng ñiu khin tn s VCO. xác ñnh ñim phân cc cho transistor như trên Hình 3. Các
ñin tr =R1 140  , R = 2 120  kt hp vi các ngun
A. Phân tích tuyn tính
VC = 12 V và VE = −5 V , gii hn dòng và to ñin th
T bng tham s S ca transistor  ñim phân cc
Vc = 10 (V), I c = 30 (mA); t ñó chúng ta xây dng cu hình VCE ≈ 10 V và I C = 29,8 mA .
BC cho transistor và s dng AWR mô phng tuyn tính ta Vì Γ R ≈ 1∠ − 82, 08 nên b cng hưng phi có tính thun
nhn ñưc kt qu cho các tham s S11 , S22 và h s  ñnh K dung kháng ñ cng hưng vi ñin cm ngõ vào ca linh
như trên Hình 2. Trong ñó ta thy = S11 1.535 > 1 , kin tích cc; giá tr dung kháng xác ñnh trên Smith
=S22 1.483 > 1 và K = −0, 6733 < 1 có giá tr gn ti ưu ti chart 51, 76  . Giá tr t ñin tương ng:
tn s 2,828GHz. Như vy phn t tích cc s dao ñng nu
vào cc E ca nó mt b cng hưng thích hp và ngõ ra kt 1 1
C= =
cui R=
L 50  [1]. 2π × f × X C 2π × 2828 × 106 × 51, 76 (3)
= 1, 09 ( pF ) .
Vì S11∠82.08 nên t (2) ñơn gin là ñt mt phn t cng
hưng ñ có h s phn x Γ R ≈ 1∠ − 82, 08 vào cc E DCVS
ID=V2
DCVS
ID=V1
V=5 V
transistor thì mch s dao ñng.

V=12 V
S parameter
1.6 0.5 CAP CAP
CAP
2.828 GHz |S(1,1)| (L) ID=C4 ID=C2
ID=C3
C=100 pF
1.535 C=1 pF C=330 pF
Linear IND
ID=L1
IND
ID=L2
L=47 nH L=47 nH
1.4 |S(2,2)| (L) 0.2
Linear
2.828 GHz
1.483 K() (R)
1.2 -0.1
Linear RES
ID=R1
RES
ID=R2
R=140 Ohm R=120 Ohm
PORT
SUBCKT CAP P=1
ID=S3 ID=C1 Z=50 Ohm
C=100 pF
1 -0.4 NET="NE85630/CEL"
2.828 GHz
C
3 2
-0.6733
B
OSCAPROBE 1
0.8 -0.7 CAP
ID=C5 ID=X1
Fstart=1 GHz MSUB
C=1.09 pF
Fend=5 GHz Er=4.6
Fsteps=200 A H=0.75 mm
Vsteps=30 T=0.017 mm
Rho=1
0.6 -1 Tand=0.025
ErNom=4.6
VIA1P Name=SUB1
1 2 3 4 5 ID=V5
VIA1P
ID=V4
D=0.8 mm D=0.8 mm
Frequency (GHz) H=0.75 mm
T=0.017 mm
H=0.75 mm
T=0.017 mm
RHO=1 RHO=1
Hình 2a. Biên ñ S11 , S22 và K. Hình 3. Mch dao ñng tn s xác ñnh 2.828 MHz.
S Ang Spectrum
200 25
2.828 GHz DB(|Pharm(PORT_1)|)[*,*] (dBm)
2.828 GHz 20 16.92 dBm OSC
82.08 Deg
100 15
Power output (dBm)
5.656 GHz
8.683 dBm
10
0
5
2.828 GHz
-97.56 Deg 0
8.484 GHz
-100 -5.515 dBm 11.31 GHz
Ang(S(1,1)) (Deg) -5 -7.677 dBm
Linear
Ang(S(2,2)) (Deg)
Linear -10
-200 0 5 10 14
1 2 3 4 5 Frequency (GHz)
Frequency (GHz)
Hình 4a. Ph ngõ ra b dao ñng.

Hình 2b. Pha tương ng ca S11 và S22 .
103
103
Vì mô hình ca diode bin dung thc hin  tn s thp, nên
Phase_noise các ñin cm ký sinh ca dây ni t chip diode ñn chân hàn
10
linh kin LS = 2, 2 nH , ñt ni tip vi ñin cm ngõ vào phn
0
t tích cc 2,9 nH kt hp vi ñin cm l xuyên thông [8]. Do
-20 ñó, ñin cm toàn phn ca mch vào là
Phase noise [dBc/Hz]
-40 0.01 MHz

-59.38 dB L∑ = 2,9 nH + 2, 2 nH + 0, 2 nH = 5, 3nH. (5)
-60
Giá tr t cng hưng s là: 0,59 pF tương ng vi ñin th
-80
phân cc cho hai diode 14,94 V.
-100
Mch cng hưng, phn t tích cc kt hp vi b mô
-120 phng cân bng hài AWR to VCO hoàn chnh ñưc trình bày
.0001 .001 .01 .1 1 trên Hình 6 (xem ñu trang k tip) và Hình 7 cho kt qu mô
Frequency
phng di tn b dao ñng theo ñin th ñiu khin.
Hình 4b. Nhiu pha.

Kt qu trên Hình 7 cho thy tn s ngõ ra thay ñi t 1.921
MHz ñn 4.045 MHz khi ñin th ñiu khin bin ñi tương
Sau khi ni t ñin có giá tr 1,09 pF vào cc E và mô ng t 6V ñn 35V. Quan h này tương ñi tuyn tính vi
phng. Kt qu trên Hình 4 là ph tn ngõ ra và nhiu pha ca KVCO ≈ 70 MHz/V .
b dao ñng. Mc ñin ngõ ra ti thành phn căn bn
16,92dBm, hài bc hai 8, 683dBm , hài bc ba −5,515dBm
V TUNE
và nhiu pha 59,38 dBc t v trí lch sóng mang 10 KHz. 5
35 V
Trong phn tip theo, ta tính toán dao ñng VCO có tn s 4.045 GHz
kim soát bng diode bin dung. T mch dao ñng tn s c 4
Frequency (GHz)
ñnh, ñin cm ngõ vào tương ñương: 14.94 V
2.828 GHz
3
1 1
=L =
ω 2C (2π f ) 2 × C 2
1 6V
OSC_FREQ()[*,X] (GHz)
= (4) 1.921 GHz
OSC
(2π × 2828 ×106 ) 2 ×1, 09 × 10−12 1
≈ 2,9 ( nH ) .
6 16 26 35
Volts (V)
Như vy, bây gi nu thay th t ñin có giá tr xác ñnh
bng diode bin dung ta s ñưc mt b dao ñng có tn s
kim soát bng ñin th VCO. ðng thi ñ ci thin ñ tuyn Hình 7. Tn s ngõ ra b dao ñng VCO theo ñin áp ñiu khin.
tính và gim ñin th ñiu khin; ta s dng cp diode bin III. THC NGHIM VÀ ðO TH
dung BB833 ni –lưng ñu lưng cho b cng hưng. Trên hình
Hình 5 là kt qu mô phng ñin dung ca chúng theo ñin áp
ñiu khin.
Linear Cv vs Voltage
5
4
Capacitance (pF)
2
14.94 V
0.5865 pF
1
6V
1.367 pF
0
0 10 20 30 40
Voltage (V)
Hình 8. Mch dao ñng VCO thc t.

Hình 5. ðin dung theo ñin áp ca hai diode BB833 ni –back to
back.
104
104
DCVS DCVS
ID=V2 ID=V1
V=5 V V=12 V
CAP
CAP CAP
ID=C3
ID=C4 ID=C2
C=100 pF
C= 1 pF C=330 pF
IND IND
ID=L1 ID=L2
L=47 nH L=47 nH
RES RES
ID=R1 ID=R2
R=140 Ohm R=120 Ohm
PORT
SUBCKT CAP RES P=1
ID=S3 ID=C1 ID=R3 Z=50 Ohm
NET="NE85630/CEL" C=100 pF R=1 Ohm
SUBCKT
C
ID=S2 100 3 2
NET="BB833"
B
1
RES
ID=R4
R=10000 Ohm
200
200
A
DCVSS OSCAPROBE
ID=V3 SUBCKT MSUB
ID=X1
VStart=14.94 V ID=S1 Er=4.6
Fstart=1 GHz VIA1P
VStop=14.94 V NET="BB833" H=0.75 mm
Fend=5 GHz ID=V4
VStep=0 V T=0.017 mm
Fsteps=200 D= 0.8 mm Rho=1
CAP Vsteps=30 H= 0.75 mm Tand=0.025
ID=C5 T= 0.017 mm ErNom=4.6
C=330 pF 100 RHO=1 Name=SUB1
VIA1P
ID=V5
D= 0.8 mm
H=0.75 mm
T= 0.017 mm
RHO=1
Hình 6. Mch dao ñng VCO rng mt Octve.
Bng 1: So sánh ch tiêu, kt qu mô phng và thc nghim b dao ñng.
Tham s Ch tiêu Mô phng Thc nghim ðơn v
ðin th ngun

VC 12 ± 0,5 12 12 ± 0,5
VE 5 ± 0,5 5 5 ± 0,5 Volts
VCONT (635) ± 0,5 635 (635) ± 0,5
Dòng ngun 30 29,8 30,3 mA
Di tn 24 1,921 – 4,045 1,860 – 3,980 GHz
Công sut ngõ ra 16 16,92 13,4 dBm
Nhiu pha 10KHz 60 59,38 46,4 dBc/Hz
Hài 30 25,6 x dBc
105
105
HộiHội
Thảo Quốc
Thảo Gia
Quốc 2015
ĐiệnTử,
Tử,Truyền
NghệThông
ThôngTinTin (ECIT
(ECIT 2015)
2015)
Mch dao ñng VCO ñưc thc hin bng phn mm Sprint
layout trên nn FR4. Transistor 2SC4226 ñóng trong v
SOT343, diode bin dung BB833 ñóng v SOD323, các cun
cn cao tn RFC và t ñin dáng kích thưc 0805. Hình 8
trình bày bo mch thc hin cui cùng trong ñó kt hp mch
suy hao 10dB, lc thông thp có tn s ct f cut −off = 4,5GHz
và mch MMIC ERA6, mc ñích cách ly ti và bo ñm mc
ra khong 40 mW.
Kt qu ño th di tn thp hơn mt ít so vi thit k
1860 MHz − 3980 MHz . Trên Hình 9 và 10, mc ñin ngõ ra
ti tn s 2.828 MHz là 13, 4 dBm , vi suy hao ngoài 25dB ,
nhiu pha 46, 4 dBc/Hz ti v trí lch vi sóng mang
10 ( kHz ) . Các giá tri này thp hơn so vi giá tr mô phng
Hình 10a. Nhiu pha ca mch dao ñng.
tương ng 3,52 dB và 13dB .
Bng 1 (xem trang trưc) cho kt qu thc t ño ñưc so vi
ch tiêu kỳ vng và kt qu mô phng.
I. KT LUN
Tin trình thit k và thc hin mch dao ñng VCO băng
tn S rng mt octave ñưc trình bày và kt qu ñt thc
nghim ñưc: Di tn 1860 MHz − 3980 MHz tương ng vi
ñin áp ñiu khin thay ñi t 6 ( V ) − 35 ( V ) , mc RF ngõ ra
13, 4 ( dBm ) và nhiu pha 46, 4 ( dBc/Hz ) . So vi mc tiêu ñ
ra, kt qu ño ñt thc t có di tn thp hơn kt qu mô phng
4% do ñin cm, ñin dung ký sinh ca các ñim hàn chân linh
kin không ñưc ñưa vào trong mô hình. Mc RF ngõ ra thp
hơn giá tr mô phng 3,5dB vì s dng vt liu nn FR4 có suy
Hình 10b. Nhiu pha ca mch dao ñng.
hao tương ñi ln δ = 0, 025 ; và cui cùng, diode bin dung có
h s phm cht thp R = 3, 6  nên nhiu pha thp hơn TÀI LIU THAM KHO
s
[1] Silver J. P. Reflection Oscillator Design Tutorial, www.rfic.co.uk, E
13dB so vi kt qu mô phng. ð khc phc ngun ñôi ta có mail: John@rfic.co.uk.
th dùng mt chip ñi ñin ñ to ra ñin áp 5V t ngun [2] Cornelis J. Kikkert, RF Electronics Design and Simulation, James Cook
University, Townsville, Queenland, Australia, 2013.
chính 12V và dùng ngun ñin áp quét ñưc sa dng bù s
phi tuyn ca tn s VCO theo ñin áp ñiu khin nhm có ñ [3] Guillermo Gonzaler, Microwave transistor amplifiers Analysis and
design, 2nd Edition, Pretice Hall, Inc., Upper Saddle River, New Jersey,
tuyn tính yêu cu. Tóm li, kt qu chính xác có th ñt nu United State of America, 1984.
có ñưc vt liu, linh kin phù hp và mô hình ñưc xây dng [4] David M. Pozar, Microwave Engineering, 2nd Edition, John Wiley &
ñy ñ. Sons, Inc., New york, United State of America,1998.
[5] Sebnem Seckin Ugurlu “Dielectric resonator oscillator design and
realization at 4,25GHz” ELECO 7th 2011 International Conference on
Electrical and Electronics Engineerng, pp 185188. 14 December,
Bursa, Turkey, 2011.
[6] NEC’s NPN Silicon High Frequency Transistor, NE856 Series.
California Eastern Laboratories, 2005.
[7] Silicon Tuning Diodes, Edition 20110615 Published by Infineon
Technologies, AG 81726 Munich, Germany.
[8] Rowan Gilmore, Les Besser, Practical RF Circuit Design for Modern
Wireless Systems, Artech House, Inc., 685 Canton Street, Norwood, MA
02062, paper 373374, volume I, 2003.
Hình 9. Ph ngõ ra.
106
106
ThiӃt KӃ Phòng Thí NghiӋm ViӉn Thông Tӯ Xa Dӵa

Trên Bӝ Thí NghiӋm Emona DATEx
Lѭѫng Vinh Quӕc Danh và NguyӉn Thӏ Trâm
Bӝ môn ĈiӋn tӱ ViӉn thông
Khoa Công NghӋ, Ĉҥi hӑc Cҫn Thѫ
E-mail: {lvqdanh, nttram}@ctu.edu.vn
Abstract—Bài báo này trình bày viӋc thiӃt kӃ mӝt phòng thí Trong bài báo này, chúng tôi trình bày viӋc thiӃt kӃ mӝt
nghiӋm tӯ xa phөc vө giҧng dҥy hӑc phҫn thӵc hành ViӉn thông phòng thí nghiӋm tӯ xa phөc vө giҧng dҥy hӑc phҫn thӵc hành
tҥi trѭӡng Ĉҥi hӑc Cҫn Thѫ. Ĉây là mӝt phòng thí nghiӋm viӉn ViӉn thông tҥi trѭӡng Ĉҥi hӑc Cҫn Thѫ. Phòng thí nghiӋm viӉn
thông tӯ xa, có tên gӑi là Tele-Lab (Telecommunication thông tӯ xa, có tên gӑi Tele-Lab (Telecommunication
Laboratory), ÿѭӧc xây dӵng trên cѫ sӣ kӃt hӧp board mҥch NI
Laboratory), ÿѭӧc thiӃt lұp trên cѫ sӣ kӃt hӧp board mҥch
ELVIS II, bӝ thí nghiӋm viӉn thông Emona DATEx và phҫn
mӅm LabVIEW. Mô hình Tele-Lab cho phép sinh viên có thӇ ELVIS II (Educational Laboratory Virtual Instrument Suite)
thӵc hiӋn các bài thӵc hành viӉn thông tӯ xa thông qua mҥng cӫa hãng National Instruments [5] và bӝ thí nghiӋm viӉn thông
internet bҵng cách truy cұp vào máy chӫ vӟi cҩu hình mҥng DATEx (Digital and Analog Telecommunications
riêng ҧo. Mӝt board Arduino Uno ÿѭӧc sӱ dөng ÿӇ ÿiӅu khiӇn Experimenter) cӫa hãng Emona (Úc) ÿӇ xây dӵng mӝt loҥt bài
mӝt ma trұn rѫ-le chuyӇn mҥch cho phép thiӃt lұp các kӃt nӕi tín thí nghiӋm trên nӅn tҧng phҫn mӅm LabVIEW. Phiên bҧn ÿҫu
hiӋu trong quá trình thí nghiӋm. Sinh viên có thӇ ÿһt trѭӟc thӡi tiên cӫa Tele-Lab [6] cho phép ngѭӡi hӑc thӵc hiӋn các bài thí
gian tiӃn hành thí nghiӋm thông qua website hӑc phҫn. ViӋc kӃt nghiӋm thông qua mҥng internet vӟi yêu cҫu biӃt trѭӟc ÿӏa chӍ
hӧp các bài thӵc hành tҥi phòng thí nghiӋm và các bài thӵc hành IP cӫa máy chӫ. Ngoài ra, tính năng ÿiӅu chӍnh nút vһn
tӯ xa có thӇ là mӝt phѭѫng thӭc hӳu hiӋu ÿӇ cӫng cӕ kiӃn thӭc và
(volume) trên board Emona DATEx tӯ xa cǊng còn mӝt sӕ hҥn
nâng cao khҧ năng tӵ hӑc cӫa sinh viên. Ĉây có thӇ ÿѭӧc xem là
mӝt giҧi pháp góp phҫn nâng cao hiӋu suҩt sӱ dөng trang thiӃt bӏ chӃ vӅ mһt kӻ thuұt. Bài báo này giӟi thiӋu mô hình Tele-Lab
thí nghiӋm và mӣ ra khҧ năng hӧp tác, chia sҿ thiӃt bӏ phөc vө vӟi tính năng nâng cҩp cho phép ngѭӡi hӑc truy cұp vào hӋ
ÿào tҥo giӳa các trѭӡng ÿҥi hӑc. thӕng qua mҥng internet sӱ dөng cҩu hình mҥng riêng ҧo VPN
(Virtual Private Networks) nên không cҫn biӃt trѭӟc ÿӏa chӍ IP
Keywords- Arduino, Emona DATEx, LabVIEW, NI ELVIS II, cӫa máy chӫ. Bên cҥnh ÿó, viӋc bә sung chӭc năng hiӇn thӏ sѫ
Phòng thí nghi͏m vi͍n thông tͳ xa. ÿӗ kӃt nӕi mҥch ÿiӋn và giao diӋn SFP (Soft Front Panels) cӫa
board Emona DATEx cho phép ngѭӡi hӑc ÿiӅu khiӇn các nút
I. GIӞI THIӊU vһn ngay trên giao diӋn chѭѫng trình duyӋt web. Ngѭӡi hӑc có
Sӵ phát triӇn nhanh chóng cӫa lƭnh vӵc công nghӋ thông tin thӇ truy cұp vào máy chӫ ÿһt ӣ phòng thí nghiӋm (Lab server)
và truyӅn thông ÿòi hӓi chѭѫng trình ÿào tҥo kӻ sѭ ngành kӻ tӯ máy tính ӣ nhà ÿӇ thiӃt lұp các ÿѭӡng kӃt nӕi mҥch ÿiӋn trên
thuұt ÿiӋn tӱ truyӅn thông phҧi có khҧ năng trang bӏ cho ngѭӡi board DATEx bҵng cách bұt/tҳt các rѫ-le chuyӇn mҥch ÿѭӧc
hӑc các kiӃn thӭc mӟi nhҩt và kӻ năng thӵc hành phù hӧp. Tuy ÿiӅu khiӇn bӣi mӝt board Arduino Uno [7].
nhiên, sӵ hҥn chӃ vӅ sӕ lѭӧng và chҩt lѭӧng trang thiӃt bӏ thí Phҫn II cӫa bài báo sӁ giӟi thiӋu cҩu trúc và nguyên tҳc hoҥt
nghiӋm tҥi các trѭӡng ÿҥi hӑc là trӣ ngҥi chính ÿӇ có thӇ ÿҥt ÿӝng cӫa hӋ thӕng Tele-Lab. Bài thí nghiӋm vӅ kӻ thuұt ÿiӅu
ÿѭӧc mөc tiêu môn hӑc cӫa các hӑc phҫn thӵc hành, thí chӃ trҧi phә (spread spectrum modulation) sӁ ÿѭӧc chӑn trình
nghiӋm. Mӝt trong nhӳng giҧi pháp cho vҩn ÿӅ trên là viӋc khai bày ӣ Phҫn III nhѭ mӝt ví dө minh hӑa.
thác công nghӋ ÿiӅu khiӇn tӯ xa và mҥng internet ÿӇ triӇn khai II. CҨU TҤO & NGUYÊN TҲC HOҤT ĈӜNG CӪA
các hoҥt ÿӝng tӵ hӑc ngoài giӡ hӑc trên lӟp cӫa sinh viên. TELE-LAB
Ý tѭӣng xây dӵng phòng thí nghiӋm tӯ xa ÿѭӧc giáo sѭ
Jesus del Alamo giӟi thiӋu lҫn ÿҫu tiên vào năm 1998 vӟi Dӵ Hình 1 trình bày cҩu trúc tәng quát cӫa phòng thí nghiӋm
án iLab tҥi ViӋn Công nghӋ MIT, Hoa KǤ [1]. KӇ tӯ ÿó ÿӃn viӉn thông tӯ xa Tele-Lab. HӋ thӕng ÿѭӧc xây dӵng trên nӅn
nay, ÿã có nhiӅu dӵ án nghiên cӭu nhҵm xây dӵng các phòng tҧng phҫn cӭng NI ELVIS II, bӝ thí nghiӋm Emona DATEx
thí nghiӋm tӯ xa phөc vө giҧng dҥy chҷng hҥn nhѭ dӵ án “iLab ETT-202 [8] và phҫn mӅm LabVIEW vӟi 02 ÿӕi tѭӧng chính
Shared Architecture” tҥi MIT [2], dӵ án Netlab tҥi Ĉҥi hӑc là máy chӫ (Lab server) và ngѭӡi hӑc (Client).
Nam Úc [3] và dӵ án iLabRS tҥi Ĉҥi hӑc Bách Khoa Catalunya Máy chͯ: ÿһt tҥi phòng thí nghiӋm, ÿѭӧc cài ÿһt phҫn mӅm
(Tây Ban Nha) [4]. Tuy nhiên, các mô hình phòng thí nghiӋm LabVIEW nhҵm ÿiӅu khiӇn các board NI ELVIS II, Emona
tӯ xa này ÿѭӧc xây dӵng trên cѫ sӣ hҥ tҫng kӻ thuұt phӭc tҥp DATEx, Arduino Uno. Ngoài ra, máy chӫ còn lѭu trӳ cѫ sӣ
vӟi chi phí cao nên khó khҧ thi trong ÿiӅu kiӋn dҥy và hӑc hiӋn dӳ liӋu ngѭӡi dùng và giúp quҧn lý, thiӃt lұp các bài thӵc
tҥi cӫa nhiӅu trѭӡng ÿҥi hӑc ӣ ViӋt Nam. hành.

ISBN: 978-604-67-0635-9 107

Ng˱ͥi h͕c: là ngѭӡi sӱ dөng Tele-Lab ÿӇ thӵc hiӋn bài thí

nghiӋm thuӝc hӑc phҫn thӵc hành ViӉn thông. Ngѭӡi hӑc có
thӇ truy cұp vào máy chӫ qua mҥng internet vӟi cҩu hình
mҥng riêng ҧo thông qua phҫn mӅm LogMeIn Hamachi [9].
Ngѭӡi hӑc chӍ cҫn cài ÿһt LabView Run-Time Engine 2012,
mӝt phҫn mӅm cho phép chҥy các ӭng dөng LabVIEW ÿã
ÿóng gói hoһc các ӭng dөng ÿѭӧc chia sҿ tӯ LabVIEW, trên
máy tính cá nhân và có thӇ truy cұp vào Tele-Lab bҵng trình
duyӋt web mà không cҫn cài ÿһt phҫn mӅm LabVIEW.
Nhӡ công cө Webserver cӫa LabVIEW, hӋ thӕng Tele-Lab
cho phép ngѭӡi hӑc thӵc hiӋn bài thí nghiӋm tӯ bҩt kǤ nѫi ÿâu
thông qua mҥng internet. Ngѭӡi hӑc truy cұp vào Tele-Lab và
Hình 3. Bӝ Emona DATEx gҳn trên board NI ELVIS II
ÿiӅu khiӇn giao diӋn ma trұn rѫ-le (switch matrix) ÿӇ ÿóng/ngҳt
các ÿѭӡng kӃt nӕi tín hiӋu ÿã ÿѭӧc thiӃt lұp sҹn trên board
mҥch Emona DATEx ETT-202 ÿһt tҥi phòng thí nghiӋm.
Hình 4. Mӝt sӕ module cѫ bҧn trên board Emona DATEx [10]
Board NI ELVIS II là mӝt bӝ công cө dành cho viӋc dҥy và

hӑc các môn ÿiӋn tӱ căn bҧn và thiӃt kӃ mҥch ÿӕi vӟi sinh
viên thuӝc các chuyên ngành khác nhau nhѭ: kӻ thuұt ÿiӋn, kӻ
thuұt cѫ khí và y sinh. Board NI ELVIS II cung cҩp ÿҫy ÿӫ
Hình 1. Cҩu trúc tәng quát cӫa Tele-Lab các thiӃt bӏ giúp kiӇm tra, ÿo lѭӡng và mô tҧ dӳ liӋu qua ÿӗ
thӏ. NI ELVIS II còn hӛ trӧ các thiӃt bӏ ÿo và hiӇn thӏ kӃt quҧ
phân tích tín hiӋu và ÿiӅu khiӇn qua máy tính. Board mҥch
cung cҩp 12 thiӃt bӏ ÿo lѭӡng thông dөng trong phòng thí
nghiӋm bao gӗm máy hiӋn sóng (Scope), ÿӗng hӗ ÿo sӕ
(DMM), bӝ nguӗn (VPS), mҥch tҥo xung (FGEN), máy phân
tích phә (DSA). Ngoài ra, NI ELVIS II còn ÿѭӧc sӱ dөng nhѭ
7HOHODE mӝt công cө ҧo có thӇ ÿѭӧc ÿiӅu khiӇn tӯ xa dӵa trên nӅn
LabVIEW và phҫn mӅm NI ELVISmx.
Emona DATEx là mӝt bӝ thí nghiӋm viӉn thông có thӇ
ÿѭӧc gҳn vào board NI ELVIS II (Hình 3). Ĉѭӧc thiӃt kӃ dѭӟi
dҥng tұp hӧp các khӕi chӭc năng (module), board Emona
DATEx cho phép ngѭӡi hӑc dӉ dàng kӃt nӕi các module lҥi
vӟi nhau ÿӇ thӵc hiӋn bài thí nghiӋm viӉn thông hoһc kiӇm
Hình 2. Thành phҫn cҩu tҥo cӫa Tele-Lab chӭng nhӳng kiӃn thӭc lý thuyӃt ÿã ÿѭӧc hӑc. Board Emona
DATEx bao gӗm hѫn 20 khӕi mҥch viӉn thông cѫ bҧn nhѭ:
Hình 2 trình bày các board mҥch phҫn cӭng và phҫn mӅm mҥch cӝng tín hiӋu (adder), mҥch ÿa hӧp (multiplexer), mҥch
tҥo thành hӋ thӕng Tele-Lab. Theo ÿó, phҫn cӭng chӫ yӃu cӫa trӝn tín hiӋu (mixer), khӕi phát tín hiӋu, mҥch dӏch pha…
hӋ thӕng gӗm có board Emona DATEx ÿѭӧc tích hӧp lên Nhӳng khӕi mҥch này có thӇ ÿѭӧc sӱ dөng ÿӇ thӵc hiӋn hàng
board NI ELVIS II và ma trұn rѫ-le chuyӇn mҥch ÿѭӧc ÿiӅu chөc bài thí nghiӋm viӉn thông chӍ bҵng cách kӃt hӧp các
khiӇn bҵng board Arduino Uno. module lҥi vӟi nhau [10]. Hình 4 trình bày mӝt sӕ module cѫ
bҧn cӫa bӝ thí nghiӋm Emona DATEx ETT-202.

108
dҥng HTML sӁ ÿѭӧc tҥo ra tѭѫng ӭng cho mӛi VI. Nhӡ ÿó,
ngѭӡi hӑc có thӇ ÿiӅu khiӇn thiӃt bӏ VI tӯ xa thông qua trình
duyӋt web. Ngѭӡi hӑc truy cұp vào mӛi VI giӕng nhѭ truy cұp
mӝt trang web thông thѭӡng. Vӟi công cө này cӫa LabVIEW,
sau khi máy chӫ ÿѭӧc kích hoҥt, các giao diӋn, thiӃt bӏ VIs sӁ
ÿѭӧc kӃt nӕi và ÿiӅu khiӇn tӯ xa bӣi ngѭӡi hӑc.
Hình 5. Giao diӋn Emona DATEx SFP [10]
Hình 7. Giao diӋn ÿiӅu khiӇn rѫ-le trong LabVIEW
Hình 6. Mҥch ÿiӅu khiӇn ma trұn rѫ-le chuyӇn mҥch

Bên cҥnh ÿó, Emona DATEx ÿѭӧc cung cҩp trình ÿiӅu
khiӇn tѭѫng thích vӟi môi trѭӡng LabVIEW, cho phép kӃt hӧp
vӟi board NI ELVIS II ÿӇ thiӃt lұp các bài thí nghiӋm viӉn Hình 8. Phҫn cӭng cӫa Tele-Lab
thông. Tҩt cҧ các nút vһn (volume) và các công-tҳc (switch)
trên board Emona DATEx có thӇ ÿѭӧc ÿiӅu chӍnh trӵc tiӃp Do hiӋn tҥi Tele-Lab chӍ cho phép 01 ngѭӡi truy cұp vào hӋ
bҵng tay hoһc ÿiӅu chӍnh gián tiӃp tӯ xa thông qua phҫn mӅm thӕng tҥi mӛi thӡi, nhóm tác giҧ ÿã xây dӵng mӝt trang web
LabVIEW và giao diӋn DATEx SFP (Soft Front Panels), ÿѭӧc phөc vө ÿăng ký thӡi gian biӇu tiӃn hành bài thí nghiӋm và hӛ
mô tҧ ӣ Hình 5. trӧ viӋc trao ÿәi giӳa giҧng viên và ngѭӡi hӑc. Cҩu trúc cӫa
Mӝt board Arduino Uno kӃt nӕi vӟi máy chӫ tҥi phòng thí website này ÿѭӧc trình bày ӣ Hình 9.
nghiӋm thông qua cәng USB ÿѭӧc sӱ dөng ÿӇ ÿiӅu khiӇn ma
III. MӜT BÀI THÍ NGHIӊM TRÊN TELE-LAB
trұn rѫ-le chuyӇn mҥch (Hình 6) cho phép thiӃt lұp các ÿѭӡng
kӃt nӕi tín hiӋu cҫn thiӃt giӳa các module trên board Emona Sinh viên tham gia lӟp hӑc phҫn cӫa phòng thí nghiӋm có
DATEx trong quá trình thӵc hiӋn mӝt bài thí nghiӋm nào ÿó. thӇ truy cұp vào máy chӫ cӫa Tele-Lab ÿӇ ÿăng ký tài khoҧn,
Ngѭӡi hӑc có thӇ thay ÿәi trҥng thái (ÿóng/ngҳt) cӫa các kӃt chӑn xem thông tin chi tiӃt vӅ lӟp thӵc hành và truy cұp vào
nӕi trong ma trұn bҵng cách sӱ dөng mӝt giao diӋn phҫn mӅm ÿѭӡng link bài thӵc hành ÿӇ thӵc hiӋn thí nghiӋm. ViӋc ÿánh
ÿiӅu khiӇn rѫ-le ÿѭӧc xây dӵng trong môi trѭӡng LabVIEW giá kӃt quҧ thӵc tұp ÿѭӧc dӵa trên bài báo cáo thí nghiӋm do
(Hình 7). Thông qua giao diӋn DATEx SFP, ngѭӡi hӑc có thӇ ngѭӡi hӑc nӝp cho giҧng viên phө trách môn hӑc sau khi hoàn
ÿiӅu chӍnh các nút vһn và công-tҳc trên board Emona DATEx tҩt bài thӵc hành. Trong bài báo này, bài thí nghiӋm ĈiӅu chӃ
bҵng mӝt chѭѫng trình ÿiӅu khiӇn trong LabVIEW. Các bӝ trҧi phә trӵc tiӃp DSSS (Direct Sequence Spread Spectrum)
phұn phҫn cӭng cӫa Tele-Lab ÿѭӧc mô tҧ trên Hình 8. ÿѭӧc chӑn trình bày nhѭ mӝt ví dө minh hӑa.
LabVIEW cung cҩp chӭc năng công cө ҧo VIs (Virtual Ĉҫu tiên, bài thí nghiӋm ÿѭӧc giҧng viên thiӃt lұp sҹn trên
Instruments) và công cө Web Publishing cho phép thiӃt lұp board Emona DATEx thông qua các kӃt nӕi tín hiӋu ÿѭӧc ÿiӅu
giao diӋn ngѭӡi sӱ dөng mӝt cách ÿѫn giҧn và nhanh chóng. khiӇn bӣi ma trұn rѫ-le nhѭ mô tҧ ӣ Hình 10. TiӃp theo, các
Các thiӃt bӏ hoһc ӭng dөng ÿѭӧc tҥo ra tӯ LabVIEW có ÿӏnh thiӃt bӏ ҧo VIs sau ÿây ÿѭӧc thiӃt lұp: matrix.vi, Scope.vi,
dҥng “.vi” và “.exe” ÿѭӧc gӑi chung là VIs. Mӝt file có ÿӏnh FGen.vi, Emona DATEx Main SFP.vi, và DSA.vi.

109
Hội+ӝL7KҧR4XӕF*LDYӅĈLӋQ7ӱ7UX\ӅQ7K{QJYj&{QJ1JKӋ7K{QJ7LQ(&,7
tích tín hiӋu (Dynamic Signal Analyzer – DSA) cӫa trình

duyӋt web trên máy tính cӫa ngѭӡi hӑc (Hình 15).
Hình 11. Giao diӋn Emona DATEx cung cҩp cho ngѭӡi hӑc
Hình 9. Sѫ ÿӗ cҩu trúc website ÿăng ký cӫa Tele-Lab
Hình 12. Giao diӋn ÿiӅu khiӇn kӃt nӕi rѫ-le cho mҥch ÿiӅu chӃ DSSS
Hình 10. KӃt nӕi mҥch bài thӵc hành phát tín hiӋu DSSS
Sau khi truy cұp vào link cӫa bài thӵc hành, ngѭӡi hӑc tiӃn
hành thí nghiӋm bҵng cách thӵc hiӋn các kӃt nӕi giӳa các
module trên board Emona DATEx theo sѫ ÿӗ kӃt nӕi mҥch
ÿiӋn ÿã ÿѭӧc thiӃt lұp trѭӟc và hiӇn thӏ trên trình duyӋt web ӣ
màn hình máy tính cӫa ngѭӡi hӑc (Hình 11). Ngѭӡi hӑc có thӇ
thӵc hiӋn viӋc ÿóng/ngҳt các kӃt nӕi thông qua giao diӋn ÿiӅu
khiӇn ma trұn rѫ-le ÿѭӧc mô tҧ ӣ Hình 12. Hình 13 trình bày
dҥng sóng cӫa tín hiӋu tin tӭc cҫn ÿiӅu chӃ và chuӛi xung giҧ
ngүu nhiên (pseudo-random noise sequence / PN sequence)
hiӇn thӏ trên thiӃt bӏ Scope khi ngѭӡi hӑc ngҳt rѫ-le 5 và ÿóng
rѫ-le 6. Dҥng sóng cӫa tín hiӋu ÿiӅu chӃ DSSS hiӇn thӏ trên
thiӃt bӏ Scope cӫa LabVIEW khi ngѭӡi hӑc ngҳt rѫ-le 6 và
ÿóng rѫ-le 5 ÿѭӧc mô tҧ ӣ Hình 14. Phә tҫn sӕ cӫa tín hiӋu
ÿiӅu chӃ DSSS có thӇ ÿѭӧc xem trên tab thiӃt bӏ ҧo VI phân Hình 13. Tín hiӋu cҫn ÿiӅu chӃ và PN sequence hiӇn thӏ trên màn
hình máy tính cӫa ngѭӡi hӑc

110
LӠI CҦM ѪN
Nghiên cӭu này ÿѭӧc thӵc hiӋn tҥi Bӝ môn ĈiӋn tӱ ViӉn
thông, Khoa Công NghӋ, trѭӡng Ĉҥi hӑc Cҫn Thѫ, trong
khuôn khә ÿӅ tài nghiên cӭu khoa hӑc cҩp cѫ sӣ năm 2015.
Tác giҧ chân thành cҧm ѫn NguyӉn Thuұn Thành, sinh viên
ngành Kӻ thuұt ĈiӋn tӱ TruyӅn thông khóa 37, ÿã hӛ trӧ quá
trình nghiên cӭu.
TÀI LIӊU THAM KHҦO

[1] Achelengwa, E., M.,” Emona-based interactive amplitude
modulation/demodulation iLab”, Master’s Thesis. URL:
http://dspace.mit.edu/handle/1721.1/66402
[2] Oluwapelumi, O. A., et al., “ Remote realistic interface experimentation
using the Emona DATEx board”, 2012 ASEE Annual Conference,
Texas, pp. 25.1117.1 - 25.1117.17, June 2012.
Hình 14. Tín hiӋu DSSS trên màn hình máy tính cӫa ngѭӡi hӑc [3] Jan, M., Zorica, N., & Özdemir, G., “Collaborative Learning in the
Remote Laboratory NetLab”, International Multi-Conference on Society,
Cybernetics and Informatics, 2007.
[4] Bragos, R. et al., “ A Remote Laboratory to Promote the Interaction
between University and Secondary Education”, 2010 IEEE EDUCON
Education Engineering 2010 – The Future of Global Learning
Engineering Education, pp. 345-350, April 2010.
[5] NI ELVIS. URL: http://www.ni.com/ni-elvis/
[6] L. V. Q. Danh, N. C. Qui, and V. D. Tin, “Implementation of a Remote
Telecommunications Laboratory Using Emona-DATEx Trainer at
Cantho University,” Second International Engineering and Technical
Education Conference (IETEC’13), Ho Chi Minh City, Vietnam, pp. 13-
22, Nov. 2013.
[7] Arduino Uno. URL: https://www.arduino.cc/en/Main/arduinoBoardUno
[8] Emona Telecoms Trainer ETT-202. URL:
http://www.tims.com.au/emona-telecoms-trainer-ett-202
[9] LogMeIn Hamachi software. URL: https://secure.logmein.com/
[10] Emona DATEx Lab manuals.
Hình 15. Phә tín hiӋu DSSS trên màn hình máy tính cӫa ngѭӡi hӑc
IV. KӂT LUҰN

Bҵng cách sӱ dөng ma trұn rѫ-le chuyӇn mҥch ÿiӅu khiӇn
bҵng vi xӱ lý, nhóm tác giҧ ÿã trình bày mӝt phѭѫng pháp khҧ
thi ÿӇ thiӃt lұp mӝt phòng thí nghiӋm viӉn thông tӯ xa Tele-
Lab vӟi chi phí thҩp dӵa trên sӵ kӃt hӧp cӫa board NI ELVIS
II, bӝ thí nghiӋm viӉn thông Emona DATEx ETT-202 và phҫn
mӅm LabVIEW. Bên cҥnh các bài thӵc hành tҥi phòng thí
nghiӋm, viӋc sӱ dөng phòng thí nghiӋm tӯ xa có thӇ là mӝt
phѭѫng thӭc hӳu hiӋu ÿӇ cӫng cӕ kiӃn thӭc và nâng cao khҧ
năng tӵ hӑc cӫa sinh viên. Ĉây có thӇ ÿѭӧc xem là mӝt giҧi
pháp góp phҫn nâng cao hiӋu suҩt sӱ dөng trang thiӃt bӏ thí
nghiӋm và mӣ ra khҧ năng hӧp tác, chia sҿ thiӃt bӏ phөc vө
ÿào tҥo giӳa các trѭӡng ÿҥi hӑc.

111
PHÁT TRIӆN LѬӦC ĈӖ CHӲ KÝ SӔ MÙ

1
NguyӉn TiӅn Giang , NguyӉn Ĉӭc Thөy2, Lê Ĉình Sѫn 3, Lѭu Hӗng DǊng3.
1
Cөc Công NghӋ Thông Tin – Bӝ QP, 2 Trѭӡng Cao ÿҷng Kinh tӃ - Kӻ thuұt TP. Hӗ Chí Minh, 3 Hӑc viӋn Kӻ thuұt Quân sӵ.
Email: ntgiang77@gmail.com, thuyphulam2013@gmail.com, ledinhson@gmail.com, luuhongdung@gmail.com
Tóm t̷t— Bài báo ÿӅ xuҩt xây dӵng 2 lѭӧc ÿӗ chӳ ký sӕ mù tӯ bҧn tin M và yêu cҫu A ký lên M (ngѭӡi yêu cҫu ký). ĈӇ che
viӋc phát triӇn lѭӧc ÿӗ chӳ ký sӕ trên cѫ sӣ bài toán logarithm dҩu danh tính cӫa B sau khi bҧn tin M ÿã ÿѭӧc ký, thӫ tөc
rӡi rҥc. Các lѭӧc ÿӗ mӟi ÿӅ xuҩt ӣ ÿây có mӭc ÿӝ an toàn cao hình thành chӳ ký (“ký mù”) ÿѭӧc thӵc hiӋn qua các bѭӟc nhѭ
hѫn vӅ khҧ năng chӕng tҩn công làm lӝ nguӗn gӕc cӫa bҧn tin sau:
ÿѭӧc ký so vӟi mӝt sӕ lѭӧc ÿӗ ÿã biӃt trѭӟc ÿó trong thӵc tӃ.
B˱ͣc 1: B làm “mù” bҧn tin M bҵng cách chӑn ngүu nhiên
Tͳ khóa- Digital Signature, Blind Signature, Digital Signature mӝt giá trӏ k thӓa mãn: 1 < k < n và k nguyên tӕ cùng nhau vӟi
Scheme, Blind Signature Scheme. n , sau ÿó B tính: m' = m × k e mod n , ӣ ÿây: m = H (M ) là giá trӏ
ÿҥi diӋn cӫa bҧn tin cҫn ký M và H(.) là hàm băm kháng va
I. ĈҺT VҨN Ĉӄ chҥm. B gӱi bҧn tin ÿã ÿѭӧc làm mù (m’) cho A.
B˱ͣc 2: A sӁ ký lên m’ bҵng thuұt toán ký cӫa lѭӧc ÿӗ
Khái niӋm chӳ ký sӕ mù ÿѭӧc ÿӅ xuҩt bӣi D. Chaum vào RSA: s' = (m' ) d mod n rӗi gӱi lҥi s’ cho B.
năm 1983 [1], ÿây là mӝt loҥi chӳ ký sӕ ÿѭӧc sӱ dөng ÿӇ xác B˱ͣc 3: B “xóa mù” s’ và nhұn ÿѭӧc chӳ ký s nhѭ sau:
thӵc tính toàn vҽn cӫa mӝt bҧn tin ÿiӋn tӱ và danh tính cӫa
s = s'×k −1 mod n .
ngѭӡi ký, nhѭng không cho phép xác thӵc nguӗn gӕc thӵc sӵ ViӋc kiӇm tra tính hӧp lӋ cӫa s và do ÿó là tính toàn vҽn
cӫa bҧn tin ÿѭӧc ký. Nói cách khác, loҥi chӳ ký này cho phép cӫa M ÿѭӧc thӵc hiӋn nhѭ ӣ lѭӧc ÿӗ RSA. Vҩn ÿӅ ӣ ÿây là,
ҭn danh ngѭӡi tҥo ra bҧn tin ÿѭӧc ký. Trong [2-4] ÿã chӍ ra mӝt ÿӕi tѭӧng bҩt kǤ có thӇ kiӇm tra tính hӧp lӋ cӫa s, tӯ ÿó
ӭng dөng cӫa loҥi chӳ ký này khi cҫn bҧo vӋ tính riêng tѭ cӫa khҷng ÿӏnh tính toàn vҽn cӫa M và danh tính ngѭӡi ký bҵng
các khách hàng trong các hӋ thӕng thanh toán ÿiӋn tӱ hay vҩn thuұt toán kiӇm tra RSA, nhѭng không thӇ xác ÿӏnh ÿѭӧc bҧn
ÿӅ ҭn danh cӫa cӱ tri trong viӋc tә chӭc bҫu cӱ trӵc tuyӃn [5]. tin M là do ai tҥo ra. Nghƭa là danh tính cӫa B ÿã ÿѭӧc giҩu
Mӝt ÿiӇm cҫn chú ý ӣ ÿây là, vӟi các loҥi chӳ ký sӕ thông kín.
thѭӡng thì ngѭӡi ký cǊng chính là ngѭӡi tҥo ra bҧn tin ÿѭӧc 2.1.2. Tҩn công làm lӝ nguӗn gӕc bҧn tin ÿѭӧc ký
ký, còn vӟi chӳ ký sӕ mù thì ngѭӡi ký và ngѭӡi tҥo ra bҧn tin Vӟi lѭӧc ÿӗ chӳ ký sӕ mù RSA nhѭ ÿã mô tҧ ӣ trên, viӋc
ÿѭӧc ký là 2 ÿӕi tѭӧng hoàn toàn khác nhau. Ĉây là tính chҩt xác ÿӏnh danh tính cӫa ngѭӡi tҥo ra bҧn tin ÿѭӧc ký M là có
ÿһc trѭng cӫa chӳ ký sӕ mù và cǊng là mӝt tiêu chí quan trӑng thӇ thӵc hiӋn ÿѭӧc. Bӣi vì tҥi thӡi ÿiӇm ký, ngѭӡi ký (A) chӍ
ÿӇ ÿánh giá mӭc ÿӝ an toàn cӫa loҥi chӳ ký sӕ này. không biӃt nӝi dung cӫa M, nhѭng danh tính cӫa B thì A hoàn
toàn biӃt rõ, ÿiӅu này là hiӇn nhiên vì A chӍ ký khi biӃt rõ B là
Trong [1-5] các tác giҧ ÿã ÿӅ xuҩt mӝt sӕ lѭӧc ÿӗ chӳ ký sӕ
ai. Giҧ sӱ danh tính cӫa B ÿѭӧc ký hiӋu là IDB, ÿӇ xác ÿӏnh
mù ӭng dөng khi cҫn bҧo vӋ tính riêng tѭ cӫa các khách hàng
danh tính cӫa ngѭӡi yêu cҫu ký tӯ bҧn tin M và chӳ ký s tѭѫng
trong các hӋ thӕng thanh toán ÿiӋn tӱ hay vҩn ÿӅ ҭn danh cӫa
ӭng sau thӡi ÿiӇm ký (khi M và s ÿã ÿѭӧc công khai), ӣ mӛi
cӱ tri trong viӋc tә chӭc bҫu cӱ trӵc tuyӃn. Tuy nhiên, ÿiӇm
lҫn ký chӍ cҫn A lѭu trӳ giá trӏ s’ và IDB trong mӝt cѫ sӣ dӳ
yӃu chung cӫa các lѭӧc ÿӗ trên là không có khҧ năng chӕng lҥi
liӋu. Tӯ ÿó, viӋc xác ÿӏnh danh tính cӫa ngѭӡi yêu cҫu ký -
kiӇu tҩn công làm lӝ nguӗn gӕc cӫa bҧn tin ÿѭӧc ký, vì thӃ khҧ IDB tӯ bҧn tin ÿѭӧc ký M và chӳ ký s là hoàn toàn có thӇ thӵc
năng ӭng dөng cӫa các lѭӧc ÿӗ này trong thӵc tӃ là rҩt hҥn chӃ. hiӋn ÿѭӧc bҵng mӝt thuұt toán nhѭ sau:
Nӝi dung bài báo tұp trung phân tích ÿiӇm yӃu có thӇ tҩn công Thuұt toán 1.1:
làm lӝ nguӗn gӕc bҧn tin ÿѭӧc ký cӫa mӝt sӕ lѭӧc ÿӗ chӳ ký sӕ Input: (M,s), {(si’, IDBi)| i=0,1,2,…N}.
mù ÿã ÿѭӧc công bӕ, tӯ ÿó ÿӅ xuҩt xây dӵng mӝt lѭӧc ÿӗ mӟi Output: IDBi.
có ÿӝ an toàn cao hѫn vӅ khҧ năng giӳ bí mұt nguӗn gӕc cӫa
[1]. m ← H (M ) , i = 0
bҧn tin ÿѭӧc ký có thӇ ÿáp ӭng các yêu cҫu mà thӵc tӃ ÿһt ra.
[2]. select: ( si ' , IDBi )
II. TҨN CÔNG LÀM LӜ NGUӖN GӔC BҦN TIN ĈӔI [3]. k ∗ ← si '×m − d mod n
VӞI MӜT SӔ LѬӦC ĈӖ CHӲ KÝ SӔ MÙ.
[4]. if gcd( k , n) ≠ 1 then
∗
2.1. Tҩn công lѭӧc ÿӗ chӳ ký sӕ mù RSA
2.1.1. Lѭӧc ÿӗ chӳ ký sӕ mù RSA [4.1]. i ← i + 1
Lѭӧc ÿӗ chӳ ký sӕ mù RSA ÿѭӧc phát triӇn tӯ lѭӧc ÿӗ chӳ [4.2]. goto [2]
ký sӕ RSA [6]. Lѭӧc ÿӗ chӳ ký sӕ mù RSA có thӇ mô tҧ nhѭ [5]. s ∗ ← si '×(k ∗ ) −1 mod n
sau: Giҧ sӱ A là ngѭӡi ký có khóa bí mұt (d), công khai (n,e) [6]. if (s ∗ ≠ s) then
ÿѭӧc hình thành theo lѭӧc ÿӗ chӳ ký RSA. B là ngѭӡi tҥo ra
ISBN: 978-604-67-0635-9 112

[6.1]. i ← i + 1 [8]. return IDBi

[6.2]. goto [2] Nh̵n xét:
[7]. return IDBi Tѭѫng tӵ nhѭ vӟi lѭӧc ÿӗ chӳ ký mù RSA, tӯ Thu̵t toán
Nh̵n xét: 1.2 cho thҩy, nӃu N không ÿӫ lӟn thì viӋc xác ÿӏnh ÿѭӧc danh
Tӯ Thu̵t toán 1.1 cho thҩy, nӃu N không ÿӫ lӟn thì viӋc tính cӫa ngѭӡi yêu cҫu ký (ngѭӡi tҥo ra bҧn tin ÿѭӧc ký) là
xác ÿӏnh ÿѭӧc danh tính cӫa ngѭӡi yêu cҫu ký (ngѭӡi tҥo ra hoàn toàn có thӇ thӵc hiӋn ÿѭӧc. Nói cách khác, lѭӧc ÿӗ chӳ
bҧn tin ÿѭӧc ký) là hoàn toàn có thӇ thӵc hiӋn ÿѭӧc. Nói cách ký sӕ mù DSA cǊng sӁ không an toàn xét theo khía cҥnh
khác, lѭӧc ÿӗ chӳ ký sӕ mù RSA là không an toàn nӃu sӕ chӕng tҩn công làm lӝ nguӗn gӕc bҧn tin nӃu sӕ lѭӧng bҧn tin
lѭӧng bҧn tin ÿѭӧc ký không ÿӫ lӟn. ÿѭӧc ký không ÿӫ lӟn.
2.2. Tҩn công lѭӧc ÿӗ chӳ ký sӕ mù DSA 2.3. Tҩn công lѭӧc ÿӗ chӳ ký sӕ mù Nyberg-Rueppel
2.2.1. Lѭӧc ÿӗ chӳ ký sӕ mù DSA 2.3.1. Lѭӧc ÿӗ chӳ ký sӕ Nyberg-Rueppel
Tӯ lѭӧc ÿӗ chӳ ký sӕ DSA [8], nhóm tác giҧ Jan L. Tham sӕ hӋ thӕng cӫa lѭӧc ÿӗ chӳ ký sӕ do K. Nyberg và
Camenisch, Jean-Marc Piveteau, Markus A. Stadler ÿӅ xuҩt R. A. Rueppel ÿӅ xuҩt [7] ÿѭӧc lӵa chӑn tѭѫng tӵ nhѭ ӣ lѭӧc
mӝt lѭӧc ÿӗ chӳ ký sӕ mù [8] vӟi thӫ tөc hình thành tham sӕ ÿӗ DSA. ĈӇ ký lên mӝt bҧn tin M có giá trӏ ÿҥi diӋn m ∈ Z p ,
hӋ thӕng bao gӗm mӝt sӕ nguyên tӕ p, mӝt sӕ nguyên tӕ q là ngѭӡi ký chӑn ngүu nhiên mӝt giá trӏ k ∈ Z q và tính:
ѭӟc cӫa (p-1) và phҫn tӱ sinh g ∈ Z *p có bұc là q. Ngѭӡi ký có
r = m × g k mod p , s = k + x.r mod q
khóa bí mұt x ∈ Z q và khóa công khai tѭѫng ӭng là
Chӳ ký lên bҧn tin M ӣ ÿây là cһp (r,s). Chӳ ký ÿѭӧc coi là
y = g x mod p . Thӫ tөc hình thành chӳ ký “mù” bao gӗm các hӧp lӋ nӃu thӓa mãn phѭѫng trình kiӇm tra:
bѭӟc nhѭ sau: m = y − s × g r × r mod p
1. a) Ngѭӡi ký (A) chӑn mӝt giá trӏ k ∈ Z q và tính Ӣ ÿây m là giá trӏ ÿҥi diӋn cӫa bҧn tin cҫn thҭm tra M:
R ' = g k mod p m = H (M ) , vӟi H(.) là hàm băm.
b) A kiӇm tra nӃu gcd( R ' , q ) ≠ 1 thì thӵc hiӋn lҥi bѭӟc 2.3.2. Lѭӧc ÿӗ chӳ ký sӕ mù Nyberg-Rueppel
a). Ngѭӧc lҥi, A gӱi R cho ngѭӡi yêu cҫu ký (B). CǊng nhóm tác giҧ Jan L. Camenisch, Jean-Marc
2. a) Ngѭӡi yêu cҫu ký B chӑn 2 giá trӏ α , β ∈ Z q và tính Piveteau, Markus A. Stadler [8] ÿã ÿӅ xuҩt mӝt lѭӧc ÿӗ chӳ ký
sӕ mù ÿѭӧc phát triӇn tӯ lѭӧc ÿӗ chӳ ký Nyberg-Rueppel vӟi
R = (R ' ) × g β mod p . thӫ tөc hình thành chӳ ký “mù” bao gӗm các bѭӟc nhѭ sau:
α
b) B kiӇm tra nӃu gcd( R' , q) = 1 thì tính tiӃp giá trӏ 1. Ngѭӡi ký (A) chӑn mӝt giá trӏ k ∈ Z q và tính
m ' = α × m × R '× R −1 mod q rӗi gӱi m’ cho A. NӃu ÿiӅu r' = g k mod p rӗi gӱi cho ngѭӡi yêu cҫu ký (B).
kiӋn chӍ ra không thӓa mãn, B thӵc hiӋn lҥi bѭӟc a). 2. a) B chӑn ngүu nhiên giá trӏ α ∈ Z q , β ∈ Z q* và tính
3. Ngѭӡi ký A tính giá trӏ s' = (k × m'+ x × R ' ) mod q rӗi
r = m × g α × (r ' ) mod p , m' = r × β −1 mod q .
β
gӱi cho B.
4. Ngѭӡi yêu cҫu ký B tính các thành phҫn (r,s) cӫa chӳ b) B kiӇm tra nӃu m' ∈ Z q* thì gӱi m’ cho ngѭӡi ký A.
ký: r = R mod q , s = ( s'× R × (R ')−1 + β × m) mod q . Ngѭӧc lҥi, B thӵc hiӋn lҥi bѭӟc a).
Thӫ tөc kiӇm tra tính hӧp lӋ cӫa chӳ ký hoàn toàn tѭѫng 3. A tính giá trӏ s' = ( k + x × m' ) mod q rӗi gӱi cho B.
tӵ nhѭ ӣ lѭӧc ÿӗ chӳ ký DSA. 4. B tính s = ( s'×β + α ) mod q và chӳ ký cӫa A lên M là
2.2.2. Tҩn công làm lӝ nguӗn gӕc bҧn tin ÿѭӧc ký cһp (r,s).
ĈӇ tҩn công làm lӝ nguӗn gӕc bҧn tin ÿѭӧc ký M, ngѭӡi Thӫ tөc kiӇm tra tính hӧp lӋ cӫa chӳ ký tѭѫng tӵ nhѭ ӣ
ký A cҫn lѭu trӳ giá trӏ các tham sӕ {R’,m’,s’} và IDB ӣ mӛi lѭӧc ÿӗ chӳ ký Nyberg-Rueppel. Nghƭa là: chӳ ký (r,s) ÿѭӧc
lҫn ký. A có thӇ xác ÿӏnh ÿѭӧc danh tính cӫa B bҵng Thu̵t coi là hӧp lӋ nӃu thӓa mãn phѭѫng trình kiӇm tra:
toán 1.2 nhѭ sau:
m = y − s × g r × r mod p
Thuұt toán 1.2:
Input: (M,r,s), {(Ri’, mi’,si’,IDBi)| i=0,1,2,…N}. Ӣ ÿây m là giá trӏ ÿҥi diӋn cӫa bҧn tin cҫn thҭm tra M.
Output: IDBi. 2.3.3. Tҩn công làm lӝ nguӗn gӕc bҧn tin ÿѭӧc ký
ĈӇ tҩn công làm lӝ nguӗn gӕc bҧn tin ÿѭӧc ký M, ngѭӡi ký
[1]. m ← H (M ) , i = 0
A cҫn lѭu trӳ giá trӏ các tham sӕ {r’,m’,s’} và IDB ӣ mӛi lҫn
[2]. select: ( Ri ' , mi ' , si ' , IDBi ) ký. Tӯ ÿó, A có thӇ xác ÿӏnh ÿѭӧc danh tính cӫa B bҵng thuұt
[3]. α ← mi '×m −1 × r × (R')−1 mod q toán nhѭ sau:
Thuұt toán 1.3:
[4]. β ← m −1 × s − si '×r × (R ')−1 mod q
( ) Input: (M,r,s), {(ri’, mi’,si’, IDBi)| i=0,1,2,…N}.
[5]. R ← (Ri ' ) × g mod p
α β
Output: IDBi.
[6]. r ∗ ← R mod q [1]. m ← H (M ) , i = 0
[7]. if (r ∗ ≠ r ) then [2]. select: (ri ' , mi ' , si ' , IDBi )
[7.1]. i ← i + 1 [3]. β ← r × (mi ' )−1 mod q
[7.2]. goto [2]
113

[4]. α ← ( s − si '×β ) mod q [5]. T ∗ = Ti × yτ × g ε mod p

[5]. r * = m × g α × (ri ' )β mod p [6]. e∗ = FH (T ∗ || M )
[6]. if ( r* ≠ r ) then [7]. if (e∗ ≠ e' ) then
[6.1]. i ← i + 1 [7.1]. i ← i + 1
[6.2]. goto [2] [7.2]. goto [2]
[7]. return IDBi [8]. return IDBi
Nh̵n xét: Nh̵n xét:
Tѭѫng tӵ nhѭ 2 thuұt toán ký mù ÿã xét ӣ trên, Thu̵t Tѭѫng tӵ nhѭ các thuұt toán ký mù ÿã xét ӣ trên, Thu̵t
toán 1.3 cho thҩy lѭӧc ÿӗ chӳ ký mù Nyberg-Rueppel là toán 1.4 cho thҩy lѭӧc ÿӗ chӳ ký mù Moldovyan là không an
không an toàn nӃu sӕ lѭӧng bҧn tin ÿѭӧc ký không ÿӫ lӟn, khi toàn nӃu sӕ lѭӧng bҧn tin ÿѭӧc ký (N) không ÿӫ lӟn, khi ÿó
ÿó viӋc xác ÿӏnh nguӗn gӕc bҧn tin là có thӇ thӵc hiӋn ÿѭӧc. viӋc xác ÿӏnh nguӗn gӕc bҧn tin là có thӇ thӵc hiӋn ÿѭӧc.
2.4. Tҩn công lѭӧc ÿӗ chӳ ký sӕ mù Moldovyan III. XÂY DӴNG LѬӦC ĈӖ CHӲ KÝ SӔ MÙ
2.4.1. Lѭӧc ÿӗ chӳ ký sӕ mù Moldovyan
Ĉây là lѭӧc ÿӗ chӳ ký sӕ mù ÿѭӧc N.A. Modovyvan [9] Qua phân tích các lѭӧc ÿӗ chӳ ký sӕ mù trên ÿây ÿã cho
ÿӅ xuҩt trên cѫ sӣ phát triӇn tӯ chuҭn chӳ ký sӕ cӫa thҩy viӋc làm “mù” bҧn tin vӟi mӝt tham sӕ bí mұt nhѭ ӣ lѭӧc
Belarusian STB 1176.2-9 [12]. Các tham sӕ hӋ thӕng bao gӗm ÿӗ chӳ ký sӕ mù RSA, hay vӟi 2 tham sӕ nhѭ ӣ các lѭӧc ÿӗ
DSA, Nyberg-Rueppal và Moldovyan thì ngѭӡi ký vүn có thӇ
2 sӕ nguyên tӕ p, q thӓa mãn: q|(p-1) và phҫn tӱ sinh g ∈ Z *p tìm ÿѭӧc nguӗn gӕc thӵc sӵ cӫa bҧn tin ÿѭӧc ký (danh tính
có bұc là q. Ngѭӡi ký có khóa bí mұt x ∈ Z q và khóa công cӫa ngѭӡi yêu cҫu ký). Mөc này ÿӅ xuҩt viӋc phát triӇn lѭӧc
ÿӗ chӳ ký sӕ mù tӯ mӝt lѭӧc ÿӗ chӳ ký cѫ sӣ ÿѭӧc cҧi tiӃn tӯ
khai tѭѫng ӭng là y = g mod p . Thӫ tөc hình thành chӳ ký
x
lѭӧc ÿӗ chӳ ký Schnorr [13] và mӝt lѭӧc ÿӗ xây dӵng trên bài
“mù” bao gӗm các bѭӟc nhѭ sau: toán logarit rӡi rҥc – DLP (Discrete Logarithm Problem) [14].
1. Ngѭӡi ký A chӑn ngүu nhiên mӝt giá trӏ k thӓa mãn: Ѭu ÿiӇm cӫa các lѭӧc ÿӗ mӟi này là cǊng chӍ sӱ dөng 2 tham
1 < k < q và tính T = g mod p rӗi gӱi T cho ngѭӡi yêu sӕ bí mұt nhѭ ӣ các lѭӧc ÿӗ mù DSA, Nyberg-Rueppal hay
k
cҫu ký B. Moldovyan,... nhѭng không cho phép ngѭӡi ký hay bҩt kǤ
2. B chӑn ngүu nhiên 2 giá trӏ Ĳ và ࣅ rӗi tính: mӝt ÿӕi tѭӧng nào khác có thӇ xác ÿӏnh ÿѭӧc nguӗn gӕc thӵc
T ' = T × yτ × g ε mod p , e' = FH (T ' || M ) và e = (e'−τ ) mod q , ӣ sӵ cӫa bҧn tin nhѭ ӣ các lѭӧc ÿӗ ÿã ÿѭӧc công bӕ trѭӟc ÿó
[1-5].
ÿây: FH(.) là hàm băm và “||” là toán tӱ nӕi 2 xâu bit .
3.1. Xây dӵng lѭӧc ÿӗ chӳ ký cѫ sӣ
Sau ÿó B gӱi e cho A.
3.1.1. Lѭӧc ÿӗ chӳ ký cѫ sӣ LD 15.01A
3. A tính giá trӏ s = ( k − x × e) mod q rӗi gӱi cho B.
Lѭӧc ÿӗ chӳ ký cѫ sӣ ӣ ÿây, ký hiӋu LD 15.01A, ÿѭӧc
4. B tính thành phҫn thӭ 2 cӫa chӳ ký: s ' = ( s + ε ) mod q và cҧi tiӃn tӯ lѭӧc ÿӗ chӳ ký do C. Schnorr ÿӅ xuҩt vào năm 1991
chӳ ký cӫa A lên M là cһp (e' , s ' ) . và ÿѭӧc sӱ dөng làm cѫ sӣ ÿӇ phát triӇn lѭӧc ÿӗ chӳ ký sӕ mù
Thӫ tөc kiӇm tra tính hӧp lӋ cӫa chӳ ký tѭѫng tӵ nhѭ ӣ ӣ phҫn tiӃp theo. Lѭӧc ÿӗ chӳ ký LD 15.01A bao gӗm các
STB 1176.2-9, nhѭ sau: thuұt toán hình thành tham sӕ và khóa, thuұt toán hình thành
1. KiӇm tra nӃu: 1 < s' < q và 0 < e' < q thì chuyӇn sang và kiӇm tra chӳ ký nhѭ sau:
a) Thu̵t toán hình thành tham s͙ và khóa
bѭӟc 2. Ngѭӧc lҥi, (e' , s ' ) sӁ bӏ tӯ chӕi vӅ tính hӧp lӋ. Thuұt toán 2.1a:
2. Tính giá trӏ: T ∗ = g s ' × y e ' mod p Input: p, q|(p-1), x – khóa bí mұt cӫa A.
3. Tính giá trӏ: e∗ = FH (T ∗ || M ) Output: g, y, H(.).
4. KiӇm tra nӃu: e∗ = e' thì (e' , s ' ) ÿѭӧc công nhұn hӧp lӋ. [1]. g ← h ( p −1) / q mod p , 1 < h < p
Ngѭӧc lҥi, (e' , s ' ) sӁ bӏ tӯ chӕi. [2]. select H : {0,1} Z t , q < t < p
∗
2.4.2. Tҩn công làm lӝ nguӗn gӕc bҧn tin ÿѭӧc ký [3]. y ← g − x mod p (2.1a)
ĈӇ tҩn công làm lӝ nguӗn gӕc bҧn tin ÿѭӧc ký M, ngѭӡi ký [4]. return {g,y,H(.)}
A cҫn lѭu trӳ giá trӏ các tham sӕ {T,e,s} và IDB ӣ mӛi lҫn ký.
b) Thu̵t toán ký
Tӯ ÿó, A có thӇ xác ÿӏnh ÿѭӧc danh tính cӫa B bҵng Thu̵t
Thuұt toán 2.2a:
toán 1.4 nhѭ sau:
Input: p, q, g, x, k, M – bҧn tin cҫn ký.
Thuұt toán 1.4:
Output: (e,s) – chӳ ký cӫa A lên M.
Input: (M,e’,s’), {(ei, si,Ti, IDBi)| i=0,1,2,…N}.
Output: IDBi. [1]. r ← g k mod p (2.2a)
[1]. m ← H (M ) , i = 0 [2]. e ← H (r || M ) mod q (2.3a)
[2]. select: (ei , si , Ti , IDBi ) [3]. s ← ( k + x × e ) mod q (2.4a)
[3]. τ ← (e'−ei ) mod q [4]. return (e,s)
Chú thích:
[4]. ε ← ( s '− si ) mod q - Toán tӱ “||” ӣ ÿây là phép nӕi 2 xâu bit.
114

c) Thu̵t toán ki͋m tra Lѭӧc ÿӗ chӳ ký cѫ sӣ ÿӅ xuҩt ӣ ÿây, ký hiӋu LD 15.01B,
Thuұt toán 2.3a: ÿѭӧc xây dӵng dӵa trên tính khó cӫa bài toán DLP và ÿѭӧc sӱ
Input: p, q, g, y, M, (e,s). dөng ÿӇ phát triӇn lѭӧc ÿӗ chӳ ký sӕ mù trong phҫn tiӃp theo.
Output: (e,s) = true / false . a) Thu̵t toán hình thành tham s͙ và khóa
[1]. u ← g s × y e mod p (2.5a) Thuұt toán 21b:
Input: p, q|(p-1), x – khóa bí mұt cӫa A.
[2]. v ← H (u || M ) mod q (2.6a)
Output: g, y, H(.).
[3]. if ( v = e ) then {return true } [1]. g ← h ( p −1) / q mod p , 1 < h < p
else {return false } [2]. select H : {0,1}∗ Z t , q < t < p
Chú thích: −1
[3]. y ← g x mod p (2.1b)
- NӃu kӃt quҧ trҧ vӅ true thì chӳ ký (e,s) hӧp lӋ, do ÿó
nguӗn gӕc và tính toàn vҽn cӫa bҧn tin cҫn thҭm tra M ÿѭӧc [4]. return {g,y,H(.)}
công nhұn. b) Thu̵t toán ký
- NӃu kӃt quҧ trҧ vӅ là false thì chӳ ký (e,s) là giҧ mҥo, hoһc Thuұt toán 2.2b:
nӝi dung bҧn tin M ÿã bӏ sӱa ÿәi. Input: p, q, g, x, k, M – bҧn tin cҫn ký.
d) Tính ÿúng ÿ̷n cͯa l˱ͫc ÿ͛ c˯ sͧ LD 15.01A Output: (e,s) – chӳ ký cӫa A lên M.
ĈiӅu cҫn chӭng minh ӣ ÿây là: cho p, q là 2 sӕ nguyên tӕ [1]. r ← g k mod p (2.2b)
thӓa mãn ÿiӅu kiӋn q | ( p − 1) , g = h ( p −1) / q mod p vӟi: [2]. e ← H (r || M ) mod q (2.3b)
1 < h < p , H : {0,1}∗ Z t vӟi: q < t < p , 1 < x, k < q , [3]. s ← x × ( k + e ) mod q (2.4b)
y = g − x mod p , r = g k mod p , e = H (r || M ) mod q , [4]. return (e,s)
s = ( k + x × e) mod q . NӃu: u = g s × y e mod p và c) Thu̵t toán ki͋m tra
v = H (u || M ) mod q thì: v = e . Thuұt toán 2.3b:
Input: p, q, g, y, M, (e,s).
Thұt vұy, tӯ (2.1a), (2.3a), (2.4a) và (2.5a) ta có:
Output: (e,s) = true / false .
u = g s × y e mod p = g k + x.e × g − x.e mod p (2.7a)
[1]. u ← g − e × y s mod p (2.5b)
= g x.e+k − x.e mod p = g k mod p
Tӯ (2.2a) và (2.7a), suy ra: u = r (2.8a) [2]. v ← H (u || M ) mod q (2.6b)
Thay (2.8a) vào (2.6a) ta ÿѭӧc: [3]. if ( v = e ) then {return true }
v = H (u || M ) mod q = H ( r || M ) mod q (2.9a) else {return false }
Tӯ (2.3a) và (2.9a), suy ra: v = e d) Tính ÿúng ÿ̷n cͯa l˱ͫc ÿ͛ c˯ sͧ LD 15.01B
Ĉây là ÿiӅu cҫn chӭng minh. ĈiӅu cҫn chӭng minh ӣ ÿây là: cho p, q là 2 sӕ nguyên tӕ
e) Mͱc ÿ͡ an toàn cͯa l˱ͫc ÿ͛ c˯ sͧ thӓa mãn ÿiӅu kiӋn q | ( p − 1) , g = h ( p −1) / q mod p vӟi:
Mӭc ÿӝ an toàn cӫa mӝt lѭӧc ÿӗ chӳ ký sӕ nói chung ÿѭӧc
ÿánh giá qua các khҧ năng: 1 < h < p , H : {0,1}∗ Z t vӟi: q < t < p , 1 < x, k < q ,
−1
- Chӕng tҩn công làm lӝ khóa mұt. y = g x mod p , r = g k mod p , e = H (r || M ) mod q ,
- Chӕng tҩn công giҧ mҥo chӳ ký. s = x × ( k + e ) mod q . NӃu: u = g − e × y s mod p và
V͉ kh̫ năng ch͙ng ṱn công làm l͡ khóa mât: Tӯ (2.1a)
cho thҩy mӭc ÿӝ an toàn xét theo khҧ năng chӕng tҩn công v = H (r || M ) mod q thì: v = e .
làm lӝ khóa mұt cӫa lѭӧc ÿӗ cѫ sӣ phө thuӝc vào mӭc ÿӝ khó Thұt vұy, tӯ (2.1b), (2.3b), (2.4b) và (2.5b) ta có:
−1
giҧi cӫa bài toán logarit rӡi rҥc, hoàn toàn tѭѫng tӵ nhѭ vӟi u = g − e × y s mod p = g − e × g x. x .( k + e )
mod p (2.7b)
các lѭӧc ÿӗ chӳ ký DSA [9] , GOST R34.10-94 [10] và =g e +k −e
mod p = g mod p
k
Schnorr [13].
Tӯ (2.2b) và (2.7b), suy ra:
V͉ kh̫ năng ch͙ng ṱn công gi̫ m̩o chͷ ký: Tӯ (2.3a),
u=r (2.8b)
(2.5a) và (2.6a) cӫa lѭӧc ÿӗ cѫ sӣ cho thҩy, mӝt cһp (e,s) bҩt
kǤ (không ÿѭӧc tҥo ra bӣi Thu̵t toán ký 2.2a cӫa lѭӧc ÿӗ và Thay (2.8b) vào (2.6b) ta ÿѭӧc:
tӯ khóa bí mұt x cӫa ngѭӡi ký) nhѭng vүn sӁ ÿѭӧc công nhұn v = H (u || M ) mod q = H (r || M ) mod q (2.9b)
là chӳ ký hӧp lӋ cӫa ÿӕi tѭӧng sӣ hӳu khóa công khai y lên Tӯ (2.3b) và (2.9b), suy ra: v = e
bҧn tin M nӃu thӓa mãn ÿiӅu kiӋn: Ĉây là ÿiӅu cҫn chӭng minh.
e = H (( g s × y e mod p) || M ) mod q (2.10a) e) Mͱc ÿ͡ an toàn cͯa l˱ͫc ÿ͛ c˯ sͧ LD 15.01B
Tѭѫng tӵ nhѭ ӣ lѭӧc ÿӗ chӳ ký Schnorr, có thӇ thҩy rҵng Tѭѫng tӵ lѭӧc ÿӗ LD 15.01A, mӭc ÿӝ an toàn xét theo
(2.10a) là mӝt dҥng bài toán khó nӃu các tham sӕ p, q và kích khҧ năng chӕng tҩn công làm lӝ khóa mұt cӫa lѭӧc ÿӗ LD-
thѭӟc cӫa dӳ liӋu ÿҫu ra hàm băm H(.) ÿѭӧc chӑn ÿӫ lӟn. 15.01B phө thuӝc vào mӭc ÿӝ khó giҧi cӫa bài toán logarit rӡi
3.1.2. Lѭӧc ÿӗ chӳ ký cѫ sӣ LD 15.01B rҥc, còn kh̫ năng ch͙ng ṱn công gi̫ m̩o chͷ ký phө thuӝc
vào ÿӝ khó cӫa viӋc giҧi (2.10b):
e = H ((g −e × y s mod p) || M ) modq (2.10b)
115

3.2. Xây dӵng lѭӧc ÿӗ chӳ ký sӕ mù u = g s × y e mod p = g (α . sa + β ) × y (α .eb + β ) mod p

3.2.1. Lѭӧc ÿӗ chӳ ký sӕ mù LD 15.02A
= g α .( k + x .eb ) + β × g − x .(α .eb + β ) mod p
Lѭӧc ÿӗ chӳ ký sӕ mù ӣ ÿây ÿѭӧc phát triӇn tӯ lѭӧc ÿӗ (3.9a)
cѫ sӣ LD 15.01A. Giҧ sӱ A là ngѭӡi ngѭӡi ký có khóa công = g k .α × g x .eb .α × g β × g − x .eb .α × g − x . β mod p
khai ÿѭӧc hình thành theo Thu̵t toán 2.1a cӫa lѭӧc ÿӗ cѫ sӣ α β
= (g k ) × (g − x ) × g β mod p
và B là ngѭӡi tҥo ra bҧn tin M ÿѭӧc ký. Khi ÿó, thuұt toán ký
= (ra ) × y β × g β mod p = (ra ) × ( y × g ) β mod p
α α
và kiӇm tra chӳ ký cӫa lѭӧc ÿӗ ÿѭӧc chӍ ra nhѭ sau:
a) Thu̵t toán ký Tӯ (2.1a), (3.1a) và (3.9a) ta có:
Thuұt toán 3.1a: u = g −β × g − x
β
( ) × (g ) −k α
mod p (3.10a)
Input: p, q, g, x, y, Į, ȕ, k , M.
× y mod p
α −β β
= (ra ) × g
Output: (e,s).
[1]. ra ← g k mod p (3.1a) Tӯ (3.2) và (3.10), suy ra: u = rb (3.11a)
[2]. rb ← (ra ) × ( y × g ) mod p
α β
(3.2a) Thay (3.11a) vào (3.8a) ta có:
v = H (u || M ) mod q = H ( rb || M ) mod q (3.12a)
[3]. e ← H (rb || M ) mod q (3.3a)
Tӯ (3.2a) và (3.12a), suy ra: v = e . Ĉây là ÿiӅu cҫn chӭng
[4]. eb ← α −1 × (e − β ) mod q (3.4a)
minh.
[5]. sa ← (k + x × eb ) mod q (3.5a) d) Mͱc ÿ͡ an toàn cͯa l˱ͫc ÿ͛ LD 15.02A
[6]. s ← (α × sa + β ) mod q (3.6a) Tѭѫng tӵ nhѭ vӟi lѭӧc ÿӗ cѫ sӣ, mӭc ÿӝ an toàn cӫa lѭӧc
[7]. return (e,s) ÿӗ chӳ ký mù mӟi ÿӅ xuҩt cǊng ÿѭӧc ÿánh giá qua các khҧ
Chú thích: năng:
- Các bѭӟc [1], [5] do ngѭӡi ký A thӵc hiӋn. - Chӕng tҩn công làm lӝ khóa mұt.
- Các bѭӟc [2], [3], [4], [6] và [7] do ngѭӡi có bҧn tin - Chӕng giҧ mҥo chӳ ký.
cҫn ký B thӵc hiӋn. Ngoài ra, vӟi mӝt lѭӧc ÿӗ chӳ ký sӕ mù, mӭc ÿӝ an toàn
- Tham sӕ k do A lӵa chӑn thӓa mãn: 1< k < q. cӫa nó còn ÿѭӧc ÿánh giá qua khҧ năng chӕng tҩn công làm lӝ
- Tham sӕ Į, ȕ do B lӵa chӑn thӓa mãn: 1 < Į, ȕ < q. nguӗn gӕc bҧn tin sau khi ÿѭӧc ký. Yêu cҫu ÿһt ra ÿӕi vӟi
- {x,y} là cһp khóa bí mұt/công khai cӫa A. lѭӧc ÿӗ mӟi ÿӅ xuҩt là bҧn tin M sau khi ÿã ÿѭӧc ký, thì ngѭӡi
b) Thu̵t toán ki͋m tra ký A hay bҩt kǤ mӝt ÿӕi tѭӧng sӱ dөng nào khác cǊng hoàn
toàn không thӇ biӃt ÿѭӧc bҧn tin M ÿѭӧc tҥo ra tӯ ÿӕi tѭӧng
Thuұt toán 3.2a:
B.
Input: p, q, g, y, M – bҧn tin cҫn thҭm tra, (e,s) – chӳ
Kh̫ năng ch͙ng ṱn công làm l͡ khóa m̵t và gi̫ m̩o chͷ
ký cӫa A.
ký
Output: (e,s) = true / false . Mӭc ÿӝ an toàn cӫa lѭӧc ÿӗ chӳ ký mù mӟi ÿӅ xuҩt ÿѭӧc
[1]. u ← g s × ye mod p (3.7a) thiӃt lұp dӵa trên mӭc ÿӝ an toàn cӫa lѭӧc ÿӗ cѫ sӣ . Vì thӃ,
[2]. v ← H (u || M ) mod q (3.8a) vӅ cѫ bҧn khҧ năng chӕng tҩn công làm lӝ khóa mұt và khҧ
[3]. if ( v = e ) then {return true } năng chӕng giҧ mҥo chӳ ký cӫa 2 lѭӧc ÿӗ này là tѭѫng ÿѭѫng
nhѭ nhau.
else {return false } Kh̫ năng ch͙ng ṱn công làm l͡ ngu͛n g͙c cͯa b̫n tin
Chú thích: ÿ˱ͫc ký
- NӃu kӃt quҧ trҧ vӅ true thì tính hӧp lӋ cӫa chӳ ký (e,s) Thuұt toán ký cӫa lѭӧc ÿӗ mӟi ÿӅ xuҩt cho thҩy, nӃu ӣ mӛi
ÿѭӧc công nhұn, do ÿó tính toàn vҽn cӫa bҧn tin cҫn thҭm tra lҫn ký bҵng viӋc lѭu trӳ các tham sӕ {sa,ra,eb,k} cùng vӟi ÿӏnh
M và danh tính cӫa ngѭӡi ký (A) ÿѭӧc khҷng ÿӏnh. danh cӫa ngѭӡi yêu cҫu ký (IDB), ngѭӡi ký A có thӇ xác ÿӏnh
- NӃu kӃt quҧ trҧ vӅ là false thì chӳ ký (e,s) là giҧ mҥo, hoһc ÿѭӧc mӕi quan hӋ giӳa {M,(e,s)} vӟi IDB, nghƭa là tӯ bҧn tin
nӝi dung bҧn tin M ÿã bӏ sӱa ÿәi. M và chӳ ký tѭѫng ӭng (e,s) có thӇ xác ÿӏnh ÿѭӧc danh tính
c) Tính ÿúng ÿ̷n cͯa l˱ͫc ÿ͛ LD 15.02A cӫa ngѭӡi yêu cҫu ký B, vӟi ÿiӅu kiӋn ngѭӡi ký A biӃt ÿѭӧc
ĈiӅu cҫn chӭng minh ӣ ÿây là: cho p, q là 2 sӕ nguyên tӕ các tham sӕ (Į,ȕ). Thұt vұy, khi biӃt (Į,ȕ) ngѭӡi ký A có thӇ
thӓa mãn ÿiӅu kiӋn q | ( p − 1) , g = h ( p −1) / q mod p vӟi: 1 < h < p , xác ÿӏnh ÿѭӧc IDB bҵng Thu̵t toán 3.3a nhѭ sau:
H : {0,1} Z q
∗
, 1 < x, k < q , 1 < α , β < q , y = g − x mod p ,
Thuұt toán 3.3a:
ra = g k mod p , rb = (ra ) × ( y × g ) mod p , e = H (rb || M ) mod q , Input: {(rai,ebi,sai,ki,IDBi)| i=0,1,2,…N}, M, (e,s), Į, ȕ.
α β
eb = α −1 × (e − β ) mod q , sa = (k + x × eb ) mod q , Output: IDBi.

. NӃu: e
u = ( g ) s × ( y ) mod p và [1]. m ← H (M ) , i = 0
s = (α × s a + β ) mod q
v = H (u || M ) mod q thì: v = e. [2]. select: (rai , ebi , sai , ki , IDBi )
Thұt vұy, tӯ (3.4a), (3.5a), (3.6a) và (3.7a) ta có: [3]. rbi * ← (rai )α × ( g × y )β mod p
[4]. e∗ ← H (rbi * || M ) mod q
116

[5]. if e∗ ≠ e then [4]. eb ← α −1 × (e + β ) mod q (3.4b)

[5.1]. i ← i + 1 ; [5]. sa ← x × (k + eb ) mod q (3.5b)
[5.2]. goto [2]; [6]. s ← α × (sa + β ) mod q (3.6b)
[6]. ebi∗ ← α −1 × (e − β ) mod q [7]. return (e,s)
[7]. if ebi∗ ≠ ebi then Chú thích:
- Các bѭӟc [1], [5] do ngѭӡi ký A thӵc hiӋn.
[7.1]. i ← i + 1 ; - Các bѭӟc [2], [3], [4], [6] và [7] do ngѭӡi có bҧn tin cҫn ký
[7.2]. goto [2]; B thӵc hiӋn.
[8]. sai∗ ← (ki + x × ebi ) mod q - Tham sӕ k do A lӵa chӑn thӓa mãn: 1< k < q.
[9]. if sai∗ ≠ sai then - Tham sӕ Į, ȕ do B lӵa chӑn thӓa mãn: 1 < Į, ȕ < q.
- {x,y} là cһp khóa bí mұt/công khai cӫa A.
[9.1]. i ← i + 1 ; b) Thu̵t toán ki͋m tra
[9.2]. goto [2]; Thuұt toán 3.2b:
[10]. s ∗ ← (α × sai + β ) mod q
Input: p, q, g, y, M – bҧn tin cҫn thҭm tra, (e,s) –
[11]. if s ∗ ≠ s then chӳ ký cӫa A.
Output: (e,s) = true / false .
[11.1]. i ← i + 1 ;
[11.2]. goto [2]; [1]. u ← g −e × y s mod p (3.7b)
[12]. return IDBi [2]. v ← H (u || M ) mod q (3.8b)
Nh̵n xét: [3]. if ( v = e ) then {return true }
Thuұt toán 3.3a có thӇ xác ÿӏnh ÿѭӧc danh tính cӫa ngѭӡi else {return false }
yêu cҫu ký B nӃu biӃt ÿѭӧc các tham sӕ bí mұt (Į,ȕ) do B tҥo c) Tính ÿúng ÿ̷n cͯa l˱ͫc ÿ͛ LD 15.02B
ra. Nói cách khác, mӭc ÿӝ an toàn cӫa lѭӧc ÿӗ mӟi ÿӅ xuҩt xét ĈiӅu cҫn chӭng minh ӣ ÿây là: cho p, q là 2 sӕ nguyên tӕ
theo khҧ năng giӳ bí mұt nguӗn gӕc cӫa bҧn tin phө thuӝc vào thӓa mãn ÿiӅu kiӋn q | ( p − 1) , g = h ( p −1) / q mod p vӟi:
mӭc ÿӝ khó cӫa viӋc tìm ÿѭӧc các tham sӕ bí mұt (Į,ȕ). Tӯ
1 < h < p , H : {0,1} Z t vӟi: q < t < p , 1 < x, k < q ,
∗
thuұt toán ký cӫa lѭӧc ÿӗ mӟi ÿӅ xuҩt cho thҩy tҥi thӡi ÿiӇm
ký A chӍ biӃt ÿѭӧc các tham sӕ ra, eb, sa. ĈiӅu ÿó có nghƭa là 1 < α, β < q , y = g x mod p
−1
, ra = g k mod p ,
ÿӇ tính ÿѭӧc (Į,ȕ), A cҫn phҧi giҧi (3.13a):
α .β
α
rb ← (ra ) × g × y β
mod p , e = H (rb || M ) mod q ,
eb = α −1 × ( H ((ra )α × (g × y ) mod p || M ) mod q − β ) mod q
β
−1
eb = α × (e + β ) mod q , sa = x × (k + eb ) mod q ,
(3.13a)
s = α × (s a + β ) mod q . NӃu: u = g × y mod p −e s
và
Tuy nhiên, tӯ các kӃt quҧ nghiên cӭu ÿã ÿѭӧc công bӕ có
thӇ thҩy rҵng (3.13a) là mӝt dҥng bài toán khó chѭa có lӡi giҧi v = H (u || M ) mod q thì: v = e .
nӃu các tham sӕ p, q ÿѭӧc chӑn ÿӫ lӟn ÿӇ phѭѫng pháp vét Thұt vұy, tӯ (3.4b), (3.5b), (3.6b) và (3.7b) ta có:
cҥn là không khҧ thi trong các ӭng dөng thӵc tӃ.
−1
u = g − e × y s mod p = g β −α .eb × g x .α .( β + sa )
mod p
Mһt khác, do mӛi bѭӟc thӵc hiӋn cӫa thuұt toán ký (Thu̵t =g β −α . eb
×g x −1 .α . ( β + x . (k + eb ))
mod p
toán 3.1a) ÿӅu sӱ dөng 2 tham sӕ bí mұt (Į,ȕ) do B tҥo ra nên − eb .α x −1 .α . β −1
các dҥng tҩn công làm lӝ nguӗn gӕc bҧn tin nhѭ các thuұt toán = g ×gβ
×g × g x .α . x .( k + eb )
mod p
ÿã chӍ ra ӣ Mөc 2 (Thu̵t toán 1.1, 1.2, 1.3 và 1.4) là không = g ×gβ − eb .α
× g x −1
( ) × (g ) α .β
k α
×g α . eb
mod p
(3.9b)
khҧ thi ÿӕi vӟi lѭӧc ÿӗ mӟi ÿӅ xuҩt. α .β
−1
3.2.2. Lѭӧc ÿӗ chӳ ký sӕ mù LD 15.02B = gβ × gx ( )
× (g k ) mod p
α
Lѭӧc ÿӗ chӳ ký sӕ mù, ký hiӋu LD-15.02B, ÿѭӧc phát Tӯ (2.1b), (3.1b) và (3.9b) ta có:
triӇn tӯ lѭӧc ÿӗ cѫ sӣ LD-15.01B. CǊng giҧ thiӃt rҵng A là −1 α .β
ngѭӡi ký có khóa công khai ÿѭӧc hình thành theo Thu̵t toán
u = gβ × gx ( ) × (g ) mod p k α
(3.10b)
α .β
2.1b cӫa lѭӧc ÿӗ cѫ sӣ LD 15.01B và B là ngѭӡi tҥo ra bҧn tin mod p
α β
= (ra ) × g × y
M ÿѭӧc ký. Khi ÿó, thuұt toán ký và kiӇm tra chӳ ký cӫa lѭӧc Tӯ (3.2) và (3.10), suy ra: u = rb (3.11b)
ÿӗ ÿѭӧc chӍ ra nhѭ sau:
Thay (3.11) vào (3.8) ta có:
a) Thu̵t toán ký
v = H (u || M ) mod q = H (rb || M ) mod q (3.12b)
Thuұt toán 3.1b:
Input: p, q, g, x, y, Į, ȕ, k , M. Tӯ (3.2b) và (3.12b), suy ra: v = e . Ĉây là ÿiӅu cҫn chӭng
Output: (e,s). minh.
[1]. ra ← g k mod p (3.1b) d) Mͱc ÿ͡ an toàn cͯa l˱ͫc ÿ͛ LD 15.02B
Mӭc ÿӝ an toàn xét vӅ khía cҥnh chӕng tҩn công làm lӝ
[2]. rb ← (ra )α × g β × y α . β mod p (3.2b)
khóa mұt và chӕng giҧ mҥo chӳ ký cӫa LD 15.02B có thӇ
[3]. e ← H (rb || M ) mod q (3.3b) phân tích tѭѫng tӵ nhѭ vӟi lѭӧc ÿӗ cѫ sӣ LD 15.01B hay nhѭ
117

vӟi các lѭӧc ÿӗ chӳ ký hӑ ElGamal nhѭ: DSA, GOST R34.10- IV. KӂT LUҰN
94, Schnorr … Tӯ viӋc phân tích ÿiӇm yӃu cӫa mӝt sӕ lѭӧc ÿӗ chӳ ký sӕ
Tѭѫng tӵ lѭӧc ÿӗ LD 15.02A, khҧ năng chӕng tҩn công mù ÿã ÿѭӧc công bӕ, bài báo ÿӅ xuҩt 2 lѭӧc ÿӗ chӳ ký sӕ mù
làm lӝ nguӗn gӕc cӫa bҧn tin sau khi ký cӫa lѭӧc ÿӗ LD- mӟi ÿѭӧc phát triӇn tӯ các lѭӧc ÿӗ chӳ ký cѫ sӣ xây dӵng dӵa
15.02B cǊng có thӇ ÿѭӧc ÿánh giá qua phân tích khҧ năng trên tính khó cӫa bài toán logarit rӡi rҥc, 2 lѭӧc ÿӗ mӟi này có
thӵc hiӋn thuұt tҩn công làm lӝ nguӗn gӕc bҧn tin ÿѭӧc ký nhѭ mӭc ÿӝ an toàn cao hѫn các lѭӧc ÿӗ ÿã biӃt vӅ khҧ năng chӕng
sau: tҩn công làm lӝ nguӗn gӕc cӫa bҧn tin ÿѭӧc ký. Ĉây là mӝt
Thuұt toán 3.3b: yӃu tӕ quan trӑng cho phép lѭӧc ÿӗ mӟi ÿӅ xuҩt có tính khҧ
Input: {(rai,ebi,sai,ki,IDBi)| i=0,1,2,…N}, M, (e,s), Į, ȕ. thi trong các ӭng dөng thӵc tӃ.
Output: IDBi.
[1]. m ← H (M ) , i = 0
[2]. select: (rai , ebi , sai , ki , IDBi )
[1] D. Chaum, Blind Signature Systems, Advances in Cryptology, Crypto’
[3]. rbi * ← (rai )α × g β × y α . β mod p 83, Plenum Press, pp. 153.
[2] D. Chaum, A. Fiat, M. Naor, “Untraceable Electronic Cash”, Advances
[4]. e ∗ ← rbi *×H (M ) mod q in Cryptology,Crypto’ 88, LNCS 403, Springer Verlag, pp. 319-327.
[3] D. Chaum, “Privacy Protected Payment”, SMART CARD 2000, Elsevier
[5]. if e∗ ≠ e then Science Publishers B.V., 1989, pp. 69-93.
[5.1]. i ← i + 1 ; [4] N. Ferguson, “Single Term Off-line Coins”, Advances in Cryptology,
Eurocrypt’93, LNCS 765, Springer Verlag, pp. 318-328.
[5.2]. goto [2];
[5] D. Chaum, B. den Boer, E. van Heyst, S. Mjolsnes, A. Steenbeek,
[6]. ebi∗ ← α −1 × (e + β ) mod q “Efficient Offline Electronic Checks”, Advances in Cryptology,
Eurocrypt’89, LNCS 434, Springer Verlag, pp. 294-301.
[7]. if ebi∗ ≠ ebi then [6] B. C. Rivest R., Shamir A., Adleman L. (1978), “A Method for
[7.1]. i ← i + 1 ; Obtaining Digital Signatures and Public Key Cryptosystems”,
Communications of the ACM, Vol. 21, No. 2, pp. 120 – 126.
[7.2]. goto [2]; [7] K. Nyberg, R. A. Rueppel, A New Signature Scheme Base on the DSA
[8]. s ai∗ ← x × (k i + ebi ) mod q Giving Message Recovery, 1st ACM conference on Computer and
Communications Security, November 3 – 5, Fairfax, Virginia.
[9]. if sai∗ ≠ sai then [8] Jan L. Camenisch, Jean-Marc Piveteau, Markus A. Stadler, Blind
[9.1]. i ← i + 1 ; Signatures Base on Discrete Logarithm Problem, Swiss KWF
Foundation, grant no. 2724.1.
[9.2]. goto [2]; [9] Nikolay A. Moldovyan, Blind Collective Signature Protocol, Computer
[10]. s ∗ ← α × (sai + β ) mod q Science Journal of Moldova, vol.19, no.1(55), 2011.
[10] National Institute of Standards and Technology, NIST FIPS PUB 186-3.
[11]. if s ∗ ≠ s then Digital Signature Standard, U.S. Department of Commerce, 1994.
[11.1]. i ← i + 1 ; [11] GOST R 34.10-94. Russian Federation Standard. Information
Technology. Cryptographic data Security. Produce and check
[11.2]. goto [2]; procedures of Electronic Digital Signature based on Asymmetric
[12]. return IDBi Cryptographic Algorithm. Government Committee of the Russia for
Standards, 1994 (in Russian).
Nh̵n xét:
[12] Kharin Yu.S., Bernik V.I., Matveev G.V., Aguievich S.V. Mathematic
Thu̵t toán 3.3b cho phép A có thӇ xác ÿӏnh ÿѭӧc danh and computer foundations of cryptology, Novoe znanie, Minsk, 2003.
tính cӫa B nӃu có thӇ tính (Į,ȕ) nhӡ giҧi (3.13b): 381 p. (in Russian).
[13] C. P. Schnorr, “Efficient signature generation by smart cards”, Journal
eb = α −1 × ( H ((( ra ) α × g β × y α . β mod p ) || M ) mod q + β ) mod q of Cryptology, vol. 4, pp. 161 – 174, 1991.
(3.13b) [14] T. ElGamal, “ A public key cryptosystem and a signature scheme based
on discrete logarithms”, IEEE Transactions on Information Theory.
Tuy nhiên, (3.13b) là mӝt dҥng bài toán khó nӃu các tham 1985, Vol. IT-31, No. 4. pp.469–472.
sӕ p, q ÿѭӧc chӑn ÿӫ lӟn. Mһt khác, các dҥng tҩn công làm lӝ
nguӗn gӕc bҧn tin nhѭ các thuұt toán ÿã chӍ ra ӣ Mөc 2 (Thu̵t
toán 1.1, 1.2, 1.3 và 1.4) là không khҧ thi ÿӕi vӟi lѭӧc ÿӗ mӟi
ÿӅ xuҩt.
118

MÔ HÌNH TRỌNG SỐ KẾT HỢP CÁC PHƯƠNG PHÁP TRÍCH

CHỌN ĐẶC TÍNH TRONG NHẬN DẠNG HÀNH ĐỘNG NGƯỜI
Nguyễn Năng Hùng Vân, Phạm Minh Tuấn, Ung Nho Dãi
Khoa Công nghệ Thông tin,
Trường Đại học Bách khoa, Đại học Đà Nẵng
Email : nguyenvan@dut.udn.vn, pmtuan@dut.udn.vn, dai.n.ung@gmail.com
Tóm tắt – Nhận dạng hành động người (tiếng Anh: Discriminant Analysis - Multi-class LDA) [5] nhằm
Human Activity Recognition - HAR) là một lĩnh vực nâng cao kết quả khi nhận dạng hành động người. Điểm
nghiên cứu quan trọng về thị giác máy tính. Khó khăn lớn chung của hai phương pháp này là làm giảm số lượng
nhất đối với hệ thống HAR là dữ liệu từ camera thông thuộc tính của dữ liệu nhận dạng trước khi xây dựng mô
dụng là chỉ quay được ở một hướng, dẫn đến sự thiếu hụt hình huấn luyện đồng thời tăng hiệu quả nhận dạng. Mỗi
dữ liệu và dẫn đến kết quả nhận dạng thấp. Bài báo này, phương pháp trích chọn đặc tính khác nhau sẽ cho một
tập trung vào nghiên cứu và xây dựng mô hình mới về kết quả nhận dạng khác nhau. Bài báo này sử dụng
nhận dạng hành động người, trong đó trọng tâm là phương pháp trọng số để kết hợp các phương pháp trích
phương pháp trích chọn đặc tính PCA, LDA nhằm giảm
chọn đặc tính nhằm nâng cao hiệu quả nhận dạng.
số chiều và độ lớn của dữ liệu, góp phần nâng cao độ chính
xác khi nhận dạng. Trước tiên, từ dữ liệu chuyển động 3D, Nội dung của bài báo trình bày các nghiên cứu liên
chúng tôi tiến hành tiền xử lý và trích chọn đặc tính của quan gồm phương pháp trích chọn đặc tính PCA, LDA
các đối tượng. Tiếp đến, xây dựng các mô hình nhận dạng và phương pháp máy vectơ hỗ trợ (Support Vector
ứng với mỗi phương pháp trích chọn đặc tính, sử dụng mô Machine – SVM). Sau đó bài báo trình bày phương pháp
hình SVM để huấn luyện. Cuối cùng, sử dụng phương đề xuất. Cuối cùng trình bày kết quả thực nghiệm và các
pháp trọng số để kết hợp kết quả của các mô hình nhận đánh giá dựa trên dữ liệu của CMU Mocap [2].
dạng và đưa ra kết quả cuối cùng. Bài báo tiến hành thực
nghiệm trên dữ liệu CMU Mocap và cho thấy tỷ lệ nhận II. NGHIÊN CỨU LIÊN QUAN
dạng của phương pháp đề xuất cao hơn so với những
phương pháp trước đây. Trong phần này, bài báo trình bày những vấn đề liên
Từ khóa - Nhận dạng hành động người; Phương pháp quan đến nghiên cứu như PCA, Multi-class LDA và
phân tích thành phần chính; Phân tích biệt thức tuyến tính; phương pháp nhận dạng sử dụng SVM.
Máy vector hỗ trợ.
A. Phương pháp phân tích thành phần chính - PCA
I. GIỚI THIỆU Phương pháp phân tích thành phần chính [4]
Từ những năm 80 của thế kỷ trước, nhận dạng hành (Principal Components Analysis - PCA) là một thuật
động người đã nhận được sự quan tâm, nghiên cứu của toán thống kê sử dụng phép biến đổi trực giao để biến
các nhà khoa học trên khắp thế giới. Các kết quả nghiên đổi một tập hợp dữ liệu từ một không gian nhiều chiều
cứu này được ứng dụng rộng rãi trong nhiều lĩnh vực sang một không gian mới ít chiều hơn. Phép biến đổi
khác nhau như hệ thống an ninh, y học, giao thông và này dựa trên việc tìm trục của không gian mới sao cho
giao tiếp giữa người và máy [1]. phương pháp dữ liệu chiếu lên trục đó là lớn nhất.
Trong những năm gần đây, những nghiên cứu trong Thay vì giữ lại các trục tọa độ của không gian cũ,
lĩnh vực nhận dạng hành động người chủ yếu tập trung PCA xây dựng một không gian mới ít chiều hơn, nhưng
vào nghiên cứu và nhận dạng từ những video được quay lại có khả năng biểu diễn dữ liệu tốt tương đương không
bởi các camera thông dụng. Khó khăn lớn nhất đối với gian cũ, mà vẫn đảm bảo phương sai của dữ liệu trên
dữ liệu từ camera thông dụng là chỉ quay được ở một mỗi chiều mới là lớn nhất. Hình 1 là một minh họa kết
hướng, dẫn đến sự thiếu hụt dữ liệu, nếu kết hợp nhiều quả của việc xây dựng không gian mới của PCA.
camera thì vẫn không đảm bảo thu được toàn bộ hoạt
động, đồng thời giảm hiệu năng của quá trình nhận dạng. y
Nhằm khắc phục những khó khăn trên, trong những
a
năm gần đây đã có một số nghiên cứu về phương pháp
thu thập dữ liệu 3D hay sử dụng các hệ thống chụp
chuyển động dựa vào “marker” như Motion Capture [2]
hoặc là sử dụng stereo camera chụp chuyển động 2D từ
x
nhiều hướng khác nhau để dựng thành mô hình 3D, gần
b
y
đây nhất là dùng các thiết bị cảm biến chiều sâu chuyên
dụng như Microsoft Kinect [3]. z
a) Không gian dữ liệu ban đầu b) Không gian dữ liệu mới
Từ dữ liệu 3D thu được, bài báo trình bày một số Hình 1. Minh họa PCA
phương pháp trích chọn đặc tính như phân tích thành
phần chính (Principal Components Analysis - PCA) [4]
và phân tích biệt thức đa lớp (Multi-class Linear
ISBN: 978-604-67-0635-9 119

119
Giải sử cho tập dữ liệu huấn luyện 𝐗𝐗 = {𝑥𝑥𝑖𝑖 |𝑥𝑥𝑖𝑖 ∈ B. Phân tích biệt thức tuyến tính đa lớp – multi-class
𝑹𝑹𝑑𝑑 }, i ∈ {1 … n}. Với 𝒙𝒙𝒊𝒊 là vectơ thuộc không gian 𝑑𝑑 LDA
chiều, 𝑛𝑛 là số lượng vectơ trong tập 𝐗𝐗. Phân tích biệt thức tuyến tính đa lớp (Multi-class
Bước 1: Tiền xử lí Linear Discriminant Analysis – multi-class LDA) là
phương pháp phân tích biệt thức tuyến tính trong bài
Có hai cách tiền xử lí thường được dùng cho PCA là toán phân loại đa lớp được xây dựng bằng việc cải tiến
Centered PCA và Normed PCA [4]. phương pháp phân tich biệt thức tuyến tính hai lớp
- Centered PCA là phương pháp mang trọng tâm của (Liner Discriminant Analysis – LDA) [5]. Multi-class
tất cả các vectơ về tọa độ gốc: LDA tìm trục vectơ 𝒖𝒖 sao cho tất cả các dữ liệu khi chiếu
trên trục 𝒖𝒖 đó có độ phân ly lớn nhất.
̂ = {𝑥𝑥̂𝑖𝑖 },
𝐗𝐗
Cho tập dữ liệu huấn luyện có gán nhãn:
𝑥𝑥̂𝑖𝑖 = 𝑥𝑥𝑖𝑖 − µ
trong đó µ là trọng tâm của tất cả các vectơ trong tập 𝐗𝐗, 𝐗𝐗 𝐗 𝐗𝐗𝐗𝐗𝑖𝑖 , 𝑦𝑦𝑖𝑖𝑖 )|𝒙𝒙𝒊𝒊 ∈ 𝑹𝑹𝑑𝑑 , y ∈ {1 … 𝑙𝑙}}; i ∈ {1 … n}
được tính bởi công thức:
Với 𝒙𝒙𝑖𝑖 là vectơ thứ 𝑖𝑖 của tập huấn luyện thuộc không
𝑛𝑛
1 gian 𝑑𝑑 chiều, 𝑦𝑦𝑖𝑖 là nhãn của 𝒙𝒙𝑖𝑖 . Khi đó, độ phân ly của
µ = ∑ 𝑥𝑥𝑗𝑗 dữ liệu huấn luyện khi chiếu trên trục vectơ 𝒖𝒖 được biểu
𝑛𝑛
𝑗𝑗𝑗𝑗 diễn như sau:
- Normed PCA là phương pháp mang trọng tâm tất
cả vectơ về tọa độ gốc, đồng thời chuẩn hóa dữ liệu về 𝒖𝒖T Sb 𝒖𝒖
độ lệch chuẩn là 1: 𝒖𝒖Sw 𝒖𝒖
trong đó, Sb là ma trận phân tán liên hợp (within class
̃ = {𝑥𝑥̃𝑖𝑖 }
𝐗𝐗 scatter matrix), được tính bởi công thức:
trong đó 𝒙𝒙̃𝒊𝒊 là vectơ n chiều (𝑥𝑥̃ 𝑖𝑖1 … , 𝑥𝑥
̃𝑖𝑖𝑖𝑖 … , 𝑥𝑥
̃𝑖𝑖𝑖𝑖 ), 𝑥𝑥
̃𝑖𝑖𝑖𝑖
𝑙𝑙
được tính bởi:
𝑥𝑥𝑖𝑖𝑖𝑖 − µ Sb = ∑ 𝑛𝑛𝑐𝑐 (𝜇𝜇𝑐𝑐 − 𝜇𝜇)(𝜇𝜇𝑐𝑐 − 𝜇𝜇)T ∈ 𝑹𝑹𝑑𝑑×𝑑𝑑
𝑥𝑥̃
𝑖𝑖𝑖𝑖 = 𝑐𝑐=1
𝜎𝜎𝑘𝑘 trong đó, 𝜇𝜇𝑐𝑐 là trọng tâm của lớp 𝑐𝑐 và 𝑛𝑛𝑐𝑐 số lượng vectơ
với có trong lớp 𝑐𝑐. 𝜇𝜇 và 𝑛𝑛 là trọng tâm và số lượng của tất
𝑛𝑛
1 cả dữ liệu có trong tập huấn luyện.
𝜇𝜇𝑘𝑘 = ∑ 𝑥𝑥𝑗𝑗𝑗𝑗
𝑛𝑛 1
𝑗𝑗𝑗𝑗
𝜇𝜇𝑐𝑐 = ∑ 𝒙𝒙𝑖𝑖
𝑛𝑛 𝑛𝑛𝑐𝑐
𝑦𝑦𝑖𝑖 =𝑐𝑐
1 𝑛𝑛
𝜎𝜎𝑘𝑘 = √ ∑(𝑥𝑥𝑗𝑗𝑗𝑗 − 𝜇𝜇𝑘𝑘 )2 1
𝑛𝑛 𝑛 𝑛 𝜇𝜇 = ∑ 𝒙𝒙𝑖𝑖
𝑗𝑗𝑗𝑗 𝑛𝑛
𝑖𝑖=1
trong đó 𝜎𝜎𝑗𝑗 là phương sai của cột thứ 𝑗𝑗 trong X. và Sb là ma trận phân tán nội lớp (within - class scatter
Trong bài báo này, phương pháp Centered PCA matrix), được tính bởi:
được sử dụng để trích chọn đặc tính trong nhận dạng. 𝑛𝑛
T
Bước 2: Xây dựng không gian mới Sb = ∑(𝒙𝒙𝑖𝑖 − 𝜇𝜇𝑦𝑦𝑖𝑖 )(𝒙𝒙𝑖𝑖 − 𝜇𝜇𝑦𝑦𝑖𝑖 ) ∈ 𝑹𝑹𝑑𝑑×𝑑𝑑
Tính ma trận hiệp phương sai (covariance) của các 𝑖𝑖=1
̂, Gọi 𝐗𝐗 ∗ = [𝑥𝑥𝑥1 … 𝑥𝑥𝑥𝑛𝑛 ] ∈ 𝑅𝑅𝑛𝑛𝑛𝑛𝑛 là ma trong đó 𝜇𝜇𝑦𝑦𝑖𝑖 là là trọng tâm của lớp có nhãn là 𝑦𝑦𝑖𝑖 .
thuộc tính trong 𝐗𝐗
trận chứa tất cả các vectơ huấn luyện. Khi đó vectơ 𝒖𝒖 được xác định bởi,
∗ ∗𝐓𝐓
𝐕𝐕 𝐕𝐕𝐕𝐕 𝐗𝐗 𝒖𝒖T Sb 𝒖𝒖
Do là tích của ma trận 𝐗𝐗 ∗ với một chuyển vị của nó ̂ = argmax
𝒖𝒖
𝒖𝒖 𝒖𝒖T Sw 𝒖𝒖
nên 𝐕𝐕 𝐕𝐕𝐕𝐕𝑑𝑑𝑑𝑑𝑑𝑑𝑑 là ma trận có kích thước 𝑑𝑑 𝑑 𝑑𝑑. Bài toán Ta có thể tìm được vectơ 𝒘𝒘 bằng cách giải bài toán
xây dựng không gian mới được thực hiện bằng cách giải tìm giá trị riêng tổng quát sau:
bài toán tìm giá trị riêng sau, với 𝒖𝒖 là các vectơ riêng
của 𝐕𝐕: Sb 𝒖𝒖 𝒖𝒖𝒖w 𝒖𝒖
Việc chuyển dữ liệu từ không gian ban đầu sang
𝐕𝐕𝐕𝐕𝐕 𝐕𝐕𝐕 không gian mới tương tự như phương pháp PCA.
Bước 3: Chuyển dữ liệu từ không gian ban đầu
sang không gian mới C. Máy Vector hỗ trợ
Thông thường không gian mới không được xây Máy vectơ hỗ trợ (Support Vector Machine – SVM)
dựng bằng tất cả các 𝑑𝑑 vectơ riêng trong 𝑅𝑅𝑑𝑑 , mà thông [6] làm một giải thuật học máy dựa trên lý thuyết học
thường chỉ sử dụng 𝑘𝑘 vectơ riêng đầu tiên. thống kê. Giả sử cho trước n điểm trong không gian 𝑑𝑑
chiều (mỗi điểm thuộc vào một lớp kí hiệu là +1 hoặc -
Gọi ma trận 𝐔𝐔𝑃𝑃𝑃𝑃𝑃𝑃 = [ 𝒖𝒖1 ,𝒖𝒖2 … 𝒖𝒖𝑘𝑘 ] ∈ 𝑹𝑹𝑑𝑑×𝑘𝑘 . Khi 1, mục đích của giải thuật SVM là tìm một siêu phẳng
đó tọa độ các điểm trong hệ tọa độ mới là: (hyperplane) phân hoạch tối ưu cho phép chia các điểm
𝐓𝐓 này thành hai phần sao cho các điểm cùng một lớp nằm
𝐅𝐅 = 𝐔𝐔𝑃𝑃𝑃𝑃𝑃𝑃 𝐗𝐗 ∗ ∈ 𝑹𝑹𝑛𝑛×𝑘𝑘 . về một phía với siêu phẳng này.
120
120
Xét tập dữ liệu mẫu có thể tách rời tuyến tính

{(𝒙𝒙1 , 𝑦𝑦1 ), (𝒙𝒙2 , 𝑦𝑦2 ), … , (𝒙𝒙𝑛𝑛 , 𝑦𝑦𝑛𝑛 )} với 𝒙𝒙𝑖𝑖 ∈ 𝑹𝑹𝑑𝑑 và 𝑦𝑦𝑖𝑖 ∈
{−1, 1}. Siêu phẳng phân tập dữ liệu này thành hai lớp
là siêu phẳng có thể tách rời dữ liệu thành hai lớp riêng
biệt với lề (margin) lớn nhất. Tức là, cần tìm siêu phẳng
phân tách dữ liệu H: 𝒘𝒘 ∙ 𝒙𝒙 + b = 0 và hai siêu phẳng H1,
H2 song song với H và có cùng khoảng cách đến H. Với
điều kiện không có phần tử nào của tập mẫu nằm giữa
H1 và H2, khi đó:
𝒘𝒘 ∙ 𝒙𝒙 + b ≥ 1 y=1
{
𝒘𝒘 ∙ 𝒙𝒙 + b ≤ 1 y = −1
Kết hợp hai điều kiện trên ta có 𝑦𝑦𝑦𝑦𝑦𝑦𝑦𝑦 𝑦 𝑦𝑦 𝑦 𝑦 𝑦𝑦. Hình 3. Mô hình đề xuất nhận dạng hành động
Khoảng cách (còn gọi là “lề”) của giữa 2 siêu phẳng A. Quá trình tiền xử lý
H1 và H2 đến H là ‖w‖. Bài toán đặt ra là tìm siêu phẳng
Mô hình bộ xương 3D của con người có một số
Hsao cho lề lớn nhất, tức là cần tìm min‖w‖ với ràng
𝑤𝑤𝑤𝑤𝑤 lượng lớn các đoạn xương, kết hợp với độ tự do của mỗi
buộc 𝑦𝑦𝑦𝑦𝑦𝑦𝑦𝑦 𝑦 𝑦𝑦 𝑦 𝑦 𝑦𝑦. Bài toán này có thể chuyển khớp sẽ làm tăng số chiều của thuộc tính. Hơn nữa, mỗi
1
sang bài toán tương đương dễ giải hơn là min ‖w‖2 hành động của người có thời gian dài ngắn khác nhau
𝑤𝑤𝑤𝑤𝑤 2 nên quá trình tiền xử lý này giải quyết hai vấn đề:
với ràng buộc 𝑦𝑦𝑦𝑦𝑦𝑦𝑦𝑦 𝑦 𝑦𝑦 𝑦 𝑦 𝑦𝑦. Lời giải cho bài toán
tối ưu này là cực tiểu hóa hàm Lagrange:  Giảm số chiều của thuộc tính bằng cách giảm số
𝑛𝑛 lượng các xương được lựa chọn trong quá trình
1 trích chọn đặc tính. Bài báo này tham khảo
L(𝒘𝒘, 𝑏𝑏, 𝛼𝛼) = ‖𝒘𝒘‖2 − ∑ 𝛼𝛼𝑖𝑖 [𝑦𝑦𝑖𝑖 (𝒘𝒘 ∙ 𝒙𝒙𝑖𝑖 + 𝑏𝑏) − 1]
2 phương pháp của K. Adistambha [7] trong việc
𝑖𝑖=1 lựa chọn một nhóm các xương có thể thay thế
Trong đó 𝛼𝛼 là các hệ số Lagrange, 𝛼𝛼 𝛼 𝛼. Sau đó cho toàn bộ xương trong quá trình nhận dạng mà
người ta chuyển thành bài toán đối ngẫu là cực đại hóa
vẫn đảm bảo độ chính xác của mô hình.
hàm W(𝛼𝛼):
 Chuẩn hóa thời gian quan trắc dữ liệu của hành
max W(𝛼𝛼) = max (minL(𝒘𝒘, 𝑏𝑏, 𝛼𝛼)) động của người. Bài báo này chọn phương pháp
𝛼𝛼 𝛼𝛼 𝒘𝒘,𝑏𝑏 đơn giản nhất là sử dụng thời gian của hành động
Giải bài toán trên ta được 𝒘𝒘𝒘𝒘𝒘 và 𝛼𝛼. Việc phân lớp ngắn nhất.
chỉ là việc kiểm tra hàm dấu sign(𝒘𝒘 𝒘𝒘𝒘 + b). Hình 2 là
một minh họa siêu phẳng với lề cực đại trong không gian B. Trích chọn đặc tính
hai chiều. Các phần tử nằm trên lề gọi là vectơ hỗ trợ. Mục đích chính là tìm vectơ biểu diễn dữ liệu với số
chiều nhỏ hơn dữ liệu ban đầu nhưng vẫn đảm bảo được
hiệu quả nhận dạng hành động người. Bài báo này sử
dụng 3 phương pháp trong quá trình trích chọn đặc tính.
 Phương pháp trích chọn đặc tính thủ công [7]
bằng cách thực hiện lựa chọn một số nhóm
xương từ tất cả các xương quan trắc được. Việc
xây dựng vectơ thuộc tính là quá trình tạo vectơ
từ các góc quay của các xương so với khớp quay
của chúng. Nếu sử dụng 11 xương, mỗi xương
đều có thể quay tự do theo 3 hướng thì số chiều
của vectơ sẽ là 11 × 3 × frame. Trong đó frame
là số số lượng quan trắc được trong một hành
động.
 Phương pháp sử dụng PCA. Sử dụng tất cả các
Hình 2. Siêu phẳng với lề cực đại trong không gian 2D
xương quan trắc được, tạo tất cả vectơ thuộc tính
cho tất cả các hành động người. Sau đó, giải bài
III. PHƯƠNG PHÁP ĐỀ XUẤT toán tìm vectơ riêng và không gian mới từ các
vectơ riêng có giá trị riêng lớn.
Bài báo này kết hợp các phương pháp trích chọn đặc
tính sử dụng phương pháp trọng số nhằm nâng cao hiệu  Phương pháp sử dụng mutli-class LDA. Tương
quả nhận dạng. Giải pháp đề xuất được tổng quát theo tự như cách sử dụng tất cả các xương đối với
Hình 3 bao gồm các khối chức năng chính: Tiền xử lý, phương pháp PCA
trích chọn đặc tính, học máy sử dụng SVM và phương
C. Phương pháp trọng số
pháp trọng số.
Mỗi phương pháp trích chọn đặc tính cho một kết
quả khác nhau và có những ưu điểm cũng như nhược
điểm khác nhau. Kết hợp các phương pháp trích chọn
này sẽ có thể khắc phục những nhược điểm của từng
121
121
phương pháp. Mỗi phương pháp trích chọn đặc tính điểm. Bài báo này, chỉ sử dụng các góc quay của
thường có tỷ lệ nhận dạng khác nhau nên bài báo này đề các xương được lưu trữ trong cấu trúc AMC.
sử dụng tỷ lệ nhận dạng trong việc xác định trọng số gán
nhãn trong phương pháp đề xuất. Cụ thể là, bài báo đề Hình 4 là một biễu diễn của cấu trúc ASF. Bài báo
xuất việc xác định trọng số và cách gán nhãn cho hành này sử dụng dữ liệu gồm 29 xương thể hiện như Hình
động cần nhận dạng như sau: 4. Hình 5 là một ví dụ về hình ảnh 3D của xương người
được dựng lại từ cấu trúc AMC.
Giả sử ta có 𝑏𝑏 phương pháp trích chọn đặc tính và 𝑐𝑐
loại hành động khác nhau (cụ thể trong bài báo này 𝑏𝑏 =
3, 𝑐𝑐 = 4). Các phương pháp được đánh số thứ tự từ 1 đến
𝑏𝑏; các loại hành động được gán nhãn từ 1 đến 𝑐𝑐. Gọi 𝑓𝑓𝑖𝑖
là nhãn của hành động nhận dạng được từ mô hình sử
dụng phương pháp trích chọn đặc tính 𝑖𝑖, 𝜔𝜔𝑖𝑖 là tỷ lệ nhận
dạng của phương pháp trích chọn đặc tính 𝑖𝑖, 𝑖𝑖 𝑖 𝑖𝑖𝑖 𝑖 𝑖𝑖𝑖,
𝑓𝑓𝑖𝑖 ∈ {1.. 𝑚𝑚𝑚.
Gọi 𝑝𝑝𝑗𝑗 là trọng số để gán nhãn 𝑗𝑗 cho hành động cần
nhận dạng, 𝑗𝑗 𝑗𝑗𝑗𝑗𝑗𝑗𝑗𝑗. Khi đó 𝑝𝑝𝑗𝑗 đươc xác định bởi
công thức sau:
𝑝𝑝𝑗𝑗 = ∑ 𝜔𝜔𝑖𝑖
𝑓𝑓𝑖𝑖 =𝑗𝑗
Nhãn 𝑓𝑓̂ cần tìm được xác định như sau:
𝑓𝑓̂ = argmax(𝑝𝑝𝑗𝑗 )
𝑗𝑗

Hình 4. Mô hình bộ xương [7]
Bài báo này sử dụng dữ liệu 3D của CMU Mocap
trong việc kiểm chứng kết quả nhận dạng. Quá trình
thực nghiệm được chia làm hai giai đoạn. Giai đoạn thứ
nhất là tiến hành xây dựng mô hình nhận dạng với dữ
liệu đầu vào ứng với các phương pháp trích chọn đặc
tính khác nhau. Giai đoạn tiếp theo sẽ kết hợp các
phương pháp trích chọn đặc tính sử dụng tỉ lệ nhận dạng
thu được ở giai đoạn thứ nhất.
A. Dữ liệu 3D của CMU Mocap
Để theo dõi chuyển động của các đối tượng, Đại học Hình 5. Xương người 3D được dựng lại từ AMC
Carnegie Mellon (CMU) [2] đã xây dựng một phòng thí
nghiệm gồm 12 camera hồng ngoại MX-40 lắp đặt xung B. Kết quả thực nghiệm
quanh một không gian hình chữ nhật có kích thước Để tiến hành thực nghiệm bài báo chọn bốn hành
3m×8m. Một người mang bộ áo liền quần có gắn các động là: chạy (run), đi (walk), nhảy (jump) và khiêu vũ
marker bên trên và di chuyển tự do trong vùng ghi hình. (dance). Dữ liệu được chia ngẫu nhiên thành ba nhóm
Các camera sẽ định vị marker bằng sóng hồng ngoại. khác nhau như Bảng 1. Dữ liệu huấn luyện gồm 165
Tín hiệu thu được từ hệ thống camera được xử lý và cho lượt hành động dùng trong việc xây dựng mô hình với
ra kết quả cuối cùng là dữ liệu dạng mô hình hóa 3D của PCA, multi-class LDA và SVM. Dữ liệu kiểm định gồm
cơ thể người. Một số cấu trúc định dạng khác nhau được 163 lượt hành động dùng trong việc tìm tỷ lệ nhận dạng
sử dụng như asf/amc, vsk/v, c3d, bvh, txt. của từ phương pháp trích chọn đặc tính và dữ liệu kiểm
Bài báo này sử dụng dữ liệu định dạng bởi cấu trúc thử gồm 163 lượt hành động dùng để thử nghiệm kết
ASF (Acclaim Skeleton File) và AMC (Acclaim Motion quả cuối cùng của phương pháp đề xuất.
Capture).
BẢNG 1. THỐNG KÊ SỐ LƯỢNG DỮ LIỆU
 ASF mô tả sự gắn kết giữa các xương trong cơ
thể và độ tự do (degrees of freedom - dof) của Hành động run walk jump dance Tổng
các khớp. ASF chính là trạng thái ban đầu của dữ Dữ liệu huấn luyện 24 75 43 23 165
liệu chuyển động và chứa các thông tin về chiều
dài, hướng, độ tự do của mỗi xương. Dữ liệu kiểm định 24 75 42 22 163
Dữ liệu kiểm thử 24 75 42 22 163
 AMC chứa các thông tin có thể thay đổi trong hệ
thống các khớp xương. Dữ liệu hành động thay Tổng 72 225 127 67 491
đổi theo thời gian nên AMC được tạo thành bởi
nhiều frame, mỗi frame thể hiện dữ liệu gồm vị 1) Kết quả nhận dạng sử dụng phương pháp thủ
trí và các góc quay của các xương cho một thời công
122
122
Bài báo sử dụng phương pháp thủ công bằng cách lựa BẢNG 4. KẾT QUẢ CHI TIẾT KHI SỬ DỤNG TẤT CẢ 29 XƯƠNG
chọn các nhóm xương tham khảo từ kết quả nghiên cứu
Hành động run walk jump dance
của K. Adistambha [7]. Việc phân chia các nhóm dựa
trên nguyên tắc nhóm sau là nhóm trước thêm vào một run 78,3% 21,7% 0,0% 0,0%
số xương khác, chi tiết ở Hình 4: walk 0,0% 98,7% 1,3% 0,0%
 Nhóm 3 xương: root, lowerback, upperback. jump 0,0% 19,0% 81,0% 0,0%
 Nhóm 4 xương = nhóm 3 + thorax. dance 0,0% 50,0% 9,0% 41,0%
 Nhóm 7 xương = nhóm 4 + lowerneck, Tuy kết quả nhận dạng trung bình của phương pháp
upperneck, head. sử dụng 11 xương khá cao nhưng đối với các loại hành
động phức tạp như “dance”, đặc tính của dữ liệu không
 Nhóm 11 xương = nhóm 7 + left and right
thể hiện rõ trong không gian hiện tại, dẫn tới tỉ lệ nhận
clavicle, left and right humerus.
dạng đúng rất thấp (36.4%). Các đặc tính của hành động
 Nhóm 13 xương = nhóm 11+ left and right phức tạp này sẽ thể hiện rõ hơn nếu áp dụng các phương
femur. pháp biến đổi để tìm ra một không gian mới, mà ở đó độ
biến thiên của dữ liệu là cao nhất.
 Nhóm 17 xương = nhóm 13 + left and right
radius, left and right tibia. 2) Kết quả nhận dạng sử dụng PCA
Đối với phương pháp PCA, thông số cần xác định là
 Nhóm 23 xương = nhóm 17 + left and right wrist,
số lượng các vectơ riêng (chính là số chiều trong không
left and right hand, left and right foot.
gian mới) để mô hình nhận dạng có độ chích xác cao
Việc thực nghiệm cũng theo thứ tự này, có nghĩa là nhất. Hình 6 biểu diễn sự biến thiên của tỉ lệ nhận dạng
bắt đầu với nhóm có ít xương nhất, sau đó thêm các khi số chiều thay đổi sử dụng PCA.
xương vào để sinh ra nhóm mới, cuối cùng tìm ra mô
100.00%
hình SVM có kết quả khả quan nhất, chi tiết tại Bảng 2.
80.00%
BẢNG 2. KẾT QUẢ THỰC NGHIỆM VỚI PHƯƠNG PHÁP THỦ CÔNG
60.00%
Số xương run walk jump dance Tỷ lệ
40.00%
3 0,0% 93,3% 14,3% 18,2% 49,4%
20.00%
4 0,0% 93,3% 14,3% 13,6% 48,8%
0.00%
7 0,0% 94,7% 30,9% 13,6% 53,7% 1 5 8 10 13 17 20 23 37 49 53 69 163
13 0,0% 96,0% 28,5% 18,2% 54,3%
Hình 6. Sự biến thiên của tỉ lệ nhận dạng PCA
23 78,3% 98,7% 81,0% 31,9% 82,1%
Với số chiều tăng dần, độ chính xác tăng theo hình
11 78,3% 98,7% 81,0% 36,4% 82,7% răng cưa đến một giá trị ngưỡng (90.1% với số chiều
Tất cả (29) 78,3% 98,7% 81,0% 41,0% 83,3% bằng 49), sau đó bắt đầu giảm và dần trở thành đường
thẳng khi số chiều lớn. Bảng 5 là kết quả nhận dạng chi
Bảng 3 và 4 là kết quả nhận dạng chi tiết khi sử dụng
tiết với số chiều bằng 49 trong PCA. Ta thấy so với
11 xương và tất cả 29 xương. Tỷ lệ thu được khi thực
phương pháp thủ công, tỷ lệ nhận dạng đúng của hành
nghiệm 11 xương trung bình là 82,7% tương đối cao và
động “dance” tăng đáng kể.
chỉ thấp hơn một ít so với việc sử dụng tất cả 29 xương
là 83.3%. Vì vậy có thể sử dụng nhóm dữ liệu gồm 11 BẢNG 5. KẾT QUẢ NHẬN DẠNG CHI TIẾT VỚI SỐ CHIỀU BẰNG 49
xương như một phương pháp lựa chọn đặc tính trong TRONG PCA
việc xây dựng phương pháp trọng số trong mô hình đề
xuất nhận dạng hành động người. Hành động run walk jump dance
run 78,3% 17,4% 4,3% 0,0%

BẢNG 3. KẾT QUẢ CHI TIẾT KHI SỬ DỤNG 11 XƯƠNG
walk 0,0% 98,7% 0,0% 1,3%
Hành động run walk jump dance jump 0,0% 14,3% 85,7% 0,0%
run 78,3% 8,7% 13,0% 0,0% dance 0,0% 9,1% 9,1% 81,8%
walk 0,0% 98,7% 1,3% 0,0% 3) Kết quả nhận dạng sử dụng multi-class LDA
jump 0,0% 19,0% 81,0% 0,0% Tương tự như PCA, phương pháp multi-class LDA
dance 4,5% 45,5% 13,6% 36,4% cũng cần xác định số chiều dữ liệu sau trích chọn để mô
hình nhận dạng xây dựng được có độ chính xác cao nhất.
Hình 7 biểu diễn sự biến thiên của tỉ lệ nhận dạng khi
số chiều thay đổi sử dụng multi-class LDA. So với PCA,
tỷ lệ nhận dạng của phương pháp multi-class LDA dễ
tăng với số chiều nhỏ và dễ học quá (over fitting) khi số
chiều được lựa chọn là lớn.
123
123
100.00% Khi kết hợp các phương pháp trích chọn đặc tính, tỉ
lệ nhận dạng có tăng lên. Tỉ lệ nhận dạng của mô hình
80.00% kết hợp là 90.7% cao hơn 0.6% so với phương pháp trích
60.00% chọn đặc tính tốt nhất (90.1%).
40.00% BẢNG 8. KẾT QUẢ NHẬN DẠNG CHI TIẾT CỦA MÔ HÌNH ĐỀ XUẤT
20.00%
0.00%
run 78,3% 17,4% 4,3% 0,0%
1 3 5 35 117 125 138 145 152 161 163
walk 0,0% 100% 0,0% 0,0%
Hình 7. Sự biến thiên của tỉ lệ nhận dạng multi-class LDA
jump 0,0% 14,3% 85,7% 0,0%
Với số chiều là 138, phương pháp multi-class LDA dance 0,0% 9,1% 9,1% 81,8%
đạt được kết quả nhận dạng cao nhất là 86%. Bảng 6 là
kết quả nhận dạng chi tiết với số chiều bằng 138 trong D. Đánh giá kết quả
multi-class LDA. Với bài toán nhận dạng hành động trong không gian
3D, với phương pháp trích chọn đặc tính thủ công có thể
BẢNG 6. KẾT QUẢ NHẬN DẠNG CHI TIẾT VỚI SỐ CHIỀU BẰNG 138
TRONG MULTI-CLASS LDA
sử dụng nhóm có 11 xương để xây dựng mô hình huấn
luyện và nhận dạng.
Từ kết quả thực nghiệm với hai phương pháp trích
run 78,3% 13,0% 4,3% 4,4% chọn đặc tính PCA, multi-class LDA, ta thấy với cùng
walk 0,0% 86,7% 10,7% 2,6% tập dữ liệu huấn luyện và kiểm định thì độ chính xác cao
nhất của PCA là 90.1%, độ chính xác cao nhất của multi-
jump 0,0% 7,1% 92,9% 0,0%
class là 86.0%. PCA cho kết quả tốt hơn multi-class
dance 9,1% 4,5% 9,1% 77,3% LDA.
C. Phương pháp trọng số Ngoài ra, nếu sử dụng phương pháp trọng số kết hợp
các phương pháp trích chọn đặc tính khác nhau thì độ
Với kết quả của giai đoạn thực nghiệm trên, bài báo chính xác của mô hình nhận dạng sẽ được cải thiện
thu được tỷ lệ nhận dạng của các phương pháp trích (90.7% so với phương pháp tốt nhất là 90.1%).
chọn đặc tính cho mô hình phương pháp trọng số biễu
diễn ở Bảng 7. V. KẾT LUẬN
BẢNG 7. TỶ LỆ NHẬN DẠNG THU ĐƯỢC
Nhận dạng hành động người được ứng dụng rộng rãi
trong nhiều lĩnh vực khác nhau của cuộc sống. Kết hợp
Phương pháp Tham số Tỷ lệ nhận dạng hai phương pháp nghiên cứu lý thuyết và thực nghiệm,
bài báo đã trình bày về nhận dạng hành động người
Lựa chọn thủ công 11 83,3% trong không gian 3D. Bài báo đã trình bày các phương
PCA 49 90,1% pháp trích chọn đặc tính PCA, multi-class LDA và
Multi-class LDA 138 86,0% phương pháp phân nhận dạng sử dụng SVM. Bên cạnh
Giai đoạn thực nghiệm tiếp theo sử dụng phương đó, bài báo đã nghiên cứu và đề xuất mô hình trọng số
pháp trọng số kết hợp các mô hình nhận dạng được xây kết hợp các phương pháp trích chọn đặc tính khác nhau
dựng từ các phương pháp trích chọn đặc tính với nhau với độ chính xác cao. Kết quả thực nghiệm cho thấy mô
trong giai đoạn thứ nhât. Cuối cùng, bài báo sử dụng dữ hình đề xuất cho kết quả nhận dạng tốt hơn so với mô
liệu kiểm thử để kiểm tra tỷ lệ nhận dạng. Hình 8 biễu hình truyền thống. Kết quả nghiên cứu có ý nghĩa khoa
diển tỷ lệ nhận dạng thành công của mô hình đề xuất học và xã hội cao, góp phần mở ra hướng nghiên cứu
(“Kết hợp”) so với các phương pháp trích chọn đặc tính mới về nhận dạng hành động con người.
độc lập. Bảng 8 là kết quả nhận dạng chi tiết của mô TÀI LIỆU THAM KHẢO
hình đề xuất.
[1] TS. Nguyễn Văn Giáp, KS. Trần Việt Hồng “Kỹ thuật nhận
dạng Tiếng nói và ứng dụng trong điều khiển” Trường Đại học
100.00% Bách Khoa TPHCM.
95.00% [2] CMU Graphics Lab Motion Capture Database. Carnegie
90.00% Mellon University, Pennsylvania, United States. Trang web:
http://mocap.cs.cmu.edu/
85.00%
[3] Trần Việt Đức – Trương Minh Hiếu “Nghiên cứu và ứng dụng
80.00% Kinect vào việc trình chiếu tài liệu” Trường Đại học Lạc Hồng.
75.00% [4] I.T. Jolliffe, “Principal Component Analysis”, 2nd Edn., New
70.00% York: Springer-Verlag 2002.
Run Walk Jump Dance Accuracy [5] Alan J.I, “Linear Discriminant Analysis”, Springer 2012.
[6] Steinwart, Ingo, Christmann, Andreas, "Support Vector
Thủ công PCA LDA Kết hợp Machines", Springer 2008.
[7] Adistambha K, Ritz C. H, Burnett I. S, “Motion Classification
Hình 8. Thống kê kết quả giữa các phương pháp Using Dynamic Time Warping”, ICPR 2008, IEEE.
124
124
HộiHội
Thảo Quốc
Thảo Gia
Quốc Gia2015
2015về
vềĐiện
Điện Tử,
Tử,Truyền
Nghệ Thông
Thông TinTin (ECIT
(ECIT 2015)
2015)
Theo vết đa đối tượng bằng giải thuật lọc hạt trên
cơ sở của chuỗi Markov Monte Carlo
Trương Công Dung Nghi∗ , Chế Viết Nhật Anh∗ , Hồ Phước Tiến† and Đỗ Hồng Tuấn∗
∗ Khoa Điện-Điện tử, Trường Đại học Bách Khoa, Đại học Quốc Gia Tp.HCM
† Khoa Điện tử Viễn thông, Trường Đại học Bách Khoa, Đại học Đà Nẵng
Tóm tắt—Chúng tôi trình bày trong bài báo này giải thuật nhiều đặc tính khác nhau [11]. Một vài hướng tiếp cận khác
theo vết nhiều đối tượng dựa trên cơ sở của lọc hạt theo chuỗi đề xuất các phép biến đổi affine trong không gian trạng thái
Markov Monte Carlo. Để tăng hiệu quả và chính xác của mô (state space model) [12], [13], [14], hoặc cải thiện bước lấy
hình quan sát, chúng tôi đề nghị kết hợp hai nguồn thông tin mẫu các hạt theo kiểu truyền thống [15], [4], [16].
dựa trên đặc trưng về màu sắc của đối tượng và ma trận tin
cậy phát hiện tiền cảnh. Giải thuật lọc hạt với ước lượng phân Trong bài báo này, chúng tôi đề xuất giải thuật theo vết
bố theo chuỗi Markov Monte Carlo được áp dụng để giải quyết nhiều đối tượng với những tình huống thực tế phức tạp (các
bài toán theo vết nhiều đối tượng. Toàn bộ hệ thống được kiểm đối tượng có tương tác và bị che lấp một phần). Giải thuật đề
nghiệm trên hai bộ cơ sở dữ liệu thông dụng với các tình huống xuất dựa trên ý tưởng xây dựng tập hợp các hạt theo mô hình
thực tế phức tạp. Kết quả thực nghiệm cho thấy được hiệu quả chuỗi Markov Monte Carlo. Để tăng độ chính xác của quá
của giải thuật đề xuất. trình ước lượng, chúng tôi đề xuất kết hợp mô hình đặc trưng
Từ khóa—Theo vết đa đối tượng, lọc hạt (particle filtering), dựa trên đặc điểm màu sắc của đối tượng với ma trận xác
chuỗi Markov Monte Carlo (Markov Chain Monte Carlo), phát suất thu được từ giải thuật phát hiện đối tượng tiền cảnh [17].
hiện tiền cảnh. Giải thuật lọc hạt theo mô hình chuỗi Markov Monte Carlo
được áp dụng để ước lượng phân bố tiên quyết (posterior) các
biến trạng thái của đối tượng, từ đó giải quyết bài toán theo
I. GIỚI THIỆU
vết các đối tượng trong khung ảnh. Giải thuật đề xuất được
Theo vết đối tượng trong video là một trong những vấn đề kiểm nghiệm trên hai bộ cơ sở thông dụng là PETS’06 [18]
cơ bản và quan trọng trong các ứng dụng của ngành thị giác CAVIAR [19]. Kết quả thực nghiệm cho thấy tính hiệu quả và
máy tính. Vấn đề này có thể được xem là bước xử lý tiên khởi chính xác của giải thuật đề xuất trong các tình hướng thực tế
trong nhiều ứng dụng quan trọng như hệ thống giám sát thông phức tạp.
minh, ứng dụng tương tác giữa người và máy, hay hệ thống Bài báo được trình bày với các mục chính như sau: trong
giám sát giao thông,. . . Cho tới thời điểm này, đã và đang có mục II, chúng tôi trình bày cơ sở lý thuyết cũng như giải thuật
rất nhiều nghiên cứu cho vấn đề này [1], tuy nhiên việc xây đề xuất cho việc theo vết nhiều đối tượng. Mục III trình bày
dựng một hệ thống hoàn toàn tự động theo vết nhiều đối tượng kết quả thực nghiệm thu được trên hai bộ cơ sở với các tình
với độ chính xác cao vẫn luôn là một thách thức lớn và đòi huống thực tế phức tạp. Phần kết luận và hướng phát triển
hỏi những nghiên cứu cải tiến không ngừng. được trình bày trong mục IV.
Các giải thuật theo vết nhiều đối tượng (Multiple Object
Tracking - MOT) thường được phân loại thành hai nhóm chính: II. CƠ SỞ LÝ THUYẾT
nhóm giải thuật xác định (deterministic methods) [2], [3] và
nhóm giải thuật dựa trên ước lượng xác suất (probabilistic Trong bài báo này, chúng tôi tập trung giải quyết bài toán
methods) [4], [5]. Trong nhóm giải thuật ước lượng dựa trên theo vết nhiều đối tượng trong video, với các tình huống phức
xác suất thì các phương pháp dựa trên cơ sở của việc lọc tạp trong thực tế bao gồm số lượng đối tượng thay đổi do di
hạt (particle filtering), được đề xuất lần đầu tiên bởi Isard và chuyển ra hoặc vào khung ảnh, các đối tượng có tương tác
Blake [6], cho được những kết quả khá khả quan. và có thể bị che lấp một phần. Đối với tình huống số lượng
đối tượng thay đổi, chúng tôi sử dụng một tập hợp các biến
Đa số các giải thuật theo vết dựa trên cơ sở của lọc hạt ek = [ek,1 · · · ek,Nmax ] tượng trưng cho tình trạng hiện diện
đều cố gắng cải thiện mô hình quan sát (observation models) của các đối tượng trong khung ảnh, với k tương ứng với thời
sao cho mô hình sử dụng hoạt động tốt trong điều kiện hình điểm tk , và Nmax là số đối tượng tối đa có thể theo vết trong
dáng đối tượng thay đổi do di chuyển hay do thay đổi môi khung ảnh. Giá trị của ek,n (n = 1 . . . Nmax ) được định nghĩa
trường, có sự che lấp và tương tác giữa các đối tượng. Hướng như sau:
tiếp cận thông dụng nhất là xây dựng các mô hình đặc tả hình
dáng bên ngoài với khả năng thích nghi cao, như là sử dụng 1 đối tượng n có trong khung ảnh
ek,n = (1)
histogram màu [7], [8], bộ trộn Gauss [9], [10], hay phối hợp 0 đối tượng n không có trong khung ảnh
ISBN: 978-604-67-0635-9 125
125
Hội
Hội Thảo
Thảo Quốc Gia2015
Quốc Gia 2015vềvềĐiện
Điện Tử,Truyền
Tử, Truyền Thông
Thông và và Công
Công Nghệ
Nghệ Thông
Thông Tin (ECIT
Tin (ECIT 2015)2015)
Các đối tượng cần theo vết được đánh dấu bởi một khung B. Mô hình biến đổi vị trí - kích thước của các đối tượng
hình chữ nhật và được đặc trưng bởi biến vị trí - kích thước
Xk được định nghĩa như sau: Xác suất biến đổi biến Xk,n của đối tượng thứ n có thể
  được chia thành ba trường hợp tương ứng với cặp giá trị của
xk,1 ··· xk,Nmax ek,n và ek−1,n như sau:
 yk,1 ··· yk,Nmax 
 
Xk =   (2) • Xuất hiện đối tượng mới: {ek,n , ek−1,n } = {1, 0}
 rxk,1 ··· rxk,Nmax  Đối tượng mới có thể xuất hiện ở bất cứ vị trí nào trong
ryk,1 ··· ryk,Nmax khung ảnh. Vì vậy xác suất biến đổi của biến Xk,n trong
trường hợp này được định nghĩa như sau:
với (xk,n , yk,n ) là trọng tâm của hình chữ nhật tương ứng với
đối tượng cần theo vết, và (rxk,n , ryk,n ) là độ lớn của hai p (Xk,n |Xk−1,n , ek,n , ek−1,n ) = pb (Xk,n )
cạnh hình chữ nhật. T
∼ [U (1, Nx ), U (1, Ny ), N (rmx , σx ), N (rmy , σy )]
Gọi Z0:k là chuỗi các quan sát từ thời điểm t0 đến tk , (6)
Sk = {Xk , ek } là tập hợp biến trạng thái của các đối tượng với (Nx , Ny ) là kích thước của khung ảnh,
cần theo vết. Bài toán theo vết nhiều đối tượng trong trường (rmx , rmy , σx , σy ) là các tham số cho trước ứng
hợp này tương ứng với việc ước lượng phân bố p(Sk |Z0:k ) với giá trị trung bình và phương sai của kích thước
của biến trạng thái Sk tại thời điểm tk khi có được chuỗi các khung hình chữ nhật đặc trưng cho đối tượng.
quan sát Z0:k . Đại lượng này có thể được biểu diễn một cách • Cập nhật đối tượng: {ek,n , ek−1,n } = {1, 1}
đệ quy theo phương trình lọc Bayes: Trường hợp này tương ứng với việc cập nhật trạng thái
của một đối tượng đang tồn tại và được theo vết tại thời
p (Sk |Z0:k ) ∝ p (Zk |Sk ) p (Sk |Sk−1 ) điểm tn−1 . Ở đây chúng tôi sử dụng phân bố Gauss cho
việc cập nhật biến vị trí - kích thước:
p (Sk−1 |Z0:k−1 ) dSk−1 (3)
p (Xk,n |Xk−1,n , ek,n , ek−1,n )
Với giả thiết các đối tượng cần theo vết di chuyển hoàn toàn = pu (Xk,n |Xk−1,n ) = N (Xk,n |Xk−1,n , ΣX ) (7)
độc lập với nhau, đồng thời biến vị trí - kích thước Xk và với ΣX là ma trận hiệp phương sai quy định vùng thay
tình trạng hiện diện ek là hai biến độc lập, phân bố xác suất đổi xung quanh vị trí hiện tại.
biến đổi (transition probability distribution) p (Sk |Sk−1 ) = • Đối tượng biến mất: {ek,n , ek−1,n } = {0, 1}
p (Xk , ek |Xk−1 , ek−1 ) có thể được khai triển như sau: Đối với trường hợp đối tượng ra khỏi khung ảnh, chúng
tôi sẽ giữ biến trạng thái của đối tượng tại biến lưu trữ
p (Xk , ek |Xk−1 , ek−1 ) = p (Xk |Xk−1 , ek , ek−1 ) p (ek |ek−1 ) Xd .
N
max
= p (Xk,n |Xk−1,n , ek,n , ek−1,n ) p (ek,n |ek−1,n ) (4)

n=1
C. Mô hình quan sát
với Xk,n = [xk,n , yk,n , rxk,n , ryk,n ] .

T Để đánh giá độ chính xác/tương thích của vùng ứng cử với
các đối tượng đang theo vết, chúng tôi xây dựng mô hình
Trong các mục tiếp theo, chúng tôi sẽ lần lượt định nghĩa các likelihood bằng cách kết hợp hai nguồn thông tin: độ tương tự
đại lượng xác suất cần thiết để ước lượng phân bố p(Sk |Z0:k ) dựa trên đặc trưng về màu sắc của các đối tượng theo vết và
theo như phương trình (3). ma trận likelihood thu được từ giải thuật phát hiện tiền cảnh.
Mô hình đặc trưng dựa trên màu sắc: Chúng tôi sử

A. Phân bố tiên quyết của biến hiện diện ek dụng mô hình đặc trưng được đề xuất trong [20] để đặc
tả vùng đối tượng theo vết. Mỗi điểm ảnh được biểu diễn
Trong giải thuật đề xuất, biến hiện diện ek được mô hình bởi một vector đặc trưng s = [c, x, y], với c là vecor
theo chuỗi Markov rời rạc. Hai trạng thái “xuất hiện” và “biến các thành phần màu đã được chuẩn hoá {R∗ , G∗ , B ∗ } =
mất” của đối tượng lần lượt được đặc trưng bởi các giá trị xác {R, G, B} − mean({R, G, B})
, và [x, y] là toạ độ của pixel
suất PB và PD . Xác suất thay đổi tình trạng hiện diện được std ({R, G, B})
định nghĩa như sau: đang xét với điểm toạ độ gốc là điểm trên cùng bên trái hình
chữ nhật. Mật độ xác suất của vector đặc trưng s được ước
lượng bởi bộ trộn thích nghi gồm Ns Gaussians:
p(ek,n |ek−1,n ) = δ(ek,n − 1)[(1 − PD )δ(ek−1,n − 1)
Ns

+ PB δ(ek−1,n )] + δ(ek,n )[(1 − PB )δ(ek−1,n )
f (s) = αi η (s|µi , Σi ) (8)
+ PD δ(ek−1,n − 1)] (5) i=1
126
126
HộiHội
Thảo Quốc
Thảo Gia
Quốc Gia2015
2015về
vềĐiện
Điện Tử,
Tử,Truyền
Nghệ Thông
Thông TinTin (ECIT
(ECIT 2015)
2015)
với αi là trọng số của thành phần thứ i, η (s|µi , Σi ) là hàm D. Giải thuật theo vết bằng bộ lọc hạt dựa trên chuỗi Markov
mật độ xác suất của phân bố chuẩn với vector trung bình µi Monte Carlo
và ma trận hiệp phương sai Σi .
Như đã trình bày ở phần trên, giải thuật theo vết nhiều đối
Các thành phần Gaussians trong mô hình đặc trưng được ước
tượng có thể được xem tương ứng với việc ước lượng phân bố
lượng bằng cách sử dụng giải thuật tách/nhập mô tả trong [20].
p (Sk |Z0:k ) với:
Sự tương tự giữa một vùng ước lượng re và mô hình tham
chiếu ro được định nghĩa như sau: p (Sk |Z0:k ) ∝ p (Zk |Sk ) p (Sk |Sk−1 ) p (Sk−1 |Z0:k−1 )
(12)
d (re , ro )
LC = exp − (9)
σ2 Phân bố hậu nghiệm p (Sk−1 |Z0:k−1 ) tại thời điểm k − 1
với d (re , ro ) là khoảng cách giữa hai hàm mật độ xác suất: được ước lượng dựa trên tập hợp các hạt (particle set)
(
{Sk−1 j)}:

2
d (re , ro ) = fe (s) − fo (s) (10) Np
s 1 (j)

p (Sk−1 |Z0:k−1 ) ≈ δ Sk−1 − Sk−1 (13)
Np j=1

2
với f (s) = f (s) f (s) .
s với Np là tổng số hạt sử dụng trong giải thuật và (j) là chỉ
số của hạt.
Ma trận likelihood từ giải thuật phát hiện tiền cảnh: Giải thuật theo vết sử dụng lọc hạt dựa trên chuỗi Markov
Thành phần thứ hai trong mô hình likelihood được dựa trên Monte Carlo bao gồm 2 bước chính: bước ước lượng kết hợp
ma trận likelihood thu được từ giải thuật phát hiện tiền cảnh thực hiện việc cập nhật đồng thời biến trạng thái của các đối
đề xuất trong [17]. Giải thuật này mô hình hoá nền và tiền tượng, và bước tinh chỉnh thực hiện việc cập nhật độc lập
cảnh thông qua bộ trộn Gauss với vector đặc trưng kết hợp cả biến trạng thái của từng đối tượng. Hai bước này được lặp lại
hai thành phần: màu sắc và không gian. Ma trận likelihood (Nb + Np ) lần, với Nb là độ dài khởi động và Np là số hạt
ước lượng từ hiệu log của hai hàm mật độ xác suất tương ứng dùng trong giải thuật. Chi tiết của giải thuật tại ở lần lặp thứ
với nền và tiền cảnh được sử dụng trong phần này như một i tại thời điểm tk được mô tả như sau:
ma trận đánh giá độ tin cậy của các vùng trong khung ảnh có
hiện diện đối tượng cần theo vết. Hình 1 biểu diễn một trường (i) Bước ước lượng kết hợp. Trong bước ước lượng này, chúng
hợp của ma trận likelihood ứng với một khung ảnh tách từ tôi thực hiện việc ước lượng mẫu X∗k , X∗k−1 , e∗k , e∗k−1 thông
video cần thực hiện giải thuật theo vết. qua hàm q1 ( Xk , Xk−1 , ek , ek−1 | Z0:k ) given by:
q1 ( Xk , Xk−1 , ek , ek−1 | Z0:k ) = q11 (Xk |Xk−1 , ek , ek−1 )

60
50
q12 (ek |ek−1 ) q13 (Xk−1 , ek−1 |Z0:k−1 ) (14)
40
với q11 (Xk |Xk−1 , ek , ek−1 ) and q12 (ek |ek−1 ) là các hàm
30
20
biến đổi trạng thái đã định nghĩa trong mục II-A và II-B,
10
q13 (Xk−1 , ek−1 |Z0:k−1 ) là ước lượng của phân bố hậu
0
nghiệm p (Xk−1 , ek−1 |Z0:k−1 ) ở thời điểm tk−1 .
−10
Như vậy, giả sử tại thời điểm tk−1 , ta có Np mẫu
Np
Hình 1. Ma trận likelihood từ giải thuật phát hiện tiền cảnh (từ trái sang Xjk−1 , ejk−1 . Với Np mẫu này, ta chọn ngẫu nhiên một
phải: ảnh gốc, ma trận likelihood). ∗ j=1
mẫu Xk−1 , ek−1 , sau đó dựa trên các hàm biến đổi trạng
∗
thái đã định nghĩa trong mục II-A và II-B để có được mẫu

Với ma trận thu được từ giải thuật phát hiện tiền cảnh, mỗi ước lượng mới {X∗k , e∗k }. Mẫuước lượng mới này có xác suất
pixel khi này được đặc trưng bởi một giá trị, tạm gọi là điểm ∗
p (Zk |Sk )
tin cậy, đánh giá độ tin cậy pixel đang xét thuộc về miền tiền được chấp nhận là ρ1 = min 1, m−1 .
p Zk Sk
cảnh hay không. Cho trước vector ước lượng Xik,n của đối
tượng n, giá trị likelihood dựa trên ma trận phát hiện tiền (ii) Bước tinh chỉnh. Ở bước này, chúng tôi đề xuất ước lượng
cảnh LD được định nghĩa là tổng điểm tin cậy của các pixel lần lượt các biến ek,n và Xk,n của
từng đối tượng.
Biến ek,n
trong vùng chữ nhật tương ứng. m
được ước lượng dựa trên hàm q2 ek,n ek−1,n cho bởi công
Như vậy, khi kết hợp cả hai nguồn thông tin vừa trình bày, thức (5). Xác suất chấp nhận trong trường hợp này là:
ta định nghĩa được giá trị likelihood của một vector ước lượng  

Xik,n như sau: p Zk,n e∗k,n , X∗k,n
ρ2,n = min 1,

 (15)
p Zk Xik ∝ LC × LH (11) p Zk,n emk,n , X m
k,n
127
127
Biến Xk,n được tách thành 2 thành phần là trọng tâm

T T
ck,n = [xk,n , yk,n ] và kích thước rk,n = [rxk,n , ryk,n ] .
Thành phần trọng tâm ck,n được ước lượng bằng hàm sau:

m
q3 ck,n cm , r m
,
k−1,n k,n k−1,nr m
= N ck,n µ̃k,n , Σ̃ (16)
với vector trung bình µ̃m = cm +

−1 m
k,n k−1,n
ΣX(12) ΣX(22) rk,n − rm
k−1,n và ma trận hiệp
−1
phương sai Σ̃ = ΣX(11) − ΣX(12) ΣX(22) ΣX(21)
ΣX(11) ΣX(12)
với ΣX = .
ΣX(21) ΣX(22)
Xác suất chấp nhận cho giá trị ước lượng trọng tâm là:
 

p Zk,n c∗k,n , rm
k,n
ρ3,n = min 1,
m
 (17)
p Zk,n Xk,n
Quá trình ước lượng cho các giá trị kích thước hình chữ
nhật rk,n cũng được thực hiện tương tự với hàm ước lượng:

m
q4 rk,n rm , c m
, c
k−1,n k,n k−1,n
m
= N r k,n µ̂k,n , Σ̂ (18)
−1 m
với µ̂m m
k,n = rk−1,n + ΣX(21) ΣX(11) ck,n − cm k−1,n and
−1
Σ̂ = ΣX(22) − ΣX(21) ΣX(11) ΣX(12) .
Xác suất chấp nhận cho thành phần này là:
 
∗
p Zk,n cmk,n , rk,n
ρ4 = min 1,

 (19)
p Zk,n Xm k,n
III. KẾT QUẢ THỰC NGHIỆM

Hình 2. Kết quả theo vết thu được bởi giải thuật đề xuất với đoạn video trích
Trong mục này, chúng tôi trình bày kết quả thu được của từ bộ cơ sở dữ liệu CAVIAR.
giải thuật đề xuất khi kiểm nghiệm với các đoạn video trích ra
từ hai bộ cơ sở dữ liệu thông dụng: bộ dữ liệu PETS’06 [18]
và bộ dữ liệu CAVIAR [19]. Giải thuật thực hiện với tổng số IV. KẾT LUẬN
lượng hạt Np = 1500, độ dài khởi động Nb = 500 và số đối
tượng theo vết tối đa Nmax = 6. Trong bài báo này, chúng tôi trình bày giải thuật theo vết
nhiều đối tượng dựa trên cơ sở của lọc hạt theo mô hình chuỗi
Hình 2 trình bày kết quả thu được với đoạn video trích từ Markov Monte Carlo. Chúng tôi đề xuất kết hợp hai nguồn
bộ cơ sở dữ liệu CAVIAR. Kết quả cho thấy giải thuật xử lý thông tin về đặc điểm màu sắc của đối tượng theo vết và ma
tốt tình huống xuất hiện và biến mất của các đối tượng. Ngoài trận độ tin cậy phát hiện tiền cảnh nhằm tăng hiệu quả của mô
ra, với trường hợp các đối tượng có tương tác và bị che lấp hình quan sát. Giải thuật theo vết được xây dựng trên nguyên
một phần như trong trường hợp này, kết quả thu được là rất lý của lọc hạt với việc ước lượng theo chuỗi Markov Monte
khả quan. Carlo. Giải thuật đề xuất được kiểm nghiệm trên hai cơ sở dữ
Đối với đoạn video trích từ bộ dữ liệu PETS’06, trường liệu thông dụng với các tình huống phức tạp. Kết quả thực
hợp này tương đối phức tạp hơn trường hợp trên: số lượng đối nghiệm cho thấy hiệu quả và độ chính xác của giải thuật theo
tượng cần theo vết nhiều hơn, các đối tượng có hình dáng bên vết nhiều đối tượng đã đề xuất.
ngoài giống nhau, tình huống tương tác giữa các đối tượng
cũng phức tạp hơn. Kết quả thu được từ giải thuật cho thấy LỜI CẢM ƠN
giải thuật xử lý tốt tình huống xuất hiện của đối tượng mới.
Tuy nhiên, kết quả vẫn có lỗi trong trường hợp các đối tượng Nghiên cứu này được tài trợ bởi Quỹ phát triển khoa học và
tương tác nhau, nhất là trong trường hợp này đặc điểm nhận công nghệ quốc gia (NAFOSTED) trong đề tài mã số 102.99-
diện bề ngoài của các đối tượng là rất giống nhau (hình 3). 2013.36.
128
128
[5] D.-N. Truong Cong, F. Septier, C. Garnier, L. Khoudour, and

Y. Delignon, “Robust visual tracking via mcmc-based particle filtering,”
in IEEE International Conference on Acoustics, Speech and Signal
Processing, 2012.
[6] M. Isard and A. Blake, “Condensation-conditional density propagation
for visual tracking,” International Journal of Computer Vision, vol. 29,
no. 1, pp. 5–28, 1998.
[7] P. Pérez, C. Hue, J. Vermaak, and M. Gangnet, “Color-based probabilis-
tic tracking,” in European Conference on Computer Vision. Springer,
2002, pp. 661–675.
[8] K. Nummiaro, E. Koller-Meier, and L. Van Gool, “An adaptive color-
based particle filter,” Image and Vision Computing, vol. 21, no. 1, pp.
99–110, 2003.
[9] S. Zhou, R. Chellappa, and B. Moghaddam, “Visual tracking and
recognition using appearance-adaptive models in particle filters,” IEEE
Transactions on Image Processing, vol. 13, no. 11, pp. 1491–1506, 2004.
[10] H. Wang, D. Suter, K. Schindler, and C. Shen, “Adaptive object tracking
based on an effective appearance filter,” IEEE Transactions on Pattern
Analysis and Machine Intelligence, vol. 29, no. 9, pp. 1661–1667, 2007.
[11] L. Jin, J. Cheng, and H. Huang, “Human tracking in the complicated
background by particle filter using color-histogram and hog,” in Interna-
tional Symposium on Intelligent Signal Processing and Communication
Systems (ISPACS), 2010, pp. 1–4.
[12] X. Li, W. Hu, Z. Zhang, X. Zhang, and G. Luo, “Robust visual tracking
based on incremental tensor subspace learning,” in IEEE International
Conference on Computer Vision, 2007.
[13] D. Ross, J. Lim, R. Lin, and M. Yang, “Incremental learning for robust
visual tracking,” International Journal of Computer Vision, vol. 77,
no. 1, pp. 125–141, 2008.
[14] J. Kwon, K. Lee, and F. Park, “Visual tracking via geometric particle
filtering on the affine group with optimal importance functions,” in IEEE
Conference on Computer Vision and Pattern Recognition. IEEE, 2009,
Hình 3. Kết quả theo vết thu được bởi giải thuật đề xuất với đoạn video trích pp. 991–998.
từ bộ cơ sở dữ liệu PETS’06. [15] W. Gilks and C. Berzuini, “Following a moving target–monte carlo
inference for dynamic bayesian models,” Journal of the Royal Statistical
Society: Series B (Statistical Methodology), vol. 63, no. 1, pp. 127–146,
TÀI LIỆU THAM KHẢO 2001.
[16] S. Pang, J. Li, and S. Godsill, “Models and algorithms for detection and
[1] A. Yilmaz, O. Javed, and M. Shah, “Object tracking: A survey,” ACM tracking of coordinated groups,” in IEEE Aerospace Conference. IEEE,
Computing Surveys, vol. 38, no. 4, pp. 1–45, 2006. 2008, pp. 1–17.
[2] V. Takala and M. Pietikainen, “Multi-object tracking using color, texture [17] D.-N. Truong Cong, L. Khoudour, C. Achard, and A. Flancquart, “Adap-
and motion,” in IEEE Conference on Computer Vision and Pattern tive model for object detection in noisy and fast-varying environment,”
Recognition, 2007, pp. 1–7. in International Conference on Image Analysis and Processing, 2011,
[3] D.-N. Truong Cong, N.-A. Che Viet, and T. Ho-Phuoc, “Rule-based pp. 68–77.
multiple object tracking,” in International Conference on Advanced [18] “Pets 2006,” http://www.cvg.rdg.ac.uk/PETS2006/data.html.
Technologies for Communications, 2014. [19] “Caviar,” http://homepages.inf.ed.ac.uk/rbf/CAVIARDATA1/.
[4] Z. Khan, T. Balch, and F. Dellaert, “Mcmc-based particle filtering for [20] D.-N. Truong Cong, L. Khoudour, C. Achard, and L. Douadi, “People
tracking a variable number of interacting targets,” IEEE Transactions detection and re-identification in complex environments,” IEICE Trans-
on Pattern Analysis and Machine Intelligence, vol. 27, pp. 1805–1918, actions on Information and Systems, vol. E93-D, no. 7, pp. 1761–1772,
2005. 2010.
129
129
Nâng cao chất lượng gom cụm kết quả tìm

kiếm video sử dụng kết hợp đặc trưng âm
thanh, đặc trưng thị giác và thông tin văn bản
Nguyễn Quang Phúc, Nguyễn Thị Anh Thư, Ngô Đức Thành, Lê Đình Duy, Nguyễn Hoàng Tú Anh
Phòng Thí nghiệm Truyền thông Đa phương tiện
Đại học Công nghệ Thông tin, ĐHQG-HCM
Thành phố Hồ Chí Minh, Việt Nam
Email: {phucnq,thunta,thanhnd,ldduy,anhnht}@uit.edu.vn
Tóm tắt—Bài báo này đề xuất phương pháp sử dụng loại, chủ đề khác nhau và gây khó khăn trong việc tìm
kết hợp đặc trưng âm thanh, đặc trưng thị giác và thông kiếm. Trường hợp xấu hơn xảy ra khi kết quả của các
tin văn bản để nâng cao chất lượng gom cụm kết quả tìm chủ đề khác áp đảo chủ đề mà người dùng quan tâm.
kiếm video. Mặc dù hướng tiếp cận kết hợp đa đặc trưng
Trong kịch bản như vậy, việc gom cụm kết quả tìm kiếm
đã được giới thiệu trong các lớp bài toán như tìm kiếm
video (video retrieval), phân lớp video (video classification) video là cần thiết nhằm giúp người dùng dễ dàng xác
nhưng đóng góp chính của bài báo này là phân tích ưu định video cần tìm. Nói cách khác, thay vì phải duyệt
điểm của từng loại đặc trưng cụ thể làm cơ sở cho việc kết qua một danh sách phẳng kết quả tìm kiếm gồm nhiều
hợp đa đặc trưng và là công trình đầu tiên sử dụng kết video thuộc nhiều chủ đề trộn lẫn với nhau thì người
hợp đặc trưng âm thanh, đặc trưng thị giác và thông tin dùng được cung cấp một cái nhìn trực quan hơn thông
văn bản đi kèm video để giải quyết bài toán gom cụm kết
quả tìm kiếm video. Các thí nghiệm được tiến hành trên
qua kết quả gom cụm video theo từng chủ đề cụ thể.
kết quả tìm kiếm video của YouTube với phương pháp kết Qua đó, người dùng có thể dễ dàng xác định được video
hợp đề xuất cho kết quả tốt hơn so với việc chỉ áp dụng mà họ quan tâm một cách nhanh chóng và bỏ qua các
từng loại đặc trưng riêng lẻ trong quá trình gom cụm cụm video không thích hợp.
video. Tóm lại, với một danh sách video trả về từ kết quả
Từ khóa—gom cụm video, đặc trưng âm thanh, đặc tìm kiếm của một truy vấn bất kỳ trên các kênh video
trưng thị giác, độ tương tự kết hợp.
trực tuyến, bài toán gom cụm kết quả tìm kiếm video là
xác định các video có nội dung tương tự nhau và gom
I. GIỚI THIỆU
chúng lại trong cùng một cụm. Dữ liệu đầu vào và đầu
Ngày nay, với sự phát triển mạnh mẽ của công nghệ ra của bài toán được minh họa trực quan ở Hình 1. Đầu
truyền thông và kỹ thuật số cùng với sự bùng nổ của vào là danh sách video trả về từ kết quả tìm kiếm video
mạng Internet, số lượng video được chia sẻ trên Web trên Web, đầu ra là các cụm video.
ngày càng nhiều. Để tìm kiếm video trên Web, người Gom cụm kết quả tìm kiếm trên Web được nghiên cứu
dùng phải cung cấp từ khóa tìm kiếm trên các công cụ rộng rãi trước đây. Các công trình chủ yếu tập trung vào
tìm kiếm video (ví dụ như YouTube, Google Video). Kết dữ liệu văn bản (phổ biến là gom cụm trang Web) [6],
quả tìm kiếm được trình bày như một danh sách phẳng [8], [9] và dữ liệu hình ảnh [3], [5], [11]. Gần đây, có
với các video được xếp theo độ liên quan với từ khóa một số công trình nghiên cứu gom cụm kết quả tìm kiếm
truy vấn. Để tìm được video mong muốn, người dùng video [1], [7], [12]. So với dữ liệu dạng văn bản hay hình
phải “tốn công” duyệt qua toàn bộ danh sách. Hơn nữa, ảnh thì dữ liệu video có cấu trúc phức tạp hơn. Nội
các kết quả tìm kiếm là rất đa đạng và thường bị phân dung của video chứa đựng đồng thời các đặc trưng về
mảnh hoặc bị chi phối bởi các video không phù hợp âm thanh (audio), thị giác (visual) hay văn bản (textual).
(đặc biệt trong những trường hợp như người dùng gửi Điều này đặt ra nhiều thách thức trong việc biểu diễn
truy vấn quá ngắn hoặc truy vấn mơ hồ do tính đa nghĩa và so khớp video. Trong [12], tác giả biểu diễn video
của từ khóa truy vấn). dựa trên đặc trưng thị giác. Cụ thể, mỗi frame được biểu
Giả định người dùng đang quan tâm tới một vấn đề diễn thành một véc tơ đặc trưng trong không gian màu
cụ thể nhưng không đưa ra được từ khóa phù hợp. Do HSV (Hue Saturation Value). Sau đó, video được biểu
đó, kết quả tìm kiếm video trả về có thể thuộc nhiều thể diễn bởi một véc tơ đặc trưng được tính bằng cách lấy
130
ISBN: 978-604-67-0635-9 130

khai thác nội dung ngữ nghĩa được trích xuất từ thông tin
văn bản đi kèm video có thể giúp gom các video tương
đồng ngữ nghĩa về cùng một cụm. Do đó, đặc trưng thị
giác và thông tin văn bản đi kèm video sẽ hỗ trợ, bổ
sung cho nhau để biểu diễn video một cách hiệu quả
giúp nâng cao chất lượng gom cụm video. Tuy nhiên,
việc tận dụng nội dung ngữ nghĩa của thông tin văn bản
đi kèm video sẽ thực sự hiệu quả khi chúng được mô tả
đúng với nội dung thực sự của video. Dữ liệu video trên
các kênh video trực tuyến thường được tải lên bởi nhiều
người dùng, các thông tin văn bản đi kèm video cũng
được người dùng khai báo. Trong thực tế, vì những mục
đích riêng (ví dụ như thu hút lượt xem) hoặc do cảm
nhận chủ quan, người dùng có thể mô tả các thông tin
Hình 1. Minh họa trực quan dữ liệu đầu vào và đầu ra cho bài toán văn bản đi kèm không đúng với nội dung thực sự của
gom cụm kết quả tìm kiếm video. video. Trong những trường hợp tương tự như vậy, chúng
tôi tin rằng việc khai thác kết hợp đặc trưng âm thanh
được trích xuất trực tiếp từ nội dung video (ví dụ như
trung bình tất cả các véc tơ biểu diễn cho các frame của
những video về ca nhạc thường có các âm thanh như
video. Độ tương đồng giữa các video được quy về việc
tiếng reo hò, tiếng vỗ tay; những video đua xe thì âm
tính khoảng cách giữa các véc tơ biểu diễn chúng. Với
thanh đi kèm là tiếng động cơ xe, ...) sẽ góp phần cải
hướng tiếp cận này thì tính ngữ nghĩa trong thông tin
thiện chất lượng gom cụm video.
văn bản đi kèm video (ví dụ như tiêu đề (title), mô tả
Để làm rõ những phân tích trên, một ví dụ minh họa
(description), các thẻ từ khóa (tags)) không được xem
được thể hiện ở Hình 2. Trong ví dụ này, cả bốn video
xét. Trong [1], [7], các tác giả đã khai thác các thông
đều giới thiệu về “xe hơi” nên sẽ được gom vào cùng
tin được trích xuất từ đặc trưng thị giác và thông tin văn
một cụm. Video 1 và video 3 có thể hiện thị giác tương
bản đi kèm video nhằm cải thiện chất lượng gom cụm
đối giống nhau nên việc khai thác đặc trưng thị giác sẽ
video. Tuy nhiên, các phương pháp rút trích đặc trưng
giúp gom 2 video này với nhau. Tuy nhiên, video 2 và
biểu diễn video được sử dụng vẫn còn khá đơn giản và
video 4 có thể hiện thị giác khác so với video 1 và video
hiệu quả của từng loại đặc trưng trong quá trình gom
3. Khi đó, việc tận dụng thông tin văn bản đi kèm video
cụm video chưa được phân tích rõ ràng.
cùng với đặc trưng âm thanh được trích xuất từ nội dung
Trong bài báo này, chúng tôi tập trung vào việc phân
video (như tiếng động cơ xe) sẽ giúp gom video 2 và
tích ưu điểm của từng loại đặc trưng cụ thể làm cơ sở
video 4 vào chung cụm với video 1 và video 3.
cho việc kết hợp đa đặc trưng. Từ đó, đề xuất phương
Từ những phân tích trên, chúng tôi đề xuất mô hình
pháp kết hợp đặc trưng âm thanh, đặc trưng thị giác và
kết hợp đặc trưng âm thanh, đặc trưng thị giác và thông
thông tin văn bản đi kèm video nhằm nâng cao chất
lượng gom cụm video.
Các mục tiếp theo của bài báo được tổ chức như sau:
mục II giới thiệu phương pháp kết hợp đặc trưng đề
xuất, mục III trình bày các thực nghiệm, mục IV thảo
luận về hướng phát triển.
II. PHƯƠNG PHÁP ĐỀ XUẤT
A. Mô hình kết hợp đặc trưng âm thanh, đặc trưng thị
giác và thông tin văn bản
Theo quan sát trực quan, các video có nội dung tương
tự nhau thường có thể hiện thị giác (sự xuất hiện của
các đối tượng, hình ảnh) giống nhau. Vì vậy, việc sử
dụng đặc trưng thị giác để gom cụm video sẽ trở nên
hiệu quả. Tuy nhiên, với sự đa dạng của dữ liệu video
trên Web, những video thuộc cùng một chủ đề có thể có Hình 2. Minh họa cụm bốn video thuộc chủ đề “xe hơi” từ danh sách
những đối tượng và hình ảnh khác nhau. Khi đó, việc kết quả tìm kiếm video của truy vấn “Aston”.
131
131
Hình 3. Mô hình kết hợp đặc trưng âm thanh, đặc trưng thị giác và Hình 5. Minh họa quá trình tính độ tương tự video dựa trên đặc trưng
thông tin văn bản giải quyết bài toán gom cụm kết quả tìm kiếm video. thị giác (SIFT) được biểu diễn theo mô hình BoW.
tin văn bản đi kèm video nhằm nâng cao chất lượng
gom cụm video (xem Hình 3). bao gồm các bước chính là phát hiện và mô tả các điểm
đặc trưng. Các điểm đặc trưng sẽ được phát hiện và mô
B. Trích xuất đặc trưng, biểu diễn và so khớp video
tả trên từng frame của mỗi video. Để phát hiện các điểm
1) Đặc trưng âm thanh (Audio): Như đã phân tích đặc trưng, chúng tôi sử dụng bộ phát hiện đặc trưng phổ
ở trên, đặc trưng âm thanh đóng một vai trò quan biến Hessian-Affine [10]. Với mỗi đặc trưng, một véc
trọng trong quá trình gom cụm video. Trong bài báo tơ 128 chiều được tạo ra từ bộ mô tả SIFT. Như vậy,
này, chúng tôi sử dụng MFCC (Mel-Frequency Cepstral mỗi frame của video sẽ được biểu diễn bao gồm một
Coefficients) [13] như là một loại đặc trưng âm thanh tập các véc tơ đặc trưng 128 chiều. Video được biểu
được trích xuất từ video. Mượn ý tưởng từ mô hình BoW diễn bằng tập hợp tập các véc tơ đặc trưng biểu diễn
(Bag-of-Words) trong biểu diễn dữ liệu văn bản, sau khi cho từng frame.
đặc trưng âm thanh (biểu diễn dạng tập các véc tơ) được
trích xuất từ tập dữ liệu video, quá trình gom cụm các Tương tự như quá trình biểu diễn video với đặc trưng
đặc trưng tạo từ điển được tiến hành. Cuối cùng, mỗi âm thanh, chúng tôi cũng sử dụng mô hình BoW để biểu
video sẽ được biểu diễn bởi một véc tơ đặc trưng với diễn và tính độ tương tự video theo đặc trưng thị giác.
số chiều tương ứng với số từ trong từ điển. Độ tương tự Quá trình tính độ tương tự video dựa trên đặc trưng thị
giữa các video được tính là khoảng cách giữa các véc giác được thể hiện ở Hình 5.
tơ đại diện chúng. Quá trình tính độ tương tự video dựa 3) Thông tin văn bản (Textual): Thông tin văn bản đi
trên đặc trưng âm thanh được thể hiện ở Hình 4. kèm video (ví dụ như tiêu đề (title), mô tả (description),
các thẻ từ khóa (tags)) góp phần quan trọng thể hiện nội
dung ngữ nghĩa video giúp cải thiện chất lượng gom cụm
video. Tuy nhiên, vấn đề đặt ra là thông tin văn bản có
ý nghĩa tương tự nhau nhưng có thể được diễn đạt với
nhiều từ ngữ khác nhau (điều này chủ yếu là do tính linh
hoạt vốn có của ngôn ngữ tự nhiên cho phép người dùng
thể hiện cùng một nội dung nhưng với các ngôn từ khác
nhau). Trong bài báo này, chúng tôi đề xuất sử dụng từ
điển WordNet [2] để tính độ tương tự ngữ nghĩa giữa
Hình 4. Minh họa quá trình tính độ tương tự video dựa trên đặc trưng các từ thể hiện trong thông tin văn bản đi kèm video.
âm thanh (MFCC) được biểu diễn theo mô hình BoW.
Sau khi nghiên cứu rộng rãi một số phương pháp,
2) Đặc trưng thị giác (Visual): Để tăng độ chính xác chúng tôi đề xuất sử dụng phương pháp của Li để tính
so khớp video thì một trong những yêu cầu quan trọng độ tương tự ngữ nghĩa giữa các từ, phương pháp này có
là các điểm đặc trưng cục bộ (local keypoint features) sự tương quan tốt nhất với sự đánh giá của con người về
được rút trích từ các frame phải bất biến với những biến mức độ tương tự ngữ nghĩa giữa các từ như được trình
đổi về độ sáng, tỉ lệ co giãn, phép xoay, .... Một trong bày trong báo cáo [15].
những phương pháp rút trích và mô tả các đặc trưng cục Độ tương tự giữa các video dựa trên thông tin văn
bộ đáp ứng yêu cầu trên được sử dụng phổ biến nhất bản đi kèm sử dụng từ điển WordNet được thể hiện ở
hiện nay là Scale-Invariant Feature Transform (SIFT) [4] Hình 6.
132
132
Bảng I
BỘ DỮ LIỆU VIDEO THỬ NGHIỆM
Truy vấn Số video Số chủ đề

1. Aston 82 4
2. Cobra 92 5
3. Jaguar 86 4
4. Leopard 95 5
5. Lion 89 4
6. Lotus 91 6
Hình 6. Minh họa quá trình tính độ tương tự video dựa trên thông tin 7. Mustang 83 5
văn bản đi kèm sử dụng từ điển WordNet. 8. Scorpion 90 6
9. Venus 89 7
10. Viper 87 5
C. Gom cụm video
Quá trình gom cụm video dựa trên sự kết hợp đặc
trưng âm thanh, đặc trưng thị giác và thông tin văn bản B. Phương pháp đánh giá
được thực hiện qua 3 bước sau: Để đánh giá chất lượng gom cụm video. Chúng tôi
Bước 1. Độ tương tự giữa các video theo từng đặc sử dụng 2 độ đo phổ biến là Entropy và Purity [14].
trưng cụ thể sẽ được tính theo các phương pháp được Entropy của mỗi cụm phản ánh sự phân tán video
trình bày ở mục trước đó. thuộc các chủ đề trong mỗi cụm, giá trị Entropy đánh
Bước 2. Với hai video bất kỳ X và Y , độ tương tự giá chất lượng gom cụm tổng thể được tính là trung bình
kết hợp đa đặc trưng được tính theo công thức sau: cộng của tất cả các Entropy của các cụm. Với tập dữ
liệu gồm n video thuộc k loại (chủ đề) được gán nhãn
Sim (X, Y ) = wi ∗ Simi (X, Y ) (1) thủ công, ký hiệu là Cj , j = 1, ..., k và thuật toán gom
mỗi đặc trưng i cụm n video vào k cụm Pi với i = 1, ..., k. Entropy
đánh giá chất lượng gom cụm toàn cục cho tất cả các
trong đó, Sim (X, Y ) là độ tương tự kết hợp đa đặc cụm được tính toán theo công thức sau:
trưng giữa hai video X và Y , Simi (X, Y ) là độ tương ni nij nij
tự giữa hai video X và Y theo đặc trưng i, wi là trọng Entropy = − log (2)
n n i ni
số của đặc trưng i. i j
Bước 3. Áp dụng thuật toán gom cụm dữ liệu để thực trong đó ni là số video trong cụm Pi , nij là số video
hiện gom cụm video dựa trên độ tương tự kết hợp đa trong cụm Pi thuộc chủ đề Cj và n là tổng số video
đặc trưng. trong tất cả các cụm.
Kết quả gom cụm là hoàn hảo nếu mỗi cụm chỉ chứa
III. THỰC NGHIỆM video thuộc cùng một chủ đề duy nhất. Khi đó, giá trị
Entropy sẽ bằng không. Nói một cách tổng quát, giá trị
A. Bộ dữ liệu video Entropy càng nhỏ thì cho chất lượng gom cụm tốt hơn.
Purity phản ánh độ tinh khiết của các cụm. Purity của
Chúng tôi sử dụng phần mềm mã nguồn mở TubeKit1
một cụm được xác định dựa trên số video thuộc chủ đề
để tải dữ liệu video thực từ YouTube thông qua YouTube
mà xuất hiện nhiều nhất trong cụm đó. Purity đánh giá
API. Chúng tôi tải về khoảng 80 đến 100 video (thời
chất lượng gom cụm toàn cục cho tất cả các cụm được
lượng mỗi video từ 2 đến 10 phút) cho mỗi truy vấn và
tính toán theo công thức sau với các ký hiệu có ý nghĩa
thực hiện loại bỏ một số video biệt lập, ít liên quan đến
tương tự như trong công thức tính Entropy:
truy vấn tìm kiếm. Sự loại bỏ này là hợp lý bởi vì chúng
ni nij
tôi đang thử nghiệm tính năng hậu xử lý gom cụm kết P urity = (maxj ) (3)
quả tìm kiếm video chứ không phải là tìm kiếm chính i
n ni
xác của một công cụ tìm kiếm video. Ngược lại với Entropy, giá trị Purity càng lớn thì cho
Thí nghiệm được tiến hành trên bộ dữ liệu gồm 884 kết quả gom cụm tốt hơn.
video của 10 truy vấn với các từ khóa khác nhau. Thông
tin chi tiết về bộ dữ liệu video được mô tả ở Bảng I. C. Cài đặt thực nghiệm
Nhằm mục đích so sánh, đánh giá kết quả gom cụm
1 www.tubekit.org video với phương pháp đề xuất, chúng tôi tiến hành cài
133
133
đặt các thí nghiệm sau:

• A (Audio): Gom cụm video dựa trên độ tương tự
theo đặc trưng âm thanh.
• V (Visual): Gom cụm video dựa trên độ tương tự
theo đặc trưng thị giác.
• T (Textual): Gom cụm video dựa trên độ tương tự
theo thông tin văn bản đi kèm video.
• A-V-T (Audio-Visual-Textual) (hướng tiếp cận của
chúng tôi): Gom cụm video dựa trên độ tương tự
kết hợp đặc trưng âm thanh, đặc trưng thị giác và
theo thông tin văn bản đi kèm video.
Để xem xét sự tương quan giữa các đặc trưng trong
mô hình kết hợp, chúng tôi thử nghiệm phương pháp kết
hợp đặc trưng đề xuất với các bộ trọng số khác nhau
Hình 7. Kết quả gom cụm video được đánh giá theo Entropy.
ứng với từng đặc trưng được thể hiện trong Bảng II.
Bảng II
TRỌNG SỐ KẾT HỢP CÁC ĐẶC TRƯNG tương tự nhau (thuộc cùng chủ đề) thường có những đối
Âm tượng hình ảnh cụ thể và âm thanh tương tự nhau. Tuy
Trọng Thị giác Văn bản
thanh
(Visual) (Textual)
Tổng nhiên, kết quả thí nghiệm cũng cho thấy rằng mỗi đặc
số
(Audio) trưng đều có ưu thế riêng đối với mỗi bộ dữ liệu video
tsA 0.60 0.30 0.10 1.00 của từng truy vấn. Phương pháp kết hợp đa đặc trưng
tsB 0.35 0.50 0.15 1.00 của chúng tôi (A-V-T) được thử nghiệm với các bộ trọng
tsC 0.20 0.60 0.20 1.00 số khác nhau cho mỗi đặc trưng đều cho kết quả gom
cụm video tốt hơn so với các phương pháp sử dụng từng
Để gom cụm video, chúng tôi sử dụng thuật toán K- đặc trưng riêng lẻ (A), (V), (T). Điều này chứng minh
Medoids (một thuật toán gom cụm phổ biến) vì hai lý tính hiệu quả của việc kết hợp đặc trưng âm thanh, đặc
do sau: (i) trọng tâm của cụm là một đối tượng cụ thể trưng thị giác và thông tin văn bản đi kèm video trong
(tâm thật), (ii) độ tương tự giữa các đối tượng chỉ cần quá trình gom cụm video. Phương pháp A-V-T (tsA), A-
tính một lần (điều này là phù hợp với đầu vào là độ đo V-T (tsB) cho kết quả gom cụm video tốt nhất (đạt giá
tương tự kết hợp đa đặc trưng giữa các video được xử trị Entropy thấp nhất chứng minh xác suất phân bố các
lý tính toán trước đó). video thuộc cùng một chủ đề vào các cụm khác nhau là
Đối với bài toán gom cụm tổng quát thì số cụm được thấp nhất). Điều này cho thấy rằng trong chiến lược kết
khai báo linh động bởi người dùng. Số cụm càng ít thì hợp đa đặc trưng giải quyết bài toán gom cụm kết quả
tỷ lệ các đối tượng khác nhau được gom về cùng một tìm kiếm video thì đặc trưng âm thanh và đặc trưng thị
cụm càng cao, số cụm càng nhiều thì tỷ lệ các đối tượng giác chiếm ưu thế hơn so với thông tin văn bản đi kèm
giống nhau được gom vào các cụm khác nhau càng lớn. video.
Trong bài báo này, để công bằng trong việc đánh giá Kết quả thể hiện ở Hình 8 cho thấy phương pháp A-V-
giữa các phương pháp thực nghiệm, chúng tôi tiến hành T (tsA), A-V-T (tsB) cũng cho kết quả gom cụm video
thử nghiệm thuật toán gom cụm với số cụm đầu vào tốt nhất (đạt giá trị Purity cao nhất chứng minh tỉ lệ
tương ứng với số chủ đề của mỗi truy vấn. phân bố những video thuộc cùng một chủ đề vào cùng
một cụm là cao nhất).
D. Kết quả thực nghiệm Minh họa kết quả trực quan gom cụm video được thể
Kết quả gom cụm video ứng với các truy vấn khác hiện ở Hình 9.
nhau đánh giá theo Entropy và Purity được thể hiện ở Kết quả gom cụm video thể hiện ở Hình 9 bao gồm
Hình 7 và Hình 8. 6 cụm video liên quan đến truy vấn “Scorpion”. Cụm
Kết quả thể hiện ở Hình 7 cho thấy trên hầu hết các 1 bao gồm những video ca nhạc thể hiện bởi ban nhạc
bộ dữ liệu video của các truy vấn, phương pháp sử dụng Scorpions. Cụm 2 bao gồm những video liên quan đến
đặc trưng âm thanh (A) và đặc trưng thị giác (V) cho động vật (con bọ cạp). Cụm 3 bao gồm những video
kết quả gom cụm video tốt hơn (đạt giá trị Entropy thấp game. Cụm 4 gồm những video giới thiệu về mũ bảo
hơn) so với phương pháp sử dụng thông tin văn bản hiểm thương hiệu Scorpion. Cụm 5 gồm những video
đi kèm (T). Điều này cho thấy xu hướng những video tập Yoga (Scorpion Pose). Cụm 6 gồm những video liên
134
134
thấy rằng phương pháp kết hợp đề xuất giúp cải thiện
chất lượng gom cụm video so với các phương pháp sử
dụng từng đặc trưng riêng lẻ.
Hướng phát triển tiếp theo là có thể khai thác thêm
các thông tin được trích xuất từ đặc trưng chuyển động
(motion features) của video. Thử nghiệm và đánh giá
kết quả gom cụm video dựa trên việc kết hợp các bộ
đặc trưng khác nhau nhằm xây dựng bộ đặc trưng phù
hợp cho bài toán gom cụm kết quả tìm kiếm video.
LỜI CẢM ƠN
Nghiên cứu được tài trợ bởi Đại học Quốc gia Thành
phố Hồ Chí Minh (ĐHQG-HCM) trong khuôn khổ Đề
tài mã số C2015-26-02.
Hình 8. Kết quả gom cụm video được đánh giá theo Purity.
[1] A. Hindle, J. Shao, D. Lin, J. Lu and R. Zhang, “Clustering Web
Video Search Results Based on Integration of Multiple Features,”
In WWW, pp. 53-73, 2011.
[2] C. Fellbaum, ed., “WordNet: An electronic lexical database,”
Language, Speech, and Communication. MIT Press, Cambridge,
USA, 1998.
[3] D. Cai, X. He, Z. Li, W.Y. Ma, J.R. Wen, “Hierarchical clustering
of www image search results using visual, textual and link
information,” In ACM Multimedia, pp. 952-959, 2004.
[4] D. G. Lowe, “Distinctive Image Features from Scale-Invariant
Keypoints,” International Journal of Computer Vision, 60, 2, pp.
91-110, 2004.
[5] F. Jing, C. Wang, Y. Yao, K. Deng, L. Zhang, W.Y. Ma, “Igroup:
web image search results clustering,” In ACM Multimedia, pp.
377-384, 2006.
[6] G. Mecca, S. Raunich, A. Pappalardo, “A new algorithm for
clustering search results,” Data Knowl, Eng.62(3), pp. 504-522,
2007.
[7] H. Huang, Y. Lu, F. Zhang, and S. Sun, “A multi-modal clustering
method for web videos,” In Trustworthy Computing and Services,
pp. 163-169, 2013.
[8] H. Zeng, Q. He, Z. Chen, W. Ma, and J. Ma, “Learning to cluster
web search results,” In Proceedings of ACM SIGIR ’04, 2004.
Hình 9. Minh họa trực quan một phần kết quả gom cụm video với [9] J. Park, X. Gao, and P. Andreae, “Query directed web page
truy vấn “Scorpion”. clustering using suffix tree and wikipedia links,” In Advanced
Data Mining and Applications, pp. 91-99, 2012.
[10] K. Mikolajczyk, T. Tuytelaars, C. Schmid, A. Zisserman, J.
Matas, F. Schaffalitzky, T. Kadir, and L. Van Gool, “A comparison
quan đến một loại xe chuyên dụng thu hoạch gỗ thông of affine region detectors,” International journal of computer
(Ponsse Scorpion). Từ kết quả trực quan gom cụm video, vision, vol. 65, no. 1-2, pp. 43-72, 2005.
[11] M. Rege, M. Dong, and J. Hua, “Clustering Web Images with
chúng tôi quan sát thấy rằng đa số các video thuộc cùng Multi-modal Features,” In Proceedings of the 15th International
chủ đề đều được gom trong cùng một cụm. Thông qua Conference on Multimedia, pp. 317-320, 2007.
kết quả gom cụm video, người dùng có thể xác định [12] S. Liu, M. Zhu, Q. Zheng, “Mining similarities for clustering
web video clips,” In CSSE (4), pp. 759-762, 2008.
được những video mà họ quan tâm một cách dễ dàng [13] U. Srinivasan, S. Pfeiffer, S. Nepal, M. Lee, L. Gu, S. Barrass,
hơn thay vì phải duyệt qua một danh sách phẳng các kết “A Survey of Mpeg-1 Audio, Video and Semantic Analysis
quả tìm kiếm như trước đây. Techniques,” Multimedia Tools and Applications, 27(1), pp. 105-
141, 2005.
[14] Y. Zhao, G. Karypis, “Criterion functions for document clus-
IV. KẾT LUẬN VÀ HƯỚNG PHÁT TRIỂN tering: experiments and analysis,” Technical Report TR01-40,
Department of Computer Science, University of Minnesota, 2001.
Trong bài báo này, chúng tôi đề xuất phương pháp kết [15] Y.H. Li, Z. Bandar and D. McLean, “An approach for measuring
hợp đặc trưng âm thanh, đặc trưng thị giác được trích semantic similarity using multiple information sources,” IEEE
xuất trực tiếp từ nội dung video cùng với các thông tin Transactions on Knowledge and Data Engineering, vol. 15, no.
4, pp. 871-882, 2003.
văn bản đi kèm video dựa trên những phân tích về ưu
điểm của từng loại đặc trưng. Kết quả thí nghiệm cho
135
135
Ứng dụng PCA trong nhận dạng cử chỉ tay

ngôn ngữ tiếng Việt
Nguyễn Thị Hương Thảo, Vũ Hữu Tiến, Nguyễn Ngọc Minh, Vũ Văn San
Email: {thaonth, tienvh, minhnn, sanvv}@ptit.edu.vn
Tóm tắt—Hiện nay, cử chỉ tay là một trong các mối quan dụng kỹ thuật PCA.
tâm chính đối với người khiếm thính vì họ sử dụng ngôn Hệ thống nhận dạng cử chỉ tay có bốn giai đoạn: thu
ngữ cử chỉ để giao tiếp với nhau và giao tiếp với người nhận dữ liệu, mô hình hóa cử chỉ, trích chọn đặc trưng
bình thường. Đối với người bình thường nếu không biết
và nhận dạng. Thu nhận dữ liệu có thể thực hiện bằng
hoặc gặp khó khăn với ngôn ngữ cử chỉ của người khiếm
thính thì cần phải có thông dịch viên hỗ trợ quá trình cách sử dụng găng tay. Găng tay dữ liệu sử dụng cảm
giao tiếp. Do đó, một hệ thống nhận dạng ngôn ngữ cử biến (cơ hoặc quang) được gắn vào găng tay để chuyển
chỉ bàn tay tự động là rất cần thiết để giúp đỡ những đổi cử chỉ ngón tay thành tín hiệu điện. Từ đó có thể xác
người khiếm thính hòa nhập vào cuộc sống bình thường. định được vị trí tương ứng của các ngón tay. Cử chỉ tay
Về mặt kỹ thuật, nhận dạng ngôn ngữ cử chỉ là một bài cũng có thể được thu nhận bằng camera/webcam/Kinect
toán toàn diện vì phải có sự kết hợp của các giai đoạn
3D. Cách này có giá thành thấp và người sử dụng có
thu nhận ảnh, xử lý ảnh, phân tích và nhận dạng ảnh. Bài
báo này đề xuất phương pháp xử lý hình ảnh sau khi thu thể tạo ra các cử chỉ một cách dễ dàng. Trong một số
nhận và áp dụng kỹ thuật phân tích thành phần chính các công trình nghiên cứu trước đây sử dụng ảnh tĩnh
PCA (Principle Component Analysis) để nhận dạng cử chỉ để phân tích và nhận dạng, họ thường sử dụng camera
dựa trên các hình ảnh sau khi xử lý đó. Các kết quả thực để bắt giữ hình ảnh. Tuy nhiên, phương pháp này không
nghiệm cho thấy hệ thống đề xuất đã đạt được tỉ lệ nhận thích hợp trong thực tế. Đối với các ứng dụng thời gian
dạng cao.
thực thường sử dụng webcam để bắt giữ một chuỗi video
Từ khóa—PCA, nhận dạng cử chỉ, VSL
cử động của bàn tay. Trong phương pháp này, các khung
hình được phân tích để tách ra ảnh cử chỉ bàn tay. Vấn
I. GIỚI THIỆU
đề chính trong phương pháp này là tìm ra khung hình
Ngôn ngữ cử chỉ là loại ngôn ngữ sử dụng cử chỉ bàn nào chứa cử chỉ cuối cùng.
tay, biểu cảm của khuôn mặt và chuyển động của cơ thể Sau giai đoạn thu nhận dữ liệu là mô hình hóa cử chỉ.
để truyền đạt ý nghĩa giữa những người khiếm thính với Bàn tay cần được mô hình hoá để xử lý một cách chính
nhau và với người bình thường. Ngôn ngữ cử chỉ tay xác. Các mô hình khác nhau được lựa chọn tùy theo
cũng được sử dụng trong nhiều các ứng dụng khác như từng ứng dụng cụ thể. Giai đoạn này thực hiện phân
tương tác người – máy, hiện thực ảo, trò chơi tương tác. vùng bàn tay và tiền xử lý. Phân vùng bàn tay thực hiện
Vì vậy hiện nay nhận dạng ngôn ngữ cử chỉ là một lĩnh tách bàn tay khỏi bức ảnh và tiền xử lý là quá trình cải
vực thu hút nhiều các nhà nghiên cứu tập trung tìm hiểu. thiện chất lượng bức ảnh và cắt ra đúng vùng liên quan
Điều này giúp cho những người khiếm thính có cơ hội để xử lý tiếp theo. Quá trình phân vùng chính xác sẽ
giao tiếp với người bình thường một cách dễ dàng hơn. giúp trích chọn đặc trưng hoàn hảo. Phương pháp trích
Nhiều nghiên cứu trước đây đã thực hiện với các ngôn chọn đặc trưng được xem xét kỹ lưỡng tùy vào các ứng
ngữ khác nhau như ngôn ngữ cử chỉ Mỹ Latin, ngôn ngữ dụng khác nhau.
cử chỉ Ấn Độ, ngôn ngữ cử chỉ Anh. Tuy nhiên chưa có Giai đoạn cuối cùng của hệ thống nhận dạng cử chỉ tay
nhiều bài báo đề cập đến ngôn ngữ cử chỉ Tiếng Việt là phân loại cử chỉ. Có rất nhiều phương pháp phân loại
VSL (Vietnamese Sign Language). Bài báo này đề xuất như Mô hình Markov ẩn HMM, phân tích thành phần
một hệ thống nhận dạng cử chỉ tay mà người sử dụng chính PCA, phân loại theo khoảng cách, mạng neural.
không cần phải sử dụng thiết bị chuyên dụng nào như Nhận dạng cử chỉ tay gồm nhiều kỹ thuật khác nhau
găng tay mà chỉ thực hiện cử chỉ bằng tay trần trước [1]. Các nhà nghiên cứu sử dụng các kỹ thuật khác nhau
camera cố định sẵn. Hệ thống thực hiện nhận dạng các và đạt được độ chính xác khá cao. Phương pháp trong
chữ cái Tiếng Việt qua cử chỉ bàn tay tĩnh bằng cách sử tài liệu [2] đề xuất hệ thống nhận dạng ngôn ngữ cử chỉ
136
ISBN: 978-604-67-0635-9 136

Hình 1. Sơ đồ hệ thống nhận dạng được đề xuất

Hình 2. Bảng ký hiệu ngôn ngữ cử chỉ tiếng Việt
Ấn Độ trong video trực tiếp sử dụng trị riêng và vector A. Thu nhận dữ liệu
riêng để trích chọn đặc trưng. Jayashree R.Pansare và
Giai đoạn đầu tiên của hệ thống là thu nhận dữ liệu.
đồng nghiệp [3] đề xuất hệ thống nhận dạng cử chỉ tay
Ảnh được thu nhận bằng camera của máy tính với độ
tĩnh thời gian thực đối với ngôn ngữ cử chỉ Mỹ Latinh
phân giải 5 Megapixel. Người sử dụng thực hiện các cử
trên nền phức tạp. Hệ thống thực hiện tiền xử lý ảnh với
chỉ bằng tay trần trước camera trong khoảng cách 1m.
bộ lọc trung vị và các toán tử hình thái, trích chọn đặc
Để chụp được ảnh tĩnh của cử chỉ, hệ thống sử dụng giải
trưng sử dụng centroid và phân loại sử dụng khoảng
pháp thông báo để người sử dụng giữ nguyên tư thế bàn
cách Euclidean. S.Nagarajan và T.S.Subashini [4] giới
tay trong khoảng 5ms. Trong thí nghiệm này, hệ thống
thiệu hệ thống nhận dạng cử chỉ bàn tay tĩnh mô tả các
được thử nghiệm với các ảnh cử chỉ tay mô tả 25 chữ
chữ cái ngôn ngữ ký hiệu Mỹ. Đóng góp chính của bài
cái tiếng Việt. Cơ sở dữ liệu gồm 250 ảnh tương ứng
báo là sử dụng lược đồ xám hướng biên để trích chọn
với 25 lớp chữ cái. Mỗi lớp chữ cái gồm 10 ảnh được
đặc trưng và nhận dạng bằng SVM nhiều lớp tuy nhiên
thực hiện bởi hai người khác nhau trong điều kiện ánh
hệ thống chỉ thực hiện với nền đồng nhất. [5] đề xuất hệ
sáng khác nhau trên nền trắng đơn giản. Tập cơ sở dữ
thống nhận dạng ngôn ngữ Đài Loan với cả hai loại cử
liệu của ngôn ngữ Tiếng Việt được cho trong hình 2.
chỉ tay tĩnh và động sử dụng SVM và HMM, tuy nhiên
hệ thống yêu cầu người sử dụng phải đeo găng tay màu
B. Chuẩn hóa dữ liệu
trong quá trình thu nhận ảnh.
Bài báo này đề xuất hệ thống nhận dạng cử chỉ bàn Sơ đồ khối của tầng chuẩn hóa hình ảnh được mô tả
tay dựa trên kỹ thuật PCA đối với ngôn ngữ tiếng Việt trong hình 3. Để có thể nhận dạng được hình ảnh, trước
và đánh giá tính hiệu quả của các phương pháp khi sử giai đoạn nhận dạng, các hình ảnh phải được chuẩn hóa
dụng khoảng cách Euclidean để phân loại. Trong quá để hệ thống có thể rút ra các đặc trưng của các ảnh.
trình mô hình hóa cử chỉ, bài báo đề xuất phương pháp Trong hệ thống được đề xuất, ảnh chuẩn hóa là các ảnh
tách bàn tay khỏi nền, giúp cho quá trình nhận dạng nhị phân có kích thước 100x100.
được chính xác hơn. Để có thể phân vùng được cử chỉ tay, ảnh RGB đầu
Bài báo được cấu trúc như sau. Phần II đề xuất hệ vào được chuyển thành ảnh YCrCb với mục đích sử dụng
thống nhận dạng cử chỉ tay. Các kết quả thực nghiệm hai kênh màu Cr và Cb để chọn vùng da bàn tay. Với
được mô tả và phân tích được mô tả phần III. Cuối cùng việc sử dụng hai kênh màu như vậy, ảnh được xử lý sẽ
là kết luận được đưa ra trong phần IV. ít bị tác động với sự thay đổi của ánh sáng. Trong hệ
thống được đề xuất, để chọn vùng da bàn tay, giá trị
Cr được chọn trong khoảng từ 146 đến 165 và Cb được
II. MÔ HÌNH HỆ THỐNG chọn trong khoảng từ 140 đến 195.
Do quá trình tách ảnh bàn tay dựa trên giá trị ngưỡng
Sơ đồ hệ thống đề xuất được mô tả trong hình 1. của Cr và Cb nên một số vùng trên ảnh bị sai lệch, tạo
137
137
Vector phương sai của mỗi ảnh được tính như sau:
Φi = Γi − Ψ (2)
Bước 2: Tính ma trận hiệp phương sai

Ma trận hiệp phương sai C của các ảnh trong cơ sở
dữ liệu được tính như sau:
M
1
C= Φn ΦTn = AAT (3)
M n=1
trong đó A = [Φ1 Φ2 ...ΦM ]

Hình 3. Các bước xử lý trong quá trình mô hình hóa hình ảnh cử chỉ
Bước 3: Tính trị riêng và vector riêng
Trong bài báo này, kích thước của ảnh là
ra những vùng trống trên ảnh. Do đó ảnh sau khi tách 100X100(N = 100) và có 250 ảnh trong cơ sở dữ liệu
được xử lý để loại bỏ vùng trống không mong muốn. (M = 250). Vì vậy, kích thước của ma trận hiệp phương
Để đơn giản cho việc xử lý nhận dạng, ảnh YCrCb sai C là 1002 X1002 . Đây là ma trận có kích thước lớn
được biến đổi sang ảnh nhị phân. Quá trình này giúp và vì vậy việc tính vector riêng và trị riêng rất phức tạp.
cho việc xử lý giảm từ 3 ma trận Y, Cr, Cb xuống còn Để giảm khối lượng tính toán, [6] chứng minh rằng M
một ma trận ảnh nhị phân. trị riêng của AT A tương ứng với M trị riêng lớn nhất
Do việc chọn ngưỡng trong quá trình biến đổi nhị của AAT cùng với vector riêng tương ứng. M trị riêng
phân, ảnh sẽ xuất hiện các vùng khuyết không mong của AAT có thể được tính như sau:
muốn. Do vậy việc loại bỏ các vùng khuyết được tiến ui = Avi , i = 1, 2, ..., M (4)
hành một lần nữa. Tuy nhiên, trong một số ảnh, việc
loại bỏ này có thể làm mất nội dung của ảnh. Vì vậy, trong đó vi là vector riêng của AT A.
thuật toán tìm vùng trống lớn nhất để giữ lại được sử Để đơn giản trong tính toán, chỉ có K(K < M )
dụng để không làm thay đổi hình dạng đối tượng trong vector riêng (tương ứng với K trị riêng lớn nhất) được
ảnh. giữ lại. Trong bài báo này, chọn K = 30 để đảm bảo
Cuối cùng, phép xử lý hình thái (phép đóng) được sử tính cân bằng giữa thời gian tính toán và độ chính xác
dụng để hình ảnh đối tượng được hoàn chỉnh hơn. trong nhận dạng.
C. Trích chọn đặc trưng và phân loại Bước 4: Trích chọn đặc trưng của ảnh
Sau khi lựa chọn K vector riêng của ảnh trong cơ sở
Trong giai đoạn nhận dạng sử dụng thuật toán PCA
dữ liệu, phương sai của mỗi ảnh cử chỉ bàn tay trong
để trích chọn đặc trưng của ảnh và phân loại ảnh đầu
cơ sở dữ liệu được mô tả là tổ hợp tuyến tính của K
vào. Cụ thể là các trị riêng và vector riêng được coi
vector riêng lớn nhất.
là đặc trưng của ảnh đầu vào. Đối với giai đoạn phân
loại, khoảng cách Euclidean được sử dụng để so sánh K

đặc trưng của ảnh đầu vào với đặc trưng của các ảnh Φ̂i = λj uj , i = 1, 2, ..., K (5)
được lưu trữ trong cơ sở dữ liệu. Ảnh nào trong cơ sở j=1
dữ liệu có khoảng cách Euclidean ngắn nhất sẽ được coi
là giống với bức ảnh đầu vào nhất. Các bước của giai trong đó λj = uTj Φj .
đoạn nhận dạng được mô tả như sau: Mỗi ảnh cử chỉ bàn tay trong cơ sở dữ liệu được mô
Bước 1: Tính vector phương sai của dữ liệu tả bằng một vector:
Giả sử rằng có M ảnh trong cơ sở dữ liệu để huấn  i 
λ1
luyện I1 , I2 , ..., IM . Kích thước của mỗi ảnh là N XN .  λi2 
Để tính trị riêng, mỗi ảnh Ii kích thước N XN được Ωi =  
 ...  , i = 1, 2, ..., M (6)
sắp xếp lại thành vector Γi kích thước 1XN 2 . Vector λiK
trung bình của M ảnh được tính như sau:
M trong đó Ωi là vector đặc trưng của ảnh cử chỉ bàn tay
1 i trong cơ sở dữ liệu.
Ψ= Γi (1)
M i=1 Bước 5: Phân loại
138
138
Bảng I
Với ảnh cử chỉ bàn tay đầu vào, vector đặc trưng Ω BẢNG SO SÁNH KẾT QUẢ NHẬN DẠNG
được tính toán như sau:
  Tỷ lệ thành công (%) Tỷ lệ thành công (%)
λ1 Ký tự
(Phương pháp đề xuất) (Phương pháp trong tài liệu [2])
 λ2  A 100 100
Ω=  ...
 , λi = uTi Φ
 (7) B 50 25
C 75 75
λK D 50 50
Đ 75 75
trong đó Φ là giá trị ảnh đầu vào trừ đi ảnh trung bình E 100 100
của cử chỉ bàn tay trong cơ sở dữ liệu. G 80 80
Sau khi tách vector đặc trưng của ảnh đầu vào, vector H 50 100
I 75 75
đặc trưng này được so với vector đặc trưng của ảnh trong K 100 100
cơ sở dữ liệu dựa vào khoảng cách Euclidean. L 100 100
Khoảng cách Euclidean được tính như sau: M 75 75
N 100 100
K
O 50 50
er = Ω − Ωk = (λi − λki )2 (8) P 100 100
i=1 Q 100 100
R 75 100
Ảnh trong cơ sở dữ liệu với er tối thiểu là ảnh gần S 100 75
giống nhất với ảnh đầu vào. Ảnh giống nhất được coi T 50 50
U 100 100
là kết quả quá trình đối sánh của ảnh đầu vào. Vì vậy, V 75 75
ký tự tương ứng với ảnh kết quả đó được coi là kết quả X 100 75
của quá trình nhận dạng cử chỉ tay. Y 75 50
Dấu móc 75 75
III. MÔ PHỎNG VÀ PHÂN TÍCH KẾT QUẢ Dấu mũ 80 80
Tổng 80.4 79.4
Để đánh giá hiệu quả sử dụng thuật toán PCA trong
việc nhận dạng ngôn ngữ chữ cái tiếng Việt, mô phỏng
được thực hiện trên tập cơ sở dữ liệu 250 ảnh mô tả Kết quả mô phỏng cho thấy tỉ lệ nhận dạng thành công
25 chữ cái tiếng Việt. Tất cả các ảnh đều được chuẩn là 80.4 % . Kết quả cũng cho thấy một số các chữ cái bị
hóa bằng cách cắt và định lại kích cỡ 100 x 100 pixel. nhận dạng sai vì chúng có ảnh cử chỉ bàn tay khá giống
Hệ thống kiểm tra với 25 ký tự với mỗi lớp ký tự gồm nhau. Tuy nhiên, bằng việc chuẩn hóa ảnh hợp lý và sử
10 ảnh và thực hiện đánh giá dựa trên tỉ lệ nhận dạng dụng phương pháp PCA để nhận dạng, tỉ lệ thành công
thành công. của hệ thống được đề xuất đạt được cao hơn so với một
Hệ thống VSL được thực hiện trên phần mềm MAT- số phương pháp trước đó.
LAB phiên bản 7.6, Windows 8.1, 2 GB RAM và
webcam có độ phân giải 5 Megapixel. TÀI LIỆU THAM KHẢO
Bảng 1 mô tả kết quả của hệ thống đề xuất khi nhận [1] A.R. Sarkar , G. Sanyal and S. Majumder, Hand Gesture Recog-
dạng 25 chữ cái tiếng Việt với tỉ lệ thành công lên tới nition Systems: A Survey, International Journal of Computer
Applications,vol 71,2013
80.4 %. Kết quả chỉ ra rằng tỉ lệ thành công của các [2] J. Singha and K. Das, Recognition of Indian Sign Language in
chữ cái “B, D, H, O, T” thấp vì chúng có hình dạng Live Video, International Journal of Computer Applications, Vol
khá giống nhau. Vì vậy hệ thống đôi khi nhận dạng 70, 2013.
[3] J. R. Pansare, S. H. Gawande and M. Ingle, Real-Time Static Hand
nhầm. Đối với các chữ cái như “A, E, K, L, N, P, Q, S, Gesture Recognition for American Sign Language (ASL) in Com-
U, X” ảnh cử chỉ bàn tay có chất lượng tốt sau giai đoạn plex Background,Journal of Signal and Information Processing,
tiền xử lý. Vì vậy hệ thống đạt được tỉ lệ nhận dạng cao 2012, vol 3, 364-367.
[4] S. Nagarajan and T.S. Subashini, Static Hand Gesture Recognition
đối với các chữ cái này. Ngoài ra, do đối tượng ảnh cử for Sign Language Alphabets using Edge Oriented Histogram and
chỉ được tách ra đầy đủ và được chuẩn hóa tốt hơn nên Multi Class SVM, International Journal of Computer Applications,
hệ thống được đề xuất đạt được tỷ lệ thành công cao vol82, 2013.
[5] C. Huang and B. Tsai, A Vision-Based Taiwanese Sign Language
hơn so với phương pháp trong tài liệu [2]. Recognition, 20th International Conference onPattern Recognition
(ICPR), 2010.
IV. KẾT LUẬN [6] M. Turk and A. Pentland Eigenfaces for recognition, Journal of
Cognitive Neuroscience, vol.3, no.1, pp. 71-86, 1991.
Trong bài báo này thực hiện đánh giá hệ thống nhận
dạng ngôn ngữ cử chỉ tiếng Việt sử dụng kỹ thuật PCA.
139
139
Tổng quan những thách thức của kỹ thuật theo dõi

bệnh tiểu đường bằng phương pháp không xâm lấn
Hoàng Đình Đại
Chử Đức Hoàng Viện Điện tử - Viễn thông
Viện Điện tử - Viễn thông Trường Đại học Bách khoa Hà Nội
Trường Đại học Bách khoa Hà Nội Hà Nội, Việt Nam
Hà Nội, Việt Nam daihd@bme.edu.vn
hoang.chuduc@hust.edu.vn
Đỗ Xuân Hiếu
Lê Thị Như Viện Điện tử - Viễn thông
Viện Điện tử - Viễn thông Trường Đại học Bách khoa Hà Nội
Trường Đại học Bách khoa Hà Nội Hà Nội, Việt Nam
Hà Nội, Việt Nam hieudx@bme.edu.vn
nhult@bme.edu.vn
Trần Minh Tú
Viện Điện tử - Viễn thông
Trường Đại học Bách khoa Hà Nội
Hà Nội, Việt Nam
minhtu.tran@bme.edu.vn
Tóm tắt: Tỉ lệ bệnh nhân mắc bệnh tiểu đường mỗi năm kiểm soát và chữa trị, bệnh tiểu đường có thể gây ra nhiều biến
trên thế giới ngày càng tăng nhanh với hơn 6% dân số thế chứng nguy hiểm. [3] Các biến chứng cấp tính bao gồm tiểu
giới. Bệnh nhân tiểu đường được các chuyên gia yêu cầu đường nhiễm xe-ton axit (diabetic ketoacidosis) - và đường quá
theo dõi nồng độ glucose trong máu thường xuyên và liên cao – nonketotic thẩm thấu quá cao (nonketotic hyperosmolar
tục để kiểm soát tình trạng bệnh của họ. Tuy nhiên, các coma). [4] Các biến chứng mãn tính thường gặp như bệnh tim
phương pháp đo glucose hiện thời là không thuận tiện. Sự mạch, đột quỵ, suy thận, loét chân, mù mắt…
nghiên cứu và phát triển kỹ thuật không xâm lấn là thực Bệnh tiểu đường là bệnh do tuyến tụy không sản xuất đủ
sự cần thiết. Bài báo này đề cập đến tổng quan các vấn đề insulin hoặc các tế bào của cơ thể không đáp ứng với insulin
xoay quanh bệnh tiểu đường, phương pháp đo lường xâm được sản xuất. [5] Bệnh tiểu đường được phân ra gồm ba loại
lấn hiện tại và chi tiết về các phương án cho tương lai. chính:
Phương pháp không xâm lấn cũng còn nhiều điều cần làm  Tiểu đường Tuýp 1
sáng tỏ. Trong khi những tiến bộ đã được tìm thấy và  Tiểu đường Tuýp 2
bước đầu thực hiện, độ tin cậy và hiệu chuẩn của công cụ  Tiểu đường thai kỳ
không xâm lấn có thể vẫn chưa được cải thiện, và ngày Tiểu đường Tuýp 1 do bị thiếu insulin, có nghĩa cơ thể
càng có nhiều hơn nữa nghiên cứu được tiến hành trong không sản xuất đủ lượng insulin cần thiết hoặc không sản xuất
điều kiện sinh lý khác nhau của sự trao đổi chất, tuần insulin. Trước đây, nó được biết đến với tên gọi “tiểu đường
hoàn chất lỏng trong cơ thể, và các thành phần máu cần phụ thuộc insulin” (insulin-dependent diabetes mellitus –
thiết. Đó thực sự là các thách thức lớn đối với công cuộc IDDM). Phần lớn các trường hợp được chẩn đoán là trẻ em và
tìm ra cái mới. người trẻ trưởng thành, nên còn có cách gọi khác là “ Tiểu
Từ khóa: Không xâm lấn, theo dõi tiểu đường, bệnh tiểu đường vị thành niên”. [3] Đến nay, vẫn chưa có nghiên cứu nào
đường, đo nồng độ glucose… chỉ ra được nguyên nhân tại sao.
Tiểu đường Tuýp 2 xảy ra do hiện tượng kháng insulin,
1. GIỚI THIỆU một trạng thái mà các tế bào trong cơ thể không khớp với
insulin đúng cách. [3] Điều này cũng có thể xảy ra khi hiện
Bệnh đái tháo đường (diabetes mellitus), hay còn có tên tượng thiếu insulin trở nên trầm trọng hơn. [6] Dạng này được
khác là bệnh tiểu đường, được biết đến là nhóm bệnh rối loạn gọi là “tiểu đường không phụ thuộc insulin” (non- insulin-
chuyển hóa, trong đó có mức đường trong máu cao trong một dependent diabetes mellitus – NIDDM) hoặc “tiểu đường
khoảng thời gian dài. [1][2] Các triệu chứng thường thấy của khởi phát ở người lớn”. Nguyên nhân chính gây ra thường là ở
hiện tượng lượng đường trong máu cao bao gồm đi tiểu thường
xuyên, khát nước nhiều và nhanh đói. Nếu không có biện pháp
ISBN: 978-604-67-0635-9 140
140
những người có trọng lượng cơ thể quá mức, thừa cân và xuyên thì NIDDM thường được tìm thấy ở bệnh nhân lớn hơn
không thường xuyên vận động. [3] 40 tuổi, có thể tiêm insulin hoặc kiểm soát với thuốc uống,
Tiểu đường thai kỳ là tiểu đường “ có điều kiện”, đó là sự giảm cân, chế độ ăn hợp lý và kế hoạch thể dục thường xuyên.
rối loạn đường huyết trong máu khi mang thai. Nguyên nhân Cả hai loại tiểu đường tuýp 1 và tuýp 2 đều là mãn tính, không
gây ra do khi mang thai có sự thay đổi hoạt động nội tiết: tăng có bất kì phương pháp nào chữa khỏi hoàn toàn. Tiểu đường
tiết các hormon cần cho thai kỳ nhưng lại làm giảm tác dụng thai kì có ảnh hưởng đến phụ nữ mang thai nhưng có thể kiểm
của insulin. soát lượng đường trong máu. Nó chỉ diễn ra trong thời gian
Tiểu đường đã và đang là một trong những thách thức lớn ngắn và tự trở lại bình thường sau khi sinh.
đối với ngành y tế trên thế giới. Nồng độ glucose trong máu Theo số liệu thống kê, gần 18 triệu người trên thế giới phải
thay đổi theo bất kì hướng nào, tăng hoặc giảm đều có thể dẫn chịu chung số với bệnh tiểu đường, chỉ riêng nước Mỹ đã có
đến tử vong. Một người bình thường có nồng độ glucose trong đến 5% tổng dân số bị bệnh. Bệnh tiểu đường là nguyên nhân
máu đạt từ 70mg/dL đến 110mg/dL hoặc 3.9 đến 6.0 mM/L. cao thứ 7 dẫn đến tử vong. Dự đoán đến năm 2020, các chi phí
Nhưng ngay sau khi nạp đường vào cơ thể, mức độ này có thể liên quan đến điều trị đái tháo đường được dự đoán có thể lên
lên đến 140 mg/dL. Để kiểm tra và kiểm soát nồng độ glucose, đến 192 tỷ đô la Mỹ (Freer, tháng 3 năm 2011). [11] Đến giờ
các chuyên gia yêu cầu bệnh nhân phải thường xuyên tiến hành vẫn chưa có biện pháp nào chữa khỏi hoàn hoàn bệnh tiêu
các biện pháp đo lường. Tuy nhiên, hiện nay, biện pháp phổ đường. Vì vậy, việc đo nồng độ glucose trong máu ở bệnh
biến vẫn là lấy mẫu máu và đo bằng các phản ứng hóa học. nhân tiểu đường thường xuyên và kiểm soát insulin là chìa
Phương pháp này gây đau đớn, khó chịu và tốn kém cho bệnh khóa cho việc kiểm soát tình hình.
nhân. Vì vậy, yêu cầu tìm ra một thiết bị đo nồng độ đường
2.2. Phương pháp đo nồng độ glucose xâm lấn hiện tại
huyết không xâm lấn, theo dõi liên tục, chính xác là vô cùng
cần thiết. Hầu hết các bệnh nhân tiểu đường chỉ biết đến phương
Để phòng ngừa và điều trị bệnh tiểu đường cần có một chế pháp xâm lấn. Bệnh nhân được yêu cầu theo dõi mức đường
độ ăn uống hợp lý và luyện tập thể dục thường xuyên, không huyết hai đến ba lần một ngày. Họ kiểm tra lượng đường trong
sử dụng thuốc lá và duy trì cơ thể ở trạng thái cân nặng bình máu bằng cách sử dụng kim nhọn – trích vào ngón tay để lấy
thường. Kiểm soát huyết áp và chăm sóc chân phù hợp cũng là mẫu máu vào que thử, lấy que thử ra và gắn vào máy. Sau một
việc hết sức quan trọng đối với người mắc bệnh tiểu đường. thời gian ngắn, máy này sẽ đọc và cho ra số liệu. Mặc dù cho
Bệnh tiểu đường Tuýp 1 phải được kiểm soát bằng cách tiêm kết quả khá chính xác và ổn định thì phương pháp xâm lấn hiện
insulin. [3] Tiểu đường Tuýp 2 có thể điều trị bằng thuốc. [7] tại thực sự có nhiều bất lợi: gây đau đớn, chi phí cao, nguy cơ
Insulin và một số loại thuốc lại có thể gây ra lượng đường gây ra bệnh truyền nhiễm và không thể theo dõi mức đường
trong máu thấp. [8] Phẫu thuật giảm cân ở những người béo huyết liên tục.
phì đôi khi cũng là một biện pháp tốt đối với người bị bệnh tiểu Dưới đây là mô hình cơ bản của phương pháp xâm lấn:
đường Tuýp 2. [9] Riêng đối với trường hợp tiểu đường thai kì
thì người bệnh thường sẽ tự khỏi sau khi sinh. [10]
2. TỔNG QUAN VỀ BỆNH TIỂU ĐƯỜNG
2.1 Bệnh Đái tháo đường (Tiểu đường)

Đái tháo đường là thuật ngữ dùng để chỉ trạng thái cơ thể
không phù hợp với số lượng hoặc chất lượng hormon insulin
được sản xuất cần thiết để duy trì mức đường huyết lưu thông
bình thường.
Chỉ số đường huyết an toàn:
 Trước bữa ăn: 90 – 130 mg/dL (5.0 – 7.2 mM/L)
 1 -2 giờ sau bữa ăn: dưới 180 mg/dL (10mM/L)
 Trước khi đi ngủ: 110 – 150 mg/dL (6.0 – 8.3
mM/L)
Nếu một người có mức đường huyết nằm ngoài các khoảng
trên thì cần phải được xét nghiệm và chẩn đoán kịp thời. Theo
số liệu thống kê, các nhà nghiên cứu nhận thấy có ba loại bệnh
tiểu đường chính: bệnh tiểu đường tuýp 1, tiểu đường tuýp 2 và Hình 1. Phương pháp đo nồng độ glucose xâm lấn
tiểu đường thai kỳ. Tiểu đường Tuýp 1 là Tiểu đường phụ
thuộc Insulin (IDDM), chiếm 5 – 10% các trường hợp mắc Để giải quyết những vấn đề trên, việc tìm ra phương pháp
bệnh tiểu đường. Tiểu đường Tuýp 2 hay còn gọi là Tiểu theo dõi glucose không xâm lấn là cần thiết. Các phương pháp
đường không phụ thuộc insulin (NIDDM) chiếm 90 – 95% không xâm lấn kỳ vọng là phương pháp không đau, tiện lợi và
tổng số ca mắc bệnh. Trong khi IDDM thường xảy ra ở trẻ em chính xác.
và trẻ vị thành niên, đòi hỏi phải có đủ số insulin để duy trì sự
sống kết hợp chế độ ăn uống lành mạnh và tập thể dục thường
141
141
2.3 Phương pháp đo glucose không xâm lấn

Đo glucose không xâm lấn dùng để chỉ phương pháp đo
nồng độ glucose trong máu (yêu cầu đối với bệnh nhân tiểu
đường nhằm ngăn ngừa các biến chứng cấp và mãn tính) mà
không cần lấy mẫu máu, không gây tổn thương trên người bệnh
và không đau. [12] Các nhà nghiên cứu đã chỉ ra rằng có ba
phương pháp đo glucose không xâm lấn:
 Kĩ thuật quang
 Sử dụng nước bọt
 Phân tích glucose trong nước mắt
3. PHƯƠNG PHÁP ĐO GLUCOSE KHÔNG XÂM LẤN
Trong bài báo này, chúng ta sẽ xem xét tất cả các phương
pháp đo glucose không xấm lấn như bất kì phương pháp nào
mà không cần trích da. Các kĩ thuật/công nghệ khác nhau sẽ Hình 2. Sơ đồ khối hệ thống đo glucose không xâm lấn
được liệt kê. Các nguyên tắc về công nghệ, cùng với những lợi
thế và hạn chế của nó cũng sẽ được thảo luận.
Về cơ bản, mô hình của thiết bị đo glucose không xâm lấn
3.1. Đo đường huyết sử dụng nước bọt có cấu trúc như trên. Cảm biến được dùng thường là một số
Các nghiên cứu cho thấy có mối quan hệ giữa nồng độ loại cảm biến quang học. Với mỗi phương thức khác nhau sau
glucose trong máu và trong nước bọt. đây, sẽ dựa trên cùng nguyên lý cơ bản trên nhưng với sóng
Về cơ bản, việc sử dụng nước bọt cũng tương tự như ánh sáng khác nhau.
phương pháp truyền thống là sử dụng máu, điều khác biệt duy
nhất đó là nước bọt, không phải máu. Bệnh nhân tiểu đường BẢNG 1. CÁC PHƯƠNG PHÁP ĐO GLUCOSE
đặt que thử vào miệng khoảng vài giây để lấy một lượng nhỏ KHÔNG XÂM LẤN
nước bọt làm mẫu phân tích và sau đó đặt que thử vào máy đọc Kĩ thuật Định nghĩa
và cho ra kết quả. Phổ hồng ngoại gần Hấp thụ hoặc phát xạ ánh
Near Infrared Spectroscopy sáng có bước sóng từ 0.7 –
3.2. Sử dụng nước mắt để theo dõi nồng độ glucose (NIR) 2.5 um, phổ được so sánh để
Bệnh nhân tiểu đường cũng có khả năng sử dụng nước mắt tìm ra glucose.
để đo nồng độ glucose. Mức đường huyết trong nước mắt thấp Phổ Raman Ánh sáng laser được sử dụng
hơn từ 30 đến 50 lần trong máu. Người bệnh không phải cố Raman Spectroscopy để cảm ứng ánh sáng phát ra
khóc để lấy mẫu, các cảm biến có thể nhẹ nhàng đặt trên bề từ vùng chuyển đổi gần
mặt của mắt để thu hút chất lỏng. ngưỡng kích thích
Phương pháp này có hạn chế là nó sẽ cho thông số sai lệch Quang phổ ảnh âm Chất lỏng có thể gây kích
khi bệnh nhân cố kích thích chảy nước mắt. Photoacoustics Spectroscopy thích sóng laser. Điều này
3.3. Kĩ thuật quang được sử dụng để tạo ra một
âm thanh phản hồi và một
Phương pháp đo lường nồng độ glucose không xâm lấn sử một quang phổ sinh ra sẽ
dụng kĩ thuật quang học là kĩ thuật tập trung một chùm sóng được hiệu chỉnh.
lên cơ thể. Chùm sáng này sẽ bị suy giảm sau khi truyền qua Thay đổi tán xạ Sự tán xạ của laser có thể
lớp mô. Một kết quả sẽ nhận được từ ánh sáng khuếch tán đi ra Scatter Changes được sử dụng để chỉ ra sự
khỏi mô. Sự hấp thụ ánh sáng của da sẽ phụ thuộc vào thành thay đổi trong thành phần các
phần cấu tạo của da (nước, hemoglobin, melanin, chất béo và chất trong các lần thử nghiệm.
glucose). Việc truyền tải ánh sáng ở mỗi bước sóng là hàm phụ
Thay đổi sự phân cực Sự có mặt của glucose trong
thuộc độ dày, màu sắc và cấu trúc da, xương, máu và các thành
Polarization Changes chất lỏng là nguyên nhân dẫn
phần khác mà ánh sáng đi qua.
đến sự phân cực nhiều hơn
Sự tập trung glucose có thể được xác định rõ bằng cách
của sóng truyền qua.
phân tích sự thay đổi tín hiệu quang trong mỗi bước sóng, sự
Phổ nửa hồng ngoại Hấp thụ hoặc phát xạ ánh
phân cực hoặc cường độ của ánh sáng. Thể tích mẫu được đo
Mid – Infrared Spectroscopy sáng trong khoảng 2.5 – 10
bằng các phương pháp này phụ thuộc vào vị trí đo. Sự tương
(MIR) um được kiểm tra và sử dụng
quan với mức đường huyết dựa trên cơ sở phần trăm mẫu chất
để định lượng glucose trong
lỏng ở kẽ, nội bào hoặc mao mạch.
chất lỏng.
Sơ đồ khối cơ bản của hệ thống đo glucose không xâm lấn
được mô tả trong hình dưới đây:
Phổ hồng ngoại gần có quang phổ nằm trong vùng bước
sóng từ 730 – 2500 nm. Nó cho phép đo glucose trong máu
trong các mô bởi sự biến động của cường độ ánh sáng, dựa trên
142
142
HộiHội
Thảo Quốc
Thảo QuốcGia
Gia2015
2015về
vềĐiện
Điện Tử,
Tử,Truyền
Nghệ Thông
(ECIT 2015)
2015)
truyền và phản xạ. [15] Khi so sánh với MIR, ánh sáng tập 3.4. Một số phương pháp mới
trung vào cơ thể được hấp thụ một phần và tán xạ một phần do 3.4.1Một số phương pháp mới được công bố
sự tương tác của nó với các thành phần hóa học trong mô. Trước tình hình phát triển nhanh của khoa học – công nghệ
Nồng độ glucose được ước tính bằng cường độ chùm sáng và để đáp ứng yêu cầu cấp bách về thiết bị đo tiểu đường
truyền qua mô và phản xạ từ chính mô đó. không xâm lấn, các nhóm nghiên cứu hiện nay đã cho ra đời
Ưu điểm: Độ chính xác cao, tín hiệu đo có năng lượng cao những sản phẩm mới, không đi theo lối mòn của các kỹ thuật
hơn phổ MIR. [14] nói trên.
Nhược điểm: cần tác dụng một áp lực quét, sự khác biệt sinh Thử tiểu đường bằng hình xăm tạm, người ta sẽ in các
lý không liên quan đến đường huyết, các phần tương đối nhỏ điện cực lên giấy dung làm hình xăm tạm, các điện cực này
của glucose trong máu tương quan yếu, độ ổn định kém. [15] được kết nối với cảm biến, sau mỗi bữa ăn các điện cực sẽ sinh
Phổ nửa hồng ngoại (MIR) dựa trên sóng ánh sáng có phổ điện trong 10 phút, dòng điện sẽ thu hút glucose đến sát với
bước sóng từ 2500 – 10000 nm. [14] Sự hấp thụ ánh sáng nửa mặt da, giúp cảm biến đo được lượng đường huyết.
hồng ngoại khác nhau có thể được biểu diễn bởi một mô hình Thiết bị vòng xoắn đặt trong ruột: bác sĩ sẽ đưa thiết bị
kĩ thuật phân tích định lượng quang phổ. Hiện nay, thuật toán vòng xoắn vào ruột bệnh nhân như mổ nội soi. Khi được đưa
bình phương tối thiểu thường được sử dụng để hiệu chuẩn đa vào và định vị, nó sẽ làm một vật cản luồng thức ăn đi vào
biến cho các thành phần. [15] Để các bước sóng cao hơn, vật thành ruột, làm thay đổi đường đi của thức ăn và cách thức làm
tạo sóng nửa hồng ngoại làm giảm hiện tượng tán xạ và tăng sự việc của hệ thống tiêu hóa. Thiết bị này tỏ ra hiệu quả trong
hấp thụ. [14] việc giảm glucose trong máu và giảm nhanh số đo vòng bụng.
Ưu điểm: Sóng nửa hồng ngoại đem so sánh với phổ sóng 3.4.2 Phương án đề xuất: Máy đo đường huyết không
hồng ngoại thì tín hiệu thu được phản ánh mức glucose có độ xâm lấn tối thiểu và dự án Zinmed
sắc nhọn hơn, tín hiệu NIR có phổ rộng và yếu hơn. Một nhóm nghiên cứu Trường Đại học Bách khoa Hà Nội
Nhược điểm: Mức độ thâm nhập sâu yếu đã và đang triển khai một dự án lớn dành cho cộng đồng bệnh
Thay đổi sự phân cực dựa trên hiện tượng xảy ra khi sóng nhân tiểu đường – Zinmed - giải pháp giúp hỗ trợ quản lý và
phân cực ngang trong một dung dịch có chứa chất hoạt quang điều trị bệnh tiểu đường.
(như các phân tử chiral). Glucose là một phân tử chiral, đặc
tinh quay ánh sáng của nó có thể được biết đến trong thời gian
dài. Thật vậy, các cuộc điều tra về sự thay đổi phân cực gây ra
bởi glucose đã cho thấy kĩ thuật không xâm lấn đầu tiên cho
việc đo glucose ở người. [14]
Ưu điểm: Kĩ thuật này có thể cho phép dùng với ánh sáng
nhìn thấy, phù hợp với môi trường tự nhiên. [14]
Nhược điểm: Nhạy cảm với các tán xạ của các mô, vì có
hiện tượng phản phân cực tán xạ. [14]
Phổ Raman dựa trên việc sử dụng sóng laser để tạo lên sự
rung lắc và quay đảo của các phân tử và hậu quả sự phát hành
của ánh sáng tán xạ ảnh hưởng bởi sự rung của các phân tử.
[14] Hiệu ứng này phụ thuộc vào nồng độ các phân tử glucose.
Kĩ thuật này có thể đo lường với cả những tín hiệu yếu, thậm Hình 3. Mô hình đơn giản thiết bị đo glucose không xâm lấn
chí trong các dịch trong cơ thể con người. Bởi sự phát xạ ánh Zinmed
sáng tán xạ bị ảnh hưởng bởi sự rung động của các phần tử, do Zinmed bao gồm hệ thống website quản lý, ứng dụng di
đó có thể dùng để ước tính nồng độ glucose trong cơ thể người. động, máy đo đường huyết xâm lấn tối thiểu và tin tức chuyên
Phổ glucose có thể dùng để phân biệt với các hợp chất khác sâu trong hệ thống website vệ tinh. Bệnh nhân tiến hành đo tiểu
trong cùng một dải này. đường bằng phương pháp không xâm lấn tối thiểu, dữ liệu
Ưu điểm: Phổ Raman cho tín hiệu sắc nét và không bị chồng được hiển thị và lưu trên smartphone; đồng thời hệ thống
chéo lên nhau như NIR. Bước sóng laser cố định thường được website quản lý và các website vệ tinh giúp kết nối với các
sử dụng với chi phí thấp. bệnh nhân tiểu đường khác và cung cấp cho người dùng cẩm
Nhược điểm: Chịu ảnh hưởng của sự không ổn định của nang cần thiết để phòng và điều trị bệnh tiểu đường. Hiện tại,
bước sóng và cường độ sóng laser, thời gian thu lại quang phổ hệ thống website quản lý và website vệ tinh đã hoạt động mạnh
lâu. mẽ, nhận được sự quan tâm của nhiều người.
Phổ âm ảnh sử dụng chùm tia quang học để nhanh chóng Tuy các thiết bị này còn đang trong quá trình hoàn thiện và
làm nóng mẫu và tạo ra một làn sóng áp suất âm và có thể thu thử nghiệm trên quy mô rộng lớn hơn nhưng rõ ràng chúng cho
được bằng glucose. thấy một sự nỗ lực, phấn đấu không ngừng nghỉ của các nhà
Nhược điểm: chịu ảnh hưởng của các thành phần hóa học, khoa học trên thế giới. Và với trình độ khoa học – kỹ thuật hiện
sinh học cũng như các tác động vật lí như nhiệt độ, áp suất. nay hoàn toàn có thể tạo ra được thiết bị với phương pháp tối
[16] ưu và độ chính xác chấp nhận được trong điều kiện Việt Nam.
143
143
HộiHội Thảo
Thảo QuốcGia
Quốc Gia2015
2015về
về Điện
Điện Tử, Truyền Thông
Tử, Truyền ThôngvàvàCông
CôngNghệ
NghệThông Tin Tin
Thông (ECIT 2015)
(ECIT 2015)
4. SO SÁNH VÀ THẢO LUẬN phương pháp cũ. Bởi vậy, đo glucose không xâm lấn thực sự là
công nghệ trong tương tai.
4.1. So sánh các thế hệ phương pháp đo tiểu đường.
Hình 3 cho thấy sự phát triển của các thế hệ đo tiểu đường.
6.2. Những thử thách bước đầu của phương pháp đo
Các thế hệ trước với nhiều nhược điểm cả về giá thành lẫn sự
glucose không xâm lấn
bất tiện. Và do vậy, việc ra đời các máy của thế hệ thứ tư
không xâm lấn là một điều tất yếu.
Các phần trên chúng tôi đã đi trình bày tổng quan về bệnh
tiểu đường cũng như các phương pháp đo đường huyết từ quá
khứ đến hiện tại và tương lai. Và rõ ràng, trên thế giới đã có
rất nhiều nhóm nghiên cứu đang khám phá một loạt các
phương pháp tiếp cận, cố gắng phát triển một phép đo glucose
không xâm lấn cho kết quả ổn định, đáng tin cậy, thuận tiện
và kinh tế. Bảng 2 sau đây sẽ cho thấy một số sản phẩm mới
nhất, được tham khảo trên internet như: GlucoWatch,
Diasensor…
BẢNG 2. THÔNG TIN VỀ THIẾT BỊ ĐO GLUCOSE
KHÔNG XÂM LẤN
Số Công nghệ Định nghĩa và
thứ hiện trạng
tự
1 Phổ hồng ngoại gần Xuất hiện năm 2010 và
được FDA chấp thuận
năm 2011
Hình 4. Sự phát triển qua các thế hệ đo đường huyết 2 Phổ Raman Xuất hiện năm 2011 và
vẫn tiếp tục được nghiên
Như đã trình bày ở trên, thế hệ máy đo tiểu đường bằng cứu
phương pháp xâm lấn hiện tại tồn nhiều nhược điểm. Trước 3 Phổ hồng ngoại gần – Xuất hiện năm 2008 và
tiên phải kể đến là việc bệnh nhân tiểu đường phải lấy mẫu Công nghệ cổng quang được thương nghiệp hóa
máu nhiều lần một ngày để theo dõi. Phương pháp này chỉ cho sớm vào cuối năm 2011
ra thông số tĩnh, tại thời điểm lấy máu mà không thể theo dõi 4 Công nghệ huỳnh quang Xuất hiện năm 2007 được
liên tục, các hiện tượng tăng hoặc hạ đường huyết không được FDA chấp thuận năm
theo dõi tỉ mỉ. Do vậy, việc theo dõi đường huyết theo phương 2011
pháp cũ không phản ánh đúng tính chất và thực trạng của bệnh 5 Cộng hưởng điện từ - Xuất hiện năm 2005 và
nhân, hay đánh giá được chính xác tình trạng bệnh của bệnh sinh học được sản xuất thí điểm
nhân. Không chỉ vậy, việc lấy mẫu máu nhiều lần cũng gây năm 2011
khó chịu cho bệnh nhân, đau đớn và tổn thương mô là không 6 Cảm biến hóa học trong Xuất hiện năm 2010 và
thể tránh khỏi. Từ đó kéo theo nhiều hệ lụy khác như bất tiện hơi thở đang trong quá trình phát
trong sinh hoạt và làm việc, nguy cơ gây ra các bệnh truyền triển
nhiễm… Một điều không thể tránh khỏi là sự tiêu tốn về tài
7 Phổ huỳnh quang Xuất hiện năm 2011 và
chính lớn, mỗi lần thử máu bệnh nhân phải sử dụng một kim
được Canada chấp nhận
trích máu hoàn toàn mới.
thương mai hóa
Với thực tế này, lợi thế của phương pháp không xâm lấn là
Cùng với đó, Bảng 1 đã cho thấy đã có rất nhiều nhóm
điều có thể chinh phục những bệnh nhân khó tính nhất.
nghiên cứu đang làm việc trong chủ đề này, tất cả đều cố gắng
Phương pháp đo glucose không xâm lấn cho phép loại bỏ
tìm ra một phương pháp đo lường mới, công nghệ đo đường
những bất lợi trên. Vì sử dụng các kỹ thuật cảm biến quang
huyết không xâm lấn. Tuy nhiên, thực tế thì phương pháp
hoặc tương tự như vậy, phương pháp này hoàn toàn không gây
không xâm lấn còn nhiều hạn chế và vẫn chỉ đang trong quá
đau đớn cho bệnh nhân, đem lại cảm giác thoải mái khi sử
trình nghiên cứu.
dụng. Việc đem lại cảm giác thoải mái cho bệnh nhân khi tiến
Một trong những lí do chính là công nghệ, như việc hấp
hành thử nghiệm đã là một thành công lớn của phương pháp
thụ quang phổ, cho tỷ lệ tín hiệu trên nhiễu thấp liên quan đến
này so với phương pháp cũ vì một trong những nguyên nhân
mức độ tập trung glucose và phổ đáp ứng. Do nhu cầu lớn của
gây bệnh tiểu đường là căng thẳng thần kinh. Việc sử dụng
thị trường cho một sản phẩm đo glucose không xâm lấn thành
phương pháp mới đã giúp bệnh nhân tránh được nguyên nhân
công, điều này đã tạo nên cuộc đua cho các nhóm nghiên cứu
này. Từ đó, loại bỏ hoàn toàn các rủi ro về tổn thương mô hay
để phát triển một thiết bị chính xác hơn và thiết bị quang phổ
bệnh truyền nhiễm. Không chỉ vậy, ưu điểm vượt trội trong đo
chính xác là rất quyết liệt. Hơn nữa, phương pháp huấn luyện
glucose không xâm lấn là việc tiết kiệm chi phí. Bệnh nhân sẽ
đa biến thường được sử dụng trong phân tích định lượng các
không phải chi trả cho các khoản que trích máu như đối với
mô hình dự đoán là dữ liệu phụ thuộc, trong khi đặc trưng của
144
144
đo lường là không dễ dàng để giải quyết. Mặc dù, một phương [6] RSSDI textbook of diabetes mellitus. (Rev. 2nded.).
pháp cải thiện đã được nghiên cứu cho việc phân tích định New Delhi: Jaypee Brothers Medical Publishers. 2012. p. 235.
lượng mà có thể tăng cường sự tương quan của các thuộc tính ISBN 9789350254899.
quang phổ của phân tử glucose với nồng độ glucose trong [7] "The top 10 causes of death Fact sheet N°310".
máu, cần nỗ lực nhiều hơn trong việc nghiêm ngặt mở rộng kĩ World Health Organization. Oct 2013.
thuật để kiểm soát lượng đường trong máu không xâm lấn. [8] Rippe, edited by Richard S. Irwin, James M. (2010).
Hơn nữa, việc hiệu chỉnh thiết bị quang phổ là cần thiết, Manual of intensive care medicine (5thed.). Philadelphia:
bởi các yếu tố như cường độ ánh sáng có thể ảnh hường đến Wolters Kluwer Health/Lippincott Williams & Wilkins. p. 549.
kết quả. Như hầu hết các công nghệ không xâm lấn này dựa ISBN 9780781799928.
trên một số loại cảm biến quang học, thời gian trễ có thể xảy [9] Picot, J; Jones, J; Colquitt, JL; Gospodarevskaya, E;
ra giữa các phép đo glucose, do đó có thể dẫn đến lỗi hiệu Loveman, E; Baxter, L; Clegg, AJ (September 2009). "The
chỉnh. clinical effectiveness and cost-effectiveness of bariatric
Ngoài ra, các nhân tố bên ngoài như nhiệt độ cũng ảnh (weight loss) surgery for obesity: a systematic review and
hưởng đến kết quả dự đoán, đặc biệt với công nghệ cảm biến eonomic evaluation". Health technology assessment
quang học, vì việc thay đổi một vài độ cũng ảnh hưởng đáng (Winchester, England) 13 (41): 1–190, 21 –357, iii–
kể đến mức năng lượng của phổ hấp thụ. iv.doi:10.3310/hta13410. PMID 19726018.
Một điều quan trọng nhất là nguyên nhân đến từ tác dụng [10] Cash, Jill (2014). Family Practice Guidelines (3rded.).
sinh lí của con người. Sự khác biệt về sinh lí sẽ ảnh hưởng đến Springer. p. 396.ISBN 9780826168757.
độ tin cậy của công nghệ, vì chúng chủ yếu là do chuyển hóa [11] Anas Mazady, Electrical and Computer Engineering
cá nhân, thành phần máu, và lưu thông chất lỏng trong cơ thể Department,The University of Connecticut, Storrs, CT 06269-
quyết định. Các quang phổ hấp thụ chủ yếu là phát hiện phân 2157
tử glucose và glucose có thể phát hiện ở khắp mọi nơi trên cơ [12] Noninvasive glucose monitor,
thể. Do đó, rất khó có thể sản xuất được một mô hình bao https://en.wikipedia.org/wiki/Noninvasive_glucose_monitor
quát, có thể thường xuyên tự hiệu chuẩn sử dụng duy nhất cho [13] Overview of Non-Invasive Fluid Glucose
tất cả mọi người. Measurement Using Optical Techniques to Maintain
Glucose Control in Diabetes Mellitus, R. W. Waynant,
5. KẾT LUẬN Ph.D.* and V. M. Chenault, Ph.D., MT(ASCP)**, Food and
Hiện nay, trên thế giới, việc theo dõi đường huyết bằng Drug Administration; Center for Devices and Radiological
phương pháp xâm lấn vẫn đang là phương pháp phổ biến hơn Health; Office of Science and Technology* and Office of
cả. Mặc dù có nhiều bất lợi, nhưng đó vẫn là giải pháp ưu việt Device Evaluation**
cho tới hiện tại khi mà sự phát triển của thế hệ thứ tư – thế hệ [14] Akesh Govada, Ch Renumadhavi, K B Ramesh, “Non-
không xâm lấn vẫn còn nhiều tranh cãi và ý kiến trái chiều. Bài Invasive Blood Glucose Measurement”, International
viết này đã trình bày hầu hết các phương pháp không xâm lấn, Journal of Advanced Research in Computer and
đánh giá và so sánh, và nhận thấy rằng thực tế chưa có một Communication Engineering, Vol. 3, Issue 1, January 2014
thiết bị không xâm lấn nào có thể đáp ứng độ chính xác và [15] Chi-Fuk So, Kup-Sze Choi, Thomas KS Wong, Joanne
được áp dụng. Đứng trước những thách thức, việc tìm kiếm WY Chung, “Recent advances in noninvasive glucose
một phương pháp tối ưu, chính xác và phổ quát là một thành monitoring,”
công lớn, tạo lên một bước ngoặt lớn trong việc chăm sóc sức [16] Megha C.Pande, Prof.A. K. Joshi/International
khỏe trên toàn thế giới. Journal of Engineering Research and Applications (IJERA)
“Non-Invasive Optical Blood Glucose Measurement”.
6. THAM KHẢO
[1] "Diabetes Blue Circle Symbol". International Diabetes
Federation. 17 March 2006.
[2] "About diabetes". World Health Organization.
Retrieved 4 April 2014.
[3] "Diabetes Fact sheet N°312". WHO. October 2013.
Retrieved25 March 2014.
[4] Kitabchi, AE; Umpierrez, GE; Miles, JM; Fisher, JN
(Jul 2009). "Hyperglycemic crises in adult patients with
diabete."Diabetes Care 32 (7): 1335–43.doi:10.2337/dc09-
9032. PMC 2699725. PMID 19564476.
[5] Shoback, edited by David G. Gardner, Dolores (2011).
"Chapter 17".Greenspan's basic & clinical endocrinology
(9thed.). New York: McGraw-Hill Medical. ISBN 0-07-
162243-8.
145
145
Công nghệ nhúng trong thiết kế thiết bị đo điện tim có

chức năng phát hiện phức bộ QRS
Phạm Văn Nam, Trần Hoài Linh
Viện Điện,
Trường Đại học Bách Khoa Hà Nội
Email: pvnamdl1@gmail.com, linh.tranhoai@hust.edu.vn
Tóm tắt: Bài báo sẽ trình bày về thiết kế thiết bị sử dụng IC công Việc thu gọn thiết bị: phải thay thế các phần analog bằng
nghệ ARM (Advanced RISC Machine). Với khả năng tính toán xử lý số (như thay thế các bộ lọc số bằng các bộ lọc analog),
mạnh, thiết bị triển khai trực tuyến được thuật toán phát hiện vấn đề này có thể có hạn chế bởi tốc độ và tài nguyên của vi xử
phức bộ QRS của Hamilton và Tompkins. Ngoài ra, thiết bị còn lý. Nhưng hiện nay có các công nghệ chíp mới có tốc độ xử lý
có thêm các cổng giao tiếp mở rộng để kết nối với khối thu thập rất cao như ARM, FPGA, DSP, các dòng IC này có đủ tốc độ
tín hiệu điện tim, hay với khối tính toán chuyên dụng (như DSP, để thực hiện thuật toán lọc cũng như phát hiện phức bộ QRS
FPGA), tạo cơ sở áp dụng cho các bài toán nhận dạng tín hiệu đáp ứng thời gian thực. Nếu lượng tính toán quá lớn (đối với
ECG (Electrocardiogram), cũng như phát triển nên thành một các bài toán nhận dạng tín hiệu điện tim) thì có thể sử dụng
sản phẩm đo và nhận dạng tín hiệu điện tim có thể áp dụng vào thêm IC để xử lý song song. Trong bài báo thiết bị sẽ lựa chọn
thực tế. Thiết bị đã được thử nghiệm với bộ CSDL MIT-BIH [1]
cho được kết quả chính xác cao như thử nghiệm trên PC.
sử dụng công nghệ ARM.
Áp dụng thuật toán phát hiện phức bộ QRS của Hamilton
Từ khóa- tín hiệu ECG, hệ thống nhúng, tự động phát hiện. [1], áp dụng chạy trên thiết bị. Thử nghiệm trên bộ CSDL
Abstract: The paper presents a ECG portable design using ARM MIT-BIH, so sánh kết quả khi chạy trên PC.
IC technology. With its strong capability in programming and
performing mathematic operations, the device can integrate the II. THUẬT TOÁN PHÁT HIỆN PHỨC BỘ QRS
QRS detection algorithm proposed by Hamilton and Tompkins. Thuận toán phát hiện QRS này được Pan và Tompkins đưa
Additionaly, the device has an open design, which allows it to ra vào năm 1985 và được Hamilton và Tompkins phát triển tiếp
connect to different external ICs, such as DSP and FPGA for vào năm 1986 [1]. Năm 2002 tác giả đã thay đổi một vài thông
further increasing the calculation powers needed for recognition số để làm tăng độ chính xác và giảm được thời gian tính toán,
and classification tasks. The solution was tested with signals from thích hợp với việc nhúng chương trình xuống vi xử lý thay vì
MIT-BIH Arrhythmia Database and the performance is identical
chạy trên PC. Lưu đồ tổng thể hoạt động cơ bản của thuật toán
as the performance of the programs run on PC.
được trình bày trong Hình 1.
Keywords- ECG signals, embedded systems, auto detection.
Chữ viết tắt
Viết tắt Tiếng Anh Tiếng Việt

ECG Electrocardiogram Điện tim đồ
IC Intergrated Circuit Vi mạch tích hợp
QRS QRS Complex Phức bộ QRS
MIT-BIH MIT-BIH Database Cơ sở dữ liệu MIT-BIH
SD Secure Digital Thẻ nhớ SD
MMC Multi Media Card Thẻ nhớ MMC
I. ĐẶT VẤN ĐỀ
Một trong những mối quan tâm hàng đầu hiện nay là các
bệnh lý liên quan tới tim mạch. Việc phát hiện sớm bệnh là rất
quan trong trong điều trị, cho nên, hiện tại trên thị trường có
lưu hành một số loại thiết bị đo điện tim do nước ngoài sản
xuất, tuy nhiên giá thành của các thiết bị là khá cao. Ở Việt
Nam không phải ai cũng có khả năng trang bị cho mình những
thiết bị đắt tiền để kiểm tra bệnh tại nhà. Do đó việc nghiên cứu Hình 1. Sơ đồ hoạt động của thuật toán
chế tạo thiết bị đo điện tim cầm tay để kiểm tra tim mạch hàng
ngày là có tiềm năng. Sau đây là phần trình bày khái quát về các khối của sơ đồ
hoạt động của thuật toán của từng khối chính.
ISBN: 978-604-67-0635-9 146

146
HộiHội
ThảoThảo Quốc
Quốc Gia
Gia 2015về
2015 vềĐiện
ĐiệnTử,
Tử,Truyền
TruyềnThông
Thông và
và Công
CôngNghệ
NghệThông
ThôngTinTin
(ECIT 2015)
(ECIT 2015)
A. Khối lọc số hiệu ECG, như phân tích ở trên ta sẽ thiết kế hai bộ thông thấp
và thông cao, với hàm truyền có các hệ số giống như trong tài
liệu [3], kết quả được thực hiện trên phần mềm Matlab.
 Hàm truyền của bộ lọc thông thấp, với tần số cắt là
11Hz:
 y [n ]  2 y[ n  1]  y[n  2]  x[n ]  2 x[ n  5]  x[ n  10] 

 Hàm truyền của bộ lọc thông cao, với tần số cắt là
5Hz:
 y[ n ]  y[ n  1]  x[ n ]  x[ n  32]  
Trong Hình 5 là kết quả sau khi tín hiệu quá bộ lọc thông
Hình 2. Phân bố phổ năng lượng của tín hiệu ECG thấp 11Hz, thông cao 5Hz, ta nhận thấy tín hiệu này không còn
thành phần tần số cao, tín hiệu tập trung trong khoảng tần số từ
Theo Hình 2 thì phức bộ QRS chủ yếu tập trung lân cận tần 5Hz đến 11Hz, điều này thể hiện trong sơ đồ phân tích phổ
số 10 Hz [2]. Trong thuật toán phát hiện QRS của Hamilton và (Hình 6). Như vậy bộ lọc với các hệ số như trên công thức (1)
Tompkins đã sử dụng bộ lọc lấy dải trong khoảng tần số từ 5Hz và (2) là có thể sử dụng được.
đến 11Hz. Kết quả sau bộ lọc là y(n) (Hình 1) đã không còn
thành phần tần số thấp đặc trưng của sóng P, T hay trôi dạt
đường cơ bản, hay thành phần tín hiệu gây ra bởi nhiễu điện
lưới 50 Hz và nhiễu có tần số cao. Cho nên ta cần xây dựng bộ
lọc thông thấp có tần số cắt là 11Hz và bộ lọc thông cao có tần
số cắt là 5Hz. Hệ số của hai bộ lọc này đều là số nguyên bởi vì:
điều này cho phép thực hiện trên các bộ vi xử lý để đáp ứng tốc
độ xử lý nhanh theo thời gian thực, kết quả sau bước lọc là y(n)
sẽ được lưu lại để sử dụng cho khâu phát hiện đỉnh R sau này
[1], [3]. Hàm truyền của các bộ lọc được Hamilton sử dụng
như sau: Hình 5. Kết quả tín hiệu sau bộ lọc thông thấp với Fc là 11Hz và bộ
lọc thông cao Fc là 5Hz - y(n)
Hình 3. Một đoạn tín hiệu ECG gốc của bản ghi 100 trong bộ CSDL
MIT-BIH – x(n)
Hình 6. Phân bố phổ năng lượng của tín hiệu sau khi lọc
B. Xác định cửa sổ thời gian có chứa đỉnh R

Theo thuật toán xác định đỉnh R (Hình 1) thì sau khi bước
loại bỏ nhiễu bên ngoài khoảng 5 – 11Hz. Kết quả sau bộ lọc
nhiễu y(n) sẽ được xử lý tiếp qua các bước như sau:
 Lấy đạo hàm (d[ ]/dt): Tín hiệu điện tim ECG qua khâu
xử lý này sẽ làm nổi thêm phức bộ QRS, ngoài ra đạo
Hình 4. Phân bố phổ năng lượng của tín hiệu gốc hàm còn loại bỏ tiếp các sóng nhỏ và thành phần biến
thiên chậm như sóng T, P trong sóng ECG.
Trong Hình 3 là 1 đoạn tín hiệu ECG được trích ra từ bản
ghi 100 trong bộ CSDL MIT-BIH, tín hiệu này có thành phần  y[ n]  2 x[ n] + x[n  1]  x[n  3]  2 x[n  4]  
nhiễu 60Hz và nhiễu tần số cao, thể hiện trong sơ đồ phân tích
phổ (Hình 4), tiếp sau đây là bước loại bỏ các nhiễu này từ tín
147
147
 Xác định cửa sổ thời gian có chứa đỉnh R: Dự vào kết

quả đầu ra của bước lấy trung bình tín hiệu theo thời
gian z(n) để xác định sơ bộ thời điểm và khoảng thời
gian có chứa đỉnh R. Từ đó, tham chiếu trở lại tín hiệu
ECG sau lọc y(n), trong khoảng thời gian đó áp dụng
thuật toán tìm Max để xác định đỉnh R. Trong hình 4
thể hiện mối quan hệ lý tưởng giữa phức bộ QRS với
tín hiệu lấy trung bình theo thời gian z(n). Đỉnh R sẽ
Hình 7. Kết quả tín hiệu ECG sau phép tính đạo hàm
xuất hiện ở khoảng giữa sườn lên của xung trong tín
hiệu z(n). Từ thực nghiệm Hamilton, Tompkins lấy độ
Hình dạng của sóng ECG sau bước này gần như chỉ còn
rộng của cửa sổ từ 150 đến 250 ms [1].
các phức bộ QRS, nhiễu đã bị loại bỏ, thể hiện trong Hình 7
 Lấy trị tuyệt đối: Để không triệt tiêu thông tin khí sử
dụng phép toán lấy trung bình ở bước kế tiếp thì phải
làm dương giá trị. Năm 1986, Hamilton và Tompkins
[1] làm dương giá trị bằng phép toán bình phương,
cách bình phương này có thêm tác dụng làm nổi bật
những giá trị có biên độ cao như đỉnh R. Đến năm
2002 [3] tác giả đã thay bằng phép lấy trị tuyệt đối, nó
có ưu điểm làm giảm bớt thời gian tính toán mà vẫn
đạt được mục đích. Kết quả thể hiện trong Hình 8
Hình 10. Mối quan hệ giữa phức bộ QRS (a) và tín hiệu lấy trung bình
 y [ n ]  x[ n ]   tín hiệu theo thời gian (b)
Hình 8. Kết quả tín hiệu ECG sau phép tính trị tuyệt đối
 Lấy trung bình tín hiệu theo thời gian: Mục đích bước
này là nhập các đỉnh gần nhau lại (Hình 8) thành 1
dạng liền nhau giống như trong Hình 9, sử dụng kết Hình 11. Trích kết quả của thuật toán phát hiện phức bộ QRS trên
quả của bước này để tìm cửa sổ thời gian có có chứa phần mềm Matlab, đối với của bản ghi 100
đỉnh R. Với tần số lấy mẫu của bộ CSDL MIT-BIT là
200 sps thì tương ứng với 5ms/mẫu. Trong bài báo
III. TRIỂN KHAI PHẦN THIẾT BỊ
năm 1986[1] Hamilton, Tompkins đã sử dụng lấy trung
bình trong khoảng thời gian 160ms (tương ứng 32 mẫu),
A. Phân tích chức năng và lựa chọn linh kiện cho thiết bị
đến năm 2002 [3] tác giá đã giảm xuống còn 80ms
(tương ứng 16 mẫu), và bằng thực nghiệm chạy thử Chức năng chính của thiết bị được nghiên cứu và thiết kế
chương trình với tín hiệu điện tim bộ CSDL MIT-BIT trong bài báo này là thực hiện thuật toán phát hiện phức bộ
kết quả tách phức bộ QRS là chính xác hơn và có tốc QRS, chạy với bộ CSDL MIT-BIT. Ngoài ra, thiết bị còn có
độ xử lý nhanh hơn, thích hợp cho việc nhúng thuật thêm các kênh analog và kênh số để kết nối với module tính
toán xuống các dòng vi xử lý thông thường như PIC, toán tốc độ cao, với mục đích mở rộng để cho các bài toán
AVR, PSoC..: Kết quả sau bước lấy trung bình tín hiệu nhận dạng tín hiệu điện tim sau này và từ đó tạo cơ sở để xây
theo thời gian thể hiện trong Hình 9. dựng thiết bị đo và nhận dạng tín hiệu điện tim dùng đo cá
nhân, mang theo người thuận tiện. Thiết bị này được thiết kế
1 với một số yêu cầu và chức năng chính như sau:
 y[ n]  ( x[ n  15] + x[n  14]+...+x[n])  
16  Hiển thị các thông số đo được, vẽ lại đồ thị tín hiệu
điện tim trên màn hình thiết bị.
 Lưu trữ dữ liệu vào bộ nhớ thiết bị.
 Có khả năng kết nối trao đổi với máy tính.
 Thiết bị cầm tay, gọn nhẹ, sử dụng pin sạc.
 Có cổng giao tiếp mở rộng kết nối với khối thu thập
Hình 9. Kết quả tín hiệu ECG sau phép tính lấy trung bình theo thời
gian – z(n)
ECG và khối tính toán chuyên dụng như DSP, FPGA.
148
148
HộiHội Thảo
Thảo Quốc
Quốc Gia2015
Gia 2015về
vềĐiện
Điện Tử,
Tử,Truyền
Truyền Thông
Thông và
vàCông
CôngNghệ
NghệThông TinTin
Thông (ECIT 2015)
(ECIT 2015)
Sơ đồ tổng thể các khối chức năng cơ bản của thiết bị được  Bàn phím cảm ứng: Lựa chọn màn cảm ứng để được
trình bày trên hình 12. tận dụng không gian trên bề mặt của LCD mà không
tăng kích thước của thiết bị.
Hình 15. Hình ảnh của màn phím cảm ứng điện trở
 Giao tiếp với máy tính: Thiết bị có khả năng kết nối
với máy tính thông qua chuẩn RS232.
Hình 12. Sơ đồ khối của thiết bị

 Cổng giao tiếp mở rộng: thiết bị còn có thêm các kênh
analog để kết nối với các khối thu thập tính hiệu điện
Trong sơ đồ thiết bị chức năng cụ thể từng khối là: tim và kênh số để kết nối với khối tính toán tốc độ cao
sử dụng công nghệ FPGA/DSP.
 Vi xử lý trung tâm: Do yêu cầu về tốc độ tính toán nên
thiết bị lựa chọn vi xử lý trung tâm sử dụng công nghệ B. Lưu đồ thuận toán trên vi xử lý trung tâm
ARM là STM32F103, tốc độ 72MHz, có thư viện hỗ
trợ hầu hết các khối chức năng quan trọng như ADC,
giao tiếp UART, LCD...
Hình 13. Hình ảnh bên ngoài của IC STM32F103
 Màn hình: Để hiển thị giao diện điều khiển của thiết bị
cũng như có khả năng đưa thông tin về tín hiệu điện
tim đo được tới người quan sát thì phần giao diện sẽ sử
dụng màn hình Graphic LCD để có khả năng tái tạo
trực quan hơn hình ảnh của tín hiệu điện tim. Màn hình
lựa chọn là GLCD 160X160, có độ phân giải là
160  160, hoạt động theo chuẩn song song.
Hình 14. Hình ảnh của màn hình GLCD
 Lưu trữ: Thiết bị có khả năng lưu trữ dữ liệu vào trong
thẻ nhớ SD/MMC Card. Thông tin này sẽ dễ dàng
được đồng bộ với cơ sở dữ liệu trên máy tính nếu thiết
bị được bổ sung chức năng giao tiếp với máy tính. Hình 16. Lưu đồ thuật toán của chương trình trên vi xử lý ARM
149
149
HộiHội Thảo
Thảo Quốc
Quốc Gia2015
Gia 2015về
vềĐiện
Điện Tử,
Tử,Truyền
Truyền Thông
Thông và
vàCông
CôngNghệ
NghệThông TinTin
Thông (ECIT 2015)
(ECIT 2015)
Chương trình phần mềm nhúng xuống IC ARM, có lưu đồ B. Kết quả phần mềm
thuật toán được trình bày trong Hình 16, trong đó các hàm lọc Thiết bị đã được thử nghiệm trên record 100, 101, 102, 103,
số cũng như các hàm phát hiện phức bộ QRS dựa theo thuật 104, 105 trên bộ CSDL MIT-BIH, kết quả được trình bày trong
toán của Hamilton trong tài liệu số [1] và [3]. Thiết bị sử dụng bảng 1, và trích 1 phần kết quả chạy với record 105, trong
IC STM32F103 với tốc 72MHz, lõi xử lý Cortex-M3, nên dòng khoảng thời gian 4 (Hình 19).
IC này có tốc độ tính toán nhanh hơn rất nhiều so với các dòng
vi xử lý thông thường như PIC, AVR... Qua tính toán và thử
nghiệm thì thời gian cần cho 1 chu trình trên nhỏ hơn 100 µs,
nếu tốc độ lấy mẫu khoảng 200 sps, tương ứng với 5 ms trên 1
mẫu, như vậy thời gian cần cho 1 chu trình kể trên là rất nhỏ, vì
vậy ta còn dư nhiều thời gian để sử dụng có các thuật toán tiếp
theo như: trích chọn đặc tính, nhận dạng tín hiệu ECG… Ngoài
ra hiện hay trên thị trường đã ra mắt dòng ARM Cortex-M4,
với nhân xử lý sử dụng công nghệ DSP, tốc độ 168 MHz, tốc
độ rất nhanh, hoàn toàn có thể đảm bảo tốc độ để thực hiện
những thuật toán phức tạp, khối lượng tính toán lớn. (a)
IV. KẾT QUẢ TRIỂN KHAI
A. Phần cứng
Các thiết kế trên đây đã được thử nghiệm hoàn chỉnh trên
các phần mềm mô phỏng, các sơ đồ nguyên lý và thiết kế mạch
cứng sử dụng công nghệ ARM có tên là STM32F103, hình ảnh
của phần cứng thể hiện trong Hình 17, phần cứng đã được chạy
thử nghiệm với chương trình có lưu đồ thuật toán trong Hình (b)
16, kết quả chạy với bộ CSDL MIT-BIH được trình bày trong
bảng 1.
(c)
Hình 17. Mạch kit thử nghiệm với IC STM32F103
Thiết bị nhỏ gọn, được đóng trong vỏ có kích thước nhỏ

gọn có kích thước 10,5cm x 10,5cm x 2cm.
(d)
(a) (b)
(e)
Hình 18. Hình ảnh của thiết bị, (a) Mạch in đã lắp các linh kiện chính,
(b) Mạch in sau khi được đóng gói trong hộp nhựa có kích thước Hình 19. Hình ảnh sóng ECG qua các bước tính toán, (a) Tín hiệu gốc
10,5cm x 10,5cm x 2cm. (bản ghi 105), (b) Kết quả sau lọc và đạo hàm (c), Kết qua sau khi lấy
trị tuyệt đối, (d) Kết quả sau khi lấy trung bình tín hiệu, (e) Kết quả
phát hiện đỉnh R
150
150
HộiHội
Thảo Quốc
Thảo Gia
Quốc 2015
ĐiệnTử,
Tử,Truyền
NghệThông
ThôngTinTin (ECIT
(ECIT 2015)
2015)
Bảng 1: Kết quả thử nghiệm thiết bị trên CSDL MIT-BIH TÀI LIỆU THAM KHẢO
Record Tổng số Số nhịp không Số nhịp phát Sai số [1] P.S. Hamilton and W.J. Tompkins, “Quantitative investigation of QRS
detection rules using the MIT/BIH arrhythmia database,” IEEE Trans.
nhịp phát hiện được hiện sai (%)
Biomed Eng., vol. BME-33, pp. 1157-1165, 1986.
100 1901 1 1 0.1 [2] Thakor, N. V., Webster, J. G., and Tompkins, W. J. 1983. “Optimal QRS
101 1523 1 2 0.19 detector. Medical and Biological Engineering”, 343–50.
102 1820 1 0 0.05 [3] P.S. Hamilton and E.P. Limited, “Open Source ECG Analysis Software
104 1849 8 3 0.59 Documentation” (http://www.eplimited.com/), 2002.
105 2149 7 52 2.74 [4] Trần Đỗ Trinh (2003), “Hướng dẫn đọc điện tim”, Nhà xuất bản Y học.
[5] Friesen G. M., Jannett T.C., Jadallah M.A., Yates S.L., Quint S.R.,
Nagle H.T. (1990), “A comparison of the noise sensitivity of nine QRS
Kết quả trong bảng 1 cho thấy sai số rất nhỏ, riêng đối với detection algorithms”, IEEE Transactions on Biomedical Engineering,
bản ghi 105 có sai số lớn là do tín hiệu thu thập trong bản ghi vol. 37, no. 1, pp.85-98.
này bị trôi đường cơ sở quá lớn, có thể do sự tiếp xúc giữa điện [6] Goldberger A.L, Amaral L.A., Glass L., Hausdorff J.M., Ivanov P.C.,
cực với người là không tốt trong quá trình lấy mẫu. Mark R.G., Mietus J.E., Moody G.B., Peng C.K., Stanley H.E. (2000),
“PhysioBank, PhysioToolkit, and PhysioNet: components of a new
research resource for complex physiologic signals”, American Heart
V. KẾT LUẬN VÀ HƯỚNG PHÁT TRIỂN Association.
Bài báo đã trình bày về một thiết kế mạch đo sử dụng IC [7] Luong Duong Trong, Nguyen Duc Thuan, Trinh Quang Duc (2014),
“Removal of baseline noise from Electrocardiography (ECG) signal
ARM. Áp dụng thuận toán phát hiện QRS [1], [3]. Qua kết quả based on time domain approach“, International Journal of Biomedical
thử nghiệm với một vài tín hiệu điện tim trong bộ CSDL của Science and Engineering, Published online, pp. 11-16.
MIT-BIT Arrhythmia Database cho thấy kết quả tương đương. [8] http://www.physionet.org/physiobank/database/mitdb/
Dự kiến có thể bổ sung các chức năng khác cho thiết bị như:
thêm phần thu thập tín hiệu ECG, triển khai thêm thuận toán
nhận dạng tín hiệu điện tim, ngoài ra phần cứng có thể thêm
chức năng kết nối không dây với máy tính theo chuẩn Wifi
hoặc Bluetooth, kết nối mạng theo chuẩn Ethernet,..
151
151
Phương Pháp Tham Số Cho Bài Toán Ước

Lượng Thời Gian Trễ Thay Đổi Theo Thời
Gian Giữa Hai Tín Hiệu Điện Cơ
Lưu Gia Thiện∗ , Trần Trung Duy∗ Tân Hạnh∗ Lê Quang Phú∗
∗
Cơ Sở TP. Hồ Chí Minh
Email: {lgthien, trantrungduy, tanhanh,phulq}@ptithcm.edu.vn
Tóm tắt—Vận tốc dẫn của tín hiệu điện cơ-Muscle Fiber những vấn đề về giải phẫu và những thay đổi trong thể
Conduction Velocity (MFCV) dựa trên ước lượng thời gian tích truyền dẫn điện thế hoạt động, việc này ảnh hưởng
trễ giữa các kênh ghi âm điện cơ dán trên bề mặt da. Nhằm tới việc ước lượng vận tốc dẫn truyền của sợi cơ. Điều
xét đến sự biến đổi của vận tốc tín hiệu điện cơ trong điều
này đặc biệt đúng trong điều kiện co cơ dynamic (những
kiện thường gặp hằng ngày, chúng tôi giả định rằng thời
gian trễ giữa các kênh thay đổi theo thời gian. Trong bài điều kiện thường gặp hàng ngày nhất ), trong đó có cả
báo này, phương pháp ước lượng hợp lý cực đại-Maximum lực và tư thế của cánh tay đòn đều thay đổi. Trong trường
LikeliHood Estimation (MLE) cho thời gian trễ giữa hai hợp đó, ba yếu tố chính ảnh hưởng đến tín hiệu sEMG :
kênh tín hiệu điện cơ theo một mô hình đa thức được đầu tiên là thuộc tính không dừng của tín hiệu, thứ hai
chứng minh. Mô phỏng Monte Carlo được thực hiện ở các là sự thay đổi trong tính dẫn của các mô ngăn cách điện
mức nhiễu khác nhau để đánh giá tác động của nhiễu lên
cực và sợi cơ. Cuối cùng là sự thay đổi tương đối của
các phương pháp các ước lượng. Ước lượng hợp lý cực
đại dẫn đến một bài toán tối ưu, trong bài báo này chúng vị trí các điện cực đối với nguồn gốc của điện thế hoạt
tôi dùng phương pháp NewTon và phương pháp giả luyện động.
kim cho việc tối ưu hóa. Thời gian trễ với mô hình bất kỳ Yếu tố đầu tiên (tính không dừng) đã được nghiên cứu
cũng đã được nghiên cứu bằng cách cắt sự thời gian trễ trong [2] bằng cách xem xét các mô hình độ trễ biến
này thành nhiều lát. Cách tiếp cận này sẽ cho kết quả tốt thiên theo thời gian giữa các nguồn tín hiệu điện cơ
nhất khi so sánh với những phương pháp khác khác.
dừng ( mật độ phổ công suất không đổi theo thời gian
Từ khóa—Vận tốc tín hiệu điện cơ, độ trễ thay đổi theo
thời gian, mỏi cơ, tín hiệu điện cơ. ). Công việc này vẫn còn bị giới hạn ở trường hợp hai
kênh.
Trong một bài báo gần đây [6] , thời gian trễ không đổi (
I. GIỚI THIỆU
hằng số) giữa hai kênh đã được nghiên cứu bằng phương
Vận tốc truyền dẫn sợi cơ là một chỉ số sinh học quan pháp tương quan chéo tổng quát(GCC) [7]. Phương pháp
trọng, liên quan tới bệnh thần kinh, cơ, mệt mỏi [1] và tổng quát này bao gồm các bộ tiền lọc có tác dụng cải
sự đau [2]. Nó có thể được sử dụng trong việc chuẩn thiện kết quả ước lượng nhưng nó đòi hỏi biết trước về
đoán các rối loạn thần kinh, ví dụ như việc theo dõi phổ công suất của nhiễu và các tín hiệu. Trong trường
bệnh thoái hóa cơ thần kinh được nghiên cứu bởi [3], hợp dữ liệu thực tế, phổ công suất phải được ước lượng.
việc đánh giá sự đau trong trường hợp viêm xơ cơ trong Trong nghiên cứu này, việc ước lượng thời gian trễ thay
[4]. Chỉ số này được sử dụng rộng rãi trong các nghiên đổi theo thời gian (Time varying delay-TVD) sẽ được
cứu cơ bản về điều khiển thần kin vận động ( cơ chế nghiên cứu nhưng vẫn còn hạn chế với trường hợp hai
đốt cháy các MU theo lực); nghiên cứu sự mỏi) được kênh.
ứng dụng trong lĩnh vực sinh lý học thể thao. Phương pháp ước lượng thời gian trễ biến thiên theo
Tốc độ dẫn truyền tín hiệu điện cơ đối với người lớn thời gian tối ưu có thể được dẫn ra với phương pháp
không có bệnh lý về thần kinh cơ thường từ 2 đến 8m/s ước lượng hợp lý cực đại (MLE). Tuy nhiên, cách tiếp
[5] . Những khác biệt về giá trị có thể được giải thích cận này không thể sử dụng trực tiếp bởi vì các phương
bởi đặc điểm giải phẩu và sinh lý với mức độ kích hoạt pháp MLE dẫn đến một vấn đề tối ưu hóa trong không
thần kinh cơ khác nhau. gian N chiều, ở đó N là số mẫu của tín hiệu: một giá
Tín hiệu điện cơ bề mặt phải chịu một số hạn chế do trị thời gian trễcần phải được ước lượng với mỗi giá
152
ISBN: 978-604-67-0635-9 152

trị thời gian, N là số tham số cần phải ước lượng. Một như tuyến tính hay là hàm mũ đã được quan sát trong
cách khác với phương pháp MLE là phải giảm đáng kể thí nghiệm mà trong đó lực tăng lên với nhiều mức khác
số lượng thông số cẩn phải ước lượng. Trong bài báo nhau. Sự mô hình hóa những biến thiên này là rất thú vị
này, chúng tôi chọn mô hình TVD với một hàm đa thức vì nó cho phép mô hình hóa những biến thiên đã biết.
có tham số p. Điều này có thể được thực hiện nhờ vào Trong [13], một mô hình của vận tốc tín hiệu điện cơ
định lý Weierstrass nhằm đảm bảo rằng bất kỳ hàm liên đã được đề nghị, tuy nhiên nó không phản ánh hiệu quả
tục nào cũng có thể được xắp xỉ bằng một hàm đa thức. thực của các phương pháp trong trường hợp tăng tốc và
Vì vậy, thay vì ước lượng thời gian trễ tại mỗi thời điểm, giảm tốc nhanh trong các loại co cơ khác nhau [5]. Vì
chỉ cần ước lượng p hệ số của đa thức. Một hàm TVD vậy, cần thiết đưa vào nhiều mô hình khác nhau biểu
bất kỳ cần phải được ước lượng với một giá trị khá lớn diễn các tình huống khác nhau. Trong đề tài này, một
của p. Tại giai đoạn này, sự thỏa hiệp giữa các giá trị mô hình sin nghịch đảo và mô hình đa thức của thời
bậc p và các giá trị tính toán phải được xem xét. Một gian trễ đã được đề nghị, cho phép tạo ra các mô hình
giá trị p thấp dẫn đến một lỗi không phù hợp giữa mô của vận tốc tín hiệu điện cơ.
hình và hàm TVD thực tế. Một giá trị p cao phải chịu 1) Mô hình sin nghịch đảo: Trong nghiên cứu này,
thời gian tính toán cao và các vấn đề hội tụ. mô hình sin nghịch đảo TVD được định nghĩa theo công
Vì những lý do này, chúng tôi đề nghị cắt hàm thời gian thức 2
trễ thành nhiều lát cắt, mỗi lát cắt là một mô hình đa 5.10−3
thức bậc 1 (tuyến tính) và bậc 2 đã được sử dụng. θs (n) = Fs (2)
5 + 3 sin(0, 2n.2π/Fs )
Kết quả sẽ được biểu diễn bằng mô phòng Monte-Carlo
theo sai số căn quân phương (RMSE) của những phương Mô hình này được đề cập trong [5]. Nó tính đến các
pháp ước lượng theo các tham số (Mô hình của thời gian thay đổi sinh lý hàng ngày của vận tốc truyền dẫn sợi
trễ, phương pháp, độ dài của lát cắt). cơ có thể gặp phải trong các tình huống tập luyện. Cụ
II. MÔ HÌNH CỦA THỜI GIAN TRỄ VÀ TÍN HIỆU thể giá trị MFCV nhỏ nhất và lớn nhất tương ứng là
GIẢ 2m/s và8m/s. Gia tốc tối đa là 2.5m/s2. Một chu kì
sin tương ứng 5s hoặc tương đương khoảng 10000 mẫu
A. Mô hình của tín hiệu
tín hiệu. F s : tần số lấy mẫu.
Xét tín hiệu điện cơ bề mặt s (n) lan truyền giữa kênh 2) Mô hình đa thức: TVD với một mô hình bất kỳ
1 và kênh 2, một mô hình phân tích đơn giản của hai có thể được phân tích thành một mô hình đa thức bậc
tín hiệu quan sát được x1 (n) và x2 (n) trong miền thời p theo định luật Weierstrass.
gian rời rạc, không có sự khác biệt hình dạng, công thức p
1. θp (n) = Fs θk .nk (3)
k=0
x1 (n) = s(n) + w1 (n)
(1) Do đó TVD được định nghĩa bởi một vector tham số có
x2 (n) = s(n − θ(n)) + w2 (n)
kích thước p+1 với Θ = [θ0 θ1 θ2 ....θp ] .
Trong đó là thời gian trễ dẫn truyền giữa hai tín hiệu; C. Tạo tín hiệu giả
w1 (n) và w2 (n) là nhiễu Gauss, giả định độc lập; trị
trung bình bằng 0; phương sai σ 2 . Mỗi giá trị θ(n) được Tín hiệu trễ được tạo ra theo phân tích mô hình mật
ước lượng, vận tốc dẫn truyền có thể đơn giản được suy độ phổ công suất (Power Spectral Density-PSD) theo
ra bởi công thức M F CV (n) = ∆e/θ(n) , trong đó ∆e công thức 4, đã được nghiên cứu trong [14]
là khoảng cách giữa các điện cực, giá trị của nó là 5mm. kfh4 f 2
Tần số lấy mẫu F s = 2048Hz. P SD(f ) = 2 (4)
(f 2 + fl2 ).(f 2 + fh2 )
B. Mô hình của TVD Một ví dụ về hình dạng của PSD của tín hiệu EMG bề
Để đánh giá hiệu quả của các phương pháp ước lượng, mặt trên hình 3.1a. Trong đó tham số tần số thấp và cao
tín hiệu giả đã được tạo ra và áp đặt vào hai tín hiệu được cố định tương ứng với fl = 60Hz và fh = 120Hz
giả một thời gian trễ. Sự biến thiên của vận tốc tín hiệu . k là thừa số chuẩn hóa. Kênh đầu tiên được tạo ra bằng
điện cơ phụ thuộc vào nhiều yếu tố, loại cơ đang nghiên cách lọc tuyến tính nhiễu Gauss trắng với đáp ứng xung
cứu, loại co cơ ( static hay dynamic) theo [8],[9],[10] tương ứng với PSD này (tức là biến đổi Fourier ngược
loại thí nghiệm ( thí nghiệm về sự đau hay sự mệt mỏi của căn bậc 2 PSD ở trên theo công thức 4). Một khi
) trong [11]. Vì vậy, nhiều mô hình được mô tả trong kênh thứ nhất được tạo ra, phiên bản trễ của nó được
các nghiên cứu trước đây. Trong [12], sự biến đổi gần tạo ra nhờ phép nội suy sinc theo như công thức
153
153
refeq:4, đã nghiên cứu trong [15]. Tham số p là chiều định nghĩa như sau:
dài bộ lọc và chọn cố định là 40. Cuối cùng, cả hai kênh
2
đều bị thêm vào nhiễu trắng cộng với một mức tỉ số tín (x1 , x2 ; θ; s) = p (x1 , x2 ; θ; s) = p (xi (n) ; θ)
hiệu trên nhiễu cho trước. Hình 1 cho thấy 200 mẫu đầu 2
i=1
−N
tiên trong 10000 mẫu tín hiệu EMG giả được thực hiện = (2πσ) 2
N
và thời gian trễ của nó tại 20dB. Thời gian trễ là một 2 N
2
hàm đa thức bậc 3 được mô tả trong hình 1. exp − 2σ1 2 (x1 (n) − s (n)) + (x2 (n − θ (n)) − s (n))
n=1 n=1
p (6)
s(n − θ(n)) = sin c(i − θ(n))s(n − i) (5) Lấy ln cùa hàm "LikeliHood" ta được hàm "Log Like-
i=−p
lihood".
ln (x1 , x2 ; θ; s)
TH, SNR = 20dB N
2
=− (x1 (n) − s (n))
1 n=1 (7)
(a)
N
BDCH
2
− (x2 (n − θ (n)) − s (n))
0 n=1
−1 Ước lượng của θ(n) có thể được thực hiện thông qua
0 50 100 150 200 ước lượng của s(n) vốn đạt được bằng cách cho đạo
SM hàm bậc nhất theo s(k) của hàm log-likelihood bằng
1 không, với 0 ≤ k ≤ N . Đạo hàm bậc nhất của hàm
Log-likelihood
PSDCH
(b)
0.5 ∂ ln Λ(x1 ,x2 ;θ;s)
∂s(k) (8)
0 = 2[x1 (k) − s(k)] + 2[x2 (k + θ(k)) − s(k)]
0 100 200 300 400
TS (HZ) Tối đa hóa hàm log-likelihood bằng cách cho biểu thức
5 8 triệt tiêu, ta có:
TVD (M)
(c)
∂ln (x1 , x2 ; θ; s) x1 (k) + x2 (k − θ(n))
= 0 => s
(k) =
∂s (k) 2
0 (9)
0 2000 4000 6000 8000 10000
SM Thay thế s (n) bằng ŝ (n) vào biểu thức 7, chúng ta thu
được
N
Hình 1. Tín hiệu giả (màu xanh da trời) và phiện bản trễ của nó 1 2
(màu đỏ), b) PSD chuẩn hóa. c) TVD với mô hình đa thức bậc 3, ln (x1 , x2 ; θ; s) = − (x2 (n − θ (n)) − x1 (n))
θ = [2.8627, −4.1246, 2.4526, −0.3337]. SM: số mẫu, PSDCH:
2 n=1
PSD chuẩn hóa, BDCH: biên độ chuẩn hóa (10)
, SNR: tỉ số tín hiệu trên nhiễu.
Tối đa hóa hàm log-likelihood tương đương tối thiểu
biểu thức dưới đây.
III. PHƯƠNG PHÁP
θ = arg min e2t (θ) (11)
A. Chứng minh lý thuyết θ
Trong đó
Giả định tín hiệu điện cơ bề mặt s (n) lan truyền giữa
kênh 1 và 2. Hai tín hiệu quan sát được x1 (n) và x2 (n) N
2
trong miền thời gian rời rạc theo mô hình 1. Ước lượng e2t (θ) = (x2 (n − θ(n)) − x1 (n)) (12)
thời gian trễ theo phương pháp MLE có nghĩa là tối đa n=1
hóa "LikeliHood", chính là hàm mật độ xác suất của tín Bài toán ước lượng θ(n) trở thành bài toán ước lượng
hiệu quan sát được với các thông số cần phải ước lượng, vecto N thông sô θ = [θ (1) θ (2) ...θ (N )]. Với mô hình
Xuất phát từ tính chất độc lập nhiễu trắng Gauss, nên TVD đa thức theo công thức 3, bài toán trở thanh bài
hai tín hiệu độc lập với nhau, hàm ’LikeliHood’ được toán ước lương vecto p+1 thông số θ = [θ0 θ1 θ2 ....θp ],
154
154
có nghĩa là số thông số cần phải ước lượng giảm đi rất trong công thức 3. Các tham số đa thức tìm được
nhiều. Trong nghiên cứu này, chúng tôi sử dụng phương là θ4 = [1.9125, −0.3475, 0.9366, −0.7187, −0.1051).
pháp Newton để tìm cực tiểu của hàm e2t (θ). Tín hiệu giả được tạo ra bằng cách sử dụng tham số đa
thức này thay vào công thức 3, sau đó áp đặt vào hai
B. Tối ưu hóa bằng phương pháp Newton kênh. Hình 2a biểu diễn ước lượng TVD sử dụng phương
Phương pháp Newton-Raphson và các cải biến của pháp Newton và phương pháp “phase coherency”. Hình
nó có lẽ là phương pháp phổ biến nhất được sử dụng 2b biểu diễn sai số căn quân phương (RMSE-root mean
để tìm nghiệm. Từ một nghiệm x1 ước lượng ban đầu square error) của các phương pháp ước lượng được tính
của hàm f (x), nghiệm ước lượng x2 tiếp theo là giao toán bằng mô phỏng Monte Carlo. Lưu ý rằng phương
điểm của tiếp tuyến tại điểm [x1 , f (x1 )] với trục hoành pháp Newton đem lại kết quả tốt hơn phương pháp
Ox. Ước lượng nghiệm x3 tiếp theo sẽ là giao điểm của “phase coherency”( ngoại trừ lúc bắt đầu các tín hiệu
tiếp tuyến tại điểm [x2 , f (x2 )] với trục x như trong hình ). Kết quả này được dự đoán trước bởi vì phương pháp
III-B. Quá trình này có thể được lặp đi lặp lại cho đến Newton tìm kiếm một mô hình đa thức có cùng bậc
khi đạt được sai số mong muốn. với đa thức lý thuyết. Ngược lại, phương pháp “phase
coherency” không chú ý đến mô hình của thời gian trễ.
B. Mô hình sinh nghịch đảo

Trong trường hợp này, TVD sử dụng mô hình sin
nghịch đảo thể hiện trong mô hình công thức 2. Hình
4 a cho thấy ước lượng TVD sử dụng phương pháp
Newton và phương pháp “phase coherency”. Phương
pháp newton dựa trên ước lượng TVD đa thức bậc 4
không tương thích với mô hình sin nghịch đảo. Hình 4
b cho thấy sai số căn quân phương (RMSE- root mean
square error) của ước lượng được tính toán bằng mô
phỏng Monte Carlo. Trong trường hợp này, phương pháp
“phase coherency” có kết quả tốt hơn so với phương
pháp Newton ngoại trừ các lát cắt thời gian nhỏ, nơi
mà các mô hình đa thức phù hợp với TVD lý thuyết.
Hình 2. Hình minh họa phương pháp Newton
Kết luận cho các thử nghiệm này, các giá trị RMSE chủ
yếu do mô hình không tương thích hơn là lỗi do phương
IV. KẾT QUẢ MÔ PHỎNG pháp ước lượng. Một cách khác có thể cải thiện ước
lượng là tăng bậc đa thức nhằm làm giảm các sai số
Một mô phỏng Monte-Carlo với 100 lần chạy độc lập
do mô hình không tương thích. Tuy nhiên, phương pháp
được thực hiện cho mỗi giá trị SN R để nghiên cứu tác
này có hai nhược điểm :
động của nhiễu với các ước lượng. Trong luận văn này,
2 tín hiệu EMG giả có cùng giá trị SNR tương ứng lần • Vi các biến thiên của TVD không thể được biết
lượt là 10, 20, 30, 40dB với thời gian quan sát tín hiệu trước, số bậc thích hợp của hàm đa thức không thể
là 5s. Trong đề tài này chúng tôi sử dụng phương pháp được chọn. Do đó, ước lượng bậc của mô hình thích
Phase-Coherency(CohF) được phát triển trong [5] như hợp là một nhiệm vụ khó khăn.
là phương pháp tham chiếu nhằm so sánh với kết quả • Một hàm đa thức bậc cao đảm bảo một sự tương
của phương pháp đề xuất trong nghiên cứu này. thích tốt giữa thời gian trễ thực tế và hàm mô hình
nhưng thời gian tính toán sẽ tăng lên. Khi bậc đa
A. Mô hình đa thức thức tăng lên, các phương pháp tối ưu Newton trở
Các tham số của mô hình đa thức TVD ở công nên nan giải.
thức 3 được cố định để phù hợp với mô hình sin Ý tưởng đề xuất cho vấn đề này chia tín hiệu ra thành
nghịch đảo TVD theo công thức 2 trong ý nghĩa sai nhiều đoạn nhỏ, khi đó các đa thức bậc nhỏ là đủ tương
số quân phương -Mean square error(MSE) ( tức là thích với mô hình thời gian trễ lý thuyết, mô hình bậc
các tham số này là vị trí xảy ra cực tiểu của sai 1 và bậc 2 đã được thử nghiệm trong những lát cắt thời
số căn quân phương giữa TVD trong công thức 2 và gian như vậy. Chiều dài của mỗi lát cắt tương ứng được
155
155
SNR= 20 dB SNR=20 dB
5
TVDLT (a) 5 TVDLT
CohF NewTon
4
RM SE (m )
Newton 4 CohF
3 (a)
TVD(m)
3
2
2
1
0 2000 4000 6000 8000
SM 1
0 2000 4000 6000 8000
SM
SNR=20 dB SNR=20 dB
0.2
(b) 0.2
CohF (b) CohF
Newton Newton
0.15 0.15
(b)
RM SE (m )
0.1
0.1
0.05
0.05
0 2000 4000 6000 8000 0
0 2000 4000 6000 8000
SM
SM
Hình 3. TVD (a) và RMSE (b) phụ thuộc thời gian (số mẫu:SM);
Hình 4. TVD (a) và RMSE (b) phụ thuộc vào thời gian; thời gian trễ
TVD lý thuyết là mô hình đa thức bậc 4 ( màu hồng) và ứớc
theo lý thuyết là mô hình sin nghịch đảo ( màu đen ) và ước lượng
lượng trung bình của nó bằng phương pháp “phase coherency”
trung bình bằng phương pháp “Phase coherency” ( màu đỏ) và phương
( màu đỏ) và phương pháp Newton ( màu xanh dương) tham
pháp Newton ( màu xanh dương)
số θ 4 = [1.9125, −0.3475, 0.9366, −0.7187, −0.1051],m: mẫu;
TCDLT: TVD lý thuyết;
tiếp cận tuyến tính. Các thí nghiệm khác đã được thực
chọn là 128 và 1024 mẫu. Các tham số hàm tuyến tính hiện bằng cách đánh giá tác động của nhiễu lên kết quả.
và parabol được ước lượng cho mỗi lát độc lập bằng Để có được kết quả chính xác hơn, RM SE trung bình
phương pháp Newton, tương ứng. Sau đó, các hàm ước trên toàn độ dài của tín hiệu đã được tính toán cho mỗi
lượng được dán vào nhau từng đoạn một. Do tính không mức nhiễu. Hình 6 hiện thị các kết quả theo giá trị SNR.
liên tục của TVD sau khi xây dựng lại, một bộ lọc thông Kết quả của phương pháp “phase coherency” và phương
thấp, pha bằng không và 300 bậc với tần số cắt bằng pháp Newton cũng được hiện thị để so sánh với phương
3Hz đã được sử dụng. pháp đề xuất.
Hình 5 cho thấy RM SE phụ thuộc thời gian của phương Một lần nữa, chiều dài lát ngắn hơn, kết quả tốt hơn.
pháp “phase coherency”, và cho phương pháp Newton Điều này đúng cho giá trị SNR cao. Trong trường hợp
xem xét với các ước lượng tuyến tính hoặc parabol cho nhiễu mạnh (SNR=10dB), kết quả thì khá giống nhau
từng lát cắt, tại SN R = 20dB. Kết quả cho thấy chiều bất kể chiều dài lát cắt : chiều dài lát cắt là 128 mẫu
dài lát cắt nhỏ (128 mẫu) thì thích hợp hơn là một lát dài làm cho các thông số mô hình ước lượng nhạy cảm hơn
( 1024 mẫu). Hơn nữa, phương pháp parabol gần như với nhiễu so với 1024 mẫu. Sử dụng mô hình parabol
không cải thiện kết quả đáng kể so với phương pháp thay vì mô hình tuyến tính trở nên phù hợp hơn cho các
156
156
giá trị SNR cao và cho lát dài.

0.2 SNR=20 dB Các kết quả quan trọng là độ lợi thu được bằng các
TT 128 chiến lược lát cắt so với mô hình đa thức bậc 4. Trong
TT 1024 đó RM SE giảm khoảng 0.2 mẫu cho giá trị SNR từ
parabol 128 10 − 40dB , RMSE giảm từ 0.15 mẫu tại 10dB đến
0.15 0.01 mẫu tại 40dB với chiều dài lát cắt 128 mẫu đối
parabol 1024
với phương pháp ước lượng bằng lát cắt tuyến tính .
RM SE(m )
Các RM SE với phương pháp “phase coherency” có xu

0.1 hướng giảm với việc tăng giá trị SN R nhưng nhiều hơn
khoảng 0.05 mẫu. Kết luận, mô hình không phù hợp với
T V D thực tế có thể được giải quyết với một mô hình
đa thức bậc thấp của dữ liệu cắt lát cắt. Chiến lược này
0.05 có thể có lợi để áp dụng cho bất kỳ mô hình T V D liên
tục nào.
V. KẾT LUẬN
0
0 2000 4000 6000 8000 10000 Phương pháp ước lượng hợp lý cực đại kết hợp với
SM phương pháp Newton cho việc ước lượng thời gian trễ
thay đổi được áp dụng cho tín hiệu sEMG giả để ước
Hình 5. RMSE theo thời gian (số mẫu:SM); Phương pháp Newton với lượng vận tốc dẫn truyền của tín hiệu điện cơ . Đầu
ước lượng tuyến tính bằng lát cắt 128 và 1024 mẫu ( xanh dương và
xanh lá cây tương ứng). Phương pháp Newton với ước lượng parabol tiên sự xấp xỉ một mô hình TVD sin nghịch đảo với
vơi lát cắt 128 và 1024 mẫu ( màu xanh dương, nét đứt và màu xanh một mô hình đa thức bậc 4 cho việc tạo tín hiệu giả.
lá cây, nét đứt tương ứng) Thứ hai, TVD được đề xuất cắt thành nhiều lát ( với
sự xấp xỉ tuyến tính và parabol) và khi đó TVD được
ước lượng bằng các lát cắt. Các phương pháp đề xuất cải
thiện việc ước lượng thời gian trễ với mức tăng độ chính
0.25 xác ít nhất 0.05 mẫu khi so sánh với các phương pháp
MLE cổ điển và với phương pháp phase coherency.
0.2 TÀI LIỆU THAM KHẢO
TT 128 [1] R. Merletti and L. L. Conte, “Surface emg signal processing

RM SE T B (m )
parabol 128 during isometric contractions.” J Electromyogr Kinesiol, vol. 7,

0.15 no. 4, pp. 241–250, Dec 1997.
parabol 1024 [2] D. Farina, L. Arendt-Nielsen, R. Merletti, and T. Graven-
TT 1024 Nielsen, “Effect of experimental muscle pain on motor
0.1 unit firing rate and conduction velocity.” J Neurophysiol,
CohF
vol. 91, no. 3, pp. 1250–1259, Mar 2004. [Online]. Available:
Newton http://dx.doi.org/10.1152/jn.00620.2003
[3] D. C. Allen, R. Arunachalam, and K. R. Mills, “Critical illness
0.05 myopathy: further evidence from muscle-fiber excitability studies
of an acquired channelopathy.” Muscle Nerve, vol. 37, no. 1, pp.
14–22, Jan 2008.
[4] B. Gerdle, N. Ostlund, C. Grnlund, K. Roeleveld, and J. S.
0 Karlsson, “Firing rate and conduction velocity of single motor
10 20 30 40 units in the trapezius muscle in fibromyalgia patients and healthy
SNR (dB) controls.” Journal of Electromyography and Kinesiology, vol. 18,
no. 5, pp. 707–716, Oct 2008.
[5] F. Leclerc, “Dloppement d’outils non-stationnaires pour la
Hình 6. Giá trị RMSE trung bình (RMSETB) theo theo giá trị SNR mesure de dis variables appliquux signaux bioctriques,” Ph.D.
. Phương pháp Newton với ước lượng tuyến tính (TT) bằng lát cắt dissertation, UNIVERSITORLNS, 2008.
128 và 1024 mẫu ( xanh dương và xanh lá cây tương ứng ). Phương [6] P. Ravier, G.-T. Luu, M. Jabloun, and O. Buttelli, “Do the
pháp Newton với ước lượng parabol bằng lát cắt 128 và 1024 mẫu generalized correlation methods improve time delay estimation
(màu xanh dương, nét đứt và màu xanh lá cây, nét đứt tương ứng); of the muscle fiber conduction velocity?” in Proceedings of the
Phương pháp “phase coherency” (đo); Phương pháp Newton với ước 4th International Symposium on Applied Sciences in Biomedical
lượng bậc 4 ( xanh lá cây, nét lớn ). and Communication Technologies, ser. ISABEL ’11. New York,
NY, USA: ACM, 2011, pp. 181:1–181:5.
157
157
[7] C. Knapp and G. Carter, “The generalized correlation method of neural strategies from the surface emg.” J Appl Physiol,
for estimation of time delay,” IEEE Transactions on Acoustics, vol. 96, no. 4, pp. 1486–1495, Apr 2004. [Online]. Available:
Speech, and Signal Processing, vol. 24, no. 4, pp. 320–327, 1976. http://dx.doi.org/10.1152/japplphysiol.01070.2003
[8] C. Krogh-Lund and K. Jørgensen, “Changes in conduction ve- [12] D. Farina, L. Arendt-Nielsen, R. Merletti, and T. Graven-Nielsen,
locity, median frequency, and root mean square-amplitude of the “Assessment of single motor unit conduction velocity during sus-
electromyogram during 25brachii muscle, to limit of endurance.” tained contractions of the tibialis anterior muscle with advanced
Eur J Appl Physiol Occup Physiol, vol. 63, no. 1, pp. 60–69, spike triggered averaging.” J Neurosci Methods, vol. 115, no. 1,
1991. pp. 1–12, Mar 2002.
[9] L. Arendt-Nielsen, K. R. Mills, and A. Forster, “Changes in [13] F. Leclerc, P. Ravier, O. Buttelli, and J.-C. Jouanin, “Compar-
muscle fiber conduction velocity, mean power frequency, and ison of three time-varying delay estimators with application to
mean emg voltage during prolonged submaximal contractions.” electromyography,” in Proceeding of EUSIPCO, 2007.
Muscle Nerve, vol. 12, no. 6, pp. 493–497, Jun 1989. [Online]. [14] D. Farina and R. Merletti, “Comparison of algorithms for estima-
Available: http://dx.doi.org/10.1002/mus.880120610 tion of emg variables during voluntary isometric contractions.”
[10] M. Lowery, P. Nolan, and M. O’Malley, “Electromyogram me- J Electromyogr Kinesiol, vol. 10, no. 5, pp. 337–349, Oct 2000.
dian frequency, spectral compression and muscle fibre conduc- [15] Y. Chan, J. Riley, and J. Plant, “Modeling of time delay and
tion velocity during sustained sub-maximal contraction of the its application to estimation of nonstationary delays,” Acoustics,
brachioradialis muscle.” J Electromyogr Kinesiol, vol. 12, no. 2, Speech, and Signal Processing [see also IEEE Transactions on
pp. 111–118, Apr 2002. Signal Processing], IEEE Transactions on, vol. 29, no. 3, pp.
[11] D. Farina, R. Merletti, and R. M. Enoka, “The extraction 577–581, Jun 1981.
158
158
Hệ Thống Hỗ Trợ Nông Dân Trên Thiết Bị Di Động:

Nhận Dạng Cua Giống
Nguyễn Thiện An và Nguyễn Thái Nghe
Khoa CNTT&TT, Trường Đại học Cần Thơ
Email: ntankg@gmail.com; ntnghe@cit.ctu.edu.vn
Tóm tắt - Bài viết này là một phần trong giải pháp xây dựng hệ cho mỗi lần bán. Chính vì thế, người dân đang rất cần một
thống hỗ trợ nông dân trên thiết bị di động mà nhóm chúng tôi phương pháp hiệu quả hơn.
đề xuất. Trong phạm vi của nghiên cứu này, chúng tôi đề xuất
xây dựng mô hình “Nhận dạng cua giống” trên nền thiết bị di Bên cạnh đó, công nghệ Xử lý ảnh và Thị giác máy tính đã
động, trước mắt là các thiết bị chạy hệ điều hành Android. Mô được áp dụng rộng rãi trong rất nhiều lĩnh vực, như: Y học,
hình nhận dạng được xây dựng dựa trên giải thuật Boosting phân Giáo dục, Thiên văn, Công nghiệp, Nông nghiệp,…Một số
tầng có sử dụng đăc trưng Haar-like. Thông qua ảnh chụp từ ứng dụng tiêu biểu như: Xử lý ảnh trong Y học (McAuliffe et
thiết bị di động (ví dụ, chụp ảnh chậu chứa cua giống), hệ thống al., 2001) (Pierre et al., 2002), xử lý ảnh vệ tinh trong Thiên
sẽ lọc nhiễu theo phương pháp lọc trung vị (Median Filter) để văn (John R. Jensen and Dr. Kalmesh Lulla, 1987), nhận dạng
nâng cao chất lượng ảnh, loại bỏ các chi tiết không cần thiết. Kế
đến, dựa trên đặc trưng Haarlike kết hợp với giải thuật Boosting
dấu vân tay trong Khoa học Hình sự (Hong L., Yifei Wan,
phân tầng, hệ thống sẽ nhận dạng và đếm số lượng cua giống có Jain A., 1998), nhận dạng mặt người (Châu Ngân Khánh,
trong ảnh. Kết quả thực nghiệm bước đầu đã cho thấy việc nhận Đoàn Thanh Nghị, 2014), nhận dạng chữ viết tay (Phạm Anh
dạng cua giống dựa trên mô hình đã xây dựng là rất khả quan. Phương et al., 2009), nhận dạng biển số xe (Nguyễn Thái
Mô hình này sẽ được cải tiến hơn nữa để có thể áp dụng vào thực Nghe et al., , 2014), nhận dạng biển báo giao thông (Bahlmann
tế. et al., 2005), Robot thu hoạch nông sản trong Nông nghiệp
(Bulanon et al., 2002) (Wei et al., 2012),…
Từ khóa- Xử lý ảnh, thị giác máy tính, đặc trưng Haar-like, nhận
dạng cua giống, nhận dạng trên thiết bị di động.
I. GIỚI THIỆU
Đồng bằng sông Cửu Long là vùng rất phát triển nghề nuôi
trồng thuỷ sản. Đặc biệt, ở một số tỉnh giáp biển như: Cà Mau,
Bạc Liêu, Kiên Giang, Trà Vinh,… do đất sản xuất bị nhiễm
mặn nên việc trồng lúa nước cho sản lượng không cao, chất
lượng lại thấp. Vì vậy, từ nhiều năm nay nghề nuôi thuỷ sản
nơi đây đã trở thành nghề chủ đạo thay cho trồng lúa nước,
trong đó nuôi cua biển là ngành kinh tế mang lại thu nhập khá
cao cho nông dân.
Hàng năm, khi đến thời điểm thả con giống, người nông dân
thường ra trại cua (là nơi sản xuất cua con) để mua cua giống
(cua con, kích thước nhỏ, như minh họa trong Hình 1 phần
trên) về nuôi. Cua giống có kích thước nhỏ nhưng lại được
bán theo đơn vị “con” và cách xác định số lượng chủ yếu là
đếm và ước lượng là chính. Do đó, số lượng cua thực tế sẽ ít
hơn số lượng cua được ước lượng rất nhiều. Chẳng hạn, nếu
người mua muốn mua 1000 con, người bán sẽ đếm 100 con
cho vào một chậu nhỏ làm “chậu mẫu”, sau đó dùng 1 chậu
khác có kích thước giống chậu mẫu và cho cua vào đó đến khi
thấy màu sắc, số lượng giống như chậu mẫu thì xem như chậu
đó cũng chứa 100 con, như minh họa trong Hình 1 (trên). Lặp
lại tương tự với các chậu khác cho đến khi đủ 10 chậu, tức là
đã đủ 1000 con.
Qua tìm hiểu từ những người nông dân có kinh nghiệm thì tỷ
lệ cua được mua thực tế khoảng 80% so với tỷ lệ ước lượng. Hình 1. Cua giống được đếm khi bán (ảnh trên) và cua trưởng
Tức là khi người mua mua 1000 con thì số lượng thực tế chỉ thành (ảnh dưới)
khoảng 800 con, điều này đã gây thiệt thòi khá nhiều cho nông
dân, mặc dù người bán cũng đã có “bù thêm” một số lượng
ISBN: 978-604-67-0635-9 159

Từ những phân tích trên, chúng tôi thấy rằng việc áp dụng
công nghệ xử lý ảnh vào Nông nghiệp, đặc biệt là ngành nuôi
trồng Thuỷ sản là rất cần thiết nhưng vẫn chưa được nghiên
cứu tốt.
Trong bài viết này, chúng tôi đề xuất xây dựng mô hình “Nhận
dạng và đếm số lượng cua giống” trên thiết bị di động nhằm
hỗ trợ nông dân một cách đếm khác thay cho cách đếm truyền
thống khi đi mua cua giống. Đây cũng là cách giúp người
Nông dân bảo vệ quyền lợi cũng như tạo ra sự công bằng khi
mua bán.
Hình 3. Các đặc trưng Haar-like mở rộng
II. CÁC NGHIÊN CỨU LIÊN QUAN
Giá tri ̣ của đặc trưng Haar-like là sự chênh lệch giữa tổ ng các
Nhận dạng là lĩnh vực đang rất được quan tâm trong nghiên điể m ảnh của các vùng đen và các vùng trắ ng theo công thức:
cứu khoa học cũng như thương mại. Kết quả của các công
f(x)=Sumblack rectangle (pixel gray level) – Sumwhite rectangle (pixel
trình nghiên cứu về nhận dạng đã được thương mại hoá trong
gray level)
các sản phẩm điện tử tiêu biểu như: máy ảnh kỹ thuật số, điện
thoại thông minh,… với tính năng xác định gương mặt, nụ Như vậy, để tính toán các giá trị của đặc trưng Haar-like ta
cười khi chụp ảnh. Hay chức năng Tag ảnh trong các mạng xã phải tính tổng các vùng pixel trên ảnh. Nếu muốn tính các giá
hội nổi tiếng như: Facebook, Twitter, Instagram,… với chức trị của các đặc trưng cho tất cả các vùng trên ảnh ta phải tốn
năng nhận dạng gương mặt. Ngoài ra, còn rất nhiều nghiên chi phí tính toán khá lớn, không thể đáp ứng cho các ứng dụng
cứu khoa học về nhận dạng như: nhận dạng chữ viết tay, nhận chạy thời gian thực. Do đó, để có thể tính nhanh các đặc trưng
dạng biển số xe, nhận dạng mặt người… này, Viola và Jones (2001; 2004) giới thiệu khái niệm ảnh tích
phân (Integral Image). Integral Image là một mảng hai chiề u
Trong rất nhiều nghiên cứu về nhận dạng vẫn chưa thấy với kích thước bằ ng kích thước của ảnh cầ n tính giá tri ̣ đặc
nghiên cứu nào liên quan đến vấn đề nhận dạng cua giống trưng Haar-like, với mỗi phần tử của mảng này được tính bằng
trong ngành nuôi trồng Thuỷ sản. Vì vậy mô hình “Nhận dạng cách tính tổng của điểm ảnh phía trên (dòng-1) và bên trái
cua giống” sẽ góp phần làm phong phú thêm các lĩnh vực có (cột-1) của nó. Bắt đầu từ vị trí trên, bên trái đến vị trí dưới,
thể áp dụng kỹ thuật nhận dạng và đặc biệt là việc ứng dụng bên phải của ảnh, việc tính toán này đơn thuần chỉ dựa trên
công nghệ cao phục vụ Nông Nghiệp - Nông dân – Nông thôn. phép cộng số nguyên đơn giản, do đó tốc độ thực hiện rất
nhanh.
III. ĐẶC TRƯNG HAAR-LIKE VÀ GIẢI THUẬT
BOOSTING PHÂN TẦNG
A. Đặc trưng Haar-like
Đặc trưng Haar-like (Paul A. Viola and Michael J. Jones,
2001) đươ ̣c sử du ̣ng trong việc nhận da ̣ng đố i tươṇ g trong ảnh
số . Mỗ i đặc trưng Haar-like là sự kế t hơ ̣p gồ m 2 hoặc 3 hình
chữ nhật đen, trắng với nhau theo một trật tự, một kích thước Hình 4. Tính giá trị ảnh tích phân tại điểm có toạ độ P(x,y)
nào đó. Những khố i chữ nhật này thể hiện sự liên hệ tương
quan giữa các bộ phận trong ảnh mà bản thân từng giá tri ̣pixel Giá trị của điểm P có toạ độ (x,y) được tính theo công thức
không thể diễn đa ̣t đươ ̣c. Có 4 đặc trưng Haar-like cơ bản thể sau:
hiện ở Hình 2 như sau
Sau khi đã tính được ảnh tích phân, việc tính tổng giá trị mức
xám của vùng ảnh bất kỳ nào đó ta tính được dễ dàng như sau:
Giả sử ta cần tính tổng giá trị mức xám của vùng D như trong
Hình 2. Đặc trưng Haar-like cơ bản Hình 5, ta tính như sau:
Từ 4 đặc trưng cơ bản, đặc trưng Haar-like còn được mở rộng D = A + B + C + D – (A+C) – (A+B) + A
thành nhóm các đặc trưng đường, đặc trưng cạnh, đặc trưng
tâm (Lienhart, Kuranov, Pisarevky, 2002; Lienhart, Maydt,
2002).
Hình 5. Tính nhanh giá trị mức xám vùng ảnh D
160
Với A+B+C+D là giá trị tại điểm P4 trên Integral Image, đố i tươ ̣ng nhận diện) mà tầ ng trước nó nhận da ̣ng sai, tức là nó
tương tự như vậy A+C là giá trị tại điểm P3, A+B là giá trị tại sẽ tập trung ho ̣c từ các mẫu background khó hơn, do đó sự kế t
điểm P2, và A là giá trị tại điểm P1. Vậy ta có thể viết lại biểu hơ ̣p các tầ ng AdaBoost này la ̣i sẽ giúp bộ phân loa ̣i giảm thiể u
thức tính D ở trên như sau: nhận da ̣ng lầ m. Với cấ u trúc này, những mẫu background dễ
nhận da ̣ng sẽ bi ̣ loa ̣i ngay từ những tầ ng đầ u tiên, giúp đáp
𝐷𝐷 = (𝑥𝑥4 , 𝑦𝑦4 ) − (𝑥𝑥3 , 𝑦𝑦3 ) − (𝑥𝑥2 , 𝑦𝑦2 ) + (𝑥𝑥1 , 𝑦𝑦1 )
ứng tố t nhấ t thời gian xử lý và vẫn duy trì đươ ̣c hiệu quả phát
hiện đố i tươ ̣ng (Châu Ngân Khánh, Đoàn Thanh Nghị, 2014).
B. Thuật toán Adaboost
Thuật toán Adaboost (Adaptive Boosting) là thuật toán máy
học được cải tiến từ thuật toán Boosting (Freund, Schapire,
1995) được giới thiệu vào năm 1995. Adaboost là một bộ phân
loại phi tuyến phức, hoạt động theo nguyên tắc kết hợp tuyến
Hình 6. Mô hình Cascade of Boosted Classifiers (Javier,
tính các bộ phân lớp yếu (weak classifiers) thành một bộ phân
2006)
lớp mạnh (Strong Classifiers). AdaBoost sử du ̣ng tro ̣ng số để
đánh dấ u các mẫu khó nhận da ̣ng. Trong quá trình huấ n luyện
cứ mỗ i bộ phân loa ̣i yế u đươc̣ xây dựng thì thuật toán sẽ tiế n
IV. ĐỀ XUẤT MÔ HÌNH NHẬN DẠNG
hành cập nhật la ̣i tro ̣ng số để chuẩ n bi ̣ cho việc xây dựng bộ
phân loa ̣i tiế p theo. Cập nhật bằ ng cách tăng tro ̣ng số của các
mẫu nhận da ̣ng sai và giảm tro ̣ng số của các mẫu đươ ̣c nhận Hệ thống “Nhận dạng và đếm số lượng cua giống” được xây
da ̣ng đúng bởi bộ phân loa ̣i yế u vừa xây dựng. Bằ ng cách này dựng qua 2 bước. Thứ nhất, xây dựng mô hình nhận dạng đối
thì bộ phân loa ̣i sau có thể tập trung vào các mẫu mà bộ phân tượng sử dụng giải thuật Boosting phân tầng và đặc trưng
loa ̣i trước nó làm chưa tố t. Cuố i cùng các bộ phân loa ̣i yế u sẽ Haar-like. Thứ hai, triển khai mô hình đã xây dựng lên thiết bị
đươ ̣c kế t hơ ̣p la ̣i tùy theo mức độ tố t của chúng để ta ̣o nên một di động nền tảng Android để nhận dạng và đếm số lượng cua
bộ phân loa ̣i ma ̣nh. giống.
Bộ phân loại hk được biểu diễn như sau: A. Xây dựng mô hình nhận dạng cua giống
1 𝑛𝑛ế𝑢𝑢 𝑝𝑝𝑘𝑘 𝑓𝑓𝑘𝑘 (𝓍𝓍) < 𝑝𝑝𝑘𝑘 𝜃𝜃𝑘𝑘 Quy trình nhận dạng cua giống thông qua các bước chính như
ℎ𝑘𝑘 (𝑥𝑥) = { mô tả trong Hình 7.
0 𝑛𝑛ế𝑢𝑢 𝑛𝑛gược 𝑙𝑙ạ𝑖𝑖
Với x là cửa sổ con cần xét, 𝜃𝜃𝑘𝑘 là ngưỡng, 𝑓𝑓𝑘𝑘 là giá trị đặc
trưng Haar-like và 𝑝𝑝𝑘𝑘 hệ số quyết định chiều của phương trình
(Châu Ngân Khánh, Đoàn Thanh Nghị, 2014).
C. Mô hình phân tầng Cascade

Mô hình phân tầng Cascade (Cascade of Boosted Classifiers)
là mô hình phân tầ ng với mỗ i tầ ng là một mô hình AdaBoost
sử du ̣ng bộ phân lớp yế u là cây quyế t đinh ̣ với các đặc trưng
Haar-like .
Trong quá trình huấ n luyện, bộ phân lớp phải duyệt qua tấ t cả
các đặc trưng của mẫu trong tập huấ n luyện. Việc này tố n rấ t
nhiề u thời gian. Tuy nhiên, trong các mẫu đưa vào, không phải Hình 7: Mô hình nhận dạng cua giống
mẫu nào cũng thuộc loa ̣i khó nhận da ̣ng, có những mẫu
background rấ t dễ nhận ra (go ̣i đây những mẫu background Để hệ thống nhận dạng được đối tượng, trước hết cần phải thu
đơn giản). Đố i với những mẫu này, chỉ cầ n xét một hay một thập dữ liệu đầu vào để tạo tập dữ liệu học. Trong bài viết này,
vài đặc trưng đơn giản là có thể nhận da ̣ng đươ ̣c chứ không dữ liệu đầu vào chính là ảnh cua giống. Có 2 lớp ảnh cần thu
cầ n xét tấ t cả các đặc trưng. Nhưng đố i với các bộ phân loa ̣i thập là lớp dương (Positive - ảnh chứa cua giống) và lớp âm
thông thường thì cho dù mẫu cầ n nhận da ̣ng là dễ hay khó nó (Negative - ảnh bất kỳ nhưng không chứa cua giống). Ảnh lớp
vẫn phải xét tấ t cả các đặc trưng mà nó rút ra đươ ̣c trong quá dương được cắt ra sao cho mỗi ảnh chỉ chứa 1 đối tượng.
trình ho ̣c. Do đó, chúng tố n thời gian xử lý một cách không Chúng tôi sử dụng 1.460 ảnh có kích thước 20x20 pixels làm
cầ n thiế t. lớp dương và 12.638 ảnh kích thước 320x240 pixels làm lớp
Mô hình Cascade of Classifiers đươ ̣c xây dựng nhằ m rút ngắ n âm.
thời gian xử lý, giảm thiể u nhận da ̣ng lầ m (False Alarm) cho Khi đã có đủ 2 lớp ảnh, chúng tôi thực hiện giai đoạn tạo mẫu
bộ phân loa ̣i. Cascade trees gồ m nhiề u tầ ng (stage hay còn go ̣i theo các bước được trình bày dưới đây.
là layer), mỗ i tầ ng là một mô hình AdaBoost với bộ phân lớp
yế u là các cây quyế t đinh. ̣ Một mẫu để đươ ̣c phân loa ̣i là đố i
tươ ̣ng thì nó cầ n phải đi qua hế t tấ t cả các tầ ng. Các tầ ng sau Bước 1: Tạo tập tin mô tả đối tượng lớp dương, đây là tâp tin
đươ ̣c huấ n luyện bằ ng những mẫu âm (Negative – không chứa
<Tên_ảnh_1> <số_đối_tượng> <x1 y1 width height>

<x2 y2 width height> <…>
….
<Tên_ảnh_n> <số_đối_tượng> <x1 y1 width height>
<x2 y2 width height> <…>
161
text có cấu trúc: - vec: thư mục chứa tập tin kết quả
- 7000: số lượng mẫu
Trong đó: - opencv_createsamples: tiện ích tạo mẫu của thư viện
- Tên_ảnh_1, Tên_ảnh_n: ảnh thứ nhất, ảnh thứ n có OpenCV
chứa đối tượng - -w 20 -h 20: kích thước chiều rộng, cao của ảnh.
- Số_đối_tượng: số lượng đối tượng có trong ảnh
Sau khi thực hiện Bước 3 chúng tôi thu được các tập tin
- x1, y1: toạ độ (tính từ góc trên bên trái) của đối tượng *.vec trong thư mục vec.
thứ nhất
Bước 4: Tạo tập tin mô tả các tập tin *.vec tương tự như cách
- width, height: chiều rộng, cao của hình chữ nhật bao
tạo tập tin mô tả đối tượng lớp âm ở Bước 2. Sau bước này
quanh đối tượng
chúng tôi thu được tập tin vec.txt.
Tập tin mô tả đối tượng sau khi tạo có cấu trúc như Hình 8:
Bước 5: Sử dụng chương trình mergevec.cpp được viết bởi
Natoshi Seo (http://note.sonots.com/) để kết hợp các tập tin
*.vec với nhau thành một tập tin vector phục vụ cho bước
huấn luyện. Câu lệnh:
$ mergevec vec.txt samples.vec
Hình 8. Tập tin mô tả đối tượng lớp dương Trong đó:
- mergevec: tên chương trình kết nối tập tin *.vec
Bước 2: Tạo tập tin mô tả đối tượng lớp âm, đây là tập tin
dạng text chứa tên ảnh có cấu trúc: - vec.txt: tập tin mô tả các tập tin *.vec
- samples.vec: tập tin kết quả
<Tên_ảnh_1>
…. Bước 6: Huấn luyện dữ liệu học cho mô hình từ tập tin
<Tên_ảnh_n> samples.vec được tạo ở Bước 5. Chúng tôi sử dụng tiện ích
opencv_traincascade trong thư viện OpenCV để huấn luyện.
Tập tin mô tả đối tượng sau khi tạo có cấu trúc như Hình 9: Câu lệnh:
$ ./opencv_traincascade -data trainCascade -vec samples.vec
-bg negative.txt -numPos 7000 -numNeg 12638 -numStages 25
-w 20 -h 20 -minHitRate 0.995 -maxFalseAlarmRate 0.5 -
percalcValBufSize 2000 -percalcIdxBufSize 2000 -mode ALL
Trong đó:
Hình 9. Tập tin mô tả đối tượng lớp âm - opencv_traincascade: tên chương trình huấn luyện dữ
liệu
Trong đó:
- -data trainCascade: thư mục chứa tập tin kết quả
- Tên_ảnh_1: tên ảnh âm thứ nhất - -vec samples.vec: tập tin vector tạo ở Bước 5
- Tên_ảnh_n: tên ảnh âm thứ n - -bg negative.txt: tập tin mô tả đối tượng lớp âm được
tạo ở Bước 2
Bước 3: Tạo mẫu bằng tiện ích opencv_createsamples và
createtrainsamples.pl: - -numPos 7000: số lượng mẫu lớp dương
- -numNeg 12638: số lượng mẫu lớp âm
Tiện ích createtrainsamples.pl được viết bởi Natoshi Seo
(http://note.sonots.com, 2015). Tiện ích này cung cấp chức - -numStage 25: số bước huấn luyện
năng xoay ảnh theo các trục x, y, z để vét cạn các trường hợp - -w 20 –h 20: kích thước rộng, cao của ảnh
khi đối tượng trong ảnh không nằm theo hướng thẳng đứng. - minHitRate 0.995: tỷ lệ nhận dạng đúng thấp nhất
Câu lệnh:
- -maxFalseAlarmRate 0.5: tỷ lệ cảnh báo sai cao nhất
$ perl createtrainsamples.pl positive.txt negative.text vec 7000 - -percalcValBufSize 2000, -percalcIdxBufSize 2000: tỷ lệ
“./opencv_createsamples -w 20 -h 20” Ram (MB) được sử dụng khi huấn luyện dữ liệu
Trong đó: Khi quá trình huấn luyện kết thúc, chúng tôi thu được tập tin
- createtrainsamples.pl: tiện ích xoay ảnh khi tạo mẫu cascade.xml. Đây là tập tin chứa dữ liệu học để giúp hệ thống
nhận dạng đối tượng khi triển khai xây dựng hệ thống. Tập tin
- positive.txt, negative.txt: tập tin mô tả đối tượng lớp cascade.xml có cấu trúc như Hình 10:
dương và lớp âm được tạo ở Bước 2
162
ảnh đã chụp.
Hình 10. Cấu trúc tập tin cascade.xml
B. Xây dựng hệ thống nhận dạng và đếm cua giống

Mô hình tổng quát của hệ thống Nhận dạng và đếm số
lượng cua giống được mô tả như Hình 11:
Hình 11. Mô hình tổng quát của hệ thống Nhận dạng và

đếm số lượng cua giống
Sau khi xây dựng xong mô hình nhận dạng, chúng tôi cài đặt
mô hình vào ứng dụng chạy trên thiết bị di động, trước mắt là
hệ điều hành Android do các thiết bị chạy Android khá phổ
biến và giá thành cũng phù hợp với phần lớn người dùng, đặc
biệt là nông dân. Hình 12. Kết quả nhận dạng và đếm cua giống. Những con
đã được hệ thống nhận dạng được bao trong ô hình chữ nhật.
Sau khi cài đặt, ứng dụng cho phép người dùng chụp ảnh chậu
chứa cua giống và lưu ảnh vào bộ nhớ điện thoại. Sau đó, hệ Hình 13 minh hoạ kết quả nhận dạng khi chụp cùng bức ảnh ở
thống thực hiện tiền xử lý ảnh bằng các phép toán lọc ảnh để Hình 12 nhưng ở góc độ nghiêng. Hệ thống nhận dạng đúng
khử nhiễu trước khi tiến hành nhận dạng. Kết quả đầu ra của 245 con trong số 270 con được nhận dạng (ảnh thực là 375
hệ thống là số lượng cua giống được xác định sau khi nhận con). Tuy nhiên độ chính xác thấp hơn nhiều (đạt 65.33%) do
dạng bằng mô hình do chúng tôi xây dựng. một đối tượng bị khuất hoặc quá nhỏ. Yếu tố (chủ quan) này
sẽ được khắc phục đơn giản bằng cách hướng dẫn người dùng
V. KẾT QUẢ MINH HỌA chụp trực diện hình ảnh thay vì chụp nghiêng để có kết quả tốt
Trong giai đoạn xây dựng và huấn luyện mô hình, chúng tôi hơn.
dùng 12638 ảnh âm (ảnh bất kỳ không phải con cua) và 1460 Thử nghiệm trong môi trường thực tế, chúng tôi đã chụp 9 ảnh
ảnh dương (các con cua) để trích xuất 7000 đặc trưng phục vụ sau đó lấy kết quả trung bình, độ chính xác đạt 81.86%. Chúng
quá trình huấn luyện. Sau khi huấn luyện xong, mô hình được tôi sẽ tiếp tục việc kiểm thử trên nhiều ảnh khác trong tương lai.
triển khai trên thiết bị di động chạy hệ điều hành Android.
Từ ảnh chụp các con cua trong chậu, hệ thống tự động nhận VI. KẾT LUẬN VÀ HƯỚNG PHÁT TRIỂN
dạng, đếm và hiển thị số con như minh họa trong Hình 12. Chúng tôi đã đề xuất xây dựng mô hình Nhận dạng cua giống
Trong hình này, hệ thống đã nhận dạng và đếm là 356 con. trên thiết bị di động dựa trên giải thuật Boosting phân tầng và
Trong đó nhận dạng đúng là 334 con, nhận dạng nhầm là 22 đặc trưng Haar-like. Nghiên cứu này sẽ là tiền đề cho các
con trong tổng số lượng cua thực tế trong ảnh là 375, với độ nghiên cứu ứng dụng công nghệ cao để phục vụ Nông nghiệp
chính xác tương ứng là 89%. Để độ chính xác được khách – Nông dân – Nông thôn, đặc biệt là các ứng dụng trên nền
quan hơn, người sử dụng có thể chụp nhiều lần ở nhiều góc độ thiết bị di động. Kết quả bước đầu đã cho thấy mô hình đề
khác nhau, sau đó hệ thống sẽ cho kết quả trung bình trên số
163
xuất là rất khả thi, mặc dù độ chính xác của mô hình chưa 2. Bulanon D.M., Kataoka T., Ota Y., Hiroma T., 2002.
được như mong muốn. Automation and Emerging Technologies: A Segmentation
Algorithm for the Automatic Recognition of Fuji Apples at
Chúng tôi sẽ tiếp tục cải tiến các thuật toán và tập dữ liệu học Harvest. Biosystems Engineering 83(4): 405-412.
để tăng độ chính xác cho kết quả nhận dạng. Sau đó phát triển 3. Châu Ngân Khánh, Đoàn Thanh Nghị, 2014. Nhận dạng mặt
trên các hệ điều hành thông dụng khác như iOS, Windows người với giải thuật Haar Like Feauture – Cascade of Boosted
Phone. Classifiers và đặc trưng SIFT. Tạp chí khoa học Đại học An
Giang 3(2): 15-24.
4. Freund, Y., Robert E.Schapire, 1995. A decision- theoretic
generalization of on-line learning and an application to boosting.
AT&T Labs, New Jersey.
5. Hong L., Yifei Wan, Jain A., 1998. Fingerprint image
enhancement: algorithm and performance evaluation. Pattern
Analysis and Machine Intelligence, IEEE Transactions 8: 777-
789.
6. Javier Ruiz-del-Solar, Rodrigo Verschae, 2006. Object detection
using cascades of boosted classifiers. Universidad de Chile,
Chile.
7. John R. Jensen and Dr. Kalmesh Lulla, 1987. Introductory
digital image processing: A remote sensing perspective.
Geocarto International 1: 65.
8. Lienhart, R., Kuranov, A., & Pisarevsky, V., 2002. Empirical
Analysis of Detection Cascades of Boosted Classifiers for Rapid
Object Detection. Microprocessor Research Lab, USA.
9. Lienhart, R., Maydt, R., 2002. An Extended Set of Haar-like
Features for Rapid Object Detection. Intel Labs, Intel
Corporation, Santa Clara, USA.
10. McAuliffe M.J., Lalonde F.M., McGarry D., Gandler W., Csaky
K., Trus B.L, 2001. Medical Image Processing, Analysis and
Visualization in clinical research. Computer-Based Medical
Systems, IEEE Symposium: 381-386.
11. Nguyễn Thái Nghe, Nguyễn Văn Đồng, Võ Hùng Vĩ, 2014. Một
giải pháp trong xây dựng hệ thống hỗ trợ giữ xe thông minh.
Tạp chí khoa học Trường Đại học Cần Thơ 35: 17-30.
12. Paul A. Viola and Michael J. Jones, 2001. Rapid Object
Detection using a Boosted Cascade of Simple Features. IEEE
Conference on Computer Vision and Pattern Recognition.
13. Phạm Anh Phương, Ngô Quốc Tạo, Lương Chi Mai, 2009. Kết
hợp các bộ phân lớp SVM cho việc nhận dạng chữ Việt viết tay
rời rạc. Tạp chí Tin học và Điều khiển học 25(1): 88-97.
14. Pierre Jannin, J Michael Fitzpatrick, David Hawkes, Xavier
Pennec, Ramin Shahidi, et al.., 2002. Validation of medical
image processing in image-guided therapy. IEEE Transactions
on Medical Imaging, Institute of Electrical and Electronics
Hình 13. Minh họa kết quả nhận dạng và đếm cua giống Engineers (IEEE) 21(12): 1445-9.
khi chụp ở góc nghiêng. 15. Viola, P., Jones, M., 2001. Robust Real-time Object Detection.
International Journal of Computer Vision.
16. Viola, P., Jones, M., 2004. Robust Real-time Face Detection.
International Journal of Computer Vision, Netherlands.
17. Wei Ji, Dean Z., Fengyi C., Bo Xu, Ying Z., Jinjing Wan, 2012.
Automatic recognition vision system guided for apple
harvesting robot. Computers &Electrical Eng., 38(5): 1186-
1195.
1. Bahlmann C., Ying Zhu, Ramesh V., Pellkofer M., Koehler T.,
2005. A system for traffic sign detection, tracking, and
recognition using color, shape, and motion information.
Intelligent Vehicles Symposium, IEEE: 255-260.
164
Hội Thảo Quốc
Hội Thảo GiaGia
Quốc 2015 vềvề
2015 Điện
ĐiệnTử,
Tử,Truyền
TruyềnThông
Thôngvà
vàCông NghệThông
Công Nghệ ThôngTin
Tin(ECIT
(ECIT2015)
2015)
Phương Pháp Ước Lượng Giá Trị Hệ Số Hấp Thụ

Riêng (SAR) Của Thiết Bị Di Động Có Đa Ăng-ten
Phát Sử Dụng Gần Cơ Thể Con Người
Chu Văn Hải và Lê Đình Thành
Khoa Vô Tuyến Điện Tử,
Đại Học Kỹ Thuật Lê Quý Đôn
Email: chuhait1@gmail.com, le.dinhthanh.vn@ieee.org
Tóm tắt— Trong bài báo này, chúng tôi trình bày một phương tần số, việc sử dụng các thiết bị đầu dò vô hướng đo SAR trở
pháp ước lượng nhanh dùng trong các hệ thống đo sử dụng đầu lên phức tạp hơn và đòi hỏi những kỹ thuật đo đặc biệt. Lý do
dò điện trường vô hướng để xác định hệ số hấp thụ riêng là vì tổng cường độ điện trường bức xạ (tương ứng là SAR) là
(Specific Adsorption Rate - SAR) của thiết bị di động có 2 ăng-ten tổng véc tơ của các nguồn riêng lẻ, do đó các giá trị SAR tại
phát. Đối với thiết bị di động có 2 ăng-ten, 3 phép đo với góc lệch
mỗi điểm đo không chỉ phụ thuộc vào độ lớn của cường độ
pha xác định trước sẽ được thực hiện. Từ các kết quả đo này,
các hệ số ước lượng sẽ được tính, và sau đó, SAR với góc pha bất điện trường tại điểm đo mà còn phụ thuộc vào góc pha tương
kỳ nào đó có thể được ước lượng bằng máy tính. Phương pháp đối của các ăng-ten.
này cho phép ước lượng chính xác SAR, và có thể xác định được Một phương pháp cơ bản để đo SAR cho thiết bị đa ăng-
giá trị SAR lớn nhất tương ứng với độ lệch pha cụ thể nào đó ten phát, được giới thiệu trong [1]-[3], là thực hiện phép đo
của các ăng-ten. với mỗi góc pha xác định thay đổi từ 0 đến 360 độ với một
bước pha nhất định. Ví dụ, với bước pha bằng 5 độ tương ứng
Từ khóa- Hệ số hấp thụ riêng (SAR), nhiều ăng ten phát, đầu sẽ có 72 phép đo được thực hiện để tìm ra giá trị SAR lớn
dò điện trường vô hướng.
nhất ứng với một góc pha cụ thể nào đó. Tổng quát, nếu có N
I. GIỚI THIỆU ăng-ten phát và bước pha là k độ, thì tương ứng có
Hệ số hấp thụ riêng (SAR) được định nghĩa là năng lượng  36 0 / k  N  1 phép đo lặp đi lặp lại. Rõ ràng, phương pháp đo
hấp thụ trên mỗi đơn vị khối lượng của một cơ thể sinh học thông thường này rất tốn thời gian, thậm chí là không khả thi
khi nó tiếp xúc với trường điện từ. SAR được xác định là hệ số khi giá trị bước pha là nhỏ, hoặc số lượng của ăng-ten phát
giới hạn trong tiêu chuẩn an toàn quốc tế RF [1]-[3] và giá trị nhiều lên (bởi vì thực tế mỗi phép đo thông thường hiện nay
của nó tỷ lệ thuận với bình phương cường độ điện trường bức mất khoảng 30 phút). Ngoài ra còn có các nghiên cứu trong
xạ: [6], [7] xét đến trường hợp 2 ăng ten phát, và thực nghiệm đo
SAR với giá trị bước pha bằng 45 độ tương ứng có 8 phép đo
 W / Kg 
2
SAR   E  (1) được tiến hành để xác định giá trị cực đại của SAR. Tuy
nhiên, do bước pha là khá lớn nên giá trị SAR cực đại tìm
Trong đó: σ và ρ tương ứng là các đại lượng đặc trưng cho được chưa chính xác, chỉ là gần đúng.
độ dẫn điện (S/m) và mật độ khối lượng riêng (kg/m3) của cơ Để giảm thời gian đo, một phương pháp khác đã được giới
thể sinh học. thiệu cho kiểm tra việc tuân thủ các hướng dẫn an toàn của
Hiện nay có hai loại đầu dò điện trường được sử dụng để các thiết bị không dây [1], [8]. Đây là phương pháp đòi hỏi
đo SAR trong các hệ thống phòng đo SAR [4], [5] gồm đầu dò phải tắt và mở các ăng-ten phát luôn phiên nhau và tiến hành
điện trường vector và đầu dò điện trường vô hướng. Với phạm đo SAR riêng lẻ với ăng-ten đang mở. Sau đó bằng cách kết
vi bài báo chúng tôi tập trung nghiên cứu phương pháp ước hợp các giá trị SAR riêng lẻ với nhau ta thu được giá trị SAR
lượng sử dụng đầu dò điện trường vô hướng. Khi sử dụng đầu tổng. Tuy vậy, hạn chế của phương pháp này là chỉ có thể chỉ
dò vô hướng chỉ có thể cung cấp thông tin về độ lớn của ra giá trị cận trên của SAR, giá trị này quá cao so với SAR
cường độ điện trường, không cho biết thông tin về pha của các thực tế. Không những vậy, phương pháp này cũng đòi hỏi có
ăng-ten. Tuy nhiên do yếu tố kỹ thuật và đầu tư thiết bị ít tốn các chuyển mạch để bật hoặc tắt các ăng-ten, vì vậy làm cho
kém nên đầu dò điện trường vô hướng hiện được sử dụng rộng hệ thống đo phức tạp hơn.
rãi hơn trong các phòng thí nghiệm. Trong bài báo này, chúng tôi sẽ đề xuất một phương pháp
Trong phép đo SAR hiện nay, với thiết bị đa ăng-ten phát, đơn giản để ước lượng giá trị SAR cho thiết bị đa ăng-ten
mỗi ăng-ten sử dụng một tần số khác nhau thì đầu dò vô phát. Phương pháp này sẽ giảm thiểu số lần đo cho một góc
hướng thực hiện các phép đo SAR theo phương pháp thông pha tương ứng, và ước lượng giá trị SAR cho các góc pha
thường trên mỗi tần số tương ứng với mỗi ăng-ten riêng lẻ. khác nhau. Cụ thể, với một thiết bị có 2 ăng-ten phát chỉ cần 3
Tuy nhiên, đối với thiết bị đa ăng-ten làm việc trên cùng một phép đo là xác định được SAR cho một góc pha bất kỳ.
165
ISBN: 978-604-67-0635-9 165

II. PHÂN TÍCH LÝ THUYẾT tiêu chuẩn quốc tế về đo đạc bức xạ sóng điện từ [2], [3]. Hai
Với thiết bị có 2 ăng-ten phát, tổng cường độ điện trường chấn tử được đặt song song, cách nhau một khoảng một phần
bức xạ bởi 2 ăng-ten đo được tại điểm bất kỳ bằng tổng vector tư bước sóng, và cách mô hình SAM Phantom một khoảng 10
cường độ điện trường bức xạ từ từng ăng-ten riêng lẻ. Cường mm như mô tả trong hình 1.
độ điện trường tổng được tính như sau: Cấu hình ăng-ten và các thông số kích thước ăng-ten; kích
i
thước SAM Phantom, độ dày vỏ, các thông số chất lỏng SAM
E E1  E 2 e (2) Phantom (hằng số điện môi, độ dẫn điện và mật độ khối
trong đó: β là góc pha tương đối của 2 ăng-ten, E1 và E2 là lượng riêng) được quy định trong các tiêu chuẩn quốc tế về
các giá trị phức tương ứng của cường độ điện trường bức xạ đo SAR [1]-[3] thể hiện trong Bảng 1.
từ ăng-ten 1 và ăng-ten 2.
Từ (1) và (2), thông qua một số phép biến đổi toán học, ta BẢNG 1. THÔNG SỐ CỦA SAM PHANTOM
có thể biểu diển phép tính SAR như sau: VÀ ĂNG-TEN.
SA R  A  B c o s   C s in  (3) Tham số Giá trị
trong đó: A, B, C là các giá trị thực được biểu diễn thông qua Tần số 2.4 GHz
các thành phần thực và ảo của E1, E2; σ và ρ. Các tham số này Bán kính lưỡng cực 1.8mm
không phụ thuộc vào β. Chiều dài tổng thể λ/2
Để ước lượng SAR cho một β tùy ý, chúng tôi tiến hành
Khoảng cách giữa 2 ăng-ten λ/4
xác định các giá trị của A, B, C (gọi là các tham số ước
SAM (Specific
lượng) bằng cách thực hiện ba phép đo SAR với 3 góc pha
Kích thước SAM Phantom Anthropomorphic
khác nhau. Để đơn giản phép tính ta có thể lựa chọn β với các
Mannequin) [3]
giá trị: 0, 90 và 180 độ. Từ (3), qua một vài bước biến đổi các
tham số A, B, và C được xác định: Khoảng cách giữa SAM Phantom và
10mm
DUT
 A  SAR0  SAR180  / 2 Hằng số điện môi của chất lỏng bên
42
B  SAR  SAR  / 2
0 180
(4) trong SAM Phantom (εr)
Độ dẫn điện chất lỏng (σ) 0.99 S/m
C   2 SAR  SAR  SAR  / 2
90 0 180
Khối lượng riêng chất lỏng (ρ) 1000 Kg/m3
trong đó: SAR0 , SAR90 và SAR180 được xác định từ phép đo
SAR sử dụng đầu dò vô hướng cho góc pha tương ứng với 0, B. Kết quả
90 và 180 độ. Sau khi xác định được giá trị của các tham số Để kiểm tra tính chính xác và hiệu quả của phương pháp
ước lượng A, B, C thay vào (3) và với góc pha bất kỳ ta có thể ước lượng, chúng tôi tiến hành chạy mô phỏng từ mô hình
ước lượng được SAR tương ứng. trên với các góc pha: 0; 45; 90; 135; 180; 233; 270 độ. Kết
quả thu được thông qua các bước xử lý sẽ cho ra giá trị đo
III. MÔ HÌNH KIỂM CHỨNG VÀ KẾT QUẢ
SAR chuẩn hóa và giá trị ước lượng SAR.
A. Mô hình
Để đơn giản, hai ăng-ten chấn tử hoạt động ở tần số 2.4 G
được sử dụng như là ăng-ten của thiết bị đo kiểm (devices
under test-DUT). Để tính toán SAR bên trong phần đầu cơ
thể con người, mô hình SAM Phantom (Specific
Anthropomorphic Mannequin) được sử dụng trong chương
trình mô phỏng.
(a) (b)
Hình 1. Mô hình SAM Phantom và 2 ăng-ten phát:

(a) góc nhìn tổng quát; (b) Mặt phẳng quan sát SAR .
Mô hình đầu người SAM Phantom là kích thước trung Hình 2. Các phân bố SAR tương ứng với giá trị β khác nhau
bình của đầu người. Kích thước của nó được chỉ rõ trong các của hai ăng-ten: (a) β =0 độ; (b) β =90 độ; (c) β =180 độ.
166
166
HộiHội
Thảo Quốc
Thảo QuốcGia
Gia2015
2015về
vềĐiện
Điện Tử,
Tử,Truyền
Nghệ Thông
Thông TinTin (ECIT
(ECIT 2015)
2015)
Hình 2 thể hiện phân bố SAR với các góc pha tương đối 0 đến 360 độ. Từ kết quả tính toán này, giá trị SAR lớn nhất
khác nhau: 0; 90; và 180 độ trong một mặt phẳng ngang mô được tìm thấy là 1.12 tương ứng với góc pha 233 độ.
hình SAM Phantom (xem hình 1.b). Các giá trị SAR được
chuẩn hóa bằng một giá trị chuẩn hóa (normalization factor)
là giá trị lớn nhất trong mặt phẳng quan sát khi góc pha tương
đối của 2 chấn tử là 90 độ. Từ các giá trị này, chúng ta sẽ tính
được các hệ số ước lượng theo phương trình (4) và ước lượng
được SAR đối với giá trị pha bất kỳ theo phương trình (3).
Hình 3; 4; 5 và 6 trình bày kết quả so sánh giá trị SAR
tính toán và giá trị SAR ước lượng với góc pha bằng 45; 135;
233 và 270 độ tương ứng. Từ các hình này, ta thấy rằng kết
quả ước lượng giá trị SAR và tính toán SAR tại mặt phẳng
quan sát bên trong SAM Phantom là khá đồng nhất. Giá trị
sai số lớn nhất giữa chúng chỉ khoảng dưới 0,01%. Hình 6. So sánh kết quả với β = 233 độ:
(a) chuẩn hóa đo SAR; (b) ước lượng SAR.
1.2
M axim um norm alized local S A R

0.8
0.6
Hình 3. So sánh kết quả với β = 45 độ: Peak maximum point SAR
0.4
(a) chuẩn hóa đo SAR; (b) ước lượng SAR.
0.2
0
0 50 100 150 200 250 300 350
Relative phase of the two antennas (deg.)
Hình 7. Maximum normalized point SAR

IV. KẾT LUẬN
Bài báo đã trình bày một phương pháp ước lượng đơn
giản để xác định SAR lớn nhất của các thiết bị có 2 ăng-ten
Hình 4. So sánh kết quả với β = 135 độ: phát. Phân tích lý thuyết và kiểm chứng bằng chương trình
(a) chuẩn hóa đo SAR; (b) ước lượng SAR. mô phỏng đã xác minh tính đúng đắn của kỹ thuật ước lượng.
Kết quả mô phỏng (tính toán) và ước lượng khẳng định
phương pháp ước lượng hoạt động tốt trong hầu hết các
trường hợp kiểm tra, và độ lệch giữa kết quả đo và ước lượng
SAR là rất nhỏ, chủ yếu là dưới 0.01%. Nhờ giảm số lượng
của các phép đo, phương pháp ước lượng được đề xuất sẽ
giảm đáng kể tổng thời gian kiểm định cho một thiết bị có đa
ăng-ten phát. Trong các nghiên cứu tiếp theo, chúng tôi sẽ tập
trung xem xét mô hình và kiểm chứng với nhiều ăng-ten hơn,
và tính toán với mô hình cơ thể con người phức tạp hơn.
LỜI CẢM ƠN
Hình 5. So sánh kết quả với β = 270 độ: Nghiên cứu này được tài trợ bởi Quỹ Phát triển khoa học và
(a) chuẩn hóa đo SAR; (b) ước lượng SAR. công nghệ Quốc gia (NAFOSTED) trong đề tài mã số
102.04-2014.16.
Bằng cách áp dụng phương pháp ước lượng cho các giá trị
khác nhau của β, thay đổi từ 0 đến 360 độ, chúng ta có thể tìm TÀI LIỆU THAM KHẢO
thấy giá trị của β tương ứng với SAR lớn nhất. Hình 7 cho [1] IEC/TR 62630, “Guidance for Evaluating Exposure from
thấy giá trị lớn nhất SAR khi thay đổi β trong một khoảng từ Multiple Electromagnetic Sources,” Ed. 1.0, 2010.
167
167
Hội
HộiThảo
ThảoQuốc
Quốc Gia 2015 vềĐiện
2015 về ĐiệnTử,
Tử,Truyền
TruyềnThông
Thôngvàvà Công
Công Nghệ
Nghệ Thông
Thông Tin (ECIT
Tin (ECIT 2015)
2015)
[2] IEC:62209-2, “Human exposure to radio frequency fields from [6] K.-C. Chim, K. C. L. Chan, and R. D. Murch,
hand-held and body-mounted wireless communication devices “Investigating The Impact of Smart Antennas on SAR”,
- Human models, instrumentation, and procedures - Part 2: IEEE Trans. Antennas Propag., vol. 52, no. 5, 1370-1374,
Procedure to determine the specific absorption rate (SAR) for May 2004.
wireless communication devices used in close proximity to the [7] J.-O. Mattsson, and L.P. De Leon, "SAR Evaluation of A
human body (frequency range of 30 MHz to 6 GHz)”, Mar. Multi-Antenna System", in Proc. IEEE Antennas and
2010. Propagation Int. Symp., pp. 1373- 1376, Honolulu, Jun.
[3] IEEE 1528, “IEEE Recommended Practice for 2007.
Determining the Peak Spatial-Average Specific [8] D. T. Le, T. Iyama, L. Hamada, S. Watanabe, and T.
Absorption Rate (SAR) in the Human Head from Wireless Onishi, “Electric Field Measurements for MIMO Wireless
Communications Devices: Measurement Techniques”, Ed. Communication Transmitters in Electromagnetic
2013. Exposure Evaluation” in Proc. Of Pan-Pacific EMC Joint
[4] DASY52 by SPEAG,http://www.speag.com/products/das Meeting (PPEMC’12), Tokyo, Japan, Nov. 2012.
-y /dasy-systems/
[5] ART-MAN by ART-Fi, http://www.art-fi.eu/art-man
168
168
HộiHội Thảo
Thảo QuốcGia
Quốc Gia2015
2015về
vềĐiện
Điện Tử,
Tử,Truyền
Truyền Thông
Thông và
vàCông
CôngNghệ
NghệThông TinTin
Thông (ECIT 2015)
(ECIT 2015)
Nâng Cao Tín Hiệu Tiếng Nói Bằng Giảm Nhiễu Phi
Tuyến Dựa Vào Miền Wavelet
Tuan V. Tran Tuan V. Pham
Faculty of Electronic and Telecommunication Faculty of Electronic and Telecommunication
Danang University of Science and Technology Center of Excellence
Da Nang, Viet Nam Danang University of Science and Technology
tuantran.kl@engineer.com Da Nang, Viet Nam
pvtuan@dut.udn.vn
Tóm tắt— Trong bài báo này, các thuật toán nâng cao tiếng bày một thuật toán sẽ giúp tối thiểu hóa việc méo tiếng nói bị
nói được đề xuất bởi việc dùng biến đổi các gói wavelet để gây bởi nhiễu dư được đề cập trong [4]. Trong khi đó,
tang khả năng phân tích tín hiệu. Trong khi đó, phương Kirubagari vaf Subathra là dùng sự kết hợp của phương pháp
pháp lọc thống kê cảm quan dựa trên wavelet cũng được tối thiểu hóa sai số bình phương và bộ lọc trừ để nâng cao chất
khai thác để lấy được sự ước lượng ngưỡng nhiễu tốt hơn lượng tiếng nói đề cập trong [5]. Phương pháp biến đổi
và thuật toán nén tối toán được áp dụng để nén nhiễu. Các Wavelet Dual tree complex được đề xuất bởi Tasmaz trong bài
phương pháp đánh giá khách quan dùng PESQ và báo [6]. Một kỹ thuật khác dựa trên Wavlet là Robust hybrid
SegSNR chỉ ra rằng các kết quả của các thuật toán đã đề adaptive perceptual wavelet packet threshold được đề xuất bởi
xuất đạt được những kết quả tốt về chất lượng khi so sánh Jain B và được đề cập trong [7].
với các thuật toán khác trong miền tần số. Bên cạnh đó, Trong bài báo này, một thuật toán được đề xuất dựa vào việc
việc đánh giá chủ quan được thực hiện bằng việc dùng sử dụng phân tích gói wavelet để hỗ trợ cho quá trình phân
Mean Opinion Score (MOS) và kết quả đạt được từ việc tích tín hiệu, các thuật toán ước lượng nhiễu cũng sẽ được sử
kiểm tra này không những cho thấy có cùng kết luận với dụng để xác định các ngưỡng tốt hơn và cuối cùng các thuật
phương pháp đánh giá khách quan và còn khẳng định toán giảm nhiễu là được dùng để hoàn thành hệ thống nâng
trong việc tin tưởng hơn vào độ chính xác của các phương cao tín hiệu tiếng nói. Sơ đồ của thuật toán đã đề xuất là được
pháp đánh giá khách quan. mô tả trong hình 1.1 phía dưới:
Từ khóa—Wavelet Packet, Percentile Filter, Voice Activity

Detection , Wavelet thresholding, Wavelet Shrinking.
I. GIỚI THIỆU
Vẫn đề xử lý tiếng nói khi bị anh hưởng bởi nhiều loại nhiễu
vẫn còn là một thách thức lớn và các thuật toán nâng cao tiếng
nói vẫn đang được phát triển và nghiên cứu để hỗ trợ tốt hơn
cho các ứng dụng như nhận dạng tiếng nói, nhận dạng người
nói. Tại bài báo này, thuật toán nâng cao tiếng nói dựa vào
việc phân tích các gói wavelet và kết hợp với các kỹ thuật để
đạt được các ngưỡng nhiễu tốt hơn là được đề xuất để giảm
nhiễu trong tiếng nói.
Có nhiều phương pháp đã được tiếp cận để thực hiện việc

giảm nhiễu cho việc nâng cao tiếng nói như: Thực hiện việc
phân tích tín hiệu nhiễu và nén nhiễu bị ảnh hưởng bởi nhiễu
Gaussian và nhiễu trong thực tế dùng bộ lọc hồi qui được đề
suất bởi Suman M và Khan H trong [1]; một kỹ thuật khác mà
McCallum M và Guillemin B muốn giới thiệu trong bài báo sô
[2] thuật toán Bayesian STSA đã dùng một mô hình tiếng nói
a stochastic – deterministic để làm một sự tiên đoán trước các
thông tin bằng việc xem xét non-zero mean. Việc ước tiếng
nói tại các băng con tương đồng với sự giảm nhiễu thông qua
việc xử lý MVDR là một kỹ thuật khác được Schasse A và
Hình 1.1: Sơ đồ thuật toán
Martin R đề xuất trong [3]. Yong Zhang, Yi Liu cũng đã trình
169
ISBN: 978-604-67-0635-9 169

HộiHội Thảo
Thảo QuốcGia
Quốc Gia2015
2015về
vềĐiện
Điện Tử,
Tử,Truyền
Truyền Thông
Thông và
vàCông
CôngNghệ
NghệThông TinTin
Thông (ECIT 2015)
(ECIT 2015)
Bài báo này được chia thành năm phần. Phân II sẽ nói về các Trong đó, I0(.) và I1(.) là ký hiệu cho các hàm Bessel bậc 0 và
thuật toán giảm nhiễu trong miền tần số và việc cập nhật
nhiễu. Các thuật toán trong miền wavelet được giới thiệu trong 1 và  k được định nghĩa như sau :
phần III. Kế tiếp, phần bốn sẽ cho chúng ta thấy các kết quả
của thí nghiệm. Kết luận và các hướng nghiên cứu trong tương k
lai được thể hiện ở phần V. vk  k (2.6)
1 k
II. GIẢM NHIỄU TRONG MIỀN TẦN SỐ
Chủ đề nghiên cứu trong bài báo này là về nhiễu cộng. Khi
Với  k và k được định nghĩa như a priori SNR và a
nhìn vào hình 2.1, nhiễu trong tín hiệu tiếng nói y (n) nhận từ posteriori SNR:
microphone được tạo ra từ tín hiệu sạch x (n) đã được cộng
với nhiễu nền d (n):
k 

 x (k ) E X ( k )
2
 (2.7)


 d (k ) E D( k ) 2 
2 2
Yk Yk
k 
 d (k )


E D( k )
2
 (2.8)
Hình 2.1: Mô hình nhiễu cộng b) Log-MMSE

A. MMSE and Log-MMSE MMSE sẽ dàng thực hiện theo toán hoc nhưng nó không mang
Kết quả được đề xuất trong [2] là một trong nhiều nghiên cứu đến chúng ta ý nghĩa về việc cải thiện chất lượng của tiếng
chỉ ra rằng biên độ phổ trong thời gian ngắn có ảnh hưởng nói. Lý do là vì tiếng nói có rất nhiều thành phần biên độ thấp
mạnh đến chất lượng và tính dễ nghe của tiếng nói. Bởi vậy, nhưng mà các thành phần này đống vai trò quyết định chất
một vài nhà nghiên cứu đã đề xuất các phương pháp optimal lượng và độ dễ nghe của tiếng nói. Do đó, Ephraim và Malah
non-linear để cải thiện phổ từ phổ tín hiệu nhiễu. đã đề xuất một phương pháp có ý nghĩa hơn đó là việc dùng
Log- MMSE [8]:
a) Minimum Mean Sequare Error (MMSE)
Ước lượng phổ biên độ MMSE(Minimum Mean Square Error)


e  E  log X k   log Xˆ k 
2

  (2.9)
tối thiểu hóa sai số bình phương trung bình giữa biên độ thật
và biên độ ước lượng: Khi đó,
Xˆ k  exp E ln  X k YK 


e  E  X  Xˆ 
k
2
k  (2.1) (2.10)
k  1  exp( t ) 
Xˆ k  exp  dt  Yk
Trong đó, X̂ k và X k là biên độ phổ ước lượng và phổ biên  k  1  2  k t 

B. Các kỹ thuật ước lượng và cập nhật nhiễu
độ thật của tín hiệu sạch tại tần số  k (chỉ số k dùng thay
a) Voice Activity Detection (VAD)
 k để đơn giản trong ký hiệu). Nhiễu sẽ được ước lượng lúc ban đầu bằng cách lấy trung bình
biên độ phổ của tín hiệu bị nhiễu:
1 M 1

Xˆ k  E Xk Yk    Xk p( Xk Yk )d Xk  
 2
p( Xk ,xk Yk )dxkd Xk (2.2)
Di ( )  Y ( )i
0 0 0
X k
M i 0 (2.11)
Sau đó chúng ta sẽ thực hiện so sánh biên độ phổ của nhiễu
Với các hàm mật độ xác suất: được ước lượng với biên độ phổ của tín hiệu bị nhiễu:
1  1 2 (2.3) N(i)  0.9N(i 1)  0.1N(i) (2.12)

p (Yk | X k ,  xk )  exp  Yk  X k e j xk 
 d ( k )  d ( k ) 
Nếu T 12dB [9] thì frame đó không phải là frame có tiếng
Xk  X k 2  (2.4)
p ( X k ,  xk )  exp   nói, khi đó ta có thể cập nhật lại nhiễu đã được ước lượng
 x (k )   x (k ) 
Và áp dụng định lý Bayes ta có được ước lượng của phổ biên trước đó the công tức. VAD thực hiện tốt trong môi trường
độ tiếng nói tăng cường: nhiễu ổn định nhưng không tốt trong môi trường thực tế do đó
Xˆ k  E[ X k | Yk ]
(2.5) bộ lục percentile được để xuất để khắc phục nhược điểm trên.
 vk v v v
 exp( k )[(1v
 k )I0 ( k ) v
 k I1 ( k )] Yk b) Percentile Filter
2 k 2 2 2
170
170
Hội
HộiThảo
Thảo Quốc Gia 2015
Quốc Gia 2015về
vềĐiện
ĐiệnTử,
Tử,Truyền
TruyềnThông
Thôngvà và Công
Công Nghệ
Nghệ Thông
Thông Tin (ECIT
Tin (ECIT 2015)2015)
Bộ lọc Percentile Filter [10] đã được đề xuất cho việc ước số của nó bởi các thuật toán xác định ngưỡng, những ngưỡng
lượng phổ của nhiễu trong miền tần số. Thuật toán này sẽ sau khi ước lượng sẽ được dùng để nén các hệ số nhiễu của tất
được thực hiện theo các bước sau: cả các kênh của Wavelet. Cuối cùng, tín hiệu đã xử lý sẽ được
Step 1 : Tại mỗi frame λ, tính Y ( , k )2 của khung tiếng nói bị phục hồi bởi Wavelet Packet Recovery và nó có thể thực hiện
như hình sau:
nhiễu, hệ số làm mượt  (, k) , và phổ công suất đã dược làm
trơn P(, k) .
2
P (  , k )   P (   1, k )  (1   ) Y ( , k )
(2.13)
Trong đó:  ( , k )   max . c ( )
1  P(  1, k ) / ˆ d2 (  1, k )  1
2
1
 c ( )  2
M 1 M 1

1    P (   1, k ) /  Y (  , k )  1 
2
 k 0 k 0  (2.14)
ˆ d2 (  1, k ) là ước lượng nhiễu tại khung   1

Hình 3.1: Sơ đồ thuật toán của PSWF
Step 2: Ước lượng nhiễu bằng Percentile Filter:
B. Các thuật toán xác định ngưỡng
Gọi Ds (i ) là giá trị tại mỗi vị trí trong Nf frames lưu trữ bởi
Hai phương pháp phổ biến sử dụng ngương wavelet là ngưỡng
bộ đêm b. Trong khi đó i chỉ số chạy của các khung λ liên tiếp cứng và ngưỡng mềm. Ngưỡng mềm sẽ nén các hệ số.
có được trong bộ nhớ đệm b. Thực hiện ước lượng percentile a) Thuật toán xác định ngưỡng cứng
Thuật toán ngưỡng cứng thực hiện như biểu thức sau:
mức nhiễu như sau:
- Sắp xếp Ds (i ) theo thứ tự tăng dần qua toàn bộ đệm

(3.1)
thứ b để có Ds (i ') with i’= [1, 2, 3… N f ]. b) Thuật toán xác định ngưỡng mềm
Thuật toán ngưỡng mềm được định nghĩa như sau:
Xác định mức ngưỡng thích nghi Tq ( b ) (i ) bằng cách lấy phần
trăm q (b)th theo công thức: Tq (b ) (i)  Ds (i ') | i '   q(b) N f 
q(b) được lựa chọn sao cho thích nghi với mỗi bộ đệm để đạt (3.2)
được mức ước lượng tốt nhất. Tiếp theo q(b) được định nghĩa:
C. Giảm nhiễu thích nghi theo µ - Law
q(b)  i ' If Ds (i ')  Ds (i ' 4)   (2.15)
Một thuật toán khác nhằm giảm nhiễu dựa trên Wavelet và nó
Hệ số q=0.35 được chọn sau khi thực hiện các bước như trên.
được biết như một sự cải thiện của thuật toán ngưỡng cứng
Giả sử rằng nhiễu không thay đổi nhanh bằng tiếng nói theo
như hình 3.2 theo µ-law. Qui luật của việc nén là được thể
thời gian, mức ngưỡng của nhiễu ước lượng theo phần trăm
được làm phẳng bằng cách áp dụng mô hình hồi qui bậc 1 với hiện bởi hàm posteriori  k ,i như sau:
hệ số α là 0.96: 1 , if  k ,i  1
 
Tq ( b ) (i )   Tq ( b 1) (i  1)  (1   )Tq ( b ) (i ) (2.16) H k ,i   (1   k ,i ) k , i  1
sgn Yk ,i ( p ) , if  k ,i  1
  k ,i  k , i
(3.3)
III. GIẢM NHIỄU DỰA VÀO PHẦN TÍCH GÓI WAVELET
Trong đó:
A. Phương pháp dùng bộ lọc wavelet thống kê có tính cảm
quan  Y k , i ( p) và áp dụng tham số  k , i được định
 k, i 
Phương pháp này được đề xuất dựa trên việc phân tích tín hiệu k , i
nhiễu của Wavelet Packet Decomposition khi đó các mức
nhiễu sẽ được ước ượng từ mỗi gói wavelet tương đông với hệ nghĩa bởi [2]:
171
171
HộiHội
Thảo Quốc
Thảo QuốcGia
Gia2015
2015về
vềĐiện
Điện Tử,
Tử,Truyền
Nghệ Thông
Thông TinTin (ECIT
(ECIT 2015)
2015)
 ~  max| Y ( p ) | A. Kết quả đánh giá khách quan

  k ,i  p k ,i (3.4)
 k ,i  exp  ~  ~
 max{  k ,i }   k ,i
 i 
Trong đó, Hàm mũ exp tự thích nghi với chính nó bởi nhiễu
~
được làm trơn và chuẩn hóa  k ,i với hằng số độ dốc  5.8.
Hình 4.1: Các thuậ toán nén nhiễu được đánh giá bởi PESQ
với môi trường nhiễu BABBLE
Trong hình 4.1, kết quả của phương pháp PESQ đã cho thấy
rằng các thuật toán trong miền tần số có kết quả tốt hơn các
thuật toán trong miền wavelet. Kết quả này thật sự ấn tượng
với thuật toán NSS-PF. Trong miền wavelet thì thuật toán
Shrinking – UT – PF có một kết quả cũng tốt và nó cũng cho
thấy hiệu quả hơn các thuật toán khác trong miền wavelet.
SoftTh – PF đã có một kết quả không như mong đợi khi nó
được dùng để xử lý nhiễu trong môi trường nhiễu BABBLE.
B. Kết quả đánh giá chủ quan
Hình 3.2: Đặc tuyên hàm nén nhiễu trong

miền wavelet.
IV. KẾT QUẢ THÍ NGHIỆM VÀ ĐÁNH GIÁ

Các thuật toán trong miền wavelet và các thuật toán đã được
cải thiện trong miền tần số là được sử dụng để xử lý các tín
hiệu nhiễu, các tín hiệu nhiễu này cung được xây dựng trên cơ
sở dữ theo tiêu chuẩn IEEE. Những mẫu tín hiệu tiếng nói này
sẽ được cộng vào các loại nhiễu khác nhau như CAR,
BABBLE, WHITE, STREET và TRAIN. Hơn nữa, nhiều mức
nhiễu khác nhau sẽ cho ra kết quả chính xác hơn. Những kết Với biểu đồ hình 4.2, chúng ta có thể thấy rằng kết quả sau khi
quả này sẽ được đánh giá thông qua các phương pháp đánh giá chúng ta thực hiện khảo sát để hoàn thành việc đánh giá chủ
khách quan là PESQ và SegSNR, bởi vì những phương pháp quan. Chúng ta có thể có một cái nhìn tổng quát hơn khi nhìn
này có độ ổn định và tin cậy cao [11] nên được IEEE khuyến vào biểu đồ này, kết quả chỉ ra rằng thuật toán Shrinking – UT
cáo nên sử dụng để đánh giá các tín hiệu đã tăng cường. Hình
– PF 4.2:
làm Biểu
việc rất đồ
tốtso
vàsánh khảquả
đạt kết năng
tốtxử
khilýthuật
nhiễutoán
các này
thuật toán
được
Những tín hiệu đã được tăng cường cũng được sử dụng đẻ hỗ dùng để xử lý tín hiệuvới mức tại
nhiễu SNRcác– môi
5dB trường nhiễu khác
trợ cho việc đánh giá chủ quan với phương pháp Mean nhau mà chúng ta đang xét, đặc biệt là xử lý tốt với loại nhiễu
Opinion Score (MOS). WHITE. Nếu chúng ta so sánh kết quả đánh giá giữa đánh giá
khách quan và đánh giá chủ quan, chúng ta sẽ thấy chúng gần
như có cùng kết quả ví dụ như kết quả của Shrinking – UT –
PF đạt được kết quả cao với tín hiệu nhiễu do BABBLE.
172
172
HộiHội
C. So sánh kết quả đánh giá khách quan và chủ quan câu thoại đã được cộng nhiễu ban đầu. Sau đó tiến hành tính
giá trị trung bình các chỉ số trên cơ sở 30 câu ứng với 4 mức
SNR trong 5 môi trường nhiễu, bởi vậy chúng tôi có thể nói
rằng kết quả kiểm tra của chúng tôi được đảm bảo. Những
thuật toán cũng được phân tích và so sánh hiệu suất của việc
xử lý trực tiếp bởi các phương pháp đánh giá khách quan như:
IS, CEP, LLR, WSS, PESQ và SNRseg. Sự đánh giá đã cho
thấy rằng các thuậ toán trong miền tần số như MMSE-PF cho
chúng ta kết quả hay hiệu suất xử lý tốt với sự giảm nhiễu lớn
nhất và trong miền Wavelet là thuật toán Shrinking – UT –PF
cho chúng ta thấy được kết quả tốt hơn những thuật toán khác,
đặc biệt là khi thuật toán này được dùng để xử lý nhiễu
WHITE. Hơn nữa, thuật toán này còn nén tốt hơn, ít tác động
xấu đến tín hiệu như gây méo tín hiệu và đảm bảo được tính
dễ nghe của tín hiệu sau khi xử lý. Trong tương lai chúng tôi
vẫn muốn nghiên cứu sâu hơn để cải thiện hơn giải pháp này
cho việc tối ưu hơn nữa khả năng nén nhiễu trong miền
wavelet và tiếp tục so sánh với các thuật toán trong miền tần
số để đánh giá hiệu quả của việc nâng cao tín hiệu cho người
nghe. Chúng tôi cũng đã thực hiện việc đánh giá chủ quan và
kết quả mà chúng tôi đạt được từ sự đánh giá này giúp cho
chúng tôi tin rằng những phương pháp đánh giá khách quan
như PESQ, SegSNR là đáng tin cậy bởi vậy chúng tôi hoàn
toàn tin tưởng những phương pháp này khi sử dụng đánh giá
trong thí nghiệm.
LỜI CÁM ƠN
Chúng tôi muốn gửi lời cám ơn đặc biệt đến PGS.TS Phạm
Văn Tuấn và ThS. Võ Thị Diệu Hanh. Nghiên cứu này đã cho
thấy những thách thức và khó khan khi thực hiện. Tất cả
Hình 4.3: Biểu đồ so sánh khả năng xử lý nhiễu và sự chúng tôi thật sự không thể hoàn thành nghiên cứu này nếu
tương đồng của 2 phương pháp đánh giá tại SNR – 5dB không có sự giúp đỡ của họ.
Thông qua việc quan sát hình ảnh ở trên tại mức 5dB và so
sánh với biểu đồ phía dưới chúng ta có thể nhận ra được sự
tương đồng giữa đánh giá khách quan và đánh giá chủ quan. [1] Suman, M. ; K.L. Univ., Guntur, India ; Khan,
Đặc biệt, hình ảnh ở trên cho thấy các thuật toán trong miền H. ; Latha, M.M. ; Kumari, D.A. “Performance analysis
tần số như LogMMSE-PF và NSS-PF đã đạt được kết quả xử
lý tốt với nhiễu BABBLE, những thanh Error bar ở dưới của of enhanced noisy compressed speech signal corrupted
những thuật toán này là khá tương đồng và trong biểu đồ phía by Gaussian and real world noise using recursive
dưới chúng ta cũng thấy được kết quả tương tự. Thuật toán
Shrinking – UT – PF (Optimal Shrinking) trong biểu đồ phía filter”,IEEE, p 340-348, Jan 2015.
dưới cho chúng ta thấy kết quả lớn nhất nhưng nó lại có sự [2] Tasmaz, H.; Elektrik-Elektron. Muhendisligi Bolumu,
chênh lệch lớn bởi vậy kết quả này sẽ ít sự chính xác nhưng
cũng gần với kết quả đánh giá chủ quan. Adiyaman Univ. Muhendislik Fak., Adyaman, Turkey,
V. KẾT LUẬN “Dual tree complex wavelet transform based speech

Với bài báo này, chúng tôi đã trình bày kết quả và đề xuất giải enhancement”, IEEE, p 823 – 826, May 2015.
pháp mới để cải thiện chất lượng tiếng nói dựa vào các [3] Schasse, A.; Inst. of Commun. Acoust, Ruhr-Univ.
phương pháp ước lượng và giảm nhiễu phi tuyến tối ưu cả
trong miền tần số và miền wavelet. Nội dung của sự nghiên Bochum, Bochum, Germany; Martin, R., “Estimation
cứu này được tập trung vào việc nén nhiễu trong miền wavelet of Subband Speech Correlations for Noise Reduction
với ngưỡng mềm and ngưỡng cứng. Bên cạnh đó, những thuật
toán ước lượng như Percentile Filter được tích hợp vào bên via MVDR Processing”, IEEE, p 1355 – 1365, July
trong các hàm nén nhiễu để phát triển các thuật toán như: 2014.
NSS_PF, LogMMSE-PF, MMSE-PF, HardThr-PF, SoftThr-
PF and Shrinking-UT-PF. Bằng việc dùng một cơ sở dữ liệu [4] Yong Zhang; ShenZhen Key Lab. of Intell. Media &
lớn gồm 3600 câu thoại đã được xử lý giảm nhiễu so với 600 Speech, Peking Univ. ShenZhen Res. Inst., Shenzhen,
173
173
HộiHội
China ; Yi Liu, “A novel perceptual distortion [10] Pham T.V., Gernot Kubin, Erhard Rank, "Robust
minimization speech enhancement algorithm”, IEEE, p Speech Recognition Using Adaptive Noise Threshold
1- 6, July 2014. Estimation and Wavelet Shrinkage", Proc. IEEE ICCE,
[5] Kirubagari, B.; Dept. of Comput. Sci. & Eng., Hoi an, Vietnam, p 04-06, Feb 2008.
Annamalai Univ., Annamalai Nagar, India ; Palanivel, [11] Hu Y. and Loizou P.C., “Evaluation of Objective
S. ; Subathra, N., “Speech enhancement using Quality Measures for Speech Enhancement”, IEEE, p
minimum mean square error filter and spectral 229 -238, Jan 2008.
subtraction filter”, IEEE, p 1 – 7, Feb 2014. [12] Cohen I., “Speech enhancement using a noncausal a
[6] McCallum, M.; Dept. of Electr. & Comput. Eng., Univ. Priori SNR estimator”, IEEE Signal Processing Letters,
of Auckland, Auckland, New Zealand; Guillemin, B. vol. 11, no.9, pp 725-728, Sept 2004.
“Stochastic-Deterministic MMSE STFT Speech [13] Singh, S.; Dept. of Electr. Eng., Indian Inst. of Technol.
Enhancement with General A Priori Information”, Roorkee, Roorkee, India; Tripathy, M. ; Anand, R.S.,
IEEE, p 1445 – 1457, July 2013. “A fuzzy mask based on wavelet packet for improving
[7] Jain, B.; Poornima Coll. of Eng., Sitapura, speech quality and intelligibility”, IEEE, p 1 – 4, Feb
India; Bansal, A.K., “Robust hybrid adaptive 2014.
perceptual wavelet packet threshold to enhance speech [14] Pham T.V., Gernot Kubin, "WPD-based Noise
in adverse noisy environment”, IEEE, p 1 – 6, May Suppression Using Nonlinearly Weighted Threshold
2014. Quantile Estimation and Optimal Wavelet Shrinking",
[8] Bensty J., Jingdong Chen and Yiteng Arden Huang, Proc. Interspeech, Lisboa, Portugal, p 4-8, Sep 2005.
‘Noise Reduction Algorithms in a Generalizaed [15] Zhang Jie; Coll. of Electron. & Inf. Eng., Tongji Univ.,
Transform Domain”, IEEE Transaction on Audio, Shanghai, China ; Xiaoqun Zhao ; Jingyun Xu ; Zhang
Speech, and Language Processing, vol.17, No.6, 2009. Yang, “Suitability of speech quality evaluation
[9] Steven F.Boll,“Suppression of Acoustic Noise in measures in speech enhancement”, IEEE, p 22-26, July
Speech Using Spectral Subtraction”,IEEE, p 113 – 120, 2014.
Jan 2003
174
174
HộiHội
Anten Dò Sóng Terahertz Trong Hệ Quang Phổ Miền

Thời Gian Dùng Xung Laser Femto Giây
Nguyễn Trương Khang(1,2,*), Nguyễn Thanh Tú(3), Đặng Lê Khoa(3), Hứa Thị Hoàng Yến(4), và Huỳnh Văn Tuấn(4)
1
Viện Khoa học Tính toán, Trường Đại học Tôn Đức Thắng
2
Khoa Điện-Điện tử, Trường Đại học Tôn Đức Thắng
3
Khoa Điện tử viễn thông, Trường Đại học Khoa học Tự nhiên TP. HCM
4
Khoa Vật lý - Vật lý Kỹ thuật, Trường Đại học Khoa học Tự nhiên TP. HCM
*
nguyentruongkhang@tdt.edu.vn
Tóm tắt— Trong bài báo này, chúng tôi đề xuất ba cấu trúc anten II. MÔ PHỎNG VÀ THỰC NGHIỆM
quang dẫn có thể sử dụng như những thiết bị dò sóng THz trong
hệ quang phổ miền thời gian dùng xung laser femto giây. Đặc Nhằm đạt được khả năng dò sóng THz với độ nhạy cao và
tính dò sóng THz của từng cấu trúc anten được mô phỏng và trong một dải tần số rộng như mong muốn, chúng tôi đề xuất 3
kiểm chứng thực nghiệm. Độ nhạy hồi đáp theo tần số của từng cấu trúc anten quang dẫn khác nhau, đó là anten hình chữ H
anten cho các dạng phổ khác nhau, và kết quả thực nghiệm khá (Grischkowsky), anten hình chữ I (stripline), và anten hình nơ
phù hợp với kết quả lý thuyết và mô phỏng được dự đoán. bướm (bowtie), hình 1(a). Vì xung THz có thể được dò nhờ
vào quá trình thay đổi của dòng quang điện tức thời (transient
Từ khóa- anten quang dẫn, laser femto giây, quang phổ miền photocurrent) xảy ra trong vật liệu bán dẫn, mô hình Drude-
thời gian, Terahertz. Lorentz được sử dụng để tính dòng quang điện này
I. GIỚI THIỆU
Trong những năm gần đây, sóng Terahertz (THz) được sử
dụng rộng rãi trong công nghệ xử lý ảnh y học, truyền thông,
quang phổ học, và cảm biến nhờ vào những đặc tính độc đáo
của nó như tính truyền qua các vật liệu phi kim loại, năng
lượng photon thấp tương ứng với các mode dao động cơ bản
của nhiều loại phân tử. Trong những ứng dụng cụ thể, khả năng
dò sóng THz với độ nhạy cao trong một dải tần số rộng thường
được quan tâm đặc biệt. Vì thế, kỹ thuật dò sóng THz là một
trong những lĩnh vực nghiên cứu quan trọng của công nghệ
THz. Cho đến nay, nhiều loại kỹ thuật dò sóng THz khác nhau
đã và đang liên tục được nghiên cứu và phát triển, ví dụ như kỹ
thuật cảm biến điện/nhiệt hồng ngoại, tinh thể điện-quang, hay
anten quang dẫn [1,2]. (a)
Trong số nhiều phương pháp dò sóng THz khác nhau,
phương pháp sử dụng anten quang dẫn hoạt động dựa trên cơ
chế dao động kích thích của hệ laser femto giây thì được ưa
chuộng nhờ vào tỉ số tín hiệu cực đại trên nhiễu khá tốt. Bên
cạnh đó, ta có thể dễ dàng cải thiện và thay đổi tính chất dò
sóng THz trong phương pháp này bằng việc tối ưu hóa nhiều
thông số trong hệ, ví dụ như cấu trúc hình học của anten, chất
lượng vật liệu bán dẫn, và đặc tính của nguồn laser femto giây
[3-5]. Vì vậy, phân tích lý thuyết và thực nghiệm các cấu trúc
anten quang dẫn dùng trong việc dò sóng THz là rất cần thiết.
Trong bài bài này, chúng tôi đề xuất ba cấu trúc anten quang
dẫn khác nhau cho việc dò sóng THz dùng trong hệ THz quang
phổ miền thời gian. Đặc tính dò sóng THz của từng anten được
khảo sát cả trong mô hình lý thuyết mô phỏng và thực nghiệm.
Kết quả cho thấy, anten hình chữ I và hình nơ bướm cho khả
năng dò sóng THz với độ nhạy khá cao so với anten hình chữ
H truyền thống, đặc biệt là ở vùng tần số thấp (~300 GHz), khá (b)
thích hợp cho các ứng dụng quang phổ và truyền thông không Hình 1. (a) Các cấu trúc anten khảo sát và (b) kết quả mô phỏng phổ tín hiệu
dây ở vùng tần số THz thấp này. THz dò được bằng các anten này.
ISBN: 978-604-67-0635-9 175
175
HộiHội
Thảo Quốc
Thảo Gia
Quốc 2015
ĐiệnTử,
Tử,Truyền
NghệThông
ThôngTinTin (ECIT
(ECIT 2015)
2015)
V s
I  (t) e  n(t)  μ  c
pc e g (1)
trong đó, e là điện tích của điện tử, µe là độ linh động của điện
tử, g là khoảng cách giữa hai điện cực của anten, n(t) là mật độ
hạt mang được tạo ra, Vc(t) là điện áp phụ thuộc thời gian giữa
hai điện cực anten, và s là diện tích vùng kích thích. Tiếp theo
đó, dòng THz dò được ở phía anten thu (Rx) sẽ được suy ra từ
kỹ thuật tích phân hữu hạn (FIT-Finite Integration Technique)
sử dụng một chương trình mô phỏng toàn sóng (full-wave EM
simulator) [6-8]. Cách tiếp cận mô phỏng này cho phép việc
đánh giá phổ thu được tại anten dò sóng THz được chính xác
hơn. Bên cạnh đó, nhóm chúng tôi thực hiện mô phỏng với cấu
trúc thấu kính (lens), mặc dù chiếm rất nhiều thời gian và tài
nguyên tính toán, kết quả mô phỏng cho thấy sự tương đồng
khá tốt với kết quả thực nghiệm. Hình 1(b) biểu diễn kết quả lý (a)
thuyết mô phỏng của 3 cấu trúc anten đang khảo sát. Theo đó,
cấu trúc anten hình chữ I và hình nơ buớm cho đỉnh cộng
hưởng ở tần số thấp hơn, nhưng với biên độ lớn hơn, so với
anten hình chữ H, trong khi độ rộng băng thông của sóng THz
dò bằng cấu trúc hình chữ H thì rộng hơn so với 2 anten kia.
Để kiểm chứng kết quả lý thuyết mô phỏng, chúng tôi chế
tạo 3 cấu trúc anten dựa trên các số liệu tính toán. Các cấu trúc
anten được đặt trên một lớp vật liệu bán dẫn gallium-arsenide
(GaAs) với chiều dày 1,2 μm và được mọc trong điều kiện
nhiệt độ thấp. Khoảng cách giữa hai điện cực của các anten đều
là 5 μm, đây cũng gọi là vùng kích thích anten dựa trên cơ chế
chuyển đổi từ các cặp điện tử-lỗ trống thành dòng quang điện.
Nguồn kích thích laser femto giây là một nguồn laser rắn
Ti:sapphire dựa trên cơ chế khóa mode (mode-locked) với độ
rộng xung khoảng 65 fs và bước sóng trung tâm gần 800 nm.
Khi chiếu nguồn laser này vào vùng kích thích (gap) của anten (b)
quang dẫn, các cặp điện tử-lỗ trống sẽ được kích thích và dòng
Hình 2. Tín hiệu thực nghiệm trường điện từ THz dò bằng các cấu trúc anten
quang điện chuyển tiếp (thời gian ~ ps) được hình thành nhờ khảo sát, trong đó, (a) kết quả trong miền thời gian và (b) kết quả
vào một điện áp ngoài đặt vào hai đầu điện cực của anten phát trong miền tần số.
(Tx). Trong mô hình thực nghiệm, anten phát được sử dụng là
một anten quang dẫn có cấu trúc hai dây dẫy đồng phẳng được bằng anten hình chữ H, hình chữ I, và hình nơ bướm lớn
(coplanar stripline), trong đó bề rộng mỗi dây là 10 μm và hơn biên độ tín hiệu THz dò được bằng anten tham chiếu tương
khoảng cách giữa hai dây là 80 μm. Anten phát này được ứng là 1,9, 1,2 và 1,6 lần. Hình 2(b) biểu diễn kết quả thực
quang khắc trên một lớp đế bán cách điện GaAs (semi- nghiệm này trong miền tần số bằng cách thực hiện phép biến
insulating GaAs). đổi Fourier nhanh (FFT: fast-Fourier-transform) các tín hiệu ở
Trong quá trình dò sóng THz, các xung được lấy mẫu sẽ lần hình 2(a). Theo đó, anten hình chữ I và hình nơ bướm cho độ
lượt được đồng bộ với xung THz được tạo ra ở phía anten phát, nhạy cao trong việc dò sóng THz ở vùng tần số dưới 0,6 THz,
và các xung mẫu này cũng sẽ tạo ta các cặp điện tử-lỗ trống so với anten hình chữ H.
trên vật liệu bán dẫn ở phía anten thu. Tiếp theo, trường điện từ Kết quả so sánh về độ rộng phổ nửa biên độ cực đại (Full-
THz sẽ gây ra một dòng quang điện. Theo đó, xung THz truyền width at half maximum) cho thấy, anten hình chữ I cho phổ
từ anten phát đến anten thu sẽ được dò (đo) qua việc phát hiện rộng hơn anten tham chiếu, anten hình chữ H, và anten hình nơ
sự thay đổi của dòng quang điện như một hàm trễ giữa xung bướm. Cụ thể, độ rộng phổ nửa biên độ cực đại của anten hình
lấy mẫu và xung THz chính. Thêm nữa, trong kỹ thuật đo này, chữ I vào khoảng 311% (Δf / fpeak ~ 0.56 / 0.18) trong khi đó độ
anten phát và thu thường được gắn trên một thấu kính silicon rộng phổ nửa biên độ cực đại của anten tham chiếu vào khoảng
nhằm làm tăng độ hội tụ của tín hiệu, và đồng thời bù vào độ 148% (Δf / fpeak ~ 1.29 / 0.87), của anten hình chữ H khoảng
mất năng lượng trong qua trình truyền gây ra do sự khác biệt 139% (Δf / fpeak ~ 1.17 / 0.84), và của anten nơ bướm khoảng
lớn về chiết suất giữa lớp đế GaAs và không khí [9,10]. 138% (Δf / fpeak ~ 0.25 / 0.18).
Hình 2 biểu diễn kết quả thực nghiệm trong miền thời gian Những kết quả này chỉ ra rằng, anten hình chữ I và anten
và tần số của sóng THz được dò bằng ba cấu trúc anten đang hình nơ bướm có thể dò sóng THz một cách khá hiệu quả (độ
khảo sát. Ta thấy, kết quả thực nghiệm khá tương đồng với kết nhạy cao) cho vùng tần số thấp khoảng từ 0.1 THz đến 1.0
quả lý thuyết mô phỏng cả về dạng phổ và độ lớn. Hình 2(a) THz. Thú vị hơn, căn cứ theo dạng hình học của anten hình
cho thấy, biên độ tín hiệu miền thời gian của xung THz dò chữ I và anten hình nơ bướm, chúng ta có thể nói rằng giới hạn
176
176
HộiHội
ThảoThảo Quốc
Quốc Gia
2015 ĐiệnTử,
Tử,Truyền
TruyềnThông
Thông và
và Công
CôngNghệ
NghệThông
ThôngTinTin
(ECIT 2015)
(ECIT 2015)
biên dưới của vùng tần số THz có thể dò được bằng kỹ thuật TÀI LIỆU THAM KHẢO
dùng anten quang dẫn là vào khoảng tần số 0,2 THz. Nói cách [1] B. Ferguson and X. -C. Zhang, “Materials for terahertz science and
khác, cho dù độ dài của anten được tăng liên tục thì tần số đỉnh technology,” Nat. Mater., vol. 1, pp. 26-33, September 2002.
của phổ dò sóng THz sẽ gặp một giới hạn nhất định [11]. [2] G. Chattopadhyay, “Technology, capabilities, and performance of
lowpower terahertz sources,” IEEE Trans. THz Sci. Technol., vol. 1, pp.
33–53, September 2011.
III. KẾT LUẬN [3] P. Smith, D. Auston, and M. Nuss, “Subpicosecond photoconducting
Chúng tôi đề xuất và tính toán lý thuyết mô phỏng cũng dipole antennas,” IEEE J. Quantum Electron., vol. 24, pp. 255-260,
February 1988.
như tiến hành làm thực nghiệm đặc tính dò sóng THz của các
loại anten quang dẫn khác nhau. Kết quả cho thấy, anten hình [4] T. K. Nguyen and I. Park, “Effects of antenna design parameters on the
characteristics of a terahertz photoconductive dipole antenna”, Prog. in
chữ I và hình nơ bướm cho khả năng dò sóng THz với độ nhạy Electromag. Research M, vol. 28, pp. 129–143, 2013.
khá cao so với anten hình chữ H, đặc biệt là ở vùng tần số thấp. [5] G. Ducournau, Y. Yoshimizu, S. Hisatake, F. Pavanello, E. Peytavit,
Theo đó, hai anten này khá thích hợp cho các ứng dụng quang M.Zaknoune, T. Nagatsuma, J.-F. Lampin, “Coherent THz
phổ và truyền thông không dây ở vùng tần số THz thấp này. communication at 200 GHz using a frequency comb, UTC-PD and
Qua nghiên cứu này, chúng tôi tin rằng, độ nhạy và băng thông electronic detection”, IEEE J. Electron. Lett., vol. 50, pp. 386 – 388,
hồi đáp của anten quang dẫn trong hệ xung THz miền thời gian February 2014.
hoàn toàn có thể được cải thiện bằng việc thay đổi và tối ưu [6] D. H. Auston, “Impulse response of photoconductors in transmission
lines,” IEEE J. Quantum Electron., vol. 19, pp. 639–648, April 1983.
hóa cấu trúc hình học của anten.
[7] J. F. Holzman, F. E. Vermeulen, and A. Y. Elezzabi, “Ultrafast
photoconductive self-switching of subpicosecond electrical pulses,”
IEEE J. Quantum Electron., vol. 36, pp. 130–136, February 2000.
LỜI CẢM ƠN [8] CST Microwave Studio, CST GmbH, 2015. http://www.cst.com.
Nghiên cứu này được tài trợ bởi Quỹ phát triển khoa học và [9] M. V. Exter, C. Fattinger, and D. Grischkowsky, “High-brightness
công nghệ quốc gia (NAFOSTED) trong đề tài mã số “103.05- terahertz beams characterized with an ultrafast detector,” Appl. Phys.
2013.75”. Lett., vol. 55, pp. 337-339, July 1989.
[10] J. T. Darrow, X. -C. Zhang, D. H. Auston, and J. D. Morse, “Saturation
properties of large aperture photoconducting antennas,” IEEE J.
Quantum Electron., vol. 28, pp. 1607-1616, June 1992.
[11] F. Miyamaru, Y. Saito, K. Yamamoto, T. Furuya, S. Nishizawa, and M.
Tani, “Dependence of emission of terahertz radiation on geometrical
parameters of dipole photoconductive antennas,” Appl. Phys. Lett., vol.
96, pp. 211104.1-211104.3, 2010.
177
177
HộiHội
Thảo Quốc
Thảo Gia
Quốc 2015
Gia 2015về
vềĐiện
ĐiệnTử,
Tử,Truyền
NghệThông
ThôngTinTin (ECIT
(ECIT 2015)
2015)
Đánh Giá Hiệu Quả Cập Nhật Nhiễu Trực Tuyến Trong
Các Thuật Toán Nâng Cao Chất Lượng Tiếng Nói
Đào Văn Lân, Hoàng Văn Phúc và Vũ Hỏa Tiễn
Trường Đại học Kỹ thuật Lê Quý Đôn, 236 Hoàng Quốc Việt, Hà Nội, Việt Nam
Email: kqha1025@gmail.com, phuchv@mta.edu.vn, hoatien57@yahoo.com
Tóm tắt – ực hiện kh o sát và hiệu quả nhiễu trực tuyến được mô tả trong ph n III. Cuối cùng
đ ệu qu của việc cập nhật nhiễu trực tuyến theo thời ph n V là nh ng kết luận.
gian trong các thuật toán nâng cao chấ lượng tiếng nói. Việc
kh s v đ được thực hiện cho ba dạng thuật toán
chính là: thuật toán dựa trên mô hình thống kê; thuật toán không II. QUY TẮC CẬP NHẬT NHIỄU TRỰC TUYẾN
gian con (subspace); thuật toán trừ phổ. Bên cạ đ Trong các tài liệu [1, 3, 4, 7, 15, 6 đ đưa ra một số
ũ đề xuấ p ươ p p chọn giá trị ưỡng quyế định tín phương pháp cập nhật nhiễu theo thời gian trong các thuật toán
hiệu phù hợp với mỗi ứng dụng cụ thể xử lý nâng cao chất lượng tiếng nói.
Từ khóa- Speech enhancement, statistical model based methods, Cập nhật nhiễu trực tuyến là phương pháp thực hiện liên tục
subspace algorithms, spectral-subtractive algorithms. việc cập nhật phổ của nhiễu trong các chu kỳ trích mẫu song
song với việc thực hiện các thuật toán xử lý tín hiệu tiếng nói.
Căn cứ để thực hiện việc cập nhật nhiễu trực tuyến là phát hiện
I. GIỚI THIỆU tiếng nói (VAD: Voice Activity Detection) để cập nhật phổ
nhiễu trong các khoảng chu kỳ không có tiếng nói.
Hiện nay, có rất nhiều nghiên cứu liên quan đến việc xử lý
tiếng nói ứng dụng trong nhận dạng con người, nhận dạng nội Trong các thuật toán dựa trên mô hình thống kê [1], vấn đề
dung tiếng nói, chuyển tiếng nói sang văn bản, chuyển từ tiếng đặt ra trong việc nâng cao chất lượng tiếng nói là phải đề ra
nói sang tiếng nói như các tài liệu - đ đề cập được khung mô tả mang tính thống kê, là một tập các phép đo
tương ứng với hệ chuyển đổi Fourier của tín hiệu nhiễu và
Hình là sơ đồ khối tổng quát của các ứng dụng xử lý số chúng ta mong muốn tìm ra được một phương pháp ước lượng
tín hiệu tiếng nói. Sau khi chuyển đổi từ tương tự sang số tuyến tính hoặc phi tuyến với các tham số có lợi đó là hệ
(ADC), tín hiệu đ u vào bao gồm cả tín hiệu có ích (tiếng nói) chuyển đổi tín hiệu sạch.
và nhiễu từ nhiều nguồn khác nhau (như tiếng ô tô, xe máy,
tiếng ồn tại nhà máy… ). Vì thế tất cả các ứng dụng đều sử Quy luật cập nhật nhiễu trực tuyến đối với các thuật toán
dụng khối tiền xử lý, nhằm nâng cao chất lượng tiếng nói trước dựa trên mô hình thống kê [1, 2, 8, 9, 5 được quyết định bởi
khi áp dụng các thuật toán ứng dụng cụ thể. Trong khối tiền xử các công thức (1) và (2).
lý việc cập nhật nhiễu (noise update) có ý nghĩa rất quan H1
trọng, ảnh hưởng đến chất lượng của các thuật toán nâng cao 1 N 1  (1)
chất lượng tiếng nói.  log  k 
N k 1 
H0
N ậ dạ ườ
N ậ dạ ộ du 1   k k 
ế Với  k  exp  
( ế
í ệu v
, ễu)
K ố
â
ề xử lý
a ấ ……. í ệu a
1  k 1   k 
lượ ế C u ể ừ ế
sa vă Dk (i) (1   ).Yk2 (i)  Dk (i  1)
 (2)
C u ể ế
sa ế Trong đó γk, ξk tương ứng với tỷ số tín hiệu/nhiễu (SNR)
tiên nghiệm và hậu nghiệm [15].
Hình 1. Sơ đồ tổng quát ứng dụng xử lý số tín hiệu tiếng nói.
N là số điểm thực hiện thuật toán FFT.
Mục đích chính của bài báo này là khảo sát đánh giá hiệu H1 là giả thiết rằng tín hiệu đ u vào gồm tín hiệu có ích là
quả của việc cập nhật nhiễu trực tuyến đối với các thuật toán tiếng nói, còn H0 là giả thiết rằng tín hiệu đ u vào chỉ có nhiễu.
nâng cao chất lượng tiếng nói trong khối tiền xử lý nâng cao
chất lượng tiếng nói như được mô tả trong hình 1. Nội dung δ là giá trị ngưỡng quyết định tín hiệu vào chỉ có nhiễu hay
tiếp theo của bài báo, trong ph n tác giả sẽ giới thiệu qui tắc gồm cả tín hiệu có ích.
cập nhật nhiễu trực tuyến và kết quả thực nghiệm Đánh giá Dk(i) là công suất phổ của nhiễu tại khung thứ i (t n số k).
ISBN: 978-604-67-0635-9 178
178
Yk2 (i ) là công suất phổ của tín hiệu gồm cả tiếng nói và Tiêu chí để đánh giá chất lượng của các thuật toán nâng cao
chất lượng tiếng nói theo [1, 5] gồm độ méo tín hiệu tiếng nói
nhiễu.
(SIG), nền nhiễu (BAK) và hiệu ứng tổng thể (OVL).
β là hằng số làm mịn (smoothing constant) chọn trong dải Trong bài báo này tác giả đề xuất phương pháp tìm giá trị
(0<β<1) và ở đây giá trị được chọn (trừ trường hợp của phương tối ưu của δ từ thực nghiệm theo các bước sau:
pháp trừ phổ) là β = 0,98.
Bước 1: Khảo sát và đánh giá từng thuật toán nâng cao chất
Thuật toán nâng cao chất lượng tiếng nói theo phương pháp lượng tiếng nói với các giá trị δ khác nhau theo các tiêu chí ở
trừ phổ [1] dựa trên nguyên lý sau: giả sử tín hiệu nhiễu có các bảng 1-3.
dạng cộng tính, ta có thể ước lượng được phổ của tín hiệu sạch
Bước 2: Từ bước 1, chọn giá trị δ cho kết quả ứng với các
bằng cách trừ ước lượng phổ của tiếng nói có nhiễu cho ước
tiêu chí tốt nhất.
lượng phổ của nhiễu. Phổ của nhiễu có thể được ước lượng và
cập nhật trong các khoảng thời gian không có tiếng nói. Bảng 1. Hệ số độ méo của tín hiệu (SIG).
Quy luật cập nhật nhiễu trực tuyến lớp các thuật toán trừ Giá trị Đánh giá
phổ được quyết định theo các công thức (3) và (4) trong các tài
liệu tham khảo [1,17]. 5 Rất tự nhiên, không có suy hao
4 Khá tự nhiên, mức suy hao rất nhỏ
 ei  2

 k bi Y i (k )   3 Ít tự nhiên, mức suy hao nhỏ
(3)
SNRi (dB)  10 log10  e  
2 Khá tự nhiên, khá suy hao
 i b Di (k ) 2  
 k i  1 Rất không tự nhiên và mức suy hao lớn
 
D
 (i)
2
 . D(i 1)  (1   ). Y(i)
2
(4)
Bảng 2. Hệ số nền nhiễu (BAK).
Riêng với thuật toán trừ phổ, giá trị β được chọn là 0,9. Giá trị Đánh giá
Lớp các thuật toán không gian con là phương pháp chủ 5 Không thể nhận ra
yếu dựa trên lý thuyết đại số tuyến tính Hơn n a, các thuật 4 Có thể nhận ra một chút
toán này dựa trên giả thiết là tín hiệu sạch có thể được giới hạn
trong một không gian con của không gian nhiễu Euclid. Vì vậy, 3 Có thể nhận ra nhưng khó chịu
phương pháp này phân tách không gian vector của tín hiệu có 2 Tương đối dễ nhận ra tương đối khó chịu
nhiễu thành không gian con chứa chủ yếu là tín hiệu sạch bằng 1 Rất dễ nhận ra, rất khó chịu
cách bỏ qua các thành ph n của vector nhiễu ở trong không
gian con nhiễu.
Bảng 3. Hiệu ứng tổng thể (OVL).
Với lớp các thuật toán không gian con (subspace), quy luật
cập nhật nhiễu trực tuyến [1, 16, 18, 9 được quyết định bởi Giá trị Đánh giá
các công thức (5) và (6).
5 Rất tốt (Excellent)
Ry (1,1)  4 Tốt (Good)
Ry Rx  Rn ;   (5)
Rn (1,1)  3 Trung bình (Fair)
2 Kém (Poor)
R
n  .Rn  (1   ).R y (6)
1 Tồi (Bad)
Với Ry, Rx, Rn tương ứng là ma trận hiệp phương sai của tín
hiệu có nhiễu, tín hiệu sạch, nhiễu. Trong số các thuật toán nâng cao chất lượng tiếng nói dựa
trên mô hình thống kê tác giả chọn các thuật toán SE
Trong thuật toán không gian con, giá trị β được chọn là
log SE log SE SPU trình bày trong để khảo sát với
0,98.
các giá trị δ khác nhau Trong đó SE (minimum mean-
square-error) là thuật toán tối ưu theo sai số trung bình bình
III. THỰC NGHIỆM VÀ ĐÁNH GIÁ KẾT QUẢ phương nhỏ nhất, logMMSE (MMSE log-spectral amplitude
D liệu phục vụ khảo sát và đánh giá kết quả trong bài báo estimator) là thuật toán logarithm ước lượng biên độ phổ theo
này được lấy trên cơ sở tham khảo [1,6], theo đó tín hiệu tiếng tối ưu sai số trung bình bình phương nhỏ nhất, logMMSE_SPU
nói sạch trong một file tiếng nói (“sp04.wav”) và tín hiệu có (logMMSE under signal presence uncertainty) là thuật toán dựa
nhiễu thì được tạo trong một file khác trên thuật toán logMMSE khi không chắc chắn có tín hiệu tiếng
(“sp04_babble_sn10.wav”). nói. Kết quả khảo sát thể hiện trên các hình 2-4.
179
179
HộiHội
ThảoThảo Quốc
Quốc Gia
2015 ĐiệnTử,
Tử,Truyền
TruyềnThông
Thông và
và Công
CôngNghệ
NghệThông
ThôngTinTin
(ECIT 2015)
(ECIT 2015)
Từ kết quả khảo sát thực nghiệm trên các hình 2-4 cho thấy, Kết quả khảo sát thuật toán nâng cao chất lượng tiếng nói
đối với các thuật toán nâng cao chất lượng tiếng nói dựa trên trừ phổ với các giá trị δ khác nhau thể hiện trên hình 5. Từ
mô hình thống kê, khi δ = 0,9, cho hiệu quả nâng cao chất nh ng kết quả đó ta rút ra nhận xét là đối với thuật toán trừ phổ
lượng tiếng nói tốt nhất theo các tiêu chí SIG, BAK, OVL theo thì giá trị δ=5,5 cho hiệu quả nâng cao chất lượng tiếng nói là
các bảng 1-3. tốt nhất theo cả ba tiêu chí đ dẫn ra trong các bảng 1-3.
§å thÞ kh¶o s¸t thuËt to¸n n©ng cao chÊt l- îng tiÕng nãi MMSE theo delta
3.5
Khi khảo sát thuật toán nâng cao chất lượng tiếng nói
3.4 không gian con với các giá trị δ khác nhau ta nhận được kết
3.3 quả như trên hình 6 Từ đó ta thấy với giá trị δ=1 thì kết quả
SIG
3.2 BAK của thuật toán nâng cao chất lượng tiếng nói không gian con tốt
OVL nhất theo cả ba tiêu chí đ nêu
3.1
3 §å thÞ kh¶o s¸t thuËt to¸n n©ng cao chÊt l- îng tiÕng nãi trõ phæ theo delta
3.6
2.9 SIG
3.4 BAK
2.8 OVL
2.7 3.2
2.6 3
2.5 2.8
0 0.1 0.2 0.3 0.4 0.5 0.6 0.7 0.8 0.9 1
delta
2.6
Hình 2. ết quả khảo sát chất lượng thuật toán MMSE theo δ.
2.4
§å thÞ kh¶o s¸t thuËt to¸n n©ng cao chÊt l- îng tiÕng nãi LogMMSE theo delta
3.5 2.2
3.4 2
3.3 1.8
SIG 0 1 2 3 4 5 6 7 8 9 10
delta
3.2 BAK
OVL
Hình 5. Đồ thị khảo sát chất lượng thuật toán trừ phổ theo δ.
3.1
3 §å thÞ kh¶o s¸t thuËt to¸n n©ng cao chÊt l- îng tiÕng nãi kh«ng gian con theo delta
3.4
2.9 3.3
SIG
2.8 3.2 BAK
OVL
2.7 3.1
2.6 3
0 0.1 0.2 0.3 0.4 0.5 0.6 0.7 0.8 0.9 1
delta 2.9
Hình 3. ết quả khảo sát chất lượng thuật toán LogMMSE theo δ. 2.8
2.7
§å thÞ kh¶o s¸t thuËt to¸n n©ng cao chÊt l- îng tiÕng nãi LogMMSE-SPU theo delta
3.3
2.6
3.2 2.5
3.1
SIG 0 1 2 3 4 5 6 7 8 9 10
BAK delta
3
OVL
Hình 6. Đồ thị khảo sát chất lượng thuật toán không gian con theo δ.
2.9
2.8
IV. KẾT LUẬN
2.7
Trong bài báo này nhóm tác giả đ thực hiện nghiên cứu,
2.6
khảo sát và đánh giá hiệu quả của các thuật toán nâng cao chất
2.5 lượng tiếng nói sử dụng phương pháp cập nhật nhiễu trực
tuyến Ngoài ra bài báo cũng đề xuất phương pháp lựa chọn
0 0.1 0.2 0.3 0.4 0.5 0.6 0.7 0.8 0.9 1 giá trị δ phù hợp trên cơ sở đánh giá các tiêu chí S và
delta
OVL, để các thuật toán đạt được hiệu quả thực thi cao nhất.
Hình 4. ết quả khảo sát chất lượng thuật toán LogMMSE-SPU theo δ.
180
180
HộiHội
ThảoThảo Quốc
Quốc Gia
Gia 2015về
2015 vềĐiện
ĐiệnTử,
Tử,Truyền
TruyềnThông
Thông và
và Công
CôngNghệ
NghệThông
ThôngTinTin
(ECIT 2015)
(ECIT 2015)
Trong các nghiên cứu tiếp theo nhóm tác giả sẽ tiến hành [10] Mitra, V.; Franco, H.; Graciarena, M.; Vergyri, D., “Medium-duration
modulation cepstral feature for robust speech recognition,” 2014 IEEE
hiện thực hóa các thuật toán nâng cao chất lượng tiếng nói cập
International Conference on Acoustics, Speech and Signal Processing
nhật nhiễu trực tuyến này vào các ứng dụng, cụ thể như nhận (ICASSP), pp.1749-1753, May 2014.
dạng tiếng nói có tính tới các đặc điểm của tiếng Việt. [11] Sultana, R.; Palit, R., “A survey on Bengali speech-to-text recognition
techniques,” 2014 9th International Forum on Strategic Technology
(IFOST), pp.26-29, Oct. 2014.
[12] M.P. Admane, R. Jasutkar, “Speech to text and accelerometer based
[1] Philipos C.Loizou, Speech enhancement: theory and practice, second smart phone interaction system,” 2014 International Conference on
edition, Publisher of Engineering and Environmental Sciences CRC Information Communication and Embedded Systems (ICICES), pp.1-4,
Press, Baco Raton, Florida, 2013. Feb. 2014.
[2] Yang Lu; P.C. Loizou, “Speech enhancement by combining statistical [13] Faizullah Ansari, M.D.; Shaji, R.S.; SivaKarthick, T.J.; Vivek, S.;
estimators of speech and noise,” 2010 IEEE International Conference on Aravind, A., “Multilingual speech to speech translation system in
Acoustics Speech and Signal Processing (ICASSP), vol., no., pp.4754- bluetooth environment,” 2014 International Conference on Control,
4757, March 2010. Instrumentation, Communication and Computational Technologies
[3] Dubey, Rajesh Kumar; Kumar, Arun, “Comparison of subjective and (ICCICCT), pp.1055-1058, Jul. 2014.
objective speech quality assessment for different degradation / noise [14] Seung Yun; Young-Jik Lee; Sang-Hun Kim, “Multilingual speech-to-
conditions,” 2015 International Conference on Signal Processing and speech translation system for mobile consumer devices,” IEEE
Communication (ICSC), vol., no., pp.261-266, March 2015. Transactions on Consumer Electronics, vol.60, no.3, pp.508-516, Aug.
[4] Yi Hu; Loizou, P.C., “Subjective Comparison of Speech Enhancement 2014.
Algorithms,” 2006 IEEE International Conference on Acoustics, Speech [15] Jongseo Sohn; Nam Soo Kim; Wonyong Sung, “A statistical model-
and Signal Processing, 2006. ICASSP 2006 Proceedings, vol.1, May based voice activity detection,” IEEE Signal Processing Letters, vol.6,
2006. no.1, pp.1-3, Jan. 1999.
[5] TU “Perceptual evaluation of speech quality (PESQ) and objective [16] Mittal, U.; Phamdo, N., “Signal/noise KLT based approach for
method for end-to-end speech quality assessment of narrowband enhancing speech degraded by colored noise,” IEEE Transactions on
telephone networks and speech codecs ” TU-T Recommendation 862, Speech and Audio Processing, vol.8, no.2, pp.159-167, Mar 2000.
2000.
[17] Berouti, M.; Schwartz, R.; Makhoul, J., “Enhancement of speech
[6] Speech noise reference database: corrupted by acoustic noise,” IEEE International Conference on
http://ecs.utdallas.edu/loizou/speech/noizeus. Acoustics, Speech, and Signal Processing (ICASSP '79), vol.4, pp.208-
[7] Kisoo Kwon; Jong Won Shin; Sonowat, S.; Inkyu Choi; Nam Soo Kim, 211, Apr. 1979.
“Speech enhancement combining statistical models and NMF with [18] Yi Hu; Loizou, P.C., “A generalized subspace approach for enhancing
update of speech and noise bases,” 2014 IEEE International Conference speech corrupted by colored noise,” IEEE Transactions on Speech and
on Acoustics, Speech and Signal Processing (ICASSP), pp.7053-7057, Audio Processing, vol.11, no.4, pp.334-341, Jul. 2003.
May. 2014. [19] Yi Hu; Loizou, P.C., “A subspace approach for enhancing speech
[8] Y. Ephraim, “Statistical-model-based speech enhancement systems,” corrupted by colored noise,” 2002 IEEE International Conference on
Proceedings of the IEEE , vol.80, no.10, pp.1526-1555, Oct. 1992. Acoustics, Speech, and Signal Processing (ICASSP), vol.1, pp.I-573-I-
[9] Y Ephraim and D alah “Speech enhancement using a minimum 576, May 2002.
mean-square error log-spectral amplitude estimator ” EEE Trans [20] Yi Hu; P.C. Loizou, “Speech enhancement based on wavelet
Acoust. Speech Signal Processing, vol. ASSP-33, pp. 443-445, Apr. thresholding the multitaper spectrum,” IEEE Transactions on Speech
1985. and Audio Processing, vol.12, no.1, pp.59-67, Jan. 2004.
181
181
HộiHội
Thảo Quốc
Thảo Gia
Quốc 2015
Gia 2015về
vềĐiện
Điện Tử,
Tử,Truyền
Nghệ Thông
Thông TinTin (ECIT
(ECIT 2015)
2015)
Tăng Khả Năng Phát Hiện Mục Tiêu Có Kích Thước

Nhỏ, Phản Xạ Yếu Chuyển Động Trên Bề Mặt Nền
Bằng Giải Pháp Phân Cực-Doppler
Phạm Trọng Hùng
Khoa Vô tuyến điện tử-Học viện Kỹ thuật quân sự
Hà Nội, Việt Nam
Email: hungpt1504@gmail.com
Abstract - Bài báo đi sâu vào xây dựng hàm đáp ứng Phân phân cực Doppler để thấy sự khác biệt trong hàm phổ năng
cực – Doppler của mục tiêu radar hỗn hợp và thực hiện việc lượng của mục tiêu hỗn hợp (bề mặt nền + mục tiêu kích
đánh giá so sánh hiệu quả về năng lượng khi sử dụng hàm đáp thước nhỏ) trong trường hợp không có mục tiêu và trường hợp
ứng Phân cực – Doppler so với khi sử dụng phương pháp có mục tiêu chuyển động trên bề mặt nền. Cấu trúc bài báo
Doppler thông thường. Từ đó đề xuất giải pháp nâng cao khả như sau: Phần II đi vào tính toán xây dựng hàm đáp ứng Phân
năng phát hiện các mục tiêu có kích thước nhỏ, phản xạ yếu cực-Doppler dựa trên cơ sở phân cực tròn. Phần III là so sánh
chuyển động trên bề mặt nền dựa trên hàm đáp ứng Phân cực –
hiệu quả về mặt năng lượng khi sử dụng phương pháp xử lý
Doppler thông thường và phương pháp xử lý Phân cực-
Doppler.
Doppler. Phần IV là kết luận.
Keywords - Doppler radar, small-target detection on the sea,
moving target detection, circular polarization. II. XÂY DỰNG HÀM ĐÁP ỨNG PHÂN CỰC – DOPPLER
CỦA MỤC TIÊU RADAR HỖN HỢP TRÊN CƠ SỞ PHÂN
I. ĐẶT VẤN ĐỀ CỰC TRÒN
Bài toán phát hiện mục tiêu chuyển động trên bề mặt nền Giả sử mục tiêu radar hỗn hợp bao gồm bề mặt nền dàn
(mặt đất, mặt biển…) thường được thực hiện bằng cách xử lý trải và mục tiêu có kích thước nhỏ (mục tiêu điểm). Mỗi mục
tính toán vận tốc Doppler. Đó là phương pháp kinh điển trong tiêu đều được đặc trưng bởi một ma trận tán xạ riêng. Trong
xử lý tín hiệu radar, phổ biến trong nhiều tài liệu. Tuy nhiên cơ sở phân cực tròn, các ma trận tán xạ (MTTX) này có dạng
khi mục tiêu có kích thước nhỏ thì khả năng phát hiện các mục [1,3]:
tiêu này sẽ bị hạn chế do công suất tín hiệu phản xạ từ mục   j 1 (t )  2 (t ) 
tiêu nhỏ chuyển động không đủ lớn để có thể phát hiện. Các 1 1 (t )  2 (t ) 
S rl (t ) 
biện pháp xử lý tham số phân cực trong bài toán phát hiện nen 2 j 1 (t )  2 (t )   1 (t )  2 (t )  (1)
   
mục tiêu trên bề mặt nền (đặc biệt là các mục tiêu nhỏ) cho
  j 1  2 
nhiều kết quả tốt, tăng được khả năng phát hiện [1,2]. Trong 1 1   2 
quá trình tính toán hàm tham số phân cực đối với bề mặt nền S rl (t )  exp  j d t
mt 2 j 1  2   1  2 
và mục tiêu thăng giáng [3] thấy rằng: tham số phân cực của    
mục tiêu không còn là đại lượng bất biến nữa mà cũng thăng
giáng thay đổi theo thời gian [4]. Nguyên nhân của sự thăng Trong đó ξ1, ξ2 là trị riêng của mục tiêu điểm chuyển
giáng này là do sự xáo động của mục tiêu (bề mặt nền hoặc động, λ1(t), λ2(t) là trị riêng thăng giáng trong MTTX của bề
mục tiêu). Do hàm tỷ số phân cực [4,5] trong cơ sở phân cực mặt nền; Ωd là tần số Doppler ứng với vận tốc chuyển động
tròn phụ thuộc vào thời gian nên có thể sử dụng phép biến đổi của mục tiêu V.
hàm tham số phân cực trên miền thời gian sang miền tần số để Giả sử véc tơ riêng của các mục tiêu này là trùng nhau.
khai thác thông tin về độ dịch tần Doppler. Phương pháp xử lý Khi đó MTTX của mục tiêu hỗn hợp trong cơ sở phân cực
Doppler sau đó cũng giống như các biện pháp xử lý Doppler tròn có thể viết dưới dạng:
thông thường nên có thể tạm gọi là phương pháp Phân cực –
Doppler. Giải pháp này có thể tăng được khả năng phát hiện S rl (t )  S rl (t )  S rl (t ) 
 nen mt
các mục tiêu nhỏ chuyển động trên bề mặt nền. Bài báo sẽ đi
theo hướng nghiên cứu này: khai thác triệt để tham số phân 1 1 (t )  2 (t )  (1   2 )exp  jt
     
j 1 (t )  2 (t )  (1  2 )exp  jt

cực mục tiêu, kết hợp giải pháp xử lý Doppler để tăng khả    
2 j 1 (t )  2 (t )  (1  2 )exp  jt  1 (t )  2 (t )  (1  2 )exp  jt
năng phát hiện. Cụ thể là nghiên cứu hiệu quả về mặt năng (2)
lượng khi thực hiện xử lý bằng phương pháp Phân cực-
Doppler so với giải pháp xử lý bằng phương pháp Doppler
thông thường. Sau đó thực hiện biến đổi FFT hàm đáp ứng
182
ISBN: 978-604-67-0635-9 182

HộiHội Thảo
Thảo QuốcGia
Quốc Gia2015
2015về
vềĐiện
Điện Tử,
Tử,Truyền
Truyền Thông
Thông và
vàCông
CôngNghệ
NghệThông TinTin
Thông (ECIT 2015)
(ECIT 2015)
Khi sóng phát có phân cực tròn phải

0
[3], thì tín hiệu Prl (t )  j (1  zP
 )  nen
rl
(t )  a (t ).exp  j t Pmtrl (t )  
E r (t ) px
phản xạ từ mục tiêu hỗn hợp sẽ là: j 1  a (t ).exp  j t  Pnen
rl
(t )  a (t ).exp  j t Pmtrl (t ) 
E l (t ) 0      
1 j  1 (t )  2 (t )    1   2  exp  j  d t
(8)
 S rl (t ) .  Từ phương trình này có thể đề xuất phương pháp phát hiện các
E r (t ) th  r
E (t ) px 
2   (t )   (t )       exp  j  t
 1 2   1 2 d  mục tiêu có phản xạ yếu trên bề mặt nền. Khai triển biểu thức
(3) (8) và lược bỏ các thành phần phụ, kết hợp điều kiện (6) thu
Tỷ số phân cực tròn của sóng phản xạ từ mục tiêu hỗn hợp có được hàm đáp ứng Phân cực – Doppler ở dạng một quá trình
dạng: ngẫu nhiên dải hẹp rút gọn:
(9)
E r j (  1 (t )  2 (t )   1  2  exp  j d t) S1 (t )  a (t )   mt   nen (t )  mt   nen (t ).
Prl (t )  l  
E 1 (t )  2 (t )   1  2  exp  j d t cos t    (t )   a (t ) 
(4) Với mục tiêu có kích thước nhỏ phản xạ yếu, thì
Ta thấy rằng, tỷ số phân cực tròn ở trên là tổng trung bình a  1 (tín hiệu phản xạ từ mục tiêu nhở hơn nhiều so với tín
cộng của hai thành phần mục tiêu gồm bề mặt nền và mục tiêu
hiệu phản xạ từ bề mặt nền). Các mục tiêu có kích thước nhỏ
điểm có kích thước nhỏ, phản xạ yếu chuyển động trên bề mặt
thường có cấu trúc đơn giản nên có thể xem như chúng thuộc
nền:
lớp mục tiêu đẳng hướng phân cực và độ không đẳng hướng
j ( 1 (t )  2 (t )  Pnen
rl
(t )  1  2  Pmtrl (t )exp  jt) phân cực bằng không (μmt = 0). Khi đó ta có thể rút gọn biểu
Prl (t )   thức (9) thành:
1 (t )  2 (t )   1  2  exp  jt
S (t )  a (t )  (t ) cos t   (t )   (t )  (10)
(5) 1 nen   a 
Điều đó thể hiện sự thay đổi mà mục tiêu phản xạ yếu đưa
1  2  vào tín hiệu phản xạ từ bề mặt nền. Chúng được xác định bởi
 (t )  2 (t )  rl
Trong đó: Pnen (t )  1
rl
, Pnen (t )  là tỷ số độ dịch tần Doppler nằm trong hàm đáp ứng Phân cực –
 (t )   (t ) 1 2 1  2  Doppler của mục tiêu hỗn hợp và có dạng của một quá trình
phân cực tròn của sóng phản xạ từ bề mặt nền và mục tiêu ngẫu nhiên hẹp. Như vậy với mục tiêu có kích thước nhỏ,
tương ứng. Theo [4] các đại lượng này chính bằng hệ số phản xạ yếu chuyển động trên bề mặt nền không thể phát hiện
không đẳng hướng phân cực phức của mục tiêu: được bằng phương pháp Doppler thông thường, nhưng có thể
(6) phát hiện được “vết phân cực” của mục tiêu đó trong hàm đáp
P rl (t )   (t ), P rl (t )  
nen nen mt mt ứng Phân cực – Doppler. Khi thực hiện phân tích phổ cả hàm
năng lượng σ(t) và hàm đáp ứng Phân cực – Doppler S1(t) có
1  2 thể nhìn thấy sự khác biệt trong phổ năng lượng của các hàm
Đặt a (t )  - ứng với tỷ số diện tích phản xạ hiệu này. Điều này sẽ làm tăng hiệu quả trong bài toán phát hiện
1 (t )  2 (t )
các mục tiêu có kích thước nhỏ phản xạ yếu, chuyển động trên
dụng (RCS) của tiêu điểm có kích thước nhỏ và diện tích phản bề mặt nền so với các giải pháp xử lý Doppler truyền thống.
xạ hiệu dụng của bề mặt nền. Ta có thể viết lại biểu thức (5) ở
dạng:
j ( P rl (t )  a (t ).exp  jt P rl (t )) (7) III. SO SÁNH HIỆU QUẢ VỀ NĂNG LƯỢNG CỦA GIẢI
Prl (t )  nen mt
PHÁP PHÂN CỰC – DOPPLER SO VỚI CÁC HỆ THỐNG
1  a (t ).exp  jt
XỬ LÝ DOPPLER TRUYỀN THỐNG
Ta viết mẫu số của biểu thức (7) ở dạng:
 với z   a(t ).exp  jt
1  a (t ).exp  jt  1  z Xét hai tín hiệu:
Với điều kiện z  1 , có thể khai triển được: U1 (t )  a1cos(1t  1 ) và U 2 (t )  a2 cos  (1  d )t  2  là các
N tín hiệu phản xạ từ bề mặt nền và mục tiêu radar chuyển động
(1  z ) 1   ( 1)zn  n  1 z  z  2  z 3  ...  ( 1) N .z N trên bề mặt nền, với Ωd là tần số Doppler của mục tiêu chuyển
n0
động. Có thể tính gần đúng tín hiệu phản xạ tổng theo biểu
Ở đây sử dụng giải pháp khai triển giải tích hàm đáp ứng Phân
thức:
cực-Doppler của mục tiêu hỗn hợp (biểu thức 5) ứng với điều
U  (t )  U1 (t )  U 2 (t )  (11)
kiện z  1 (tức là trong trường hợp tín hiệu phản xạ từ bề mặt
 aa 
nền lớn hơn tín hiệu phản xạ từ mục tiêu điểm có kích thước a12  a22   1  2 1 2 2 cosd t  cos 1t   (t ) 
nhỏ). Chỉ giữ lại thành phần đầu của biểu thức khai triển ta  a1  a 2 
được: với điều kiện a2 << a1 (tức là tín hiệu phản xạ từ mục tiêu nhỏ
hơn nhiều lần tín hiệu phản xạ từ bề mặt nền trong một ô (cell)
phân biệt radar).
183
183
HộiHội
ThảoThảo Quốc
Quốc Gia
2015 ĐiệnTử,
Tử,Truyền
TruyềnThông
Thông và
và Công
CôngNghệ
NghệThông
ThôngTinTin
(ECIT 2015)
(ECIT 2015)
Tín hiệu (11) đã được điều chế biên độ. Ta có thể viết lại biểu
thức ở dạng:
U  (t )  U m (1  M cos d t )cos 1t   (t ) , (12)
Trong đó hệ số điều chế biên độ M được tính bằng:
U  U min aa (13)
M  max  21 2 2
U max  U min a1  a2
Công suất trung bình của tín hiệu (12) là:
U2 U2M 2 (14)
PAM  P1   P1   P1    m  m
2 4
Từ biểu thức này có thể tính được tỷ lệ công suất tương đối
của các thành phần tần số bên ( 1  d ) so với công suất ở
thành phần tần số chính ω1 là:
P1   P1  (15)
M2
Ptd  
P1 2
Thay biểu thức (13) vào (15) ta được:
Hình 1. So sánh hiệu quả về năng lượng của xử lý Doppler
2 (16)
M 2 1  a1a2  1 a12 a22 1 K2 thông thường và xử lý Phân cực-Doppler
Ptd    2   
2 2  a1  a22  2 (a12  a22 ) 2 2 (1  K 2 ) 2
a2
Với K 2  22 là tỷ số diện tích phản xạ hiệu dụng (RCS) của
a1
mục tiêu chuyển động và RCS của bề mặt nền.
Kết hợp biểu thức (10) và biểu thức (12) ta có thể so sánh
được tỷ số công suất công suất tín hiệu phản xạ từ mục tiêu
nhỏ chuyển động so với công suất tín hiệu phản xạ từ bề mặt
nền khi sử dụng phương pháp xử lý Doppler thông thường
(12) và phương pháp xử lý Phân cực – Doppler (6).
Từ hình 1 thấy rằng, tỷ số tương đối về năng lượng tín
hiệu phản xạ từ mục tiêu so với năng lương tín hiệu phản xạ từ
bề mặt nền đã tăng lên đáng kể khi sử dụng phương pháp xử
lý Phân cực-Doppler. Cụ thể khi tỷ số diện tích phản xạ hiệu
dụng của mục tiêu so với nền là 0,1 thì tỷ số công suất tín hiệu
phản xạ từ mục tiêu so với tín hiệu phản xạ từ bề mặt nền là
0,005 trong trường hợp xử lý thông thường và bằng 0,01 trong
trường hợp xử lý bằng Phân cực-Doppler. Tức là tỷ lệ về năng Hình 2. Hàm phổ năng lượng Doppler thông thường
lượng đã tăng lên 2 lần (3dB). Còn nếu tỷ lệ diện tích phản xạ
hiệu dụng của mục tiêu so với nền là 0,15 thì tỷ lệ công suất
tương đối của tín hiệu phản xạ từ mục tiêu so với tín hiệu phản
xạ từ bề mặt nền tăng từ 0,01 lên 0,023, tức là tỷ lệ về năng
lượng đã tăng lên 2,3 lần (3,6dB).
Trên hình 2 là hàm phổ năng lượng Doppler thông
thường, đối với mục tiêu nhỏ chuyển động thì năng lượng
phản xạ từ mục tiêu rất nhỏ (a2/a1=0.001 –tức tín hiệu phản xạ
từ bề mặt nền so với tín hiệu phản xạ từ mục tiêu chuyển động
bằng 1000 lần), rất khó để phân biệt mục tiêu so với bề mặt
nền. Hình 3 là giải pháp xử lý Phân cực-Doppler với
a2/a1=0.001, ở đây thấy rằng: hàm phổ tại tần số Doppler của
mục tiêu nhỏ thể hiện rõ tại tần số Doppler.
Hình 4 là hàm phổ Phân cực-Doppler trong trường hợp không
có mục tiêu chuyển động trên bề mặt nền (a2/a1=0) cho ta hình
ảnh phổ bằng 0. So sánh giữa hình 3 và hình 4 thấy ngay sự
khác biệt khi không có mục tiêu chuyển động trên bề mặt nền
và có mục tiêu chuyển động trên bề mặt nền trong hàm phổ
Phân cực-Doppler. Điều này là cơ sở để phát hiện mục tiêu Hình 3. Hàm phổ Phân cực-Doppler
184
184
HộiHội
Thảo Quốc
Thảo Gia
Quốc 2015
ĐiệnTử,
Tử,Truyền
NghệThông
ThôngTinTin (ECIT
(ECIT 2015)
2015)
nhỏ chuyển động trên bề mặt nền khi biện pháp xử lý Doppler (gồm mục tiêu nhỏ phản xạ yếu chuyển động và bề mặt nền)
thông thường không hiệu quả. Như vậy với các mục tiêu nhỏ cho phép tăng độ tương phản của mục tiêu nhỏ chuyển động
chuyển động trên bề mặt nền sẽ khó phát hiện bằng biện pháp so với bề mặt nền (tăng tỷ lệ công suất so với biện pháp xử lý
xử lý Doppler thông thường sẽ có thể được phát hiện bởi Doppler thông thường, cải thiện đáng kể khả năng phát hiện
phương pháp xử lý Phân cực-Doppler, thông qua sự thay đổi các mục tiêu nhỏ chuyển động trên bề mặt nền (với các mục
vết phân cực của mục tiêu trong một diện tích phân biệt radar tiêu mà phương pháp xử lý Doppler thông thường không thể
(radar cell). phát hiện được). Ngoài ra kết quả so sánh hàm phổ năng lượng
cũng chỉ ra rằng, khi bề mặt nền ổn định (tức tham số phân
cực của bề mặt nền là hằng số, bất biến theo thời gian) nếu có
mục tiêu nhỏ chuyển động trên bề mặt nền đó sẽ cho kết quả
rõ nét trong hàm phổ năng lượng của hàm đáp ứng phân cực –
Doppler.

[1]. Tatarinov S, Ligthart L P, Gaevoy E, “Dynamical Polarization Contrast
of Complex Radar Targets, IEEE 1999 International Geoscience and
Remote Sensing Symposium, vol II, pp 1387- 1389, Hamburg,
Germany, 1999
[2]. Козлов А.И.,Татаринов В.Н.,Татаринов С.В.,Кривин Н.Н.
“Поляризацион-ный след при рассеянии электромагнитных волн
составными объектами” М.: Научный вестник МГТУ ГА, 2013 г., №
189. – С. 66 – 73.
[3]. Татаринов В.Н., Татаринов С.В., Лигтхарт Л.П. “Введение в

современную теорию поляризации радиолокационных сигналов //
Поляризация плоских ЭМВ и её преобразования”. - Томск: изд-во
Томского государственного университета, 2006. –Т. 1.
[4]. Tatarinov V, Ligthart L P, Tatarinov S, “An Introduction to the Statistical
Theory of Polarization Parameters of Fields Scattered by Complex Radar
Hình 4. Hàm phổ Phân cực-Doppler trong trường hợp không Objects”, Proc. MIKON2000, vol 2, ISBN 83-30 906662 - 0-0, pp 351-
354, Wroclaw, Poland 2000.
có mục tiêu chuyển động
[5]. Tatarinov V.N., Tatarinov S.N., Krivin N.N. “Innovations in radar
IV. KẾT LUẬN technologies: Polarization invariant parameter utilization for the problem
of radar object detection and mapping”, IICST 2011, pp 62-68, Tomsk,
Bài báo đã đề xuất một giải pháp mới trong bài toán nâng Russia, 2011.
cao khả năng phát hiện các mục tiêu nhỏ, phản xạ yếu chuyển
động trên bề mặt nền. Khi sử dụng phương pháp xử lý
Doppler vào hàm đáp ứng phân cực của mục tiêu hỗn hợp
185
185
Hội Hội
Hệ Thống Mã Hoá Và Nhận Dạng Mẫu Hai Chiều Ứng Dụng Trong In Ấn Và Tra Cứu
Thông Tin
Hoàng Anh Tuấn, Nguyễn Hữu Phương, Bùi Trọng Tú

Trường Đại học Khoa học Tự Nhiên Thành phố Hồ Chí Minh
Email: hatuan@fetel.hcmus.edu.vn, nhphuong@hcmus.edu.vn, bttu@hcmus.edu.vn
Tóm Tắt—Hệ thống Mã hoá (MH) và Nhận dạng mẫu (NDM) hai
chiều (2D) được coi như là một kỹ thuật tiềm năng trong lĩnh vực xử
lý thông tin. Nó được ứng dụng trong khá nhiều ngành kỹ thuật phục
vụ mục đích ẩn dữ liệu và khôi phục thông tin. Trong bài báo này,
một cơ chế mã hoá được đề xuất để phục vụ tốt hơn cho nhóm
ngành in ấn và tra cứu thông tin từ nhưng sản phẩm in ấn. Để tương
tác nhận dạng các mẫu được mã hoá này, một số thuật toán về trích
xuất dữ liệu ảnh màu, lọc tín hiệu cũng như cơ chết phân ngưỡng
Hình 1: Vị trí thông thường chứa ảnh nên được mã hoá
động được áp dụng cho phần nhận dạng mẫu Bài bào này cũng đưa Các ảnh nền chứa một tập hợp các khối dữ liệu mã hoá
ra mô hình kiểm nghiệm thực tế từ những mẫu được in ấn, kết hợp được đặt sát nhau tạo nên một mảng ma trận các chấm tròn li
với việc mô phỏng trên nền tảng FPGA nhằm tối ưu thuật toán, làm ti. Mỗi khối dấu chấm tròn là một ma trận gồm 16 dấu chấm
tiền đề cho việc thiết kế ASIC khối nhận dạng mẫu. tròn được phân bố đều theo kiểu 4x4. Kích thước mỗi khối
4x4 dấu chấm tròn nhỏ là 2 mm x 2 mm. Ở nghiên cứu này,
Từ khoá- MH, NDM, 2D, FPGA.
việc thực hiên với kích thước này là để đạt được hiệu qua cao
nhất cả cho việc mã hoá và nhận dạng.
I. GIỚI THIỆU Dữ liệu được mã hoá trong 16 dấu chấm tròn này theo
những mức xám khác nhau. Trong 16 chấm này dữ liệu thức
tế chỉ nằm trong 9 dấu chấm, còn 7 dấu chấm còn lại được sử
Các công nghê nhận dạng mẫu dựa trên xử lý ảnh đã và
dụng cho những mục đích khác, ví dụ: canh chuẩn xoay ảnh,
đang được ứng dụng nhiều trong thực tế, phổ biến nhất là mã chọn mức ngưỡng cao nhất và thấp nhất. 9 trên 16 dấu chấm
vạch, mã QR Code,… Để có được kết quả nhận dạng mẫu tốt thực hiện mã hoá dữ liệu theo 3 mức xám.
cần phải có phương pháp mã hóa mẫu tốt và thuật toán nhận
dạng tốt. Bài báo này tập trung vào yếu tố đầu, đó là đưa ra Các dấu Mức 3: #B0B0B0
một phương pháp mã hoá mẫu và thuật toán tương ứng để chấm này
nhận dạng mẫu nhằm ứng dụng trong lĩnh vực lưu trữ thông dung cho mã Mức 2: #808080
tin và truy xuất thông tin tự động. Nó là một phần của lĩnh hoá dữ liệu
vực nhận dạng hình ảnh nhưng ở đây không phải ảnh mặt Mức 1: #505050
người, ảnh sinh học hay ảnh viễn thám mà là ảnh nền của một
văn bản hay một tài liệu có chứa thông tin mã hoá thông tin. Hình 2: Định vị dấu chấm mã hoá và cơ chế mức xám của nó
Kết quả của đề tài này có thể được nguyên cứu và phát triển Theo phương pháp thông kê thì với số lượng dấu chấm là
để ứng cũng trong lĩnh vực giáo dục với các mô hình giảng 9 và mỗi dấu có thể có 1 trong 3 mức xám khác nhau thì tổ
dạy và học tập thông minh. Một số lĩnh vực khác có nhu cầu hợp các trạng thái có tể đạt được là: =19683.Với số lượng
về mã hoá thông tin để sau đó truy xuất từ cơ sở dữ liệu trả ra mẫu này thì phục vụ tương đối cho việc mã hoá dữ liệu
kết quả cũng có thể ứng dụng phương pháp mà đề tài này đã
đề xuất. III. PHƯƠNG PHÁP NHẬN DẠNG MẪU
Mẫu mã hoá cũng như nhận dạng của đề tài này là một Quá trình xử lý ảnh nhận dạng được trải qua các bước sau:
mẫu hình ảnh hai chiều được chụp từ các loại máy chụp ảnh,
hoặc cảm biến lấy ảnh.
II. TỔNG QUAN VỀ CƠ CHẾ MÃ HOÁ
Không gian chứa dữ liệu mã hoá là một mẫu dữ liệu được

in ấn lên các chất liệu in ấn bình thường. Các mẫu chứa thông
tin mã hoá được ghép sát nhau liên tục để tạo thành một mảng
ảnh nền trước khi được in ra.
Hình 3: Mô hình xử lý mẩu nhận dạng
186
ISBN: 978-604-67-0635-9 186

Ảnh sau khi được chụp từ camera là một ảnh có kích thước tế với mỗi ảnh nhận được do nhiễu nên dữ liệu nhận được đối
64x64 pixel sẽ trải qua 3 bước xử lý chính để cho ra được dữ với mức đen nhất không còn là 0 nữa mà có thể là 1, 2, 3
liệu sau cùng là mã mức xám được luu trữ trong các dấu hoặc cao hơn. Tương tự như vậy thì màu trắng nhất không
chấm tròn. Vì mẫu mã hoá được thu từ camera trong điều còn là 255 nữa mà có thể thấp hơn 254, 253, 252 hoặc thấp
kiện thực tế sẽ không chuẩn như thiết kế mẩu đã nói ở phần hơn.
trên nên các bộ lọc trung vị và phép phân chia ngưỡng động
được dùng để xử lý mẫu thực. Cụ thể các bước như sau.
A. Xử lý ảnh màu thành ảnh đa mức xám
Đơn vị cơ bản của một bức ảnh là điểm ảnh (pixel), mỗi
điểm ảnh có thể được biểu diễn bằng n bytes dưới các hệ màu
khác nhau. Việc chuyển đổi giữa các hệ màu thông thường
được thực hiện thông qua các phép biến đổi ma trận. Trong
bài viết này tôi sẽ giới thiệu phương thức chuyển đổi từ ảnh
24 bits RGB sang ảnh 8 bits đa mức xám. Để thực hiện yêu
cầu trên, thông thường ta sử dụng một trong những công thức
sau đây, áp dụng cho từng điểm ảnh [x,y]: Hình 5: Mô hình phân chia ngưỡng theo thiết kế
I(x,y) =0.3086*R(x,y)+ 0.6094*G(x,y) + 0.0820* B(x,y)
I(x,y) =0.299 *R(x,y) + 0.587 * G (x,y) + 0.114 * B (x,y)
B. Lọc nhiễu với lọc trung vị (Median Filter)
Lọc trung vị là phép lọc phi tuyến được sủ dụng phổ biến
do khả năng khử nhiễu ngẫu nhiên tốt, và ít bị nhoè hơn so
với phép lọc trung bình.Ý tưởng thuận toán này là sắp xếp
các giá trị điểm ảnh trong cửa sổ xử lý tăng hoặc giảm dần so
với trung vị. Kích thước cửa sổ được chon sao cho số điểm
ảnh trong cửa sổ là một số lẻ. thường là 3x3= 9 điểm ảnh,
5x5= 25 điểm ảnh.Thay thế giá trị trung tâm bằng giá trị giữa
của danh sách.
Hình 5: Mô hình phân chia ngưỡng động theo thực tế
Từ các ngưỡng mới này ta mới có thể xem xét chính xác
hơn một dấu chấm thực tế thuộc vùng nào và từ đó sẽ cho ra
dữ liệu nhận dạng được chính xác và đúng thực tế hơn.
IV. MÔ HÌNH PHẦN CỨNG THUẬT TOÁN NHẬN

DẠNG MẪU
Mô hình thiết kế phần cứng cho thuật toán xử lý dữ liệu đã
Hình 4: Mô hình xử lý của thuật toán Median Filter phân tích ở phần III được thiết kế và thực hiện trên board DE0
Giả sử A= là các giá trị pixel trong cửa sổ Nano. Project đã hoàn thành và chạy thành công trên board
lân cận với DE0 Nano.
Một mẫu dữ liệu được xử lý theo phương pháp sau
Thì Median (A)
Ví dụ ta có A ={1,2,5,5,6,7,10,12,13} -> Median (A) =6

C. Định mức ngưỡng xám dựa trên dự liệu thực
Cơ sở khoa học của phương pháp này là sử dụng các dấu
chấm không chứa dữ liệu để xác định hai mức xám cao nhất
và thấp nhất theo ảnh thực tế nhận được. Theo lý thuyết
chuyển đổi mức xám ở phần phần A thì ảnh sau khi chuyển Hình 6 : Mô hình dữ liệu thực hiện
đổi từ ảnh màu RGB sang ảnh đa mức xám thì dữ liệu ảnh tại
Ảnh được chụp từ camera, sau đó được lưu trên máy tính.
mỗi điểm ảnh sẽ còn là 8 bit Grayscale thay vì 24 bit RGB.
Máy tính thực hiện việc chuyển ảnh xuống board nhúng để
Đo đó giá trị mức xám sẽ thay đổi từ 0 tới 255 tương ứng với
chạy thuật toán xừ lý nhận dạng. Kết quả nhận dạng sẽ được
màu đen nhất là 0 và màu trắng nhất là 255. Nhưng trên thực trả về máy tính để hiển thị và lưu trữ. Quá trình giao tiếp dữ
187
187
liệu giữa máy tính và board được thực hiện qua chuẩn giao CORE hoạt động gồm 3 công đoạn chính: chuyển màu
thức USB 2.0 RGB sang mức xám, lọc Median, phân chia ngưỡng động để
lấy giá trị 16 điểm, so sánh lấy ra kết quả. Trong cá khối xử lý
Sơ đồ khối của hệ thống phần cứng được xây dựng như sau: này thì khối lọc Median khá quan trọng trong việc xử lý với
mẩu thực tế. Mô hình lọc median để trích giá trị trung vị
(med) từ 9 giá trị của cửa sổ lọc (p0->p8) được thực hiện qua
một loại khối so sánh tuần tự giá trị lớn đi đường trên và giá
trị nhỏ đi đường dưới, từ đó chọn được giá trị trung vị.
Hình 7: Sơ đồ khối hệ thống phần cứng

Hình ảnh ban đầu được chứa trong PC. CPU NiosII trong Hình 9: Mô hình các bộ so sánh để lấy giá trị của lọc Median
FPGA thông qua hệ thống JTAG-UART để đọc file hình từ
PC ghi vào hệ thống để tiến hành xử lý. Sau khi thực hiện việc V. KẾT QUẢ THỰC NGHIỆM
tính toán xong, FPGA sẽ trả kết quả lại cho PC. Board FPGA Hệ thống được triển khai thử nghiệm trên số lượng mẫu
sử dụng cho đề tài này là board DE0 nano của Terasis với chip thực tế được in ra và chụp lại khoảng gần 1000 mẫu và kế
FPGA là Cyclone IV của Altera.Các thành phần IP chức năng
quả thu được khá tốt với sai số nhỏ hơn <0.1% với góc
trong FPGA:
nghiên nhỏ hơn 15 độ. Mục tiêu của việc triển khai hệ thống
CPU: là CPU NiosII, thực hiện công việc đọc file hình và nhận dạng mẫu này trên chip FPGA là nhằm tạo tiền đề cho
ghi vào Onchip memory. Khởi động CORE hoạt động. Chờ việc mở rộng nghiên cứu tối ưu hiệu quả nhận dạng và tốc độ
CORE thực thi tính toán các thuật toán xong để đọc kết quả nhận dạng. Bên cạnh đó cũng là cơ sở để phát triển ASIC cho
trả về. thuật toán nhận dạng này. Như các hãng nghiên cứu về mảng
này họ đều cho ra chip xử lý cho việc nhận dạng, vì thế đề tài
JTAG-UART: cho phép CPU truy xuất trực tiếp lên một
này cũng đi theo hướng phát triển đó.
file trên máy tính PC thông qua cổng JTAG-UART.
Hệ thống được cài đặt và thử nghiệm thành công trên
Onchip Memory: có dung lượng 16KB để lưu bức hình.
board DE0-Nano với chip FPGA số hiệu là EP4CE22F17C6
Do hình cần xử lý co kích thước bé chỉ có 64x64 pixel nên có
với kết quả sử dụng tài nguyên hệ thống như sau.
thể lưu trên bộ nhớ trong chip.
SDRAM Controller: controller này để giao tiếp với
memory offchip SDRAM. Bởi vì dung lượng memory onchip
trong FPGA không đủ để chứa lệnh, cho nên SDRAM được
sử dụng để chứa lệnh cho CPU. SDRAM trên board DE0
Nano có dung lượng 32MB.
CORE: lõi tính toán thuật toán. Khi nhận lệnh start từ CPU
sẽ tiến hành đọc bức hình được lưu trong Onchip memory.
CORE sẽ xử lý hình ảnh để cho ra kết quả mã tương ứng với
hình ảnh đó.
Hình 10: Kết quả phần cứng chạy trên board nhúng DE0
nano.
Khi chạy xong thì Nios2 tự động printf ra ngoài màn hình
Hình 8: Mô hình của khối xử lý thuật toán trên CORE console cho thấy kết quả
188
188
: TÀI LIỆU THAM KHẢO

[1] R.N. Bracewell, Two-Dimensional Imaging, Prentice Hall, 1995
[2] R.C. Gonzalez, R.E. Woods, Digital Image Processing,Prentice Hall,
1992
[3] Haykin, Adaptive Filter Theory Fourth Edition, Prentice Hall, 2006
[4] C.D. Munson, S.T. Huang, C.A. Bovik, “The Effect of Median
Hình 11: Kết quả nhận dạng của một mẫu ví dụ Filtering on Edge Estimation and Detection,” IEEE Transactions on
Pattern Analysis and Machine Intelligence, pages.181-194, 1987
Chuỗi kết quả này được xử lý từ một ảnh thực tế, 9 giá trị [5] Bae K.S., Kim K.K., Chung Y.G., Yu W.P., “Character recognition
tất cả [1 2 3 3 2 1 1 2 3] được trích xuất từ 16 dấu chấm của system for cellular phone with camera”, Computer Software and
một mẫu bất kì nào đó ở đây là mẫu dữ liệu ví dụ trong kho Applications Conference (COMPSAC). pages.539 – 544, 2005
dữ liệu mẫu được tạo sẵn. [6] Jain, A.K., Duin, R.P.W. ; Jianchang Mao. “Statistical Pattern
Recognition: A Review”, IEEE Transactions on Pattern Analysis and
Hệ thống mã hoá và nhận dạng này được thực hiện trên số Machine Intelligence, Volume:22 , Issue: 1, pages. 4-37, 2000
lượng dữ liệu mẫu khoảng 1000 mấu. Và ngày càng mở rộng [7] Khodaskar.A.A, Ladhake.S.A.” Pattern recognition: Advanced
development, techniques and application for image retrieval”,
thêm để kiểm chứng. Kết quả kiểm chứng tạm thời cho sai số International Conference on Communication and Network
khá tốt 0.1%. Sau đây là bảng so sánh kết quả với hệ thống Technologies (ICCNT), pages.74 – 78, 2014
mã hoá và nhận dạng loại hai chiều dùng dấu chấm (dot [8] Yu.F.T.S, Gregory.D.A, “Optical pattern recognition: architectures and
matrix) hiện tại mà các công ty công nghê đang nắm giữ: techniques”, Proceedings of the IEEE, pages.733 – 752, 1996
[9] Selvarajan S, Sri Ramakrishna, Palanisamy V. , Mathivanan B.,
“Human identification and recognition system using more significant
hand attributes” International Conference on Computer and
Communication Engineering (ICCCE), pages.1211 – 1216, 2008
[10] Sameer Singh, “2D spiral pattern recognition with possibilistic
measures”, Elsevier Pattern Recognition Letters, pages.141–147, 1998
[11] Yuning Xie, Xiaoguo Zhang, Zhu Zhu, Qing Wang, “An adaptive
median filter using local texture information in image”, International
Conference on Computer and Information Science (ICIS), pages.177 –
180, 2014
[12] OPTICAL ID IMAGE Decoder Specifications [ 2ndgeneration ], sonix
technology co., ltd
[13] Tung-Tsai Liao, Shih-Chien Lin, Yu-Tang Chang,” Method for coding
two dimensional optical identification with the same gray level and
printing product thereof”, Generalplus Technology Inc., 2010
Bảng 1: So sánh kết quả bài báo với một số công nghệ khác [14] http://www.sonix.com.tw/
Từ các kết quả trên đây dễ nhận thấy là đề tài đạt được
những kết quả tương đượng hoặc tốt hơn so với các công
nghệ hiện tại đang được sử dụng. Nhưng để triển khai tốt hơn
trong thực tế cần một số cải tiến và tối ưu hơn nữa.
Kết quả được thực hiện cho hệ thống thực tế bao
gồm một camera thu nhận ảnh với độ phân giải 64x64 pixel
và một Chip xử lý nhận dạng. Kết quả nhận dạng được kết
hợp với cơ sở dữ liệu có sẵn để cho ra kết quả thích hợp theo
mô hình sau
Hình 12: Mô hình triển khai thực tế của kết quả đề tài
189
189
HộiHội
Thảo Quốc
Thảo Gia
Quốc 2015
ĐiệnTử,
Tử,Truyền
NghệThông
ThôngTinTin (ECIT
(ECIT 2015)
2015)
Bộ Ước Lượng Chuyển Động Nguyên Thông Lượng

Cao Trên Thuật Toán Full-Search Cho Chuẩn H.264
Huỳnh Quốc Thịnh và Bùi Trọng Tú
Khoa Điện Tử Viễn Thông,
Trường Đại Học Khoa Học Khoa Học Tự Nhiên Tp. Hồ Chí Minh
Email: hqthinh@fetel.hcmus.edu.vn, bttu@hcmus.edu.vn
Abstract— Trong bài báo này, chúng tôi đề xuất hai kiến trúc ASIC Có nhiều thuật toán để thực hiện ước lượng chuyển động
cho bộ ước lượng chuyển động nguyên dựa trên thuật toán Full- nguyên trong đó Full Search (FS) là thuật toán cho kết quả chính
Search cho chuẩn nén video H.264. Trong thiết kế, chúng tôi thực xác nhất[2]. Bằng cách so sánh với tất cả các MB có trong vùng
hiện tối ưu phần cứng cho bộ cộng SAD 2 chiều, cải tiến mảng lưu tìm kiếm, thuật toán FS sẽ tìm ra chính xác MB có giá trị nhỏ
trữ tìm kiếm kết hợp với việc tính toán song song đa đầu vào cho
nhất và cho ra vector chuyển động của current MB. Nhược điểm
thông lượng tính toán cao, tăng hiệu quả truy cập bộ nhớ. Thiết kế
được tổng hợp trên công nghệ 90 nm cho tần số hoạt động tối đa của thuật toán FS là độ phức tạp tính toán cao, tốn nhiều tài
là 300 MHz, thông lượng cao nhất 1186 chu kì/ 41MVs đối với nguyên. Để giảm độ phức tạp, theo các nghiên cứu, người ta chia
vùng tìm kiếm là [64x64], tài nguyên vào khoảng 215K Leaf Cell. thành 2 loại. Thứ nhất, giảm độ phức tạp tính toán bằng cách
giảm số điểm tìm kiếm ví dụ như Three Steps Search (TSS)[9],
Keywords- H.264/AVC, IME, Motion Estimation, VBSME, Full- Diamond Search (DS)[10], các thuật toán mở rộng như Four
Search. Steps Search[11]... Thứ hai là giảm độ phức tạp tính toán tại mỗi
điểm tìm kiếm bằng cách giảm mẫu[2]. Các thuật toán này có
I. GIỚI THIỆU
thời gian tìm kiếm nhanh, giảm độ phức tạp tính toán nhưng lại
H.264 là chuẩn nén tiên tiến với nhiều ưu điểm do tỉ lệ nén làm giảm chất lượng hình ảnh và thường được sử dụng trong các
khá cao mà vẫn giữ được chất lượng hình ảnh khá tốt[1]. Ngày ứng dụng hình ảnh có độ phân giải thấp hay các ứng dụng trên
nay, chuẩn nén H.264 được sử dụng rộng rãi trong hầu hết các di động. Hướng tới các ứng dụng video chất lượng cao thông
ứng dụng video từ tốc độ thấp cho đến các ứng dụng độ phân thường các bộ ước lượng chuyển động dựa trên thuật toán Full
giải cao. H.264 sử dụng kỹ thuật ước lượng chuyển động đa kích Search và được thực hiện trên phần cứng[4]. Bài báo này thực
cỡ khối (Variable Block Size Motion Estimation, VBSME) và hiện xây dựng bộ ước lượng chuyển động nguyên dựa trên thuật
được thực hiện qua 2 bước: ước lượng chuyển động nguyên toán Full Search để ứng dụng vào các video chất lượng cao.
(Integer Motion Estimation, IME) và ước lượng chuyển động Nội dung của bài báo được tổ chức như sau: Phần I là giới
thập phân (Fraction Motion Estimation, FME). Trong đó, bộ ước thiệu chung về ước lượng chuyển động, phần II giới thiệu các
lượng chuyển động nguyên có vai trò quan trọng trong việc giảm nghiên cứu và kiến trúc phần cứng cho thuật toán Full Search,
độ dư thừa, tăng khả năng nén và cũng là thành phần có độ phức phần III nêu kiến trúc đề xuất và thực hiện, phần IV là kết quả
tạp tính toán cao, tốn nhiều thời gian và tài nguyên của hệ thống và đánh giá thiết kế, cuối cùng là kết luận.
mã hóa H.264[2].
Kỹ thuật ước lượng chuyển động dựa trên các thuật toán dò II. CÁC KIẾN TRÚC CHO IME
tìm khối (BMA-Block Matching Algorithm) để tìm kiếm vector Có nhiều nghiên cứu cho ước lượng chuyển động với kích cỡ
chuyển động. Ý tưởng của BMA là chia khung hiện tại thành các khối thay đổi với các kiến trúc mảng một chiều, 2 chiều, kiến
khối nhỏ (Macro Block, MB), sau đó so sánh từng MB này với trúc song song đa lối vào hoặc kiến trúc sử dụng bộ cộng hình
các MB xung quanh của khung tham khảo, còn gọi là vùng tìm cây[2,4,6,7,8]… Kiến trúc IME trong tham khảo[4] và [5] cho
kiếm, để tìm vector chuyển động. Mức độ khác nhau giữa 2 MB thông lượng xử lý cao nhưng cần bộ nhớ cho vùng tìm kiếm lớn
được xác định bằng cách tính tổng độ sai khác giữa các pixel. (2p + N-1)2. Kiến trúc [5] còn có hạn chế là tốn nhiều thời gian
Có nhiều cách để tính độ sai khác, trong đó phương pháp được cho bước khởi tạo ban đầu. Tham khảo [6] sử dụng hiệu quả các
sử dụng rộng rãi nhất là Sum of Absolute Difference (SAD). Để đơn vị xử lý nhưng vùng tìm kiếm bị hạn chế. Tham khảo [7]
xác định được SAD nhỏ nhất ta dựa vào công thức (1) và (2). cho thông lượng khá cao nhưng tốn rất nhiều đơn vị xử lý. Các
Trong đó, CB là khối thực thi hiện tại (Current Block), RB là kiến trúc này có sự đánh đổi giữa dung lượng và lượng truy cập
khối tham chiếu (Reference Block), SR là dải tìm kiếm (search dữ liệu bộ nhớ, giữa thông lượng xử lý và tài nguyên hệ thống.
range), i, j là vector chuyển động (Motion Vector, MV). Trong số các thiết kế này, 2-D SAD tree IME[4] cho thông
𝑁𝑁−1 𝑁𝑁−1
(1) lượng cao và được ứng dụng trong các bộ mã hóa H.264/AVC
𝑆𝑆𝑆𝑆𝐷𝐷(𝑖𝑖,𝑗𝑗) = ∑ ∑|𝐶𝐶𝐶𝐶(𝑚𝑚,𝑛𝑛) − 𝑅𝑅𝑅𝑅(𝑚𝑚+𝑖𝑖,𝑛𝑛+𝑗𝑗) | cấu hình cao. Hình 1 mô tả kiến trúc của một khối IME cơ bản.
𝑚𝑚=0 𝑛𝑛=0
Bộ nhớ khối hiện tại (CMB) lưu trữ 16x16 pixel của current MB
(2)
𝑆𝑆𝑆𝑆𝑆𝑆𝑚𝑚𝑚𝑚𝑚𝑚 = min(𝑆𝑆𝑆𝑆𝐷𝐷(𝑖𝑖,𝑗𝑗) ) , − 𝑆𝑆𝑆𝑆 ≤ 𝑖𝑖, 𝑗𝑗 < 𝑆𝑆𝑆𝑆 trong khi bộ nhớ Vùng tìm kiếm (RMB) sẽ lưu trữ các giá trị
trong vùng tìm kiếm. Các giá trị từ 2 bộ nhớ này sẽ được đưa
ISBN: 978-604-67-0635-9 190
190
HộiHội Thảo
Thảo Quốc
Quốc Gia
Gia 2015về
2015 vềĐiện
ĐiệnTử,
Tử,Truyền
TruyềnThông
Thông và
và Công
CôngNghệ
NghệThông
ThôngTinTin
(ECIT 2015)
(ECIT 2015)
đến Mảng tính toán để tính độ sai khác sau đó sẽ được cộng lại thì lưu mỗi lần sẽ là 64 bit (8 pixel) và cần 10 chu kì để dịch
với nhau cho tất cả các kích thước khối ở bộ cộng SAD. Các đầy mảng 80 pixel. Trong thiết kế đề xuất, chúng tôi sử dụng 2
SAD này sẽ được so sánh với nhau để đưa ra các giá trị SAD bộ đệm SIPO, một bộ vào nối tiếp 64 bít ra song song 128 bit
nhỏ nhất từ đó tìm được các vector chuyển động. cho việc lưu giá trị hiện tại (CMB) và một bộ vào 64 bít ra 640
Off-chip bít (80 pixel) cho việc lưu giá trị tham khảo (RMB). Bộ CMB
Off-chip MEM
MEM
là mảng thanh ghi chứa 16x16 pixel, load song song cùng lúc
16pixel/chu kì để chứa các giá trị của khối hiện tại, kết hợp với
IME
IME SIPO ta cần 33 chu kì để lưu đầy mảng. RMB là mảng thanh
ghi dịch vòng, có thể lấy dữ liệu song song và dịch trái, phải.
Bộ
Bộ nhớ
nhớ Vùng
Vùng tìm
tìm kiếm
kiếm Kích thước độ rộng mảng chính bằng kích thước của macro
Khối
Khối hiện
hiện tại
tại (SRAM)
(SRAM) block (N). Kích thước độ dài của mảng phụ thuộc vào kích
thước ngang (p) của vùng tìm kiếm và bằng 2p + N (pixel). Ví
dụ, trong thiết kế của đề xuất này, độ rộng MB N = 16, kích
Mảng
Mảng tính
tính toán
toán thước tìm kiếm p = 32 thì chiều dài của mảng là 80 pixel và kích
thước mảng sẽ là 80x16 pixel. Dữ liệu đầu vào được lấy từ thanh
ghi SIPO và đầu ra được đưa đến các bộ PEs. Khi kết hợp với
Bộ
Bộ cộng
cộng SAD
SAD SIPO, để lưu đầy RMB ta cần có 10 x 16 + 1 = 161 chu kì. RMB
có chức năng giữ giá trị hiện tại cho các khối PE tính toán đồng
thời lưu phần không tính toán để sử dụng cho các dữ liệu tìm
kiếm tiếp theo. So với SRAM chứa cả vùng tìm kiếm thì mảng
SAD
SAD dịch vòng chỉ chứa phần tính toán hiện tại và điểm tìm kiếm
trong một hàng của vùng tìm kiếm. Các hàng tính toán xong sẽ
Hình 1: Sơ đồ hệ thống IME cơ bản được loại khỏi mảng (không dùng đến nữa) và được thay thế
bằng hàng mới trong vùng tìm kiếm. Kết hợp với hướng tìm
Để thực hiện ước lượng chuyển động, đầu tiên tất cả các pixel kiếm kiểu “snake scan” giúp làm tăng hiệu quả truy cập tính
trong vùng tìm kiếm phải được đưa vào bộ nhớ tìm kiếm SW. toán.
Nếu kích thước vùng tìm kiếm ngang là [-p,p-1] và dọc là [-q,
q-1] thì kích thước bộ nhớ là 4pq (pixel), do đó IME cần 1 bộ
nhớ để lưu trữ vùng tìm kiếm sau đó mới đưa vào các thanh ghi SIPO SIPO
ĐIỀU KHIỂN
để tính toán. Hơn nữa, có 2 dạng truy cập bộ nhớ trong bộ cộng TRUY CẬP
SAD là truy cập hàng và truy cập cột mà SW chỉ hỗ trợ truy cập BỘ NHỚ
hàng hoặc cột nên truy cập cột sẽ được thực hiện bằng cách truy
CMB RMB
cập nhiều hàng và ngược lại. Với H.264/AVC, MB có kích
thước là 16x16 sẽ dẫn đến truy cập 1 cột cần truy cập đến 16
hàng. Vậy, truy cập cột sẽ cần 16 chu kì clock nếu truy cập hàng BỘ ĐIỀU KHIỂN
cần 1 chu kì. Do đó, việc truy cập bộ nhớ phức tạp và cần băng MẢNG 16x16 PEs
thông lớn. Ví dụ kiến trúc SAD trong [4] dữ liệu truyền từ bộ

nhớ vào thanh ghi là Nx8bit/chu kì. SAD ADDER TREE
Dựa vào những phân tích trên, chúng tôi tiến hành thực hiện
trên bộ IME trên 2 mô hình khác nhau sau đó đánh giá hiệu quả BỘ PHÁT
ĐỊA CHỈ
từng mô hình để lựa chọn phù hợp cho từng ứng dụng của chuẩn BỘ SO SÁNH (SAD COMPARATOR)
nén video H.264. 41 MVs
III. KIẾN TRÚC ĐỀ XUẤT CHO BỘ IME

Hình 2: Mô hình IME được đề xuất
Sơ đồ tổng quát của hệ thống được minh họa ở hình 2 bao
gồm các thành phần sau: 256 đơn vị xử lý tính toán song song Mảng 16x16-PEs một ma trận gồm 256 khối đơn vị tính toán
các giá trị sai khác của pixel giữa khối hiện tại và khối tham giá trị tuyệt đối giữa các pixel hiện tại và các pixel tham khảo
khảo; một mảng các thanh ghi dịch vòng ghi dữ liệu vào song dựa vào công thức (3).
song và có thể dịch trái, dịch phải; bộ SIPO là các thanh ghi (𝑎𝑎 + 𝑏𝑏 ′ ) + 1, 𝑣𝑣ớ𝑖𝑖 𝑎𝑎 > 𝑏𝑏
|𝑎𝑎 − 𝑏𝑏| = { (3)
đệm vào nối tiếp ra song song giúp tăng hiệu quả truyền dữ liệu; (𝑎𝑎 + 𝑏𝑏 ′ )′ , 𝑣𝑣ớ𝑖𝑖 𝑎𝑎 ≤ 𝑏𝑏
mảng 16x16 thanh ghi chứa dữ liệu khối hiện tại; bộ cộng các Bộ cộng SAD là một bộ cộng 2 chiều dùng để tính toán các
giá trị sai khác có kiến trúc hình cây 2 chiều; và so sánh các giá giá trị SAD của 41 kích thước khác nhau của 1 macro block.
trị SAD. Ngoài ra còn có bộ điều khiển truy xuất bộ nhớ và bộ Mô hình bộ cộng được chỉ ra ở hình 3. MB 16x16 được chia
điều khiển của toàn hệ thống. thành 4 khối 8x8 tương ứng B0-B3. Mỗi khối 8x8 lại được chia
Các SIPO là các thanh ghi đệm vào nối tiếp và ra song song thành 4 khối 4x4, vậy có tất cả 16 khối 4x4 tương ứng từ C0-
có đầu vào bằng với độ rộng bus của bộ nhớ ngoài và có chiều C15. Tầng đầu tiên là 16 bộ cộng 4x4 được thiết kế dựa trên bộ
dài phụ thuộc vào bộ nhớ mà nó hỗ trợ nhằm để tăng hiệu quả cộng Carry Save Adder 16 ngõ vào. Ở các tầng tiếp theo ta cộng
truy cập bộ nhớ. Ví dụ, độ rộng bit của bộ nhớ ngoài là 64 bit các kết quả từ bộ cộng 4x4 để cho ra các kích thước khối lớn
191
191
Hội Hội
Thảo Quốc
Thảo GiaGia
2015 ĐiệnTử,
Tử,Truyền
TruyềnThông
ThôngTinTin (ECIT
(ECIT 2015)
2015)
hơn. Nếu sử dụng các bộ cộng thông thường thì độ trễ qua các 𝑆𝑆𝑆𝑆𝑆𝑆
bộ cộng rất lớn, điều này sẽ làm chậm tốc độ tính toán của toàn
hệ thống. Để giảm độ trễ qua các tầng cộng, trong việc tính toán = ((𝐴𝐴 ⊕ 𝐵𝐵). (𝐶𝐶 ⊕ 𝐷𝐷) + (𝐴𝐴 ⊕ 𝐵𝐵). (𝐶𝐶 ⊕ 𝐷𝐷)) . 𝐶𝐶𝐶𝐶𝐶𝐶
các kích cỡ khối lớn hơn ta sử dụng các bộ cộng Cary Save
Adder cho toàn bộ các khối nhỏ hơn đứng trước. Sau đó, các + ((𝐴𝐴 ⊕ 𝐵𝐵). (𝐶𝐶 ⊕ 𝐷𝐷) + (𝐴𝐴 ⊕ 𝐵𝐵). (𝐶𝐶 ⊕ 𝐷𝐷)) . 𝐶𝐶𝐶𝐶𝐶𝐶 (4)
giá trị SAD của các kích thước khối được tính toán thông qua
bộ cộng Carry Look Ahead cải tiến. 𝐶𝐶𝐶𝐶𝐶𝐶𝐶𝐶𝐶𝐶 = (𝐴𝐴 ⊕ 𝐵𝐵 ⊕ 𝐶𝐶 ⊕ 𝐷𝐷). 𝐶𝐶𝐶𝐶𝐶𝐶 + (𝐴𝐴 ⊕ 𝐵𝐵 ⊕ 𝐶𝐶 ⊕ 𝐷𝐷). 𝐷𝐷 (5)
C0 C1 C2 C3 C4 C5 C6 C7 C8 C9 C10 C11 C12 C13 C14 C15
𝐶𝐶𝐶𝐶𝐶𝐶𝐶𝐶 = (𝐴𝐴 ⊕ 𝐵𝐵). 𝐶𝐶 + (𝐴𝐴 ⊕ 𝐵𝐵). 𝐴𝐴 (6)
16: SAD 4x4
4x4 4x4 4x4 4x4 4x4 4x4 4x4 4x4 4x4 4x4 4x4 4x4 4x4 4x4 4x4 4x4
Σ Σ Σ Σ Σ Σ Σ Σ 8: SAD 8x4
8: SAD 4x8 Hoạt động của bộ IME được chia ra làm 2 bước chính. Thứ
Σ
B0 B1
Σ Σ B2 B3
Σ
4: SAD 8x8
nhất là bước khởi tạo hay lưu dữ liệu vào CMB và RMB, việc
Σ
lưu dữ liệu vào 2 mảng thanh ghi này được thực hiện đồng thời.
Σ 2: SAD 16x8
2: SAD 8x16
Thiết kế giả sử động rộng bus truy xuất bộ nhớ ngoài là 64 bit
và thực hiện với kích thước vùng tìm kiếm p = 32 (64x64) thì
+
như đề cập ở phần trên, bộ CMB cần 33 chu kì và RMB cần 161
SAD 16x16
MB
chu kì. Do thực hiện đồng thời nên ở bước khởi tạo cần 161 chu
Hình 3: Mô hình bộ cộng SAD 2 chiều
kì tổng cộng.
Mô hình thiết kế của bộ cộng 4x4 theo kiến trúc Cary Save Thứ hai là bước tính toán giá trị tuyệt đối, tính SAD và 41
Adder được chỉ ra ở hình 4. Các tầng trên chỉ tính riêng lẻ phần vector chuyển động. Với đặc điểm của bộ cộng SAD 2 chiều,
tổng và số nhớ sử dụng kỹ thuật cộng dồn 4:2 (4:2 compressor) mỗi điểm tìm kiếm được thực hiện trong 1 chu kì cho 41 vector.
để cho kết quả tối ưu nhất[13,14]. Tầng cuối cùng một bộ cộng Với kích thước vùng tìm kiếm 64x64 = 4096 điểm thì số chu kì
Carry Look Aheah cải tiến (MCLA) [12] được sử dụng để cộng thực hiện tính toán là 4096 chu kì. Để so sánh SAD ta cần thêm
phẩn tổng và số nhớ cho kết quả SAD cuối cùng. Với việc sử 1 chu kì đệm vậy tổng cộng 2 bước là 161 + 4096 + 1 = 4258
dụng bộ cộng Carry Save Adder kết hợp với MCLA sẽ cho kết chu kì/MB. Đối với vùng tìm kiếm nhỏ hơn, p = 16 thì tổng
quả tính toán nhanh hơn nhiều so với các bộ cộng thông thường. cộng là 97 + 1024 +1 = 1122 chu kì/MB, hay p = 8 thì ta có 65
+ 256 +1 = 322 chu kì/MB. Sơ đồ thời gian thực thi của các
Σ Σ Σ Σ thành phần trong hệ thống được minh họa ở hình 6.
0 33 161-162 4258-4259 Chu kì
Khối CMB Lưu dữ liệu
Σ Σ Khối RMB Lưu dữ liệu Dịch trái, phải và lưu
Khối cộng SAD Tính SAD
Khối so sánh So sánh SAD và xác định các MVs
Σ Hình 6: Sơ đồ thời gian tính toán của IME

+ SAD4x4
SAD4x4 Do việc tính toán SAD của 7 kích cỡ khối khác nhau trong 1
Hình 4: Cấu trúc bộ cộng SAD4x4 chu kì nên thời gian tính toán sẽ dài, điều này sẽ làm giảm tần
số hoạt động của mạch. Để tăng tần số ta tiến hành chia đôi
Thiết kế sử dụng bộ cộng dồn 4:2 thay vì 3:2 để tối ưu số tầng đường critical path hay pipeline 2 tầng trong cấu trúc SAD.
cộng từ đó giảm độ trễ trong tính tính toán. Các biểu thức tính Cấu trúc IME 1 pipline 2 tầng (IME1p)
toán của bộ cộng 4:2 được chỉ ra ở công thức (4), (5), và (6). So với mô hình IME1, IME1p chia bộ cộng SAD thành 2
Hình 5 minh họa mô hình bộ cộng 4:2. Với đường truyền trễ tầng. Khi đó việc tính SAD và so sánh kết quả của các kích cỡ
qua một cổng XOR-XNOR và 2 bộ đa hợp. khối sẽ chia thành 2 chu kì, chu kì thứ nhất, bộ cộng sẽ cho các
kết quả của các khối 4x4, 4x8, 8x4, chu kì thứ 2 sẽ cho kết quả
các khối còn lại: 8x8, 8x16, 16x8 và 16x16. Và việc so sánh để
đưa ra các giá trị vector ước lượng cũng được thực hiện trong 2
chu kì. So với mô hình IME1 thì mô hình pipeline sẽ cần thêm
8 thanh ghi 14 bít và 1 chu kì đệm, tuy nhiên đường critical path
sẽ ngắn lại do đó tần số hoạt động của mạch sẽ tăng lên.
Cấu trúc IME đa đầu vào (IME2)
Do đặc điểm cấu trúc của mảng dịch vòng lưu các giá trị của
N hàng trong vùng tìm kiếm nên ta có thể tính toán song song
các điểm tìm kiếm bằng cách đặt song song các mảng 16x16
PEs, các bộ cộng SAD và các bộ so sánh mà không cần mở rộng
các mảng thanh ghi lưu trữ. Nếu đặt m bộ tính toán thì số chu
kì thực hiện ước lượng MB sẽ giảm đi m lần, số bộ tính toán tối
Hình 5: Kiến trúc bộ cộng 4:2 đa bằng với 2 lần kích thước tìm kiếm ngang. Tuy nhiên, việc
192
192
HộiHội
Thảo Quốc
Thảo Gia
Quốc 2015
ĐiệnTử,
Tử,Truyền
NghệThông
ThôngTinTin (ECIT
(ECIT 2015)
2015)
tăng bộ tính toán sẽ làm tăng đáng kể diện tích của toàn hệ thống V. KẾT LUẬN
do đó tùy vào các cấu hình video mà chọn số bộ tính toán (số Trong bài báo này, chúng tôi đã xây dựng một kiến trúc VLSI
đầu vào) cho thích hợp. thông lượng cao cho bộ ước lượng chuyển động nguyên trong
Với 4 bộ tính toán song song. Mỗi chu kì sẽ thực hiện tính chuẩn mã hóa H.264/AVC. Bộ IME này sử dụng kiến trúc cộng
toán song song 4 điểm tìm kiếm và cho ra giá trị 41 vector SAD hình cây kết hợp tối ưu phần cứng, cải tiến bộ nhớ tìm kiếm
chuyển động của 41 kích thước khác nhau. Khi kích thước vùng và xử lý đa đầu vào cho thông lượng xử lý cao, giảm dung lượng
tìm kiếm p lần lượt là 32, 16, và 8 thì số chu kì thực hiện ước và tăng hiệu quả truy cập bộ nhớ. Với các kết quả đạt được, bộ
lượng xong 1 MB 16x16 lần lượt là 1186, 354 và 130 chu kì. IME có thể đáp ứng cho các ứng dụng nén video thời gian thực
Trong bài báo này, chúng tôi tiến hành thực hiện trên phần cứng độ phân giải cao như 1280x720 @ 30 fps hay 1920x1080 @
bộ IME 2 đầu vào (IME2_2C) và IME 4 đầu vào (IME2_4C) 30fps đối với vùng tìm kiếm là [64x64].
để so sánh kết quả với nhau.
IV. KẾT QUẢ MÔ PHỎNG VÀ TỔNG HỢP
[1] ITU, ITU-T Recommendation H.264: Advanced video coding
Hệ thống IME được thực hiện bằng ngôn ngữ Verilog HDL for generic audiovisual services, 2006.
và được mô phỏng kết quả trên phần mềm VCS của Synopsys [2] Youn-Long Steve Lin, Chao-Yang Kao, Huang-Chih Kuo, Jian-Wen
và so sánh kết chính xác với Matlab. Mạch được tổng hợp dựa Chen “VLSI Design for Video Coding -H.264/AVC Encoding from
Standard Specification to Chip,” Springer- New York-Dordrecht-
trên công nghệ 90nm của Synopsys kết quả thu được ở bảng 1 Heidelberg-London, ISBN 978-1-4419-0958-9, 2010.
và bảng 2. Một số so sánh được chỉ ra ở bảng 3. [3] Tung-Chien Chen, Shao-Yi Chien, Yu-Wen Huang, Chen-Han Tsai,
Bảng1: Kết quả tổng hợp mạch Ching-Yeh Chen, To-Wei Chen, and Liang-Gee Chen, “Analysis and
Architecture Design of an HDTV720p 30 Frames/s H.264/AVC
Latency* Encoder”, Transactions on Circuits and Systems for Video Technology,
Tần số Tài nguyên (Chu kì) vol.16 No.6 June 2006.
Mô hình
(MHz) (K Leaf Cell)
16x16 32x32 64x64 [4] Ching-Yeh Chen, Shao-Yi Chien, Yu-Wen Huang, Tung-Chien Chen,
IME1 300 96 Tu-Chih Wang, and Liang-Gee Chen, “Analysis and Architecture Design
of Variable Block-Size Motion Estimation for H.264/AVC”, IEEE
IME1p 350 118
65 97 161 Transactions on Circuits and Systems—i: Regular papers, vol. 53, no. 2,
IME2_2C 300 161 February 2006.
IME2_4C 300 215
[5] Meihua GU, Ningmei YU, Lei ZHU, Wenhua JIA, “High Throughput and
*Số chu kì đệm để lưu giá trị vào mảng thanh ghi tìm kiếm phụ thuộc vào Cost Efficient VLSI Architecture of Integer Motion Estimation for
kích thước vùng tìm kiếm H.264/AVC”, Journal of Computational Information Systems, April
Bảng 2: Thông lượng xử lý của các kiến trúc 2011.
[6] Chien-Min Ou, Chian-Feng Le and Wen-Jyi Hwang, “An Efficient VLSI
Thông lượng xử lý Architecture for H.264 Variable Block Size Motion Estimation”, IEEE
Mô hình Số PE (Chu kì/MB)/(kMB/s) Transactions on Consumer Electronics, Vol. 51, No. 4, November 2005.
16x16 32x32 64x64 [7] Chao-Yang Kao and Youn-Long Lin, “A Memory-Efficient and Highly
IME1 256 322/970 1122/278 4258/73 Parallel Architecturefor Variable Block Size Integer Motion
IME1p 256 323/1105 1123/318 4259/83 Estimation in H.264/AVC”, IEEE Transactions on Very Large Scale
IME2_2C 512 193/1619 609/513 2209/141 Integration (VLSI) Systems, vol. 18, No. 6, June 2010.
IME2_4C 1024 130/2403 354/882 1186/263 [8] Minho Kim, Ingu Hwang, Soo-Ik Chae, “A Fast VLSI Architecture for
So sánh và đánh giá Full-Search Variable Block Size Motion Estimation in MPEG-4
Ở kiến trúc đề xuất, bộ nhớ cục bộ của vùng tìm kiếm là AVC/H.264”, Proceedings of Asia and South Pacific design
automation conference, Shanghai, China, January 2005, pp 631–634.
N(2p+N) giảm hơn 60% so với việc lưu trữ toàn bộ vùng tìm
[9] Xuan Jing, Chau, L.-P, “An efficient three-step search algorithm for block
kiếm trong tham khảo [4] và [5]. Kiến trúc này cũng dễ dàng motion estimation”, Multimedia, IEEE Transactions on, vol. 6, p.435 –
tăng việc tính toán đa đầu vào mà không thay đổi bộ nhớ tìm 438, May 2004.
kiếm. Dựa vào bảng 2 ta thấy thông lượng xử lý của kiến trúc [10] Shan Zhu, and Kai-Kuang Ma, “ A New Diamond Search Algorithm for
này lớn cho phép xử lý video ở thời gian thực tại độ phân giải Fast Block-Matching Motion Estimation”, IEEE Trans. Image
1280x720@30fps (108K MB/s) hoặc 1920x1080@30fps Processing, vol 9, no. 2, pp. 287-290, February 2000.
(245760 MB/s) ở kiến trúc IME2_4C. [11] Lai-Man Po, and Wing-Chung Ma, “A Novel Four-Step Search Algorithm
for Fast Block Motion Estimation”, IEEE Trans. Circuits And Systems
Bảng 3: So sánh với các công trình đã nghiên cứu For Video Technology, vol 6, no. 3, pp. 313-317, June 1996.
[12] Yu-Ting Pai and Yu-Kumg Chen, “The Fastest Carry Lookahead Adder”,
Nghiên cứu [5] [6] [7a] IME2_2C
Proceedings of the Second IEEE International Workshop on Electronic
Kiến trúc SAD2D 1D 2D SAD 2D
Design, Test and Applications (DELTA’04) 0-7695-2081-2/04, 2004.
Công nghệ(nm) 130 180 180 90
Số PEs 512 256 4096 512 [13] R.UMA,Vidya Vijayan, M. Mohanapriya, Sharon Paul, “Area, Delay and
Power Comparison of Adder Topologies”, International Journal of VLSI
Kích thước tìm kiếm 65x65 16x16 64x64 64x64
design & Communication Systems (VLSICS) Vol.3, No.1, February
Tài nguyên (cổng) - - 1449K 162K 2012.
Bộ nhớ(KB) 6.656 - 2.9 1.536
Tần số (MHz) 300 200 130 300 [14] Sreehari Veeramachaneni, Kirthi Krishna M, Lingamneni Avinash,
Sreekanth Reddy Puppala , M.B. Srinivas, “Novel Architectures for High-
Lantency (chu kì) 700 - - 161
Speed and Low-Power 3-2, 4-2 and 5-2 Compressors”, IEEE 20th
Thông lượng 2815 256 512 2209 International Conference on VLSI Design (VLSID'07) 0-7695-2762-0/07
(chu kì/MB) 2007.
193
193
THUẬT TOÁN LPSO LẬP LỊCH THỰC THI LUỒNG CÔNG VIỆC CHO CÁC ỨNG
DỤNG KHOA HỌC TRONG MÔI TRƯỜNG ĐIỆN TOÁN ĐÁM MÂY
Phan Thanh Toàn1, Nguyễn Thế Lộc2, Nguyễn Doãn Cường3

1
Khoa Sư phạm kỹ thuật, Trường Đại học Sư Phạm Hà Nội
2
Khoa Công nghệ thông tin, Trường Đại học Sư Phạm Hà Nội
3
Viện Công nghệ thông tin, Viện Khoa học công nghệ quân sự
pttoan@hnue.edu.vn, locnt@hnue.edu.vn, cuongvncntt@yahoo.com
Tóm tắt (iii) thuật toán lập lịch mới tên là LPSO (mục 4.4).
Ứng dụng dạng luồng công việc đã được sử dụng rộng rãi Phần V mô tả các thực nghiệm được tiến hành dựa trên công
trong nhiều công trình nghiên cứu khoa học, đây là loại ứng dụng cụ mô phỏng Cloudsim [1] và phân tích những số liệu thực
có qui mô phức tạp và thường phải xử lí một lượng dữ liệu rất lớn nghiệm thu được. Phần VI tóm tắt những kết quả chính của bài
do vậy các môi trường tính toán phân tán như điện toán lưới (grid báo và hướng nghiên cứu sẽ tiến hành trong tương lai.
computing), hay điện toán đám mây (cloud computing) thường
II. CÁC CÔNG TRÌNH LIÊN QUAN
được sử dụng. Bài toán lập lịch từ lâu đã được chứng minh là
thuộc lớp NP-complete trong khi mô hình dịch vụ trên môi trường 2.1. Các hướng tiếp cận bài toán
điện toán đám mây yêu cầu phải tìm ra lời giải trong thời gian
ngắn để khách hàng không phải chờ đợi. Bài báo này đề xuất thuật Bài toán lập lịch luồng công việc đã được chứng minh là
toán metaheuristic LPSO để tìm kiếm phương án lập lịch dựa trên thuộc lớp NP-đầy đủ [2] nghĩa là thời gian để tìm ra lời giải tối
phương pháp Tối ưu bày đàn. Thực nghiệm được tiến hành trên ưu là rất lớn, vì vậy đã có nhiều giải thuật metaheuristic được
công cụ mô phỏng CloudSim đã chứng tỏ thuật toán đề xuất cho nghiên cứu nhằm tìm ra lời giải gần đúng trong thời gian ngắn.
kết quả tốt hơn ba thuật toán đối chứng là PSO, Random và S. Parsa [3] đã đề xuất một thuật toán lập lịch nhằm tối thiểu
RoundRobin và lời giải tìm được có độ sai lệch rất bé so với lời giải thời gian thực thi trong môi trường lưới tính toán Grid. J.M.
tối ưu. Cope và đồng nghiệp đã phân tích hiệu năng của giải thuật
FRMTL và FRMAS [4] trong môi trường lưới tính toán
Từ khóa: workflow scheduling, particle swarm optimization, cloud TeraGrid, một dạng đặc biệt của đám mây điện toán. A.
computing Agarwal đã đề xuất thuật toán tham lam [5] trong đó mỗi tác vụ
I. ĐẶT VẤN ĐỀ được gán một thứ tự ưu tiên dựa vào khối lượng công việc của
tác vụ, mỗi máy chủ cũng được gán một thứ tự ưu tiên theo tốc
Luồng công việc (workflow) là một chuỗi có thứ tự các độ xử lý của máy chủ sau đó gán các tác vụ vào các máy chủ
tác vụ (task) có thể được thực hiện đồng thời hay tuần tự nếu theo các thứ tự ưu tiên đã tính toán. Cách làm này có nhược
dữ liệu đầu ra của tác vụ này là đầu vào của tác vụ kế tiếp. Rất điểm là khiến những tác vụ có mức ưu tiên thấp phải chờ đợi
nhiều ứng dụng trong các lĩnh vực khoa học khác nhau đều yêu lâu và bỏ qua yếu tố tốc độ truyền dữ liệu giữa các máy chủ
cầu phải xử lí một lượng lớn dữ liệu được tổ chức theo dạng trong đám mây.
luồng công việc. Vấn đề lập lịch luồng công việc trong môi
trường điện toán đám mây về bản chất là tìm phương án ánh xạ Một số tác giả khác như M.Wieczorek [6] đã nghiên
những tác vụ của luồng công việc tới các máy chủ của đám cứu và đề xuất thuật toán lập lịch thực thi luồng công việc theo
mây sao cho thời gian xử lý toàn bộ luồng công việc là nhỏ phương pháp GA (Genetic Algorithm - Gen di truyền), tuy
nhất, biết rằng khối lượng tính toán và yêu cầu dữ liệu của các nhiên các nghiên cứu [7] [8] đã nhận định rằng phương pháp
tác vụ, tốc độ tính toán và truyền thông của các máy chủ là PSO (Particle Swarm Optimization - Tối ưu bày đàn) có ưu thế
khác nhau. hơn so với phương pháp GA khi giải bài toán lập lịch luồng
công việc trong những môi trường tính toán phân tán như Lưới
Phần tiếp theo của bài báo có cấu trúc như sau. Phần II (Grid Computing) hay Đám mây (Cloud Computing). Theo
giới thiệu một số công trình nghiên cứu có liên quan về bài hướng đó, S. Pandey [9] đã đề xuất thuật toán theo phương
toán lập lịch luồng công việc.Trong phần III chúng tôi trình pháp PSO nhằm cực tiểu hóa chi phí thực thi. Thay vì tìm
bày mô hình lý thuyết để biểu diễn năng lực tính toán và truyền phương án có tổng chi phí thực thi tại các máy chủ là bé nhất,
thông của đám mây, dựa trên mô hình lý thuyết này, phần IV S. Pandey lại định nghĩa hàm mục tiêu để tìm phương án có chi
đề xuất: phí thực thi của máy chủ tốn kém nhất (máy có tổng chi phí lớn
(i) phương thức mới để cập nhật vị trí của cá thể (mục 4.2) hơn mọi máy khác) là nhỏ nhất so với các phương án khác.
(ii) giải pháp để chương trình thoát ra khỏi vùng cực trị địa Cách làm này có xu hướng “cào bằng” nghĩa là thiên về các lời
phương và di chuyển tới một vùng mới trong không gian giải có chi phí thực thi của các máy chủ là xấp xỉ nhau. Chúng
tìm kiếm (mục 4.3) tôi nhận thấy, qua lý thuyết và các thực nghiệm kiểm chứng,
ISBN: 978-604-67-0635-9 194

194
Hội Hội
Thảo Quốc
Thảo GiaGia
2015 ĐiệnTử,
Tử,Truyền
TruyềnThông
ThôngTinTin (ECIT
(ECIT 2015)
2015)
cách làm này thường khiến chương trình sớm hội tụ về những B: S×S → R+
giá trị cực tiểu địa phương thay vì tìm ra cực trị toàn cục. (Si,Sj) → B(Si,Sj) 1
2.2. Phương pháp Tối ưu bày đàn - Giả thiết hàm băng thông
B() thỏa mãn các điều kiện 2 3 4
Phương pháp tối ưu bày đàn (PSO - Particle Swarm sau:
Optimization) được đề xuất bởi Kennedy và Eberhart [10] là
phương pháp tìm kiếm tiến hóa dựa theo hành vi tìm thức ăn  B(Si,Si) = ∞ : thời gian
theo đàn của các loài động vật như chim hay cá, mỗi cá thể truyền tại chỗ bằng không 5
trong đàn sẽ di chuyển dựa theo kinh nghiệm của bản thân và  B(Si,Sj) = B(Sj,Si) : tốc độ Hình 1: Đồ thị biểu diễn một
của các cá thể khác trong quần thể. Tại bước lặp thứ k, hướng truyền hai chiều bằng nhau luồng công việc với 5 tác vụ
di chuyển của cá thể thứ i trong đàn được cập nhật theo các  Giá trị B(Si,Sj) được cho
công thức sau: trước (i,j).
vik+1= vik + c1 rand1×(pbesti - xik) + c2 rand2 ×(gbest - xik) (1) - Khối lượng dữ liệu do tác vụ Ti chuyển tới tác vụ Tj, kí
xik+1 = xik + vik (2) hiệu là Dij với đơn vị là Megabit, là giá trị cho trước (i,j).
Trong đó
- Mỗi phương án xếp lịch thực thi luồng công việc tương
 vik, vik+1 :vector dịch chuyển của cá thể i ở bước lặp k và k+1 đương với một hàm f()
 xik, xik+1 : vị trí của cá thể i ở bước lặp thứ k và k+1
ω: hệ số quán tính f:T→S
 c1, c2 : hệ số gia tốc Ti → f(Ti)
Trong đó f(Ti) là máy chủ chịu trách nhiệm thực thi tác vụ Ti
 rand1, rand2 : các hệ số ngẫu nhiên trong đoạn [0,1]
Từ các giả thiết trên ta suy ra:
 pbesti : vị trí tốt nhất của cá thể i tính tới thời điểm hiện tại
 lbesti : vị trí tốt nhất của cá thể i trong lân cân.  Thời gian tính toán của tác vụ Ti là: Wi (i=1,2, ... M) (3)
P f Ti 
Có hai phiên bản của phương pháp PSO là PSO toàn cục  Thời gian truyền dữ liệu giữa tác vụ Ti và tác vụ con Tj là
và PSO cục bộ, với phiên bản PSO toàn cục vector dịch Dij
chuyển của mỗi cá thể được cập nhật theo vị trí tốt nhất của cá (4)
thể và vị trí tốt nhất của cả quần thể, ngược lại phiên bản PSO B f Ti , f T j 
cục bộ vector dịch chuyển của mỗi cá thể được cập nhật theo Bài báo này định nghĩa hàm mục tiêu là: Makespan → min
vị trí tốt nhất của cá thể và vị trí tốt nhất của các lân cận của cá trong đó Makespan là thời gian hoàn thành luồng công việc,
thể đó. PSO toàn cục có tốc độ hội tụ nhanh tuy nhiên thường được tính từ khi tác vụ gốc được khởi động cho tới thời điểm
bị rơi vào cục bộ địa phương do vậy lời giải thường không tốt tác vụ cuối cùng được thực hiện xong.
bằng PSO cục bộ. IV. THUẬT TOÁN ĐỀ XUẤT
III. MÔ HÌNH LÝ THUYẾT 4.1. Mã hóa cá thể
Giả sử cần sắp xếp lịch biểu cho một luồng công việc trong Theo phương pháp PSO, tại bước lặp thứ k, cá thể thứ i
môi trường đám mây với các giả thiết như sau : trong đàn được xác định bởi vector vị trí xik (cho biết vị trí
- Luồng công việc được biểu diễn bởi đồ thị G=(V, E), với hiện tại) và vector dịch chuyển vik (cho biết hướng dịch
V là tập đỉnh của đồ thị, mỗi đỉnh biểu thị cho một tác vụ. chuyển hiện tại). Trong bài toán xếp lịch đang xét, hai vector
- T ={T1, T2,…,TM} là tập các tác vụ, M là số lượng tác vụ đó đều có số chiều bằng số tác vụ trong luồng công việc, ký
của luồng công việc đang xét. hiệu là M. Cả vector vị trí và vector dịch chuyển đều được
biểu diễn bằng cấu trúc dữ liệu bảng băm.
- E là tập cạnh thể hiện mối quan hệ cha-con giữa các tác
vụ. Cạnh (Ti, Tj)  E cho biết tác vụ Ti là cha của tác vụ Ví dụ 1: giả sử luồng công việc gồm tập tác vụ T={T1, T2, T3,
Tj, dữ liệu đầu ra của Ti sẽ là dữ liệu đầu vào cho tác vụ Tj T4, T5}, đám mây có tập máy chủ S = {S1, S2, S3}. Khi đó cá
(xem Hình 1) thể xi được biểu diễn bằng vector vị trí [1 ; 2 ; 1 ; 3 ; 2] chính
là phương án xếp lịch mà theo đó tác vụ T1, T3 được bố trí thực
- Tập máy chủ của đám mây ký hiệu là S = {S1, S2,….,SN}, hiện bởi máy chủ S1, tác vụ T2, T5 được thực hiện trên S2 còn
N là số lượng máy chủ của đám mây. tác vụ T4 được thực hiện bởi S3 như dưới đây
- Mỗi tác vụ có thể được thực thi trên một máy chủ bất kì, T1 T2 T3 T4 T5
máy chủ đó phải thực hiện toàn bộ tác vụ từ đầu đến cuối.
- Khối lượng tính toán (Workload) của tác vụ Ti kí hiệu là S1 S2 S1 S3 S2
Wi với đơn vị đo là flop (floating point operations: phép 4.2. Phương thức cập nhật vị trí của cá thể
tính trên số thực dấu phảy động). Wi được cho trước (i =
1,2, …M) Khi áp dụng công thức cập nhật vị trí của cá thể (2) vào
- Tốc độ tính toán của máy chủ Si , đơn vị là MI/s (million bài toán lập lịch đang xét, chúng ta gặp một vấn đề. Các thành
instructions/second), được ký hiệu bởi P(Si), là giá trị phần của vector dịch chuyển vik là số thực do công thức (1)
được cho trước (i = 1,2, …M) tính vector dịch chuyển có những tham số là số thực như
rand1, rand2, c1,c2. Nhưng vì tập máy chủ S là hữu hạn và đếm
- Giữa hai máy chủ Si, Sj bất kỳ (1≤i,j≤N) có một đường được nên các thành phần của vector vị trí xi phải là số nguyên
truyền với băng thông, đơn vị là Megabit/s, được biểu thị để có thể ánh xạ tới một máy chủ nào đó nơi mà tác vụ tương
bởi hàm hai biến B() được định nghĩa như sau:
195
195
HộiHội Thảo
Thảo QuốcGia
Quốc Gia2015
2015về
vềĐiện
Điện Tử,
Tử,Truyền
Truyền Thông
Thông và
vàCông
CôngNghệ
NghệThông TinTin
Thông (ECIT 2015)
(ECIT 2015)
ứng sẽ được thực hiện, chẳng hạn vector vị trí xi trong ví dụ 1 phép trừ. Cách làm mang tính ngẫu nhiên như vậy đã phá hỏng
có các thành phần là xi[1] =1, xi[2] =2, xi[1] =1, xi[4] =3, xi[5] quá trình từng bước tiếp cận tới vị trí cực trị của phương pháp
=2. Hậu quả là hai vế của phép gán (2) khác kiểu nhau, vế trái PSO. Bài báo này đề xuất một "phép trừ vector" áp dụng
xik+1[t] thuộc kiểu số nguyên còn vế phải xik[t] + vik[t] thuộc riêng cho công thức (1) như sau. Giả sử:
kiểu số thực. pbesti = [xi1, xi2,…xiM] với xik S (k) và xj = [xj1, xj2,…xjM]
Để giải quyết mâu thuẫn này, một số nghiên cứu trước với xjk S (k)
đây như [9] [11] đã làm tròn giá trị số thực ở vế phải rồi gán Khi đó kết quả phép trừ pbesti - xj được tính như sau: pbesti -
cho biến vị trí xik+1[t] ở vế trái. Kết quả là nếu giá trị của vế xj =[y1, y2,….yM] với các thành phần yk là các số thực được tính
phải là 3.2 thì phân phối tác vụ tới thực thi tại máy chủ có số như sau
thứ tự là 3, còn nếu vế phải là 3.8 thì tác vụ sẽ được phân cho
∑ ( ) ∑ ( )
máy chủ có số thứ tự là 4. Cách làm có vẻ tự nhiên này thực { ( ) } { ( ) }
chất là gán một vị trí được tính toán cẩn thận theo chiến lược
PSO cho máy chủ mà số thứ tự của nó tình cờ đúng bằng giá ( )
trị nguyên sau khi làm tròn. Cách làm như vậy đã phá hỏng Theo cách tính này, các máy chủ được xếp thứ tự theo tốc độ
quá trình tiến hóa từng bước của phương pháp PSO. tính toán và băng thông của những đường truyền kết nối tới
Để giải quyết vấn đề trên, bài báo này đề xuất cách giải nó. Ví dụ 3 sau đây sẽ minh họa cụ thể hơn.
quyết như sau: giá trị thực của vế phải (xik[t] + vik[t]) sẽ được Ví dụ 3:
để nguyên không làm tròn, còn vế trái xik+1[t] sẽ được gán bởi
định danh của máy chủ có tốc độ tính toán gần với giá trị của Ta tiếp tục sử dụng tập máy chủ trong ví dụ 2.
vế phải nhất so với các máy chủ còn lại. Làm như vậy tác vụ Giả sử gbest = [2,1,2,1,1] ; xj = [3,2,1,2,1] ;
sẽ được gán cho máy chủ có năng lực phù hợp với giá trị được Vậy gbest – xj = [y1, y2, y3,y4,y5] với y1 được tính như sau
tính toán theo PSO. ( ) ( ) ( ) ( )
xik+1[t]←j if │P(Sj) - (xik[t] + vik[t])│≤│P(Sr) - (xik[t] + vik[t])│ { ( ) } { ( ) }
SrS ; t =1,2 .. M (5)
Cách tính tương tự được áp dụng cho các thành phần y2, y3 …
Ví dụ 2: giả thiết tập máy chủ S trong ví dụ 1 có tốc độ tính y5 còn lại.
toán được liệt kê trong bảng 1 sau đây
Bảng 1: Tốc độ tính toán của các máy chủ 4.3. Biện pháp thoát khỏi cực trị địa phương
Phương pháp PSO nói riêng và các phương pháp tìm
Máy chủ Si Tốc độ xử lý P(Si) (MI/s)
kiếm tiến hóa nói chung đôi khi bị mắc kẹt tại các lời giải cực
S1 3.1 trị địa phương mà không thể thoát ra để đi tới lời giải tốt hơn.
S2 5.2 Bài báo này đề xuất sử dụng phương pháp PSO kết hợp với
S3 4.1 thủ tục tìm kiếm lân cận để định hướng cá thể tốt nhất chuyển
sang vùng tìm kiếm mới mỗi khi chương trình bị sa vào vùng
Giả sử ở bước thứ k+1 tổng xik + vik = [4.4 ; 2.1 ; 6.7 ; 5.6 ; cực trị địa phương.
10.2] thì vector vị trí xik+1 sẽ được gán bằng [3; 1; 2; 2; 2]
nghĩa là cá thể đó tương ứng với phương án xếp lịch sau đây: Tìm kiếm lân cận là phương pháp tìm kiếm bắt đầu từ
một giải pháp ban đầu s0 của bài toán và sử dụng các toán tử
T1 T2 T3 T4 T5 để di chuyển sang một giải pháp khác của bài toán theo một
S3 S1 S2 S2 S2 cấu trúc lân cận xác định nhằm tìm ra một lời giải tốt hơn. Bài
báo này đề xuất 2 toán tử Exchange và RotateRight sử dụng
cho quá trình tìm kiếm lân cận (xem hình 3.a và 3.b)
Thật vậy, thành phần thứ nhất của vector vị trí, xik+1[1] , sẽ
nhận giá trị 3, nghĩa là tác vụ T1 sẽ được gán cho máy chủ S3 3 1 2 3 1
3 1 2 3 1
bởi vì :
[ ] | ( ) | | ( ) ( )|
a. Toán tử RotateRight
Nghĩa là trong 3 máy chủ thì máy S3 có tốc độ tính toán gần 3 3 2 1 1
với giá trị 4.4 nhất so với 2 máy chủ còn lại, theo bảng 1, do
đó tác vụ T1 được gán cho máy chủ S3 để thực hiện, tức là f(T1) Hình. 3. Các toán tử tìm kiếm lân cận b. Toán tử Exchange
= S3. Phép gán tương tự cũng được thực hiện với bốn tác vụ
còn lại : T2, T3,T4,T5.
Function LocalSearch (vector vị trí xi )
Vấn đề tương tự cũng xảy ra với phép trừ hai vector vị trí Input: vector vị trí xi
trong công thức (1): (pbesti - xik ) và (gbest - xik). Một số công Output: vector vị trí xk có f(xk) < f(xi)
trình hiện có như [9] [11] chỉ đơn giản thực hiện phép trừ các
1. Khởi tạo bước lặp t  0
thành phần số nguyên rồi gán cho máy chủ có số thứ tự tương
ứng. Ví dụ nếu pbesti = [2,4,3,3,5] và xik = [1,3,2,1,2] thì 2. while (điều kiện lặp)
pbesti - xik =[2-1,4-3,3-2,3-1,5-2] = [1,1,1,2,3]. Như đã giải 3. r1, r2, r3  Random(1, M)
thích ở trên, cách làm này thực chất là gán các tác vụ cho 4. xi  RotateRight(xi, r1)
những máy chủ mà số thứ tự của nó tình cờ đúng bằng kết quả
196
196
HộiHội
Thảo Quốc
Thảo Gia
Quốc 2015
ĐiệnTử,
Tử,Truyền
NghệThông
ThôngTinTin (ECIT
(ECIT 2015)
2015)
5. xk  Exchange (xi, r2, r3) lượt được khảo sát cho tới khi toàn bộ không gian lời giải
6. if f(xk) < f(xi) then return xk được duyệt hết, thuật toán trở thành duyệt vét cạn. Để tránh
7. else return xi tình huống này, chúng tôi cũng sử dụng giải pháp chung
thường được áp dụng trong các giải thuật tiến hóa, đó là đặt
8. t  t+1
một giá trị ngưỡng tối đa, khi quá trình tiến hóa của quần thể
9. End while đạt tới số thế hệ vượt quá giá trị ngưỡng đã đinh thì quá trình
End Function tìm kiếm kết thúc. Trong phần thực nghiệm tiếp theo giá trị
ngưỡng cho số thế hệ là 3000, giá trị K được đặt là 100 và độ
4.4. Thuật toán đề xuất LPSO lệch  được ấn định là 0.21.
Tổng hợp những cải tiến nói trên, thuật toán đề xuất với tên
gọi LPSO được mô tả như sau. V. THỰC NGHIỆM
Algorithm LPSO
5.1. Phân nhóm dữ liệu thực nghiệm
Input: tập T, tập S, mảng W[1×M], mảng P[1×N], mảng B[N×N],
mảng D[M×M], hằng số K, độ lệch , số cá thể SCT Dữ liệu sử dụng trong các thực nghiệm bao gồm :
Output: lời giải tốt nhất gbest  Dữ liệu về tốc độ tính toán của các máy chủ và băng
1. Khởi tạo xi, vi một cách ngẫu nhiên thông giữa các máy chủ được lấy từ các công ty cung
2. Khởi tạo bước lặp t 0 ; cấp dịch vụ cloud trong nước [13][14] và quốc tế
3. while (điều kiện lặp) do [15][16]
4. for i=1 to SCT do
 Dữ liệu luồng công việc được lấy từ các bộ dữ liệu
5. Tính vector xi theo công thức (5)
6. end for
thử nghiệm được xây dựng theo độ trù mật khác nhau
7. for i=1 to SCT do và các luồng công việc từ các ứng dụng thực tế như
8. Cập nhật pbesti ứng dụng Montage [17]. Thông tin chi tiết về luồng
9. end for công việc Montage được trình bày qua hình 4 và bảng
10. Cập nhật gbest dữ liệu 2
14. for i=1 to SCT do
15. Cập nhật vik theo công thức (1) 1 1 1 1
16. Tính xi theo (2)
17. end for
18. t++ ;
19. if (sau K thế hệ mà độ lệch giữa các 2 2 2 2 2 2
gbest không vượt quá ) then
20. gbest  LocalSearch(gbest);
21 end if 3
Data Aggregation
22. end while
23. return gbest
4 Data Partitioning
Thuật toán hoạt động theo phương pháp PSO theo đó tại
mỗi bước các cá thể cập nhật vị trí của mình hướng tới vị trí
tốt nhất của cả quần thể (gbest) đồng thời có dựa trên kinh 5 5 5 5
nghiệm các cá thể lân cận (lbesti). Nếu sau K thế hệ liên tiếp
mà cả quần thể không cải thiện được một cách đáng kể giá trị
gbest (mức chênh không vượt quá ) thì chứng tỏ quần thể 6
Data Aggregation
đang hội tụ tại một cực trị địa phương. Khi đó thủ tục
LocalSearch được gọi tìm ra cá thể gbest mới và cá thể này sẽ
di cư cả quần thể tới một vùng không gian mới, tại đó quá 7 Pipeline
trình tìm kiếm được tái khởi động.
Điều kiện lặp ở đây là mức chênh của giá trị gbest so
với K vòng lặp trước đó lớn hơn độ lệch  ( ấn định từ trước), 1 mProjectPP
8 3 mConcatFit
nghĩa là thuật toán LPSO sẽ dừng nếu như sau K lần di cư
(thông qua thủ tục LocalSearch) mà giá trị gbest tìm được vẫn
không cải thiện được một cách đáng kể (mức chênh không 2 mDiffFit 9 4 mBgModel
vượt quá ).
Trong trường hợp thuật toán hội tụ nhanh nhất, nghĩa là 5 mBackground 6 mImgTbl
sau K lần thực hiện LocalSearch thì chương trình hội tụ tới
cực trị, điều kiện dừng lặp được thỏa mãn nên chương trình
kết thúc sau K2 thế hệ. Ngược lại, trong trường hợp tồi nhất, 7 mAdd 8 mShrink 9 mJPEG
chương trình luôn tìm được lời giải tốt hơn sau mỗi lần di cư
(thông qua thủ tục LocalSearch) thì các vùng tìm kiếm sẽ lần
Hình. 4. Luồng công việc Montage với 20 tác vụ
197
197
HộiHội
ThảoThảo Quốc
Quốc Gia
2015 ĐiệnTử,
Tử,Truyền
TruyềnThông
Thông và
và Công
CôngNghệ
NghệThông
ThôngTinTin
(ECIT 2015)
(ECIT 2015)
Bảng 2: Thông tin dữ liệu vào/ra của các tác vụ trong ứng dụng Montage i5 2.2 GHz, RAM 4GB, hệ điều hành Windows 7 Ultimate.
Thực nghiệm được lặp lại 300 lần trên mỗi nhóm thực nghiệm.
Name and number Execution Input data
Output
of Tasks time (s) (MB) Data 5.4. Kết quả thực nghiệm
(MB) Hình 5,6,7,8 cho thấy sự chênh lệch về thời gian xử lý
mProject (45) 13.59 4.03 7.94 (makespan) của lời giải tốt nhất mà thuật toán đề xuất LPSO
mDiffFit (107) 10.59 15.88 0.54 và các thuật toán đối chứng (PSO, Random và Round Robin)
mConcatFit (1) 13.60 0.03 0.02 tìm được khi chạy trên 4 nhóm dữ liệu thực nghiệm khác
mBgModel (1) 10.88 0.03 0.00 nhau.
mBackground (45) 10.74 7.95 7.94 Bảng 3: Kết quả thực nghiệm
mImgtbl (1) 10.69 357.27 0.01
mAdd (1) 30.34 357.28 330.86 M N  LPSO PSO Random Round Robin
5 3 0.2 7.8 9.0 30.75 28.6
mShrink (1) 12.26 165.43 6.62
5 3 0.4 4.6 6.6 21.45 19.9
mJPEG (1) 10.96 6.62 0.32 5 3 0.6 7.1 7.6 14.1 12.6
Những dữ liệu đó được tổng hợp lại và chia thành bốn nhóm 10 3 0.3 13.4 15.9 41.5 40.7
dựa theo số lượng máy chủ N và số lượng tác vụ M bao gồm: 10 3 0.4 14.5 18.1 50.8 41.7
 Nhóm 1: M=5, N=3 10 3 0.7 14.8 18.3 49.7 38.6
 Nhóm 2: M=10, N=3 20 8 0.2 9.2 12.1 58.4 52.7
 Nhóm 3: M=20, N=8 20 8 0.3 8.2 12.4 55.5 49.1
20 8 0.5 11.5 14.3 57.4 51.2
 Nhóm 4: M=25, N=8 (luồng công việc Montage)
25 8 0.2 2.8 3.8 15.1 13.5
Mỗi nhóm lại bao gồm ba thực nghiệm khác nhau về tỷ lệ số
cạnh trên số đỉnh của đồ thị luồng công việc, ký hiệu là  40
Makespan (s)
| | 30
( ) α = 0.2
20
Tham số  cho biết đồ thị G phân thành bao nhiêu cấp, mỗi α = 0.4
10
cấp có nhiều hay ít tác vụ, nói cách khác  phản ánh độ trù
α = 0.6
mật của đồ thị G. Khi làm thực nghiệm với mỗi nhóm, số máy 0
chủ và số tác vụ được giữ cố định còn tỷ lệ  lần lượt thay đổi LPSO PSO Random Round
như trong các hình 5,6,7. Robin
5.2. Tham số cấu hình hệ thống
Hình. 5. Lời giải tìm được bởi các thuật toán trong trường hợp M=5, N=3
Các tham số cấu hình của đám mây được thiết lập trong miền
giá trị như sau: 60
 Tốc độ tính toán P của các máy chủ: từ 1 đến 250 (million 50
Makespan (s)
instructions/s) 40
 Khối lượng dữ liệu D giữa các tác vụ: từ 1 đến 10000 α= 0.3
30
(Mega bit)
20 α = 0.4
 Băng thông giữa các máy chủ B: từ 10 đến 100 (Mega
bit/s) 10
α = 0.7
 Hệ số quán tính:  = 0.729 0
 Hệ số gia tốc: c1 = c2 = 1.49445 LPSO PSO Random Round
 Hằng số : K = 30 Robin
 Số cá thể SCT: SCT=25
 Độ lệch  : 0.21 Hình. 6. Lời giải tìm được bởi các thuật toán trong trường hợp M=10, N=3
 : từ 0.2 tới 0.7
80
5.3. Quá trình tiến hành thực nghiệm
Makespan (s)
60
Để kiểm chứng thuật toán đề xuất LPSO chúng tôi đã
sử dụng công cụ mô phỏng Cloudsim [1] để tạo lập môi α = 0.2
40
trường đám mây kết hợp với dữ liệu luồng công việc của ứng α = 0.3
dụng Montage [17]. Các hàm của gói thư viện Jswarm [1] 20
được sử dụng để thực hiện các phương thức Tối ưu bày đàn. 0 α = 0.5
Đối tượng so sánh là thuật toán PSO [9], thuật toán Random
LPSO PSO Random Round
[12] và thuật toán Round Robin [13].
Robin
Các chương trình mô phỏng được viết bằng ngôn ngữ
Java và chạy trên máy tính cá nhân với bộ vi xử lý Intel Core Hình. 7. Lời giải tìm được bởi các thuật toán trong trường hợp M=20, N=8
198
198
HộiHội
Thảo Quốc
Thảo Gia
Quốc 2015
ĐiệnTử,
Tử,Truyền
NghệThông
ThôngTinTin (ECIT
(ECIT 2015)
2015)
16 TÀI LIỆU THAM KHẢO

14
[1]. Công cụ mô phỏng CloudSim http://www.cloudbus.org/cloudsim/
12 [2]. J.D. Ullman, “NP-complete scheduling problems”, Journal of
10 Computer and System Sciences, Volume 10, Issue 3, 1975
8 [3]. S. Parsa, R. E. Maleki “RASA: A New Task Scheduling Algorithm in
Grid Environment”, International Journal of Digital Content
6 α = 0.15
Technology and its Applications, Vol. 3, No. 4, 2009
4 [4]. J.M. Cope, N. Trebon, H.M. Tufo, P. Beckman, “Robust data
2 placement in urgent computing environments”, IEEE International
0 Symposium on Parallel & Distributed Processing, IPDPS 2009
[5]. A. Agarwal, S. Jain, “Efficient Optimal Algorithm of Task
LPSO PSO Random Round Scheduling in Cloud Computing Environment”, International Journal
Robin of Computer Trends and Technology (IJCTT), vol. 9, 2014
[6]. M.Wieczorek, “Marek Scheduling of Scientific Workflows in the
Hình. 8. Lời giải tìm được bởi các thuật toán trong trường hợp M=25, N=8 ASKALON Grid Environment”, ACM SIGMOD Record Journal,
Vol. 34, Issue 3, 2005.
Các thông số ở bảng 3 cho thấy thuật toán được kiểm [7]. A. Salman, “Particle swarm optimization for task assignment
chứng trên nhiều bộ dữ liệu khác nhau về qui mô của luồng Problem”, Microprocessors and Microsystems, 2002.
công việc (số tác vụ M và số máy chủ N) và độ trù mật  của [8]. S. Pandey, A. Barker, K. K. Gupta, R. Buyya, “Minimizing
đồ thị luồng công việc. Kết quả thực nghiệm cho thấy trong Execution costs when using globally distributed cloud services”, 24th
hầu hết các trường hợp thuật toán đề xuất LPSO đều cho lời IEEE International Conference on Advanced Information
giải tốt hơn các thuật toán PSO, Random và Round Robin. Networking and Applications, 2010.
Riêng với nhóm thực nghiệm thứ nhất (số tác vụ bằng 5 và số [9]. J. Kennedy, RC. Eberhart, “Particle swarm optimization”, in Proc.
máy chủ bằng 3) thì thuật toán LPSO cho lời giải gần xấp xỉ IEEE Int’l. Conference on Neural Networks, vol. IV, 1995.
với lời giải tốt tuyệt đối tìm được bằng phương pháp duyệt vét [10]. T. Davidovic, M. Selmic, D. Teodorovic, D. Ramljak “Bee colony
cạn: 7.8 giây so với 7.7 giây. optimization for scheduling independent tasks to identical
processors”, Journal of Heuristics, 2012.
VI. KẾT LUẬN VÀ HƯỚNG PHÁT TRIỂN [11]. M. Mitzenmacher, E. Upfal, “Probability and Computing:
Randomized Algorithms and Probabilistic Analysis”, Cambridge
Bài báo này đã trình bày một giải thuật tìm kiếm theo
University Press, 2005.
phương pháp Tối ưu bày đàn để tìm lời giải gần đúng cho bài
[12]. Don Fallis, “The Reliability of Randomized Algorithms”, British
toán lập lịch thực thi luồng công việc trong môi trường điện Journal for the Philosophy of Science, 2000.
toán đám mây. Những kết quả chính gồm có: [13]. https://www.ngoisaoso.net/Cloud-Server.html
- Đề xuất một phương thức mới để cập nhật vị trí của cá thể [14]. http://vdo.vn/may-chu-vps-vdc
bằng cách ánh xạ một giá trị thực tới máy chủ có tốc độ [15]. http://www.rackspace.com/cloud/servers
tính toán và băng thông gần với giá trị đó nhất. [16]. http://aws.amazon.com/ec2/pricing/
[17]. http://montage.ipac.caltech.edu
- Đề xuất công thức tính vector dịch chuyển của cá thể thứ i
theo giá trị gbest và lbesti ABSTRACT - The key factor which rules the cloud’s
- Đề xuất thủ tục LocalSearch để chương trình thoát ra khỏi performance is the workflow scheduling, one of the well-
known problems have proven to be NP-complete. Many
cực trị địa phương bằng cách chuyển các cá thể tới một algorithm in the literature have been targeting the workflow
miền không gian tìm kiếm mới. scheduling problem, however, handful efficient solutions
- Đề xuất thuật toán LPSO sử dụng phương thức cập nhật have been proposed. This paper proposes a metaheuristic
vị trí cá thể và thủ tục LocalSearch để tìm kiếm lời giải algorithm called LPSO which based on the Particle Swarm
Optimization method. Our experiments which arranged by
cho bài toán lập lịch thực thi luồng công việc trong môi using the simulation tool CloudSim show that LPSO is
trường đám mây. superior to the general algorithms called Random and
Những kết quả thực nghiệm được tiến hành với nhiều bộ RoundRobin, moreover the deviation between the solution
found by LPSO and the optimal solution is negligible.
dữ liệu thực nghiệm khác nhau đã chứng tỏ chất lượng lời giải
tìm được bởi thuật toán đề xuất tốt hơn so với các thuật toán Key words: workflow scheduling, particle swarm optimization,
đối chứng là thuật toán PSO gốc, thuật toán Random và thuật cloud computing
toán Round Robin. Về hướng công việc tiếp theo, ngoài hai
yếu tố hiện nay là kinh nghiệm cá nhân (pbest) và kinh nghiệm
từ cả quần thể (gbest) chúng tôi dự định đưa thêm vào yếu tố
kinh nghiệm của các cá thể trong một lân cận xác định theo
lược đồ Von Neuman hoặc Star để cập nhật vị trí mới cho mỗi
cá thể nhằm đạt được lời giải có chất lượng tốt hơn.
199
199
HộiHội
ThảoThảo Quốc
Quốc Gia
2015 ĐiệnTử,
Tử,Truyền
TruyềnThông
Thông và
và Công
CôngNghệ
NghệThông
ThôngTinTin
(ECIT 2015)
(ECIT 2015)
Hệ Thống Nhúng Nhận Dạng Tiếng Nói Tiếng Việt

Sử Dụng Mel-Frequency Cepstral Coefficients Và
Dynamic Time Warping
Lê Đức Lộc, Trần Văn Hoàng và Hoàng Trang
Khoa Điện – Điện Tử
Trường Đại Học Bách Khoa – ĐHQG TP. Hồ Chí Minh
Email: ducloc0506@gmail.com, tvhoang@hcmut.edu.vn, hoangtrang@hcmut.edu.vn
Abstract — Trong bài báo này, mô hình nhận dạng mẫu từ đơn dạng của hệ thống khi thực nghiệm đối với bộ từ vựng 4 từ là
tiếng Việt được trình bày. Tiếng nói được trích đặc trưng bằng giải 90.1% [9], và 90.5% đối với bộ từ vựng gồm 10 từ [10].
thuật MFCC (Mel-Frequency Cepstral Coefficients). Giải thuật
thời gian động DTW (Dynamic Time Warping) được sử dụng để so Trong bài báo của chúng tôi, hệ thống nhận dạng tiếng nói
sánh tiếng nói đầu vào với các mẫu thu sẵn, từ đó sẽ chọn ra được sử dụng phương pháp nhận dạng DTW được áp dụng với ngôn
kết quả nhận dạng phù hợp nhất với tiếng nói phát ra. Hệ thống ngữ tiếng Việt với ưu điểm là tốc độ nhận dạng nhanh, đơn
nhận dạng được thực hiện và chạy trên board nhúng BeagleBone giản, không yêu cầu bộ nhớ lớn với độ chính xác cao (cao hơn
Black do Texas Instruments sản xuất. Kết quả nhận dạng cao phù so với hệ thống thực hiện bằng ngôn ngữ tiếng anh [9-10]) phù
hợp với lý thuyết. hợp trong các hệ thống điều khiển yêu cầu tốc độ đáp ứng
Keywords — Nhận dạng từ đơn tiếng Việt, MFCC, DTW.
nhanh và tài nguyên phần cứng hạn chế. Đặc biệt, việc huấn
luyện mẫu cho một từ chỉ yêu cầu một lần đọc, làm cho tính
linh động của hệ thống rất cao. Đồng thời, trong bài báo này,
I. GIỚI THIỆU chúng tôi cũng tiến hành thực nghiệm với một người khác
Nhận dạng tiếng nói là một kỹ thuật có nhiều ứng dụng (không phải người huấn luyện) cho kết quả khả quan, chứng tỏ
trong cuộc sống, trong việc điều khiển bởi ưu điểm lớn nhất sự linh hoạt và tiện dụng của hệ thống khi áp dụng với ngôn
của nó là tốc độ cao, tương tác cao và trực quan với con ngữ tiếng Việt mà không cần phải huấn luyện với tất cả người
người. Ở Việt Nam, nhận dạng tiếng nói đã được nghiên cứu dùng như trong bài báo [11].
trong những năm gần đây và đạt được nhiều thành quả [1-2].
Phần còn lại của bài báo được tổ chức như sau: trong phần
Bài báo trình bày một mô hình nhận dạng mẫu tiếng Việt đọc
II, chúng tôi trình bày tổng quan về hệ thống nhận dạng tiếng
rời rạc với độ chính xác cao: sử dụng phương pháp trích đặc
nói. Quá trình các bước thực hiện hệ thống nhận dạng sẽ được
trưng hiện đại MFCC kết hợp với phương pháp so sánh mẫu
mô tả trong phần III. Phần IV sẽ cung cấp kết quả đánh giá
DTW đơn giản, không yêu cầu bộ nhớ cao và cho tốc độ nhận
thực nghiệm và phân tích các kết quả đạt được. Cuối cùng, các
dạng nhanh.
kết luận bài báo sẽ được trình bày trong phần V.
Hệ thống nhận dạng tiếng nói đã được thực hiện trong
những năm gần đây. Trong bài báo [3], phương pháp trích đăc II. TỔNG QUAN HỆ THỐNG NHẬN DẠNG TIẾNG NÓI
trưng được sử dụng là phương pháp LPC (Linear Predictive
Coding). Do đó, độ chính xác nhận dạng của hệ thống không A. Mô hình nhận dạng tiếng nói
cao bằng việc sử dụng phương pháp MFCC. Trong các bài báo Sau khi tiếng nói được thu từ một microphone, quá trình
[3-6], hệ thống nhận dạng được thực hiện dựa trên mô hình phát hiện điểm bắt đầu và kết thúc của từ diễn ra trước khi
Markov ẩn (Hidden Markov Model – HMM). Ưu điểm của tiếng nói được xử lý.
các hệ thống nhận dạng sử dụng HMM là cho độ chính xác
nhận dạng cao, tuy nhiên, đi kèm với nó là sự phức tạp, khó Giải thuật nhận dạng tiếng nói bao gồm 2 phần chính.
khăn trong thực hiện hệ thống và tốc độ thực thi hệ thống Phần 1 là huấn luyện mẫu, phần 2 là quá trình chính nhận
chậm hơn so với phương pháp DTW. Trong các bài báo [9- dạng tiếng nói. Sơ đồ khối của mô hình nhận dạng tiếng nói
11], hệ thống nhận dạng thực hiện dựa trên mô hình DTW và được mô tả trong Hình 1.
được thực nghiệm trên ngôn ngữ tiếng Anh, độ chính xác nhận
.
Nghiên cứu này được tài trợ bởi Bộ Khoa Học và Công Nghệ qua đề tài
có mã số KC.01.23/11-15
ISBN: 978-604-67-0635-9 200
200
Hình 3. Mô hình trích đặc trưng bằng MFCC

Hình 1. Mô hình nhận dạng tiếng nói
1) Tiền nhấn tín hiệu
B. Phát hiện điểm bắt đầu và kết thúc
Tiếng nói sau khi được số hóa sẽ được tiền nhấn (pre-
Phát hiện điểm bắt đầu và kết thúc của tiếng nói (tách tiếng emphasized) với bộ lọc đáp ứng xung hữu hạn (finite impulse
nói ra khỏi khoảng lặng) thường dựa trên hàm năng lượng thời response – FIR) bậc một vì pha của nó tuyến tính và thực thi
gian ngắn [7]. Trong xử lý tiếng nói việc xác định khi nào bắt đơn giản. Việc sử dụng các bộ lọc pha tuyến tính rất quan
đầu xuất hiện tín hiệu tiếng nói và khi nào kết thúc quá trình trọng, vì pha của của tín hiệu sẽ không bị thay đổi, chỉ có
nói rất cần thiết và quan trọng. Nó tăng độ chính xác và làm cường độ của tín hiệu bị thay đổi, do đó những đặc điểm theo
cho hệ thống tập trung vào việc phân tích và so sánh chính xác thời gian của tín hiệu sẽ được bảo tồn. Do trong tiếng nói, các
mẫu tiếng nói, đồng thời nó cũng hạn chế đi nhiễu của môi thành tố thấp hơn thường chứa đựng nhiều năng lượng hơn, vì
trường và các khoảng lặng làm ảnh hưởng đến hệ thống [7-8]. vậy nó được xem xét hơn khi mô hình hóa so với các thành tố
Mô hình phát hiện điểm bắt đầu và kết thúc tín hiệu tiếng nói cao hơn. Do đó, một bộ lọc pre-emphasis được dùng để
được mô tả trong Hình 2. khuếch đại tín hiệu ở các tần số cao hơn. Hàm truyền H(z) của
bộ lọc được cho bởi:
H ( z )  1  a * z 1 (2)
Để tạo được bộ lọc thông thấp a > 0. Thông thường, a

được chọn trong khoảng 0.9 đến 1.
Hình 2. Mô hình phát hiện điểm bắt đầu và kết thúc
2) Tách các khung
Hàm năng lượng thời gian ngắn của tín hiệu tiếng nói được Bởi vì tín hiệu tiếng nói là tín hiệu biến đổi chậm theo thời
tính bằng cách chia tín hiệu tiếng nói thành các khung, mỗi gian, trong một hệ thống nhận dạng tiếng nói thì tiếng nói sau
khung dài N mẫu. Nếu hàm cửa sổ bắt đầu xét ở mẫu thứ m thì khi được lấy mẫu sẽ được nhóm thành những khoảng thời gian
hàm năng lượng thời gian ngắn Em được xác định như sau: ngắn trong khoảng từ 20 đến 40 ms được gọi là các khung. Để
m  N 1 cho các thông số của khung ít thay đổi, thông thường sẽ có sự
Em   [ x(n)]
nm
2 (1) chồng lấp giữa các khung kế cận nhau.
3) Bộ lọc cửa sổ
C. Thuật toán trích đặc trưng MFCC
Một cửa sổ thường được ứng dụng để gia tăng tính liên tục
Thuật toán MFCC là thuật toán trích đặc trưng tiếng nói giữa các khung kế cận nhau. Những cửa sổ thường gặp như:
hiện đại, đang được sử dụng rộng rãi bởi tính hiệu quả của nó cửa sổ hình chữ nhật, cửa sổ Hamming, cửa sổ Hanning, cửa
thông qua phân tích các hệ số cepstral theo thang đo Mel [7]. sổ Kaiser, … Cả hai cửa sổ Hanning và Hamming đều có sự
suy giảm cao hơn rất nhiều so với cửa sổ hình chữ nhật. Ở cửa
Giải thuật MFCC được xây dựng trên mô hình mô phỏng
sổ Hanning, đỉnh thứ 2 suy giảm 31dB so với đỉnh chính, và
lại quá trình cảm nhận âm thanh của tai người, dựa trên những
giảm 44dB ở cửa sổ Hamming. Mặt khác, ở cửa sổ Hanning,
nghiên cứu về sự cảm nhận âm thanh ở những dải tần số khác
các đỉnh phụ suy giảm khá nhanh, nhưng ở cửa sổ Hamming
nhau. Với các tần số thấp (dưới 1000Hz), độ cảm nhận của tai
thì không, các đỉnh phụ gần như không đổi ở mọi tần số [7].
người là tuyến tính. Đối với các tần số cao hơn, độ cảm nhận
Do đó chúng ta thường sử dụng cửa sổ Hamming trong các
biến thiên theo hàm logarit. Do đó, để thu được những đặc
ứng dụng nhận diện giọng nói. Các hệ số h(n) của cửa số
trưng của tiếng nói, ta sử dụng các bộ lọc tuyến tính với dải
Hamming được tính như sau:
tần thấp và các bộ lọc có đặc tính logarit với dải tần số cao.
Mô hình tính toán các hệ số MFCC được mô tả như Hình 3.   2 n 
0.54  0.46 * cos   (3)
h  n    N 
 0

201
201
4) Fast Fourier Transform (FFT) 6) Cepstrum

Biến đổi Fourier nhanh (FFT) được dùng để chuyển tín Tín hiệu tiếng nói có thể được mô tả như là kết quả của
hiệu tiếng nói từ miền thời gian qua miền tần số. Đó chính là phép tích chập giữa tín hiệu kích thích của thanh quản với đáp
sự thực thi phép biến đổi Fourier rời rạc (DFT) đạt hiệu suất ứng xung của bó thanh âm. Đáp ứng của bó thanh âm quyết
cao với điều kiện ràng buộc là phổ được đánh giá tại những định đường bao của phổ, trong khi đó phổ của tín hiệu kích
tần số rời rạc. Thuật toán FFT chỉ yêu cầu khối lượng tính thích biểu diễn các thành phần phổ của tiếng nói. Đối với nhận
toán tỷ lệ với NlogN, trong khi đó DFT yêu cầu khối lượng dạng tiếng nói, đường bao của phổ hữu ích hơn các thành phần
tính toán tỷ lệ với N2. Do đó, khi chiều dài mẫu N càng lớn, ưu phổ [7].
thế của FFT so với DFT càng thể hiện rõ.
Cepstrum được định nghĩa là phép biến đổi cosin rời rạc
Độ phân giải tần số của FFT bị giới hạn bởi 2 yếu tố: chiều (DCT), được dùng để chuyển các hệ số Mel sau khi lấy
dài của tín hiệu và chiều dài của FFT. Nếu tín hiệu được tạo ra logarithm trở về miền thời gian. Kết quả của phép biến đổi này
bởi việc cộng hai tín hiệu sin mà tần số của hai tín hiệu này rất cho ta các hệ số đường bao phổ tín hiệu tiếng nói.
gần với nhau, khi đó để phân biệt hai tần số này chúng ta phải
K  p   (6)
quan sát tín hiệu với phân đoạn đủ dài. Đối với chiều dài của Cnp   log Snk'  cos   k  0.5  
FFT, phổ tần số được tạo ra bởi N điểm FFT bao gồm N/2  k 1  k  
điểm cách đều nhau phân bố giữa 0 đến phân nửa tần số lấy
mẫu. Vì vậy để tách rời hai tần số có khoảng cách gần nhau thì Trong (6), Cnp là các hệ số cepstrum bậc p của khung n và
khoảng cách giữa các điểm phải nhỏ hơn khoảng cách giữa hai S’nk là giá trị tần số Mel thứ k của khung n. Các hệ số
đỉnh. cepstrum bậc thấp tượng trưng cho đường bao của bó âm
thanh, và các hệ số bậc cao tượng trưng cho các thành phần
5) Bộ lọc Mel kích thích. Do đó, trong các ứng dụng nhận dạng tiếng nói, chỉ
Bộ lọc Mel mô hình hóa lại đáp ứng tần số của ốc tai sử dụng từ 8 đến 16 hệ số cepstrum bậc thấp.
người. Đáp ứng này tuyến tính với những tần số dưới 1kHz và 7) Đạo hàm bậc 1 và bậc 2
tỉ lệ với logarit đối với các tần số cao hơn. Phương trình (4)
được dùng để biến đổi từ thang tần số thường sang thang tần Các hệ số cepstrum Cnp mô tả đường bao của bó âm thanh
số Mel và phương trình (5) biến đổi từ thang tần số Mel về theo từng khung tín hiệu p riêng biệt nhưng không mô tả được
thang tần số thường. tốc độ biến đổi của âm thanh theo thời gian. Trong thực tế, tốc
độ biến thiên của các hệ số theo thời gian chứa một phần
 f  (4) thông tin mà ta muốn truyền đạt [7]. Để đặc trưng cho sự biến
Mel  f  1125log 1 
 
 700  thiên đó, ta sử dụng các hệ số đạo hàm bậc 1 d n và đạo hàm
 m  bậc 2 d (d n ) .
Mel
 1
 m  700  e1125  1 (5)
 
2  cn 2  cn2    cn1  cn1  (7)
dn 
Băng thông bộ lọc thang đo Mel bao gồm các bộ lọc hình 10
tam giác được phân bố bên trong băng thông tín hiệu. Chúng
được cách đều nhau trên thang Mel và băng thông của chúng 2  d n 2  d n2    d n1  d n1 
d (d n )  (8)
được thiết kế sao cho điểm 3dB nằm ở khoảng giữa hai bộ lọc 10
kế cận nhau (Hình 4). Trong nhận dạng tiếng nói, số bộ lọc là
một trong những thông số mà ảnh hưởng đến độ chính xác D. Giải thuật thời gian động DTW
nhận dạng của hệ thống [7]. Giải thuật DTW được xây dựng dựa trên cơ sở của kỹ
thuật lập trình động (Dynamic Programming Techniques).
Giải thuật này thực hiện việc so trùng hai mẫu tín hiệu tiếng
nói có đường bao tín hiệu khác nhau phi tuyến tính theo trục
thời gian do hiện tượng kéo dãn hay co rút [1].
Hình 5. Biến dạng thời gian giữa 2 mẫu tín hiệu
Ở Hình 5, mỗi đường thẳng nối một điểm từ chuỗi tín hiệu
Hình 4. Băng bộ lọc Mel, theo thang tần số Mel (a)
và theo thang tần số thường (b) này đến điểm tương ứng của chuỗi tín hiệu kia, do đó nếu cả 2
202
202
HộiHội
Thảo Quốc
Thảo Gia
Quốc Gia2015
2015về
vềĐiện
Điện Tử,
Tử,Truyền
Nghệ Thông
Thông TinTin (ECIT
(ECIT 2015)
2015)
chuỗi tín hiệu là giống hệt nhau, thì các đường nối sẽ song
song nhau. Sự biến dạng về thời gian, làm cho các tổng
khoảng cách giữa các điểm tương ứng lớn lên và làm cho việc
nhận dạng bị sai lệch.
Giả sử chúng ta có hai chuỗi tín hiệu Q và C với chiều dài

lần lượt là n và m:
Q  q1 , q2 , q3 ,..., qn
C  c1 , c2 , c3 ,..., cm
Hình 6. Giải thuật tính DTW
Để so sánh hai chuỗi tín hiệu, một ma trận n x m được hình
thành với các phần tử là khoảng cách cục bộ d(i,j) giữa hai Phương trình (10) có thể được thực hiện bằng phương
điểm qi và cj. Khoảng cách cục bộ d(i,j) giữa hai điểm được pháp đệ quy. Tuy nhiên, phương pháp này tốn nhiều thời gian
tính bằng đơn vị theo hệ Euclidean theo phương trình (9). thực hiện và gây lãng phí bộ nhớ. Để cải tiến những nhược
Việc sử dụng hệ đơn vị Euclidean có ưu điểm là dễ hiểu, dễ điểm trên, một phương pháp khác sử dụng hai vòng lặp và hai
tính toán, cho thấy rõ sự sai biệt lớn giữa chuỗi tín hiệu, nhưng mảng để lưu trữ các cột của ma trận thời gian – thời gian và
lại có khuyết điểm sẽ làm cho việc tính toán tăng độ phức tạp cột của ma trận trước đó (Hình 6).
so với các hệ đo lường khác, đồng thời cũng làm cho hệ thống
nhạy cảm với nhiễu [1]. III. THỰC HIỆN HỆ THỐNG
Mặc dù tai người có thể nghe được âm thanh với tần số từ
d  i, j
 (qi  c j )2 (9)
20Hz tới 20KHz, nhưng tai người chỉ nhạy với các tần số nhỏ
hơn 5kHz và với chất lượng của âm thanh thoại thì sẽ có băng
Sau đó, ta sẽ tính sai biệt toàn cục của hai chuỗi tín hiệu.
thông giới hạn là 4kHz. Với lí do này, chúng tôi sử dụng băng
Để tính toán được sai biệt toàn cục nhỏ nhất giữa hai tín hiệu,
thông 4KHz trong đề tài này và tần số lấy mẫu ở đây là 8KHz.
ta cần ước lượng tất cả khoảng cách có thể có, nhưng cách này
không hiệu quả khi số lượng khoảng cách có dạng hàm mũ
theo chiều dài của tín hiệu ngõ vào. Thay vào đó, ta xem xét A. Phát hiện điểm bắt đầu và kết thúc
những ràng buộc tồn tại trong quá trình so trùng và dùng Bước 1: Sau khi thu mẫu tín hiệu tiếng nói, ta chia chúng
những ràng buộc này để có được giải thuật hiệu quả hơn [1]. thành các khung nhỏ hơn để tiện cho việc tính toán. Chúng tôi
Các ràng buộc được thiết lập phải không phức tạp và cũng sử dụng 80 mẫu trong mỗi khung và chống lấp 50% giữa các
không hạn chế nhiều, như sau: khung với nhau, tương đương với 5ms cho mỗi khung tín hiệu.
− Các khoảng cách so trùng không thể thực hiện Bước 2: Ta tính năng lượng của một khung tín hiệu theo
việc đi lui. (1).
− Mọi khung của tín hiệu cần so trùng phải được Bước 3: Ta sẽ thu một tín hiệu nền và tính giá trị ngưỡng
dùng trong quá trình so trùng.
so sánh sử dụng phương trình (11).
− Các giá trị sai biệt cục bộ được kết hợp bằng
 E  j
N
phương pháp cộng dồn vào giá trị sai biệt toàn
cục. threshold
 j 0
* 1  µ  (11)
N
Gọi D(i,j), d(i,j) là độ sai biệt toàn cục và sai biệt cục bộ
tại vị trí (i,j). D(i,j) được tính như sau: Giá trị ngưỡng được chọn cao hơn so với giá trị trung bình
của tín hiệu nền. Trong đề tài này, chúng tôi chọn µ = 0.1.
D 
i, j  min  D  i  1, j  1 , D  i  1, j  , D  i, j  1  d i, j  (10)
Bước 4: Sau khi đã có tín hiệu nền, ta bắt đầu thu và phân
Với D(1,1) = d(1,1) là giá trị khởi tạo ban đầu, giải thuật tách tín hiệu. Tất cả những khung có mức năng lượng cao hơn
ứng dụng đệ qui vào việc tính toán các độ sai biệt tại D(i, j). mức ngưỡng chính là tiếng nói, những khung có mức năng
Giá trị cuối D(n,m) chính là giá trị chênh lệch giữa tín hiệu lượng thấp hơn là nhiễu hoặc các khoảng lặng. Việc sử dụng
mẫu và tín hiệu cần so sánh. các hệ số năng lượng làm ngưỡng để xác định điểm bắt đầu có
thể giảm nhiễu ngẫu nhiên trong thời gian ngắn, bởi một từ
tiếng nói thông thường dài hơn 200ms, do đó chúng tôi sử
dụng thêm số lượng khung để làm ngưỡng loại bỏ các nhiễu
trong thời gian ngắn.
203
203
B. Trích đặc trưng bằng thuật toán MFCC C. So sánh mẫu bằng giải thuật DTW
Bước 1: Tiền nhấn tín hiệu theo phương trình (2). Trong Bước 1: Tính toán các phần tử của ma trận DTW cũng là
đề tài này, chúng tôi sử dụng hệ số a = 0.97. các sai biệt cục bộ giữa các điểm của chuỗi cepstrum tín hiệu
tiếng nói và tín hiệu mẫu theo phương trình (9).
Bước 2: Chúng tôi nhóm tín hiệu vào các khung có chiều
dài 25ms với 10ms chống lấn. Với tốc độ mẫu 8kHz, ta sẽ có Bước 2: Tính tại cột 0, bắt đầu từ đáy của mảng. Giá trị sai
200 mẫu trong một khung với 80 mẫu chống lấn giữa các biệt toàn cục của ô đáy mảng 0 bằng chính sai biệt cục bộ của
khung. nó. Sau đó, tính các giá trị toàn cục của các ô khác trong mảng
bằng cách lấy giá trị cục bộ của ô đó cộng với sai biệt toàn cục
Bước 3: Áp dụng cửa sổ Hamming 200 điểm lên tín hiệu
của ô ngay dưới nó. Mảng này đươc gọi là cột trước.
tiếng nói.
Bước 3: Tính sai biệt toàn cục của ô đầu tiên của cột hiện
wf n  l   f n  l  .ham  l  (12) tại. Sai biệt toàn cục của ô này chính là sai biệt cục bộ của nó
cộng với sai biệt toàn cục của ô đầu tiên của cột trước nó.
trong đó fn(l) là khung được pre-emphasis thứ n, ham(l) thay
cho cửa sổ Hamming, và wfn(l) là khung thứ n sau khi qua cửa Bước 4: Tính sai biệt toàn cục cho các ô còn lại.
sổ Hamming.
Bước 5: Cột hiện tài trở thành cột trước và lặp lại từ bước
Bước 4: Khi các frame được cửa sổ hóa với chiều dài là 3 cho đến khi tất cả các cột được tính toán xong. Giá trị cuối
200 điểm, chiều dài FFT được thiết lập là 256 điểm để đạt của cột hiện tại cuối cùng chính là giá trị chênh lệch giữa tín
được độ phân giải tần số tốt với khối lượng tính toán có thể hiệu mẫu và tín hiệu cần so sánh.
chấp nhận được khi thực thi thực tế. Sau khi biến đổi FFT 256
điểm, chỉ có biên độ (căn bậc 2) của 128 điểm đầu tiên được IV. KẾT QUẢ THỰC NGHIỆM VÀ BÌNH LUẬN
dùng cho bước tính toán tiếp theo bởi tính chất đối xứng của
Các thí nghiệm được thực hiện với hệ thống nhận dạng
phép biến đổi FFT.
tiếng nói có bộ từ vựng lần lượt là 4 từ, 6 từ, 8 từ và 10 từ gồm
Bước 5: Chúng ta xác định các hệ số Hn của bộ lọc bằng các từ “một”, “hai”, “ba”, “bốn”, “năm”, “sáu”, “bảy”, “tám”,
phương trình (13) với f[n] được tính từ phương trình (4) và “chín”, “mười”. Mỗi từ được thử nghiệm 100 lần đọc. Các kết
(5). quả thí nghiệm bao gồm tỉ lệ nhận dạng đúng của người đọc
cũng là người huấn luyện và một người khác (nam, không phải
0 , k  f  m  1 người huấn luyện) thực hiện trong cùng một môi trường yên

 2*(k  f [m  1]) tĩnh, có tiếng gió nhẹ từ quạt máy được trình bày ở Hình 7,
, f  m  1  k  f  m 
 ( f [m  1]  f [m  1])*( f [m]  f [m  1])
H m [k ]   Hình 8, Hình 9, Hình 10 và thời gian nhận dạng được trình
2*( f [m  1]  k )
 , f  m  k  f  m  1 bày ở Bảng 1.
 ( f [m  1]  f [m  1])*( f [m  1]  f [m])

0 , k  f  m  1 Hệ thống nhận dạng tiếng nói được chạy trên Kit
(13)
BeagleBone Black dựa trên vi xử lý lõi đơn AM335x 1GHz
Trong đề tài này, chúng tôi sử dụng Mel cho thang tần số ARM Cortex-A8, 512 MB DDR3 RAM. Các kết quả đánh giá
từ 300Hz – 4000Hz để loại bỏ nhiễu tần số thấp dưới 300Hz độ chính xác và tốc độ nhận dạng được thực hiện hoàn toàn
cho thiết bị thu âm gây ra. trên kit này.
Bước 6: Tính các hệ số cepstrum theo phương trình (6),
trong đề tài này chúng tôi sử dụng 13 hệ số cepstrum bậc thấp. Người huấn luyện (Trung bình 96.25%)
Người khác (Trung bình 91.25%)
Bước 7: Tính đạo hàm bậc 1 và bậc 2 theo phương trình 100
(7) và phương trình (8). 95
90
Tín hiệu tiếng nói được trích đặc trưng bằng giải thuật 85
MFCC. Đối với nhận dạng từ đơn, do mỗi từ phát âm dài 80
không quá 500ms sẽ tạo thành tối đa 24 khung tín hiệu, mỗi "một" "hai" "ba" "bốn"
khung tín hiệu có 39 hệ số gồm 13 hệ số cepstrum, 13 hệ số

đạo hàm bậc 1 và 13 hệ số đạo hàm bậc 2. Do đó vec-tơ đặc Hình 7 Độ chính xác nhận dạng đối với hệ thống có bộ từ vựng 4 từ
trưng của mỗi từ có tối đa 936 hệ số, những hệ số này sẽ được
lưu lại làm mẫu hoặc dùng làm ngõ vào tín hiệu so sánh với Hình 7 biểu diễn độ chính xác nhận dạng của hệ thống
nhận dạng tiếng nói có bộ từ vựng gồm 4 từ: “một”, “hai”,
các mẫu đã thu.
“ba”, “bốn”. Có thể nhận thấy rằng, độ chính xác nhận dạng
của hệ thống là rất cao. Đối với người thử nghiệm cũng là
người huấn luyện, hệ thống đạt độ chính xác trung bình là
96.25%, trong khi người thử nghiệm là người khác (không
204
204
HộiHội
ThảoThảo Quốc
Quốc Gia
2015 ĐiệnTử,
Tử,Truyền
TruyềnThông
Thông và
và Công
CôngNghệ
NghệThông
ThôngTinTin
(ECIT 2015)
(ECIT 2015)
huấn luyện mô hình) hệ thống đạt độ chính xác trung bình là huấn luyện) cho tỉ lệ khá cao. Với kết quả này, cộng với việc
91.25%. hệ thống chỉ cần huấn luyện mỗi từ với một lần đọc duy nhất
làm cho tính linh động của hệ thống rất cao, dễ sử dụng và
Người huấn luyện (Trung bình 95.83%) linh hoạt, rất phù hợp với các thiết bị điều khiển cầm tay với
Người khác (Trung bình 91.83%)
các giới hạn về tài nguyên phần cứng.
100
98
Bảng 1 cho thấy thời gian nhận dạng của một từ tăng dần
96 khi bộ từ vựng của hệ thống tăng lên. Điều này là do khi bộ từ
94 vựng tăng, số mẫu cần so sánh, tham chiếu cũng tăng lên, làm
92
cho số lượng tính toán tăng. Tốc độ nhận dạng còn phụ thuộc
90
88 vào cách phát âm của người đọc. Đọc chậm và kéo dài sẽ dẫn
86 đến thời gian nhận dạng lâu hơn.
84
82
"một" "hai" "ba" "bốn" "năm" "sáu" V. KẾT LUẬN
Hình 8 Độ chính xác nhận dạng đối với hệ thống có bộ từ vựng 6 từ

Bài báo này trình bày một mô hình nhận dạng từ đơn đơn
giản, dễ thực hiện bằng phương pháp trích đặc trưng MFCC
và so sánh mẫu DTW. Các kết quả thí nghiệm với bộ thư viện
Người huấn luyện (Trung bình 90.875%) nhỏ từ 10 từ trở xuống đã chứng minh được mô hình đem lại
Người khác (Trung bình 85.375%) kết quả nhận dạng cao với ưu điểm nổi bật là thời gian nhận
100 dạng nhanh. Tuy nhiên, mô hình nhận dạng bị phụ thuộc vào
95 cách phát âm của người nói, nên khi cần mở rộng bộ thư viện,
90 sự tương đồng giữa các từ làm hiệu suất nhận dạng bị giảm
85
xuống. Do đó, đối với các bộ thư viện lớn hơn, cần các kết
hợp với các phương pháp so sánh mẫu khác như Mô hình
80
chuỗi Markov ẩn, phương pháp Mạng Nơtron để tăng hiệu
75
suất nhận dạng.
70
"một" "hai" "ba" "bốn" "năm" "sáu" "bảy" "tám"
Hình 9 Độ chính xác nhận dạng đối với hệ thống có bộ từ vựng 8 từ TÀI LIỆU THAM KHẢO
[1] Nguyễn Thanh Bình, Võ Nguyễn Quốc Bảo, "Xử Lý Âm Thanh Và Hình
Ảnh", Học Viện Công Nghệ Bưu Chính Viễn Thông, 2007.
[2] Lê Tiến Thường, Hoàng Đình Chiến, "Vietnamese Speech Recognition
Applied to Robot Communications", Au Journal of Technology, Volume
7 No. 3 January 2004.
[3] V. Amudha, B.Venkataramani, R. Vinoth kumar, S. Ravishankar:
“Software/Hardware Co-Design of HMM based Isolated Digit
Recognition System.” In: Journal of Computers, VOL. 4, No. 2, pp. 154-
159, (2009).
[4] Haitao Zhou, Xiaojun Han: “Design and Implementation of Speech
Recognition System Based on Field Programmable Gate Array”. In:
Modern Applied Science, Vol. 3, No. 8, pp. 106-111, August 2009.
[5] Wei Han, Cheong-Fat Chan, Chiu-Sing Choy, Kong-Pang Pun: “An
Efficient MFCC Extraction Method in Speech Recognition.” In: the 2006
IEEE International Symposium on Circuits and Systems (ISCAS), pp. 145-
Hình 10Độ chính xác nhận dạng đối với hệ thống có bộ từ vựng 10 từ 148, Greece (2006).
[6] Wei Han: “A Speech Recognition IC with an Efficient MFCC Extraction
Bảng 1. Thời gian nhận dạng của người huấn luyện và người khác Algorithm and Multi-mixture Models”, the Chinese University of Hong
Thời gian nhận Thời gian nhận Kong, Doctor of philosophy thesis, September 2006.
Số lượng mẫu dạng trung bình của dạng trung bình của [7] Xuedong Huang, Alex Acero, Hsiao-Wuen Hon, “Spoken language
processing: A guide to theory, algorithm, and system development”,
người huấn luyện người khác Prentice Hall PTR Upper Saddle River, NJ, USA ©2001.
4 mẫu 0.384s 0.445s [8] Qi Li, Jinsong Zheng, Augustine Tsai, & Qiru Zhou, "Robust Endpoint
Detection and Energy Normalization for Real-Time Speech and Speaker
6 mẫu 0.47s 0.521s Recognition", IEEE Transactions On Speech And Audio Processing,
8 mẫu 0.593s 0.746s Vol. 10, No. 3, March 2002.
[9] Rajesh Makhijani, Ravindra Gupta, “Isolated Word Speech Recognition
10 mẫu 0.648s 0.842s System Using Dynamic Time Warping” In: International Journal of
Engineering Sciences & Emerging Technologies, VOL. 6, Issue 3, pp:
Như các kết quả được đưa ra trong Hình 7, Hình 8, Hình 9, 352-367, (2013).
Hình 10, ta có thể nhận thấy rằng khi bộ từ vựng được tăng [10] MarutiLimkar, RamaRao, VidyaSagvekar: “Isolated Digit Recognition
dần lên thì độ chính xác nhận dạng của hệ thống càng giảm Using MFCC and DTW”. In: International Journal on Advanced
Electrical and Electronics Engineering, Vol. 1, Issue 3, pp. 59-64, (2012).
dần. Do đó, hệ thống nhận dạng sử dụng phương pháp DTW
[11] Shivanker Dev Dhingra, Geeta Nijhawan, Poonam Pandit: “Isolated
chỉ thích hợp trong các ứng dụng với bộ từ vựng nhỏ, điều Speech Recognition Using MFCC And DTW”, In: International Journal
khiển đơn giản với đáp ứng nhanh. Ngoài ra, kết quả nhận of Advanced Research in Electrical, Electronics and Instrumentation
dạng của hệ thống với một người khác (không phải là người Engineering, Vol. 2, Issue 8, pp. 4085-4092, (2013).
205
205
Một Phương Pháp Dịch Từ Mới Trong

Dịch Máy Hoa-Việt
Trần Thanh Phước Nguyễn Thị Thanh Thảo
Khoa Công nghệ Thông tin Khoa Công nghệ Thông tin
Trường Đại Học Tôn Đức Thắng Trường Cao Đẳng Kinh Tế Kỹ Thuật TPHCM
tranthanhphuoc@tonducthang.edu.vn nguyenthithanthao@hotec.edu.vn
Trịnh Thanh Duy Đinh Điền

Khoa Kinh tế Kỹ thuật Khoa Công nghệ Thông tin
Trường Bách Khoa Sài Gòn Trường Đại Học Khoa Học Tự Nhiên, TP.HCM
trinhthanhduy@gmail.com ddien@fit.hcmus.edu.vn
Tóm tắt — Từ mới (UKW: Unknown word) là vấn đề Không giống như các ngôn ngữ phương Tây (điển
hiển nhiên trong dịch máy nói chung và trong dịch hình là tiếng Anh), từ trong tiếng Hoa và tiếng Việt
thống kê Hoa-Việt nói riêng. Hơn nữa, so với các ngôn không được phân định bởi khoảng trắng. Một câu
ngữ giàu tài nguyên khác như tiếng Hoa, Anh thì kho tiếng Hoa bao gồm một dãy các ký tự nằm liên tiếp
ngữ liệu song ngữ Hoa-Việt còn hạn chế, vì vậy, UKW
nhau và không có khoảng trắng giữa các ký tự này.
trong dịch máy Hoa-Việt lại càng nhiều hơn. Mặt khác,
ranh giới từ trong tiếng Hoa và tiếng Việt không được Trong tiếng Việt, các từ chính tả được cách với nhau
phân định bởi khoảng trắng, phân đoạn từ thường được bởi một khoảng trắng, dấu câu nằm liền sau từ chính
thực hiện đầu tiên trong dịch máy Hoa, Việt sang các tả. Do đó, việc phân đoạn từ thường được giải quyết
ngôn ngữ khác hoặc ngược lại. Việc phân đoạn từ làm đầu tiên trong dịch máy Hoa, Việt sang các ngôn ngữ
tăng chất lượng dịch chung cuộc nhưng lại phát sinh khác. Việc phân đoạn từ làm tăng chất lượng dịch
nhiều UKW. Chúng tôi chia UKW làm hai phần là nhưng thường phát sinh nhiều UKW hơn so với hệ
UKW dạng thực thể có tên và UKW không thuộc thực dịch cơ sở (hệ dịch không phân đoạn từ, xem mỗi ký
thể có tên (NNE-UKW). Trong bài báo này, chúng tôi sẽ tự tiếng Hoa và từ chính tả tiếng Việt là đơn vị độc
trình bày một phương pháp dịch NNE-UKW dựa vào
lập). Một ví dụ trong ngữ liệu thử nghiệm của chúng
việc phân rã từ và mô hình ngôn ngữ. Kết quả thử
nghiệm cho thấy phương pháp của chúng tôi đã tăng tôi như sau: từ tiếng Hoa 车票 (vé xe: bus ticket) là
điểm BLEU so với hệ dịch cơ sở và hệ dịch phân đoạn một UKW đối với hệ dịch phân đoạn từ nhưng không
từ. là UKW trong hệ dịch cơ sở (Hình 1).
Từ khóa — NNE-UKW, unknown word, dịch máy Hoa-

Việt, phân rã từ, mô hình ngôn ngữ.
I. GIỚI THIỆU
Hiệu suất dịch máy thống kê phụ thuộc vào độ lớn
và chất lượng của kho ngữ liệu song ngữ. Kho ngữ
liệu càng lớn và càng tinh khiết thì chất lượng của hệ Hình 1. Một ví dụ về hệ dịch cơ sở (dựa vào ký tự)
dịch sẽ càng cao. Để có được ngữ liệu song ngữ cho Từ 2 câu của ngữ ngữ liệu huấn luyện, chúng ta
hệ dịch máy thống kê (SMT: statistical machine
có được một gióng hàng ký tự 车 (xe) và 票 (vé)
translation), bên cạnh phương pháp thu thập bằng tay
(chúng tôi không quan tâm đến các gióng hàng ký tự
tốn kém thì phương pháp rút trích tự động từ các
website song ngữ ngày càng được sử dụng rộng rãi. khác). Do đó, ở câu kiểm tra, khi gặp hai ký tự 车 và
Phương pháp rút trích tự động này được thực hiện 票, hệ thống sẽ dịch được chúng. Ngược lại, khi phân
bằng cách dò tìm các các trang web song ngữ là bản đoạn từ, 2 character 车 và 票 kết hợp thành một từ
dịch của nhau. Các trang web song ngữ Hoa-Việt duy nhất 车票, hệ thống sẽ không dịch được từ này
hoặc Việt-Hoa hiện tại không nhiều, và nếu có thì các do ngữ liệu huấn luyện không tồn tại nó. Do đó,
bản dịch của nhau thường chưa thực sự song song. UKW 车票 sẽ được phát sinh.
Do đó, việc thu thập tự động ngữ liệu song ngữ Hoa-
Việt từ web hiện nay còn khó khăn và chất lượng ngữ Chúng tôi chia UKW tiếng Hoa thành hai loại:
liệu thu được thường không cao. Hiện tại, kho ngữ UKW dạng thực thể có tên và UKW không thuộc
liệu của hệ thống dù chất lượng khá tốt nhưng số thực thể có tên (NNE-UKW: Not Named Entity
lượng cặp câu chưa nhiều. Với kho ngữ liệu hạn chế UKW). Một từ tiếng Hoa có thể là một ký tự có nghĩa
như thế, thì từ mới (UKW: Unknown word) trong hệ hoặc bao gồm nhiều ký tự kết hợp lại với nhau và
dịch Hoa-Việt càng hiển nhiên hơn so với các hệ dịch UKW thường là những từ bao gồm nhiều ký tự hợp
cho cặp ngôn ngữ giàu tài nguyên khác. lại. Chúng tôi sẽ phân rã UKW thành những từ con
nhỏ hơn và dịch các từ con này. Sau đó, chúng tôi sẽ
ISBN: 978-604-67-0635-9 206

206
chọn ra nghĩa tiếng Việt tốt nhất dựa vào xác suất theo kiểu: “A is to B as C is to D”, ví dụ như:
đồng xuất hiện của các nghĩa tiếng Việt của các từ [comfortable : uncomfortable = translatable :
con. untranslatable] trong tiếng Anh. Nhóm tác giả phát
hiện rằng phương pháp của họ có thể dịch chính xác
Bài báo này được trình bày như sau: ở Phần 2,
đến 80% các UKW không thuộc thực thể có tên.
chúng tôi sẽ trình bày các công trình liên quan đến
Phương pháp này đã được thử nghiệm trên các cặp
bài toán xử lý UKW trong dịch máy. Phần nhận dạng
ngôn ngữ như: Pháp-Anh, Đức-Anh và Tây Ban Nha-
cũng như dịch UKW sẽ được trình bày ở Phần 3.
Anh.
Trong khi đó, ở Phần 4, chúng tôi sẽ mô tả các thử
nghiệm cũng như một số thảo luận. Phần kết luận sẽ Riêng đối với các cặp ngôn ngữ giàu hình thái thì
được trình bày ở Phần 5. nhóm tác giả Karunesh Arora và đồng sự [5] đã sử
dụng các kỹ thuật xấp xỉ từ vựng để nhận diện chính
II. CÔNG TRÌNH LIÊN QUAN tả cũng như các biến thể của từ trong kho ngữ liệu
Hiện nay có rất nhiều nghiên cứu với các hướng huấn luyện. Tất cả UKW trong câu nguồn sẽ được
tiếp cận khác nhau nhằm dịch lại UKW, nâng cao thay thế bằng các từ biến thể tương ứng được tìm
hiệu suất dịch máy. Dựa vào phép chính tả của từ, thấy trong ngữ liệu huấn luyện, điều này đã làm giảm
nhóm tác giả Joao Silva và các đồng sự [1] đã đề xuất khá nhiều số lượng UKW trong câu đầu vào. Phương
hai phương pháp nhằm khắc phục các UKW, đó là: pháp này được các tác giả thử nghiệm trên cặp ngôn
phát hiện từ cùng nguồn gốc (cognates’ detection) và ngữ Hin Đi - Nhật.
độ tương tự hợp lý (logical analogy) để dịch lại UKW.
Hướng tiếp cận này đã thực hiện thành công cho cặp III. PHƯƠNG PHÁP DỊCH NNE-UKW
ngôn ngữ biến hình Anh - Bồ Đào Nha. Chúng tôi phân đoạn từ cho ngữ liệu tiếng Hoa và
tiếng Việt trước khi huấn luyện và dịch bởi công cụ
Một hướng tiếp cận khác để xử lý UKW được
SMT. Trong thử nghiệm, chúng tôi sử dụng công cụ
thực hiện bởi tác giả Matthias Eck và các đồng sự [2].
Stanfor Segmenter1 để phân đoạn từ tiếng Hoa, công
Nhóm tác giả này đã tìm các định nghĩa của các
cụ VnTokenizer2 để phân đoạn từ tiếng Việt, công cụ
UKW ở ngôn ngữ nguồn và dịch các định nghĩa của
MOSES3 để thực hiện huấn luyện và dịch. Kết quả
UKW này (thay vì dịch các UKW). Các định nghĩa
dịch của SMT tiếp tục được chúng tôi nhận diện
của UKW sẽ được rút trích tự động từ các từ điển
NNE-UKW và dịch lại theo mô hình ở Hình 2.
trực tuyến và các bách khoa toàn thư, sau đó chúng
được dịch lại qua hệ thống SMT. Kết quả dịch này sẽ
thay thế các UKW ở bản dịch cũ. Phương pháp đã
được các tác giả thử nghiệm trên cặp ngôn ngữ Anh –
Tây Ban Nha. Trong bài báo này, chúng tôi cũng có
áp dụng từ điển trực tuyến để tìm và dịch nghĩa cho
UKW.
Ở khía cạnh khác, tác giả Ruiqiang Zhang và
đồng sự [6] đã dịch lại các UKW bằng cách phân rã
các UKW thành các từ con (subwords). Nhóm tác giả
đã phân rã các UKW tiếng Hoa thành các từ con và
dịch dựa vào các từ con này (subword-based
translation). Từ con là một đơn vị ở giữa ký tự và từ.
Bên cạnh đó, nhóm tác giả còn phát hiện ra rằng, chất
lượng dịch sẽ tăng đáng kể nếu áp dụng nhận dạng
tên riêng (Named Entity recognition: NER) để dịch
các UKW trước khi áp dụng dịch dựa vào từ con.
Hình 2. Mô hình dịch NNE-UKW
WordNet và phiên âm quốc tế (IPA) cũng được sử
dụng để xử lý UKW. Khan MD và đồng sự [3] đã sử  Bước 1: Chúng tôi tìm kiếm nghĩa của NNE-
dụng hai yếu tố này để dịch UKW trong dịch máy UKW trên từ điển Hoa-Việt trực tuyến. Chúng tôi
dựa trên ví dụ (EBMT) từ tiếng Anh sang tiếng tận dụng sự phong phú từ vựng của từ điển trực
Bangla. Đầu tiên, hệ thống sẽ tìm trong WordNet các tuyến với mong muốn có thể tìm được nghĩa tiếng
từ tiếng Anh có nghĩa liên quan đến UKW. Từ những Việt của UKW. Trong thử nghiệm, chúng tôi sử
từ có nghĩa liên quan này, hệ thống sẽ chọn ra từ có
nghĩa gần nhất nhất tồn tại trong từ điển Anh-Bangla.
1
Giả sử như không tìm được từ thỏa mãn, hệ thống sẽ Download tại:
sử dụng phiên âm quốc tế để chuyển ngữ cho UKW. http://nlp.stanford.edu/software/segmenter.shtml
2
Download tại:
Bên cạnh đó, tác giả Philippe Langlais và các http://vlsp.vietlp.org:8080/demo/?page=resources
đồng sự [4] đã sử dụng phương pháp học tương tự để 3
Download at:
dịch lại UKW. Khái niệm về sự tương tự được định http://www.statmt.org/moses/?n=Moses.Releases
nghĩa như sau: [A : B = C : D], thể hiện mối quan hệ
207
207
dụng từ điển Hoa-Việt trực tuyến từ trang web 𝑃𝑃(𝑤𝑤𝑖𝑖3 |𝑤𝑤𝑖𝑖2 ) + ⋯ + 𝑃𝑃(𝑤𝑤𝑖𝑖𝑖𝑖 |𝑤𝑤𝑖𝑖(𝑛𝑛−1) )
“https://vi.glosbe.com/zh/vi/” để tra cứu các
Nghĩa tiếng Việt tốt nhất là nghĩa có tổng xác suất
UKW. Ví dụ như từ 咖哩 (món cà ri: curry), từ
lớn nhất. Hình 3 minh họa quá trình phân rã và dịch
này là UKW đối với kho ngữ liệu song ngữ Hoa-
Việt nhưng lại là từ vựng có trong từ điển Hoa- UKW 手提包 (túi xách tay: handbag), từ này không
Việt trực tuyến. tồn tại trong từ điển Hoa-Việt trực tuyến.
 Giả sử phương pháp sử dụng từ điển ở bước (1)

vẫn không giải quyết được UKW, hệ thống phân rã
UKW thành các từ con và dịch nghĩa của các từ
con này. Phương pháp phân rã và dịch từ con như
sau:
─ Phân rã một UKW thành các từ con dựa vào
từ điển. Từ con ở đây có thể là một từ gồm
nhiều ký tự (hiển nhiên là nhỏ hơn UKW), cũng
có thể là một ký tự riêng biệt. Một ký tự tiếng
Hoa đều có nghĩa tương ứng ở tiếng Việt và Hình 3. Minh họa phân rã và dịch NNE-UKW
chúng ta hoàn toàn có thể xem ký tự tiếng Hoa
là một từ có nghĩa độc lập. Từ tiếng Hoa là vô “túi xách tay” là từ có tổng xác suất 2-gram cao nhất,
hạn nhưng ký tự tiếng Hoa là hữu hạn và được vì vậy từ này sẽ thay thế UKW 手提包 trong bản
lưu trữ trong từ điển. Do đó, khi đã phân rã dịch tiếng Việt cuối cùng.
UKW đến mức ký tự thì vấn đề UKW là không
còn.
IV. THỬ NGHIỆM VÀ THẢO LUẬN
─ Bước kế tiếp, hệ thống sẽ dịch các từ con này
dựa vào từ điển. Một từ con có thể có nhiều A. Ngữ liệu thử nghiệm
nghĩa, có nghĩa phổ biến và có một số nghĩa ít Kho ngữ liệu thử nghiệm của chúng tôi bao gồm
xuất hiện. Để hạn chế không gian từ phát sinh, 30.000 cặp căp Hoa-Việt được lấy từ các sách dạy
trong thử nghiệm, chúng tôi chỉ chọn nghĩa đầu đàm thoại tiếng Hoa, các diễn đàn tiếng Hoa trực
tiên trong từ điển. Sau bước này, một tập hợp tuyến và các website song ngữ Hoa-Việt. Cụ thể như:
nghĩa của các từ con sẽ được phát sinh. sách “301 câu đàm thoại tiếng Hoa” website
“http://www.dantiengtrung.com.vn”, website song
─ Từ tập hợp nghĩa của các từ con, hệ thống ngữ “http://www.dongnai.gov.vn”, ... Chúng tôi sử
phát sinh tập hợp nghĩa tiếng Việt bằng cách kết dụng 90% cặp câu cho huấn luyện, 5% cho kiểm tra
hợp không theo thứ tự tất cả các nghĩa của các và 5% cho điều chỉnh tham số. Các kho ngữ liệu huấn
từ con của một UKW. Sau bước này, chúng ta luyện được huấn luyện bởi công cụ Moses với các
đã có được tập hợp nghĩa tiếng Việt của UKW. tham số mặc định. Chúng tôi sử dụng ngữ liệu của
─ Kế tiếp, hệ thống lọc ra nghĩa tốt nhất từ tập nhóm VLSP với 212.454 câu tiếng Việt để huấn
hợp nghĩa của các từ con. Giả sử rằng từ wi (wi luyện mô hình ngôn ngữ tiếng Việt.
= wi1wi2...win) là một trong các nghĩa tiếng Việt B. Thực hiện thử nghiệm
của UKW, với wij (𝑗𝑗 𝑗 𝑗𝑗𝑗 𝑗𝑗𝑗) là một nghĩa tiếng
Chúng tôi sử dụng các ngữ liệu này để thực hiện
Việt của từ con và n là tổng số từ chính tả trong
ba thử nghiệm sau:
từ wi. Chúng tôi sử dụng mô hình ngôn ngữ n-
gram được huấn luyện trên ngữ liệu tiếng Việt  Hệ dịch cơ sở (1): chúng tôi xem ký tự tiếng
như sau: (công thức (1)). Hoa và từ chính tả tiếng Việt như những đơn vị
𝑃𝑃(𝑤𝑤𝑖𝑖1 … 𝑤𝑤𝑖𝑖𝑖𝑖 ) = 𝑃𝑃(𝑤𝑤𝑖𝑖1 )𝑃𝑃(𝑤𝑤𝑖𝑖2 |𝑤𝑤𝑖𝑖1 )𝑃𝑃(𝑤𝑤𝑖𝑖3 |𝑤𝑤𝑖𝑖1 𝑤𝑤𝑖𝑖2 )
độc lập có nghĩa. Chúng tôi chèn một khoảng
(1) trắng vào giữa các ký tự tiếng Hoa và chèn một
… 𝑃𝑃(𝑤𝑤𝑖𝑖𝑖𝑖 |𝑤𝑤𝑖𝑖1 𝑤𝑤𝑖𝑖2 … 𝑤𝑤𝑖𝑖(𝑛𝑛−1) )
khoảng trắng vào giữa dấu câu và từ chính tả
Trong thử nghiệm, chúng tôi sử dụng công cụ trong tiếng Việt.
SRILM 4 với mô hình ngôn ngữ 2-gram để chọn ra  Hệ dịch phân đoạn từ (2): chúng tôi phân đoạn
nghĩa tiếng Việt phù hợp nhất. Để tránh xác suất 2- từ tiếng Hoa bằng công cụ Stanford Segmenter,
gram bằng không, chúng tôi tiến hành cộng các xác và công cụ VnTokenizer cho tiếng Việt.
suất với nhau thay vì nhân chúng lại (công thức (2).  Sau đó, chúng tôi tiến hành dịch ngữ liệu kiểm
tra tiếng Hoa bằng công cụ Moses cho cả hai
𝑃𝑃(𝑤𝑤𝑖𝑖1 … 𝑤𝑤𝑖𝑖𝑖𝑖 ) = 𝑃𝑃(𝑤𝑤𝑖𝑖2 |𝑤𝑤𝑖𝑖1 ) + (2) trường hợp (1) và (2). Kết quả dịch của trường
hợp (2) tiếp tục được nhận dạng và dịch lại NNE-
UKW.
4
Download tại: Tùy thuộc vào việc chọn lựa các câu trong ngữ
http://www.speech.sri.com/projects/srilm/download.htm liệu kiểm tra mà điểm BLEU có giá trị khác nhau.
l Hình 4 minh họa điểm BLEU cho cách chọn lựa ngữ
208
208
liệu kiểm tra theo định dạng như sau: mỗi 20 câu Kết quả dịch NNE-UKW trong 1.500 câu kiểm tra
trong kho ngữ liệu thì 18 câu đầu tiên dành cho huấn được trình bày ở Bảng 1.
luyện, câu thứ 19 cho điều chỉnh tham số và câu thứ
20 cho kiểm tra. Bảng 1. Độ chính xác của dịch NNE-UKW
Tổng Dịch Độ chính
UKW đúng xác (P)
Dịch dựa vào từ
95 60 63,15%
điển trực tuyến
Dịch dựa vào từ
1220 599 49,09%
con
All NNE-UKW 1315 659 50.11%
C. Thảo luận
Với kết quả thử nghiệm như trên, chúng tôi nhận
thấy rằng kết quả dịch trong hệ dịch phân đoạn từ
thường tốt hơn so với hệ dịch cơ sở. Tuy nhiên, hệ
dịch phân đoạn từ lại xuất hiện UKW nhiều hơn. Bên
cạnh đó, chất lượng của hệ thống dịch lại UKW của
chúng tôi thường tốt hơn so với trường hợp dịch phân
đoạn từ. Điều này cũng dễ hiểu vì chất lượng của hệ
dịch lại UKW đã bao gồm chất lượng của hệ dịch
Hình 4. Các kết quả thử nghiệm phân đoạn từ cộng với chất lượng dịch UKW. Giả sử
kết quả dịch lại sai hoàn toàn thì chất lượng của hệ
Bên cạnh đó, chúng tôi cũng đánh giá độ chính dịch lại cũng không thấp hơn hệ dịch phân đoạn từ.
xác của việc dịch NNE-UKW dựa vào công thức 3 Bảng 2 trình bày sáu trường hợp trong ngữ liệu kiểm
như sau: tra.
𝑺𝑺𝑺𝑺𝑺𝑺𝑺𝑺𝑺𝑺𝑺đượ𝒄𝒄𝒄𝒄𝒄𝒄𝒄𝒄𝒄𝒄 đú𝒏𝒏𝒏𝒏
𝑷𝑷 𝑷 (3)
𝑻𝑻𝑻𝒏𝒏𝒏𝒏 𝒔𝒔𝒔𝒔𝒔𝒔𝒔𝒔𝒔𝒔𝒔đượ𝒄𝒄𝒄𝒄𝒄𝒄𝒄𝒄𝒄𝒄
Bảng 2. Một số kết quả dịch qua ba hệ thống

Câu tiếng Hoa Nghĩa đúng Hệ dịch cơ sở Hệ dịch phân Hệ dịch lại
tiếng Việt doạn từ NNE-UKW
1. 能给我一张 Có thể cho tôi Có thể cho tôi 1 Có thể cho tôi Có thể cho tôi
说明书吗？ một bản thuyết tờ cho thấy sách một 说明书 một bản thuyết
minh không? không ? không ? minh không?
2. 去美术馆在 Đi phòng tranh Đi tàng mỹ thuật Đi 美术馆 ở đây đi phòng tranh ở
这乘车吗？ đón xe ở đây phải ở đây đón xe phải đi xe phải đây đón xe phải
không? không ? không ? không?
3. 我想知道票 Tôi muốn biết giá Tôi muốn biết giá Tôi muốn biết 票 Tôi muốn biết giá
价从上海到北 vé từ Thượng Hải vé từ Thượng Hải 价 từ Thượng vé từ Thượng Hải
京 đến Bắc Kinh đến Bắc Kinh Hải đến Bắc đến Bắc Kinh
Kinh
4. 你喜欢平面 Bạn thích loại bạn thích bình bạn thích 平面 Bạn thích mặt
银幕的吗？ màn hình phẳng diện bạc mạc của 银幕 không ? bằng của màn
không? không ? hình không?
5. 越南有很多 Việt Nam có rất Việt Nam có rất Việt Nam có rất Việt Nam có rất
传统节日，如 nhiều ngày lễ nhiều truyền nhiều ngày hội nhiều ngày hội
端午节、中秋 truyền thống , thống như lễ tết , truyền thống, như truyền thống, như
như tết đoan lễ trung thu 端午节 , 中秋节 tết đoan ngọ ,
节
ngọ , tết trung thu chương. trung thu liên
hoan
6. 这件晚装我 Bộ đồ dạ hội này tôi muốn cái này Cái này 晚装 tôi Cái này tối hóa
要在今晚的宴 tôi cần mặc trong trang tối nay muốn ở tối của trang tôi muốn ở
会上穿 buổi tiệc tối nay chúng tôi mặc 宴会 trên mặc tối của yến hội
trên mặc
Tất cả hệ dịch đều có lỗi về nghĩa và trật tự từ, tuy cơ sở đã dịch được tất cả 6 trường hợp, nhưng kết quả
nhiên, chúng tôi không đề cập về những lỗi này. Ở dịch của hệ dịch này thường không chính xác trừ câu
đây, chúng tôi chỉ tập trung về những lỗi của các hệ số 3 (nhận dạng, dịch và đảo trật tự đúng hai ký tự 票
thống khi dịch các câu có chứa NNE-UKW. Hệ dịch /“vé” và 价/ “giá”). Trong những trường hợp còn lại,
209
209
các ký tự trong câu tiếng Hoa đều tồn tại trong kho sở nên số lượng gióng hàng từ cũng như khả năng
ngữ liệu huấn luyện, vì thế hệ dịch cơ sở đã chọn nhận dạng từ của hệ dịch này kém hơn so với hệ dịch
nghĩa tiếng Việt có xác suất cao nhất làm kết quả dịch. cơ sở. Và kết quả là hệ dịch này phát sinh nhiều
Tuy nhiên, những nghĩa này thường bị sai. Điển hình UKW hơn. Mặc khác, từ trong ngôn ngữ tự nhiên là
như từ tiếng Hoa 说明书 ở trường hợp 1, nghĩa dịch tập mở nên dù kho ngữ liệu có lớn đến mức nào đi
đúng của từ này là “bản thuyết minh”. Tuy nhiên, hệ nữa cũng không thể bao phủ hơn tất cả các từ, vì vậy
dịch cơ sở lại dịch thành “cho thấy sách”. Sở dĩ như việc phát sinh UKW là điều không thể tránh khỏi
vậy là vì nghĩa ký tự tương ứng “明/thấy” và “书 trong dịch máy. Kết quả dịch ở trường hợp phân đoạn
/sách” có xác suất cao nhất trong kho ngữ liệu ở hệ từ được dịch lại qua hệ thống của chúng tôi.
dịch cơ sở. Các lỗi sai tương tự ở những trường hợp Chúng ta tiếp tục thảo luận về sự cải tiến của hệ
còn lại. thống dịch lại thông qua các câu ví dụ bên trên. Bảng
Ở hệ dịch phân đoạn từ, do tổng số từ trong kho 3 sẽ minh họa các bước xử lý của hệ dịch lại đối với
ngữ liệu của trường hợp này ít hơn so với hệ dịch cơ những trường hợp ở Bảng 3.
Bảng 3. Minh họa các bước nhận dạng và dịch NNE-UKW

Phân đoạn 1. 能给我 2. 去美术 3. 我想知道票 4. 你喜 5. 越南有很 6. 这件晚装
từ 一张说明馆在这价从上海到北欢平面多传统节我要在今晚
书吗？乘车吗？京银幕的日，如端午的宴会上穿
吗？节、中秋节
Kết quả dịch Có thể cho Đi 美术馆 Tôi muốn biết 票 bạn thích Việt Nam có Cái này 晚装
phân đoạn tôi một 说 ở đây đi xe 价 từ Thượng 平面 của rất nhiều ngày tôi muốn ở tối
từ 明书 phải không Hải đến Bắc 银幕 hội truyền của 宴会 trên
không ? ? Kinh không ? thống, như 端 mặc
午节 , 中秋节
Nhận dạng Có thể cho đi 美术馆 Tôi muốn biết 票 bạn thích Việt Nam có Cái này 晚装
NNE-UKW tôi một 说 /UKW ở 价 /UKW từ 平面 rất nhiều ngày /UKW tôi muốn
明书/UKW đây đi xe Thượng Hải đến /UKW hội truyền ở tối của 宴会
không ? phải Bắc Kinh của 银幕 thống, như 端 /UKW trên mặc
không ? /UKW 午节 /UKW ,
không ? 中秋节/UKW
Dịch NNE- ...说明书... … 美术 … 票价 … ... 平面 ... ... 端午节 , 中 ... 晚装 ... 宴
UKW 馆… 银幕 ... 秋节会 ...
... bản ... phòng … giá vé … ... mặt ... tết đoan ... tối hóa
thuyết tranh … bằng ... ngọ, trung thu trang ... yến
minh ... màn liên hoan hội ...
hình ...
Giải thích sơ - Dịch dựa - Dịch dựa - Phân rã UKW - Dịch - Dịch dựa - 宴会 được
lược vào từ điển vào từ điển và dịch dựa vào dựa vào vào từ điển dịch dựa vào từ
trực tuyến trực tuyến từ con và mô từ điển trực tuyến điển
hình ngôn ngữ trực tuyến - 晚装 được
dịch dựa vào từ
con và mô hình
ngôn ngữ
Bên cạnh những cải tiến như trên, chúng tôi cũng từ con này dựa vào từ điển và mô hình ngôn ngữ. Để
phát hiện một số trường hợp dịch lại bị sai. Lỗi sai ở hạn chế không gian từ phát sinh, chúng tôi chỉ lấy
trường hợp dịch dựa vào từ điển trực tuyến thường là nghĩa tiếng Việt đầu tiên trong từ điển và kết hợp
sai ngữ cảnh. Ví dụ như UKW 平面 (ở câu 4 của không theo thứ tự các nghĩa này lại với nhau. Việc
Bảng 2). Theo từ điển thì từ này có nghĩa lần lượt là chọn lựa như vậy có thể bị sai nếu nghĩa đúng của từ
“mặt bằng”, “mặt phẳng”, “phẳng”. Hệ thống dịch lại con không phải là nghĩa đầu tiên trong từ điển. Bên
đã chọn nghĩa “mặt bằng” để thay thế cho UKW. Tuy cạnh đó, hệ thống dịch lại sẽ chọn nghĩa tiếng Việt tốt
nhiên, nghĩa thứ ba “phẳng” mới là sự chọn lựa đúng nhất dựa vào xác suất 2-gram cao nhất. Tuy nhiên ở
cho trường hợp này. Mặc dù nghĩa “mặt bằng” không một số trường hợp thì xác suất cao nhất không đi đôi
phù hợp với ngữ cảnh nhưng nó cũng gần với nghĩa với nghĩa tốt nhất. Điển hình như UKW 晚装 ở câu 6
của từ “phẳng”. Bảng 2 có nghĩa là “đồ dạ hội” hay “trang phục dạ hội”
nhưng xác suất 2-gram cao nhất tương ứng của từ này
Đối với các UKW không tồn tại trong từ điển,
là “tối hóa trang”.
chúng tôi phân rã chúng thành các từ con và dịch các
210
210
V. KẾT LUẬN TÀI LIỆU THAM KHẢO

Trong bài báo này, chúng tôi đã đề xuất một [1] Joao Silva, Luisa Coheur, Angela Costa, Isabel Trancoso,
Dealing with unknown words in statistical machine
phương pháp dịch NNE-UKW trong dịch máy Hoa- translation, in proceedings of the Eight International
Việt dựa vào từ điển và mô hình ngôn ngữ. Kết quả Conference on Language Resources and Evaluation
thực nghiệm cho thấy hệ dịch lại của chúng tôi đã cho (LREC'12), pp. 176-187, 2012.
chất lượng dịch tốt hơn so với hệ dịch cơ sở, đã dịch [2] Matthias Eck, Stephan Vogel, Alex Waibel, Communicating
đúng nhiều UKW của trường hợp phân đoạn từ, góp Unknown words in machine translation, in International
Conference on Language Resources and Evaluation, pp.1542-
phần làm tăng hiệu suất dịch máy. Bên cạnh đó, 1547, 2008.
chúng tôi cũng thấy rằng hệ dịch lại UKW còn nhập [3] Khan Md. Anwarus Salam, Setsuo Yamada and Setsuo
nhằng về nghĩa ở cả hai trường hợp: dịch dựa vào từ Yamada, How to Translate Unknown Words for English to
điển trực tuyến cũng như dịch dựa vào phân rã thành Bangla Machine Translation Using Transliteration, Journal of
từ con. computers, vol. 8, no. 5, pp.481-486, 2013.
[4] Philippe Langais and Alexandre Patry, Translating Unknown
Trong tương lai, chúng tôi sẽ tích hợp thêm thông Words by Analogical Learning, Conference on Empirical
tin từ đồng nghĩa và mô hình ngôn ngữ vào hệ thống Methods in Natural Language Processing, pp.877-886, 2007.
để khắc phục các lỗi của trường hợp dịch dựa vào từ [5] Karunesh Arora and Michael Paul and Eiichiro Sumita,
Translation of unknown words in phrase-based statistical
điển trực tuyến. Đối với phương pháp dịch dựa vào machine translation for languages of rich morphology, The
phân rã thành từ con, chúng tôi sẽ điều chỉnh phân rã first International Workshop on Spoken Languages
cách phân rã NNE-UKW cũng như mở rộng không Technologies for Under-resourced languages (SLTU - 2008),
p.70-75, 2008.
gian từ tiếng Việt để tìm nghĩa tiếng Việt phù hợp
[6] Ruiqiang Zhang, Eiichiro Sumita, Chinese Unknown word
nhất. Translation by Subword Re-segmentation, in International
Joint Conference on Natural Language Processing, pp.225-
232, 2008.
211
211
HộiHội
Thảo Quốc
Thảo GiaGia
Quốc 2015
2015vềvềĐiện
ĐiệnTử,
Tử,Truyền
TruyềnThông CôngNghệ
Thông và Công NghệThông
ThôngTinTin (ECIT
(ECIT 2015)
2015)
Mẫu Thiết Kế Cho Việc Phát Triển Phần Mềm Trong

Môi Trường Đám Mây: Bản Khảo Sát Hiện Trạng
Ngô Huy Biên và Trần Đan Thư
Khoa Công Nghệ Thông Tin,
Trường Đại học Khoa học Tự nhiên, Đại học Quốc gia thành phố Hồ Chí Minh, Việt Nam
Email: nhbien@fit.hcmus.edu.vn, tdthu@fit.hcmus.edu.vn
Abstract— Điện toán đám mây hứa hẹn một cuộc cách mạng di chuyển các ứng dụng truyền thống lên các đám mây hay xây
trong công nghệ và kinh doanh bằng cách cung cấp khả năng dựng một hệ thống mới trên đám mây là một thách thức lớn đối
tính toán như các dịch vụ trong môi trường Internet. Hầu hết các với các nhà phát triển do sự khác biệt rất lớn giữa một dịch vụ
doanh nghiệp ngày nay đều dựa trên các hệ thống công nghệ dành cho hàng trăm triệu người sử dụng với một ứng dụng cài
thông tin để vận hành các hoạt động kinh doanh phức tạp. Việc đặt trên máy một người dùng hay một ứng dụng dùng cho vài
di chuyển các hệ thống này lên môi trường đám mây là điểu tất trăm người trong một công ty. Các nhà phát triển cần thiết kế
yếu do lợi ích to lớn trong việc giảm chi phí xây dựng và vận ứng dụng để đáp ứng khả năng mở rộng, tính sẵn sàng cao
hành hệ thống. Các nhà phát triển có thể phát triển các ứng dụng cùng năng lực xử lý thông minh khi người dùng mất kết nối.
dịch vụ điện toán đám mây bằng 2 cách: phát triển ứng dụng
Sự tương tác, kết hợp giữa các dịch vụ đám mây phức tạp tạo
trên dịch vụ nền tảng hoặc phát triển ứng dụng riêng gọi đến các
dịch vụ của điện toán đám mây. Dù phát triển ứng dụng đám
nên sự ảnh hưởng lẫn nhau giữa các ứng dụng và các nhà phát
mây bằng cách nào đi nữa thì thiết kế là giai đoạn không thể bỏ triển cần xử lý chúng một cách khéo léo.
qua nhằm đánh giá tính đúng đắn của phương pháp giải quyết Các mẫu thiết kế truyền thống vẫn có thể sử dụng để phát
vấn đề và có tài liệu để các bên liên quan liên lạc thống nhất với triển các ứng dụng đám mây, tuy nhiên chúng chưa đủ để đáp
nhau. Để thiết kế thành công các hệ thống phần mềm trong đám ứng các nhu cầu của ứng dụng điện toán đám mây khi mà khối
mây phục vụ doanh nghiệp các kiến trúc sư cần được trang bị lượng xử lý trở nên khổng lồ, các kết nối có thể bị cắt đứt đột
đầy đủ kiến thức và kinh nghiệm. Mẫu thiết kế là một phương
ngột, các dịch vụ tương tác chồng chéo, phụ thuộc vào nhau,
tiện nhằm chuyển giao giải pháp cho các vấn đề lặp lại nhiều lần
chờ đợi kết quả của nhau [56, 70], nhiều khách hàng có yêu
và tính hiệu quả của mẫu thiết kế đã được chứng thực qua thời
gian. Trong bài báo này chúng tôi khảo sát các công trình nghiên
cầu khác nhau cùng dùng chung một ứng dụng.
cứu về mẫu thiết kế để phát triển phần mềm doanh nghiệp trong Một ví dụ cụ thể có thể kể đến như cơ chế xác thực và phân
môi trường đám mây, đặc biệt là phần mềm cung cấp như dịch quyền. Các mẫu thiết kế như Brokered Authentication, Role-
vụ, đồng thời đi sâu vào các khó khăn khi phát triển ứng dụng đa Based Access Control [36] vẫn có thể sử dụng để xác thực và
người thuê. Đóng góp chính của bài báo này bao gồm (i) lý do cần phân quyền cho ứng dụng đám mây. Tuy nhiên với các ứng
nghiên cứu mẫu thiết kế để phát triển phần mềm trong môi dụng đám mây hỗ trợ đa người thuê, các người thuê phân thành
trường đám mây, (ii) bản tổng kết hiện trạng một cách hệ thống
nhiều cấp khác nhau cần có mẫu thiết kế mới để xây dựng hệ
các kết quả nghiên cứu về mẫu thiết kế cho các ứng dụng trong
môi trường đám mây và (iii) các câu hỏi nghiên cứu đề xuất cho
thống quản lý nhiều người thuê phân cấp đồng thời cung cấp
các vấn đề còn tồn đọng. Chúng tôi hy vọng rằng bài báo sẽ góp cơ chế xác thực đơn giản cho tất cả các người thuê cũng như cơ
phần giúp các nhà nghiên cứu về kỹ nghệ phần mềm trong môi chế phân quyền linh hoạt mà vẫn đảm bảo sự bảo mật trong
trường đám mây có cái nhìn tổng quan từ đó xác định hướng việc truy cập vào các tài nguyên.
nghiên cứu và bài toán cụ thể cho mình trong lĩnh vực này dễ Việc chuyển đổi các ứng dụng truyền thống lên đám mây
dàng hơn. không có nghĩa là loại bỏ chúng, các ứng dụng truyền thống sẽ
vẫn tồn tại song song với các ứng dụng đám mây, do vậy cần
Keywords — thiết kế phần mềm; mẫu thiết kế; điện toán đám
mây; đa người thuê; tính biến thiên của phần mềm.
có các mẫu thiết kế kết hợp sự xác thực và phân quyền giữa
đám mây và ứng dụng truyền thống, bảo mật cho người dùng
trong nhiều môi trường chỉ qua một lần xác thực nhằm giúp họ
I. GIỚI THIỆU sử dụng dịch vụ dễ dàng hơn.
Đ iện toán đám mây hứa hẹn một cuộc cách mạng trong
công nghệ và kinh doanh bằng cách cung cấp khả năng
tính toán như các dịch vụ trong môi trường Internet. Hầu
Một ví dụ khác như dịch vụ trao đổi thông điệp trong môi
trường đám mây, các dịch vụ email truyền thống hầu như
hết các doanh nghiệp ngày nay đều dựa trên các hệ thống công không bảo vệ nội dung điện thư truyền đi trong môi trường
nghệ thông tin để vận hành các hoạt động kinh doanh phức tạp. mạng, do vậy cần có các mẫu thiết kế để giải quyết vấn đề bảo
Việc di chuyển các hệ thống này lên môi trường đám mây là mật nội dung dữ liệu trao đổi giữa các dịch vụ.
điểu tất yếu do lợi ích to lớn trong việc giảm chi phí xây dựng Rất nhiều vấn đề cần được giải quyết khi xây dựng phần
và vận hành hệ thống[18, 44, 60, 75]. mềm trong môi trường điện toán đám mây như làm thế nào để
Cho đến thời điểm hiện tại phần lớn các ứng dụng phần xây dựng mô hình dữ liệu cho phép thay đổi khi thực thi
mềm vẫn ở dạng truyền thống (on-premise applications). Việc chương trình, làm sao để xử lý các quy trình tính toán phức tạp
ISBN: 978-604-67-0635-9 212
212
Hội Hội
ThảoThảo Quốc
Quốc GiaGia 2015
2015 vềvềĐiện
ĐiệnTử,
Tử,Truyền
TruyềnThông
Thông và
và Công
CôngNghệ
NghệThông
ThôngTinTin
(ECIT 2015)
(ECIT 2015)
đòi hỏi sự kết hợp của nhiều dịch vụ, trong đó mỗi dịch vụ đòi kiếm cho việc xây dựng phần mềm đám mây; phần III chúng
hỏi đầu vào khác nhau và trả về kết quả bất tương thích với các tôi giới thiệu các vấn đề gặp phải khi thiết kế các phần mềm
dịch vụ khác, làm sao để một hệ thống có khả năng quay ngược
cung cấp như dịch vụ trong môi trường đám mây; phần IV
quy trình xử lý khi tính năng của hệ thống được xây dựng bằng
cách kết hợp nhiều dịch vụ khác nhau và một dịch vụ được gọi chúng tôi tập trung vào các khó khăn về thiết kế khi phát triển
bị lỗi. ứng dụng đa người thuê; phần V chúng tôi thảo luận một số
Việc phát hiện các mẫu thiết kế để giải quyết các vấn nảy công trình liên quan; cuối cùng chúng tôi tổng kết lại hiện
sinh khi phát triển các hệ thống phần mềm trong môi trường trạng nghiên cứu và đưa ra tầm nhìn về tương lại. Trong mỗi
đám mây, đặc biệt là các hệ thống quản trị ngân hàng, thương phần chúng tôi giới thiệu một số vấn đề mở còn tồn đọng của
mại điện tử, quản trị nhân lực, kết nối, trao đổi thông tin hay chủ đề nghiên cứu.
bản đồ dịch trở thành một nhu cầu cấp thiết. Các mẫu thiết kế Đóng góp chính của bài báo này gồm (i) lý do cần nghiên
mới sẽ giúp bảo đảm chất lượng và nâng cao hiệu suất của quá
trình phát triển phần mềm trong môi trường đám mây. cứu mẫu thiết kế để phát triển phần mềm trong môi trường
đám mây, (ii) bản tổng kết hiện trạng nghiên cứu về mẫu thiết
Trong bài báo này chúng tôi khảo sát các vấn đề gặp phải kế cho các ứng dụng trong môi trường đám mây và (iii) một số
khi thiết kế và xây dựng phần mềm trong môi trường đám câu hỏi nghiên cứu đề xuất cho các vấn đề còn tồn đọng.
mây. Sơ đồ khái niệm dưới đây mô tả các lĩnh vực mà chúng
tôi sẽ đề cập và mối liên hệ giữa chúng. II. MẪU THIẾT KẾ
Công nghệ và phương pháp phát triển phần mềm thay đổi
liên tục theo từng ngày, các vấn đề mới luôn xuất hiện ngày
một nhiều trong khi các mẫu thiết kế có sẵn thì luôn giới hạn.
Do vậy thường xuyên có nhu cầu về các mẫu mới để giải quyết
các vấn đề vừa nảy sinh. Để đưa ra các mẫu mới đòi hỏi cần có
sự đầu tư nghiên cứu về mẫu đối với các vấn đề mới nảy sinh,
sau đó tổng kết và tài liệu hóa lại các giải pháp.
Cũng như mọi sự vật khác, các mẫu không phải là tồn tại
vĩnh viễn. Có những mẫu trở nên lỗi thời do vấn đề cần giải
quyết không còn xuất hiện nữa hoặc do xuất hiện một giải pháp
thay thế khác tốt hơn, hoặc do công nghệ phát triển làm cho
Hình 1. Sơ đồ khái niệm của các lĩnh vực nghiên cứu. vấn đề có thể tự được giải quyết khi áp dụng công nghệ mới.
Khi một mẫu đã lỗi thời chúng ta không nên ứng dụng nó nữa.
Sơ đồ trên thể hiện mẫu phần mềm là một lĩnh vực con Để nhận biết một mẫu là lỗi thời, cập nhập lại mẫu đó cho hợp
trong kỹ nghệ phần mềm, mẫu thiết kế là một lĩnh vực con thời đòi hỏi sự nghiên cứu lại các mẫu cũ trong hoàn cảnh mới.
trong mẫu phần mềm. Điện toán đám mây là một lĩnh vực Do vậy ngoài việc tìm kiếm các mẫu và ngôn ngữ mẫu mới,
nghiên cứu riêng biệt, phần giao giữa điện toán đám mây và kỹ các nhà nghiên cứu còn tập trung vào việc tái cấu trúc, sửa
nghệ phần mềm chính là kỹ nghệ phần mềm trong môi trường chữa, điều chỉnh, mô tả lại các mẫu cũ cho phù hợp với hiện
đám mây (bao gồm quy trình, chuẩn hóa, mô hình phát triển, tại.
ứng dụng, vân vân).
Việc nghiên cứu để phát hiện, tài liệu hóa và áp dụng mẫu
Ứng dụng đám mây là một lĩnh vực con trong điện toán được thực hiện liên tục với hàng loạt các thành tựu như 23 mẫu
đám mây, các ứng dụng đám mây tập trung ở ba loại là ứng thiết kế của nhóm 4 người với các mẫu như Abstract Factory,
dụng quản lý hạ tầng cung cấp dạng dịch vụ, ứng dụng cung Facade, Composite, Template, Strategy [43] được áp dụng rộng
cấp nền tảng dạng dịch vụ và ứng dụng nghiệp vụ cung cấp rãi trong các hệ thống hướng đối tượng; hay các mẫu MVC,
như dịch vụ. Sự giao nhau giữa mẫu thiết kế và ứng dụng đám Layer, Interceptor của nhóm 5 người [16] được tích hợp vào
mây chính là mẫu thiết kế cho ứng dụng đám mây, lĩnh vực hầu hết các hệ thống khung hiện tại; hay các mẫu Data Acess
nghiên cứu mà bài báo đề cập chính là miền giao nhau này. Object, Transfer Object, Business Object, Domain Model,
Ứng dụng đa người thuê là một lĩnh vực nghiên cứu trong Active Record [5, 40] được ứng dụng rộng rãi trong hầu hết
ứng dụng đám mây. Sự giao nhau giữa mẫu thiết kế và ứng các phần mềm doanh nghiệp hiện nay; hay các mẫu Role-
dụng đa người thuê chính là mẫu thiết kế cho ứng dụng đa Based Access Control [36] được áp dụng để quản lý phân
người thuê, đây là một lĩnh vực con của mẫu thiết kế cho ứng quyền trong hầu như tất cả các hệ thống.
dụng đám mây và cũng chính là lĩnh vực mà bài báo này tập Các nghiên cứu về lý thuyết mẫu cũng đã được thực hiện
trung đề cập nhiều nhất. chi tiết [15, 24, 71]. Ngoài ra các nhà nghiên cứu còn đề xuất
Phần tiếp theo của bài báo được cấu trúc như sau: phần II nhiều mẫu dành riêng cho các ngôn ngữ hay hệ thống đặc thù
[9, 20 - 23]; các tác vụ trong quá trình phát triển phần mềm như
chúng tôi giới thiệu một số thành tựu trong việc nghiên cứu
phân tích [39], thiết kế nghiệp vụ [31], kiểm thử đơn vị [64],
mẫu thiết kế, mục đích là giới thiệu về các lĩnh vực trong công tích hợp [50], quản lý tài nguyên [53], bảo mật hệ thống [37],
nghệ phần mềm mà các nhà nghiên cứu đã tập trung tìm kiếm quản lý cấu hình [11]; các phần mềm đặc thù như trang mạng
mẫu thiết kế, từ đó cho thấy mẫu thiết kế cần tiếp tục được tìm [45], hệ quản trị nội dung [72], hệ thống phân tán [27], phần
213
213
HộiHội
ThảoThảo Quốc
Quốc Gia
2015 ĐiệnTử,
Tử,Truyền
TruyềnThông
Thông và
và Công
CôngNghệ
NghệThông
ThôngTinTin
(ECIT 2015)
(ECIT 2015)
mềm hướng dịch vụ [10, 30]. Các kinh nghiệm khi ứng dụng nghiệp cần các ứng dụng vận hành đám mây. Thiết kế các ứng
mẫu một cách không đúng đắn cũng được nghiên cứu và tài dụng này là một vấn đề thiết yếu cần được giải quyết. Xây
liệu hóa lại [13, 28, 58, 79]. dựng các phần mềm hệ thống (IaaS) và nền tảng (PaaS) cho
đám mây là một quá trình phức tạp.
Tuy nhiên cuộc sống luôn thay đổi, các lĩnh vực mới xuất
hiện ngày càng nhiều, xây dựng phần mềm trong các lĩnh vực Các phần mềm hệ thống cho đám mây cần quản lý được
đó đòi hỏi các mẫu thiết kế mới. Vấn đề mở hiện nay là việc các máy chủ vật lý, các máy ảo, hệ thống lưu trữ vật lý, quản lý
phát hiện, tài liệu hóa các mẫu và ngôn ngữ mẫu chuyên biệt thông điệp giao tiếp, cân bằng tải, chống lỗi, theo dõi mức độ
cho công nghệ mới và miền ứng dụng đặc thù, ví dụ như hệ sử dụng tài nguyên, hiệu suất hệ thống, cung cấp giao diện
thống nhúng và phân tán theo thời gian thực, tương tác nhóm, người dùng và giao diện lập trình ứng dụng [75]. Các phần
phát triển phần mềm hướng mô hình, phát triển phần mềm mềm nền tảng đám mây cần quản lý quản lý được các ứng
hướng khía cạnh, và đặc biệt là tính toán dịch vụ và điện toán dụng, cung cấp môi trường, ngôn ngữ và thư viện để phát triển
đám mây. ứng dụng, cung cấp phương pháp lưu trữ cho ứng dụng, vận
hành và theo dõi các ứng dụng.
III. MẪU THIẾT KẾ CHO ỨNG DỤNG ĐÁM MÂY Trong [48] các tác giả giới thiệu hai mẫu thiết kế để xây
Ngành điện toán cho đến ngày nay đã trải qua 6 hệ mẫu dựng các hệ thống IaaS và PaaS. Mẫu Cloud Infrastructure đưa
tính toán từ điện toán máy trạm đến điện toán cá nhân, đến điện ra mối quan hệ tĩnh và động giữa người thuê với hệ thống điều
toán mạng, đến điện toán internet, đến điện toán lưới và hiện khiển, máy ảo, máy chủ, tài nguyên với mục đích hỗ trợ việc
tại đang trong giai đoạn điện toán đám mây [42]. Điện toán xây dựng các hệ thống IaaS. Mẫu Platform-as-a-Service đưa ra
đám mây là một lĩnh vực liên quan chặt chẽ với kỹ nghệ phần mối quan hệ tĩnh và động giữa người dùng với bên cung cấp
mềm. Việc nghiên cứu các mẫu thiết kế để phát triển phần mềm nền tảng cùng các thành phần thiết yếu của một hệ thống PaaS
trong môi trường điện toán đám mây tập trung vào mẫu thiết kế nhằm mục đích hỗ trợ xây dựng các hệ thống PaaS. Tuy nhiên
cho 3 loại phần mềm chính: phần mềm hạ tầng, phần mềm nền hai mẫu thiết kế này chỉ cung cấp kiến trúc ở mức độ tổng quan
tảng và phần mềm cung cấp như dịch vụ [17, 42, 61, 77]. mà không đưa ra các hướng dẫn, phân tích chi tiết về việc hiện
thực hóa chúng.
Một trong các yêu cầu đối với phần mềm hạ tầng là khả
năng hợp nhất các hệ thống đám mây do vậy cần các mẫu thiết Vấn đề chưa giải quyết trong lĩnh vực mẫu thiết kế cho
kế và chuẩn để có thể thực hiện yêu cầu này. Cả 3 loại phần phần mềm hệ thống và nền tảng đám mây là phân tích để tìm ra
mềm đều cần sử dụng các mẫu thiết kế về lưu trữ và xử lý dữ những điểm chưa hoàn thiện trong mô hình nghiệp vụ của các
liệu lớn, bảo mật và mở rộng các hệ thống. Cả 3 loại phần phần mềm khi áp dụng vào các hoàn cảnh thực tế; đưa ra các
mềm này đều có nhu cầu tích hợp các hệ thống với nhau. Việc chỉ dẫn cụ thể để xây dựng, hiện thực hóa các loại phần mềm
tích hợp này thường được thực hiện dựa trên các mẫu thiết kế dạng này; so sánh, đánh giá các phần mềm hệ thống và phần
cho các hệ thống nền tảng trung gian (middleware) hay hệ mềm nền tảng khác nhau.
thống mạch kết nối dịch vụ (enterprise service bus) và áp dụng B. Mẫu thiết kế cho việc hợp nhất các hệ thống đám mây
các chuẩn chung. Đặc biệt cả 3 loại phần mềm hầu như đều Các đám mây hiện nay tập trung rải rác ở một số nhà cung
được xây dựng trên mô hình đa người thuê. Việc xây dựng các cấp lớn như Amazon, Google, Microsoft, IBM và Rackspace.
hệ thống đa người thuê đòi hỏi các mẫu thiết kế kiến trúc cho [19] dự đoán trong tương lai các đám mây này sẽ hợp nhất với
từng lĩnh vực đặc thù và khả năng xử lý tính biến thiên. Hình nhau để tận dụng nguồn cung cấp dịch vụ của nhau nhằm giảm
2 mô tả các hướng nghiên cứu chúng tôi vừa đề cập. Chi tiết chi phí mở rộng và mở rộng các khả năng của mình. Các tác
cho từng hướng sẽ được trình bày ở những phần tiếp theo. giả đưa ra một kịch bản hợp nhất trong đó các tài nguyên ảo
được chia sẽ giữa các đám mây và cung cấp cho người dùng
một cách liền mạch. Các tác giả cũng đề xuất kiến trúc, kỹ
thuật và công nghệ cần thiết để xây dựng 3 thành phần này.
Đây là một ý tưởng rất hấp dẫn, tuy nhiên việc hiện thực hóa
và đánh giá kiến trúc này vẫn chưa được thực hiện.
C. Mẫu thiết kế lưu trữ và truy xuất dữ liệu ứng dụng đám
mây
Các phần mềm trong môi trường đám mây luôn cần lưu trữ
xử lý một khối lượng dữ liệu cực kỳ lớn và nhiều khi không có
giới hạn. Đây là một đặc điểm đặc thù của các phần mềm trong
môi trường đám mây nhằm tận dụng khả năng lưu trữ và xử lý
không giới hạn của đám mây. Trong đám mây hầu hết các dữ
Hình 2 – Phát triển phần mềm trong môi trường đám mây. liệu được lưu trữ không theo kiểu quan hệ dẫn đến việc lập
A. Mẫu thiết kế cho phần mềm hệ thống và nền tảng đám mây trình ứng dụng đám mây cũng thay đổi theo.
Nhiều doanh nghiệp hay chính phủ vì lý do bảo mật hoặc Các hệ thống đám mây thường cung cấp hai dịch vụ cho
do nhu cầu tích hợp với ứng dụng truyền thống của minh, hoặc việc lưu trữ và truy xuất dữ liệu ứng dụng, đặc biệt là khả
có nhu cầu toàn quyền quản lý ứng dụng và hạ tầng cần có đám năng hỗ trợ ứng dụng làm việc với khối lượng dữ liệu lớn:
mây riêng của mình. Để xây dựng các đám mây riêng doanh
214
214
HộiHội
 Tập Tập tin (file) hệ thống để lưu trữ dữ liệu như nhau. Các nhà phát triển gặp nhiều khó khăn trong việc tích
Google File System [44], Hadoop Distributed File hợp ứng dụng của mình với các ứng dụng ở các nền tảng khác,
đặc biệt là các ứng dụng truyền thống trong nội bộ doanh
System [76]
nghiệp. Trong [32] các tác giả giới thiệu mẫu thiết kế “Cloud
 Cơ chế để truy xuất dữ liệu như MapReduce [26], Component Gateway” giúp các ứng dụng tương tác với nhau
Map-Reduce-Merge [86] bằng cách mỗi ứng dụng trong môi trường đám mây tạo bản
sao giao diện của mình và dùng chúng tương tác với các ứng
Một số mẫu thiết kế để truy xuất và xử lý dữ liệu lớn như dụng truyền thống. Các bản sao này sẽ chuyển các yêu cầu đến
repartition join, semi-joins, secondary sort, reservoir sampling, các thành phần bên trong của ứng dụng đám mây.
vân vân được giới thiệu trong [51]. Tuy nhiên các cách xử lý Một vấn đề khác khi tích hợp các ứng dụng là khả năng
này thường áp dụng cho xử lý song song và cho kết quả không đảm bảo tính tin cậy và toàn vẹn cho từng quy trình nghiệp vụ,
theo thời gian thực trong khi các hệ thống đám mây thường trong đó mỗi quy trình nghiệp vụ gọi các quy trình từ các ứng
phải tương tác với người dùng theo thời gian thực. Việc đưa ra dụng khác. Mặc dù đã có các chuẩn để hỗ trợ sự tin cậy khi tích
các mẫu thiết kế để giải quyết việc xử lý dữ liệu lớn và cho ra hợp các dịch vụ như WS-Coordination, WS-
kết quả gần như theo thời gian thực là một vấn đề cần giải AtomicTransaction và WS-BusinessActivity [83] việc hiện
quyết. thực hóa các chuẩn này thành các hệ thống nền tảng trung gian
Các ứng dụng đám mây thường tương tác và trao đổi một để giảm thời gian và chi phí cho các nhà phát triển trong việc
khối lượng lớn dữ liệu với nhau. Làm sao để việc trao đổi được hiện thực hóa các nghiệp vụ doanh nghiệp trong môi trường
tiến hành nhanh chóng với độ tin cậy cao, các lỗi có thể xảy ra đám mây vẫn chưa được thực hiện. Do vậy cần tìm kiếm mẫu
nằm trong sự kiểm soát, các thông tin không bị hỏng hay dư thiết kế để tích hợp các ứng dụng theo chuẩn, ví dụ như mẫu
thừa trong quá trình trao đổi cũng là một vấn đề cần giải quyết. thiết kế cho chuẩn quản lý giao dịch của ứng dụng đám mây
Ngoài ra các ứng dụng trình khách thường hạn chế về khả năng nhằm đạt được độ tin cậy về kết quả và sự toàn vẹn về dữ liệu.
lưu trữ và tính toán nên việc thiết kế hệ thống sao cho vừa tận
E. Mẫu thiết kế cho việc bảo mật ứng dụng
dụng được khả năng lưu trữ cục bộ vừa tận dụng được khả
năng lưu trữ không giới hạn của đám mây cũng là một vấn đề Mối quan tâm lớn nhất của các doanh nghiệp khi đưa ứng
cần giải quyết. dụng của mình lên đám mây là khả năng bảo mật thông tin do
trong môi trường đám mây các hệ thống luôn mở với người
D. Mẫu thiết kế cho việc tích hợp giữa các ứng dụng cung cấp dùng cuối thông qua các giao diện người dùng trên web hay
như dịch vụ các dịch vụ web. Ngoài ra bảo mật cho ứng dụng trong môi
Mỗi ứng dụng, đặc biệt là ứng dụng doanh nghiệp luôn hiện trường đám mây thường đòi hỏi tuân theo các chuẩn nhằm hỗ
thực hóa một số các quy trình nghiệp vụ đặc thù. Các quy trình trợ cho việc tích hợp các dịch vụ đám mây. Nếu dịch vụ đám
này thường được tích hợp với nhau để thực hiện một quy trình mây là dịch vụ đa người thuê, bảo mật cho ứng dụng còn cần
lớn hơn. Việc tích hợp có thể được thực hiện trong cùng một hệ đảm bảo sự cách ly giữa các người thuê khác nhau.
thống bằng cách sử dụng các ngôn ngữ thực thi quy trình như Hầu hết các ứng dụng hiện tại sử dụng các cơ chế chứng
Web Services Business Process Execution Language (BPEL) thực đơn giản dễ bị tấn công bởi các dạng tấn công nghe trộm
[83] và các động cơ xử lý ngôn ngữ thực thi quy trình [55]. và mô phỏng. Dịch vụ mạng là công nghệ được sử dụng phổ
Việc tích hợp có thể được thực hiện giữa các hệ thống khác biến hiện nay. Để đảm bảo sự bảo mật cho các dịch vụ web
nhau, cụ thể hơn là các hệ thống cung cấp dạng dịch vụ trong đồng thời giúp các dịch vụ web tương tác được với nhau, nhiều
trong môi trường đám mây. Sự tích hợp giữa các hệ thống khác chuẩn đã được phát triển và áp dụng. Chuẩn WS-Policy mô tả
nhau đảm bảo việc tận dụng tối đa việc tái sử dụng khả năng văn phạm để biểu diễn các chính sách khác nhau của một dịch
của từng hệ thống. Việc tích hợp giữa các hệ thống có thể được vụ web và kết hợp giữa chúng. WS-Policy là nền tảng để mô tả
thực hiện ở nhiều mức độ khác nhau bằng cách sử dụng các các chuẩn khác. Chuẩn WS-Security sử dụng các mô hình bảo
dịch vụ mạng (web service) hay mashups [75] hay các ngôn mật có sẵn như Kerberos [68] hoặc X509. Chuẩn này đặc tả
ngữ thực thi quy trình với các hệ thống trung gian. cách sử dụng các mô hình đó sao cho các dịch vụ web có thể
Ở góc độ thiết kế việc tích hợp giữa các ứng dụng khác tương tác đồng nhất với nhau.
nhau có thể được thực hiện dựa vào các mẫu thiết kế tích hợp Bảo mật được xây dựng trên mối quan hệ tin cậy được định
dạng truyền tải thông điệp như Message Bus [50]. Tuy nhiên nghĩa trước. Kerberos bảo mật được bởi vì các thành viên tham
các mẫu thiết kế này quá tổng quát chưa giải quyết cụ thể các gia tin tưởng vào một trung tâm phân phối khóa (Kerberos Key
yêu cầu đặc thù trong đám mây như đồng bộ hóa dữ liệu giữa Distribution Center). Public Key Infrastructure (PKI) [1] bảo
ứng dụng di dộng và nhiều nơi lưu trữ trong đám mây, đảm bảo mật được bởi vì các thành viên tin tưởng vào các nhà cấp
tính toàn vẹn của dữ liệu khi di chuyển trong đám mây, khả chứng chỉ gốc (Root Certificate Authorities). Chuẩn WS-Trust
năng tích hợp khối lượng dữ liệu cự kỳ lớn. Trong [62] các tác đưa ra một mô hình mở rộng để thiết lập và kiểm tra các mối
giả đã đề xuất một số mẫu thiết kế đồng bộ hóa dữ liệu cho ứng quan hệ tin cậy giữa các dịch vụ web. Chuẩn WS-Federation
dụng di động như Full Transfer, Timestamp Transfer, cho phép một nhóm các tổ chức thiết lập một vùng bảo mật ảo.
Mathematical Transfer. Chuẩn WS-SecureConversation được xây dựng trên nền của
Một trong những khó khăn khi tích hợp các ứng dụng là các chuẩn WS-Security, WS-Trust, và WS-Policy nhằm cung
giải quyết các vấn đề không tương thích, trùng lắp về dữ liệu cấp sự tương tác và trao đổi dữ liệu bảo mật cho các dịch vụ
và chức năng của các ứng dụng. Hiện nay các nền tảng đám web [83]. XML Signature bảo vệ các phần của một tài liệu
mây tập trung rải rác ở nhiều nhà cung cấp và tổ chức khác XML khỏi sự chỉnh sửa trái phép bằng cách sử dụng chữ ký
215
215
HộiHội
điện tử. Thuật toán cho chữ ký có thể sử dụng hệ thống bảo thuê khác, đặc biệt là khi hệ thống đang vận hành. Do vậy để
mật đối xứng như (Triple DES hoặc AES) hoặc bất đối xứng xây dựng hệ thống đa người thuê đáp ứng tốt khả năng mở
như RSA hoặc DSA. XML Encryption mã hóa các phần của rộng các nhà thiết kế cần đưa ra các mẫu thiết kế quản lý trạng
một tài liệu XML. thái của ứng dụng khi ứng dụng được triển khai ở nhiều cụm
Các chuẩn bảo mật cho dịch vụ web thường phức tạp và dài máy chủ, mẫu thiết kế theo dõi và quản lý việc tăng giảm tài
dòng gây khó khăn cho các kiến trúc sư hay nhà phát triển nguyên đối với từng người thuê khi hệ thống đang vận hành.
trong việc áp dụng và kiểm tra chúng. Trong [2, 3] các tác giả G. Mẫu thiết kế cho ứng dụng cung cấp như dịch vụ
mô tả lại các chuẩn dưới dạng mẫu nhằm giúp các nhà phát
triển hiểu các chuẩn một cách dễ dàng hơn đồng thời cung cấp Phần mềm cung cấp như dịch vụ là một mô hình dịch vụ
khả năng so sánh và kiểm tra xem một ứng dụng có đáp ứng trong đó các khả năng của hệ thống được cung cấp đến người
một chuẩn bảo mật nào đó không. dùng bằng việc sử dụng trực tiếp ứng dụng của nhà cung cấp
trong môi trường đám mây [63].
Đăng nhập và chứng thực một lần là nhu cầu thiết yếu khi
sử dụng các dịch vụ. Chuẩn Security Assertion Markup Phần mềm cung cấp như dịch vụ xuất hiện từ những ngày
Language (SAML) được đưa ra bởi tổ chức OASIS đã giải đầu của internet. Một số nhà cung cấp ứng dụng như dịch vụ
quyết vấn đề này [25]. Giao thức OAuth 2.0 [47] là một giao (Application Service Provider – ASP) đã đóng gói các sản
thức phân quyền mở và chuẩn hóa cho phép người dùng cấp phẩm của mình, cài đặt trong trung tâm dữ liệu của mình và
quyền cho các ứng dụng bên thứ ba truy cập có giới hạn vào cho phép người dùng truy cập chúng thông qua internet. Tuy
các tài nguyên của mình tại một nơi lưu trữ. Giao thức cho nhiên làn sóng ASP đầu tiên thất bại vì cơ sở hạ tầng cho
phép cấp quyền mà không chia sẻ các thông tin bảo mật lâu đường truyền internet còn chưa đáp ứng được nhu cầu người
dài như mật khẩu đồng thời cho phép người dùng hủy việc cấp dùng về băng thông, người dùng phải sử dụng phương pháp
phép khi cần thiết. OAuth 2.0 cũng có thể được sử dụng cho truy cập bàn điều khiển từ xa (remote desktop) để thao tác với
việc đăng nhập một lần. ứng dụng và giá thành không rẻ hơn nhiều so với ứng dụng
truyền thống.
Các vấn đề chưa giải quyết trong lĩnh vực này là thể hiện
toàn bộ các chuẩn dưới dạng mẫu thiết kế nhằm giúp các nhà Không như làn sóng ASP đầu tiên các nhà cung cấp phần
mềm như dịch vụ thế hệ tiếp theo như Google hay Salesforce
phát triển dễ dàng áp dụng chúng trong hệ thống của mình và
sử dụng hoàn toàn kiến trúc nền tảng web, tận dụng tối đa hạ
hiện thực hóa chúng một cách đúng đắn [54, 78], đồng thời tầng chung cho nhiều người dùng để giảm giá thành. Dưới góc
cũng cần thiết đưa ra các mẫu thiết kế nhằm hướng dẫn áp nhìn của một khách hàng khi sử dụng phần mềm cung cấp như
dụng các thuật toán bảo mật mới trong các hoàn cảnh đặc thù dịch vụ người dùng chỉ cần có một thẻ ghi nợ (credit card) và
nhằm đảm bảo vấn đề bảo mật cho hệ thống. một trình duyệt để đăng ký sử dụng phần mềm. Sau đó người
F. Mẫu thiết kế kế cho việc mở rộng khả năng tải của ứng dùng truy cập và hiệu chỉnh lại phần mềm theo nhu cầu của
dụng mình và có thể bắt đầu sử dụng cho công việc của mình. Điểm
nhấn mạnh ở đây là khách hàng không cần các bộ phận chuyên
Đối với các ứng dụng đám mây yêu cầu về năng lực xử lý trách về công nghệ thông tin để có sản phẩm sử dụng, không lo
của hệ thống luôn tăng theo cùng số lượng người dùng. Vì vậy lắng về vấn đề cập nhập và bảo trì phần mềm [75].
là khả năng mở rộng (scalabilty) của ứng dụng nhằm đảm bảo
cho hệ thống vẫn hoạt động tốt khi dữ liệu xử lý tăng lên là yêu Các giải pháp cung cấp như dịch vụ được quan tâm bởi
cầu tiên quyết. Hệ thống cũng cần có khả năng giảm năng lực chúng mang lại sự đơn giản trong việc sở hữu, vận hành và bảo
xử lý khi dữ liệu cần xử lý giảm xuống để tiết kiệm chi phí. trì sản phẩm kèm theo khả năng giảm chi phí to lớn cho doanh
Việc tăng giảm tài nguyên này cần được thực hiện một cách nghiệp so với phần mềm truyền thống [81]. Vấn đề chưa giải
liền mạch để không ảnh hưởng đến hoạt động của hệ thống. quyết trong lĩnh vực này là đưa ra các mẫu kiến trúc để xây
dựng các hệ thống SaaS cho các miền ứng dụng khác nhau như
Trong [6] các tác giả giới thiệu 5 mẫu thiết kế để mở rộng ngân hàng, bệnh viện, bảo hiểm, trường học, học tập điện tử (e-
các ứng dụng đám mây bao gồm: Single Platform, Shared learning).
Platform, Clustered Platform, Multiple Shared Platforms,
Multiple Clustered Platforms. Các mẫu thiết kế này chỉ tập
IV. MẪU THIẾT KẾ CHO ỨNG DỤNG ĐA NGƯỜI
trung vào khía cạnh triển khai hệ thống mà không tập trung vào
THUÊ
khía cạnh thiết kế và xây dựng hệ thống.
Để đạt được mục tiêu giảm chi phí, các giải pháp cung cấp
Trong [85] tác giả giới thiệu các mẫu thiết kế Horizontally như dịch vụ thường được thiết kế theo mô hình đa người thuê.
Scaling Compute tập trung vào việc mở rộng tính toán bằng Đa người thuê là một mô hình trong đó nhiều doanh nghiệp sử
cách xây dựng các cụm tính toán tự trị và phi trạng thái dựa dụng chung một nền tảng, chia sẻ chung nơi lưu trữ dữ liệu và
trên các dịch vụ đám mây để giảm sự phức tạp trong triển khai có khả năng cấu hình lại giải pháp [59]. Có thể nói mô hình
và quản lý các cụm tính toán. này là một điểm đặc trưng nổi bật để phân biệt giữa một phần
Khó khăn khi xây dựng hệ thống có khả năng mở rộng là mềm trong môi trường đám mây với một phần mềm truyền
quản lý trạng thái của ứng dụng sao cho khi áp dụng cân bằng thống. Mô hình đa người thuê được phân thành các nhóm chính
tải (load balancing) người dùng luôn truy cập được trạng thái sau [41, 66]:
ứng dụng của phiên làm việc trước. Ngoài ra dữ liệu của các
người thuê cũng cần được thiết kế một cách hợp lý để có thể
mở rộng cho người thuê này mà không ảnh hưởng đến người
216
216
HộiHội
ThảoThảo Quốc
Quốc Gia
2015 ĐiệnTử,
Tử,Truyền
TruyềnThông
Thông và
và Công
CôngNghệ
NghệThông
ThôngTinTin
(ECIT 2015)
(ECIT 2015)
 Hệ thống không có khả năng cấu hình và một hệ thống khách hàng; hệ thống cần được thiết kế với khả năng biến thiên
được triển khai dùng chung cho nhiều người thuê để thỏa mãn các yêu cầu về dữ liệu và quy trình nghiệp vụ khác
(single instance service). nhau của các khách hàng khác nhau; hệ thống cần có khả năng
mở rộng hay thu hẹp một cách linh động tùy theo số lượng
 Hệ thống không có khả năng cấu hình và mỗi người người thuê nhằm giảm thiểu chi phí phần cứng; hệ thống cần
thuê sử dụng một hệ thống được triển khai riêng cho khả năng vận hành trên nhiều cụm máy chủ khác nhau cùng
mình (multiple instances service). khả năng chuyển đổi giữa các cụm khi xảy ra sự cố; hệ thống
 Hệ thống có khả năng cấu hình và một hệ thống được cần cho phép người thuê đo lường các yêu cầu phi chức năng
triển khai dùng chung cho tất cả các người thuê (single mà hệ thống cung cấp tại bất kỳ thời điểm nào [73].
arbitrary arbitrary instance service). A. Mẫu thiết kế kiến trúc cho phần mềm đa người thuê
 Hệ thống có khả năng cấu hình và mỗi người thuê sử Một trong những khó khăn khi xây dựng phần mềm đa
dụng một hệ thống được triển khai riêng cho mình người thuê là kiến trúc tổng thể của hệ thống. Kiến trúc này là
(multiple configurable instances service). chìa khóa để hiện thực hóa các ứng dụng đa người thuê. Mục
tiêu chính của kiến trúc này là làm sao để cách ly các người
 Ngoài ra có thể kết hợp 2 mô hình không cấu hình với thuê với nhau để họ không bị ảnh hưởng bởi nhau về mặt dữ
nhau hoặc 2 mô hình cấu hình với nhau để tạo thành liệu, bảo mật, độ tin cậy cũng như quy trình nghiệp vụ. Nhiều
các mô hình tự do (arbitrary instances service). nhà nghiên cứu đã đề xuất các kiến trúc để giải quyết khó khăn
Hình 3 mô tả kiến trúc chung của các sản phẩm cung cấp này.
như dịch vụ cho đa người thuê dạng có khả năng cấu hình và Frederick Chong và Gianpaolo Carraro liệt kê các thành
một hệ thống được triển khai cho tất cả các người thuê [75]. phần cơ bản của kiến trúc đa người thuê bao gồm tầng lưu trữ,
Một sản phẩm cung cấp như một dịch vụ được sử dụng bởi tầng dịch vụ nghiệp vụ, tẩng dịch vụ quy trình, tầng giao diện,
nhiều khách hàng (người thuê) A, B, C. Các khách hàng chia tầng dịch vụ bảo mật và tầng siêu dữ liệu [41].
sẻ chung một mã nguồn. Mỗi khách hàng có dữ liệu riêng của
mình và có thể cấu hình lại hệ thống thông qua các siêu dữ Guo và các cộng sự đề xuất mô hình để phát triển các ứng
dụng đa người thuê trong trong đó việc việc thực thi và quản lý
liệu (dữ liệu cấu hình). Các hệ thống đa người thuê giảm tối đa
được cách ly bằng cách hạn chế người dùng đến một phần của
chi phí để sở hữu và vận hành hệ thống. Một ví dụ cho thấy là cấu trúc thư mục bằng các mô hình bảo mật hệ thống đặc thù
khi hệ thống cần nâng cấp một tính năng, trong môi trường đa của nền tảng phát triển [46].
người thuê do chỉ có một mã nguồn và dữ liệu được triển khai
trên một hệ thống nên chi phí giảm đi rất nhiều so với việc cập Ralph Mietzner giới thiệu và đánh giá các mẫu thiết kế
nhập nhiều hệ thống cho từng khách hàng theo cách truyền Single instance service, Single configurable instance service và
thống [75]. Multiple instances service. Các tác giả mô tả làm thế nào để
các dịch vụ giữa các người thuê. Các mẫu thiết kế này có thể
áp dụng để thiết kế, phát triển và triển khai các ứng dụng đa
người thuê [66]. Ngoài ra các tác giả còn thể hiện phương
pháp tích hợp các dịch vụ dựa trên thông tin người thuê bằng
cách truyền thông tin người thuê hiện hành vào các thành phần
dịch vụ đang được kích hoạt.
Weissman và Bobrowski mô tả thiết kế của Force.com, một
trong những doanh nghiệp đi tiên phong trong mô hình đa
người thuê. Force.com sử dụng kiến trúc trên nền tảng siêu dữ
liệu. Các siêu dữ liệu này được dùng để định nghĩa và lưu trữ
Hình 3 – Kiến trúc của phần mềm đa người thuê [75] dữ liệu cho ứng dụng đa người thuê [84].
Một kiến trúc sơ bộ cho đa người thuê được giới thiệu trong
Mục tiêu chính của hệ thống đa người thuê là giảm chi phí
[12], trong đó các tác giả cho rằng sự định danh, cấu hình và cơ
bằng cách tối đa hóa việc chia sẻ tài nguyên. Khi chia sẻ tài
sở dữ liệu là các thành phần chính của ứng dụng đa người thuê.
nguyên hệ thống cần đảm bảo dữ liệu của từng người thuê phải
được bảo mật và cách ly; tốc độ thực thi của các người thuê Một kiến trúc để hiện thực hóa đa người thuê cho nền tảng
phải được cách ly hay nói cách khác tốc độ khi sử dụng hệ hướng dịch vụ được giới thiệu trong [8]. Afkham và các cộng
thống của người thuê này không được ảnh hưởng đến tốc độ sử sự cho rằng việc cấu hình, phân phối thông điệp, bảo mật, thực
dụng hệ thống của người thuê khác; việc thực thi công việc của thi dịch vụ và truy cập dữ liệu là các khía cạnh chính một ứng
từng người thuê phải được cách ly hay nói cách khác luồng dụng đa người thuê cần có.
thực thi của các người thuê phải độc lập, kết quả của người
thuê này không ảnh hưởng đến kết quả của người thuê khác Việc xây dựng các ứng dụng đa người thuê từ đầu đòi hỏi
[69]. nhiều thời gian và công sức. Tập trung vào khía cạnh bảo mật
của hệ thống [4] giới thiệu kiến trúc quản lý bảo mật đa người
Ngoài ra khi xây dựng các hệ thống đa người thuê cần đảm thuê cho phép các nhà cung cấp dịch vụ tái sử dụng các giao
bảo hệ thống có khả năng xử lý dữ liệu lớn hơn nhiều so với diện lập trình bảo mật có sẵn khi phát triển một ứng dụng đa
các hệ thống cho một khách hàng; hệ thống cần có khả năng người thuê mới. Kiến trúc này cũng cho phép có thể điều chỉnh
tích hợp với nhiều hệ thống truyền thống khác nhau của các lại các yêu cầu về bảo mật và “tiêm” (inject) một đoạn mã
217
217
Hội Hội
nguồn vào ứng dụng tại thời điểm đang chạy để hiện thực hóa Tính biến thiên cần được mô hình và quản lý ở góc độ vấn
yêu cầu mới này. Các tác giả ứng dụng mẫu thiết kế quản lý đề (hay cụ thể hơn là yêu cầu) và góc độ giải pháp [74]. Các
đảo ngược (inversion of control) hoặc khả năng lập trình hướng giải pháp cho tính biên thiên tập trung ở khả năng cấu hình
khía cạnh để hiện thực hóa kiến trúc này. (configuration), hiệu chỉnh (customization) và triển khai hệ
thống (provision, deployment). Cấu hình là khả năng thay đổi
Việc phân phối tài nguyên đến từng người thuê một cách hành vi của hệ thống dựa trên các thiết lập được định nghĩa
tối ưu hóa là một vấn đề cần được quan tâm. Hệ thống chưa sẵn. Cấu hình được thực hiện khi hệ thống đang vận hành. Các
được tối ưu hóa nếu một người thuê có số người dung là 100 thiết lập cho cấu hình được xác định trước khi triển khai hệ
được phân phối số tài nguyên bằng với một người thuê có số thống hoặc dựa vào các siêu dữ liệu trong quá trình vận hành.
người dùng là 10000. Trong [34] các tác giả trình bày một Hiệu chỉnh là khả năng thay đổi hành vi của hệ thống dựa trên
khung ứng dụng cho phép tối ưu hóa sự phân bổ các yêu cầu việc thay đổi hay thêm một số thành phần của hệ thống. Hiệu
của các người thuê đến các tài nguyên hệ thống bằng cách sử chỉnh được thực hiện trước khi hệ thống đưa vào triển khai.
dụng thuật toán tôi luyện thép.
Cấu hình thường được sử dụng để hỗ trợ sự thay đổi thông
Các hệ thống đa người thuê rất phong phú và đa dạng, yêu qua các tham số được định nghĩa trước cho mô hình dữ liệu,
cầu thay đổi tùy theo từng tổ chức. Ví dụ rất nhiều tổ chức quy tắc nghiệp vụ hay giao diện. Hiệu chỉnh thường được sử
cùng cần hệ thống quản trị dự án với các yêu cầu về quy trình dụng để hỗ trợ sự thay đổi của những phần cốt lõi của phần
đặc thù cho tổ chức của mình; các nhà cung cấp phần mềm mềm mà khó có thể được thực hiện bằng cấu hình. So với cấu
dịch vụ cần xây dựng hệ thống quản trị dự án đa người thuê hình thì hiệu chỉnh thường tốn nhiều chi phí và thời gian hiện
cho các tổ chức đó. Hay như nhiều trường đại học cùng cần hệ thực hóa cũng như bảo trì hơn [80]. Hình 4 trình bày phân loại
thống học tập điện tử với các yêu cầu đặc thù cho từng trường; của tính biến thiên trong môi trường đa người thuê.
các nhà cung cấp phần mềm dịch vụ cần xây dựng hệ thống
học tập điện tử đa người thuê cho các trường đại học. Để xây Mô hình hóa yêu cầu về tính biến thiên của một hệ thống và
dựng những hệ thống như vậy đòi hỏi các mẫu thiết kế kiến kỹ thuật quản lý chúng được giới thiệu trong [65]. Trong đó tác
trúc đa người thuê đặc thù cho lĩnh vực mà tổ chức quan tâm. giả áp dụng các kỹ thuật của kỹ nghệ sản phẩm phần mềm
Do vậy thể hiện kiến trúc đa người thuê cho các lĩnh vực đặc dòng để giải quyết vấn đề quản lý các yêu cầu biến thiên của
thù ví dụ như hệ thống bảo mật thông điệp, hệ thống quản lý dự ứng dụng cung cấp như dịch vụ.
án, học tập điện tử, ngân hàng, bảo hiểm, quản lý doanh nghiệp
là vấn đề cần được giải quyết. Trong [74] các tác giả mô tả quy trình để mô hình khả năng
cấu hình về tính năng và yêu cầu chất lượng của một hệ thống
B. Mẫu thiết kế cho tính biến thiên của phần mềm đa người trong đám mây bằng cách sử dụng mô hình tính tăng mở rộng
thuê (extended feature model) của kỹ nghệ phần mềm dòng.
Tính biến thiên được nghiên cứu và sử dụng nhiều trong kỹ
nghệ phần mềm dòng (software product line engineering) ở
nhiều công đoạn khác nhau trong quá trình phát triển phần
mềm như phân tích yêu cầu, thiết kế, hiện thực hóa, kiểm thử
và ở nhiều mức độ trừu tượng khác nhau như mô hình yêu cầu,
mô hình thiết kế, hệ thống đã được hiện thực hóa, kết quả kiểm
thử [57].
Khi xây dựng các phần mềm đa người thuê, các hệ thống
cần phải thỏa mãn các yêu cầu khác nhau của nhiều người thuê
và yêu cầu của môi trường phát triển đặc thù như Amazon1,
Azure2 hay Google Application Engine3. Điều này đòi hỏi các
phần mềm cần được thiết kế một cách linh động, dễ cấu hình,
hay nói cách khác là phải thỏa mãn các yêu cầu khác nhau của Hình 4 – Tính biến thiên trong môi trường đa người thuê.
các khách hàng khác nhau. Nói cách khác phần mềm đa người
thuê cần phải có tính biến thiên. Các giải pháp cho khả năng cấu hình của phần mềm đa
Tính biến thiên của phần mềm có thể được định nghĩa như người thuê tập trung vào khả năng thay đổi dữ liệu cho phù hợp
khả năng của một hệ thống hay sản phẩm phần mềm có thể mở với các người thuê khác nhau, khả năng thay đổi chức năng hay
rộng, thay đổi, cấu hình hoặc hiệu chỉnh một cách hiệu quả để hành vi cho phù hợp với các quy trình nghiệp vụ khác nhau.
có thể sử dụng trong một hoàn cảnh đặc thù [67]. Sự biến thiên Hình 5 trình bày phân loại của các giải pháp cho tính biến thiên
của phần mềm có thể xảy ra ở dữ liệu của hệ thống, ở tính năng của dữ liệu và chức năng trong môi trường đa người thuê dựa
của hệ thống, ở luồng nghiệp vụ, ở công nghệ sử dụng, ở mục trên cấu hình.
tiêu chất lượng đối với hệ thống hay ở môi trường triển khai hệ Frederick Chong và Gianpaolo Carraro giới thiệu các
thống [35]. phương pháp để cô lập và mở rộng dữ liệu của các người thuê
khác nhau trong hệ quản trị cơ sở dữ liệu quan hệ bao gồm kỹ
thuật sử dụng một sơ đồ dữ liệu chung (single schema model)
[41]. Khi sử dụng một sơ đồ dữ liệu chung mỗi dòng dữ liệu
1
http://aws.amazon.com của một bảng được gắn kết với một người thuê nhất định thông
2
3
http://www.windowsazure.com/en-us qua định danh người thuê, các trường mở rộng của mỗi bảng có
https://appengine.google.com
218
218
HộiHội
Thảo Quốc
Thảo Gia
Quốc 2015
ĐiệnTử,
Tử,Truyền
NghệThông
ThôngTinTin (ECIT
(ECIT 2015)
2015)
thể là một tập hợp cố định các trường định nghĩa trước hoặc có Việc hiện thực hóa các yêu cầu biến thiên về tính năng cho
thể là một tập hợp vô hạn các cặp tên và giá trị trong một bảng ứng dụng đa người thuê có thể được thực hiện bằng cách sử
khác. dụng một kiến trúc dành cho việc phát triển các ứng dụng tự
điều chỉnh (dynamically adaptive applications) [73]. Kiến trúc
này bao gồm một siêu mô hình để định nghĩa các thành phần,
một ngôn ngữ để diễn tả các thành phần và một động cơ để
chạy các ứng dụng phát triển dựa trên kiến trúc này. Các ứng
dụng được phát triển dựa trên bộ khung này sẽ tự điều chỉnh ở
trạng thái thực thi dựa trên cấu hình của từng người thuê cũng
như yêu cầu của họ. Các yêu cầu khác nhau của từng người
thuê được định nghĩa dựa trên cấu hình người thuê.
Stefan Walraven và các cộng sự giới thiệu cách xử lý các
yêu cầu khác nhau của những người thuê khác nhau bằng cách
kết hợp việc nội xạ sự phụ thuộc (dependency injection) với
Hình 5 – Các giải pháp cho tính biến thiên của dữ liệu và chức năng trong các hệ thống nền tảng trung gian hỗ trợ việc cách ly dữ liệu các
môi trường đa người thuê. người thuê [82]. Việc tùy chỉnh phần mềm theo các yêu cầu
khác nhau của từng người thuê được thực hiện thông qua việc
Để giải quyết tính biến thiên của dữ liệu trong quá trình nhận các cấu hình của từng người thuê trong cơ sở dữ liệu, sau
thực thi của phần mềm [7] giới thiệu kỹ thuật Chunk Folding, đó từng thành phần của phần mềm cho từng tính năng yêu cầu
trong đó các bảng dữ liệu được phân ra thành các bảng thông được khởi tạo và ánh xạ vào từng phần thực thi của hệ thống sử
thường chứa các dữ liệu chung, đặc thù cho ứng dụng và các dụng nội xạ sự phụ thuộc.
bảng rải rác (chunking) chứa các dữ liệu riêng cho từng người
thuê. Kỹ thuật này được hiện thực hóa trên nền của các hệ quản Eddy Truyen và các cộng sự giới thiệu cách tùy chỉnh ứng
trị cơ sở dữ liệu quan hệ. Các tác giả cũng xây dựng ngôn ngữ dụng đa người thuê bằng cách sử dụng các tính năng đặc biệt
để truy vấn thông tin khi sử dụng kỹ thuật này. Điểm yếu của của các ngôn ngữ lập trình hướng hoàn cảnh [49, 80].
kỹ thuật này là tính cục bộ (ad-hoc) và sự phức tạp khi truy vấn Tình biến thiên cho các yêu cầu về triển khai cho từng
thông tin. Để ứng dụng kỹ thuật này các hệ thống phải thay đổi người thuê tùy theo các điều khoản của hợp đồng về dịch vụ
hoàn toàn cách truy cập cơ sở dữ liệu của mình. hoặc triển khai một phần mềm được hiệu chỉnh cho từng người
Weissman và Bobrowski mô tả thiết kế của Force.com, một thuê có thể được hiện thực bằng ngôn ngữ thực thi quy trình
trong những doanh nghiệp đi tiên phong trong mô hình đa [32], hoặc kỹ nghệ hướng mô hình [29, 38].
người thuê. Force.com sử dụng kiến trúc trên nền tảng siêu dữ Các công trình trên đã giải quyết tính biến thiên của một số
liệu. Tính biến thiên về dữ liệu được xử lý bằng cách dùng các khía cạnh trong ứng dụng đa người thuê như dữ liệu, luồng
siêu dữ liệu để mô tả dữ liệu người thuê [84]. Tương tự như kỹ công việc. Tuy nhiên các hệ thống đa người thuê hiện tại
thuật sử dụng siêu dữ liệu Gautam Shroff mô tả kỹ thuật sử thường phân thành nhiều tầng như giao diện, nghiệp vụ và dữ
dụng nhiều sơ đồ (multiple schemas) trong đó mỗi người thuê liệu. Sự thay đổi của một tầng sẽ kéo theo sự thay đổi của các
được gắn kết với một sơ đồ dữ liệu nhất định. Sơ đồ này được tầng phụ thuộc. Thực hiện các yêu cầu về mở rộng một cách
định nghĩa bằng thông tin siêu dữ liệu [75]. đồng nhất trong quá trình thực thi vẫn chưa được giải quyết
Một kỹ thuật khác để xử lý tính biến thiên của dữ liệu là tận triệt để; vẫn chưa có các mẫu thiết kế giúp đạt được các tính
dụng các dịch vụ lưu trữ không quan hệ trong môi trường đám biến thiên của ứng dụng một cách đồng nhất ở thời điểm thực
mây (cloud data store) [75]. thi nhằm đáp ứng nhu cầu nghiệp vụ khác nhau của mỗi doanh
nghiệp khác nhau. Hay nói một cách khác là vẫn chưa có các
Trong [32] tác giả đề xuất phương pháp hiện thực tính biến mẫu thiết kế để xây dựng các ứng dụng tự điều chỉnh (adaptive
thiên về dữ liệu bằng cách sử dụng mẫu thiết kế Variable Data SaaS software).
Component, trong đó dữ liệu của mỗi thực thể được gắn kết với
một danh sách không định kiểu. Mỗi đối tượng trong danh sách V. CÔNG TRÌNH LIÊN QUAN
này được xác định thông qua một khóa duy nhất. Trong trường
Tìm hiểu về mẫu thiết kế cho điện toán đám mây chỉ mới
hợp các dữ liệu này được xử lý không thông qua các hàm nhập
được thực hiện bởi [33]. Trong báo cáo này các tác giả đề xuất
xuất cơ bản (tạo, cập nhập, xóa, trả về thông tin), nhà phát triển
quy trình để tìm kiếm mẫu thiết kế cho điện toán đám mây, đề
cần tạo các hàm xử lý đặc thù cho chúng.
xuất cách mô tả các mẫu thiết kế và thảo luận một số lĩnh vực
Để đạt được tính biến thiên về chức năng Fehling đề xuất áp dụng. Tuy nhiên các tác giả chỉ nêu lên các vấn đề chung
xây dựng các chức năng cơ bản sau đó sử dụng các ngôn ngữ cần giải quyết của điện toán đám mây mà chưa đi sâu vào việc
thực thi quy trình, ví dụ như BPEL [55], để gắn các chức năng phát triển phần mềm trong môi trường đám mây; các mẫu thiết
với nhau [32]. kế cho từng vấn đề cụ thể cũng chưa được khảo sát; các công
trình được khảo sát chưa bao quát đầy đủ các lĩnh vực chính
Thiết kế và hiện thực hóa một động cơ thực thi các luồng và phân loại một cách hệ thống; các vấn đề nghiên cứu còn tồn
công việc cho đa người thuê được giới thiệu trong [69]. Động đọng cũng chưa được đề cập.
cơ này cho phép nhiều người thuê cùng chạy các luồng công
việc của mình trên cùng một động cơ. Công trình này cũng sử
dụng BPEL làm ngôn ngữ thực thi quy trình.
219
219
Hội Hội
Thảo Quốc
Thảo GiaGia
2015 ĐiệnTử,
Tử,Truyền
TruyềnThông
ThôngTinTin (ECIT
(ECIT 2015)
2015)
VI. KẾT LUẬN VÀ TẦM NHÌN [13] William J. Brown, Raphael C. Malveau, Hays W. McCormick III, and
Thomas J. Mowbray, AntiPatterns - Refactoring Software, Architectures,
Trong bài báo này chúng tôi đã trình bày nguyên nhân cần and Projects in Crisis.: Wiley, New York, 1998.
nghiên cứu mẫu thiết kế cho việc phát triển phần mềm trong [15] Frank Buschmann, Kevlin Henney, and Douglas C. Schmidt, Pattern-
môi trường đám mây. Chúng tôi tổng kết các nghiên cứu về Oriented Software Architecture: A Pattern Language for Distributed
mẫu thiết kế cho việc phát triển phần mềm trong môi trường Computing., 2007.
đám mây. Cụ thể là các vấn đề mà các nhà nghiên cứu công [16] Frank Buschmann, Regine Meunier, Hans Rohnert, Peter Sommerlad,
nghệ phần mềm quan tâm khi phát triển ứng dụng trong môi and Michael Stal, Pattern-Oriented Software Architecture: A System of
trường đám mây như xây dựng phần mềm hệ thống và phần Patterns., 1996.
mềm nền tảng, xử lý dữ liệu lớn, quản lý bảo mật, xây dựng và [17] Rajkumar Buyya, James Broberg, and Andrzej Goscinski, Cloud
tích hợp các phần mềm cung cấp như dịch vụ, phát triển phần Computing: Principles and Paradigms., 2011.
mềm đa người thuê, xử lý tính biên cho ứng dụng đa người [18] Rajkumar Buyya, Chee Shin Yeo, and Srikumar Venugopal, Market-
thuê. Chúng tôi đi sâu vào các khó khăn khi phát triển ứng Oriented Cloud Computing: Vision, Hype, and Reality for Delivering IT
Services as Computing Utilities., 2008.
dụng trong môi trường đám mây và đề xuất các vấn đề nghiên
cứu cho từng lĩnh vực. Hình 1, 2, 4 và 5 cung cấp góc nhìn [19] Antonio Celesti, "How to Enhance Cloud Architectures to Enable Cross-
Federation," in 2010 IEEE 3rd Int. Conf. on Cloud Computing, Miami,
tổng quan về các hướng nghiên cứu mà chúng tôi đã khảo sát. 2010.
Chúng tôi hy vọng rằng bài báo sẽ giúp các nhà nghiên cứu [20] Peter Coad, Object-oriented patterns., 1992.
về kỹ nghệ phần mềm cho đám mây có cái nhìn tổng quan về [21] James O. Coplien, Advanced C++ Programming Styles and Idioms.,
hiện trạng nghiên cứu, các vấn đề nghiên cứu, từ đó có thể lựa 1991.
chọn cho mình bài toán cụ thể để tiếp tục giải quyết nhằm góp [22] James O. Coplien, C++ Idioms., 1998.
phần cung cấp các kiến thức cho ngành kỹ nghệ phần mềm [23] James O. Coplien, Idioms and Patterns as Architectural Literature.,
trong môi trường đám mây. Trong tương lai chúng tôi sẽ tập 1997.
trung khảo sát hiện trạng các hướng nghiên cứu liên quan đến [24] James O. Coplien, Software Patterns., 1996.
mẫu thiết kế trong môi trường đám mây như kỹ nghệ hướng [25] Kelly D. Lewis and James E. Lewis, "Web Single Sign-On
mô hình, thiết kế phần mềm tự hiệu chỉnh, thiết kế phần mềm Authentication using SAML. 2009.," in IJCSI International Journal of
trong mạng lưới internet vạn vật. Computer Science Issues, 2009.
[26] Jeffrey Dean and Sanjay Ghemawat, "MapReduce: Simplified Data
TÀI LIỆU THAM KHẢO Processing on Large Clusters," in OSDI, San Francisco, 2004.
[27] Michael Stal, Hans Rohnert and Frank Buschmann Douglas Schmidt,
[1] Carlisle Adams and Steve Lloyd, Understanding PKI Concepts, "Pattern-Oriented Software Architecture, Patterns for Concurrent and
Standards, and Deployment Considerations Second Edition.: Addison Networked Objects," , 2000.
Wesley, 2002.
[28] Bill Dudney, Stephen Asbury, Joseph K. Krozak, and Kevin Wittkopf,
[2] Ola Ajaj and Eduardo B. Fernandez, "A pattern for the WS- J2EE Antipatterns.: Wiley, 2003.
SecureConversation standard for web services," in Pattern Languages of
Programs, Tucson, Arizona, 2012. [29] Brandtzæg Eirik, Sébastien Mosser, and Parastoo Mohagheghi,
"Towards CloudML, a Model-based Approach to Provision Resources in
[3] Ola Ajaj and Eduardo B. Fernandez, "A pattern for the WS-Trust the Clouds.," in ECMFA, 2012, pp. 18-27.
standard of web services," in Asian Conf. on Pattern Languages of
Programs, Tokyo, 2010. [30] Thomas Erl, SOA Design Patterns., 2009.
[4] Mohamed Almorsy, John Grundy, and Amani S. Ibrahim, "TOSSMA: A [31] Eric Evans, Domain-Driven Design: Tackling Complexity in the Heart of
Tenant-Oriented SaaS Security Management Architecture," in 5th IEEE Software. Boston: Addison Wesley, 2003.
Conference on Cloud computing, Hawaii, 2012. [32] Christoph Fehling, "An Architectural Pattern Language of Cloud-based
[5] Deepak Alur, John Crupi, and Dan Malks, Core J2EE™ Patterns: Best Applications," in Pattern Languages of Programs, Portland, 2011.
Practices and Design Strategies., 2001. [33] Christoph Fehling et al., "Capturing Cloud Computing Knowledge and
[6] Claudio A. Ardagna, Ernesto Damiani, Fulvio Frati, Davide Rebeccani, Experience in Patterns," in Proceedings of the 5th IEEE International
and Marco Ughetti, "Scalability Patterns for Platform-as-a-Service," in Conference on Cloud Computing, 2012, pp. 726 - 733.
2012 IEEE 5th Int. Conf. on Cloud Computing (CLOUD), Honolulu, [34] Christoph Fehling, Frank Leymann, and Ralph Mietzner, "A Framework
2012. for Optimized Distribution of Tenants in Cloud Applications," in 3rd
[7] Stefan Aulbach, "Multi-Tenant Databases for Software as a Service," in International Conference on Cloud Computing, 2010, pp. 252-259.
2008 ACM SIGMOD Int. Conf. on Management of data, 2008. [35] Bachmann Felix and Len Bass, "Managing Variability in Software
[8] Afkham Azeez et al., "Multi-Tenant SOA Middleware for Cloud Architectures," ACM SIGSOFT Software Engineering Notes, vol. 26, no.
Computing," in Cloud Computing (CLOUD), 2010 IEEE 3rd 3, pp. 126-132, 2001.
International Conference, pages 458 - 465, Miami, FL, 2010. [36] Eduardo B. Fernandez, "Patterns for Operating Systems Access Control,"
[9] Kent Beck, Using Pattern Languages for Object-Oriented Programs., in Procs. of PLoP 2002, 2002.
1987. [37] Eduardo B. Fernandez, Security Patterns in Practice: Designing Secure
[10] Michael Bell, SOA Modeling Patterns for Service-Oriented Discovery Architectures using Software Patterns. Chichester: Wiley, 2013.
and Analysis., 2010. [38] Nicolas Ferry, Alessandro Rossini, Franck Chauvel, Brice Morin, and
[11] Stephen P. Berczuk and Brad Appleton, Software Configuration Arnor Solberg, "Towards Model-driven Provisioning, Deployment,
Management Patterns: Effective Teamwork, Practical Integration., 2002. Monitoring, and Adaptation of Multi-Cloud Systems," in 6th
International Conference on Cloud Computing, 2013, pp. 887-894.
[12] Cor-Paul Bezemer and Andy Zaidman, "Multi-Tenant SaaS
Applications: Maintenance Dream or Nightmare," in IWPSE-EVOL '10 [39] Martin Fowler, Analysis patterns: reusable object models., 1997.
Proceedings of the Joint ERCIM Workshop on Software Evolution [40] Martin Fowler et al., Patterns of Enterprise Application Architecture.,
(EVOL) and International Workshop on Principles of Software Evolution 2002.
(IWPSE), pages 88 - 92, ACM New York, NY, USA, 2010. [41] Chong Frederick and Carraro Gianpaolo, "Architecture Strategies for
220
220
HộiHội Thảo
Thảo QuốcGia
Quốc Gia2015
2015về
về Điện
CôngNghệ
Thông (ECIT 2015)
(ECIT 2015)
Catching the Long Tail," , 2006. Variability Realization Techniques," Software: Practice and Experience,
[42] Borko Furht and Armando Escalante, Handbook of Cloud Computing. vol. 35, no. 8, pp. 705-754, 2005.
New York: Springer, 2010. [68] Clifford B. Neuman and Theodore Ts'o, "Kerberos: An Authentication
[43] Eric Gamma, Richard Helm, Ralph Johnson, and John Vlissides, Design Sewice for Computer Networks," IEEE Communications Magazine, pp.
Patterns: Elements of Reusable Object-Oriented Software.: Addison- 33-38, 1994.
Wesley, 1994. [69] Milinda Pathirage, Srinath Perera, Indika Kumara, and Sanjiva
[44] Sanjay Ghemawat, Howard Gobioff, and Shun-Tak Leung, "The Google Weerawarana, "A Multi-tenant Architecture for Business Process
File System," in ACM SIGOPS Operating Systems, 2003. Executions," in Web Services (ICWS), 2011 IEEE International
Conference, pages 121 - 128, Washington, DC, 2011.
[45] Ian Graham, A pattern language for web usability., 2003.
[70] George Reese, Cloud Application Architectures., 2009.
[46] Chang Jie Guo, Wei Sun, Ying Huang, Zhi Hu Wang, and Bo Gao, "A
framework for native multi-tenancy application development and [71] D. Riehle, "Composite Design Patterns," in OOPSLA ’97 Conference
management," in CEC/EEE 2007, Tokyo, 2007, pp. 551 - 558. Proceedings, published as ACM SIGPLAN Notices, 32(10):218–228,
October 1997. ACM Press, 1997.
[47] Dick Hardt, "The OAuth 2.0 Authorization Framework," 2012.
[72] Andreas Rüping, Where Code and Content Meet: Design Patterns for
[48] Keiko Hashizume, "Cloud Service Model Patterns," in Pattern Web Content Management and Delivery, Personalisation and User
Languages of Programs, Tucson, 2012. Participation., 2009.
[49] Robert Hirschfeld, Pascal Costanza, and Oscar Nierstrasz, "Context- [73] Julia Schroeter, Sebastian Cech, Sebastian Götz, Claas Wilke, and Uwe
oriented Programming," Journal of Object Technology, vol. 7, no. 3, Aßmann, "Towards Modeling a Variable Architecture for Multi-Tenant
2008. SaaS-Applications," in VaMoS, New York, 2012.
[50] Gregor Hohpe and Bobby Woolf, Enterprise Integration Patterns: [74] Julia Schroeter, Peter Mucha Marcel, and Malte Lochau, "Dynamic
Designing, Building, and Deploying Messaging Solutions., 2003. Configuration Management of Cloud-based Applications," in 16th
[51] Alex Holmes, Hadoop in Practice.: Manning Publications Co, 2012. International Software Product Line Conference, 2012, pp. 171-178.
[44] IDC. (2015, Sep.) IDC. [Online]. [75] Gautam Shroff, Enterprise Cloud Computing: Technology Architecture
http://www.idc.com/getdoc.jsp?containerId=prUS25732415 Applications.: Cambridge University Press, 2010.
[53] Michael Kircher and Prashant Jain, Pattern-Oriented Software [76] Konstantin Shvachko, Hairong Kuang, Sanjay Radia, and Robert
Architecture: Patterns for Resource Management., 2004. Chansler, "The Hadoop Distributed File System," in Mass Storage
[54] Somorovsky Juraj, Andreas Mayer, Jorg Schwenk, Marco Kampmann, Systems and Technologies (MSST), 2010 IEEE 26th Symposium, Incline
and Meiko Jensen, "On Breaking SAML: Be Whoever You Want to Be," Village, 2010.
in USENIX Security Symposium, 2012, pp. 397-412. [77] Elias Adriano Nogueira da Silva and Daniel Lucredio, "Software
[55] Matjaz B. Juric, Business Process Execution Language for Web Engineering for the Cloud: A Research Roadmap," in Software
Services.: Packt Publishing, 2006. Engineering(SBES), 2012 26th Brazilian Symposium on Computing &
Processing (Hardware and Software), Natal, 2012.
[56] Matjaz B. Juric, Ramesh Loganathan, Poornachandra Sarang, and Frank
Jennings, SOA Approach to Integration: XML, Web services, ESB, and [78] San-Tsai Sun and Konstantin Beznosov, "The Devil is in the
BPEL in real-world SOA projects., 2007. (Implementation) Details: An Empirical Analysis of OAuth SSO
Systems," in ACM conference on Computer and communications
[57] Pohl Klaus, Günter Böckle, and Frank Van Der Linden, Software security, New York, 2012, pp. 378-390.
Product Line Engineering. Berlin: Springer, 2005.
[79] Bruce Tate, Patrick Linskey, Bob Lee, and Mike Clark, Bitter EJB.,
[58] A. Koenig, "Patterns and Antipatterns," Journal of Object Oriented 2003.
Programming, volume 8, number 1, 1995.
[80] Eddy Truyen et al., "Context-oriented Programming for Customizable
[59] Thomas Kwok, Thao Nguyen, and Linh Lam, "A software as a service SaaS Applications," in ACM Symposium on Applied Computing, 2012,
with multi-tenancy support for an electronic contract management pp. 418-425.
application," in Services Computing, 2008. SCC '08. IEEE International
Conference, pages 179 - 186, Honolulu, HI, 2008. [81] Mark Turner, David Budgen, and Pearl Brereton, "Turning Software into
a Service," IEEE Computer Society, vol. 36, no. 10, pp. 38 - 44, 2003.
[60] Neal Leavitt, "Is Cloud Computing Really Ready for Prime Time?," ,
2009. [82] Stefan Walraven, Eddy Truyen, and Wouter Joosen, "A Middleware
Layer for Flexible and Cost-Efficient Multi-tenant Applications," in 12th
[61] Zaigham Mahmood, Cloud Computing for Enterprise Architectures., International Middleware Conference, 2011.
2011.
[83] Sanjiva Weerawarana, Web Services Platform Architecture: SOAP,
[62] Zach McCormick and Douglas C. Schmidt, "Data Synchronization WSDL, WS-Policy, WS-Addressing, WS-BPEL, WS-Reliable Messaging,
Patterns in Mobile Application Design," in PLoP, Tucson, 2012. and More.: Prentice Hall PTR, 2005.
[63] Peter Mell and Timothy Grance, "The NIST Definition of Cloud [84] Craig D Weissman and Steve Bobrowski, "The Design of the Force.com
Computing," 2011. Multitenant Internet Application Development Platform," in Proceedings
[64] Gerard Meszaros, xUnit Test Patterns Refactoring Test Code., 2007. of the 35th SIGMOD international conference on Management of data,
[65] Ralph Mietzner, Andreas Metzger, Frank Leymann, and Klaus Pohl, pages 889 - 896, Providence, Rhode Island, USA, 2009.
"Variability Modeling to Support Customization and Deployment of [85] Bill Wilder, Cloud Architecture Patterns.: O'Reilly Media, 2012.
Multi-Tenant-Aware Software as a Service Applications," in PESOS '09 [86] Hung-chih Yang, Ali, Hsiao, Ruey-Lung Dasdan, and D. Stott Parker,
Proceedings of the 2009 ICSE Workshop on Principles of Engineering "Map-Reduce-Merge: Simplified Relational Data Processing," in
Service Oriented Systems, pages 18 - 25, 2009. SIGMOD '07, New York, 2007.
[66] Ralph Mietzner, Tobias Unger, Robert Titze, and Frank Leymann,
"Combining Different Multi-Tenancy Patterns in Service-Oriented
Applications," in EDOC, 2009.
[67] Svahnberg Mikael, Jilles Van Gurp, and Jan Bosch, "A Taxonomy of
221
221
HộiHội
ThảoThảo Quốc
Quốc Gia
2015 ĐiệnTử,
Tử,Truyền
TruyềnThông
Thông và
và Công
CôngNghệ
NghệThông
ThôngTinTin
(ECIT 2015)
(ECIT 2015)
Nhận dạng ngôn ngữ ký hiệu tiếng Việt với cử chỉ

động dựa trên hệ tọa độ cầu
Võ Đức Hoàng, Huỳnh Hữu Hưng, Nguyễn Hồng Sang Jean Meunier
Trung tâm DATIC, Trường Đại học Bách Khoa, Đại học Đà Nẵng. DIRO, Đại học Montreal, Canada.
Email: {hoangvd.it, hhhung}@dut.udn.vn, sangnguyenhong@hotmail.com Email: meunier@iro.umontreal.ca
Abstract—Ngôn ngữ ký hiệu là phương tiện giao tiếp được sử Sự ra đời của camera Kinect là một bước ngoặc lớn trong
dụng phổ biến trong cộng đồng người khiếm thính. Ngôn ngữ ký xử lý ngôn ngữ cử chỉ.
hiệu có những đặc trưng riêng với các quốc gia khác nhau, được
biểu diễn thông qua các cử chỉ và hình dạng bàn tay, khuỷu tay,
hay khuôn mặt. Trong bài báo này, chúng tôi đề xuất phương
pháp nhận dạng ngôn ngữ ký hiệu tiếng Việt cử chỉ động với dữ
liệu được thu từ camera Kinect phiên bản 2. Việc xác định mức
độ tương đồng giữa hai cử chỉ được thực hiện bởi thuật toán
Dynamic Time Warping (DTW) và kết quả phân lớp được đưa ra
bởi Nearest Neighbor (NN). Việc thực nghiệm trên 10 từ tiếng
Việt mang lại hiệu quả nhận dạng trung bình lên đến 92%, đồng
thời hệ thống có thể xử lý theo thời gian thực nhằm phù hợp với Hình 1. Camera đa năng Kinect
ứng dụng thực tế.
Năm 2010, Microsoft cho ra mắt phiên bản camera Kinect
Keywords- Vietnamese sign language, Kinect, Dynamic Time XBOX (hình 1) với nhiều tính năng thú vị như: camera hồng
Warping, Nearest Neighbor, so khớp mẫu, khung xương. ngoại, camera chiều sâu, camera màu, nhận dạng giọng nói,…
Đặc biệt, ta có thể sử dụng những cảm biến của camera thông
I. GIỚI THIỆU
qua các API được hỗ trợ trong bộ SDK dành cho Kinect
Ngày nay hệ thống thị giác máy tính được áp dụng nhiều XBOX. Với những ưu điểm vượt trội trong tiền xử lý dữ liệu,
trong các lĩnh vực như: giám sát, điều khiển công nghiệp, giao nhiều bài báo khoa học sử dụng Kinect XBOX như một thiết bị
tiếp người và máy, truyền thông, điều khiển rô bốt... Có hai xu thu nhận dữ liệu trong xử lý ngôn ngữ ký hiệu.
hướng nghiên cứu chính về nhận dạng ngôn ngữ ký hiệu tùy Zahoor Zafrulla và các cộng sự [9] có thể coi là người cho
thuộc vào loại cử chỉ tĩnh hay động. Các nghiên cứu về nhận đặt nền móng cho nhận dạng ngôn ngữ ký hiệu sử dụng Kinect.
dạng ngôn ngữ ký hiệu tiếng Việt (Vietnamese Sign Language Nhóm tác giả nhận thấy trò chơi giáo dục cho trẻ em khiếm
- VSL) tĩnh [1]-[4] đã cho các kết quả khá cao, ví dụ ở nghiên thính CopyCat rất có tiềm năng và có thể cải thiện hiệu quả
cứu nhận dạng VSL tĩnh được H.H.Hưng và cộng sự đưa ra nhận dạng đáng kể bằng cách sử dụng Kinect. Hệ thống mới
vào năm 2012 [1], dữ liệu được thu nhận dưới dạng ảnh 2D giúp người dùng thỏa mái hơn khi không phải mang găng tay
thông qua camera màu. Sau khi trích xuất đặc trưng dựa trên màu, cảm biến gia tốc và phải có dây nối trực tiếp với máy
hình dạng và đường bao, mạng nơ-ron nhân tạo được sử dụng tính. Đặc biệt sử dụng Kinect giá thành rẻ hơn so với việc sử
để thực hiện việc phân lớp. Việc thử nghiệm được thực hiện dụng máy ảnh có độ phân giải cao.
trên bộ ký hiệu tương ứng với bảng chữ cái tiếng Việt (nhiều Tháng 6/2012 Capilla, D.M. [10] công bố dự án bao gồm
ký tự hơn so với quốc tế) với độ chính xác lên đến 98%. một hệ thống tự động dịch ngôn ngữ ký hiệu kết nối với máy
Trong các nghiên cứu về xử lý ngôn ngữ cử chỉ trước đây, tính nhằm tạo ra sự giao tiếp thuận tiện giữa người khiếm thính
các nhà khoa học đã sử dụng các phương pháp thu nhận dữ liệu và người bình thường không hiểu ngôn ngữ ký hiệu. Hệ thống
khác nhau để nhận dạng ngôn ngữ ký hiệu: Starner T. và cộng sử dụng Kinect XBOX 360TM do Microsoft phát triển để theo
sự [6] sử dụng hai camera để thu ảnh được hai hình ảnh hai dõi cử chỉ của người khiếm thính (hình 2).
chiều, tuy nhiên quá trình tiền xử lý phức tạp vì phải đồng bộ
dữ liệu của hai camera. Imagawa và cộng sự [7] đã áp dụng kĩ
thuật xử lý ảnh màu để phát hiện và theo vết bàn tay, Jung [8]
sử dụng thiết bị thu nhận đo điện cơ đồ (EMG-
Electromyography) để phân loại 6 cử chỉ tay ngôn ngữ ký hiệu
tiếng Hàn Quốc. Bên cạnh đó, nhiều nghiên cứu sử dụng găng
tay cảm biến, găng tay màu cũng được giới thiệu. Tất cả các
phương pháp này đều tồn tại những ưu nhược điểm riêng: việc
nhận dạng bằng camera 2D đơn giản về mặt thiết bị nhưng
phức tạp ở khâu xử lý để cho ra dữ liệu chuẩn; các phương
pháp điện cơ đồ, găng tay cảm biến và màu mang lại sự bất tiện
và đòi hỏi chi phí thiết bị đáng kể trong ứng dụng thực tế. Hình 2. Hệ thống hỗ trợ người khiếm thính
ISBN: 978-604-67-0635-9 222

222
HộiHội
Thảo Quốc
Thảo Gia
Quốc 2015
ĐiệnTử,
Tử,Truyền
NghệThông
ThôngTinTin (ECIT
(ECIT 2015)
2015)
Với phiên bản Kinect for Windows (Kinect v2), các thông II. PHƯƠNG PHÁP ĐỀ XUẤT
số kỹ thuật của camera vượt trội hơn so với bản Microsoft
XBOX: camera màu được nâng lên FullHD (1920 x 1080 @30
fps) so với (640 x 480 @30 fps), camera chiều sâu (512 x 424)
so với (320 x 240), bắt được 25 điểm khung xương so với 20
điểm, theo dõi cùng lúc 6 đối tượng là người thao tác trước
thiết bị.
Ngoài ra còn có rất nhiều nghiên cứu về nhận dạng ngôn
ngữ ký hiệu sử dụng Kinect. Các báo cáo của Simon Lang [11]
sử dụng Kinect để thu nhận dữ liệu 3D, áp dụng mô hình
HMM để nhận dạng các ký hiệu với kết quả đạt 97.7%. Bài báo
về theo dõi chuyển động tay của Li Yi [12] cho thấy Kinect
thật sự phù hợp với nhận dạng ngôn ngữ ký hiệu vì nó cung
cấp dữ liệu hình ảnh 3D hiệu quả thay vì phải sử dụng nhiều
camera cũng như định vị và trích xuất hiệu quả các bộ phận
trên cơ thể người thu như: bàn tay, khủy tay, đầu, thân và chân.
Một ưu điểm của Kinect là thiết bị độc lập với môi trường ánh
sáng, có thể phát hiện chuyển động của cơ thể con người trong
bóng tối. Kinect giúp giải quyết vấn đề thu nhận dữ liệu đầu
vào không cần găng tay cảm biến, dây nối từ người thực hiện
hay phải thông qua bước tiền xử lý ảnh như: loại bỏ ảnh nền và
lọc nhiễu, làm mịn đối tượng. Giải pháp do chúng tôi đề xuất
cũng sử dụng thông tin 3D do Kinect cung cấp để trích xuất
đặc trưng biểu diễn cử chỉ.
Ngôn ngữ ký hiệu tiếng Việt so với các ngôn ngữ ký hiệu
trên thế giới có những đặc điểm chung: sử dụng chung ký hiệu
của bảng chữ cái latinh, sử dụng chung bảng chữ số, sử dụng
các hành động bàn tay kết hợp với hành động khuôn mặt, khẩu
hình miệng, ngôn ngữ cơ thể để bày tỏ ý kiến, miêu tả đối
tượng hoặc hành động. Ngoài ra, ngôn ngữ ký hiệu tiếng Việt
(cử chỉ động) cũng có những đặc trưng khác biệt so với ngôn
ngữ ký hiệu các nước khác: sử dụng các cách đánh dấu cho từ
ngữ, sử dụng các cách đánh tay biểu diễn các phụ âm ghép, tùy
thuộc vào văn hóa vùng miền.
Các ký hiệu tĩnh trong VSL chủ yếu biểu diễn hình ảnh bàn
tay tương ứng với bảng chữ cái và chữ số. Số lượng các ký
hiệu này khá ít và thường được thống nhất trên toàn quốc. Các Hình 3. Sơ đồ hoạt động của hệ thống
ký hiệu động trong VSL thường bao gồm nhiều cử chỉ phức tạp
như chuyển động cánh tay, hình dạng bàn tay, hay hướng các A. Dữ liệu khung xương
ngón tay, tùy thuộc vào quy ước của từng bộ cử chỉ. Tuy nhiên,
Kinect v2 có thể nhận biết được 25 vị trí khớp trong khung
thông tin về hành động của bàn tay và cánh tay thường được
xương. Sau khi khảo sát từ điển ngôn ngữ ký hiệu tiếng Việt,
chú trọng hơn những yếu tố khác. Khác với bộ cử chỉ tĩnh chỉ
chúng tôi kết luận rằng chuyển động của đôi tay là yếu tố quan
gói gọn trong bảng chữ cái và chữ số, cử chỉ động biểu diễn từ
trọng nhất, các thành phần khác của khuôn mặt như khẩu hình
ngữ với số lượng và thể loại rất đa dạng và phong phú. Hiện
miệng hay chuyển động mắt không được sử dụng. Do đó,
nay, bộ từ điển từ ngữ ký hiệu tiếng Việt có khoảng 4474 từ,
chúng tôi chỉ sử dụng 4 điểm liên quan đến tay gồm 2 điểm bàn
các từ lại có sự khác nhau đối với mỗi vùng miền.
tay trái và phải, 2 điểm khuỷu tay trái và phải (hình 4).
Nghiên cứu của chúng tôi tập trung vào các ký hiệu được
quy ước trong bộ từ điển ngôn ngữ ký hiệu Việt Nam [5]. Cụ
thể, các cử chỉ được xử lý theo thời gian thực, mỗi hành động
được thu lại bằng camera Kinect v2. Các cử chỉ được biểu diễn
bởi thông tin tọa độ các khớp liên quan đến tay trong hệ tọa độ
cầu thay vì hệ tọa độ Descartes. Việc nhận dạng được thực hiện
bởi thuật toán Nearest Neighbor kết hợp với kĩ thuật đo độ
tương đồng DTW. Việc thử nghiệm được thực hiện trên 10 từ,
trong đó mỗi từ bao gồm 30 mẫu, với 10 mẫu được sử dụng
làm dữ liệu huấn luyện và 20 mẫu kiểm tra.
Hình 4. Dữ liệu khung xương
223
223
Dữ liệu khung xương được thu bởi Kinect với tốc độ 30

khung hình mỗi giây. Tuy vậy, hệ thống mà chúng tôi xây
dựng chỉ chọn và xử lý 5 khung xương trong số đó. Do đó, việc
thu nhận dữ liệu được thực hiện cứ sau mỗi 0.2 giây. Cụ thể, cứ
thu được 6 khung hình thì hệ thống tiến hành tính khung xương
trung bình và đưa vào mô-đun nhận dạng. Lưu ý rằng mỗi
khung hình được thu nhận sẽ được kiểm tra có chứa các thành
phần bàn tay, khuỷu tay và tâm cơ thể hay không. Nếu có điểm
bất kỳ không được thu nhận, hệ thống sẽ tự động điền thông tin
đó bằng dữ liệu từ khung hình trước.

n
Jk
J  k 1 (1)
n
B. Trích xuất đặc trưng Hình 6. Hệ tọa độ cầu Spherical

Công việc chính ở giai đoạn này là chuyển thông tin khung
xương ở hệ tọa độ Descartes sang hệ tọa độ cầu. Camera Để chuyển từ hệ tọa độ Cartesian sang hệ tọa độ cầu
Kinect v2 với cảm biến chiều sâu cho phép làm việc với dữ liệu Spherical, ta sử dụng các công thức sau:
n
chiều sâu của đối tượng. Do đó, ta có thể sử dụng dữ liệu 3D để
 J i  
 Tx   J  i  y  Ty    J i   Tz 
2

2 2
r (2)
xử lý ngôn ngữ ký hiệu tiếng Việt. Thông tin về khung xương i 1
i x z
đã đề cập ở trên có thể biểu diễn trong hệ tọa độ Cartesian với n

  J  i  z  Tz  
3 thông số (𝑥𝑥𝑥 𝑥𝑥𝑥 𝑥𝑥). Tuy nhiên, phương pháp này bộc lộ nhược  i
 arccos   (3)
 ri 
điểm là chỉ có thể sử dụng dữ liệu trong trường hợp vị trí và
i 1
khoảng cách của đối tượng với camera Kinect là không thay n   J  i  y  Ty  
đổi. Do đó, ta cần phải đổi hệ quy chiếu từ máy quay sang hệ   atan 2  
  J  i  x  Tx  
i
(4)
quy chiếu của đối tượng: lấy tâm người làm gốc tọa độ, các dữ
i 1
 
liệu về bàn tay và khuỷu tay được quy về theo hệ tọa độ này Trong đó, n là số điểm trong tập hợp J.
(hình 5).
Hình 7. Chia vùng chuẩn hóa dữ liệu góc kinh độ φ

Hình 5. Chuyển đổi hệ quy chiếu từ máy quay sang hệ quy chiếu đối Dữ liệu ban đầu đưa vào là dữ liệu số thực ở hệ tọa độ
tượng [10]
Descartes, hệ tọa độ sau khi chuyển đổi là hệ tọa độ cầu với
Trong toán học, một hệ tọa độ cầu Spherical là một hệ tọa tâm là tâm cơ thể của đối tượng. Các góc θ và φ được chia
độ cho không gian 3 chiều mà vị trí một điểm được xác định thành 12 góc nhỏ với mỗi góc 300 (hình 7). Bán kính r được
bởi 3 số: khoảng cách theo hướng bán kính từ gốc tọa độ r, góc nhân với 10 và lấy phần nguyên (dữ liệu thô tính bằng đơn vị
mét). Quá trình này giúp làm giảm sai số trong việc làm tròn
nâng từ điểm đó từ một mặt phẳng cố định θ, và góc kinh độ
của hình chiếu vuông góc của điểm đó lên mặt phẳng cố định giá trị. Như vậy sau quá trình chuẩn hóa dữ liệu, dữ liệu đưa
vào bao gồm các giá trị nguyên.
đó φ (hình 6).
Sau khi thực hiện xong việc trích xuất đặc trưng, vector
Dữ liệu cần xét trong bài báo là tập hợp các vector của bàn
biểu diễn cử chỉ bao gồm 12 phần tử chứa dữ liệu của 4 điểm
tay trái (LH), bàn tay phải (RH), khuỷu tay trái (LE), khuỷu tay
khớp tại một thời điểm:
phải (RE). Ta có tập hợp khung xương:
J  rLE ,  LE ,  LE , rRE ,  RE ,  RE , rLH ,  LH ,  LH , rRH ,  RH ,  RH  (5)
J LE, RE, LH , RH 
Các thông tin tương ứng với hệ tọa độ cầu bao gồm C. Phân loại
 Tập hợp khoảng cách r  rLE , rRE , rLH , rRH  Trong quá trình này, dữ liệu đầu vào được so sánh với các
 Tập hợp góc nâng   LE ,  RE ,  LH ,  RH  ký hiệu sẵn có để chọn ra cử chỉ gần giống nhất. Ở đây, việc so
 Tập hợp góc kinh độ   LE ,  RE , LH , RH  khớp có thể thực hiện cả khi không có sự trùng khớp về mặt
224
224
HộiHội
Thảo Quốc
Thảo Gia
Quốc 2015
ĐiệnTử,
Tử,Truyền
NghệThông
ThôngTinTin (ECIT
(ECIT 2015)
2015)
thời gian thực hiện cử chỉ. DTW được sử dụng để so khớp hai một mảng vector. Vấn đề đặt ra là: trong hai dữ liệu về bàn tay
dữ liệu có sự sai khác nhau về thời gian. và cánh tay, dữ liệu nào đặc trưng hơn cho từ vựng của ngôn
Thuật toán DTW được giới thiệu từ những năm 1960 [13], ngữ ký hiệu? Tại mỗi thời điểm, bàn tay di chuyển nhiều hơn
đây là thuật toán so khớp sự giống nhau của 2 chuỗi mà không khuỷu tay. Đánh giá hai dữ liệu này qua thực nghiệm đã đưa ra
phụ thuộc vào thời gian cũng như tốc độ của các chuỗi này. được kết luận: dữ liệu của bàn tay quan trọng hơn dữ liệu của
Vào năm 1983, Joseph Kruskal và cộng sự [14] đã giới thiệu khuỷu tay. Do đó, chúng ta lấy trọng số 80% cánh tay và 20%
một kỹ thuật mới cho phép tìm ra đường chuẩn hoá tối ưu dựa khuỷu tay.
trên việc so sánh hai mẫu dữ liệu được vector hoá đặc trưng
(tức là tính khoảng cách giữa chúng). Kỹ thuật này được gọi là III. KẾT QUẢ THỰC NGHIỆM
time warping, có thể so khớp hai vector có đặc trưng khác nhau Phương pháp đề xuất được thử nghiệm với 10 từ trong bộ
về thời gian và tốc độ. Kỹ thuật so khớp đồng bộ thời gian từ điển Ngôn ngữ Ký hiệu Tiếng Việt [5]. Mỗi từ được lấy 30
bằng cách tính khoảng cách Euclidean hay Mahattan và so sánh mẫu gồm 20 mẫu kiểm tra và 10 mẫu huấn luyện, được thực
điểm thứ i của một thời điểm ở chuỗi mẫu với điểm i đó trong hiện bởi 2 người và các vị trí có sự khác nhau so với thiết bị
chuỗi đối chiếu có nhược điểm là kết quả so khớp thường thấp Kinect. Quá trình phân loại được thực hiện bằng thuật toán
với 2 chuỗi không có nhiều tương đồng về thời gian (hình 8). DTW và Nearest Neighbor. Cấu hình hệ thống thử nghiệm:
Windows 8 Professional, CPU Intel Core i5 2.5GHz, RAM 4G,
Kinect v2 for Windows. Hệ thống hoạt động cho ra kết quả
trong thời gian thực.
Bảng 1.Kết quả nhận dạng ngôn ngữ ký hiệu tiếng Việt
Từ Độ chính xác
Buổi sáng 90%
Hình 8. So khớp bằng phương pháp khoảng cách Euclidean Bàn hội nghị 85%
Bánh chưng 95%
Thuật toán DTW đưa ra kỹ thuật so sánh 2 chuỗi phi tuyến
tính theo thời gian cho phép so khớp 2 chuỗi ngay cả khi chúng Cầu vượt 90%
không đồng bộ về mặt thời gian cũng như tốc độ (hình 9). Giao thông 95%
Ấm áp 90%
Ăn mặc 80%
Thành phố 95%
Biểu quyết 100%
Tình nguyện 100%
IV. KẾT LUẬN VÀ HƯỚNG PHÁT TRIỂN

Hình 9. So khớp với DTW Trong bài báo này chúng tôi đề xuất một giải pháp mới để
nhận dạng ngôn ngữ ký hiệu tiếng Việt cử chỉ động dựa trên bộ
Trong hình trên, mỗi đường thẳng nối một điểm trên chuỗi dữ liệu khung xương thu nhận từ thiết bị Kinect. Đặc trưng
thời gian này với các điểm tương đồng trên chuỗi thời gian kia. biểu diễn cử chỉ được trích xuất dựa trên việc chuyển đổi vị trí
Các đường có giá trị giống nhau trên trục y, nhưng đã được các khớp tay trong hệ tọa độ Descartes sang hệ tọa độ cầu và
tách ra để các đường thẳng đứng giữa chúng có thể dễ dàng đưa các giá trị thu được về tập số nguyên. Việc phân lớp được
nhìn thấy. Nếu cả chuỗi thời gian trong hình giống hệt nhau thì thực hiện bởi kĩ thuật Nearest Neighbor, trong đó thuật toán
tất cả các đường sẽ là thẳng đứng vì lúc này không cần phải DTW được dùng để đánh giá độ tương đồng của hai mẫu dữ
dùng kỹ thuật “time warping” nữa. Khoảng cách đường là độ liệu có sự sai khác nhau về thời gian. Kết quả thu được khá khả
đo sự khác nhau giữa hai chuỗi thời gian sau khi được chỉnh quan khi độ chính xác trung bình lên đến trên 92%. Ngoài ra,
sửa so khớp với nhau, được tính bằng tổng các khoảng cách việc thực nghiệm cho thấy giải pháp đề xuất có thể xử lý trong
giữa mỗi cặp điểm được nối với nhau bằng các đường thẳng thời gian thực với chi phí thấp. Trong các nghiên cứu tiếp theo,
đứng trong hình trên. Như vậy, hai chuỗi thời gian mà giống chúng tôi sẽ phân tích thêm các thông tin về hình dạng bàn tay
hệt nhau ngoại trừ việc kéo dãn cục bộ của các trục thời gian sẽ và biểu hiện khuôn mặt để nâng cao khả năng biểu diễn cử chỉ
có khoảng cách DTW bằng 0. và tăng hiệu quả nhận dạng.
Trong quá trình thu nhận cử chỉ chúng tôi sử dụng phương
pháp phân lớp Nearest Neighbor được sử dụng để đưa ra kết V. LỜI CẢM ƠN
quả so khớp là khoảng cách nhỏ nhất giữa dữ liệu đầu vào và Nghiên cứu này được hỗ trợ bởi Nguyễn Trọng Nguyên và
các cụm dữ liệu đã huấn luyện. Đây là dữ liệu đầu vào để áp nhóm nghiên cứu xử lý ảnh, khoa Công nghệ Thông tin,
dụng cho phương pháp phân loại DTW. Dữ liệu đưa vào gồm 2 Trường Đại học Bách khoa, Đại học Đà Nẵng.
phần chính là dữ liệu khuỷu tay và dữ liệu bàn tay trong cùng
225
225
HộiHội Thảo
Thảo QuốcGia
Quốc Gia2015
2015về
vềĐiện
Điện Tử,
Tử,Truyền
Truyền Thông
Thông và
vàCông
CôngNghệ
NghệThông TinTin
Thông (ECIT 2015)
(ECIT 2015)
VI. TÀI LIỆU THAM KHẢO Gesture Recognition, 1998. Proceedings. Third IEEE
International Conference on. 1998.
[1] Huỳnh Hữu Hưng, Nguyễn Trọng Nguyên, Võ Đức Hoàng, Hồ
Viết Hà, Nhận dạng ngôn ngữ ký hiệu tiếng Việt sử dụng mạng [8] Kyung Kwon, J., et al. EMG pattern classification using spectral
Neuron nhân tạo. Tạp chí Khoa học và Công nghệ, Đại học Đà estimation and neural network. in SICE, 2007 Annual
Nẵng, 2012. 12: p. 75-80. Conference. 2007.
[2] Nguyen, T.-N., H.-H. Huynh, and J. Meunier, Static Hand [9] Zafrulla, Z., et al., American sign language recognition with the
Gesture Recognition Using Artificial Neural Network. Journal kinect, in Proceedings of the 13th international conference on
of Image and Graphics, 2013. 1(1). multimodal interfaces. 2011, ACM: Alicante, Spain. p. 279-286.
[3] Nguyen, T.-N., et al. Geometry-based static hand gesture [10] Capilla, D.M., Sign Language Translator using Microsoft Kinect
recognition using support vector machine. in Control XBOX 360 TM. Department of Electrical Engineering and
Automation Robotics & Vision (ICARCV), 2014 13th Computer Science, University of Tennessee, 2012.
International Conference on. 2014. IEEE. [11] Lang, S., M. Block, and R. Rojas. Sign language recognition
[4] Trong-Nguyen Nguyen, H.-H.H., and Jean Meunier, Static Hand using kinect. in Artificial Intelligence and Soft Computing.
Gesture Recognition using Principal Component Analysis 2012. Springer.
combined with Artificial Neural Network. Journal of [12] Li, Y. Hand gesture recognition using Kinect. in Software
Automation and Control Engineering, 2015. Vol. 3, No. 1: p. 40- Engineering and Service Science (ICSESS), 2012 IEEE 3rd
45. International Conference on. 2012. IEEE.
[5] VSDIC. Từ điển ngôn ngữ ký hiệu. 2014. [13] Bellman, R. and R. Kalaba, On adaptive control processes.
[6] Starner, T., J. Weaver, and A. Pentland, Real-time american sign Automatic Control, IRE Transactions on, 1959. 4(2): p. 1-9.
language recognition using desk and wearable computer based [14] Kruskal, J.B. and M. Liberman, The symmetric time-warping
video. Pattern Analysis and Machine Intelligence, IEEE problem: from continuous to discrete. Time Warps, String Edits
Transactions on, 1998. 20(12): p. 1371-1375. and Macromolecules: The Theory and Practice of Sequence
[7] Imagawa, K., L. Shan, and S. Igi. Color-based hands tracking Comparison, 1983: p. 125-161.
system for sign language recognition. in Automatic Face and
226
226
HộiHội
Thảo Quốc
Thảo Gia
Quốc Gia2015
2015về
vềĐiện
Điện Tử,
Tử,Truyền
Nghệ Thông
Thông TinTin (ECIT
(ECIT 2015)
2015)
Về Một Phương Pháp Xây Dựng

Hệ Mật Mã Lai Ghép
Nguyễn Toàn Thắng1, Ngô Đức Thiện2
1
Nghiên cứu sinh, Học Viện Công Nghệ Bưu Chính Viễn Thông
2
Khoa Kỹ thuật Điện tử 1, Học Viện Công Nghệ Bưu Chính Viễn Thông
Email: thangnt20@gmail.com, thiennd@ptit.edu.vn
Tóm tắt— Cho đến nay các hệ mật khóa công khai thường trao đổi và thỏa thuận khóa Diffie-Hellman, hệ mật Omura-
được xây dựng trên các bài toán một chiều, tức là việc tính xuôi Massey, hệ mật và chữ ký số ElGamal...
(hay mã hóa) khá đơn giản, còn tính ngược (hay thám mã) là rất
khó. Bài toán logarit rời rạc là một trong các bài toán một chiều Cho đến này chưa có thuật toán hiệu quả nào để giải bài toán
khó và cho đến nay vẫn chưa có thuật toán hiệu quả nào để giải logarit rời rạc tổng quát. Có nhiều thuật toán phức tạp, thường
bài toán logarit rời rạc tổng quát. Bài báo này đề xuất một phương sinh ra từ những thuật toán tương tự như bài toán phân tích thừa
pháp xây dựng một hệ mật mã khóa bí mật lai ghép sử dụng hệ số, chúng chạy nhanh hơn các thuật toán thô sơ nhưng vẫn còn
mật Pohlig-Hellman kết hợp với sơ đồ Feistel, cùng với đó là một chậm hơn so với thời gian đa thức. Có thể kể đến một số thuật
số đánh giá về tính khuếch tán của hệ mật đề xuất này. toán như: Baby-step giant-step, Pollard, Pohlig-Hellman, COS,
Từ khóa— Mật mã khối, bài toán logarit rời rạc, hệ mật Pohlig-
tính toán chỉ số (index calculus)...
Hellman, sơ đồ Feistel. Với mục đích kết hợp ưu điểm của các hệ mật và sơ đồ mã
I. MỞ ĐẦU hóa đã có, bài báo này đề xuất một phương pháp xây dựng hệ
mật mã lai ghép, trong đó hàm mã hóa sử dụng phép mã hóa của
Trong mô hình mật mã cổ điển, thì Alice (người gửi) và Bob hệ mật Pohlig-Hellman và sơ đồ mã hóa theo mạng Feistel cân
(người nhận) chọn một khoá 𝑘𝑘 bí mật nào đó; sau đó dùng 𝑘𝑘 để bằng. Hệ mật mã lai ghép này bao gồm hai phép hoán vị và phép
tạo luật mã hoá 𝑒𝑒𝑘𝑘 và luật giải mã 𝑑𝑑𝑘𝑘 , luật giải mã 𝑑𝑑𝑘𝑘 hoặc giống tính hàm mũ theo modulo.
𝑒𝑒𝑘𝑘 hoặc dễ dàng nhận được từ nó. Các hệ mật này được gọi là
mật mã khoá bí mật (hoặc mật mã khóa đối xứng), nếu để lộ 𝑘𝑘 II. BÀI TOÁN LOGARIT RỜI RẠC VÀ HỆ MẬT
thì hệ thống mất an toàn. POHLIG-HELLMAN
Ý tưởng xây dựng một hệ mật khoá công khai (hay dùng A. Bài toán logarit rời rạc
chung) là tìm một hệ mật không có khả năng tính toán để xác Các phép tính logarit rời rạc là các phép logarit được thực
định 𝑑𝑑𝑘𝑘 khi biết 𝑒𝑒𝑘𝑘 . Nếu thực hiện được như vậy thì quy tắc mã hiện trên các nhóm nhân cyclic. Nếu 𝐺𝐺 là một nhóm nhân cyclic
hóa 𝑒𝑒𝑘𝑘 có thể được công khai bằng cách công bố nó trong một và 𝑔𝑔 là một phần tử sinh của 𝐺𝐺𝐺 thì theo tính chất của nhóm nhân
danh bạ (bởi vậy nên có thuật ngữ hệ mật khoá công khai). Ưu cyclic, ta thấy rằng mỗi phần tử 𝑦𝑦 trong 𝐺𝐺 có thể được tính bằng
điểm của hệ mật khoá công khai là ở chỗ Alice (hoặc bất kỳ ai) 𝑔𝑔𝑥𝑥 với một giá trị 𝑥𝑥 nào đó. Phép tính logarit rời rạc của 𝑦𝑦𝑦với
có thể gửi một bản tin đã mã hóa cho Bob (mà không cần thông cơ số 𝑔𝑔 sẽ cho kết quả là 𝑥𝑥.
tin trước về khoá mật) bằng cách dùng luật mã hóa công khai 𝑒𝑒𝑘𝑘 .
Người nhận Bob sẽ là người duy nhất có thể giải được bản mã Có thể tóm tắt bài toán logarit rời rạc như sau [1], [4]:
này bằng cách sử dụng luật giải bí mật 𝑑𝑑𝑘𝑘 của mình. Cho một vành số ℤ𝑝𝑝 , theo [1] nếu 𝑝𝑝 là nguyên tố thì ℤ𝑝𝑝 là
Ý tưởng về một hệ mật khoá công khai được Diffie và một trường (ℤ𝑝𝑝 = 𝐺𝐺𝐺𝐺(𝑝𝑝)). Tập tất cả các phần tử khác không
Hellman đưa ra vào năm 1976. Còn việc hiện thực hoá nó thì do của trường sẽ tạo nên một nhóm nhân cyclic ℤ∗𝑝𝑝 .
Rivesrt, Shamir và Adleman đưa ra lần đầu tiên vào năm 1977,
họ đã tạo nên hệ mật nổi tiếng RSA [7].  ℤ∗𝑝𝑝 = ℤ𝑝𝑝 /{0} = {1,2, … , 𝑝𝑝 𝑝 𝑝𝑝 
Hàm mã khoá công khai 𝑒𝑒𝑘𝑘 của Bob phải là một hàm dễ tính
toán, song việc tìm hàm ngược (hàm giải mã) rất khó khăn (đối  Cho 𝑔𝑔 𝑔 𝑔∗𝑝𝑝 là một phần tử sinh của nhóm nhân.
với bất kỳ ai không phải là Bob). Đặc tính dễ tính toán này  Cho 𝑦𝑦 𝑦𝑦𝑝𝑝∗ , yêu cầu hãy tìm 𝑥𝑥 (nếu tồn tại) sao cho:
thường được gọi là đặc tính một chiều, và điều kiện cần thiết là 𝑔𝑔 𝑥𝑥 = 𝑦𝑦, tức là: 𝑥𝑥 𝑥 𝑥𝑥𝑥 𝑔𝑔 𝑦𝑦.
𝑒𝑒𝑘𝑘 phải là hàm một chiều (tính thuận đơn giản, nhưng tính ngược
rất khó) [1], [7]. Nhận xét: ∀𝑦𝑦 𝑦𝑦∗𝑝𝑝 thì [1]:
Một trong các hàm một chiều được sử dụng nhiều trong các  Bài toán có nghiệm khi 𝑔𝑔 là phần tử nguyên thủy.
hệ mật khóa công khai đó là bài toán logarit rời rạc [2], [7]. Có
thể kể đến các hệ mật khóa công khai sử dụng bài toán này như:  Bài toán có thể không có nghiệm khi 𝑔𝑔 bất kỳ.
ISBN: 978-604-67-0635-9 227
227
HộiHội
Thảo Quốc
Thảo Gia
Quốc 2015
Gia 2015về
vềĐiện
ĐiệnTử,
Tử,Truyền
NghệThông
ThôngTinTin (ECIT
(ECIT 2015)
2015)
Ví dụ: Xét 𝑝𝑝 𝑝 19 và 𝑔𝑔 𝑔 𝑔 là phần tử nguyên thủy của  𝑚𝑚𝑚𝑚𝑚 𝑑𝑑 mod 𝑝𝑝 
∗
nhóm nhân ℤ19 , ta có các giá trị 2𝑡𝑡 và log 2 𝑡𝑡 như trong bảng I
(Chú ý, các phép tính đều lấy theo modulo của 19). Trong đó: 𝑚𝑚 là bản rõ; 𝑐𝑐 là bản mã; 𝑒𝑒 là số mũ mã hóa và 𝑑𝑑
là số mũ giải mã.
BẢNG I. GIÁ TRỊ HÀM MŨ VÀ LOGARIT RỜI RẠC CƠ SỐ 2 CỦA CÁC PHẦN TỬ
TRONG NHÓM NHÂN ℤ19 ∗ Số mũ mã hóa 𝑒𝑒 (hay khóa) phải là số khả nghịch và do đó 𝑒𝑒
phải thỏa mãn điều kiện sau [6]:
𝑡𝑡 1 2 3 4 5 6 7 8 9
2 𝑡𝑡 2 4 8 16 13 7 14 9 18  gcd(𝑒𝑒𝑒 𝑒𝑒(𝑝𝑝)) = 1 
log 2 𝑡𝑡 18 1 13 2 16 14 6 3 8
Với 𝜑𝜑𝜑𝜑𝜑𝜑 là hàm Phi-Euler, cách tính 𝜑𝜑𝜑𝜑𝜑𝜑 có trong [7]. Kết
𝑡𝑡 10 11 12 13 14 15 16 17 18 quả của hàm 𝜑𝜑(𝑝𝑝) cho ta biết số lượng các số nguyên tố cùng
2𝑡𝑡 17 15 11 3 6 12 5 10 1 nhau với 𝑝𝑝.
log 2 𝑡𝑡 17 12 15 5 7 11 4 10 9 Do 𝑝𝑝 là số nguyên tố nên 𝜑𝜑(𝑝𝑝) = 𝑝𝑝 𝑝𝑝, và như thế số mũ
giải mã tương ứng 𝑑𝑑 được tính từ phép nghịch đảo của
Từ bảng I ta nhận thấy cả hàm mũ và hàm logarit rời rạc đều 𝑒𝑒𝑒mod 𝜑𝜑𝜑𝜑𝜑𝜑 như sau [7]:
không phải hàm đồng biến, chúng đều là các hàm phi tuyến. Kết
quả của hai hàm này khi đối số tăng là các giá trị có phân bố 𝑑𝑑 𝑑𝑑𝑑 −1 mod 𝑝𝑝 𝑝𝑝 𝑝 𝑝𝑝 𝜑𝜑[𝜑𝜑(𝑝𝑝)]−1 mod 𝑝𝑝 𝑝𝑝
ngẫu nhiên.
= 𝑒𝑒 𝜑𝜑(𝑝𝑝𝑝𝑝)−1 mod 𝑝𝑝 𝑝𝑝 
Một số tính chất của hàm logarit rời rạc [1].
+ 𝑥𝑥 𝑥 log 𝑔𝑔 𝑏𝑏𝑏𝑏 = (log 𝑔𝑔 𝑏𝑏 𝑏 log 𝑔𝑔 𝑐𝑐𝑐𝑐𝑐𝑐𝑐𝑐𝑐 𝑐 𝑐 Hệ mật Pohlig – Hellman có thể sử dụng làm hệ mật khóa bí
mật thông thường vì rất dễ xác định 𝑑𝑑 từ 𝑒𝑒 và 𝑝𝑝. Thậm chí nếu
𝑏𝑏
+ 𝑥𝑥 𝑥 log 𝑔𝑔 𝑐𝑐 = (log 𝑔𝑔 𝑏𝑏 𝑏 log 𝑔𝑔 𝑐𝑐𝑐𝑐𝑐𝑐𝑐𝑐𝑐𝑐 𝑐 𝑐 giữ bí mật 𝑝𝑝 thì nó có thể suy ra từ kích thước của khối bản mã.
+ log 𝑔𝑔−1 𝑦𝑦 𝑦𝑦 log 𝑔𝑔 𝑦𝑦 𝑦𝑦𝑦𝑦𝑦𝑦 log 𝑔𝑔 𝑦𝑦 III. ĐỀ XUẤT MỘT PHƯƠNG PHÁP XÂY DỰNG
HỆ MẬT MÃ LAI GHÉP
+ log 𝑔𝑔 1 = 0 = 𝑝𝑝 𝑝𝑝
Trong phần này, chúng tôi đề xuất một hệ mật mã lai ghép
Bài toán logarit rời rạc không phải lúc nào cũng khó, độ khó sử dụng hai phép mã hóa là hoán vị và lũy thừa. Sơ đồ khối và
của nó phụ thuộc vào các nhóm nhân được lựa chọn. sơ đồ mã hóa chi tiết như mô tả trong hình 1 và hình 2.
Ví dụ, các hệ mật dựa trên phép logarit rời rạc thường chọn Lược đồ mã hóa của hệ mật thực hiện theo sơ đồ Feistel cân
các nhóm nhân ℤ𝑝𝑝∗ trong đó 𝑝𝑝 là số nguyên tố lớn. Tuy nhiên, bằng [6]. Các khâu IP và IP-1 trong hình 2 là các bảng hoán vị
nếu 𝑝𝑝 𝑝𝑝 là tích của các số nguyên tố nhỏ, thì có thể sử dụng 64 bit và như thế sẽ có tổng cộng 64! cách lựa chọn khác nhau.
thuật toán Pohlig - Hellman để giải bài toán logarit rời rạc rất Trong bài báo này chúng tôi chọn các bảng hoán vị theo cách
hiệu quả. Vì thế người ta thường lựa chọn 𝑝𝑝 là số nguyên tố an của hệ mật DES, như trong bảng II và bảng III [6].
toàn, để thành lập nhóm nhân ℤ∗𝑝𝑝 cho các hệ mật. Một số nguyên
tố an toàn là một số nguyên tố có dạng 𝑝𝑝 = 2𝑞𝑞 + 1, với 𝑞𝑞 là số BẢNG II. HOÁN VỊ BAN ĐẦU (IP)
nguyên tố lớn. Điều này đảm bảo 𝑝𝑝 − 1 = 2𝑞𝑞 có phân tích thành 58 50 42 34 26 18 10 2
tích của các số nguyên tố lớn và không dễ dàng có thể giải được 60 52 44 36 28 20 12 4
bài toán logarit rời rạc bằng thuật toán Pohlig - Hellman [7]. 62 54 46 38 30 22 14 6
64 56 48 40 32 24 16 8
B. Hệ mật Pohlig - Hellman 57 49 41 33 25 17 9 1
Bài toán logarit rời rạc là bài toán khó, trong khi bài toán lũy 59 51 43 35 27 19 11 3
thừa rời rạc lại không khó (có thể tính bằng thuật toán nhân và 61 53 45 37 29 21 13 5
bình phương). Bài toán này cũng giống như bài toán phân tích 63 55 47 39 31 23 15 7
thừa số và phép nhân các số nguyên, đều có thể dùng để xây
dựng cấu trúc cho một hệ mật mã. BẢNG III. HOÁN VỊ ĐẢO (IP-1)
Hệ mật Pohlig – Hellman cũng là một hệ mật sử dụng bài 40 8 48 16 56 24 64 32

39 7 47 15 55 23 63 31
toán logarit rời rạc, có thể tóm tắt hệ mật này như sau [3], [7]:
38 6 46 14 54 22 62 30
- Chọn 𝑝𝑝 là một số nguyên tố lớn. 37 5 45 13 53 21 61 29
36 4 44 12 52 20 60 28
- Phép mã hóa thực hiện theo phương trình đồng dư sau: 35 3 43 11 51 19 59 27
34 2 42 10 50 18 58 26
 𝑐𝑐 𝑐 𝑐𝑐𝑒𝑒 mod 𝑝𝑝  33 1 41 9 49 17 57 25
- Phép giải mã được thực hiện theo phương trình sau:
228
228
HộiHội
Thảo Quốc
Thảo GiaGia
Quốc 2015
2015vềvềĐiện
ĐiệnTử,
Tử,Truyền
NghệThông
ThôngTinTin (ECIT
(ECIT 2015)
2015)
Mã hóa Chú ý, riêng vòng cuối cùng thuật toán mã hóa sẽ là:
Bản rõ M Bản mã C
(64 bit) (64 bit) 𝑅𝑅 = 𝑅𝑅3 ⨁ 𝑒𝑒4
 { 4  
𝐿𝐿4 = 𝐿𝐿3 ⨁ 𝑓𝑓𝑓𝑓𝑓3 ⨁𝑒𝑒4 , 𝑒𝑒4 )
Khóa bí mật K
(128 bit)
Hàm mã hóa 𝑓𝑓 sử dụng thuật toán mã hóa của hệ mật Pohlig
Hình 1. Sơ đồ khối của hệ mật – Hellman, thực hiện theo một trong hai cách sau:
Cách 1 sử dụng khóa làm số mũ mã hóa theo phương trình
Bản rõ M( 64 bits) đồng dư sau:
Hoán vị 𝑒𝑒
IP  𝑐𝑐𝑖𝑖 = 𝑓𝑓(𝑚𝑚𝑖𝑖 , 𝑒𝑒𝑖𝑖 ) ≡ 𝑚𝑚𝑖𝑖 𝑖𝑖 mod 𝑝𝑝 
ban đầu
L0 ( 32 bits) R0 ( 32 bits) Cách 2 sử dụng dữ liệu làm số mũ mã hóa như sau:

𝑚𝑚𝑖𝑖
e1  𝑐𝑐𝑖𝑖 = 𝑓𝑓(𝑚𝑚𝑖𝑖 , 𝑒𝑒𝑖𝑖 ) ≡ 𝑒𝑒𝑖𝑖 mod 𝑝𝑝 
m1
f Trong đó: 𝑚𝑚𝑖𝑖 = 𝑅𝑅𝑖𝑖𝑖𝑖 ⨁𝑒𝑒𝑖𝑖 và 𝑒𝑒𝑖𝑖 lần lượt là dữ liệu đầu vào
mã hóa và khóa mã hóa tại bước thứ 𝑖𝑖; còn 𝑝𝑝 là một số nguyên
tố. Tất cả 𝑝𝑝𝑝𝑝𝑝𝑖𝑖 và 𝑒𝑒𝑖𝑖 đều có kích thước là 32 bit.
L1 ( 32 bits) R1 ( 32 bits)
Trong sơ đồ hình 2 tại vòng mã hóa thứ 𝑖𝑖, khối 32 bit của
e2 nửa phải ở bước 𝑖𝑖 − 1 (𝑅𝑅𝑖𝑖−1 ) sẽ được cộng thêm với khóa 𝑒𝑒𝑖𝑖
m2 trước khi đưa vào hàm 𝑓𝑓. Điều này là để tránh trường hợp khi
f bản rõ đầu vào 𝑀𝑀 chứa toàn bit "0" thì bản mã đầu ra 𝐶𝐶 cũng sẽ
toàn là bit "0".
L2 ( 32 bits) R2 ( 32 bits) Các khóa con 𝑒𝑒𝑖𝑖 tại các vòng mã hóa được trích chọn từ khóa
ban đầu 𝐾𝐾 (128 bit). Cách đơn giản nhất là chia 128 bit khóa
e3 thành 4 khối 32 bit tương ứng với 4 khóa 𝑒𝑒1 , 𝑒𝑒2 , 𝑒𝑒3 và 𝑒𝑒4 , như
m3 mô tả trong hình 3.
f
e1 (32bit) e2 (32bit) e3 (32bit) e4 (32bit)
L3 ( 32 bits) R3 ( 32 bits) Khóa bí mật K (128 bits)
Hình 3. Tách các khóa con 𝑒𝑒𝑖𝑖 cho các vòng mã hóa
e4
m4 Do hệ mật sử dụng sơ đồ Feistel cân bằng nên sơ đồ giải mã
f
về cơ bản giống với sơ đồ mã hóa. Ta thực hiện sơ đồ từ dưới đi
lên, tức là thứ tự của các khóa sẽ đảo lại bắt đầu từ 𝑒𝑒4 và kết thúc
ở 𝑒𝑒1 . Thuật toán giải mã ở mỗi vòng được thực hiện như sau:
L4 ( 32 bits) R4 ( 32 bits)
𝐿𝐿 = 𝑅𝑅𝑖𝑖𝑖𝑖 ⨁ 𝑓𝑓𝑓𝑓𝑓𝑖𝑖𝑖𝑖 , 𝑒𝑒𝑖𝑖 )
-1 Hoán vị { 𝑖𝑖  
IP 𝑅𝑅𝑖𝑖 = 𝐿𝐿𝑖𝑖𝑖𝑖 ⨁ 𝑒𝑒𝑖𝑖
đảo
Bản mã C( 64 bits) Vì lý do mạch giải mã vẫn dùng các khóa bí mật 𝑒𝑒𝑖𝑖 để giải
mã, nên ta không cần phải tính số mũ giải mã 𝑑𝑑𝑖𝑖 , và như vậy các
Hình 2. Sơ đồ mã hóa của hệ mật khóa 𝑒𝑒𝑖𝑖 cũng không cần phải thỏa mãn biểu thức (4). Tức là có
thể chọn 𝑒𝑒𝑖𝑖 > 0 tùy ý, và hàm mã hóa 𝑓𝑓 có thể thực hiện theo
Sơ đồ mã hóa trải qua bốn vòng mã hóa với bốn khóa riêng hai cách như mô tả trong các biểu thức (8) và (9).
biệt 𝑒𝑒1 , 𝑒𝑒2 , 𝑒𝑒3 và 𝑒𝑒4 . Việc lựa chọn số vòng mã hóa là do từng hệ
mật, ví dụ như DES là 16 vòng, thông thường số vòng mã hóa Tiến hành mô phỏng tính khuếch tán của hệ mật khi thay đổi
liên quan đến độ khuếch tán của hệ mật. Với hệ mật đề xuất này dữ liệu bản rõ 𝑀𝑀 và thay đổi khóa bí mật 𝐾𝐾, với các thông số mô
thì chỉ cần 4 vòng mã hóa đã đạt độ khuếch tán đầu ra tốt. phỏng được chọn như sau:
Mỗi vòng mã hóa thực hiện theo thuật toán sau: Bản rõ 𝑀𝑀 gồm 64 bit được chọn và biễu diễn dưới dạng hexa
như sau [5]:
𝐿𝐿 = 𝑅𝑅𝑖𝑖𝑖𝑖 ⨁ 𝑒𝑒𝑖𝑖
 { 𝑖𝑖    𝑀𝑀ℎ𝑒𝑒𝑒𝑒 = 0123456789ABCDEF 
𝑅𝑅𝑖𝑖 = 𝐿𝐿𝑖𝑖𝑖𝑖 ⨁ 𝑓𝑓𝑓𝑓𝑓𝑖𝑖𝑖𝑖 ⨁𝑒𝑒𝑖𝑖 , 𝑒𝑒𝑖𝑖 )
229
229
HộiHội
Thảo Quốc
Thảo QuốcGia
Gia2015
2015về
vềĐiện
Điện Tử,
Tử,Truyền
Nghệ Thông
Thông TinTin (ECIT
(ECIT 2015)
2015)
Khóa bí mật 𝐾𝐾 gồm 128 bit (32 số hexa) được chọn như sau: BẢNG IV. KHOẢNG CÁCH HAMMING CỦA MỘT VÀI CẶP BẢN MÃ KHI THAY
ĐỔI 1 BIT BẢN TIN RÕ 𝑀𝑀
 𝐾𝐾ℎ𝑒𝑒𝑒𝑒 = 00112233445566778899AABBCCDDEEFF  Vị trí

Trường hợp 1: Trường hợp 2:
Bản rõ 𝑀𝑀𝑗𝑗 Hàm mã hóa Hàm mã hóa
bit 𝑒𝑒 𝑚𝑚
Hàm mã hóa 𝑓𝑓 là hàm mũ và tính toán theo giá trị nhị phân. thay (16 số hexa 𝑓𝑓(𝑚𝑚𝑖𝑖 , 𝑒𝑒𝑖𝑖 ) = 𝑚𝑚𝑖𝑖 𝑖𝑖 mod 𝑝𝑝 𝑓𝑓(𝑚𝑚𝑖𝑖 , 𝑒𝑒𝑖𝑖 ) = 𝑒𝑒𝑖𝑖 𝑖𝑖 mod 𝑝𝑝
Sử dụng thuật toán nhân và bình phương có thể dễ dàng thực đổi  64 bit)
𝑗𝑗 Bản mã 𝐶𝐶𝑗𝑗 𝑑𝑑𝐻𝐻 (𝐶𝐶0 , 𝐶𝐶𝑗𝑗 ) Bản mã 𝐶𝐶𝑗𝑗 𝑑𝑑𝐻𝐻 (𝐶𝐶0 , 𝐶𝐶𝑗𝑗 )
hiện các phép tính mũ theo modulo này [1].
Do yêu cầu số 𝑝𝑝 phải là một số lớn, trong bài báo để đơn giản Chưa 01234567 875A60A6 01690489
0 0
đổi 89ABCDEF DD4861DC 53487B72
chúng tôi mới chỉ chọn số 𝑝𝑝 32 bit với bit MSB của 𝑝𝑝 có giá trị
1 11234567 77AC3950 38 715CCD70 33
là "1"; 𝑝𝑝 được chọn như sau: 89ABCDEF 516F1AF3 CB949AD8
2 21234567 682D9393 39 61B6C088 35
𝑝𝑝𝑑𝑑𝑑𝑑𝑑𝑑 = 3.541.619.869  89ABCDEF 6F019515 B42A86CC
... ... ... ... ... ...
 ↔ 𝑝𝑝𝑏𝑏𝑏𝑏𝑏𝑏 = 10111001001010110001100011001011 
30 01234565 194487F4 30 A9E0D179 36
89ABCDEF ED02549A 09D4878F
Bảng IV là một vài kết quả tính toán khoảng cách Hamming
𝑑𝑑𝐻𝐻 (𝐶𝐶0 , 𝐶𝐶𝑖𝑖 ) của các cặp bản mã khi thay đổi lần lượt từng bit 31 01234563 AB780035 24 D287E92B 30
89ABCDEF 2340FB9C 13414BC4
trong 64 bit bản rõ ban đầu 𝑀𝑀. Khóa bí mật 𝐾𝐾 được giữ cố định
... ... ... ... ... ...
tại các bước mô phỏng [5]. Hàm mã hóa 𝑓𝑓 trong sơ đồ mã hóa
thực hiện theo hai trường hợp: trường hợp 1 mã hóa theo biểu 63 01234567 7EBC520B 40 88B33D4B 25
89ABCDEB 23F17E6E 0948EF31
thức (8) và trường hợp 2 mã hóa theo biểu thức (9).
64 01234567 C6FF5110 33 4E6BAC67 31
Khoảng cách Hamming trung bình (hay là độ khuếch tán) 89ABCDE7 BA721B39 A5FCFB9B
của 64 lần thay đổi bản rõ (lần lượt từ bit 1 đến 64) được tính
theo công thức sau: BẢNG V. KHOẢNG CÁCH HAMMING CỦA MỘT VÀI CẶP BẢN MÃ KHI THAY ĐỔI
1 BIT KHÓA BÍ MẬT 𝐾𝐾
1
 𝑑𝑑𝐻𝐻(𝑡𝑡𝑡𝑡) = ∑64
𝑗𝑗𝑗𝑗 𝑑𝑑𝐻𝐻 (𝐶𝐶0 , 𝐶𝐶𝑗𝑗 )  Trường hợp 1: Trường hợp 2:
64 Khóa bí
Vị trí Hàm mã hóa Hàm mã hóa
bit thay mật 𝐾𝐾𝑗𝑗 𝑒𝑒
𝑓𝑓(𝑚𝑚𝑖𝑖 , 𝑒𝑒𝑖𝑖 ) = 𝑚𝑚𝑖𝑖 𝑖𝑖 mod 𝑝𝑝
𝑚𝑚
𝑓𝑓(𝑚𝑚𝑖𝑖 , 𝑒𝑒𝑖𝑖 ) = 𝑒𝑒𝑖𝑖 𝑖𝑖 mod 𝑝𝑝
Với trường hợp 1 tính được: đổi
(32 số hexa
𝑗𝑗 Bản mã 𝐶𝐶𝑗𝑗 𝑑𝑑𝐻𝐻 (𝐶𝐶0 , 𝐶𝐶𝑗𝑗 ) Bản mã 𝐶𝐶𝑗𝑗 𝑑𝑑𝐻𝐻 (𝐶𝐶0 , 𝐶𝐶𝑗𝑗 )
 128 bit)
 𝑑𝑑𝐻𝐻(𝑡𝑡𝑡𝑡) = 31,84 𝑏𝑏𝑏𝑏𝑏𝑏 
00112233
Chưa 44556677 875A60A6 01690489
Và trường hợp 2 là: 0 0
đổi 8899AABB DD4861DC 53487B72
CCDDEEFF
𝑑𝑑𝐻𝐻(𝑡𝑡𝑡𝑡) = 31,98 𝑏𝑏𝑏𝑏𝑏𝑏  1 10112233
44556677 C5C2F1B5 7EBFDD39
26 34
8899AABB C80DB24F 5466507C
Bảng V là một vài kết quả tính toán khoảng cách Hamming CCDDEEFF
của các cặp bản mã khi thay đổi lần lượt từng bit khóa đầu vào 2 20112233
𝐾𝐾; Bản rõ 𝑀𝑀 được giữ cố định tại các bước mô phỏng [5], và 44556677 B40F8E3A
34
72405AD9
34
8899AABB 80BAE970 35379279
cũng xét hai trường hợp sử dụng hàm mã hóa 𝑓𝑓 như đề cập ở CCDDEEFF
trên.
... ... ... ... ... ...
Chú ý, trong các bảng IV và bảng V các giá trị 𝑀𝑀𝑗𝑗 , 𝐶𝐶𝑗𝑗 và 𝐾𝐾𝑗𝑗 64 00112233
được biểu diễn theo dạng hexa; các ký tự hexa in đậm chứa các 4455667F F651D78C 82732146
34 33
8899AABB 988A9F2E F87CD709
bit đã được thay đổi so với ban đầu. CCDDEEFF
Khoảng cách Hamming trung bình của các bản mã so với 65 00112233
44556677 FC8D4B5C 1CC8A983
bản mã ban đầu khi thay đổi lần lượt từng bit của khóa 𝐾𝐾 từ bit 9899AABB 2BF6F0B5
41
105E2A90
27
1 đến bit 128 được tính theo công thức sau: CCDDEEFF
... ... ... ... ... ...
1
 𝑑𝑑𝐻𝐻(𝑡𝑡𝑡𝑡) = ∑128
𝑗𝑗𝑗𝑗 𝑑𝑑𝐻𝐻 (𝐶𝐶0 , 𝐶𝐶𝑗𝑗 )  127 00112233
128
44556677 865234A6 503150C8
13 19
8899AABB DC18249D 121C2B32
Với hai trường trường hợp hàm mã hóa tính được như sau: CCDDEEFB
128 00112233
Với trường hợp 1: 𝑑𝑑𝐻𝐻(𝑡𝑡𝑡𝑡) = 28,25 𝑏𝑏𝑏𝑏𝑏𝑏  44556677 DA5F30A6
17
1D7C449D
16
8899AABB 8C0C64DD 174D7B67
CCDDEEF7
 Và trường hợp 2: 𝑑𝑑𝐻𝐻(𝑡𝑡𝑡𝑡) = 28,23 𝑏𝑏𝑏𝑏𝑏𝑏 
230
230
Nhận xét về kết quả mô phỏng: Để đơn giản, bài báo chỉ minh họa trường hợp số nguyên tố
‫ ݌‬gồm 32 bit. Ta hoàn toàn có thể tăng độ dài từ mã cũng như
Một trong các yêu cầu khi đánh giá một hệ mật đó là tính
độ dài khóa bằng cách tăng giá trị số ‫ ݌‬lên để hệ mật an toàn
khuếch tán tại đầu ra. Theo các kết quả mô phỏng ở (15), (16) ta
hơn. Tuy nhiên, khi chọn ‫ ݌‬phải chú ý đến điều kiện số nguyên
thấy độ khuếch tán đầu ra của hệ mật khi thay đổi một bit dữ liệu
tố an toàn như đã trình bày trong mục II.A ở trên.
của bản rõ đầu vào lần lượt là 31,84 bit và 31,98 bit (tương ứng
với hai kiểu mã hóa khác nhau), các giá trị này đạt xấp xỉ một Trong khuôn khổ bài báo chỉ đề cập đến tính khuếch tán của
nửa độ dài từ mã (32 bit). Tương tự trong (18) và (19) độ khuếch hệ mật, để đánh giá hoàn chỉnh hơn về hệ mật này cần có thêm
tán của hệ mật khi thay đổi một bit của khóa cũng đạt lần lượt là các mô phỏng tính toán các phép tấn công khác nữa lên hệ mật.
28,25 bit và 28,23 bit. Chỉ với 4 vòng mã hóa nhưng hệ mật đã
đạt độ khuếch tán rất tốt, đây chính là một ưu điểm đáng chú ý TÀI LIỆU THAM KHẢO
của hệ mật này. [1] Nguyễn Bình, “Giáo trình Mật mã học”, Học viện Công nghệ Bưu chính
Viễn thông, 2013.
IV. KẾT LUẬN [2] Nguyen Minh Trung, Nguyen Binh, “Some Hybrid Crypto Systems
Constructed on Discrete Logarithm Problem”, The International
Hệ mật mã lai ghép như đề xuất trong bài báo bao gồm hai Conference on Advanced Technologies for Communications (ATC)
phép mã hóa là phép hoán vị (các bảng IP và IP-1 trong sơ đồ Hanoi, Vietnam, October, 2014.
Feistel), và phép mũ rời rạc theo hệ mật Pohlig - Hellman. Hệ [3] Mollin, Richard A., "An Introduction to Cryptography (2nd ed.)".
mật này có một số ưu điểm sau: (a) Hàm mã hóa được thực hiện Chapman and Hall/CRC, 2006.
trên bài toán logarit rời rạc nên hệ mật có tính phi tuyến, cùng [4] Frederik Vercauteren, “Discrete Logarithms in Cryptography”,
ESAT/COSIC - K.U. Leuven ECRYPT Summer School 2008.
với độ dài khóa bí mật 128 bit nên hệ mật đạt được độ an toàn
[5] Jean-Yves Chouinard - ELG 5373, “Secure Communications and Data
nhất định; (b) Do sử dụng sơ đồ Feistel nên mạch mã hóa và giải Encryption, School of Information Technology and Engineering”,
mã tương tự nhau rất thuận lợi cho việc thiết kế mạch phần cứng; University of Ottawa, April 2002.
(c) Để hệ mật có độ khuếch tán đạt khoảng một nửa độ dài từ mã [6] Pascal JUNOD, "Statistical Cryptanalysis of Block Ciphers", Thèse N0
thì hệ mật chỉ cần bốn vòng mã hóa điều này sẽ làm tăng đáng 3179, Insitute de systèmes de communication, Ècole Polytechnique
kể tốc độ mã hóa. Fédérale de Lausanne, 2005.
[7] A. Menezes, P. van Oorschot, and S. Vanstone, "Handbook of Applied
Với các ưu điểm này của hệ mật, chúng tôi nhận thấy hệ mật Cryptography", CRC Press, 1996.
này rất phù hợp để ứng dụng vào các lưu đồ thực hiện hàm băm
không khóa (MDC).
231

PHÁT TRIӆN THUҰT TOÁN XÁC LҰP KHÓA

CHO CÁC Hӊ MҰT MÃ KHÓA ĈӔI XӬNG
Hoàng Văn ViӋt1, NguyӉn Ĉӭc Thөy2, Bùi ThӃ TruyӅn3, Lѭu Hӗng DǊng3.
1
Bӝ tѭ lӋnh Thông tin liên lҥc, 2Trѭӡng Cao ÿҷng Kinh tӃ - Kӻ thuұt TP. Hӗ Chí Minh, 3Hӑc viӋn Kӻ thuұt Quân sӵ
Email: viethv76@gmail.com, thuyphulam2013@gmail.com, buithetruyen@gmail.com, luuhongdung@gmail.com
Abstract — Bài báo ÿӅ xuҩt xây dӵng 2 dҥng thuұt toán xác lұp trình thiӃt lұp khóa chung bҵng các thuұt toán này chӍ cҫn thӵc
khóa mӟi cho các hӋ mұt mã khóa ÿӕi xӭng. Các thuұt toán mӟi hiӋn 1 lҫn truyӅn dӳ liӋu nên có thӇ sӁ phù hӧp vӟi các ӭng
ÿӅ xuҩt có ѭu ÿiӇm là viӋc thiӃt lұp khóa ÿѭӧc thӵc hiӋn chӍ sau dөng ÿòi hӓi tӕc ÿӝ thӵc hiӋn cao.
mӝt lҫn truyӅn thông tin thiӃt lұp khóa. Hѫn nӳa, khóa bí mұt
còn ÿѭӧc xác thӵc vӅ nguӗn gӕc nên các thuұt toán ÿѭӧc ÿӅ xuҩt
ӣ ÿây có thӇ chӕng lҥi các kiӇu tҩn công giҧ mҥo rҩt hiӋu quҧ. II. PHÁT TRIӆN THUҰT TOÁN XÁC LҰP KHÓA MӞI
Bài báo cǊng trình bày các phân tích, ÿánh giá vӅ mӭc ÿӝ an toàn CHO CÁC Hӊ MҰT KHÓA ĈӔI XӬNG
cӫa thuұt toán mӟi ÿӅ xuҩt, cho thҩy khҧ năng ӭng dөng cӫa nó 2.1 Thuұt toán xác lұp khóa dҥng 1
trong thӵc tӃ. 2.1.1 Thӫ tөc hình thành các tham sӕ hӋ thӕng và khóa công
khai
Keywords- Symmetrical Key Cryptography System, Key
Establishment, Key Agreement Protocols, Key Exchange Protocol,
Thӫ tөc bao gӗm các bѭӟc nhѭ sau:
Key Transport Protocols. 1 - Chӑn mӝt nhóm Zp vӟi p là mӝt sӕ nguyên tӕ lӟn sao
cho bài toán logarit trong Z ∗p là khó giҧi và g là phҫn tӱ
I. ĈҺT VҨN Ĉӄ
sinh cӫa Z ∗p .
Trong lƭnh vӵc bҧo mұt thông tin, các hӋ mұt mã khóa ÿӕi
xӭng (Symmetrical Key Cryptography System) có ѭu thӃ lӟn 2 - Khóa riêng x cӫa các ÿӕi tѭӧng tham gia trao ÿәi khóa
vӅ tӕc ÿӝ thӵc hiӋn so vӟi các hӋ mұt mã khóa công khai ÿѭӧc FKӑn là mӝt sӕnguyên thӓa mãn: 1 < x < ( p − 1) .
(Public Key Cryptography System), vì vұy chúng thѭӡng ÿѭӧc 3 - Khóa công khai tѭѫng ӭng y cӫa các ÿӕi tѭӧng tham
sӱ dөng ÿӇ mã hóa các khӕi dӳ liӋu có kích thѭӟc lӟn, ÿһc biӋt gia trao ÿәi khóa ÿѭӧc tính theo công thӭc:
là trong các giao dӏch trӵc tuyӃn. y = g x mod p (1.1)
Trong các hӋ mұt mã khóa ÿӕi xӭng, viӋc thiӃt lұp mӝt 4- Công khai các giá trӏ: p, g, y. Giӳ bí mұt: x.
khóa chung (Key Establishment) cho cҧ bên gӱi/mã hóa và bên 2.1.2 Thӫ tөc xác lұp khóa
nhұn/giҧi mã là mӝt vҩn ÿӅ rҩt quan trӑng, phӭc tҥp và thѭӡng Giҧ sӱ các ÿӕi tѭӧng tham gia trao ÿәi khóa ӣ ÿây là A và
ÿѭӧc hiӋn bҵng: a) các giao thӭc thӓa thuұn khóa (Key B. Giҧ thiӃt các ÿӕi tѭӧng A và B cǊng ÿã thӕng nhҩt sӱ dөng
Agreement Protocols), ӣ ÿó mӛi bên tham gia sӁ tҥo ra thông mӝt thuұt toán mұt mã khóa ÿӕi xӭng (ví dө: DES, AES,...) ÿӇ
tin ÿӇ thӓa thuұn cho viӋc thiӃt lұp 1 khóa bí mұt dùng chung mã hóa thông tin (văn bҧn, tài liӋu,...) cҫn trao ÿәi vӟi nhau.
rӗi trao ÿәi cho nhau, vì thӃ các giao thӭc thӓa thuұn khóa còn Ĉӕi tѭӧng A có khóa riêng là xA, khóa công khai tѭѫng ӭng là
ÿѭӧc gӑi là giao thӭc trao ÿәi khóa (Key Exchange Protocol) yA; ÿӕi tѭӧng B có khóa riêng là xB và khóa công khai cӫa B
mà giao thӭc ÿҫu tiên thuӝc loҥi này ÿѭӧc ÿӅ xuҩt bӣi W. là yB. Khóa công khai cӫa A và B ÿѭӧc hình thành theo Thͯ
Diffie và M. Hellman vào năm 1976 và ÿѭӧc gӑi là giao thӭc tͭc hình thành các tham s͙ h͏ th͙ng và khóa công khai ӣ Mͭc
trao ÿәi khóa Diffie-Hellman (Diffie-Hellman Key Exchange 2.1.1. Ӣ ÿây yA và yB cҫn phҧi ÿѭӧc chӭng thӵc bӣi mӝt CA
Protocol) [1]; b) các giao thӭc chuyӇn khóa (Key Transport
(Certificate Authority) ÿáng tin cұy. Thuұt toán cho phép các
Protocols), trong ÿó khóa bí mұt ÿѭӧc sinh bӣi mӝt trong hai
ÿӕi tѭӧng A và B thiӃt lұp mӝt khóa bí mұt chung K, bao gӗm
ÿӕi tѭӧng gӱi hoһc nhұn, rӗi ÿѭӧc mã hóa và truyӅn ÿӃn ÿӕi
tѭӧng kia bҵng mӝt thuұt toán mұt mã khóa công khai nhѭ các bѭӟc nhѭ sau:
RSA [2] hay ElGamal [3]. Tuy nhiên, thӓa thuұn khóa bҵng B˱ͣc 1: chӍ thӵc hiӋn bӣi A.
giao thӭc Diffie-Hellman hay viӋc sӱ dөng các thuұt toán mұt 1 - Chӑn mӝt giá trӏ ngүu nhiên k thӓa mãn:
mã khóa công khai nhѭ RSA hay ElGamal trong các giao thӭc 1 < k < ( p − 1) . Tính giá trӏ R theo công thӭc:
chuyӇn khóa ÿӅu có chung mӝt nhѭӧc ÿiӇm căn bҧn là không k
R = ( y A ) mod p (1.2)
có khҧ năng chӕng lҥi mӝt sӕ dҥng tҩn công giҧ mҥo nhѭ tҩn 2 - Gӱi R cho B.
công “kҿ ÿӭng giӳa” (Man-In-the-Middle Attack) [4-6], do
B˱ͣc 2: ÿѭӧc thӵc hiӋn bӣi cҧ A và B.
chúng không có cѫ chӃ xác thӵc bҧn tin khi nhұn ÿѭӧc. Bài báo
ÿӅ xuҩt xây dӵng mӝt dҥng thuұt toán xác lұp khóa mӟi, ѭu 1 - A hình thành khóa bí mұt chung KAB theo công thӭc:
ÿiӇm cӫa các thuұt toán mӟi ÿӅ xuҩt là có khҧ năng xác thӵc vӅ K AB = ( y B )
(k +1). x
A
mod p (1.3)
nguӗn gӕc cӫa khóa bí mұt ÿѭӧc tҥo ra, nên có thӇ chӕng ÿѭӧc 2 - B hình thành khóa bí mұt chung KBA theo công thӭc:
các kiӇu tҩn công giҧ mҥo ÿã biӃt trong thӵc tӃ. Mһt khác, quá x
K BA = (R × y A ) mod p
B (1.4)
ISBN: 978-604-67-0635-9 232

Khóa bí mұt chung K cӫa A và B ӣ ÿây là: K BA = (R × y A ) B mod p

x
K = K AB = K BA xB (1.6)
= g k . x A mod p × g x A mod p
( ) mod p
Chú ý: = (g ( k +1). x A xB
mod p mod p = g (k +1). x A . x B mod p
)
Có thӇ gia tăng tính ngүu nhiên cho khóa bí mұt chung Tӯ (1.5) và (1.6) suy ra ÿiӅu cҫn chӭng minh là:
cӫa A và B bҵng cách sӱ dөng hàm băm (Hash function) H(.) K AB = K BA .
nhѭ sau:
2.1.4 Mӭc ÿӝ an toàn cӫa thuұt toán mӟi ÿӅ xuҩt
K A = H ( K AB )
và: Mӭc ÿӝ an toàn cӫa thuұt toán mӟi ÿӅ xuҩt có thӇ ÿѭӧc
ÿánh giá qua các khҧ năng nhѭ sau:
K B = H ( K BA )
Khi ÿó khóa bí mұt chung cӫa A và B sӁ là: a). Kh̫ năng ch͙ng ṱn công làm l͡ khóa bí m̵t
K = KA = KB
Tӯ (1.3) và (1.4) cho thҩy, mӝt ÿӕi tѭӧng thӭ 3 (kҿ tҩn công)
Ӣ ÿây: KA là khóa bí mұt chung do bên A tҥo ra, còn KB là muӕn tính ÿѭӧc khóa bí mұt chung (K) thì cҫn phҧi biӃt ÿѭӧc k
khóa bí mұt chung ÿѭӧc tҥo ra phía bên B. và xA hoһc xB nhӡ giҧi (1.1) và (1.2). ViӋc giҧi (1.1) và (1.2)
Ví dө: Giҧ sӱ A và B thӕng nhҩt sӱ dөng hӋ mã AES vӟi thӵc chҩt là giҧi bài toán logarit rӡi rҥc - DLP (Discrete
khóa 128 bit hoһc 256 bit ÿӇ trao ÿәi thông tin mұt. Khi ÿó, A Logarithm Problem) [4-6]. Nhѭ vұy, khҧ năng chӕng tҩn công
và B có thӇ sӱ dөng hàm băm MD 5 hoһc SHA-256 ÿӇ gia làm lӝ khóa bí mұt chung cӫa thuұt toán mӟi ÿӅ xuҩt phө thuӝc
tăng tính ngүu nhiên cho khóa mұt nhѭ sau: vào mӭc ÿӝ khó cӫa bài toán logarit rӡi rҥc. HiӋn tҥi, bài toán
K A = MD5( K AB ) hoһc: K A = SHA − 256( K AB ) logarit rӡi rҥc vүn ÿѭӧc coi là bài toán khó nӃu tham sӕ p và
và: các giá trӏ k , xA , xB ÿѭӧc chӑn ÿӫ lӟn ÿӇ tҩn công theo kiӇu
“vét cҥn” là không khҧ thi trong các ӭng dөng thӵc tӃ.
K B = MD5( K BA ) hoһc: K B = SHA − 256( K BA )
Nh̵n xét: b). Kh̫ năng ch͙ng ṱn công gi̫ m̩o
Ӣ thuұt toán mӟi ÿӅ xuҩt, khóa bí mұt chung cӫa 2 ÿӕi
tѭӧng A và B là: K = K AB = K BA = g ( k +1). x . x mod p , còn thông
A B Giҧ sӱ C là kҿ tҩn công giҧ mҥo, vҩn ÿӅ ÿһt ra là C có thӇ
mҥo danh A ÿӇ thiӃt lұp ÿѭӧc khóa bí mұt chung vӟi B hoһc
tin A gӱi cho B là: R = g k mod p . Nhѭ vұy, thông tin mà A C mҥo danh B ÿӇ thiӃt lұp khóa bí mұt chung vӟi A bҵng
chuyӇn cho B không phҧi là khóa bí mұt nhѭ trong các giao thuұt toán mӟi ÿӅ xuҩt hay không?
thӭc chuyӇn khóa (sӱ dөng mұt mã khóa công khai nhѭ RSA, Tr˱ͥng hͫp thͱ nh̭t, C mҥo danh A ÿӇ thiӃt lұp khóa bí
El Gamal,...) mà chӍ là thông tin ÿӇ thiӃt lұp khóa, tӯ ÿó B sӁ mұt chung vӟi B. Ĉҫu tiên C chӑn ngүu nhiên mӝt giá trӏ k
tҥo nên khóa bí mұt chung cho mình. Vì vұy, thuұt toán mӟi thӓa mãn: 1 < k < p − 1 và tính: R = g k mod p , rӗi gӱi R cho B.
ÿӅ xuҩt không phҧi là mӝt giao thӭc chuyӇn khóa ÿã ÿѭӧc biӃt Khi nhұn ÿѭӧc R, B sӁ tính khóa bí mұt chung vӟi A theo
ÿӃn trong thӵc tӃ. Mһt khác, thông tin dùng ÿӇ thiӃt lұp khóa
(1.4) và ÿѭӧc: K BA = g (k +1). xA . xB mod p . Trong khi ÿó, C cǊng
bí mұt chung ӣ ÿây chӍ ÿѭӧc tҥo ra bӣi 1 trong 2 bên và gӱi
cho bên kia mà không phҧi do cҧ 2 cùng tҥo ra rӗi trao ÿәi cho tính khóa bí mұt chung vӟi B theo (1.3), nhѭng do không biӃt
nhau nhѭ ӣ các giao thӭc thӓa thuұn khóa kiӇu Diffie- xA, nên C phҧi chӑn ngүu nhiên 1 giá trӏ ngүu nhiên x∗A ÿӇ
Hellman. Tӯ ÿó cho thҩy thuұt toán ÿѭӧc ÿӅ xuҩt ӣ ÿây là mӝt tính KAB, nên sӁ nhұn ÿѭӧc: K AB = g (k +1). x . x mod p . Do:
∗
A B
dҥng giao thӭc xác lұp khóa mӟi cho các hӋ mұt khóa ÿӕi
xӭng. x∗A ≠ x A , nên: K AB ≠ K BA , nghƭa là C ÿã thҩt bҥi trong viӋc
2.1.3. Tính ÿúng ÿҳn cӫa thuұt toán mӟi ÿӅ xuҩt mҥo danh A ÿӇ thiӃt lұp khóa bí mұt chung vӟi B. CǊng cҫn
ĈiӅu cҫn chӭng minh ӣ ÿây là: cho p là sӕ nguyên tӕ và g phҧi nhҩn mҥnh rҵng, viӋc lӵa chӑn x A ÿӇ x A = x A ӣ ÿây
∗ ∗
là phҫn tӱ sinh cӫa nhóm Z *p , 1 < x A , xB < ( p − 1) , ÿѭӧc loҥi trӯ, vì ÿiӅu ÿó xҧy ra cǊng ÿӗng nghƭa vӟi viӋc giҧi
y A = g x A mod p , yB = g x mod p ,
ÿѭӧc bài toán logarit rӡi rҥc.
B
1 < k < ( p − 1) . NӃu:
(k +1). x A Tr˱ͥng hͫp thͱ hai, C mҥo danh B ÿӇ thiӃt lұp khóa
R = ( y A ) mod p , K AB = ( y B ) mod p , K BA = (R × y A )x mod p
k
chung vӟi A. Khi ÿó, A sӁ chӑn k thӓa mãn: 1 < k < p − 1 ÿӇ
B
thì: K AB = K BA . tính R theo (1.2) rӗi gӱi cho B, mà thӵc chҩt ngѭӡi nhұn ӣ
ÿây là C. Sau ÿó A sӁ tính khóa bí mұt chung KAB theo (1.3).
Chͱng minh: Do C mҥo danh B, nên A sӁ sӱ dөng khóa công khai cӫa B ÿӇ
Thұt vұy, tӯ (1.1) và (1.3) ta có: tính khóa bí mұt chung và nhұn ÿѭӧc:
K AB = ( y B )
(k +1). x A
mod p K AB = g ( k +1). x A . xB
mod p . Khi nhұn ÿѭӧc R, C tính khóa bí
(1.5)
(k +1). x A (k +1). x A . x B mұt chung vӟi A theo (1.4), ÿiӅu cҫn chú ý ӣ ÿây là do C
= (g mod p )
xB
mod p = g mod p
không biӃt ÿѭӧc khóa bí mұt xB cӫa B nên C phҧi chӑn ngүu
Mһt khác, tӯ (1.1), (1.2) và (1.4) ta lҥi có:
*
nhiên mӝt giá trӏ x B vӟi xác suҩt ÿӇ xB∗ = xB là rҩt nhӓ. Do
ÿó giá trӏ KBA mà C nhұn ÿѭӧc ӣ ÿây sӁ là:
K BA = g ( k +1). x A . xB mod p . DӉ dàng thҩy rҵng: K AB ≠ K BA do
∗
233

xB∗ ≠ xB . Nói cách khác, C ÿã không thiӃt lұp ÿѭӧc khóa K BA = ( R × y A ) xB mod p (2.8)
chung vӟi A. Khóa bí mұt chung K cӫa A và B ӣ ÿây là:
Nhѭ vұy là trong cҧ 2 trѭӡng hӧp C ÿӅu không ÿҥt ÿѭӧc K = K AB = K BA
mөc ÿích giҧ mҥo cӫa mình. Nh̵n xét:
2.2 Thuұt toán xác lұp khóa dҥng 2 - Tѭѫng tӵ thuұt toán ÿӅ xuҩt trong Mͭc 2.1, thuұt toán ÿӅ
2.2.1 Thӫ tөc hình thành tham sӕ hӋ thӕng và khóa xuҩt ӣ ÿây cǊng là mӝt dҥng giao thӭc xác lұp khóa mӟi mà
không phҧi là các dҥng giao thӭc chuyӇn khóa hay thӓa thuұn
Thӫ tөc bao gӗm các bѭӟc nhѭ sau: khóa ÿã biӃt trong thӵc tӃ.
1 - Sinh 2 sӕ nguyên tӕ lӟn và mҥnh: p và q, sao cho: - Thay vì gӱi cho B giá trӏ R nhѭ ӣ thuұt toán dҥng 1, ӣ
q | ( p − 1) hay: p = N × q + 1 , vӟi N là sӕ nguyên. thuұt toán dҥng này A gӱi cho B cһp (E,S) ÿѭӧc tҥo ra tӯ R và
2 - Chӑn g = α ( p −1) / q mod p , là phҫn tӱ sinh có bұc q cӫa khóa bí mұt xA cӫa mình theo (2.3) và (2.4). Nhӡ ÿó B có thӇ
*
nhóm Zp , nghƭa là: 1 < g < p và: g q ≡ 1 mod p , ӣ khôi phөc lҥi giá trӏ R tӯ cһp (E,S) nhұn ÿѭӧc và khóa công
khai yA cӫa A theo (2.6). Tӯ giá trӏ R này (trong B˱ͣc 2 ÿѭӧc
*
ÿây: α∈Zp . ký hiӋu là R ), B sӁ tҥo ÿѭӧc khóa bí mұt dùng chung vӟi A.
Vҩn ÿӅ quan trӑng là ӣ chӛ, R ÿѭӧc khôi phөc tӯ (E,S) nhӡ
3 - Khóa riêng x ÿѭӧc Kunh WKjnh bҵng Fich FKӑn sӕ
khóa công khai cӫa A theo (2.6) chӭng tӓ rҵng (E,S) phҧi ÿѭӧc
nguyên thӓa mãn: 1 < x < q .
A tҥo ra tӯ khóa bí mұt cӫa mình theo (2.3) và (2.4). ĈiӅu ÿó
4 - Khóa công khai ÿѭӧc tính theo công thӭc: có nghƭa là (E,S) và do ÿó khóa bí mұt mà B tҥo ÿѭӧc (KBA)
y = g x mod p (2.1) phҧi có nguӗn gӕc tӯ A. Ĉây chính là cѫ chӃ xác thӵc nguӗn
5 - Công khai các giá trӏ: p, g, y. Giӳ bí mұt: x. gӕc khóa bí mұt cӫa thuұt toán mӟi ÿӅ xuҩt, nhӡ ÿó có thӇ
2.2.2 Thӫ tөc xác lұp khóa chӕng ÿѭӧc các kiӇu tҩn công giҧ mҥo khóa bí mұt.
- Trong B˱ͣc 2 cӫa thuұt toán mӟi ÿӅ xuҩt, B chӍ tҥo khóa
Các ÿӕi tѭӧng cҫn trao ÿәi thông tin mұt cùng thӕng nhҩt bí mұt chung vӟi A khi kiӇm tra thҩy thӓa mãn ÿiӅu kiӋn:
chӑn các tham sӕ p , q và g rӗi chӑn khóa riêng và tính khóa E = E . Tӯ (2.3), (2.4), (2.6) và (2.7) cho thҩy ÿiӅu kiӋn này
công khai cӫa mình theo Thͯ tͭc hình thành khóa công khai ӣ chӍ ÿѭӧc thӓa mãn nӃu (E,S) ÿѭӧc truyӅn tӯ A sang B nguyên
Mͭc 2.2.1. Giҧ sӱ ÿӕi tѭӧng gӱi/mã hóa thông tin ký hiӋu là A vҽn mà không có bҩt kǤ sӵ thay ÿәi nào cҧ. Mӝt sӵ thay ÿәi
có khóa bí mұt là xA, khóa công khai tѭѫng ӭng cӫa A là yA; giá trӏ cӫa E hoһc S hay ÿӗng thӡi cҧ hai ÿӅu dүn ÿӃn kӃt quҧ
Ĉӕi tѭӧng nhұn/giҧi mã thông tin ký hiӋu là B có khóa bí mұt là ÿiӅu kiӋn: E = E sӁ không ÿѭӧc thӓa mãn. ĈiӅu ÿó có nghƭa
là xB và khóa công khai cӫa B là yB. Ӣ ÿây yA và yB cǊng cҫn rҵng, nӃu ÿiӅu kiӋn ÿã chӍ ra ÿѭӧc thӓa mãn thì giá trӏ R ÿѭӧc
phҧi ÿѭӧc chӭng thӵc bӣi mӝt CA (Certificate Authority) tҥo ra ӣ phía bên A sӁ ÿѭӧc khôi phөc chính xác ӣ phía bên B
ÿáng tin cұy. Các ÿӕi tѭӧng A và B thӕng nhҩt sӱ dөng mӝt ( R = R ) và do ÿó khóa bí mұt chung KBA ÿѭӧc tҥo ra phía bên
thuұt toán mұt mã khóa ÿӕi xӭng (ví dө: DES, AES,...) ÿӇ mã B sӁ bҵng chính khóa bí mұt ÿѭӧc tҥo ra ӣ phía bên A. Nói
hóa thông tin (văn bҧn, tài liӋu,...) cҫn trao ÿәi vӟi nhau, khi khác ÿi, khóa bí mұt ÿã ÿѭӧc truyӅn toàn vҽn tӯ phía A sang
ÿó thuұt toán ÿӇ thiӃt lұp mӝt khóa bí mұt chung cho phép A cho phía B. Ĉây chính là cѫ chӃ xác thӵc tính toàn vҽn cӫa
mã hóa thông tin, B giҧi mã thông tin hoһc ngѭӧc lҥi, bao gӗm khóa bí mұt ӣ thuұt toán mӟi ÿӅ xuҩt dҥng 2.
các bѭӟc nhѭ sau: 2.2.3 Tính ÿúng ÿҳn cӫa thuұt toán ÿӅ xuҩt
B˱ͣc 1: ChӍ thӵc hiӋn bӣi A. ĈiӅu cҫn chӭng minh ӣ ÿây là: cho p, q là 2 sӕ nguyên tӕ
1 - Chӑn ngүu nhiên mӝt giá trӏ k thӓa mãn: 1 < k < q . ÿӝc lұp thӓa mãn: q | ( p − 1) , g = α ( p −1) / q mod p , α ∈ Z *p ,
2 - Tính giá trӏ R theo công thӭc:
1 < x A , xB < q , y A = g x mod p , y B = g xB mod p ,
A
1< k < q ,
k
R = ( y A ) mod p (2.2)
3 - Tính thành phҫn E theo công thӭc:
k
,
R = ( y A ) mod p E = R mod q , S = x A × (k − E ) mod q . NӃu:
mod p , R = g × ( y A ) mod p ,
x . (k +1 ) S E
E = R mod q (2.3) K AB = ( y B )
A
4 - Tính thành phҫn S theo công thӭc: , thì: và

x
K BA = (R × y A ) B mod p E = R mod q E =E
S = x A × (k − E ) mod q (2.4) K AB = K BA .
5 - Gӱi (E,S) cho ÿӕi tѭӧng B. Chӭng minh:
B˱ͣc 2: Ĉѭӧc thӵc hiӋn bӣi cҧ A và B. Thұt vұy, tӯ (2.1) và (2.4) ta có:
1 - A hình thành khóa bí mұt KAB theo công thӭc: E
x . ( k +1)
R = g S × ( y A ) mod p
K AB = ( y B ) A mod p (2.5) E
2 - B hình thành khóa bí mұt KBA theo các bѭӟc: = g x A .(k − E ) × g x A mod p
( ) mod p (2.9)
2.1 - Tính giá trӏ R theo công thӭc: = g ( k. xA
×g − xA . E
×g xA . E
)mod p
E
R = g S × ( y A ) mod p (2.6) k .xA
= g mod p
2.2 - Tính giá trӏ E theo công thӭc:
Tӯ (2.2) và (2.9) suy ra: R = R (2.10)
E = R mod q (2.7)
Tӯ (2.3), (2.7) và (2.10) suy ra ÿiӅu cҫn chӭng minh thӭ
2.3 - KiӇm tra nӃu E = E thì hình thành khóa bí mұt nhҩt:
KBA theo công thӭc: E = R mod q = R mod q = E
234

Tӯ (2.1), (2.2) và (2.5) ta có: III. KӂT LUҰN

x A . (k + )1
K AB = ( y B ) mod p Bài báo ÿӅ xuҩt 2 dҥng thuұt toán xác lұp khóa mӟi cho
x A . ( k +1) (2.11) các hӋ mұt khóa ÿӕi xӭng, các thuұt toán mӟi ÿӅ xuҩt có các
= (g xB
mod p ) mod p
ÿһc ÿiӇm cѫ bҧn nhѭ sau:
= g (k +1). x A . x B mod p
- ThiӃt lұp khóa bí mұt chung giӳa các ÿӕi tѭӧng tham
Mһt khác, tӯ (2.1), (2.8) và (2.10) ta lҥi có: gia giao dӏch chӍ phҧi thӵc hiӋn mӝt 1 lҫn truyӅn dӳ liӋu duy
xB
K BA = (R × y A ) mod p nhҩt tѭѫng tӵ nhѭ các giao thӭc chuyӇn khóa sӱ dөng mұt mã
= (R × y A ) B mod p
x (2.12) khóa công khai.
xB - Thông tin ÿѭӧc chuyӇn tӯ ÿӕi tѭӧng gӱi/mã hóa sang
= g k . x A mod p × g x A mod p
( ) mod p ÿӕi tѭӧng nhұn/giҧi mã hoһc ngѭӧc lҥi, không phҧi là khóa bí
=g ( k +1). x A . xB
mod p mұt mà chӍ là thông tin dùng ÿӇ thiӃt lұp khóa chung giӳa 2
Tӯ (2.11) và (2.12) ta có ÿiӅu cҫn chӭng minh thӭ hai: ÿӕi tѭӧng, tѭѫng tӵ nhѭ thông tin dùng ÿӇ thӓa thuұn khóa
K AB = K BA = K trong các giao thӭc trao ÿәi khóa. Tuy nhiên, thông tin này chӍ
Nhѭ vұy tính ÿúng ÿҳn cӫa thuұt toán mӟi ÿӅ xuҩt ÿã cҫn truyӅn ÿi theo 1 chiӅu, do ÿó ӣ các thuұt toán mӟi ÿӅ xuҩt
ÿѭӧc chӭng minh. viӋc truyӅn dӳ liӋu chӍ cҫn thӵc hiӋn 1 lҫn duy nhҩt.
2.2.4 Tính an toàn cӫa thuұt toán mӟi ÿӅ xuҩt - Khóa bí mұt chung ÿѭӧc xác thӵc vӅ nguӗn gӕc và tính
toàn vҽn (chӍ có ӣ dҥng thuұt toán thӭ 2), vì thӃ các thuұt toán
Mӭc ÿӝ an toàn cӫa thuұt toán mӟi ÿӅ xuҩt ӣ dҥng 2 cǊng này có khҧ năng chӕng ÿѭӧc các dҥng tҩn công giҧ mҥo ÿã
ÿѭӧc ÿánh giá qua các khҧ năng nhѭ sau: biӃt trong thӵc tӃ.
a) Kh̫ năng ch͙ng ṱn công làm l͡ khóa bí m̵t Tính hiӋu quҧ và mӭc ÿӝ an toàn cӫa các thuұt toán mӟi
ÿӅ xuҩt cho thҩy khҧ năng ӭng dөng cӫa chúng trong thӵc tӃ là
Phân tích tѭѫng tӵ nhѭ ӣ Mөc 2.1.4 a) có thӇ thҩy rҵng rҩt khҧ quan.
khҧ năng chӕng tҩn công làm lӝ khóa bí mұt cӫa 2 thuұt toán
này là nhѭ nhau và ÿӅu phө thuӝc vào tính khó giҧi cӫa bài TÀI LIӊU THAM KHҦO
toán logarit rӡi rҥc. [1] W. Diffie & M. Hellman, “New Directions in Cryptography”, IEEE
b) Kh̫ năng ch͙ng ṱn công gi̫ m̩o Trans. On Info. Theory, IT-22(6):644-654, 1976.
Nhѭ ÿã chӍ ra trong phҫn Nh̵n xét cӫa Mͭc 2.2.2, nӃu [2] R. L. Rivest, A. Shamir, and L. M. Adleman, “A Method for Obtaining
Digital Signatures and Public Key Cryptosystems”, Commun. of the
ÿiӅu kiӋn kiӇm tra: E = E không ÿѭӧc thӓa mãn thì B có thӇ ACM, Vol. 21, No. 2, pp. 120-126, 1978.
khҷng ÿӏnh cһp (E,S) nhұn ÿѭӧc hoһc không phҧi do A gӱi ÿӃn [3] T. ElGamal, “A public key cryptosystem and a signature scheme based
hoһc ÿã bӏ thay ÿәi trong quá trình truyӅn ÿi tӯ A, vì thӃ khóa on discrete logarithms”, IEEE Transactions on Information Theory. Vol.
mұt chung vӟi A sӁ không ÿѭӧc tҥo ra. Phân tích tѭѫng tӵ nhѭ IT-31, No. 4. pp.469–472, 1985.
ӣ mөc 2.1.4 b) cho thҩy ngay cҧ trѭӡng hӧp kҿ tҩn công mҥo [4] A. Menezes, P. van Oorschot and S. Vanstone, “Handbook of Applied
danh A tҥo ÿѭӧc cһp (E,S) thӓa mãn ÿiӅu kiӋn kiӇm tra nhѭ ÿã Cryptography”, Boca Raton, Florida: CRC Press, 1997.
chӍ ra thì cǊng không thӇ thiӃt lұp ÿѭӧc khóa bí mұt chung vӟi [5] D.R Stinson, “Cryptography: Theory and Practice”, CRC Press 1995.
B. [6] Wenbo Mao, “Modern Cryptography: Theory and Practice”, Prentice
Hall PTR, 2003.
235

Nén tín hiệu ECG và bảo mật thông tin bệnh nhân
Nguyễn Lương Nhật1, Đào Duy Liêm2, Nguyễn Thị Minh Thy2
Học Viện Công Nghệ Bưu Chính Viễn Thông, cơ sở TP Hồ Chí Minh
1
2
Trường Đại học Công Nghệ Sài Gòn
Email: nhatnl@ptithcm.edu.vn, liem.daoduy@stu.edu.vn, thy.nguyenthiminh@stu.edu.vn
Abstract— Bài báo này trình bày một phương pháp nén tín hiệu bài viết này tín hiệu ECG được lựa chọn làm đối tượng chứa
điện tim (ECG – Electrocardiography) sử dụng thuật toán TP tin. Thông tin mật được nhúng trực tiếp ở miền không gian vào
(Turning Point) kết hợp với kỹ thuật giấu tin để bảo mật thông đối tượng chứa để đảm bảo tốc độ của hệ thống.
tin bệnh nhân. Tín hiệu ECG ban đầu sẽ được nén với tỉ lệ 2:1 Để quản lý thông tin trong các hệ thống chẩn đoán bệnh từ
trước khi dữ liệu của bệnh nhân được nhúng vào. Thuật toán mã
xa, sự kết hợp của kỹ thuật nén, mật mã và giấu tin sẽ làm tăng
hóa AES (Advanced Encryption Standard) cùng hàm băm SHA-
3 (Secure Hash Algorithm-3) được sử dụng để tăng tính bảo mật hiệu quả kênh truyền đồng thời tăng độ bảo mật cho thông tin
và xác thực cho thông tin bệnh nhân trước khi nhúng. Toàn bộ bệnh nhân. Hệ thống kết hợp này sẽ tạo nên một kênh truyền
hệ thống được thí nghiệm trên các dữ liệu ECG khác nhau lấy từ hoàn hảo, cung cấp đầy đủ tính toàn vẹn dữ liệu, tính bảo mật
cơ sở dữ liệu physioNet (www.physionet.org). Kết quả thực và tính sẵn sàng.
nghiệm cho thấy thông tin mật được bóc tách hoàn toàn chính
xác trong khi tín hiệu ECG được giải nén có rất ít sai khác so với II. NÉN TÍN HIỆU ECG DÙNG TURNING POINT
tín hiệu gốc. Tín hiệu ECG có tần số từ 0.05 Hz đến 100 Hz, trong khi
các hệ thống thu nhận tín hiệu ECG thường lấy mẫu cao hơn
Keywords- ECG Compression, ECG Steganography, SHA-3,
Turning Point Algorithm. rất nhiều so với tần số lớn nhất của tín hiệu [9]. Thuật toán TP
ban đầu được đề xuất bởi Mueller [5] để giảm mẫu của tín hiệu
ECG từ 200 Hz xuống 100 Hz qua việc lựa chọn giữ lại các
I. GIỚI THIỆU
mẫu tín hiệu quan trọng và giảm bớt các mẫu ít quan trọng hơn.
Cùng với nhu cầu ngày càng cao của con người và để đáp Thuật toán TP xử lý ba điểm dữ liệu tại một thời điểm, lưu
ứng với thời kỳ dân số già, các hệ thống chẩn đoán bệnh từ xa giữ điểm đầu tiên và gán nó như là điểm tham chiếu X0. Hai
được ứng dụng nhiều trong thực tế. Một số tín hiệu như điện điểm tiếp theo trở thành X1 và X2, tùy thuộc vào thời điểm nó
tim, huyết áp, nhiệt độ, trị số đường,… của bệnh nhân có thể giữ bước ngoặt (thay đổi độ dốc) mà X1 hay X2 được giữ lại và
được thu thập tại nhà qua các cảm biến sau đó truyền và chẩn trở thành điểm tham chiếu tiếp theo. Các bước thực hiện của
đoán bệnh bằng các hệ thống theo dõi bệnh nhân từ xa. Dữ liệu thuật toán như sau:
này cùng với các thông tin bí mật của bệnh nhân được truyền - Bước 1: Đọc các mẫu tín hiệu ECG.
qua các kênh không an toàn và được lưu trữ trong máy chủ của - Bước 2: Lưu giữ điểm đầu tiên X0 và xét hai điểm tiếp
bệnh viện hay phòng khám [1]. theo X1, X2.
Trong thời đại công nghệ thông tin đa truyền thông tiên tiến - Bước 3: Nếu (X1 - X0)(X2 - X1) < 0 thì giữ lại điểm X1,
như hiện nay, việc rò rỉ thông tin có tính chất riêng tư càng trở ngược lại thì giữ X2.
nên có nguy cơ cao hơn bao giờ hết, tính riêng tư và bảo mật - Bước 4: Gán điểm vừa giữ lại làm điểm tham chiếu và
của bệnh nhân cũng nằm trong những nguy cơ đó. Với sự phát thực hiện lại từ bước 2 tới bước 4 cho đến khi kết thúc.
triển của các hệ mật mã, những thông tin này ngày càng an - Bước 5: Xây dựng lại tín hiệu sau khi nén.
toàn nếu được bảo vệ đúng.
Trong bài viết này, chúng tôi trình bày một phương pháp
bảo mật thông tin bệnh nhân sử dụng kỹ thuật giấu tin trong tín
hiệu ECG kết hợp với các thuật toán mật mã tiên tiến (AES [2]
và SHA-3 [3]) để tăng tính bảo mật và chứng thực cho dữ liệu.
Đồng thời để thuận lợi cho việc lưu trữ và truyền dẫn, thuật
toán nén tín hiệu Turning Point được áp dụng nhằm giảm đi
các mẫu tín hiệu ít quan trọng với tỉ lệ nén 2:1 nhưng vẫn giữ
được các đặc trưng quan trọng trong tín hiệu ECG [4], [5].
Trong [6], [7] các tác giả đã thực hiện nhúng thông tin bệnh
nhân vào tín hiệu ECG để đảm bảo tính riêng tư và bảo mật của
bệnh nhân. Trong khi [6], thông tin được nhúng mà không sử
dụng bất kỳ thuật toán mã hóa nào, còn trong [7] một lớp mã
hóa được thực hiện nhưng tính xác thực thông tin người dùng
chưa cao. Trong [8] chúng tôi đã thực hiện nhúng thông tin mật
vào cả phần âm thanh và hình ảnh của video chứa, còn trong Hình 1. Tín hiệu ECG 118e00m trước và sau khi nén với TP
ISBN: 978-604-67-0635-9 236

Một khuyết điểm của thuật toán này là các mẫu tín hiệu Tín hiệu Thông tin mật
Khóa mật
được giữ lại không đại diện cho khoảng thời gian cách đều ECG gốc của bệnh nhân
nhau. Tuy nhiên sự biến dạng cục bộ này là không đáng kể khi
tín hiệu ECG được khôi phục lại độ phân giải gốc bằng phương
pháp nội suy. Hình 1 mô tả 1000 mẫu tín hiệu ECG (118e00m 256 bit
Nén dùng Mã hóa SHA-3
lấy từ physioNet) trước và sau khi nén với thuật toán TP.
TP AES 384 bit
III. GIẤU TIN TRONG TÍN HIỆU ECG
Giấu tin là kỹ thuật ẩn các dữ liệu nhạy cảm bên trong các
phương tiện chứa khác mà không gây ra quá nhiều sự thay đổi 128 bit
ECG Nhúng
trên đối tượng chứa tin. Các kỹ thuật giấu tin thường được thiết đã nén
kế để đảm bảo an toàn cho thông tin ẩn với sự biến dạng tối
thiểu của tín hiệu chủ và thường được đánh giá qua các tiêu
chí: tính vô hình của thông tin ẩn giấu, tính toàn vẹn dữ liệu và ECG
tính bảo mật. Ngoài ra để có thể ứng dụng cho các hệ thống chứa thông tin mật
thời gian thực, kỹ thuật giấu tin còn phải đảm bảo tính sẵn Hình 2. Quá trình mã hóa, nén và nhúng tại phía phát
sàng.
Trong [8] chúng tôi thực hiện nhúng thông tin mật vào âm Tín hiệu ECG gốc cung cấp từ các cảm biến hoặc từ cơ sở
thanh và hình ảnh của video 3D dùng thuật toán Parity với việc dữ liệu ECG sẽ được nén trực tiếp bằng thuật toán TP, quá
xác định số bit 1 trong khối dữ liệu. Trong bài báo này để đảm trình nén được thực hiện tuần tự như trong phần II cho ngõ ra
bảo tính sẵn sàng cho hệ thống và giảm bớt các tính toán, là tín hiệu ECG đã nén và được sử dụng làm đối tượng chứa
chúng tôi lựa chọn kỹ thuật giấu tin LSB (Least Significant cho công đoạn giấu tin.
Bit). Gắn với tên gọi của nó, bit thông tin mật sẽ được che giấu Khóa mật ở ngõ vào trước tiên sẽ được tạo chứng thực bởi
bằng cách thay thế vào vị trí có trọng số thấp nhất của một mẫu hàm băm SHA-3. Ngõ ra khối này gồm 384 bit được chia làm
tín hiệu ECG. Và tại đầu thu, thông tin sẽ được lấy ra bằng 2 phần: 256 bit đầu dùng làm khóa cho tầng mã hóa và 128 bit
cách trích xuất từ các bit có trọng số thấp nhất. sau cung cấp khóa cho quá trình nhúng thông tin.
Có thể mô tả quá trình nhúng và tách một bit thông tin mật Thông tin mật sẽ được mã hóa bởi thuật toán AES với khóa
vào một mẫu tín hiệu ECG bởi các công thức sau: dùng để mã hóa là 256 bit đầu của giá trị băm cung cấp bởi
Ei' Ei – Ei mod 2 Si (1) khối SHA-3. Ngõ ra tại đây là dữ liệu mật đã được mã hóa và
được nhúng vào tín hiệu ECG sau khi nén, khóa dùng để nhúng
Si' Ei' mod 2 (2) được lấy từ 128 bit sau của giá trị băm. Quá trình nhúng thông
Với Ei, E’i là các mẫu tín hiệu ECG trước và sau khi nhúng tin được thực hiện bằng thuật toán LSB như trong phần III, các
có định dạng là số nguyên. Si là bit thông tin mật cần nhúng và bit thông tin mật sẽ được nhúng phân tán trên tất cả các đạo
S’i là bit thông tin mật tách được tại đầu thu. trình của tín hiệu ECG để giảm sự tác động lên đối tượng chứa.
Bảng 1 cho thấy quả kết quả nhúng một ký tự A có mã Như vậy, tín hiệu ECG có chứa dữ liệu mật tại ngõ ra phía
ASCII là 65 (giá trị nhị phân là 1000001) vào 7 mẫu của tín phát sẽ truyền tới phía thu. Thời gian truyền tin được rút ngắn
hiệu ECG 118e00m lấy từ cơ sở dữ liệu physioNet. đáng kể vì thông tin cần truyền đã được nén bởi thuật toán TP.
Người bệnh hoàn toàn yên tâm về tính bảo mật thông tin cá
BẢNG 1. KẾT QUẢ NHÚNG KÝ TỰ A VÀO 7 MẪU TÍN HIỆU nhân của mình bởi độ an toàn của các kỹ thuật giấu tin và mã
hóa tiên tiến.
Ei 94 192 151 161 166 163 157
Si 1 0 0 0 0 0 1 B. Phía thu
Phía thu sử dụng khóa mật cùng tín hiệu ECG chứa dữ liệu
E’i 95 192 150 160 166 162 157
từ đầu phát gởi đến để tiến hành bóc tách thông tin và giải nén
IV. MÔ HÌNH HỆ THỐNG khi cần thiết. Các bước thực hiện được mô tả như trong hình 3.
Tương tự như phía phát, khóa mật ở ngõ vào phía thu sẽ
Mô hình hệ thống với hai công đoạn chính: phát và thu. được chứng thực bởi hàm băm SHA-3. 384 bit ngõ ra được
Khối phát thực hiện nén dữ liệu và nhúng thông tin nhận dạng chia làm 2 phần, 256 bit đầu cung cấp khóa cho quá trình giải
bệnh nhân, khối thu thực hiện tách thông tin nhận dạng và khôi mã AES và 128 bit sau dùng làm khóa để bóc tách thông tin.
phục dữ liệu ECG. Tất cả giai đoạn: nén, mã hóa, nhúng, Tín hiệu ECG có chứa dữ liệu mật (từ đầu phát gởi đến hay
chứng thực… được giải thích tuần tự trong các phần sau. từ các tập tin lưu trữ) được tiến hành bóc tách thông tin với
A. Phía phát khóa tách là 128 bit sau của giá trị băm. Tín hiệu này đồng thời
có thể hiển thị trên màn hình (hoặc in ra giấy) để các bác sĩ
Phía phát sử dụng các ngõ vào để cung cấp cho quá trình
chẩn đoán bệnh. Kết quả của quá trình bóc tách thông tin là dữ
truyền tin bao gồm: khóa mật, dữ liệu mật của bệnh nhân và tín
liệu mật của người bệnh đã được mã hóa. Dữ liệu này sau đó sẽ
hiệu ECG gốc. Hình 2 mô tả các bước thực hiện mã hóa, nén
được đưa qua khối giải mã AES với khóa dùng để giải mã lấy
và nhúng thông tin tại phía phát với ngõ ra là tín hiệu ECG
từ 256 bit đầu của giá trị băm cho ngõ ra là thông tin mật của
chứa thông tin nhận dạng bệnh nhân đã được nén với tỉ lệ 2:1.
bệnh nhân từ đầu phát gởi đến.
237

ECG
Khóa mật
chứa thông tin mật
128 bit SHA-3

Tách
384 bit
Giải mã 256 bit

Giải nén
AES
Tín hiệu ECG Thông tin mật

giải nén của bệnh nhân
Hình 3. Quá trình tách, giải mã và giải nén tại phía thu
Giả sử tại phía thu, người nhận không có khóa giải mã đúng
(hay không được xác thực) thì tại ngõ ra không tồn tại thông tin Hình 4. Tín hiệu ECG s0303lrem ban đầu
mật của bệnh nhân, người nhận chỉ nhận được tín hiệu ECG
giống như ngõ vào. Trong một số trường hợp, tín hiệu ECG
cần được khôi phục độ phân giải gốc. Tín hiệu này được đưa
qua khối giải nén sử dụng phương pháp nội suy và cho ngõ ra
là tín hiệu ECG tương tự như tín hiệu gốc.
V. KẾT QUẢ THỰC NGHIỆM VÀ BIỆN LUẬN
Toàn bộ thí nghiệm này được chúng tôi thực hiện trên
Matlab 2015a. Các tín hiệu ECG lấy từ cơ sở dữ liệu chẩn đoán
PTB của physioNet thu nhận từ 13 người khác nhau tuổi từ 17
đến 81, mỗi người có 15 đạo trình điện tim (DI, DII, DIII, aVR,
aVL, aVF, V1, V2, V3, V4, V5, V6, Vx, Vy, Vz) được đo trong 10
giây và lấy mẫu ở tần số 1 KHz cùng độ phân giải 16 bit.
Thông tin mật của bệnh nhân chính là file text đính kèm.
Để đánh giá kết quả chúng tôi sử dụng tham số PRD
(Percent of Root squared mean Difference) [10] để so sánh sự
khác nhau của tín hiệu ECG trước và sau khi nhúng, trước khi
nén và sau khi giải nén. Tham số này phản ánh khoảng cách
tương đối giữa hai tín hiệu (PRD = 0 nếu hai tín hiệu giống Hình 5. Tín hiệu s0303lrem sau khi nén và nhúng thông tin
nhau) và được cho bởi:
N
¦ xi yi
2
PRD 100 u i 1
N (3)
¦
i 1
x2
i
Với x và y là các tín hiệu ECG cần so sánh.

Một tham số khác dùng để đánh giá hiệu năng của hệ thống
là tỉ lệ nén (CR – Compression Ratio), đây là tỉ số giữa số bit
ban đầu (Bi) và số bit sau khi nén (Bo):
Bi
CR (4)
Bo
Trong mô hình của chúng tôi, Bi là tổng số bit của tín hiệu
ECG gốc và dữ liệu mật của bệnh nhân trong khi Bo sẽ là số bit
của tín hiệu ECG ở ngõ ra khối phát.
Hình 4 cho thấy tín hiệu ECG của các đạo trình D1, aVR, V6
và Vz của một bệnh nhân nữ 32 tuổi (s0303lrem trong thư viện
PTB của PhysioNet). Hình 5 là kết quả sau khi nén và giấu
thông tin bệnh nhân (2473 byte) ở các đạo trình tương ứng. Hình 6. Tín hiệu s0303lrem sau khi giải nén
238

Kết quả mô phỏng cho thấy tín hiệu ECG sau khi được nén BẢNG 3. THỜI GIAN TRUNG BÌNH CÁC BƯỚC THỰC HIỆN
và nhúng lượng thông tin khá lớn (hình 5) nhưng vẫn giữ được
Mã hóa / Nhúng / Nén /
dạng sóng như ban đầu (hình 4). Qua đó các bác sĩ hoàn toàn Tổng
có thể chẩn đoán bệnh cho bệnh nhân dựa vào tín hiệu đã nén. Giải mã AES Tách Giải nén (giây)
(giây) (giây) (giây)
Hình 6 cho thấy tín hiệu ECG sau khi giải nén bằng phương
pháp nội suy. Bằng mắt thường, không thể nhận ra sự khác biệt Đầu phát 0.1669 0.0010 0.0244 0.1923
giữa tín hiệu gốc và tín hiệu khôi phục được, nhưng tham số Đầu thu 0.1874 0.0005 0.0122 0.1911
PRD sẽ cho thấy sự khác biệt này. Bảng 2 trình bày hiệu năng
của hệ thống qua tỉ lệ nén, tham số so sánh PRD của tín hiệu I. KẾT LUẬN
ECG trước và sau khi nhúng, trước khi nén và sau khi giải nén.
Trong bài báo này, chúng tôi đề xuất phương pháp bảo mật
Kết quả thực nghiệm từ bảng 2 cho thấy thuật toán giấu tin
cho thông tin bệnh nhân sử dụng các thuật toán mã hóa kết hợp
của chúng tôi cho tính vô hình cao hơn rất nhiều so với các
với kỹ thuật giấu tin trong tín hiệu ECG. Ngoài ra để thuận lợi
nghiên cứu liên quan (0.04 % so với 0.3 % trong [1] và 0.24 %
cho việc lưu trữ và truyền thông, tín hiệu ECG gốc còn được
trong [12]). Và tại đầu thu dữ liệu mật được trích xuất một cách
nén lại với thuật toán Turning Point. Các thí nghiệm được
chính xác đảm bảo tính toàn vẹn dữ liệu.
chúng tôi thực hiện trên tất cả các đạo trình của tín hiệu ECG
Thông tin bệnh nhân được bảo vệ an toàn bởi hai lớp bảo
mẫu lấy từ cơ sở dữ liệu physioNet. Kết quả thí nghiệm chỉ ra
mật: mã hóa và giấu tin. Giấu tin là lớp ngụy trang ngoài cùng,
rằng mô hình đề xuất phù hợp với các hệ thống chăm sóc sức
toàn bộ thông tin bệnh nhân được phân bố hợp lý vào các tín
khỏe thời gian thực và dễ dàng tích hợp lên phần cứng.
hiệu ECG. Không thể nhận ra sự khác biệt của tín hiệu ECG
trước và sau khi nhúng vì tính vô hình cao của thuật toán LSB. TÀI LIỆU THAM KHẢO
Lớp bảo mật thứ hai là thuật toán mã hóa AES-256. Đây là [1] Ayman Ibaida, Ibrahim Khalil, “Wavelet-Based ECG Steganography for
thuật toán mã hóa đối xứng mạnh mẽ nhất hiện nay đã được Protecting Patient Confidential Information in Point-of-Care Systems“,
chứng minh là an toàn bởi NIST (National Institute of IEEE Transactions On Biomedical Engineering, VOL. 60, NO. 12,
Standards and Technology). December 2013, pp. 3322-3330.
Sự kết hợp này tạo nên kênh truyền tin hoàn hảo. Chỉ [2] J. Daemen, V. Rijmen, „The Design of Rijndael: AES – The Advanced
Encryption Standard.“, Springer, 2002.
những người có khóa giải mã đúng mới có thể bóc tách và giải
[3] Charles H. Romine, “SHA-3 Standard: Permutation-Based Hash and
mã thông tin mật. Việc xác thực khóa được thực hiện bời hàm Extendable-Output Functions”, Information Technology Laboratory
băm tiên tiến nhất hiện nay (SHA-3) nhằm tăng tính xác thực Gaithersburg, MD 20899-8900, 2014.
cho người dùng. [4] Hargittai, S., "Enhanced turning point algorithm for the visualization and
Để đánh giá tính sẵn sàng của hệ thống, chúng tôi thực hiện printing of long term ECG curves", IEEE 2013, Computing in
đo thời gian trung bình hoàn thành các công đoạn của tất cả các Cardiology Conference (CinC), pp.963-966, 22-25 Sept. 2013.
mẫu tín hiệu ECG. Kết quả từ bảng 3 cho thấy tính sẵn sàng rất [5] W.C.Mueller, “Arrhythmia detection program for an ambulatory ECG
monitor”, Biomed. Sci. Instrument., vol. 14, pp. 81-85.
cao của phương pháp đề xuất (tổng thời gian thực hiện tại đầu
[6] Ayman Ibaida, I. Khalil, R. van Schyndel, "A low complexity high
phát hay đầu thu nhỏ hơn 0.2 giây). capacity ECG signal watermark for wearable sensor-net health
monitoring system", Computing in Cardiology, IEEE 2011 , pp.393,396.
BẢNG 2. HIỆU NĂNG HỆ THỐNG QUA THAM SỐ PRD VÀ CR [7] Sankari, V.; Nandhini, K., "Steganography technique to secure patient
confidential information using ECG signal", IEEE 2014, Information
Dữ liệu PRD (%) PRD (%) Communication and Embedded Systems (ICICES), 2014 International
ECG mẫu CR
bệnh nhân nhúng giải nén Conference on , pp.1-7, 27-28 Feb. 2014.
S0014lrem 2852 byte 2.0190 0.0219 0.7912 [8] Nguyễn Lương Nhật, Đào Duy Liêm, Nguyễn Thị Minh Thy, “Giấu tin
trong Video 3D kết hợp mật mã”, Hội thảo quốc gia 2014 về Điện tử,
S0017lrem 2684 byte 2.0179 0.0539 1.1829 Truyền thông và Công nghệ thông tin (ECIT-2014), pp. 366-373.
S0020arem 2960 byte 2.0197 0.0550 1.0850 [9] D.T. Luong, N.D. Thuan, N. Hung, “ECG signal transmission using
wireless in patient health care and monitoring system,” Tạp chí khoa học
S0021arem 2964 byte 2.0198 0.0207 0.2731 & công nghệ, Đại học Bách Khoa Đà Nẵng, số 12(61), 2012.
S0022lrem 2903 byte 2.0194 0.0393 0.5156 [10] Y.Zigel, ACohen, and AKatz "The Weighted Diagnostic Distortion
(WDD) Measure for ECG Signal Compression". IEEE Trans. Biomed.
S0027lrem 2912 byte 2.0194 0.0469 1.1085 Eng., 47, 1422-1430, 2000.
S0031lrem 2963 byte 2.0198 0.0272 0.5867 [11] Hsiao-Lung Chan, Yi-Chun Chiu, Yun-An Kao, and Chun-Li Wang,
“VLSI Implementation of Wavelet-based Electrocardiogram
S0042lrem 2963 byte 2.0198 0.0212 0.2231 Compression and Decompression,” Journal of Medical and Biological
Engineering, vol. 31, no. 5, pp. 331-338, May 2010.
S0101lrem 2952 byte 2.0197 0.0792 1.2564
[12] S. Neela, V.R.Vijaykumar, “ECG Steganography and Hash Function
S0125lrem 2802 byte 2.0187 0.0125 0.2313 Based Privacy Protection of Patients Medical Information”, International
Journal for Trends in Engineering & Technology, V.5, I.5, 5/2015, ISSN
S0210lrem 2879 byte 2.0192 0.0673 1.2744 2349-9303, pp. 236-241.
S0303lrem 2473 byte 2.0165 0.0781 1.2787 [13] A.Ibaida, Ibrahim Khalil, Dhiah Al-Shammary, “Embedding Patients
Confidential Data in ECG Signal For HealthCare Information Systems”,
S0349lrem 2486 byte 2.0166 0.0538 0.7749 IEEE 2010, 32nd Annual International Conference of the IEEE EMBS,
Trung bình: 2.0189 0.0444 0.8140 Buenos Aires, Argentina, August 31 - September 4, 2010, pp.3891-3894.
239

E-RISKE, một sơ đồ mật mã khóa bí mật dựa

trên các phần tử khả nghịch và khả nghịch mở
rộng trong các vành đa thức bậc hữu hạn hệ số
nhị phân có hai lớp kề cyclic
Cao Minh Thắng∗ , Nguyễn Bình∗ , Hoàng Mạnh Thắng∗ , Nguyễn Ngọc Quân∗
∗Học Viện Công Nghệ Bưu Chính Viễn Thông
Email: {thangcm, nguyenbinh, thanghm, quannn}@ptit.edu.vn
Tóm tắt—Các phần tử khả nghịch trong vành đa thức dụng phổ biến trong mã sửa sai nhưng đã không được
bậc hữu hạn đã được khai thác để xây dựng một số hệ ứng dụng rộng rãi trong mật mã loại trừ lớp vành Rn,2
mật khóa công khai thú vị như NTRU và pNE. Trong bài với n = 2N |N ∈ Z + . Năm 2002, các nhóm nhân cyclic
báo này, sau khi đề xuất khái niệm "khả nghịch mở rộng",
chúng tôi sẽ giới thiệu một lớp đặc biệt của các vành đa
trong R2k ,2 đã được khai thác để để xây dựng một hệ
thức bậc hữu hạn hệ số nhị phân trong đó tất cả các đa mật khóa bí mật [7] và hệ mật này sau đó được để xuất
thức đều khả nghịch hoặc khả nghịch mở rộng. Bằng cách như là một phiên bản mới của DES [8].
khai thác các phần tử này, chúng tôi đề xuất một sơ đồ Mục II của bài báo trình bày một số khái niệm về
mật mã mới có tên là E-RISKE và chứng minh về mặt lý sơ đồ mật mã và độ an toàn chứng minh được. Trong
thuyết rằng hệ mật này không những tính toán hiệu quả mục III, với khái niệm "khả nghịch mở rộng", chúng
mà còn chống lại được tấn công phân biệt bằng bản bản tôi giới thiệu một lớp đặc biệt của Rn,2 trong đó có số
rõ được chọn (hay còn gọi là IND-CPA).
Từ khóa—Sơ đồ mật mã, khóa bí mật, vành đa thức các phần tử khả nghịch (và tương ứng là số các phần tử
bậc hữu hạn hệ số nhị phân, hai lớp kề cyclic, phần tử khả nghịch mở rộng) là rất lớn (Định lý 1). Bằng cách
khả nghịch mở rộng. khai thác tập phần tử đó, trong phần IV, chúng tôi đề
xuất một sơ đồ mật mã khóa bí mật xác suất có tên
I. GIỚI THIỆU là E-RISKE (Extended Random Invertible Secret-Key
Ứng dụng của các phần tử khả nghịch trên vành đa Encryption scheme) với tốc độ tính toán nhanh và được
thức Rn,q = Zq [x]/(xn − 1) trong mật mã rất phổ biến, chứng minh là an toàn với các tấn công nghe lén (IND-
điển hình là hệ mật khóa công khai xác suất nổi tiếng EAV) trong định lý 2 và tấn công phân biệt bằng bản
NTRU [2] và các biến thể như CTRU [3] và đặc biệt là rõ được chọn (IND-CPA) trong định lý 3. Kết luận và
pNE [6], một hệ mật dựa trên vành R2s ,q |s ∈ Z + , cho đề xuất hướng nghiên cứu tiếp theo được đề cập trong
đến nay có thể coi là biến thể duy nhật của NTRU có mục V.
độ an toàn chứng minh được.
Lợi ích của việc sử dụng các phần tử khả nghịch trong II. CÁC KHÁI NIỆM IND-EAV VÀ IND-CPA
mật mã là tốc độ tính toán. Cụ thể là, phép nhân modulo Trong phần này, ta sẽ nhắc lại một số khái niệm về
trong vành đa thức Rn,q chỉ cần O(n2 ) phép tính. Bằng sơ đồ mật mã có độ an toàn chứng minh được.
cách khai thác đặc điểm này, cùng với độ an toàn liên
Định nghĩa 1. Một sơ đồ mật mã Π(G, E, D, K, P, C),
quan tới một số bài toán khó trên dàn, NTRU có tốc
gồm 3 thuật toán là sinh khóa G, mã hóa E và giải mã
độ tính toán nhanh hơn các sơ đồ mật mã dựa trên số
D cùng với 3 không gian là không gian bản rõ P, không
nguyên và logarit rời rạc trên trường hữu hạn và đường
gian bản mã C, và không gian khóa K.
cong eliptic. Hệ quả là, hệ mật này đã được chuẩn hóa
bởi IEEE trong tiêu chuẩn P.1363.1 năm 2008 và được Định nghĩa 2. (Định nghĩa 3.4 trong [1]) Với n ∈ Z + ,
coi là một đề cử thay thế các hệ mật khoá công khai hàm f (n) được gọi là "không đáng kể" (negligible) với
truyền thống. biến n khi với mọi đa thức p(n) đều tồn tại một số tự
Vành đa thức bậc hữu hạn hệ số nhị phân Rn = nhiên N0 thỏa mãn ∀n > N0 ta đều có f (n) < p(n) 1
.
Z2 [x]/(xn + 1), một lớp của Rn,q , mặc dù được sử

ISBN: 978-604-67-0635-9 240

Định đề 1. 2−n và theo đó 1

2(n−1) −1
đều là các hàm IND-EAV-ATK thành công là không đáng kể hay
không đáng kể với biến n. 1
Pr[SecKeav
A,Π (n) = 1] ≤ + μ(n).
2
Định đề 2. Nếu p(n) là một đa thức của n và f (n) là
một hàm không đáng kể với biến n thì p(n).f (n) cũng với μ(n) là một hàm không đáng kể của n.
là một hàm không đáng kể với biến n. Định nghĩa 6. [1] Một sơ đồ mã hóa khóa bí mật Π
được gọi là an toàn với tấn công phân biệt bằng bản
Định nghĩa 3. Tấn công phân biệt bằng nghe lén (IND-
rõ được chọn, viết tắt là IND-CPA, nếu xác suất để thí
EAV-ATK: Eavesdropping Indistinghuisability Attack)
nghiệm IND-CPA-ATK thành công là không đáng kể hay
đối với một sơ đồ mã hóa khóa bí mật, ký hiệu là
SecKeav 1
A,Π (n), được mô tả như sau:[1] Pr[SecKcpa
A,Π (n) = 1] ≤ + μ(n).
2
1) Kẻ nghe lén (eavesdropper) A chọn một cặp bản với μ(n) là một hàm không đáng kể của n.
rõ m0 , m1 có cùng chiều dài trong không gian
bản rõ và gửi tới bộ mã hoá. Chú ý rằng độ dài Có thể thấy, loại hình tấn công IND-CPA-ATK, trong
của cặp bản tin m0 , m1 có thể khác độ dài n của đó kẻ tấn công có thể truy cập không giới hạn tới thủ
khoá bí mật k. tục mã hóa E, là mạnh hơn tấn công IND-EVA-ATK.
2) Bộ mã hoá chọn ngẫu nhiên một khóa k ∈ K có độ Do đó, ta có thể coi IND-CPA là an toàn hơn IND-EAV.
dài n bit và chọn ngẫu nhiên một bit b ← {0, 1} III. CÁC PHẦN TỬ KHẢ NGHỊCH VÀ KHẢ NGHỊCH MỞ
để tính một bản mã c ← Ek (mb ) được tính toán RỘNG TRÊN VÀNH ĐA BẬC HỮU HẠN HỆ SỐ NHỊ PHÂN
và trả lại cho A.
Trong phần này, chúng tôi sẽ tập trung vào các vành
3) Khi nhận được c, A thực hiện tính toán và đưa ra
đa thức nhị phân hữu hạn và các phân tử khả nghịch
giá trị b� .
cũng như khả nghịch mở rộng của nó. Để thuận tiện, ta
4) Kết quả của tấn công trả về là 1 nếu b� = b và 0
ký hiệu GF (2)[x]/(xn + 1)|n ∈ Z + là Rn với giá trị 2
trong trường hợp còn lại. Nếu SecKeavA,Π (n) = 1
là ngầm định.
thì có thể nói A đã thực hiện thành công loại tấn
công này. A. Các định nghĩa và ký hiệu
Định nghĩa 7. Vành đa thức bậc hữu hạn hệ số nhị phân
Định nghĩa 4. Thí nghiệm tấn công phân biệt bằng bản
Rn là tập các đa thức f có bậc nhỏ một số nguyên n
rõ được chọn (IND-CPA-ATK: Chosen Plain-text Attack
và các hệ số nằm trong GF (2).
Indistinghuishability Attack) đối với một sơ đồ mã hoá
khoá bí mật trong [1], ký hiệu là SecKcpa
A,Π (n), được mô Một phần tử f ∈ Rn có thể được biểu diễn là
tả như sau: [1] n−1

f= fi
1) Kẻ tấn công A được quyền truy cập không giới
i=0
hạn tới bộ mã hoá. A chọn một cặp bản rõ m0 , m1
có cùng chiều dài trong không gian bản rõ và gửi dưới định dạng đa thức hoặc
tới bộ mã hoá. Chú ý rằng độ dài của cặp bản tin f = (f0 , f1 , . . . , fn−1 )
m0 , m1 có thể khác độ dài n của khoá bí mật k.
2) Bộ mã hoá chọn ngẫu nhiên một khóa k ∈ K có độ dưới định dạng vector.
dài n bit và chọn ngẫu nhiên một bit b ← {0, 1} Trong Rn , toán tử nhân được ký hiệu là ∗, được hiểu
để tính một bản mã c ← Ek (mb ) và trả lại cho A. là phép nhân module xn + 1, nghĩa là nếu h = f ∗ g thì
3) A có thể tiếp tục truy nhập không giới hạn số lần h có hệ số
tới bộ mã hoá.
hk = ( fi .gj ) mod 2
4) Kết quả của thí nghiệm trả về là 1 nếu b� = b và
i+j=k mod n
0 trong trường hợp còn lại. Nếu SecKcpa
A,Π (n) = 1
thì có thể nói A đã thực hiện thành công loại tấn với 0 ≤ k ≤ n − 1.
công này. Bên cạnh đó, phép cộng trong Rn được ký hiệu là +
và như vậy nếu h = f + g thì
Định nghĩa 5. [1] Một sơ đồ mã hóa khóa bí mật Π n−1

được gọi là an toàn với tấn công phân biệt bằng nghe h= hi
lén, viết tắt là IND-EAV, nếu xác suất để thí nghiệm i=0

241
với hi = (fi + gi ) mod 2. Bổ đề 3. Trong Rn , tất cả các đa thức có trọng số

Hamming chẵn đều không khả nghịch.
Định nghĩa 8. Trọng số Hamming của đa thức f ∈ Rn
được ký hiệu là w(f ). Chứng minh: Giả sử f ∈ Rn là một đa thức có
trọng số Hamming chẵn. Theo bổ đề 2 thì ∀g ∈ Rn ,
Định nghĩa 9. Một đa thức f ∈ Rn được gọi là khả
w(f ∗ g) luôn chẵn hay nói cách khác không tồn tại
nghịch nếu tồn tại đa thức g ∈ Rn thỏa mãn f ∗ g = 1.
bất kỳ đa thức h nào thỏa mãn w(f ∗ h) lẻ. Mặt khác
Để thuận lợi, ta ký hiệu tập các đa thức khả nghịch w(1) = 1 là một số lẻ. Do đó, ta có thể kết luận không
trong Rn là In . tồn tại đa thức h thoả mãn w(f ∗ h) = 1 hay f không
khả nghịch.
Định nghĩa 10. Trong Rn , một đa thức e được gọi là
lũy đẳng nếu e2 = e. C. Lũy đẳng nuốt và khả nghịch mở rộng
n−1 i
Trong Rn , e1 = 1 là một lũy Bổ đề 4. Trong Rn , với e0n = i=0 x , ta luôn có
đẳng
n−1
tầm thường. Với n
f ∗ e0n = (w(f ) mod 2).e0n ∀f ∈ Rn .
lẻ ta có thể thấy rằng e0n = i=0 xi cũng là một lũy
n−1
đẳng. Chứng minh: Giả sử f = i=0 fi .xi ta có
Định nghĩa 11. Tỉ lệ số các phần tử khả nghịch trên
tổng số các đa thức trong Rn được ký hiệu là Kn . f.x0 = f0 + f1 .x + · · · + fn−1 .xn−1
Vì các đa thức khả nghịch luôn có trọng số Ham- f.x1 = fn−1 + f0 .x + · · · + fn−2 .xn−1
ming lẻ nên giá trị lớn nhất của Kn là max(Kn ) = ..
max(|In |)/|Rn | = 1/2. .
f.xn−1 = f1 + f2 .x + · · · + f0 .xn−1
B. Trọng số Hamming của các đa thức khả nghịch
và
Bổ đề 1. Trong Rn , nếu w(f ) = 2k, w(g) = 2l|k, l ∈
n−1
n−1
n−1

Z + thì w(f + g) chẵn.
f.e0n = fi .xi = (( fj ) mod 2).xi
Chứng minh: Với
i=0 i=0 j=0
N −1 N −1
i=0 fi x và g = i=0 gi x ta có
i i
f= n−1
n−1

N −1 = (w(f ) mod 2).xi = (w(f ) mod 2). xi
h=f +g = hi .xi i=0 i=0
i=0
= (w(f ) mod 2).e0n
với hi = (fi + gi ) mod 2.
Vì fi , gi ∈ GF (2) nên hi = 0 khi và chỉ khi fi = gi .
Gọi S là tập hợp chứa các giá trị i thỏa mãn fi = gi = 1. Bổ đề 5. Trong Rn với n lẻ, đa thức
Dễ thấy n−1
e0n = fi .xi
w(h) = w(f ) − |S| + w(g) − |S| = 2(k + l − |S|). i=0
là lũy đẳng.
Tổng quát hơn, nếu h là tổng của các đa thức có trọng Chứng minh: Ta có
số Hamming chẵn thì w(h) cũng chẵn. n−1

e20n = e0n ∗ (1 + fi .xi )
Bổ đề 2. Trong Rn , nếu w(f ) chẵn thì ∀g ∈ Rn , w(g ∗
i=1
f ) luôn chẵn. n−1

Chứng minh: Giả sử g có dạng = e0n + e0n ∗ fi .xi .
n−1
g = i=0 gi xi ta có i=1
n−1
N −1
Vì n lẻ, w( i=1 x ) luôn chẵn nên theo bổ đề 4,
i

i n−1
h=g∗f = gi .x ∗ f .
i=0 e0n ∗ =0
i=0
Vì w(gi .x ∗ f ) = gi .w(f ) và luôn chẵn do đó, theo bổ
i
đề 1, w(h) cũng chẵn. và e20n = e0n . Do đó, theo định nghĩa 10, e0n là lũy
đẳng trong Rn .

242
Định nghĩa 12. Trong Rn , một lũy đẳng e được gọi là Bổ đề 7. Trong Rn với n lẻ, chọn k ∈ En với nghịch
lũy đẳng nuốt khi đảo mở rộng là ke−1 , nếu biết c = m ∗ k và w(m) thì
ta có thể tính được
f ∗ e = (w(f ) mod 2).e
m = (w(m) mod 2).e0n + ke−1 ∗ c
∀f ∈ Rn .
n−1 Chứng minh: Do ke−1 ∗ k = e0n + 1, nên
Chú ý rằng, trong Rn với n lẻ thì e0n = i=0 x là
i
một lũy đẳng nuốt. ke−1 ∗ c = ke−1 ∗ c = ke−1 ∗ k ∗ m

= (e0n + 1) ∗ m = m + (w(m) mod 2).e0n
Định nghĩa 13. Trong Rn , một đa thức f � = f + e0n
được gọi là đa thức bù của f . Hệ quả là, m = (w(m) mod 2).e0n + ke−1 ∗ c
Ví dụ, trong R5 , k = x2 + x là nghịch đảo mở rộng
Như vậy, rõ ràng f cũng là một đa thức bù của f �
của ke−1 = x2 + 1.
trong Rn .
Với m = x3 + x ta có
Định nghĩa 14. Trong Rn với n lẻ, nếu một đa thức f
c = m ∗ ke−1 = x4 + x3 + x2 + 1
được gọi là khả nghịch mở rộng nếu tồn tại thức g ∈ Rn
thỏa mãn và vì w(m) mod 2 = 0 nên
f ∗ g = (e0n + 1). m = k ∗ c = (x2 + x) ∗ (x4 + x3 + x2 + 1)
Trong trường hợp này, g được gọi là nghịch đảo mở = (x3 + x).
rộng của f trong Rn .
Trong trường hợp m = x3 + x + 1, ta có
Để thuận tiện, ta ký hiệu tập các đa thức khả nghịch
c = m ∗ ke−1 = (x3 + x2 + x + 1)
mở rộng trong Rn là En .
và vì w(m) = 3 hay w(m) mod 2 = 1, nên
Bổ đề 6. Trong Rn với n lẻ, nếu đa thức f khả nghịch
với nghịch đảo g thì m = e05 + k ∗ c
f � = f + e0n = (x4 + x3 + x2 + x + 1)
+ (x2 + x) ∗ (x3 + x2 + x + 1)
là một đa thức khả nghịch mở rộng với nghịch đảo mở
= (x3 + x + 1).
rộng là
g � = g + e0n . D. Khả nghịch và khả nghịch mở rộng trên vành đa thức
hữu hạn có hai lớp kề cyclic
Chứng minh: Ta có
Định nghĩa 15. Tập của các số nguyên n thỏa mãn
n−1
f � ∗ g � = (f + e0n ) ∗ (g + e0n ) xn + 1 = (x + 1) ∗ T với T = i=0 xi là một đa thức
bất khả quy trong GF (2) được ký hiệu là N2C . Trong
= (f ∗ g + e20n + (f + g) ∗ e0n )
trường hợp này, Rn được gọi là vành đa thức bậc hữu
= (1 + e0n + (f + g) ∗ e0n ) hạn hệ số nhị phân có hai lớp kề cyclic.
Vì cả w(f ) và w(g) đều lẻ, nên w(f + g) luôn chẵn. Theo thuật toán trong [4], ta có thể tính được N2C .
Do đó, theo bổ đề 5, (f + g) ∗ e0n = 0. Hệ quả là, Một vài giá trị ví dụ của n ∈ N2C là
f � ∗ g � = e0n + 1 {3, 5, 11, 13, 19, 29, 37, 53, 59, 61, 67, 83, 101, . . .
1019, 1061, 1091, 1109, 1117, 1123, 1171, 1187, . . .
Vì w(f ) và w(e0n ) luôn lẻ khi n lẻ nên w(f � ) = 2053, 2069, 2083, 2099, 2131, 2141, 2213, 2221, . . .
w(f + e0n ) luôn chẵn. Do đó, có thể thấy rằng trọng 4091, 4093, 4099, 4133, 4139, 4157, 4219, 4229, . . .}
số Hamming của một đa thức khả nghịch mở rộng luôn
[4] cũng chỉ ra rằng tất cả n ∈ N2C đều là nguyên tố
chẵn.
lẻ.
Ví dụ, trong R5 , f = x4 + x3 + 1 khả nghịch với
nghịch đảo làg = x4 + x3 + x. Đa thức f � = f + e05 = Định lý 1. Trong Rn |n ∈ N2C , tất cả các đa thức trong
x2 + x là khả nghịch mở rộng với nghịch đảo mở rộng In \T là khả nghịch. Do đó số phần tử khả nghịch trong
là g � = g + e05 = x2 + 1. những vành đa thức đó là 2n−1 − 1.

243
Bảng I
Chứng minh: Theo [4], nếu Rn |n ∈ N2C thì n lẻ, CẤU TRÚC ĐẠI SỐ NỀN TẢNG CỦA E-RISKE
do đó w(T ) cũng lẻ. Vì deg T = n−1 có giá trị lớn nhất
là max deg f |f ∈ Rn và T là bất khả quy trên GF (2) Tham số Giá trị
nên theo định nghĩa ??, gcd(f, T ) = 1 ∀f ∈ In \ T . Vành đa thức RL = Z2 [x]/(xL + 1)|L ∈ R2C
Hơn nữa, nếu f ∈ I2C [x] \ T thì gcd(f, xn + 1) =
Không gian bản
gcd(f, (x+1)∗T ) = 1. Theo định lý Euclid, luôn tồn tại rõ
P = {m ∈ RL , deg(m) < L − 1}
hai đa thức u, v ∈ Rn thỏa mãn u ∗ f + v ∗ (xn + 1) = 1
Không gian bản
hay u ∗ f = 1. Điều này chứng tỏ f là khả nghịch với mã
C = RL
phần tử nghịch đảo u nào đó. Chiều dài bản rõ,
Theo [5], m = 2n−1 − 1 là cấp lớn nhất của các đa L − 1, L
bản mã
thức trong In \T tức là, f m = 1 và u = f m−1 là nghịch Kích thước khóa N <L
đảo của f trong Rn |n ∈ N2C .
Không gian khóa
Để tính toán nghịch đảo của một đa thức trong Rn ta con 1
K1 = {k ∈ IL2 |0 < deg(k) ≤ N − 1}
có thể sử dụng thuật toán trong [9] dựa trên thuật toán Không gian khóa
Euclid mở rộng cho các đa thức. K2 = {k ∈ EL |0 < deg(k) ≤ N − 1}
con 2
Chú ý, trong Rn |n ∈ N2C , với mỗi một đa thức f Không gian khóa K = K 1 ∪ K2
có trọng số Hamming lẻ thì luôn tồn tại một đa thức
g = e0n + f có trọng số Hamming chẵn. Mặt khác,
theo bổ đề 6, g là nghịch đảo mở rộng. Do đó, tập
B. Mã hóa
En |n ∈ N2C sẽ bao gồm tất cả các đa thức có trọng số
Hamming chẵn và |En | = 2n−1 − 1 (trừ đa thức tầm Để mã hóa (L − 1) bit bản rõ m, đầu tiên bên gửi
thường g = 0). tính L bit
Ví dụ, trong R3 , có 22 = 4 đa thức khả nghịch
{1, x, x2 , 1 + x + x2 } và tương ứng 22 − 1 = 3 đa M = ((w(m) + 1) mod 2).xL−1 + m (3)
thức khả nghịch mở rộng {x + x2 , 1 + x2 , 1 + x}, trừ
và xuất ra L bit bản mã
đa thức 0.
c=M ∗k (4)
IV. HỆ MẬT E-RISKE
Trong phần III, ta thấy rằng tất cả các đa thức trong Chú ý rằng w(M ) luôn lẻ do đó cả M và c đều khả
R2C đều khả nghịch và khả nghịch mở rộng. Bằng cách nghịch trong RL . Bên cạch đó, theo bổ đề 1, nếu k ∈ K1
khai thác đặc tính này, trong phần này chúng tôi đề xuất thì w(c) là lẻ, do đó c là khả nghịch còn khi k ∈ K2
một sơ đồ mật mã hóa khóa bí mật xác suất mới, được thì w(c) chẵn và c là khả nghịch mở rộng trong RL .
gọi là E-RISKE (Extended Random Invertible Secret-
Key Encryption scheme), Sơ đồ này sẽ được chứng minh C. Giải mã
an toàn với tấn công IND-CPA (hay gọi là IND-CPA- Để giải mã L bit bản mã c, đầu tiên bên nhận tính L
secure). Các cấu trúc đại số nền tảng của E-RISKE được bit M như sau. Nếu k ∈ K1 thì
tóm tắt trong bảng I.
M = c ∗ k −1 (5)
A. Tạo khóa
Bên gửi và bên nhận chọn và chia sẻ một đa thức ngẫu nếu không (k ∈ K2 )
nhiên k ∈ K làm khóa bí mật chung. Vì deg(k) ≤ N −1
M = e0L + c ∗ ke−1 (6)
nên ta có thể biểu diễn k bằng N bit. Với điều kiện bậc
của k deg(k) > 0 để đảm bảo rằng ta không sử dụng và sau đó khôi phục (L − 1) bit bản rõ
hai đa thức tầm thường k = 0 và k = 1 làm khóa bí
mật trong E-RISKE, Do đó, m = ML−1 .xL−1 + M (7)
|K1 | = |K2 | = 2N −1 − 1 (1) Ở đây ML−1 là hệ số của đơn thức xL−1 trong biểu
diễn đa thức của M . Chú ý rằng k −1 là nghịch đảo của
và k khi k ∈ K1 và ke−1 là nghịch đảo mở rộng của k khi
|K| = |K1 | + |K2 | = 2N − 2 (2) k ∈ K2 .

244
D. Một ví dụ nhỏ với c−1 và c−1

e là lần lượt là nghịch đảo và nghịch đảo
Trong ví dụ này, ta chọn L = 5, N = 3 và sử dụng R5 mở rộng của c trong RL . Lưu ý rằng, trong RL , c luôn
để xây dựng E-RISKE. Giả sử rằng bên gửi muốn gửi là khả nghịch hoặc khả nghịch mở rộng.
4 bit bản tin 0011 tương đương với đa thức m = x + 1 Vì k được lựa chọn ngẫu nhiên phân bố đều trong K1
tới bên nhận. hoặc K2 trong khi M và c là cho trước. Như một hệ
1) Khi k ∈ K1 : Giả sử rằng bên gửi và bên nhận đều quả,
dùng khóa bí mật chung là k = x2 +x+1 với nghịch đảo 1
là k −1 = x4 + x2 + x. Để mã hóa m, đầu tiên bên gửi Pr[k −1 = M ∗ c−1 ] =
|K1 |
tính M = x4 +x+1 sau đó tính c = M ∗k = x4 +x3 +x
và gửi c tới bên nhận. và
Khi nhận được c, bên nhận đầu tiên sử dụng k −1 để
1
tính M = c ∗ k −1 = x4 + x + 1 sau đó khôi phục Pr[k −1 = e0L + (M + e0L ) ∗ c−1
e ]=
m = x4 + (x4 + x + 1) = x + 1. |K2 |
2) Khi k ∈ K2 : Giả sử rằng bên gửi và bên nhận đều
dùng khóa bí mật chung là một đa thức khả nghịch mở Cuối cùng, ta có
rộng
|K1 | 1 |K2 | 1 2
k = e05 + (x2 + x + 1) = x4 + x3 Pr[M � = M ] = . + . = .
|K| |K1 | |K| |K2 | |K|
với nghịch đảo mở rộng
ke−1 = e05 + (x4 + x2 + x) = x3 + 1. Trong tấn công IND-EAV-ATK, kẻ tấn công A có
thể đạt được b� = b bằng cách đoán đơn giản với xác
Để mã hoá m, đầu tiên bên gửi tính M = x4 + x + 1 suất đúng là 1/2 hoặc thử tất cả các khoá k ∈ K1 hoặc
sau đó tính k ∈ K2 và tính M � bằng thủ tục giải mã cho đến khi
c = e05 + M ∗ k = x2 + 1 M � = Mb . Giả sử A mất p(N ) lần thử k để thu được
M � = Mb , với p(N ) là một đa thức của N , ta có
và gửi c tới bên nhận.
Khi nhận được c, đầu tiên bên nhận sử dụng ke−1 để 1
Pr[SecKeav
A,Π = 1] = + p(N ). Pr[M � = Mb ]
tính 2
1
M = e05 + c ∗ ke−1 = + p(N ).(Pr[M � = M0 ]. Pr[b = 0]
2
= e05 + (x2 + 1) ∗ (x3 + 1) = x4 + x + 1 + Pr[M � = M1 ]. Pr[b = 1])
sau đó khôi phục m = x4 + (x4 + x + 1) = x + 1. 1 1 2 1 2
= + p(N ).( . + . )
2 2 |K| 2 |K|
E. Phân tích độ an toàn trên lý thuyết của E-RISKE
1 2 1 p(N )
1) Khả năng chống tấn công IND-EAV-ATK: = + p(N ). = + N −1
2 |K| 2 2 −1
Định lý 2. E-RISKE an toàn với tấn công IND-EAV-
ATK. Vì p(N ) là một đa thức (để đảm bảo tấn công là khả
thi trong thời gian đa thức), theo định lý 2,
Chứng minh: Nhớ lại rằng, với bản mã c bên nhận
có thể tìm được bản rõ M bằng công thức (5) hoặc (6) p(N )
nếu biết k. Mặc dù không có khoá, kẻ nghe lén có thể 2N −1 − 1
thử lần lượt các khoá k trong không gian khoá và giải
mã ra được một bản rõ M � ∈ P. Xác suất để kẻ nghe là một hàm không đáng kể của N . Kết quả là, theo định
lén giải mã thành công sẽ là nghĩa 5, E-RISKE được coi là an toàn với tấn công IND-
Pr[M � = M ] = Pr[k −1 ∗ c = M ]. Pr[k ∈ K1 ] EAV-ATK.
2) Khả năng chống tấn công IND-CPA-ATK:
+ Pr[e0L + ke−1 ∗ c = M ]. Pr[k ∈ K2 ]
|K1 | Định lý 3. E-RISKE an toàn với tấn công IND-CPA-
= Pr[k −1 = M ∗ c−1 ]. . ATK.
|K|
|K2 | Chứng minh: Với một bản rõ M và bản mã tương
+ Pr[ke−1 = e0L + (M + e0L ) ∗ c−1
e ].
|K| ứng c cho trước và nếu ta có c� là bản mã của M với

245
một khóa k nào đó thì F. Phân tích hiệu năng trên lý thuyết
�
Pr[c = c] = Pr[k −1
∗ M = c]. Pr[k ∈ K1 ] Lợi thế quan trọng nhất của E-RISKE là tốc độ tính
+ Pr[e0L + ke−1
∗ M = c]. Pr[k ∈ K2 ] toán, thuật toán mã hóa và giải mã của E-RISKE chỉ là
một phép cộng và một phép nhân đa thức trong RL và
|K1 |
= Pr[k −1 = M −1 ∗ c]. mất O(L2 ) phép tính bit. Dễ thấy L càng lớn so với N
|K| thì E-RISKE có hiệu quả mã hoá càng cao.
|K2 | Nhược điểm của E-RISKE là ta phải chọn k ∈ K
+ Pr[ke−1 = e0L + M −1 ∗ (c + e0L )].
|K| ngẫu nhiên và thống nhất giữa hai phía, mỗi phiên làm
với M −1 là nghịch đảo của M trong RL . Nhắc lại việc cần một khóa bí mật ngẫu nhiên mới được chia
rằng, theo công thức (3), w(M ) luôn lẻ nên M luôn sẻ giữa bên gửi và bên nhận. Vì lý do này, E-RISKE
khả nghịch trong RL . Vì k được lựa chọn ngẫu nhiên cần được sử dụng kết hợp với một hệ mật khóa công
phân bố đều trong K trong khi M và c cố định nên ta khai nào đó để xây dựng một hệ mật lai ghép theo mô
có hình KEM (Key Encapsulation Mechanism) với bản rõ
1 có kích thước lớn được mã hóa bởi E-RISKE còn khóa
Pr[k −1 = M −1 ∗ c] =
|K1 | bí mật ngẫu nhiên k trong mỗi một phiên của E-RISKE
và được mã hóa bởi hệ mật khóa công khai đó. Nếu chọn
1 được hệ mật khoá công khai có đặc tính IND-CPA thì,
Pr[ke−1 = e0L + M −1 ∗ (c + e0L )] = . theo [1], sơ đồ lai ghép được cấu thành vẫn kế thừa được
|K2 |
Hệ quả là, đặc tính IND-CPA của E-RISKE. Không những thế, do
hiệu quả mã hoá cao, nếu sử dụng sơ đồ lai ghép ta
1 |K1 | 1 |K2 | 2
Pr[c� = c] = . + . = . có E-RISKE để cải thiện hiệu quả của các hệ mật khoá
|K1 | |K| |K2 | |K| |K| công khai có hệ số mở rộng bản tin lớn như NTRU và
Trong tấn công IND-CPA-ATK, kẻ tấn công A có thể pNE (khoảng hơn 4 lần).
đạt được b� = b bằng một trong hai cách sau:
1) Sử dụng thuật toán để tìm b như trong tấn công G. Lựa chọn tham số
IND-EAV-ATK; Mặc dù xác suất để kẻ tấn công có thể phá được
2) Với c là bản mã của một trong hai bản rõ m0 , m1 E-RIKSE về lý thuyết là vô cùng nhỏ nhưng thực tế
nhận được từ bộ mã hoá. Kẻ tấn công lựa chọn để đảm bảo khả năng chống các tấn công vét cạn thì
ngẫu nhiên b ∈ {0, 1} và truy vấn bộ mã hóa q(N ) giá trị của N phải đủ lớn. Đối với ứng dụng thực tế,
lần với đầu vào mb cho đến khi có được bản rõ nhóm nghiên cứu đề xuất L ≥ N ≥ 1024. Trong trường
đầu ra c� = c. Lưu ý rằng q(N ) là một đa thức hợp đó, độ mật khoá (key-security) và độ mật bản tin
của N , ràng buộc này đảm bảo tấn công có thể (message-security) của E-RISKE là 2N − 2 = 21024 − 2.
được thực hiện trong thời gian đa thức. Đối với các ứng dụng yêu cầu độ mật cao hơn, chúng
Khi đó ta có tôi khuyến nghị L ≥ N ≥ 4096.
Pr[SecKcpa
A,Π = 1] V. KẾT LUẬN
= Pr[SecKeav
A,Π
�
= 1] + q(N ). Pr[c = c] Như đã đề cập, mặc dù E-RISKE có hiệu quả tính
2 toán cao tuy nhiên do phải sử dụng khoá phiên, việc
= Pr[SecKeav
A,Π = 1] + q(N ).
|K| lựa chọn một hệ mật khoá công khai phù hợp để mã
1 2 hoá và chia sẻ khoá bí mật ngẫu nhiên của E-RISKE
= + (p(N ) + q(N )). theo mô hình KEM như nêu trên là một vấn đề mở thú
2 |K|
1 p(N ) + q(N ) vị. Ngoài ra, do E-RISKE hoạt động dựa trên các phần
= + tử khả nghịch và khả nghịch mở rộng, tìm kiếm các lớp
2 2N −1 − 1
vành Rn có hệ số Kn lớn (tối đa hoặc gần tối đa) là
Vì g(N ) = p(N ) + q(N ) cũng là một đa thức, theo
một vấn đề mở khác cho các nghiên cứu trong tương lai
định đề 2,
g(N ) của chúng tôi.
2N −1 − 1 TÀI LIỆU THAM KHẢO
là hàm không đáng kể của N . Kết quả là, theo định
[1] Jonathan Katz, Yehuda Lindell (2007), Introduction to Modern
nghĩa 5, E-RISKE là IND-CPA. Cryptography: Principles and Protocols, Chapman Hall/CRC
Cryptography and Network Security Series.

246
[2] Jeffrey Hoffstein, Jill Pipher, Joseph H. Silverman. NTRU: Alice rings, VICA-5, Hanoi, Vietnam.
ring-based public key cryptosystem. Lecture Notes in Computer [6] Stehle,D., Steinfeld,R.:Making NTRU as secure as worst-case
Science Volume 1423, pp 267-288, Springer Verlag 1998. problems over ideal lattices. In:Paterson,K.G.(ed.) EUROCRYPT
[3] Gaborit, P., Ohler, J., Sole, P.: CTRU, a Polynomial Analogue of 2011. LNCS, vol. 6632, pp. 27–47. Springer, Heidelberg (2011).
NTRU, INRIA. Rapport de recherche, N.4621 (November 2002), [7] Nguyen Binh. Crypto-system based on cyclic geometric progres-
(ISSN 0249-6399). sions over polynomial ring (Part I). REV’02.2002.
[4] Dang Hoai Bac, Nguyen Binh, Nguyen Xuan Quynh , Young [8] Ho Quang Buu, Ngo Duc Thien, Tran Duc Su. Constructing
Hoon Kim (2007). Polynomial rings with two cyclotomic cosets secret-cryptosystem based on cyclic multiplicative progress over
and their applications in Communication, MMU International polynomial rings, Journal of Science and Technology, Posts and
Symposium on Information and Communications Technologies Telecommunication Institute of Technology, 50 (2A), 2012, pp
2007, Malaysia, ISBN: 983-43160-0-3. 109-119. In Vietnamese.
[5] Nguyen Binh, Le Dinh Thich (2002), The order of polynomials [9] Menezes A. J, Van Oorchot P. C. (1998), Handbook of Applied
and algorithms for defining Oder of Polynomial over polynomial Cryptography, CRC Press.

247
Một số phương pháp mới xác định cấp của đa thức

trên vành đa thức sử dụng tính chất của nhóm nhân
cyclic đối xứng
Nguyễn Trung Hiếu
Khoa Kỹ thuật Điện tử 1, Học viện Công nghệ Bưu chính Viễn thông, Hà Nội, Việt Nam
Email: hieunt@ptit.edu.vn
Tóm tắt– Mã cyclic cục bộ (LCC) là một mã khối được tạo giảm độ phức tạp tính toán, rút ngắn thời gian tính toán tới
thành dựa trên các phân hoạch của vành đa thức. Phương pháp mức tối đa và đặc biệt là có thể xác định được cấp của toàn bộ
điển hình xây dựng mã LCC là dựa trên nhóm nhân cyclic với ưu các đa thức trên các vành lớn mà các nghiên cứu trước đây
điểm nổi bật là số lượng mã có thể tạo ra bởi phương pháp này chưa đề cập.
nhiều hơn phương pháp tạo mã cyclic dựa trên Ideal. Việc tìm
được nhóm nhân đạt cấp cực đại trong vành đa thức có ý nghĩa Nội dung bài báo được chia làm năm phần. Phần II, trình
và vai trò quan trọng nhất trong việc cấu trúc lên mã cyclic cục bày sự phân bố đa thức dựa trên cấp của đa thức trên nhóm
bộ. Bài báo này sẽ đề xuất một số phương pháp mới xác định các nhân cyclic. Trong phần III, đề xuất một phương pháp chứng
cấp của các đa thức trên vành đa thức sử dụng tính chất của minh tính chất của nhóm nhân cyclic đối xứng, trong khi phần
nhóm nhân cyclic đối xứng. IV đề xuất hai thuật toán mới xác định cấp của đa thức trên
vành và thảo luận về sự cần thiết của chúng. Cuối cùng, kết
Từ khóa– Mã cyclic cục bộ (LCC-Local Cyclic Code), Nhóm luận bài báo được trình bày trong phần V.
nhân cyclic (CMG- Cyclic Multiplicative Group), Vành đa thức,
phân hoạch. II. PHÂN BỐ ĐA THỨC DỰA TRÊN CẤP CỦA ĐA THỨC
TRÊN NHÓM NHÂN CYCLIC
I. GIỚI THIỆU
Lý thuyết mã hóa đã được nghiên cứu và ứng dụng trong
Định nghĩa 1: [10] CMG trên 2 > x@ / xn 1 là tập hợp
rất nhiều lĩnh vực của cuộc sống, đặc biệt là trong lĩnh vực
truyền thông. Lý thuyết về mã hóa phát triển theo ba hướng A â x , i
i
1, 2,....` , với a x 2 > x@ / xn 1\ ^0`
lớn đó là: mã nguồn, mã kênh (có khả năng phát hiện và sửa
lỗi) và mật mã [1], [2]. Mã cyclic là một lớp mã quan trọng ord a x A
trong các mã khối tuyến tính, có khả năng phát hiện và sửa lỗi
tốt, được ứng dụng trong điện tử dân dụng, các hệ thống lưu
trữ, các hệ thống truyền thông vì có nhiều phương pháp mã a x - phần tử sinh của CMG A .
hóa và giải mã hiệu quả.
Định nghĩa 2: Cấp của đa thức [9].
Mã cyclic được Eugene Prange nghiên cứu đầu tiên năm
1957 [1] . Ngày nay, mã cyclic vẫn nhận được sự quan tâm từ Cấp của đa thức a( x) 2 [ x] / ( xn 1) (ký hiệu ord a( x) )
các nhà nghiên cứu trên toàn thế giới [3]-[8]. Một hướng là số nguyên dương m nhỏ nhất thỏa mãn:
nghiên cứu mới về mã cyclic được biết đến là mã cyclic cục
bộ (LCC-Local Cyclic Code) được đưa ra bởi tác giả Nguyễn
a m1 ( x) a( x) mod ( x n 1) hoặc
Bình vào những năm 1980 [10]. LCC thu hút được nhiều nhà
nghiên cứu và một số kết quả nghiên cứu về LCC đã được
công bố trên các tạp chí chuyên ngành và hội nghị khoa học a m ( x) e( x) mod ( x n 1)
quốc tế [9]-[14].
Các nghiên cứu trước đây chủ yếu tập trung vào cấu trúc Trong đó e( x) là lũy đẳng trong vành, e( x) e2 ( x) .
mã [9], [10], [11], [13], [14], thực hiện cứng hóa bộ mã LCCs
[12]. Nhìn chung, LCC được xây dựng dựa trên cấu trúc và Như vậy, a( x) tạo nên một nhóm cyclic cấp m vành.
phân hoạch CMG của vành đa thức [9], [11].
Định lý 1: [9] Xét a( x) là phần tử của nhóm nhân nào đó,
Tuy nhiên, thuật toán xác định cấp của đa thức trên vành cấp cực đại của a( x) được xác định như sau:
đa thức đến nay mới chỉ sử dụng phương pháp vét cạn có độ
phức tạp lớn, bị hạn chế về năng lực và thời gian tính toán. Bài
báo này nghiên cứu một phương pháp chứng minh tính chất
- Nếu n lẻ ( n 2k 1 ) và x n 1 f ( x) ;
i trong đó
của nhóm nhân cyclic đối xứng, đề xuất hai bổ đề phân bổ đa f i ( x) là các đa thức bất khả quy. Khi đó
thức trong nhóm nhân cyclic theo cấp và đề xuất các thuật max ord (a( x)) m
2 1 . Trong đó m max deg fi ( x) .
toán cải tiến xác định cấp của đa thức trên vành nhằm làm
ISBN: 978-604-67-0635-9 248

- Nếu n chẵn ( n 2s (2k 1) ) và x 2k 1 1 f ( x) ;

i Như vậy, ta có: bmk ( x) a( x)mk k e( x)
trong đó fi ( x) là các đa thức bất khả quy. Khi đó Bổ đề được chứng minh.
max ord (a( x)) 2s (2m 1) . Trong đó m max deg fi ( x) .
Bổ đề 2: Số các đa thức đạt cấp cực đại trên vành được
Bổ đề 2.1: Trong một nhóm nhân cyclic cấp m , cấp của đa tính bằng N .M (m) , với m là cấp cực đại và N là số nhóm
thức thứ k bằng: nhân cyclic đạt cấp cực đại độc lập (nghĩa là không có nhóm
nhân nào là hoán vị của nhóm nhân khác).
m Chứng minh:
mk
gcd m, k Theo hệ quả của bổ đề 1, số đa thức đạt cấp cực đại trong
một nhóm nhân cyclic được tính bởi hàm Phi-Euler ( M (m) ).
Hệ quả: Trong một nhóm nhân cyclic cấp m thì:
Bổ đề hiển nhiên đúng.
+ Các đa thức tại vị trí thứ k nguyên tố cùng nhau với m
thì có cấp bằng m , nghĩa là GCD m, k 1 thì mk m . Ví dụ 1: Xét vành đa thức 2 [ x] / ( x5 1) , không xét lũy
đẳng nuốt en ( x) 1 x x x x 4 , có 2 nhóm nhân như
2 3
+ Số đa thức đạt cấp m là M (m) . Trong đó: sau:

1· §
M m m ¨1 e e ek
¸ là hàm Phi-Euler, với m p11 . p22 ... pk ; ° 012 , 024 , 3 , 034 , 023 , 1 , 123 ,
½
°
i © pi ¹ A1 ® ¾
pi - các số nguyên tố khác nhau; ei - các số nguyên dương. °
¯ 013 , 4 , 014 , 134 , 2 , 234 , 124 , 0 °
¿
Chứng minh: 01 , 02 , 0123 , 04 , 14 , 0124 , 34 ,

° ½
°
A2 ® ¾
Trên vành 2 [ x] / ( x n 1) , xét nhóm nhân cyclic ° 03 , 0134 , 23 , 24 , 0234 , 12 , 13 , 1234 ¿
¯ °
A â( x), a ( x),..., a
2 m
( x)` , có ord A m . Cả hai nhóm nhân đều có cấp bằng 15. Xem xét CMG A1 :
Xét nhóm nhân cyclic B có đa thức sinh b( x) a k ( x) . Có 8 đa thức ở các vị trí 1, 2, 4, 7, 8, 11, 13, 14 có cấp
bằng 15 và là cấp cực đại, phù hợp với hệ quả:
m
Đặt mk , xét § 1 ·§ 1 ·
gcd m, k M (15) 15 ¨1 ¸¨1 ¸ 8 .
© 3 ¹© 5 ¹
B ^b( x), b ( x),..., b
2 mk
` â ( x), a
( x) k 2k
`
( x),..., a mk k ( x) . Có 4 đa thức ở các vị trí thứ 3, 6, 9, 12 có cấp bằng 5
§ 1·
Cần chứng minh vấn đề: ( M (5) 5 ¨1 ¸ 4 ). Các đa thức này cùng với đa thức thứ
© 5¹
(1) Dãy các đa thức trong B là hoàn toàn phân biệt 15 tạo thành nhóm nhân con {3, 1, 4, 2, 0}.
Giả sử có 2 phần tử thứ i và thứ j có cùng giá trị, khi đó Có 2 đa thức ở các vị trí thứ 5 và 10 có cấp bằng 3
ik { jk mod m hoặc ik jk m (i j )k m . Chia cả 2 vế § 1·
( M (3) 3 ¨1 ¸ 2 ). Các đa thức này cùng với đa thức thứ
§ k · m © 3¹
cho gcd m, k , ta được ¨¨ (i j ). ¸¸ , vì 15 tạo thành nhóm nhân con {(023), (014), (0)}.
© gcd ¹
m, k gcd m, k
Xem xét các đa thức trên vành 2 [ x] / ( x5 1) , số đa thức
§ k m ·
gcd ¨¨ , ¸¸ 1 , nên suy ra (i j ) mk . Ta có đạt cấp cực đại là M 15 *2 16 . Ta có 16 đa thức đạt cấp cực
© gcd m, k gcd m, k ¹ đại: (012), (024), (034), (123), (013), (134), (234), (124), (01),
i j mk , do đó ik { jk mod m là vô lý. (02), (04), (34), (03), (23), (24), (12), (13).
(2) bmk ( x) e( x) III. ĐỀ XUẤT MỘT PHƯƠNG PHÁP CHỨNG MINH TÍNH
CHẤT CỦA NHÓM NHÂN CYCLIC ĐỐI XỨNG
Vì a( x) là đa thức sinh của nhân cyclic A cấp m , nên Định nghĩa 3: [9] Đa thức a ( x) được gọi là đa thức đối
m 1
a ( x) a( x) . Đặt e( x) a m ( x) là một lũy đẳng. xứng với đa thức a( x) nếu:
mk k
Có mk k
gcd m, k
, đặt q
gcd m, k
( q là một số a ( x) ¦a x
iI
i
i
thì a ( x) ¦a x
j J
j
j
a ( x)
nguyên dương), ta nhận được mk k mq và có

a ( x) mk k
a ( x) mq
e( x) q
e( x) (đa thức lũy đẳng). trong đó: I J =
=; I J S ^0,1,..., n 1` .
249

Dựa vào tính chất của lũy đẳng nuốt, ta có: Ví dụ 3: n 5 , a x x x 2 x 4 l 124
a x en x a x
Bổ đề 3: (Nhóm nhân cyclic đối xứng) 124 , 234 , 2 , 134 , 014 , 4 , 013 , 123 , °
° ½
A ® ¾
Xét a x là một phần tử sinh của nhóm nhân cyclic A, °1 , 023 , 034 , 3 , 024 , 012 , 0
¯ °
¿
a x là phần tử sinh của nhóm nhân cyclic A ( A được gọi
° 03 , 01 , 0134 , 02 , 23 , 0123 , 24 , 04 , ½
°
là đối xứng của nhóm nhân A). Ta có: A ® ¾
° 0234 , 14 , 12 , 0124 , 13 , 34 , 1234
¯ °
¿
A â x mod x 1`
i n
Ta có A ~ 15,5,7 , A ~ 15, 4,8 và A A 15
A â x mod x 1`
i n

§ 1 ·§ 1·
M 15 15 ¨1 ¸¨1 ¸ 8
A A; a x
i
a x
i 3© 5 ¹© ¹
Trong CMG A, các phần tử có cấp 15 là:
Chứng minh:
Trọng số của a( x) ký hiệu là W a( x) , có nhận xét sau:
^124 , 234 , 134 , 013 , 123 , 034 , 024 , 012 `
Trong CMG A , các phần tử có cấp 15 là:
- Nếu W a( x) lẻ, thì k N , k ! 0 thì W a k ( x) lẻ và
W a k ( x) 1 chẵn.
^ 03 , 01 , 02 , 24 , 04 , 12 , 13 , 34 `
Như vậy, với mỗi phần tử a( x) của nhóm nhân cyclic A
- Nếu W a( x) chẵn, thì k N , k ! 0 thì W a k ( x)
ta có tương ứng một phần tử a ( x) của nhóm nhân cyclic A .
chẵn và W a k ( x) 1 lẻ. Từ nhóm nhân cyclic A ta dễ dàng thiết lập được nhóm nhân
cyclic A . Hai nhóm nhân A và A được gọi là hai nhóm nhân

Do đó W a( x). a k ( x) 1 luôn là chẵn. cyclic đối xứng trong vành đa thức.
Sử dụng phương pháp chứng minh quy nạp, ta giả sử Từ việc khảo sát các nhóm nhân đối xứng trong vành đa
thức ta thấy chỉ cần khảo sát các nhóm nhân trong một nửa
a ( x) ai ( x) en ( x) ai ( x) và cần phải chứng minh
i
vành là ta có thể suy ra kết quả khảo sát cho toàn bộ vành. Khi
a i 1 ( x) ai 1 ( x) en ( x) ai 1 ( x) . coi mỗi nhóm nhân là một mã tương ứng mà ta có thể xây
dựng được trên nó, ta sẽ khảo sát được các mã trên vành.
Áp dụng các tính chất của lũy đẳng nuốt en ( x) , phần tử
IV. ĐỀ XUẤT CÁC THUẬT TOÁN MỚI XÁC ĐỊNH CẤP
đối xứng a ( x) và các nhận xét ở trên, với i N , i ! 0 , ta có: CỦA CÁC ĐA THỨC TRÊN VÀNH ( x) / ( xn 1)
Việc tìm cấp của tất cả các đa thức trên vành là một vấn đề
a i 1 ( x) a ( x) . a ( x)
i
quan trọng trong tính toán và xác định các đa thức đạt cấp cực
đại trên vành là cơ sở cho việc kiến thiết các nhóm nhân cyclic
e ( x) a ( x) . e ( x) a ( x)
n
i
n và các mã cyclic tương ứng.
e ( x) e ( x).a( x) a ( x) 1 a
2
n n
i 1 i 1
( x) Trên một vành đa thức 2 [ x] / ( x n 1) có 2n 2 đa thức
en ( x) a i 1 ( x) (nếu không tính lũy đẳng nuốt và phần tử 0). Hai thuật toán
cải tiến xác định cấp của tất cả các đa thức trên vành là các kết
a i 1 ( x) quả mới được nghiên cứu và trình bày dưới đây, trong đó mỗi
đa thức được biểu diễn bằng một số nguyên, các hệ số của đa
Như vậy bổ đề được chứng minh. thức là biểu diễn của số nguyên đó trong hệ nhị phân. Ví dụ:
Do đó, có thể khảng định tính chất của nhóm nhân cyclic 11 (1011)2 x3 x 1.
đối xứng:
A. Thuật toán vét cạn
a) Ý tưởng: Thử tất cả các đa thức và kiểm tra cấp của
A â( x), a ( x), a ( x),....`
2 3
từng đa thức.
A â ( x), a ( x), a ( x),....`
2 3
b) Độ phức tạp thuật toán: O 2n *max order * n , với O(n)
A â( x), a ( x), a ( x),....`
2 3 là chi phí kiểm tra mỗi đa thức có n hệ số.
c) Thuật toán vét cạn:
250

INPUT: integer n. (1) Tìm cấp cực đại của đa thức trên vành bằng việc
kiểm tra chiều dài cực đại của các lớp kề cyclic. Độ phức tạp
OUTPUT: order of all polynomials. O(n).
For k from 1 to ( 2n 2 ) do the following: (2) Áp dụng bổ đề 1. Tìm các CMG, đa thức ở vị trí thứ
1. Convert k to polynomial f ( x) m
k cấp , với m là cấp của đa thức sinh của CMG.
gcd m, k
2. Set g ( x) m f ( x)
(3) Áp dụng bổ đề 3 để tìm các CMG đối xứng.
3. Set count m 0
b) Độ phức tạp thuật toán: O N *max order * n , N là số
4. While(1) do the following:
nhóm nhân cyclic đạt cấp cực đại độc lập (theo bổ đề 2).
4.1. Set g ( x) m g ( x). f ( x)
c) Thuật toán cải tiến 2:
4.2. count m count 1 INPUT: integer n.
4.3. If g ( x) f ( x) then ord > k @ m count and break OUTPUT: order of all polynomials.
the loop
1. Set all visited > @m0
B. Thuật toán cải tiến 1 2. For k from 1 to ( 2n 2 ) do the following:
a) Ý tưởng: Sử dụng đa thức đối xứng và nhóm nhân
cyclic đối xứng, với ord a ( x) ord a( x) . 2.1. If visited > k @ 1 then continue
b) Độ phức tạp thuật toán: O 2n *max order * n . 2.2. Convert k to polynomial f ( x)
c) Thuật toán cải tiến 1: 2.3. Set g ( x) m f ( x)
INPUT: integer n. 2.4. Set count m 0

OUTPUT: order of all polynomials. 2.5. While(1) do the following:
1. Set all visited > @m0 2.5.1. Set g ( x) m g ( x). f ( x)
2. For k from 1 to ( 2n 2 ) do the following: 2.5.2. Convert inversely g ( x) to an integer M
2.1. If visited > k @ 1 then continue 2.5.3. stored >count @ m M
2.2. Convert k to polynomial f ( x) 2.5.3. If g ( x) f ( x) then break the loop;
2.3. Set g ( x) m f ( x) 2.6. For i from 1 to count
2.4. Set count m 0 2.6.1. poly _ i m stored >i @
2.5. While(1) do the following: 2.6.2. opp _ poly _ i m 2n 1 poly _ i

2.5.1. Set g ( x) m g ( x). f ( x)
2.6.3. ord > poly _ i @ m count / GCD i, count , and
2.5.2. count m count 1 ord >opp _ poly _ i @ m ord > poly _ i @
2.5.3. If g ( x) f ( x) then
2.6.4. visited > poly _ i @ m 1 and
visited >opp _ poly _ i @ m 1
n
a) opp _ k m 2 1 k
b) ord > k @ m count , and ord >opp _ k @ m count

D. Khảo sát và đánh giá các thuật toán
c) visited > k @ m 1 , and visited >opp _ k @ m 1 Trong ba thuật toán được trình bày thì thuật toán vét cạn
và thuật toán cải tiến 1 có cùng độ phức tạp là
d) break the loop O 2n *max order * n , thuật toán cải tiến 2 có độ phức tạp là
C. Thuật toán cải tiến 2 O N *max order * n . Nhìn chung với n càng lớn thì độ
a) Ý tưởng: Sử dụng các kết quả nghiên cứu về cấp và phức tạp của thuật toán cải tiến 2 càng thấp hơn so với hai
CMG đối xứng thuật toán còn lại.
251

Sử dụng cấu hình máy tính CPU Core i5 3230M, 2.6 Ghz, góp phần bổ sung vào cơ sở lý thuyết về nhóm nhân cyclic và
RAM 12 Gb, thời gian tính toán cho mỗi thuật toán với mã cyclic cục bộ.
n 5 y 27 ( n lẻ) được liệt kê trong bảng 1.
Hướng nghiên cứu tiếp theo sẽ tập trung vào việc xác định
cấp của đa thức, của tích các đa thức và phương pháp kiến thiết
Bảng 1: So sánh thời gian tính toán của ba thuật toán nhóm nhân đạt cấp cực đại trên vành đa thức.
Nội dung Số lượng Cấp Thuật Thuật Thuật
đa thức cực đại toán vét toán cải toán cải TÀI LIỆU THAM KHẢO
N cạn (s) tiến 1 (s) tiến 2 (s) [1] A.J. Menezes, P.C. Van Oorchot, Handbook of Applied Cryptography,
5 31 15 0.686 0.874 0.78 CRC Press, 1998.
7 127 7 0.671 0.858 0.79 [2] Todd K. Moon, Error Correction Coding: Mathematical Methods and
9 511 63 0.718 0.874 0.81 Algorithm, John Wiley & Sons, Inc, 2005.
11 2047 1023 6.349 3.510 0.83
[3] Emanuele Betti and Massimiliano Sala, “A New Bound for the
13 8191 4095 77.439 37.113 0.89 Minimum Distance of a Cyclic Code From Its Defining Set,” IEEE Trans.
15 32767 15 3.182 2.044 1.03 Inform. Theory, Vol. 52, No. 8, August 2006.
17 131071 255 170.446 80.731 1.4
[4] J. Luo, K. Feng, “Cyclic codes and sequences from generalized Coulter-
19 524287 262143 Infinitive 180207 2.2 Matthews function,” IEEE Trans. Inform. Theory, 54(12), pp. 5345–
21 2097151 63 Infinitive 23048 12 5353, 2008.
23 838807 2047 Infinitive Infinitive 28
[5] B. Heijne, J. Top, “On the minimal distance of binary self-dual cyclic
codes,” IEEE Trans. Inform. Theory, 55(11), pp. 4860–4863, 2009.
[6] Cunsheng Ding, Yang Yang, Xiaohu Tang (2010), “Optimal Sets of
Từ kết quả tổng hợp ở bảng 1, có thể thấy rằng thuật toán Frequency Hopping Sequences From Linear Cyclic Codes”, IEEE
cải tiến 1 đã rút ngắn thời gian tính toán một cách đáng kể so Transactions on Information Theory, ISSN 0018-9448, Vol. 56, No. 7,
pp 3605 - 3612.
với thuật toán vét cạn, đặc biệt khi vành lớn hơn, thuật toán
[7] C. Ding, “Cyclic codes from the two-prime sequences,” IEEE Trans.
cải tiến 2 có thời gian tính toán ngắn hơn đến vài trăm lần và Inform. Theory, 58(6), pp. 357–363, 2012.
thực hiện được với những vành lớn mà các thuật toán khác [8] Gaurav Chawla and Vishal Chaudhary, “FPGA Implementation of
chưa làm được. Cyclic Code Encoder and Decoder,” Advance in Electronic and Electric
Engineering, ISSN 2231-1297, Volume 4, Number 3, pp. 273-278, 2014.
Việc xác định cấp của đa thức trên vành có vai trò quan
[9] Dang Hoai Bac, Nguyen Binh, Nguyen Xuan Quynh, “Novel algebraic
trọng trong việc xác định cấp của CMG – một thành phần structure for cyclic codes,” Applied Algebra, Algebraic Algorithms, and
quan trọng để kiến trúc mã LCC [10], [14]. Trong các nghiên Error Correcting Codes – Conf. AAECC 17, LNCS 4851, pp. 301-310,
cứu và kết quả tính toán về vấn đề này, các tác giả chủ yếu sử Springer-Verlag Berlin Heidelberg, 2007.
dụng thuật toán vét cạn với các hạn chế về năng lực, thời gian [10] Nguyen Binh, “Cyclic and Local Cyclic Codes over Polynomial Ring,”
tính toán và dung lượng bộ nhớ [9], [13]. Hai thuật toán mới Journal of Science and Technology, ISSN 0866 708X, vol. 50, pp. 735-
được nghiên cứu và đề xuất đã giúp giảm độ phức tạp tính 749, 2012.
toán và giảm thời gian tính toán trong khi độ chính xác là [11] Ngo Duc Thien, Nguyen Binh, “Some Local Cyclic Codes Based on
Compound Decomposition of Two Polynomial Rings,” International
tương đương với thuật toán vét cạn. Conference on Advanced Technologies for Communications (ATC 2008
- REV’11), Hanoi, Vietnam, October, 2008.
V. KẾT LUẬN
[12] Nguyen Trung Hieu, Dang Hoai Bac, Nguyen Ngoc Minh, “An FPGA-
Trong bài báo này, tác giả đã đề xuất hai thuật toán mới để based implementation method for local cyclic code encoder/decoder,”
xác định cấp của các đa thức trên vành đa thức với các ưu Journal of Science and Technology, ISSN 0866 708X, vol. 50-2A, pp.
38-49, 2012.
điểm: giảm độ phức tạp tính toán và rút ngắn thời gian đưa ra
kết quả, đặc biệt là đã thực hiện được trên các vành lớn mà các [13] Nguyen Binh, Le Dinh Thich, “The Orders of Polynomials and
Algorithms for Defining Order of Polynomial over Polynomial Ring,”
nghiên cứu trước đây chưa đề cập, cũng như thuật toán vét cạn 5th Vietnam Conference on Automation (VICA5), Hanoi, Vietnam,
không thực hiện được. Đồng thời, tác giả cũng đã đề xuất October 2002.
phương pháp chứng minh các bổ đề liên quan đến tính chất của [14] Nguyen Binh, Van Danh Nhuan, Pham Viet Trung, “Constructing cyclic
nhóm nhân cyclic đối xứng, sự phân bố đa thức dựa trên cấp đa codes over cyclic multipcative groups,” 26th Conference of Asian Info-
thức trên vành đa thức một cách tường minh về mặt toán học, communications Council (AIC26), Hanoi, Vietnam, Nov. 2001.
252

Về một kiến trúc mạng nơ-ron nhân tạo trên FPGA

ứng dụng trong nhận dạng chữ số viết tay
Nguyễn Thị Kim Anh 1,2, Nguyễn Trường Thọ1, Huỳnh Việt Thắng1
1
Trường Đại học Bách khoa – Đại học Đà Nẵng, 2Trường Đại học Nông Lâm – Đại học Huế
Emails: nguyenthikimanh@huaf.edu.vn, ntt0102@gmail.com, thanghv@dut.udn.vn
Abstract - Trong bài báo này, chúng tôi đề xuất một kiến trúc mạng thẳng nhiều lớp với ứng dụng trong nhận dạng mẫu. Mục tiêu
nơ-ron nhân tạo lan truyền thẳng 2 lớp ứng dụng trong bài toán của bài báo này là nghiên cứu thiết kế kiến trúc ANN lan truyền
nhận dạng chữ số viết tay thực thi trên phần cứng cấu hình lại thẳng nhiều lớp trên FPGA, đồng thời ứng dụng kiến trúc mạng
FPGA (Field Programmable Gate Array). Kiến trúc mạng nơ-ron đã thiết kế trong bài toán nhận dạng chữ số viết tay nhằm kiểm
đề xuất được tổng hợp và thử nghiệm trên thiết bị FPGA Virtex-5
tra tính đúng đắn của thiết kế, xem xét khả năng thực thi và ứng
XC5VLX110T của Xilinx. Kết quả thử nghiệm với tập dữ liệu chữ
số viết tay MNIST cho tỉ lệ nhận dạng đúng là 90.88%. Mạng nơ- dụng của kiến trúc mạng nơ-ron trên FPGA.
ron được thiết kế chiếm 41% tài nguyên phần cứng, đạt tần số hoạt Các công trình nghiên cứu liên quan có thể kể ra như công
động tối đa là 205 MHz. Kết quả thử nghiệm khi kết nối mạng nơ- trình của Hoffman [1], Savic [2], Nichols [3], hay của nhóm tác
ron vào hệ thống nhúng sử dụng vi xử lý mềm 32-bit MicroBlaze giả [4]. Nghiên cứu được thực hiện trong bài báo này là bước
hoạt động tại tần số 100 MHz với bus PLB cho thấy tốc độ nhận phát triển tiếp theo của kết quả đã đạt được ở công trình [4].
dạng cho mỗi mẫu dữ liệu vào là 799 chu kỳ đồng hồ/mẫu, tương
Đóng góp khoa học của bài báo này là việc thiết kế một kiến
ứng với thời gian nhận dạng 7.99 Ps/mẫu.
trúc mạng nơ-ron nhân tạo trên FPGA; kiến trúc mạng nơ-ron
Keywords - Neural Network; MNIST; FPGA; floating-point; đề xuất được thực thi và thử nghiệm trên board FPGA Virtex-5
high performance computing; MicroBlaze; XUPV5-LX110T của Xilinx và ứng dụng cho nhận dạng chữ
số viết tay với tập dữ liệu MNIST.
Phần còn lại của bài báo được sắp xếp theo trình tự sau đây.
Mạng nơ-ron nhân tạo (Artificial Neural Network - ANN)
Phần II giới thiệu mô hình hệ thống nhận dạng. Phần III trình
có nhiều ứng dụng trong xử lý tín hiệu, phân tích ảnh, nhận dạng
bày chi tiết cấu trúc, các bước thiết kế và thực hiện một kiến
mẫu, trong các hệ thống chuẩn đoán y khoa và dự đoán chứng
trúc ANN lan truyền thẳng 2 lớp trên FPGA. Phần IV trình bày
khoán. ANN được lấy cảm hứng từ mạng nơ-ron sinh học bản
các kết quả đánh giá kiến trúc vừa được thiết kế. Cuối cùng các
chất là các hệ thống xử lý thông tin song song và phân tán. Kiến
kết luận và các hướng nghiên cứu tiếp theo được trình bày ở
trúc ANN yêu cầu một khối lượng tính toán song song khổng
Phần V.
lồ, vì vậy để đáp ứng những yêu cầu khắt khe về tốc độ trong
các ứng dụng thời gian thực và/hoặc tính toán hiệu năng cao II. MÔ HÌNH HỆ THỐNG NHẬN DẠNG
(High Performance Computing – HPC) kiến trúc ANN cần
được thực thi trên phần cứng song song. A. Sơ đồ khối hệ thống
Trong những năm gần đây, các hệ thống nhúng và ứng dụng Sơ đồ khối hệ thống nhận dạng chữ số viết tay được trình
nhúng dựa trên nền tảng công nghệ FPGA (Field bày trong Hình 1. Hệ thống bao gồm hai khối chính đó là: khối
Programmable Gate Array) đang phát triển mạnh mẽ và được giảm số chiều cho ảnh đầu vào sử dụng phương pháp trích chọn
ứng dụng rộng rãi trong thực tế cũng như trong các nghiên cứu. đặc trưng PCA (Principal Component Analysis – PCA) [5] và
Với khả năng cho phép cấu hình lại, cùng với mật độ cổng logic khối thứ hai là mạng nơ-ron nhân tạo lan truyền thẳng nhiều lớp
cao, các chip FPGA cho phép tạo ra nhiều phiên bản thiết kế dùng để nhận dạng.
của thiết bị mong muốn trong các ứng dụng khác nhau, và do
vậy rất phù hợp cho những bài toán đòi hỏi khối lượng tính toán
lớn. FPGA cung cấp tốc độ có thể so sánh với các hệ thống phần
cứng cố định và chuyên dụng đối với việc tăng tốc các thuật
toán song song. Trong khi đó, với việc thực thi trên phần mềm
thì có thể duy trì tính linh hoạt cho các thiết bị cấu hình lại chỉ
Hình 1. Sơ đồ khối hệ thống nhận dạng
trong một vài ứng dụng. FPGA rất khả thi đối với các ứng dụng
thiết kế tính toán cụ thể. Những thay đổi trong thiết kế với Chúng tôi sử dụng tập cơ sở dữ liệu chữ số viết tay MNIST
FPGA có thể được thực hiện lại trong một vài giờ và do đó tiết [6] để huấn luyện và kiểm tra mạng nơ-ron. Tập cơ sở dữ liệu
kiệm đáng kể chi phí và thời gian thực hiện thiết kế. này gồm 60,000 mẫu dùng để huấn luyện và 10,000 mẫu dùng
Trong bài báo này, chúng tôi quan tâm đến việc xây dựng để kiểm tra. Có 10 chữ số khác nhau từ 0 đến 9 trong tập cơ sở
một kiến trúc ANN hướng đến việc thực thi thiết kế ANN trên dữ liệu này. Mỗi số là một ảnh đa cấp xám được chuẩn hóa với
FPGA. Chúng tôi bắt đầu với một kiến trúc ANN lan truyền kích thước là 28x28 hay có tổng cộng là 784 điểm ảnh đặc
ISBN: 978-604-67-0635-9 253

C. Huấn luyện mạng nơ-ron nhân tạo

Việc huấn luyện mạng nơ-ron nhân tạo từ tập dữ liệu
MNIST được tiến hành theo phương pháp học có giám sát, sử
dụng mô hình mạng nơ-ron truyền thẳng gồm hai lớp với thuật
toán lan truyền ngược sai lệch với các thông số sau: 20 đầu vào,
12 nơ-ron lớp ẩn và 10 rơ-ron lớp ra [4]. Quá trình huấn luyện
Hình 2. Sơ đồ kiến trúc của mạng nơ-ron nhận dạng chữ số viết tay được thực hiện bằng công cụ Neural Network Design Toolbox
của Matlab [7]. Hình 2 là sơ đồ thể hiện kiến trúc của mạng nơ-
ron nhận dạng chữ số viết tay cần thiết kế phần cứng. Theo như
Hình 2, đầu vào của mỗi lớp nơ-ron sẽ được nhân với trọng số
W, sau đó cộng với ngưỡng (bias) b, tiếp đó đi qua hàm kích
hoạt f (sẽ được trình bày trong mục sau).
Sau khi huấn luyện, chúng tôi đã thu được các ma trận trọng
số và ngưỡng tương ứng với kích thước của hai lớp như sau:
W1’ (12x20), W2’ (10x12), b1 (12), b2 (10). Để dễ dàng hơn cho
Hình 3. Định dạng số thực dấu phẩy động bán chính xác (half- việc thiết kế trên phần cứng, chúng tôi xem giá trị ngưỡng như
precision floating-point format) theo FloPoCo là một phần của bộ trọng số của nơ-ron (giá trị ngưỡng là trọng
số tương ứng với tín hiệu vào là “1”) và biến đổi trọng số của
trưng. Vì số chiều của ảnh gốc là khá lớn nên cần phải giảm số lớp ẩn và lớp ra tương ứng với kích thước như sau: W1 (12x21),
chiều trước khi huấn luyện mạng. Chúng tôi sử dụng PCA để W2 (10x13), đồng thời vec-tơ vào của mỗi lớp cũng được tăng
trích chọn thành phần chính từ dữ liệu gốc và chỉ sử dụng một thêm một phần tử chính là hằng số “1”. Các ma trận trọng số
số thành phần chính đầu tiên cho việc huấn luyện và kiểm tra này sẽ được sử dụng để thiết kế kiến trúc lõi IP ANN trên FPGA
mạng nơ-ron. sẽ được trình bày ở những phần tiếp sau.
B. Khối trích chọn đặc trưng PCA D. Kiểu dữ liệu
PCA là một kỹ thuật phổ biến để trích chọn đặc trưng dữ Chúng tôi sử dụng định dạng số dấu phẩy động trong tất cả
liệu, mục đích nhằm cách giảm số chiều hoặc kích thước tập dữ các tính toán của kiến trúc ANN được thiết kế. Tiêu chuẩn
liệu mà không mất mát thông tin nhiều. Để thực hiện kỹ thuật IEEE-754 (2008) [8] đề ra các quy định về định dạng của số
PCA cho tập dữ liệu X = (x1, x2, ..., xM) có M mẫu N chiều, ta thực dấu phẩy động thống nhất chung giữa các nhà thiết kế.
cần thực hiện các bước sau: Bảng 1 trình bày các định dạng dấu phẩy động bán chính xác
x Tính giá trị trung bình của X: (half-precision), chính xác đơn (single-precision) và chính xác
ଵ
kép (double-precision) với tổng số bit sử dụng lần lượt là 16, 32
xtb ൌ σே
௜ୀଵ xi (1) và 64 bit.
ே
x Tính sai số từng phần tử của X so với giá trị trung bình: Bảng 1. Đặc điểm 3 định dạng số thực dấu phẩy động thông
dụng được ứng dụng nhiều trong thực tế theo chuẩn IEEE-754
ɔi = xi - xtb (2)
x Tìm ma trận hiệp phương sai: Định dạng Phần dấu Phần mũ Phần định trị
ଵ Bán chính xác 1 bit 5 bit 10 bit
Cൌ σெ ்
௜ୀଵ ߮௜ Ǥ ߮௜ = Ȱ.Ȱ
T
(3)
ெ Chính xác đơn 1 bit 8 bit 23 bit
x Tìm trị riêng của C làሺߣଵ ǡ ߣଶ ǡ ǥ ǡ ߣெ ሻ tương ứng với N Chính xác kép 1 bit 11 bit 52 bit
vec-tơ riêng ‫ݑ‬ଵ ǡ ‫ݑ‬ଶ ǡ ǥ ǡ ‫ݑ‬ே .
x Sắp xếp các trị riêng theo giá trị thứ tự từ cao đến thấp, như Định dạng số dấu phẩy động bán chính xác được biểu diễn
vậy các vec-tơ riêng sẽ được sắp xếp theo thứ tự từ cao đến bằng một chuỗi nhị phân có kích thước 16 bit, bằng một nửa
thấp của đặc trưng. kích thước của định dạng chính xác đơn. Vì vùng biểu diễn giá
trị và độ chính xác nhỏ hơn cho nên định dạng dấu phẩy động
x Trích chọn đặc trưng có ý nghĩa nhất.
bán chính xác không được xem là lý tưởng khi thực hiện các
Việc lựa chọn số lượng đầu vào để đáp ứng những yêu cầu tính toán. Tuy nhiên, định dạng bán chính xác ít chiếm dụng tài
về tỉ lệ nhận dạng đúng và khả năng thực thi được kiến trúc nguyên phần cứng hơn các định dạng còn lại nên đối với những
ANN trên phần cứng FPGA với lượng tài nguyên hữu hạn đã ứng dụng, tính toán không yêu cầu quá khắt khe về vùng biểu
được khảo sát chi tiết trong [4]. Trong bài báo này, từ tập cơ sở diễn giá trị, độ chính xác mà ngược lại cần tốc độ tính toán
dữ liệu MNIST, chúng tôi đã trích chọn đặc trưng dùng kỹ thuật nhanh và không tốn quá nhiều tài nguyên thì định dạng bán
PCA và đã lựa chọn sử dụng 20 thành phần chính đầu tiên để chính xác này sẽ là một lựa chọn thích hợp [4]. Trong bài báo
đưa vào đầu vào của ANN thực hiện huấn luyện và nhận dạng. này, chúng tôi sử dụng định dạng dấu phẩy động bán chính xác.
Số lượng đầu vào này vừa đáp ứng được những yêu cầu về tỉ lệ Trong nghiên cứu này, các tính toán với định dạng số thực
nhận dạng cũng như khả năng thực thi của kiến trúc ANN trên dấu phẩy động bán chính xác trong kiến trúc ANN đề xuất trên
FPGA Virtex-5 [4]. FPGA sẽ được thực hiện bằng ngôn ngữ mô tả phần cứng
254

VHDL dựa vào thư viện mã nguồn mở FloPoCo [9]. Lưu ý rằng, Trong đó, ti là tổng trọng của nơ-ron thứ i; wi,j là một trọng
định dạng số thực dấu phẩy động bán chính xác (16 bit theo số ứng với đầu vào xj; ri là nơ-ron thứ i được xác định bằng hàm
chuẩn IEEE-754) khi thực thi bằng thư viện FloPoCo sẽ được kích hoạt logsigmoid của ti. Triển khai công thức (4) thành dạng
thêm vào 2 bit để phân biệt các giá trị đặc biệt [9] như được ma trận, ta được:
trình bày trong Hình 3 nên độ rộng các bus dữ liệu là 18 bit, ‫ݓ‬ଵǡଵ ‫ݓ‬ଵǡଶ ǥ ‫ݓ‬ଵǡ௝ ǥ ‫ݓ‬ଵǡே ‫ݔ‬ଵ ‫ݐ‬
trong đó chia làm 4 trường cụ thể như sau: ‫ݓ ۍ‬ଶǡଵ ‫ݓ‬ଶǡଶ ǥ ‫ݓ‬ଶǡ௝ ǥ ‫ݓ‬ଶǡே ‫ݐ ۍ ې ݔ ۍ ې‬ଵ ‫ې‬
ଶ ଶ
‫ێ‬ ‫ڭ‬ ‫ڭ‬ ‫ۑڭێ ۑڭ ێ ۑ ڭ‬
x 2-bit trường ngoại lệ: 00 cho số 0, 01 cho số bình thường, ‫ݓێ‬ ǥ ‫ݓ‬௜ǡ௝ ǥ ‫ݓ‬௜ǡே ‫ ۑ‬Ǥ ‫ݔ ێێ‬௝ ‫ݐ ێێ=ۑۑ‬௜ ‫ۑۑ‬ (6)
10 cho số vô cùng, 11 cho số NaN (Not a Number); ‫ ێ‬௜ǡଵ ‫ݓ‬௜ǡଶ ‫ۑ‬
x 1-bit dấu s (sign): 0 cho số dương, 1 cho số âm; ‫ێ‬ ‫ڭ‬ ‫ڭ‬ ‫ۑڭێ ۑڭ ێ ۑ ڭ‬
x 5-bit trường mũ e (exponent); ‫ݓۏ‬ெǡଵ ‫ݓ‬ெǡଶ ǥ ‫ݓ‬ெǡ௝ ǥ ‫ݓ‬ெǡே ‫ݔۏ ے‬ே ‫ݐۏ ے‬ெ ‫ے‬
x 10-bit trường phân số f (fraction).
III. THIẾT KẾ KIẾN TRÚC MẠNG NƠ-RON NHÂN TẠO
Trong phần này, chúng tôi trình bày việc thiết kế kiến trúc
mạng nơ-ron nhân tạo (ANN) ứng dụng cho bài toán nhận dạng
chữ số viết tay trên FPGA. Để thuận tiện trong trình bày, chúng
tôi gọi kiến trúc ANN này là lõi IP ANN (IP – Intellectual
Property).
A. Sơ đồ khối chung
Hình 5. Sơ đồ khối nhân cộng tích lũy MAC
Như đề cập ở phần trước, chúng tôi cần thiết kế lõi IP ANN
gồm 2 lớp: lớp ẩn và lớp ra. Sơ đồ khối ở Hình 4 trình bày ý
tưởng để thiết kế lõi IP ANN thực hiện mạng nơ-ron nhân tạo.
Kiến trúc tổng quát của hai lớp hoàn toàn giống nhau, tuy nhiên,
các lớp khác nhau về số nơ-ron và số các đầu vào một nơ-ron,
cũng như bộ trọng số tối ưu trong mỗi lớp. Các bộ trọng số tối
ưu W1 và W2 là kết quả của quá trình huấn luyện mạng ở mục
trước là các hằng số nên sẽ được lưu cố định trong ROM.
Hình 6. Sơ đồ khối hàm kích hoạt của nơ-ron thứ i
Hình 4. Sơ đồ khối chung lõi IP ANN
Cũng như trong phần huấn luyện trên Matlab, trong phần Hình 7. Sơ đồ khối kiến trúc của nơ-ron thứ i
thiết kế lõi IP ANN cho FPGA chúng tôi cũng chọn số đầu vào
Ta dễ dàng nhận thấy: ti chính là tích vô hướng (dot-
là 20, số lượng nơ-ron lớp ẩn là 12 và lớp ra là 10. Vec-tơ đầu
product) của vec-tơ wi – vec-tơ hàng thứ i của ma trận trọng số
vào x được nhân với ma trận trọng số W1, sau đó đi qua hàm
W – và vec-tơ đầu vào x. Vì vậy, chúng tôi thiết kế khối nhân
kích hoạt f sẽ cho 12 đầu ra của lớp ẩn. Tiếp theo, 12 giá trị đầu
cộng tích lũy (Multiply Accumulate - MAC) để thực hiện nhân
ra của lớp ẩn này sẽ trở thành đầu vào cho lớp ra. Thực hiện
vô hướng hai vec-tơ, sơ đồ khối MAC được xây dựng như Hình
tương tự đối với lớp ra khi nhân đầu vào với ma trận trọng số
5. Sơ đồ khối MAC bao gồm khối nhân, khối cộng và thanh ghi
W2 và cũng qua hàm kích hoạt f để xác định 10 đầu ra của lõi
sử dụng DFF để lưu giá trị ngõ ra hiện tại của phép toán cộng,
IP ANN.
ngõ ra của khối nhân được xác định bằng phép nhân của hai
B. Kiến trúc của một nơ-ron vec-tơ x và wi sẽ đưa tới khối cộng để thực hiện phép cộng với
Giả sử ma trận trọng số W có kích thước MxN và vec-tơ đầu giá trị đưa ngược trở về từ DFF, hay nói cách khác chính là cộng
vào x = [x1, x2, ..., xN]. Để tính nơ-ron thứ i, ta sử dụng các tích lũy. Hàm kích hoạt f trong công thức (5) được thiết kế theo
công thức sau: sơ đồ khối ở Hình 6, bao gồm ba khối: lấy mũ cơ số e, cộng và

lấy nghịch đảo, được thực hiện theo thứ tự lần lượt.
‫ݐ‬௜ ൌ σே Như vậy, để thực hiện nơ-ron thứ i chúng tôi ghép nối tiếp
௝ୀଵ ‫ݓ‬௜ǡ௝ Ǥ ‫ݔ‬௝ ሺͶሻ

ଵ
hai khối nhân cộng tích lũy và khối hàm kích hoạt với nhau
‫ݎ‬௜ ൌ ݂ሺ‫ݐ‬௜ ሻ ൌ (5) cùng với một bộ nhớ ROM có N ô nhớ để lưu trữ giá trị trọng
ଵା௘ ష೟೔
số hàng thứ i. Sơ đồ khối tính toán nơ-ron (Neural) thứ i được
trình bày như trong Hình 7.
255

C. Kiến trúc lõi IP ANN Quá trình kiểm tra được thực hiện với lõi IP ANN chạy trên
board FPGA Virtex-5 XC5VLX110T và trên Matlab để đối
sánh. Tỉ lệ nhận dạng đúng của lõi IP ANN trên FPGA và
chương trình trên Matlab lần lượt là 90.88 % và 91.33 %. Lõi
IP ANN cho tỉ lệ nhận dạng đúng xấp xỉ gần bằng tỉ lệ nhận
dạng khi thực hiện trên Matlab. Sự sai khác này là hoàn toàn
chấp nhận được vì các tính toán trên Matlab dùng định dạng số
với độ chính xác kép 64-bit trong khi các tính toán của IP ANN
trên FPGA dùng định dạng số bán chính xác với chỉ với 16-bit.
Tỉ lệ nhận dạng đúng đối với tập dữ liệu chữ số viết tay
MNIST khi thực thi trên máy tính (bằng các phương pháp khác
nhau) trong khoảng 95-99 % [6], khá cao so với tỉ lệ nhận dạng
đạt được trên phần cứng FPGA trình bày trong nghiên cứu của
chúng tôi. Tuy nhiên, lưu ý rằng các thực nghiệm đã trình bày
Hình 8. Sơ đồ khối lõi IP ANN 2 lớp ứng dụng trong nhận dạng ở [6] có kích thước mạng và số lượng đầu vào là rất lớn, chẳng
chữ số viết tay: lớp ẩn gồm 12 nơ-ron, lớp ra gồm 10 nơ-ron hạn tương ứng với tỉ lệ nhận dạng đúng là 95.3 % cần sử dụng
một kiến trúc mạng nơ-ron 2 lớp với 300 nơ-ron. Trong khi đó,
Hình 8 trình bày sơ đồ khối lõi IP ANN gồm 2 lớp được thiết thiết kế lõi IP ANN của chúng tôi chỉ có tổng cộng 22 nơ-ron
kế cho bài toán nhận dạng chữ viết tay. Lớp ẩn gồm 12 nơ-ron (chỉ bằng 7.3% so với thiết kế ở [6]) và đạt tỉ lệ nhận dạng khá
nên chúng tôi ghép song song 12 khối Neural. Tương tự, đối tốt (90.88%). Rõ ràng, sự suy giảm về độ chính xác nhằm đạt
với lớp ra chúng tôi ghép song song 10 khối Neural. Đầu ra của được một kiến trúc mạng nơ-ron tinh giản để có thể thực thi
lớp ẩn là song song, tuy nhiên đầu vào của lớp ra là nối tiếp. Do được trên phần cứng FPGA với số lượng tài nguyên hạn hẹp.
đó, chúng tôi thiết kế khối chuyển đổi song song sang nối tiếp
P2S. Các đầu ra của lõi IP ANN lần lượt là: r1, r2,.., r10. V. KẾT LUẬN
Trong bài báo này, chúng tôi đã trình bày việc nghiên cứu,
IV. KẾT QUẢ thiết kế và thực thi một kiến trúc mạng nơ-ron nhân tạo 2 lớp
A. Kết quả thực thi lõi IP ANN trên phần cứng FPGA (lõi IP ANN) trên FPGA và ứng dụng trong bài toán nhận dạng
chữ số viết tay. Lõi IP ANN có thể dễ dàng mở rộng theo hướng
Chúng tôi sử dụng bộ công cụ ISE 14.1 và board mạch thay đổi số lượng nơ-ron trong mỗi lớp và có thể ứng dụng để
FPGA Virtex-5 XC5VLX110T của Xilinx [10] để thực thi thiết thực hiện nhận dạng trên nhiều tập dữ liệu khác tùy theo mục
kế lõi IP mạng nơ-ron nhân tạo ANN. Lõi IP ANN cũng được đích của người sử dụng. Việc xây dựng mạng nơ-ron trên FPGA
kết nối vào hệ thống nhúng sử dụng vi xử lý 32-bit MicroBlaze sẽ là cơ sở cho việc hiện thực hóa các giải thuật huấn luyện cho
hoạt động tại tần số 100 MHz và sử dụng hệ thống bus PLB mạng nơ-ron trên chip và từ đó có thể mở ra các hướng thiết kế
(Processor Local Bus) của Xilinx để kiểm tra tốc độ và tỉ lệ và ứng dụng mang tính thực tiễn cao với sự tích hợp các hệ
nhận dạng. Các kết quả thực thi lõi IP ANN trên phần cứng thống xử lý thông minh trên chip. Các hướng nghiên cứu trong
FPGA như sau: tương lai bao gồm: tối ưu hóa kiến trúc lõi IP ANN đã thiết kế
x Tần số hoạt động tối đa: fmax = 205 (MHz); theo hướng tăng tốc độ nhận dạng, ứng dụng lõi IP ANN trong
x Tài nguyên phần cứng sử dụng được trình bày trong Bảng nhận dạng mặt người hay nhận dạng dấu vân tay, cũng như
2 cho thấy lõi IP ANN được thiết kế và thực thi chiếm nghiên cứu thực thi kiến trúc ANN theo hướng ASIC.
khoảng 41% lượng tài nguyên của board Virtex-5 TÀI LIỆU THAM KHẢO
XC5VLX110T và hoàn toàn phù hợp cho các ứng dụng [1] M. Hoffman, P. Bauer, B. Hemrnelman, and A. Hasan, "Hardware
nhận dạng được nhúng trên FPGA; synthesis of artificial neural networks using field programmable gate
x Tốc độ nhận dạng: tốc độ nhận dạng cho một mẫu dữ liệu arrays and fixed-point numbers," in Region 5 Conference, 2006 IEEE.
vào của lõi IP ANN là 799 chu kỳ đồng hồ / mẫu, tương [2] A. W. Savich, M. Moussa, and S. Areibi, "The impact of arithmetic
representation on implementing MLP-BP on FPGAs: A study," IEEE
ứng với thời gian nhận dạng là 7.99 Ps/mẫu khi lõi IP ANN Transactionson on Neural Networks, Jan. 2007.
được thử nghiệm trong hệ thống nhúng sử dụng [3] K. Nichols, M. Moussa, and S. Areibi, "Feasibility of Floating-Point
MicroBlaze hoạt động tại tần số đồng hồ 100 MHz. arithmetic in FPGA based artificial neural networks," in CAINE, 2002.
[4] Thang Viet Huynh, "Design space exploration for a single-FPGA
Bảng 2: Ước lượng tài nguyên phần cứng của lõi IP ANN trên board handwritten digit recognition system," in 2014 IEEE-ICCE, 2014.
mạch Virtex-5 XC5VLX110T (speed grade -3) [5] Lakhina, S. ; Joseph, S. ; Verma, B., " Feature Reduction using Principal
Component Analysis for Effective Anomaly–Based Intrusion Detection
Logic sử dụng Tổng số Đã dùng Chiếm dụng on NSL-KDD ", IJEST, 2010.
[6] The MNIST database of handwritten digits,
Số slice 69120 28340 41% http://yann.lecun.com/exdb/mnist/
[7] Neural Network Toolbox™ 7 User’s Guide
B. Đánh giá độ chính xác và kiểm tra tỉ lệ nhận dạng [8] IEEE Standard for Floating-Point Arithmetic," IEEE Std 754-2008 , vol.,
no., pp.1,70, Aug. 29 2008
Để đánh giá tỉ lệ nhận dạng của lõi IP ANN chúng tôi sử [9] FloPoCo project, http://flopoco.gforge.inria.fr/
dụng tập dữ liệu kiểm tra từ MNIST gồm 10,000 mẫu dữ liệu. [10] Xilinx training, http://www.xilinx.com/training/fpga-tutorials.htm
256


!
"#$ %#&

' ()* +,-.$%/0
1
234%)5
6 1178 9 2&:
+
1
23;<=8 4%)5
6 8 9 24
6 > 9:
0
?.@AB CD:DB:,4%D&.C,:DB:,

% f +4 O %a 9 [ g. O E-

!
"# $%& V
N 8 ,8 %P W K)] P O ,R
' ( )*
+,)*-. 8 Z. [K(VN 8,8 KDW:

($ /&
!!
* !0 12&" ! @)RK&h `%a 8 )5 ,RN '

3 !

O P:9S i K&h K)] O%a SQ `.8;
4 !
356$78/6(9
:
6
;)*-&
- K 9 ,RN O SOQ j[_ :
!!
* !01&<$=
,)* h % O2 BJ%#9@e K(

>?@

&+,)*-.
( dJO]& [K( `%a ,R @U

' A B&

, )* h B : B )5 g. S . & ]& 2.
+CD$ , 4.\2., dkK)] J 2[M.@UE-:IO
@UE-. ,h B K)] e K(4h B S/

K)] [/ ( D B %& , ` %a &
!

"
#
$
"

%
"
&
'(
%)R S/K)] [/()@Kg( `%a &blc;bmc:

E: EFEEGH IJ%XBY N '&@UK)] eD.enDBo K*
IJ % K5 . %# & 9 KL .M % N @p ,R +404:::4 ? : %( [/ ( [q 8
&&),2OP & 2 %# %X BY Z
, 4 , K)] Q [_
Q& I %)R KS: T 94 @U E- VD@@D @ &%&D%W
%XBY,R8 Z. [K(:$\@U
4 4 # [q 8 : %( [/
K)] O ,R . [ K( : 9N % K^ Q 2 ( %( Bo 8 Z O 4
, K)] e K(
N @UE-K)] [_ N 8 K2&KZ ` [M!4,RA
%a [K(b+c4b0c:% dN `%a &O

K)] KXe` N . @#O4fB
!
"#$ %
"#$ % $%
@)R@B K)] d3B % %L`:
& !"

% [ [q 8 K)] .8 D [` Kr h

dKsA

' () * +) ) ,

9 % [ [q 8 K)] t .L4 f &Q
%XBY S/K)] e K(DA
-

'
0 # 1$ !
$ %

./
% KS4 # 1$" +%@d@)] ' / N
BD",+:

[ ) e h B @# 9 KL a
K)] %` X # h , KL S %` X
f+:1%a 9D `%a &@)R &)* &&K)] K)%A!%XVuv DD

ISBN: 978-604-67-0635-9 257

@ %.W bwc4 ) S

O Vux v @ EE: Hx9!-Ix
&.yWbzc4)SK-3V-Ixv&% @D -#[%5% -Ixb0cK)] KXe`K/e3@N
d{%. &.yW b|c:::: % KS &)* && -Ix t %U [eh B ,RN K' K/.^[)dA
X)K/.,XOq i ) K : +: I3 B -Ix X K V.@d D -IxW:
)S [ K&3 V-IxW@ . O7 )
8 ` [, Kh
S f. O. J Q h BJ %# Z / K)] R 2
@ K # [M 1DDB , ?[D%% b|c , q. +}}w:
KL K)] / R & 3 M K h
)* J ,R N &)* && ) S D Z /
+ :
X K. [ dJ * ,
O 4)@A B%X4[Ke` 2 `@)] && N KO&
& ,R OM Y # Z / /
V&3W% &.,f.O.b~c:#4O8 0:
,R[Ò K -Ix4dJ%&
,RN &)* &&)SSO 4% -Ix4 3 [ K O8 @ Y #: I @)]
O8 SdJ^]&,@2B%X N /% &3 KLK)] %[_ f.O.`K(
Z%ff.O.:-IxJ 2D&QeL :
& 3 % [ K: ! KS4 S dk f. % l: && e KL K)] &
&& ` [_ KX Z7 K O/@)R0;!,l;!
.\ /,X&Q,(%Q`%# S,,X&Q& ")KgJ 2)dA
3` [[K.\[)R 5 V2W
b}c4b+c:% 4 &&` [
K)] f. % . S BJ %# N O ?E9
2. .\ & 3 , dJ @# @ N a %
K: $\ / @a % 2. % O8 f.
O.,dkBgK &&*DA+W
1M
sA Ks @ ,( %Q ` [4 " 2+ 4 K)] .\
1Q )R Z/
& 3 f. % , 0W eL A ,( %Q ` 4
%6 dZQ42dh d0,
3 +" 2+ 4 K)] K f. %: -Ix K)] &
2deLdl
B 8 X[K S% O8
@# 4 #Ks@.&)* &&hK/&B 1M & 3 ,R , , ,( %Q
@# [ e V,B:4 e @# 9 -)* && Y#
-Ix KL %M # 8 B B Q K* % Z
%f%/O, Oq S K.
&&]&@ S: Q.Q
D. en N B( / & 34 -Ix )5
K)] @&.8;f)@N 2 [ % &#
[5 @# b++c' &#[5 %5%
Q&[Dd, [Dd
b+c:8 )5 4N %#-Ix@#ZK0
OQ Aa K.h K ,%) [
) dR.4 K' [2@,`KX)dR.: U% 4a K
q @J Od &3@ %J &K/K[
&3%OtK/.) [:<f,4X
&,(%Q4, 4&[Dd4 [Dd
KL K)] K) % _. 2 O q O d -Ix:
&3
r 4 % -Ix S Q ]& b+0c4 . d [ K
@.,2 K/]& )S &O
,n ;* &&4 d S X * N * K/
f.% &&` : 9
#

/ K -IxfKL S.d &&
K)] K)%A 2dZQb+lc4 2d P
b+c% @2 a 8Od&#[ -Ix
Dd
@!-IxV!d %DD-IxW,R .8f,X:A
eL,O 2. sK/`%UdJ)M
?9!
KdJ [K:
- o@ [[K)] ^ h )dA% &
f0:")Kg!-Ix
EE4 a 8.#!-Ix:% &EEE4dJO
d .8f2dK :-E< `& OZ.8 % KS M & OM % [ D Y
&t , &s Q @ : 4 a 8 O @ #, `K(V&`K([KW:
,R.\&
[[% &<: 34OM,(%Q,, Y#[K4K
%(Q .\&34K' " 2+ .\&34

258
f.3 +" 2+ ` " 2+ :J 2!-Ix EEE: 1xI$9GI
9
X@% OKXO2,o @'&,YKa : -Ix K)] @` . h K' Q &
%E
8'&8 Q d 6 : $\ & 3 KX S , %# S K/
d3 ,( %Q & 3M 2 h 45 @# $#/ Z K( )R [ , O [ .f K/ &
#6 #7 #8 %, 3 +" 2+ , " 2+ )* h K)] *,RK/.):% 2 !-Ix42
@3+ ,#+ :<(%Q.R # 4#9/4K)] QDA d O 2. s , 2 d eL J dk KX
#9/ :/ ; <=6 ;
# > #+ ? 7 K^ , .\ & 3: ` O 2 -Ix
VmW KX S&A&Od,&d3B :_ %J Z4
;
# > 3+ @ 0 # % &K 6@&Od4 a f.O.
% KS4" > + S @JK^K/ /K^" #. , O8 f.O.4KX S @.\
+: r 4 +404l4m , [ m4+404l4 f dk &3dkK^, %# S[_ &
K)] " > + d{&V+4mW d{&V04mW d{&Vl4mW: 3 X , ,( %Q ` [ S * @ ,( %Q `
" ? + S @ J K^ % "K)] & : #4 % & d3 B 4 d . d @ @'&4
[MJ K^% +: _ d/ 6 7 @ a O/.%[K,R)Z K/.
%(ZQ4KJ,K [K: ; " S @ Od :% %)5 ]&4Oq 2d
J K^"dk K)] & B ,R e d`$ & > J @R * 2d [ : O Z Od
%:<@JN K^B : %)R Ks KX K( 2d 0 l |0} : T Ks4
IBCFEBFGH4
AABCDEBFGH4 ,AA @ N J K^ K/ q a KXe`&)* &&K^ 8 dD
&3# ,R,(%Q` [,,(%Q`
.,Xd@@'&:
S:9N K^dkK)] &B ,Re d` - a 8Od[.8f dJK^
6 ,7 :#4N 8 d)5 K)] `K( 2d:
@_ d: $8fhÀ d&%.DD%
- K # &)* %f VmW [/ ( , %)R
KS4.S%K @)] &3Od
Z&.,f.O.:-h4K)] eD.)@

&O 2. s4[/( d %#
.\&3:&O 2. sdka K
& 3 B / ,X &Q N ,( %Q ` %#

a K)] &2K@a KS:-h[K)] eD.)
@&eL4[/( K )M
&34% ,2 f.O. &&) :
&eL@8On &3,X&Q&3`
K)] &2 R@a KS: flA$8f d&%.DD%
FG%H
-# $8fh0A[%B&%.DD%
s[_ N ,2 S X dJ O d % & K ,
OQ j [ K @ @ B ,2 d3 B !-Ix X @: &0M N O P&
a [PK K.RO %(Q ` N
O8 K^ % d X ,o @'&: $ d &)* K L&0M Q &0P ; P& * N O R&
&&)O/KKKLK)] KXe`% @2A[ s M&
`bmc:::IOKt% 2 KKf.%K)] &0 N S R&
) [4 a dk O d N , h .R &0 N O P&
[_ BY&8 :I,RKX4&)* N
&& X @ S . d dJ O [2 , B= B J 2 KJ L&0 T &0P ; P& * N O R&
M&
*A a O8 KN Kt4
#4 a dk -Ix ,R & ]& & 3 .R &0M N S R&
K/.)O8 K^% .d@@'&`K(:8 [%B&%.DD%
%)R KS ,X " 2+ , 3 +" 2+ i dk K)]
/R Kd:
>%f^ /)dA
'.h Kd@@'&Oa V0W

'd@)] @@'&O8 K^<2"( @+:

.5 .K/.)O8 K^:

9 5 [_ ,R<2"( 4 f dk OM K @ &
[K

fmA$8f[%B&%.DD%

259

$8fhlA@D%&%.DD% !

N !
K &0U Q &0M ;

&&
N
KJ &0 T &0M ;
&&
@D%&%.DD%

f|A K ,K^K( h B !<x-!

!
!
fwA$8f@D%&%.DD%

$8fhmA9@D%&%.DD%

Q
&&QN
K Q V &&

N

Q
KJ Q V &&
9@D%&%.DD% f~A K ,K^K( h B <x-!

!

!

fzA$8f9@D%&%.DD%

<R.\.8f8 d a dkOd K f}A K ,K^K( h B $!
,K^K( 2 ,Rd,o @'&0:
E<: 1>H9EG$

!
!)RKs@OZ.8&t [_ 8 N@&%f !
K , K ^ K( [ h B A -<x-!4

<x-!4$!4$-?m:<R` [h B 4
)K)] &B +@ .\h B ,R %(
.\ ,o @'& @ 0: 1 Z K)] %
f|4~4}4+@ %(% [f% +@):

f+A K ,K^K( h B $-?m

260
OZ.8&t a Ò2dO 2. E"EGHu$1x

s,2deL@_ df%` ,2 f.K/. b+c ": D B : !: $ D@4 9D{%Od &dA u D{ I
&n&eh B @#N 9 S &%B .44,@:lw4:+400:
d@)] E- %Dt:% O.8f"D%;&%.DD%, b0c : : !@@ B : {@Dd4 D & ODd4 {%DdA x; &
;@D%;&%.DD%@8 N OZK .h K D% D D{%Od4
!40+:
% [f % ` h B O d: [%B; blc I:$%@B:!:$ D@4B{B d%DB.&& %Dd
9 % D %Dd4
" !
&%.DD% `K^K(, K `% ` #

4,@:0:D[:0m:
h B Od4KX S/@ )dA bmc <D; 9 D 4 : ! ¡4 $;%D -.: u&&@
&O 2. sdka K &3B / .&%,DB !d %DD -Ix .Dd;[dDB 9 &&@ .&& 4
,X &QN ,(%Q ` %# a K)] & 2 E?E?E!<0+w:
K @a KS: & eL 4 [/ ( K bwc :"D4I:1.%4u{;dD& DD @ %.%.&& dO %&d
)M & 34 % ,2 f. O. && ) D{%O & % D %D4 A -% DDB d D ?%. %
I.&d.! @IdD.!Dd V!I!W40l:
:K4O[K[PKf.O.4.\ s
bzcu:@%4$:!% 4<:$Dyy4!d%[DB&.y[
dk f. O. D K( )R %# .f ) d . @Dd4 DdBD@&%D.¢%D n%D DD%&nDDd%@,D
O 5 4.8f ` s %£ D@@D4% D4?@dD,D%-[@d 4-%d4+}}}:
S . D K)5 Q , K( )R f. O. b|c : 1DDB B : ?[D%%4 -% @D d{%. &.y4 -% :
E???E::9D%@9D{%Od4+}}
s &q @#K eL,
b~c !: ?: @B[D% 4 $

% &

'

S f.KK/.) : (
)
:DB 4$uAuBBd;Dd@D4+}~}:
<: 1"H9 b}c $: @D% 4 D d{%. B D ZDDA {%B BDD%.d B
B&,D &% @D d{%. &.y4
8 Z O d .8 f 2 d O 2.
*
4,@:l4+}}}:
sveL% )[KK,R[ b+c $: @D% B :1DDB4 D &% @D d{%.¤?e&@d4 d[@4
eh B @#. %# &:$8f@ n& N2 B ,D% D D .@;B.Dd@ .&@De d& D4 "
4,@:z400:
d _ , Q K)] h . a& q
b++c : $: ?.% B : u: 4 d d{%. &.y
K ,K^K(% ,2 f.O. %() D ZD { d[@ @dd4 -% : u.D% %@
: D%D D4,@:l4&&:0~++;0~+|40m
$8 f @ n& N 2 d _ , Q K)] b+0c:,BDD% Bu:-:? D@[%D 4u &D%,D&&%
K a& ) ,^K( ,fdJ &% @Dd{%.&.y4E???%d:?,@%
&]&@ :$8f K)] a .&4,@:~4:l4&&:00w;0l}40m:
8 @J 6 d3 B ) _. e h
b+lc:IB::?[D%%4u.BDB&% @Dd{%.&.yD%4-% :
B @# & a& 2 K ,K O E??? E: : ?,@% .&4 u % D4 u14 &&:z};
Ze: |l4+}}~:

9 # hK)] %][M>7&%/O6
, 8 2 Z V9uxI?!W % KX .L d
+0:+;0+l:+|

261
Xây dựng thuật toán điều khiển tia siêu âm hội tụ dựa
trên FPGA
Trần Trọng Thắng1, Nguyễn Duy Thông2, Trịnh Quang Đức1*
1
Viện Điện Tử Viễn Thông,Đại Học Bách Khoa Hà Nội.
2
Khoa Kỹ Thuật Công Nghệ, Đại Học Quy Nhơn
Email: thangepu227@gmail.com, duc.trinhquang@hust.edu.vn, thongnguyenduy88@gmail.com
Abstract—Tia siêu âm hội tụ mang lại nhiều lợi ích trong việc đo qua đó khẳng định tính khả thi đối với việc triển khai thuật toán
và tái tạo ảnh siêu âm. Triển khai kỹ thuật mảng pha để điều khiển điều khiển trên chip FPGA.
hội tụ tỏ ra ưu thế cho những ứng dụng trong y học và kiểm tra
không phá hủy. Tuy nhiên, hiện nay, kỹ thuật mảng pha vẫn được II. CƠ SỞ LÝ THUYẾT
thiết kế bằng những bộ điều khiển khá phức tạp. Bài báo này trình
bày phương pháp tiếp cận thiết kế bộ điều khiển dựa trên nền tảng Để tính toán sự trễ pha áp dụng cho từng phần tử của đầu
FPGA để tận dụng ưu thế mảng logic cho tính toán và thực hiện dò siêu âm mảng pha trong quá trình điều khiển hội tụ, cần
song song. Thuật toán điều khiển được tính toán, mô phỏng trên xem xét sự kết hợp của sóng âm trong không gian. Sự kết hợp
máy tính qua một số những công cụ hỗ trợ như Model Sim và này được mô tả bởi lý thuyết giao thoa sóng trong vật lý. Sóng
Matlab. Điều kiện thí nghiệm mô phỏng được sử dụng là đầu dò âm được lan truyền trong không gian ở điều kiện lý tưởng khi
siêu âm mảng pha có số phần tử là 64 hoạt động ở tần số 1MHz. bỏ qua độ nhớt và sự phụ thuộc của tốc độ truyền âm vào mật
Kết quả, sau khi mô phỏng cho thấy độ sai số cho phép có thể lên độ phân bố hạt được truyền đi dạng cầu. Nghĩa là ở môi chất
đến 20 ns tương đương với tần số xung nhịp là 50 MHz. Với điều
kiện này, thuật toán trên hoàn toàn có thể đáp ứng được yêu cầu
truyền đẳng hướng và đồng nhất sóng lan truyền theo mọi
triển khai thuật toán điều khiển thử nghiệm trên chip FPGA thật. hướng trong không gian giống nhau.
Cơ chế lan truyền sóng âm được hiểu là sự giãn nén của
Keywords-Đầu chuyển đổi mảng pha, Trường siêu âm hội tụ,
mật độ hạt trong môi chất dưới tác dụng cơ học. Sự nén giãn
Điều khiển trễ pha, Mô phỏng máy tính.
mật độ hạt như vậy có thể đo lường bằng đơn vị áp suất âm.
I. GIỚI THIỆU Mô hình toán học mô tả sự lan truyền sóng âmdưới dạng lan
truyền áp suất âm p được Feymann lấy vi phân như sau [6]:
Trường siêu âm hội tụ có nhiều ưu điểm trong tạo ảnh siêu
âm [1] và điều trị y học [2], bởi tính phân bố áp suất âm và 1 w2 p
năng lượng âm tập trung ở khu vực hội tụ. Để tạo được trường 2 ( p) 0 (1)
cs2 wt 2
siêu âm hội tụ như vậy, người ta có thể tiếp cận bằng nhiều
cách khác nhau như sử dụng mặt cầu lõm [3] hoặc thấu kính
Phương trình (1) có thể dễ dàng giải với hệ số hằng c s , đại
âm [4]. Những phương pháp tiếp cận như vậy đòi hỏi thiết kế
cơ khí và trình độ gia công khá phức tạp nhưng đối với ứng diện cho vận tốc truyền sóng, để cho được nghiệm viết như
dụng trong lâm sàng lại không thực sự thuận tiện. sau:
Một cách tiếp cận khác có thể giải quyết vấn đề trên là sử
p r, t P0 sin Zt r kr r M (2)
dụng trễ pha với tính toán để sao cho thực hiện giao thoa toàn
bộ các tia phát tại một điểm bất kỳ trong không gian được gọi
là kỹ thuật mảng pha. Kỹ thuật mảng pha được Thomas Young trong đó P0 là áp suất âm cực đại của một nguồn sóng âm,
khám phá và giới thiệu lần đầu tiên vào năm 1801 tuy nhiên 2S
Z là tần số góc của dao động âm, k là hằng số sóng, M
phải đến năm 1980, đầu dò siêu âm mảng pha mới được giới cs
thiệu lần đầu tiên [5].
Việc triển khai kỹ thuật mảng pha mang lại nhiều lợi thế là góc pha ban đầu của nguồn sóng và r x , y , z đại diện cho
bởi nó có thể điều chỉnh được tiêu cự, cường độ hội tụ, quét, lái tọa độ của điểm giao động. Mặt khác, sự giao thoa sóng có thể
tia, hoàn toàn bằng điện tử. Dựa trên cách tiếp cận này, các được mô tả là sự chồng chất các nguồn sóng ở tại một điểm
máy siêu âm y học đã ra đời, không những thế, các thiết bị trong không gian ở một thời điểm nhất định. Sự chồng chất
kiểm tra không phá hủy cũng dựa trên nguyên lý này. này được có thể được lượng hóa bằng phép cộng đơn giản trên
Tuy nhiên, hệ thống điều khiển mảng pha tỏ ra khá phức miền thời gian, do đó, dựa trên phương trình (2)với lý thuyết
tạp bởi nó đòi hỏi tính song song trong tính toán và thực hiện chồng chất sóng có thể mô tả giá trị áp suất âm ở một thời
lệnh làm cho thiết bị trở nên kồng kềnh, chính vì thế, ưu thế điểm và ở một vị trí trong không gian như sau:
mảng logic như FPGA sẽ có khả năng giải quyết vấn đề này. n
Bài báo này trình bày một triển khai thử nghiệm thuật toán p¦ r , t
điều khiển mảng pha trên chip FPGA để tìm giới hạn của nó ¦P sin Zt r kr r M
0 i (3)
i 1
ISBN: 978-604-67-0635-9 262

trong đó xem rằng áp suất âm giao thoa tại một điểm bất Ở đây, h là khoảng cách giữa tâm của các phần tử phát
kỳ trong không gian bằng tổng áp suất âm của n nguồn sóng ở sóng liên tiếp, d là độ rộng của nhóm phát tia và góc T đại
cùng một thời điểm t. Nếu như góc pha ban đầu M 0 , diện cho góc lệch trục của chùm phát hay còn gọi là góc lái tia
phương trình (3), được viết lại như sau: (Hình 1). Như vậy từ công thức (6) có thể tính được các
li
n
ti và dẫn đến công thức trễ pha:
p¦ r , t ¦P sin >t Z r kc @
0 i s (4) cs
i 1
với ti được xem như khoảng thời gian cần thiết để sóng từ
'ti t max ti ti min(ti ) (7)
vị trí nguồn trong không gian truyền đến 1 điểm xác định.
III. HỆ THỐNG, THUẬT TOÁN VÀ MÔ PHỎNG
Điểm hội tụ sẽ được xem là điểm có áp suất âm cao nhất,
tức là tại đó n sóng tới sẽ đồng pha, nghĩa là III.1: HỆ THỐNG
kcs t1 kcs t 2 ... kcs t n . Với k là hằng số phụ thuộc vào đặc
tính vật lý của sóng âm và cs là hằng số vận tốc truyền sóng Công thức (7) cho kết quả tính toán bất kỳ và giá trị của nó
phụ thuộc vào điều kiện vật lý của môi chất nên thuộc miền số thực, mà ở miền số hóa, thời gian bị gián đoạn
t1 t 2 ... t n (5). Điều này giải thích tại sao mặt cầu lõm lại do phép chia tần bị hoàn toàn phụ thuộc vào xung nhịp của hệ
thống điện tử, do đó, sai số lượng tử là bắt buộc phải được tính
cho được trường áp suất âm hội tụ.
đến. Các chip FPGA, thường có xung nhịp hữu hạn và do đó
Tuy nhiên, khác với cấu trúc của đầu dò siêu âm dạng lõm, sai số lượng tử này cũng hữu hạn. Với công nghệ hiện tại sai số
các đầu dò siêu âm mảng pha thường thiết kế dạng phẳng do này không quá 10 ns tương đương với 100 MHz. Dựa trên cách
đó t1 z t 2 z ... z t n vì vậy sự khác nhau này cần phải được bù tiếp cận này, hệ thống được thiết kế với sơ đồ khối như sau:
trừ để đảm bảo điều kiện (5). Sẽ luôn tồn tại một điểm mà ở
đó ti t max , nghĩa là khoảng cách ri là lớn nhất, như vậy độ
chênh lệch cho trễ pha khi điều khiển sẽ là 'ti t max ti ,
chính là độ trễ pha phải tính toán và áp vào bộ điều khiển trễ
pha.
Để tính toán độ trễ pha này, có thể sử dụng phương pháp
hình học đơn giản. Xét một cách tổng quát, nếu chọn một
nhóm n phần tử trong tổng số N phần tử của đầu dò siêu âm
mảng pha phẳng. Giả sử rằng, nhóm n phần tử này sẽ hội tụ tại
điểm F, ta có thể tính được khoảng cách giữa điểm hội tụ và
nguồn phát sóng li với khoảng tiêu cự f được coi là khoảng
cách từ tâm của nhóm phân tử tới điểm F. Công thức được
biểu diễn như sau:
Hình 2: Sơ đồ khối thiết kế hệ thống.

2
d Ở đây đầu vào được chia làm 2 khối: khối địa chỉ và khối
li fcos (T )
2
i 1 h fsin(T ) (6)
2 dữ liệu. Khối dữ liệu là kết quả được tính toán theo công thức
(7) sẽ được trình bày chi tiết trong phần III.2. Vì sự giới hạn
trong số lượng kênh ngoại vi của thiết bị điều khiển ví dụ như
F máy tính hoặc vi xử lý, đầu vào của hệ thống sẽ được bố trí là
một kênh dữ liệu và một kênh địa chỉ. Qua đó, Mỗi số kênh
liệu sẽ được chốt bằng 1 kênh địa chị tương ứng thông qua
khối Latch. Bên cạnh đó các kênh địa chỉ cũng được chuyển
đổi thành song song qua khối SR (serial register). Như vậy,
f một cách tuần tự, các số liệu sẽ được định vị đầu vào ở các
li
kênh thực hiện trễ Delay và chốt ở đó bằng khối Latch, dữ liệu
li+
địa chỉ nối tiếp được chuyển thành song song sẽ cho phép các
kênh trong khối Delay xuất ra tín hiệu với độ trễ tương ứng với
các số liệu đã được chốt ở đầu vào cách kênh trễ. Quá trình
Ei thực hiện đầu vào là tuần tự, nhưng quá trình thực hiện điều
h Ei+ khiển trễ sẽ song song. Khối Delay được thiết kế đơn giản dựa
d trên chia tần với đầu vào là xung nhịp clock của chip FPGA.
Để thử nghiệm, phần mềm tính toán dữ liệu đầu vào và địa chỉ
Hình 1: Mô hình hình học minh họa tính giả định trong bài báo này được tính toán trên Matlab và lưu
kết quả tính toán dưới dạng tệp .txt để làm đầu vào cho hệ
toán độ trễ pha .
thống mô phỏng chạy trên Model Sim.
263

III. 2: THUẬT TOÁN III. 3: MÔ PHỎNG
Thuật toán tính toán được thực hiện dựa trên công thức (7), đầu Để kiểm nghiệm sự tính toán các số liệu trễ pha và ảnh
vào của công thức (7) sẽ công thức (6). Các dữ liệu đầu vào hưởng của chúng tới phân bố áp suất âm cũng như đo ảnh
cho tính toán sẽ là số phần tử n, độ rộng nhóm phát tia d, hưởng của sai lệch do rời rạc hóa bởi giới hạn của tần số xung
khoảng cách giữa các phần tử h, tiêu cự f, góc lệch T , và tốc nhịp, một phần mềm mô phỏng trường áp suất âm được đã
độ truyền sóng cs Ngoài ra, để áp dụng công thức (6) và (7), được tạo ra [7]. Dựa trên phần mềm mô phỏng này, trường siêu
chương trình cần phải xác định điểm gốc tọa độ. Để tiện tính âm được tạo ra từ mảng pha đã được tính toán sẽ được trực
toán, gốc tọa độ ở đây sẽ được chọn là tâm điểm của nhóm quan hóa. Ở đây, các giá trị áp xuất âm được tính toán theo một
phần tử phát tia. Thuật toán của chương trình tính toán được mặt phẳng mà được chia thành một ma trận với vị trí của các
mô tả theo lưu đồ ở hình 3. phần tử của ma trận tương ứng với một vị trí xác định trong
không gian và giá trị của phần tử thể hiện giá trị áp suất âm tại
vị trí không gian đó. Nếu trích các giá trị theo chiều dọc tại tâm
Bắt đầu của búp sóng chính, chúng ta sẽ được đường bao phân bố áp
suất âm theo chiều dọc. Ngược lại, nếu trích các giá trị theo
chiều ngang, đường bao phân bố áp suất âm theo chiều ngang
sẽ được định hình dạng.
Khai báo tham số:
n, h, f, d, Các giá trị trễ pha được tính toán nằm trên miền số thực với
sai số rất nhỏ có thể lên đến atto giây. Với sai số này, không
thể có bất cứ một thiết bị điện tử nào có thể thực hiện được.
Bởi các chip FPGA hiện nay chỉ có thể làm việc với tần số
xung nhịp tối đa lên đến 500 MHz tương đương với 2 nano
giây, do đó, cần phải xác định sai số tối thiểu mà hệ thống có
Lựa chọn tọa độ gốc thể chấp nhận được. Để đánh giá sai lệch này, phần mềm thiết
x(0)=-n/2; y(0)=0 kế trên FPGA được mô phỏng trên Model Sim, một công cụ
đánh giá chương trình cho hệ thống sẽ được cài đặt trên chip
FPGA sẽ cho kết quả đầu ra. Kết quả đàu ra này sẽ được sử
dụng để mô phỏng trường áp suất âm và so sánh với kết quả
tính toán và đo độ sai lệch của theo một đơn vị sai số lượng tử.

2
d
fcos (T ) i 1 h
2
li fsin(T )
2 IV. KẾT QUẢ
Hình 4 thể hiện ảnh cắt lớp 2D của phân bố áp suất âm được tái
tạo trên mặt phẳng có kích thước 120x90 mm tương ứng với trục X
(song song với mặt đầu dò) và trục Y (vuông góc với mặt đầu dò).
Hình ảnh cho thấy chùm siêu âm hội tụ ở 20 mm và loe rộng ra khi
li tiến ra xa hơn. Thông số trễ pha của các phần tử được biểu diễn ở
ti bảng 1.
cs
90
80
i=n? 70
60
50
40
Y (mm)
't i
t max
t i
t i
min(t )i 30
20
10
Kết thúc
0
60 40 20 0 -20 -40 -60
Hình 3: Lưu đồ thuật toán tính toán trễ pha. X (mm)

Hình 4: Trực quan của phân bố áp suất âm trên
mặt phẳng mô phỏng với điều kiện
c 1500m / s ở tần số 1MHz, h=1 mm, và
s
n=16, hội tụ ở f=20 mm với T

0
0
264

Số liệu i 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16
ở Bảng 1 ns 0 23 44 61 75 86 93 96 96 93 86 75 61 44 23 0
cho thấy Bảng 1: Giá trị trễ pha của 16 phần tử
khi góc
Theo như lý thuyết về hội tụ, vùng hội tụ theo chiều dọc,
nghiêng T 0 , các giá trị trễ pha đối xứng với nhau qua phần
0
ngoài sự phụ thuộc vào độ rộng chùm phát tia d, tần số và vận
tử ở gần tâm của nhóm phát tia. Các phần tử ở xa tâm nhóm tốc của sóng âm, còn phụ thuộc vào tương quan giữa tiêu cự f
phát tia có khoảng cách li xa so với các phần tử ở gần tâm nên và độ rộng chùm phát tia d. Điều này lý giải tại sao sai số càng
được coi là các phần tử phát đầu tiên, các phần tử gần tâm sẽ là lớn sự tập trung của vùng hội tụ càng nới rộng theo chiều dọc.
những phần tử phát sau cùng nên càng gần tâm càng trễ nhiều.
Đối với những ứng dụng tái tạo hình ảnh siêu âm, việc tập
Các giá trị của bảng một cho phép sai số trễ pha khoảng 1 trung cao hay vùng hội tụ nhỏ rất có ý nghĩa bởi nó có thể cải
ns. Tuy nhiên sai số này là rất khó đạt được bởi tần số phải chia thiện độ tương phản khá tốt bởi sự trải phảng phân bố áp suất
sẽ đòi hỏi xung đầu vào khoảng 1GHz, điều này rất khó khả thi âm theo chiều dọc sẽ làm giảm sự khuyếch đại độ tương phản
với công nghệ chế tạo FPGA hiện nay với lý do ứng dụng với dựa trên sự khác biệt về trở kháng âm.
mục đích thông thường. Để giải quyết vấn đề này, bài báo này
thử nghiên cứu với sai số cho phép ở 3 cỡ sai số là 10 ns, 16 ns,
và 20 ns. Nghĩa là, những giá trị trễ pha gần với bội số này
được làm tròn với bội số gần nhất. Hình 5 thể hiện kết quả mô
phỏng của hệ thống được mô tả ở hình 2 bằng Model Sim với
sai số cho phép là 16 ns tương đương với tần số xung nhịp là
62.5 MHz.
Hình 5: Kết quả mô phỏng bằng Model Sim với sai số 16 ns

Hình 6: Đường bao ngang tại điểm hội tụ F
Để tiện khảo sát sai số, hình trực quan phân bố áp suất âm
mô phỏng như dạng hình 4 sẽ được cắt theo trục X gọi là
đường bao ngang và theo trục Y gọi là đường bao dọc tại điểm
hội tụ F. Dựa trên đường sai lệch của các đường bao, có thể
đánh giá tính khả thi của công nghệ FPGA được triển
khai.Hình 6 thể hiện, đường bao ngang của 4 đường: đường
tính toán lý thuyết, đường sai số 10 ns, đường sai số 16 ns và
đường sai số 20 ns.
Như hình vẽ đã thể hiện, sai số của các đường bao ngang
gần như không đáng kể. Kết quả này hoàn toàn có thể lý giải
được bởi độ rộng của chùm tia siêu âm theo chiều ngang hay
còn gọi là đường kính hội tụ chỉ phụ thuộc vào bước sóng của
sóng âm và độ rộng chùm phát tia d chứ hoàn toàn không phụ
thuộc vào sự tương quan giữa tiệu cự f và các tham số khác liên
quan.
Hình 7 thể hiện kết quả của mô phỏng dựa trên giá trị trễ
pha tính toán lý thuyết, giá trị trễ pha sai số 10 ns, 16 ns và 20 Hình 7: Đường bao dọc tại điểm hội tụ F
ns. Khác với những gì hình 6 đã thể hiện, ở hình 7 sai số có thể
nhìn thấy được sai khác khá rõ. Đối với các đường sai số càng V. KẾT LUẬN
lớn sự phân bố áp suất âm theo trục dọc càng có xu hướng
Trong bài báo này, tính khả thi của triển việc triển khai thuật
ngang bằng, hay nói các khác, vùng hội tụ theo chiều dọc càng
toán điều khiển trễ pha dựa trên nền tảng FPGA đã được khảo
được nới rộng, nghĩa là độ tập trung không cao. Về khoảng
sát. Thuật toán tính toán trễ pha để điều khiển chùm tia siêu âm
cách tiêu cự thì không thấy có sự thay đổi nhiều.
hội tụ đã được trình bày. Phép thử nghiệmthiết kế trên FPGA
265

đã được mô phỏng trên phần mềm thương mại Model Sim.Dựa [4] Alessandro Spadoni and Chiara Daraio, “Generation and control
trên kết quả mô phỏng trên Model Sim và thuật toán trực quan of sound bullets with a nonlinear acoustic lens,”PNAS, 107 (16),
7230–7234, 2010.
phân bố áp suất âm số, đối những xung nhịp ở trong giải cho [5] Emmanuel P. Papadakis, “Ultrasonic Instruments & Devices”,
phép, bài báo đã mô phỏng để chứng minh, với sai số 20 ns, hệ Academic Press, San Diego, California, 1999.
thống điều khiển trễ pha dựa trên phép chia tần hoàn toán có [6] Richard Feynman, Lectures in Physics, Volume 1, Addison,
thể đáp ứng được những thiết kế trên FPGA. London, 1969.
[7] Tran Trong Thang, Nguyen Phan Kien, Trinh Quang Duc,
TÀI LIỆU THAM KHẢO “Study on Discontinuity Properties of Phased Array Ultrasound
[1] Mooney M.G. and Wilson M.G., “Linear Array Transducers Transducer Affecting to Sound Pressure Fields Pattern.” World
with Improved Image Quality for Vascular Ultrasonic Imaging,” Academy of Science, Engineering and Technology, International
Hewlett-Packard Journal, 45(4), 43-51, 1994. Journal of Mechanical, Aerospace, Industrial and Mechatronics
Engineering, 8 (10), 2014.
[2] Baker K. G., Robertson V. J., Duck F. A., "A review of
therapeutic ultrasound: Biophysical effects,"Physical therapy 81
(7), 1351–8, 2001.
[3] J. Fischer, T.Herzog, S.Walter, “Design and Fabrication of a 5
MHz Concave Phased Array Probe,” AMA Conferences 2013,
328-331, 2013.
266

Phương Pháp Chênh Lệch Trong Hiện Thực Hóa Các

Hàm Phức Tạp Trên ASIC Cho Các Hệ Thống DSP
Sái Văn Thuận, Hoàng Văn Phúc và Trần Văn Khẩn
Khoa Vô tuyến Điện tử, Trường Đại học Kỹ thuật Lê Quý Đôn
Số 236 Hoàng Quốc Việt, Hà Nội, Việt Nam.
Email: saivanthuan@gmail.com, phuchv@mta.edu.vn, khantv@mta.edu.vn
Tóm tắt—Bài báo này trình bày phương pháp chênh lệch trong trong hình 1. Một bộ cộng được sử dụng để kết hợp hai phần
xấp xỉ và hiện thực hóa một số hàm phức tạp cho các hệ thống xử này để tính toán xấp xỉ phần cứng cho hàm F(x).
lý tín hiệu số. Việc sử dụng hàm xấp xỉ tuyến tính phân đoạn, kết
hợp với phương pháp chênh lệch và tối ưu hóa tham số thiết kế
cho phép hiện thực hóa phần cứng các hàm phức tạp này với hiệu
quả sử dụng tài nguyên phần cứng cao. Các kết quả tối ưu hóa và D(x)
hiện thực hóa trên các nền tảng FPGA và ASIC cũng được trình F(x)
bày và thảo luận trong bài báo này. x +
Từ khóa- DSP; phương pháp chênh lệch; FPGA; ASIC.
F(x) - D(x)
(LUT)
I. GIỚI THIỆU
Nhiều ứng dụng xử lý tín hiệu số (DSP) (như nhận dạng Hình 1. Sơ đồ khối tổng quát của phương pháp chênh lệch.
tiếng nói, xử lý multimedia, xử lý ảnh dải động lớn, tổ hợp tần
số theo phương pháp số…) đòi hỏi việc tính toán các hàm toán
học phức tạp như logarithm, mũ, các hàm lượng giác... Hơn Như vậy, việc thiết kế phần cứng tính toán hàm F(x) bao
nữa, trong các hệ thống DSP thời gian thực, việc thực hiện các gồm hai phần việc là tìm ra một hàm xấp xỉ D(x) đơn giản nhất
hàm này trực tiếp bằng phần cứng có ý nghĩa hết sức quan về phương diện thực thi trên phần cứng và thiết kế (cũng như là
trọng nhằm đảm bảo tốc độ xử lý cao, đáp ứng yêu cầu xử lý tối ưu) một bảng tra (LUT) hiệu quả nhất. Các thuật toán tối ưu
thời gian thực. Tuy nhiên, việc hiện thực hóa trực tiếp trên thiết kế thường được đưa ra để đạt được sự dung hòa tốt nhất
phần cứng lại thường làm cho độ phức tạp về phần cứng của hệ về mức độ phức tạp (và tốc độ xử lý) giữa khối tính hàm D(x)
thống tăng lên đáng kể so với phương pháp xử lý bằng phần và phần LUT. D(x) có thể là một hàm (hay tổng của nhiều
mềm. Vì vậy, việc nghiên cứu, phát triển các phương pháp thực hàm) bậc nhất (gọi là phương pháp chênh lệch tuyến tính), hay
thi các hàm toán học này rất có ý nghĩa nhằm đáp ứng yêu cầu là một hàm bậc cao hơn (gọi là phương pháp chênh lệch bậc
ngày càng cao của các hệ thống DSP. cao).
Bài báo này trình bày phương pháp chênh lệch (difference Trong phương pháp chênh lệch tuyến tính, hàm D(x) là một
method) để hiện thực hóa các hàm toán học trong các hệ thống hàm hoặc là kết hợp của nhiều đường tuyến tính phân đoạn.
DSP nhằm đáp ứng yêu cầu về hiệu quả sử dụng tài nguyên Đây là phương pháp hay được sử dụng nhiều trong các nghiên
phần cứng và tốc độ xử lý. Hơn nữa, bài báo cũng chỉ ra những cứu gần đây do ưu điểm của các hàm tuyến tính là việc thực thi
hướng phát triển tiếp theo đối với chủ đề này. trên phần cứng đơn giản. Trong khi đó, các phương pháp chênh
lệch bậc cao sử dụng các hàm D(x) bậc hai hoặc cao hơn và các
Phần còn lại của bài báo được bố cục như sau. Phần II sẽ hàm này cho phép thực hiện xấp xỉ với sai số thấp hơn (khi đó
giới thiệu sơ lược về phương pháp chênh lệch trong xấp xỉ các giá trị hàm chênh lệch nhỏ hơn, dẫn tới kích thước bảng LUT
hàm toán học trong DSP. Phần III mô tả chi tiết hơn về việc cũng nhỏ theo) nhưng lại làm tăng độ phức tạp phần cứng cho
ứng dụng phương pháp này trong xấp xỉ một số hàm cụ thể bao việc tính các hàm bậc cao này. Việc lựa chọn hàm D(x) tùy
gồm hàm logarithm, hàm mũ và hàm sine. Trong phần IV, thuộc vào yêu cầu của ứng dụng DSP cụ thể.
nhóm tác giả đề xuất qui trình tổng quát để thiết kế các hàm
toán học ứng dụng trong các hệ thống DSP. Cuối cùng, phần V
là phần kết luận của bài báo. III. ỨNG DỤNG PHƯƠNG PHÁP CHÊNH LỆCH THỰC
HIỆN XẤP XỈ MỘT SỐ HÀM PHỨC TẠP TRONG DSP
II. PHƯƠNG PHÁP CHÊNH LỆCH TRONG XẤP XỈ
HÀM TOÁN HỌC PHỨC TẠP Trong bài báo này, chúng tôi tập trung trình bày phương
Phương pháp chênh lệch sử dụng một hàm xấp xỉ đơn giản pháp xấp xỉ hóa các hàm logarithm (cùng với hàm mũ) và hàm
ban đầu D(x) nhằm giảm độ phức tạp phần cứng và một bảng sine (ứng dụng trong các tổ hợp tần số trực tiếp) sử dụng
tra (LUT: Look-up Table) thể hiện độ chênh lệch (Difference) phương pháp chênh lệch tuyến tính. Tuy nhiên, phương pháp
giữa hàm cần tính toán F(x) với hàm D(x), như được mô tả trình bày ở đây có thể được áp dụng cho các hàm khác trong
ISBN: 978-604-67-0635-9 267

DSP. Hơn nữa, việc thực thi trên phần cứng đòi hỏi người EL ( x) log 2 1 x x (4)
thiết kế phải xem xét các vấn đề về hiệu quả sử dụng tài
Tương tự như vậy, việc xấp xỉ hàm mũ được thực hiện bởi
nguyên phần cứng, tốc độ và sai số của phép xấp xỉ.
phép xấp xỉ sau:
A. Tính toán hàm logarithm và hàm mũ bằng phương pháp
2x 1 | x (5)
chênh lệch tuyến tính cận đối xứng
Việc thực thi tính toán hiệu quả cho các hàm logarithm và Và hàm lỗi của nó được xác định như sau:
hàm mũ là đặc biệt quan trọng và cần thiết đối với các ứng E A ( x) x 2 x 1 (6)
dụng như nhận dạng tiếng nói, nâng cao chất lượng tiếng nói Hình 3 mô tả hàm lỗi Mitchel (Mitchel error) cho hàm
và đặc biệt là trong các bộ xử lý sử dụng hệ cơ số lai (HNS: logarithm (EL) và hàm mũ (EA). Có thể thấy rằng đồ thị của hai
hybrid number system) để khai thác ưu điểm của cả hai loại cơ hàm lỗi này có dạng giống nhau. Vì thế, trong bài báo này,
số đếm tuyến tính thông thường và hệ cơ số logarithm [1]. Các nhóm tác giả tập trung vào trình bày phương pháp xấp xỉ cho
bộ xử lý HNS này đã cho thấy hiệu quả về xử lý, đặc biệt là về hàm logarithm và phương pháp đó cũng được áp dụng tương
công suất tiêu thụ, trong các ứng dụng xử lý tín hiệu số, xử lý tự cho hàm mũ.
ảnh và video [2]. Hình 2 cho thấy phân bố tài nguyên tiêu tốn Từ đó, sơ đồ khối của mạch tính toán logarithm có thể được
cho một bộ xử lý HNS điển hình [1] trong đó các khối tính tổ chức như trong hình 4 trong đó khối LODE (Leading one
toán logarithm (LOGC: logarithmic converter) và hàm ngược detector and encoder) thực hiện chức năng phát hiện bit 1 có
của logarithm (ALOGC: anti-logarithmic converter) hay hàm trọng số cao nhất của N và mã hoá nhị phân để tính n, khối
mũ chiếm tới 64% tổng lượng tài nguyên sử dụng của toàn bộ INV và bộ dịch nối tiếp (Barrel shifter) có nhiệm vụ tính phần
xử lý. Vì vậy, việc nâng cao hiệu quả thực thi các bộ biến đổi thập phân (x) cho phần tính hàm xấp xỉ (để tính log2(1+x)).
này sẽ cải thiện đáng kể hiệu năng, hiệu quả sử dụng tài
nguyên và công suất tiêu thụ của các bộ xử lý này. 0.1
E
A
0.08 E
Mitchell error
L
0.06
0.04
0.02
0
0 0.1 0.2 0.3 0.4 0.5 0.6 0.7 0.8 0.9 1
x
Hình 3. Hàm lỗi Mitchell khi xấp xỉ hàm logarithm và hàm mũ.
z
Hình 2. Phân bố tài nguyên phần cứng cho bộ xử lý HNS. W k k
N LODE n
Không mất tính tổng quát, ta xét một số nguyên không dấu
N và số này luôn có thể được biểu diễn dưới dạng: INV
N 2n 1 x (1) k
l l
với 0 ≤ x < 1 Barrel Shifter log2(1+x) F
x
Vì vậy, hàm log2(.) có thể được tính như sau:
Hình 4. Sơ đồ khối tổng quát của mạch phần cứng thực hiện tính hàm
log 2 N n log 2 1 x (2)
logarithm.
Giá trị n là phần nguyên của kết quả (4-bit với trường hợp
N dạng 16-bit), được tính bằng cách phát hiện bit 1 có trọng số
cao nhất của N. Giá trị của n là dạng mã hoá nhị phân của vị trí Hình 5 mô tả một phương pháp xấp xỉ hàm EL điển hình sử
bit 1 có trọng số cao nhất của N (ví dụ nếu vị trí bit này bằng dụng bốn đường gấp khúc như được đề xuất trong bài báo [6].
13 thì n = 1101). Trong [7], nhóm tác giả đã đưa ra phương pháp cận đối xứng
(quasi-symmetrical method) để thực hiện xấp xỉ hàm logarithm
Với phương pháp xấp xỉ đơn giản (theo Mitchell), phần và hàm mũ bằng cách thay cho việc xấp xỉ trực tiếp hàm lỗi (EL
thập phân log2(1+x) được xấp xỉ bậc nhất: hay EA) thì chúng ta có thể xấp xỉ hàm trung bình EM theo công
log 2 1 x | x (3) thức (7). Do EM có dạng đối xứng như thể hiện trên hình 6, số
đoạn của hàm xấp xỉ giảm đi một nửa, giúp giảm độ phức tạp
Để tăng độ chính xác người ta có thể dùng một bảng tra phần cứng của mạch tính xấp xỉ hàm logarithm.
(LUT) để bù lỗi do phép xấp xỉ đơn giản ở trên. Bảng LUT này
chứa giá trị làm tròn của độ sai lệch giữa giá trị thật và giá trị EL x EL 1 x (7)
EM ( x)
xấp xỉ: 2
268

Để khắc phục nhược điểm của các phương pháp trước đây, 0.09
trong bài báo [7], một thuật toán tối ưu tham số cho mạch tính 0.08
0.07
xấp xỉ hàm logarithm và hàm mũ đã được đề xuất trong đó các 0.06
E (x)
hệ số góc (slope trong công thức tổng quát (8) của một đường 0.05
0.04
L
E (1-x)
bậc nhất tổng quát) được chọn theo giá trị dạng 2i để phép nhân
L
0.03 E (x)
M
này được thực thi bởi một phép dịch đơn giản. 0.02 (E -E )(x)
M L
0.01
0
y = slope * x + offset (8) -0.01
0 0.1 0.2 0.3 0.4 0.5 0.6 0.7 0.8 0.9 1
Hình 7 mô tả thuật toán tối ưu này cho xấp xỉ cận đối xứng x
hai đoạn cho một nửa dải giá trị của x, bao gồm hai bước. Tại Hình 6. Phương pháp cận đối xứng đề xuất trong xấp xỉ hàm EL
bước 1 (step 1), thuật toán này sẽ quét một dải các giá trị hệ số cho tính toán hàm logarithm trên phần cứng.
góc của hàm xấp xỉ bậc nhất để chọn giá trị tối ưu cho nó. Sau
đó, bước 2 (step 2) sẽ gán lại giá trị hệ số góc này tới giá trị
dạng 2i lân cận và quét một dải giá trị để chọn ra giá trị tối ưu Peak_pointH
của độ dịch (offset trong công thức (8)). Giá trị độ dịch được 0.09 0.09
0.08
xác định tương ứng với mỗi giá trị peak_point (hình 7) chính là
0.08
0.07 0.07
tọa độ trục tung của điểm x = 0,5. Ứng với một cặp giá trị tham 0.06
Peak_pointL
0.06
số tìm được, ta có một hàm xấp xỉ tiềm năng (candidate, như kí 0.05 0.05
Candidate
hiệu trong hình 7). Bảng I thể hiện kết quả của thuật toán tối ưu 0.04 0.04
Candidate
hóa này, áp dụng cho cả trường hợp hàm logarithm (LOGC) và 0.03 0.03
hàm mũ (ALOGC) trong đó MaxDiff thể hiện giá trị cực đại 0.02
Offset1H
0.02
của hàm chênh lệch và giá trị này sẽ quyết định kích thước của 0.01 0.01
bảng LUT. Bảng II trình bày kết quả hiện thực hóa của phương 0 0
pháp này, có so sánh với phương pháp không có tối ưu tham số -0.01
Offset1L
0 0.05 0.1 0.15 0.2 0.25 0.3 0.35 0.4 0.45 0.5
-0.01
0 0.05 0.1 0.15 0.2 0.25 0.3 0.35 0.4 0.45 0.5
trong [6]. Kết quả cho thấy, việc áp dụng thuật toán tối ưu tham x
Step 1
x
Step 2
số ở trên giúp giảm lượng tài nguyên sử dụng (thể hiện thông Hình 7. Thuật toán tối ưu hóa tham số phần cứng xấp xỉ hàm
qua diện tích chip ASIC sử dụng) đi 19% so với phương pháp logarithm.
không có tối ưu tham số. Giá trị này đối với độ trễ và ADP
(tích của lượng tài nguyên với độ trễ) lần lượt là 22% và 37%. BẢNG I. KẾT QUẢ TỐI ƯU THEO THUẬT TOÁN HAI BƯỚC.
Hình 8 mô tả kết quả tính toán lỗi xấp xỉ của phương pháp cận
đối xứng trên Matlab. Kết quả cho thấy giá trị lỗi trung bình là Hàm Bước Slope1 Offset1 Slope2 Offset2 MaxDiff
0,0089
2,3×10-4 và lỗi cực đại là 8,0×10-4, tương đương với phương 1 0,2332 0,008 0,728 0,0341
(1/112)
pháp trong [6]. LOGC
0,0101
2 0,25 0,004 0,0625 0,0518
(1/99)
Hình 9 trình bày qui trình kiểm chứng (verification) các lõi 0,0072
IP thực hiện tính toán hàm phức tạp ứng dụng trong DSP. Các 1 0,2617 0,006 0,0891 0,0495
(1/139)
mẫu hình (pattern) đầu vào được tạo ra trên FPGA, đưa tới ALOC
0,0075
2 0,25 0,003 0,125 0,0305
mạch kiểm tra của chip ASIC. Kết quả thực hiện trên lõi IP sẽ (1/133)
được đưa tới máy hiện sóng (oscilloscope) để kiểm tra một số
tham số định thời (timing) như độ trễ tính toán chẳng hạn và bộ BẢNG II. KẾT QUẢ THỰC HIỆN BỘ TÍNH LOGARITHM 16-BIT TRÊN
phân tích logic (logic analyzer) để kiểm tra chức năng, có thể THƯ VIỆN ASIC CÔNG NGHỆ CMOS 0,18μM.
kết hợp với phần mềm Matlab trên máy tính thông qua file đầu
Diện tích Độ trễ
ra dạng .csv của bộ phân tích logic. Phương pháp
(×103 μm2 ) (ns)
ADP (×103)
Bảng LUT trực tiếp 32,6 12,2 397,7
Phương pháp MTM 23,4 13,0 304,2
0.08 Trong [6] 9,4 10,3 96,8
Phương pháp có tối ưu tham số 7,6 8,0 60,8
0.06
B. Tính toán hàm sine ứng dụng trong các bộ tổ hợp tần số
EL
0.04
Hàm xấp xỉ
trực tiếp dạng số (DDFS)
Giá trị chênh lệch
0.02 Trong các bộ tổ hợp tần số trực tiếp (DDFS: direct digital
frequency synthesizer) [10], việc tính toán (xấp xỉ) hàm sine
0 có vai trò hết sức quan trọng vì nó quyết định độ chính xác và
chất lượng của tín hiệu được tạo ra bởi bộ tổ hợp tần số này.
0 0.2 0.4 0.6 0.8 1 Như được chỉ ra trong hình 10, khối tính toán hàm sine được
x
sử dụng trong bộ biến đổi pha-biên độ của DDFS và có nhiệm
Hình 5. Hàm xấp xỉ EL theo [6]. vụ là tính giá trị hàm sine ứng với mỗi giá trị pha đầu vào.
269

(add). Bảng LUT lưu sẵn giá trị hàm chênh lệch và bộ cộng
cuối cùng sẽ tạo ra giá trị sine cần tính.
Kết quả thực thi ban đầu trên FPGA [10] đã cho thấy ưu
điểm của phương pháp chênh lệch khi hiện thực hóa hàm sine
ứng dụng trong DDFS, như được mô tả trong bảng IV. Trong
bài báo này, thiết kế DDFS sử dụng phương pháp chênh lệch
tuyến tính tối ưu được tổng hợp trên thư viện ASIC công suất
thấp công nghệ CMOS 65nm nhằm hướng tới ứng dụng cho
các thiết bị di động và có thể mang mặc (wearable devices).
Kết quả hiện thực hóa trên ASIC, như thể hiện trong bảng V,
cho thấy bộ DDFS cho phép tiết kiệm tài nguyên sử dụng
(khoảng 2,1 kgate) và công suất tiêu thụ với tần số hoạt động
phù hợp với những ứng dụng phổ biến.
Hình 8. Kết quả mô phỏng trên Matlab giá trị lỗi khi xấp xỉ hàm
N N-2
logarithm EL(x) dùng phương pháp cận đối xứng.
Tích lũy Bù Biến đổi Bù
M biên độ
pha pha pha-biên độ Tới DAC
Kết quả về MSB2

Oscilloscope MSB1
định thời
Hình 10. Khối tính hàm sine trong bộ DDFS.
Bảng mạch Bộ phân tích BẢNG III. THAM SỐ THIẾT KẾ MẠCH XẤP XỈ THEO PHƯƠNG PHÁP
Chip logic CHÊNH LỆCH TUYẾN TÍNH VỚI SỐ LƯỢNG ĐOẠN KHÁC NHAU.
.csv file Số đoạn Max (Sine-f(D)) Số bit giảm được trong LUT
2 0.0490 (1/20) 4
Bộ tạo đầu vào Matlab 3 0.0220 (1/45) 5
dạng số (FPGA) (PC)
4 0.0120 (1/83) 6
5 0.0080 (1/125) 6
6 0.0058 (1/172) 7
Kết quả kiểm tra
Hình 9. Qui trình kiểm chứng các lõi IP tính toán hàm phức tạp
Đường 4 đoạn
trong DSP. Đường 3 đoạn
Giá trị hàm chênh lệch
Trong phương pháp chệnh lệch tuyến thực hiện xấp xỉ hàm
sine, giá trị pha trong góc ¼ thứ nhất của một chu kì hình sine
(ứng với giá trị góc pha 0-π/2 rad) được chia thành một số
khoảng trên đó hàm sine được xấp xỉ bởi một đường bậc nhất.
Bằng việc lựa chọn tối ưu tham số của hàm xấp xỉ bậc nhất
phân đoạn với số lượng đoạn khác nhau, thông qua thuật toán
tối ưu để cực tiểu hóa giá trị cực đại của hàm chênh lệch, Max
(Sine-f(D)) trong đó f(D) là hàm xấp xỉ bậc nhất, như mô tả
trong bảng III, kích thước LUT có thể được giảm xuống giúp Pha chuẩn hóa cho góc ¼ thứ nhất
giảm độ phức tạp phần cứng. Ở đây, số đoạn được lựa chọn là
Hình 11. Hàm chênh lệch khi xấp xỉ bằng các đường tuyến tính.
4 vì khi tăng số đoạn lên 5, số lượng bit trong mỗi từ nhớ lưu
trữ trong LUT không thay đổi như thể hiện trong bảng III này.
Hình 11 cho thấy giá trị tối đa của hàm chênh lệch, Max (Sine- Shift-Add
f(D)), của phương pháp đề xuất trong [10] của nhóm tác giả, So sánh và Logic
với 4 đoạn tuyến tính, so sánh với phương pháp dùng 3 đoạn lựa chọn Sine
tuyến tính trong [9]. Hình 12 thì thể hiện sơ đồ khối của mạch
tính toán hình sine trong bộ DDFS từ giá trị pha đầu vào (P).
P
+
Khối so sánh và lựa chọn sẽ thực hiện so sánh giá trị P với các
hằng số định trước để lựa chọn tham số hàm tuyến tính (ứng LUT
với mỗi khoảng chia của giá trị P). Mạch shift-add logic thực
hiện chức năng tính toán hàm bậc tuyến tính (bậc nhất) ứng
Hình 12. Sơ đồ khối chi tiết mạch tính hàm sine sử dụng phương
với tham số đã chọn sử dụng các mạch dịch (shift) và cộng pháp chênh lệch, ứng dụng cho bộ DDFS.
270

Hình 13 thể hiện netlist và layout của thiết kế bộ DDFS sử IV. QUI TRÌNH THIẾT KẾ CÁC HÀM PHỨC TẠP
dụng khối tính toán hàm sine áp dụng phương pháp chênh lệch TRONG DSP
tuyến tính 4 đoạn với tham số tối ưu như trên, sử dụng thư
viện ASIC công nghệ CMOS 65nm. Bảng V trình bày kết quả Hình 14 mô tả đề xuất một qui trình thiết kế tổng quát thực
hiện thực hóa thiết kế DDFS này trong đó công suất tiêu thụ hiện xấp xỉ hóa các hàm phức tạp trong DSP sử dụng thư viện
ước lượng của bộ DDFS chỉ khoảng 40μW, cho phép ứng lõi IP cứng tính toán các hàm phức tạp cho các hệ thống DSP
dụng trong các hệ thống DSP và hệ thống viễn thông thế hệ theo phương pháp chênh lệch và thuật toán tối ưu tham số
mới cũng như các thiết bị IoT (Internet of things) đòi hỏi hiệu thiết kế như đã trình bày ở trên. Bằng việc sử dụng một thư
quả sử dụng năng lượng cao. viện tạo ra các lõi IP tối ưu cùng với công cụ tự động sinh mã
nguồn mô tả phần cứng (HDL) cho các hàm này, việc thực thi
BẢNG IV. KẾT QUẢ THỰC THI BỘ DDFS TRÊN FPGA THEO CÁC các phép tính toán này sẽ được tăng tốc với lượng tài nguyên
PHƯƠNG PHÁP KHÁC NHAU. phần cứng phát sinh là tối thiểu. Một công cụ phần mềm hỗ
Chênh lệch Chênh lệch trợ thiết kế tự động được phát triển để tạo ra mô tả HDL của
Chênh lệch các khối tính toán các hàm phức tạp trên DSP, cùng với các
Phương pháp tuyến tính 3 tuyến tính 4
Sine-phase chỉ tiêu kỹ thuật của hệ thống cho phép xuất ra mô tả HDL
đoạn [9] đoạn [10]
cho toàn hệ thống. Từ mô tả HDL này, lõi IP có thể được sử
Kích thước bảng LUT
3854 2560 1536 dụng để cấu hình cho thiết bị khả trình FPGA hay hiện thực
LUT (bit)
hóa trên thư viện chuẩn ASIC.
Tỉ số nén 50:1 70:1 117,3:1
Số lượng slices FPGA Chỉ tiêu kỹ
146 176 136 Lõi IP
sử dụng thuật của hệ (dạng thư viện
thống thiết kế)
BẢNG V. KẾT QUẢ HIỆN THỰC HÓA BỘ DDFS TRÊN THƯ VIỆN
ASIC CÔNG NGHỆ CMOS 65NM. Công cụ tự động
thiết kế
Thiết kế DDFS
Công nghệ CMOS 65nm
Điện áp nguồn cấp 0,5V
Diện tích mạch (Area) của phần cell chuẩn 72,7×103 μm2 Mô tả HDL
Tần số clock tối đa 107,8 MHz
Công suất tiêu thụ 40 μW
(ước lượng tại tần số clock 100 MHz)
Cấu hình trên Thực thi trên
FPGA ASIC
Hình 14. Qui trình thiết kế các hệ thống DSP sử dụng thư viện các lõi
IP hàm toán học trên FPGA và ASIC.
(a)
V. KẾT LUẬN
Trong bài báo này, chúng tôi đã trình bày phương pháp
chênh lệch trong thực hiện xấp xỉ các hàm phức tạp ứng dụng
trong DSP. Việc sử dụng phương pháp này, kết hợp với các
thuật toán tối ưu tham số thiết kế sẽ giúp tạo ra các lõi phần
cứng xấp xỉ các hàm phức tạp một cách hiệu quả và độ chính
xác cao. Trong các nghiên cứu tiếp theo, chúng tôi sẽ áp dụng
các khối tính toán hàm toán học đã được trình bày trong bài
báo này vào các hệ thống DSP trong thực tế (như xử lý tiếng
nói, xử lý ảnh dải động cao HDR), phát triển bộ xử lý HNS
cho các ứng dụng DSP tiêu thụ điện năng thấp và xây dựng
thư viện các lõi IP các hàm phức tạp cho các hệ thống DSP.
LỜI CẢM ƠN
Nhóm tác giả xin chân thành cảm ơn Trung tâm Đào tạo
(b)
thiết kế VLSI (VDEC) thuộc Đại học Tokyo, Nhật Bản, cùng
Hình 13. Netlist sau khi tổng hợp trên công cụ Synopsys Design với các hãng Synopsys Inc. và ROHM CO. LTD, đã hỗ trợ các
Compiler (a) và layout của vi mạch sử dụng công cụ Synopsys IC công cụ hỗ trợ thiết kế, chế tạo vi mạch cho nội dung nghiên
Compiler (b) cho thiết kế bộ DDFS với thư viện ASIC công nghệ cứu trong bài báo này.
CMOS 65nm.
271

TÀI LIỆU THAM KHẢO [7] Van-Phuc Hoang and Cong-Kha Pham, “Novel Quasi-Symmetrical
Approach for Efficient Logarithmic and Anti-logarithmic Converters,”
[1] Byeong-Gyu Nam, Hyejung Kim and Hoi-Jun Yoo, “A low-power Proc. VDE-IEEE 8th Conference on Ph.D. Research in Microelectronics
unified arithmetic unit for programmable handheld 3-D graphics & Electronics (PRIME2012), pp.111-114, Jun. 2012.
systems,” IEEE J. Solid-State Circuits, vol. 42, no. 8, pp.1767-1778,
Aug. 2007. [8] M.B. Sullivan and E.E. Swartzlander, “Truncated Logarithmic
Approximation,” Proc. 2013 21st IEEE Symposium on Computer
[2] Tsung-Ching Lin, Shin-Kai Chen, Chih-Wei Liu, “A low-error and Arithmetic (ARITH), pp.191-198, Apr. 2013.
Rom-free logarithmic arithmetic unit for embedded 3D graphics
applications,” Proc. 2013 International Symposium on VLSI Design, [9] Li-Wen Hsu and Dah-Chung Chang, “Design of Direct Digital
Automation, and Test (VLSI-DAT), pp.1-4, Apr. 2013. Frequency Synthesizer with high ROM Compression Ratio,” Proc. 12th
IEEE International Conference on Electronics, Circuits and Systems
[3] Jérémie Detrey and Florent de Dinechin, “A VHDL library of LNS (ICECS2005), pp.1-4, Dec. 2015.
operators,” in Proc. 37th Asilomar Conference on Signals, Systems &
Computers, vol. 2, pp. 2227-2231, Nov. 2003. [10] Van-Phuc Hoang and Cong-Kha Pham, “An Improved Linear Difference
Method with High ROM Compression Ratio in Direct Digital Frequency
[4] Florent de Dinechin and Arnaud Tisserand, “Multipartite table Synthesizer,” IEICE Trans. Fundamentals of Electronics,
methods,” IEEE Trans. Comput., vol. 54, no. 3, pp. 319-330, Mar. 2005. Communications and Computer Sciences, vol. E94.A, no. 3, pp. 995-
[5] J. N. Mitchell, “Computer multiplication and division using binary 998, Mar. 2011.
logarithms,” IEEE Trans. Electron. Comput., vol. 11, no.11, pp. 512-517,
Aug. 1962.
[6] R. Gutierrez and J. Valls, “Low cost hardware implementation of
logarithm approximation,” IEEE Trans. Very Large Scale Integr. (VLSI)
Syst., vol. 19, no. 12, pp. 2326-2330, Dec. 2011.
272

&+ѬѪ1*75Î1+Ĉ,ӄU KHIӆN, THU THҰP VÀ XӰ LÝ DӲ

LIӊ8&È&ĈҤ,/ѬӦ1*Ĉ,ӊ1ĈѬӦ&Ĉ2.,ӆM TRA
BҴNG THIӂT Bӎ Ĉ2&Ð1*68ҨT HIOKI 3334
NguyӉn Trӑng Thҳng, Phùng Phú Bình
7UXQJWkP*LiPÿӏnh ChҩWOѭӧng
Cөc Tiêu chuҭn - ĈROѭӡng - ChҩWOѭӧng/Bӝ Quӕc phòng
Email: nguyentrongthang1603@gmail.com, phubinhus@gmail.com
Tóm t̷t: Trong bài báo này, nhóm tác giҧ ÿӅ xuҩW FKѭѫQJWUuQK trình giám sát và phөc vө tӕt công tác thӕng kê, xӱ lý dӳ liӋu
ÿLӅu khiӇn, thu thұp và xӱ lý dӳ liӋu cuҧ ciFÿҥLOѭӧQJÿLӋQÿѭӧFÿR offline.
kiӇm tra bҵng thiӃt bӏ ÿR F{QJ VXҩt HIOKI 3334 AC/DC Power Tӯ thӵc trҥng trên, nhóm tác giҧ ÿӅ xuҩWFKѭѫQJWUuQKÿLӅu
HiTester&KѭѫQJWUuQKFyPӝt sӕ WtQKQăQJQәi bұWQKѭKLӇn thӏ ÿӗng khiӇn, thu thұp và xӱ lý dӳ liӋXFiFÿҥLOѭӧQJÿLӋQÿѭӧFÿR
thӡi nhiӅXNrQKÿRJLiWUӏ FiFÿҥLOѭӧng khác nhau và biӇu diӉQÿӗ thӏ
mӕi quan hӋ giӳDFiF ÿҥL Oѭӧng ÿһc biӋW FKѭѫQJ WUuQKFy NKҧ QăQJ
kiӇm tra bҵng thiӃt bӏ Hioki 3334. &KѭѫQJ WUuQK NKҳc phөc
OѭXWUӳ dӳ liӋXÿRGѭӟi dҥng file mӅm phөc vө công tác thӕng kê, xӱ giӟi hҥn hiӇn thӏ bҵQJFiFKWăng sӕ kênh hiӇn thӏ YjOѭXWUӳ dӳ
lý kӃt quҧ offline. liӋXFiFNrQKWURQJILOHW[Wÿӗng thӡi biӇu diӉQÿӗ thӏ liên
hӋ giӳDFiFÿҥLOѭӧQJÿLӋn.
Tͳ khóa: Hioki 3334; LabVIEW; RS-232C. Phҫn còn lҥi cӫDEjLEiRÿѭӧc tә chӭFQKѭVDX Trong phҫn
II, chúng tôi miêu tҧ FKѭѫQJWUuQK ÿӅ xuҩt. Phҫn III ÿѭDUDFiF
I. GIӞI THIӊU SKpSÿR ӭng dөQJFKѭѫQJWUuQKÿӅ xuҩt. Phҫn IV cung cҩp kӃt
HIOKI 3334 AC/DC Power HiTester (Hioki 3334) là thiӃt quҧ cӫD FiF SKpS ÿR ÿm iS GөQJ FKѭѫQJ WUuQK ÿӅ xuҩt. Cuӕi
bӏ ÿD QăQJ GQJ ÿӇ ÿR JLi Wrӏ FiF ÿҥL OѭӧQJ ÿLӋn ÿѭӧc ӭng cùng, chúng tôi kӃt luұn bài báo trong phҫn V.
dөng rӝng rãi WURQJOƭQKYӵFÿLӋn dân dөQJYjWURQJÿRNLӇm
các thiӃt bӏ sӱ dөng nguӗn pin, ҳc quy [1]. Hioki 3334 là mӝt II. &+ѬѪ1* TRÌNH Ĉӄ XUҨT
thiӃt bӏ ÿRWKXӝc nhóm các trang thiӃt bӏ ÿRNLӇPWUDÿLӋn mà &KѭѫQJWUuQKÿӅ xuҩt ÿѭӧc viӃWWURQJP{LWUѭӡng lұp trình
3KzQJ *LiP ÿӏnh ChҩW OѭӧQJ ĈLӋn-ĈLӋn tӱ/Trung tâm Giám /DE9,(: FjL ÿһt trêQ Pi\ WtQK ÿӗng bӝ vӟi thiӃt bӏ qua
ÿӏnh ChҩW Oѭӧng ÿѭӧc trang bӏ nhҵP ÿҧm bҧo công tác giám chuҭn giao tiӃp RS-232C.
ÿӏnh, thӱ nghiӋm các trang thiӃt bӏ ÿLӋn trong toàn quân. 1JX\rQ Oê ÿLӅu khiӇn thiӃt bӏ nҵm ӣ viӋc truyӅn và nhұn
Trong quá trình sӱ dөng thiӃt bӏ, nhóm tác giҧ nhұn thҩy thiӃt thành công các bit chӭa nӝi dung tin nhҳn giӳa các thiӃt bӏ và
bӏ còn nhӳQJÿLӇm hҥn chӃ sau: Pi\WtQKĈӕi vӟi giao tiӃp chuҭn RS-232, viӋc truyӅn và nhұn
Thͱ nh̭t là hҥn chӃ vӅ sӕ Oѭӧng NrQKÿRÿѭӧc hiӇn thӏѬX dӳ liӋXÿѭӧc thӵc hiӋn theo nguyên tҳc truyӅn thông nӕi tiӃp,
ÿLӇm lӟn cӫa thiӃt bӏ là có thiӃt kӃ nhӓ gӑn thuұn tiӋn di các bit dӳ liӋX ÿѭӧc truyӅn tuҫn tӵ nӕi tiӃp nhau theo mӝt
chuyӇn, tuy nhiên viӋc hiӇn thӏ nhiӅu kênh sӁ là hҥn chӃ do tӕn NKXQJ KuQK ÿm ÿѭӧc chuҭn hóa (bao gӗm tӕF ÿӝ truyӅn, sӕ
nhiӅu diӋn tích trên mһt máy. Khi thӵc hiӋQÿRF{QJVXҩt tiêu Oѭӧng bit truyӅn trong 1 khung...). Vì thӃ ÿӇ có thӇ truyӅn và
thө cӫa mӝt thiӃt bӏ ÿLӋn, QJRjL ÿҥL Oѭӧng công suҩt FiF ÿҥi nhұn tin nhҳn giӳa thiӃt bӏ và máy tính, viӋFÿҫu tiên là phҧi
Oѭӧng khác cҫQTXDQWkPOjÿLӋQiSGzQJÿLӋn, công suҩt tiêu cҩu hình khung truyӅn WKHRTX\ÿӏnh cӫa nhà sҧn xuҩt thiӃt bӏ
thө theo thӡi gian, hӋ sӕ có ích cӫa công suҩt, thӡi gian. Trên [1]: TӕFÿӝ truyӅQELWV6WRSELWĈӝ dài khung truyӅn:
thiӃt bӏ chӍ có thӇ hiӇn thӏ FQJ O~F WUrQ ÿҥL OѭӧQJ ÿѭӧc 8 bit; ChӃ ÿӝ kiӇm tra: Không.
nêu trên. ViӋc hiӇn thӏ FQJO~FÿҥLOѭӧQJÿӗng thӡi sӁ giúp LabVIEW có chӭa cҩu trúc phҫn mӅm thiӃt bӏ ҧo (VISA-
QJѭӡi kiӇPWUDFyÿiQKJLiWәQJTXiWKѫQWURQJTXiWUuQKÿR Vitual Instrument Software Architecture) cung cҩp giao diӋn
Thͱ hai là thiӃt bӏ +LRNLFKѭDFyF{QJFө OѭXWUӳ dӳ lұp trình vӟi các thiӃt bӏ ngoҥi vi thông qua các chuҭn giao
liӋu. ViӋF OѭX WUӳ dӳ liӋu là hӃt sӭc cҫn thiӃW ÿһc biӋt trong tiӃp [3], do vұy truyӅn và nhұn tin nhҳn trӣ QrQÿѫQJLҧQKѫQ
OƭQK YӵF ÿR Oѭӡng, thӱ nghiӋm. Chính bӣi vұy, bҩt kǤ mӝt Các tin nhҳn có thӇ là tin nhҳQFKѭѫQJWUuQKÿѭӧc gӱi tӯ máy
thiӃt bӏ ÿRWKӱ nghiӋPQjRFǊQJÿѭӧc nhà sҧn xuҩt tích hӧp WtQKÿӃn thiӃt bӏ thông qua hàm VISA Write, hoһc là tin nhҳn
các cәng giao tiӃp vӟi máy tính (Serial, CI-V, VXI, PXI, USB, phҧn hӗL ÿѭӧc gӱi tӯ thiӃt bӏ ÿӃn máy tính thông qua hàm
Ethernet hay GPIB) phөc vө mөFÿtFKÿLӅu khiӇQOѭXWUӳ và 9,6$ 5HDG 1JRjL UD ÿӕi vӟi giao tiӃp RS-& FzQ ÿѭӧc
xӱ lý dӳ liӋu. Thӵc tӃ trong quá trình sӱ dөng tҥL3KzQJFǊQJ cung cҩp tin nhҳn xác nhұQ ÿӇ ÿҧm báo giӳa thiӃt bӏ ÿLӅu
ÿm FKӍ ra sӵ cҫn thiӃt cӫa viӋF OѭX WUӳ, ví dө QKѭ WURQJ TXi khiӇn (máy tính) và thiӃt bӏ ÿR +LRNL ÿm ÿӗng bӝ vӟi
trình kiӇPWUDGXQJOѭӧng pin sҥc tӕn nhiӅu thӡi gian ÿӇ phóng nhau [1]. Cách thӭc truyӅn và nhұn tin nhҳn tӯ Pi\WtQKÿӃn
dòng cho tӟLNKLÿLӋn áp pin sөWÿӃn giá trӏ TX\ÿӏnh [2], quá thiӃt bӏ ÿѭӧc mô tҧ ӣ hình 1.
WUuQKOѭXWUӳ dӳ liӋu sӁ giúp ích cho QJѭӡi kiӇm tra trong quá
ISBN: 978-604-67-0635-9 273

7LQQKҳQFKѭѫQJWUuQK MҧQJ/ѭXWUӳ Yj.KDLEiRÿӏa chӍ thiӃt bӏ: Dӳ liӋu thu thұp

ÿѭӧc sӁ ÿѭӧF OѭX WUӳ tҥL ÿӏa chӍ GR QJѭӡi kiӇm tra lӵa chӑn
Máy tính RS-232C
(LabVIEW)
HIOKI 3334 trên máy tính;
MҧQJ ÿR MEASUREMENT): HiӇn thӏ NrQK ÿR ÿӗng
7LQQKҳQSKҧQKӗL thӡi;
Hình 1. Nguyên lý truyӅn nhұn dӳ liӋu tӯ Pi\WtQKÿӃn thiӃt bӏ MҧQJÿӗ thӏ (GRAPHICS): HiӇn thӏ ÿӗng thӡLÿӗ thӏĈӗ
thӏ thӭ nhҩt biӇu diӉn mӛi quan hӋ giӳD GzQJ ÿLӋn và thӡi
Tӯ nguyên lý hoҥW ÿӝng trên, nhóm tác giҧ ÿѭD UD WKXұt JLDQĈӗ thӏ thӭ hai biӇu diӉn mӕi quan hӋ giӳDÿLӋn áp-thӡi
toán cӫa FKѭѫQJWUuQK. gian hoһF ÿLӋn áp-GXQJ OѭӧQJ ÿӕi vӟi kiӇP WUD GXQJ Oѭӧng
%Ҳ7ĈҪ8 pin, ҳFTX\Ĉӗ thӏ thӭ ba biӇu diӉn mӕi quan hӋ giӳa công
suҩt-thӡi gian hoһc ÿLӋn áp-thӡi gian. Tùy theo tӯQJSKpSÿR
.KDLEiRÿӏDFKӍWKLӃWEӏ; mà ta có thӇ chӑQFiFÿӗ thӏ biӇu diӉn mӕi liên hӋ giӳDFiFÿҥi
&ҩXKuQKNKXQJWUX\ӅQ. Oѭӧng cho phù hӧS Ĉӗ thӏ ÿѭӧc lұp trình hiӇn thӏ ӣ chӃ ÿӝ
Delay 100 ms online, thu thұp các giá trӏ ÿRWӯ thiӃt bӏ Hioki 3334 và hiӇn thӏ
ÿӗng thӡL WUrQ ÿӗ thӏ biӇu diӉn mӕi quan hӋ giӳD FiF ÿҥi
Oѭӧng.
*ӱLWLQQKҳQWKD\ÿәLFҩX
Ĉ~QJ
³7KD\ÿәLFҩXKuQK KuQKFjLÿһWÿӃQWKLӃWEӏ:
FjLÿһWWKLӃWEӏ´ +ӋVӕGzQJ, ÿLӋQiS; 6ӕ
PүXWtQKWUXQJEuQK...
Sai
Delay 60 ms
*ӱLWLQQKҳQÿRÿӃQWKLӃWEӏ
Delay 80 ms
7KXWKұSGӳOLӋXWӯWLQQKҳQSKҧQ
KӗLFӫDWKLӃWEӏ
+LӇQWKӏ, OѭXWUӳGӳOLӋX, YӁÿӗWKӏ
Hình 3. Giao diӋQQJѭӡi dùng
III. ÁP DӨNG &+ѬѪ1* TRÌNH Ĉӄ XUҨT TRONG
Sai
CÁC PHÉP Ĉ2 THӴC Tӂ
“STOP”
ĈӇ ÿiQKJLiNKҧ QăQJKRҥWÿӝng cӫD FKѭѫQJ WUuQK QKyP
tác giҧ tiӃn hành thӱ nghiӋPSKpSÿR7Uѭӡng hӧp áp dөng
Ĉ~QJ
FKѭѫQJ WUuQK ÿӇ ÿR F{QJ Vuҩt tiêu thө cӫa thiӃt bӏ ÿLӋn và
WUѭӡng hӧS GQJ ÿӇ ÿR GXQJ Oѭӧng pin, ҳc quy dӵa vào mӕi
.ӂ77+Ò& quan hӋ cӫa dòng phóng theo thӡi gian phóng:
1. 3KpSÿR 1: Áp dͭng FK˱˯QJWUuQKÿ͉ xṷt ÿ͋ ÿRF{QJ
Hình 2. ThuұWWRiQFKѭѫng trình sṷt tiêu thͭ cͯa thi͇t b͓ ÿL͏n
Giao diӋn sӱ dөng cӫDFKѭѫQJWUuQKÿѭӧc thӇ hiӋn ӣ hình ThiӃt bӏ ÿѭӧc thӱ nghiӋPOjEyQJÿqQÿLӋn vӟi công suҩt
3, gӗm 6 mҧng vӟi các chӭFQăQJ GDQKÿӏQK:Vѫÿӗ kӃt nӕLÿѭӧc chӍ ra ӣ hình 4.
Mҧng hiӇn thӏ FiFÿҥLOѭӧng trên thiӃt bӏ (DISPLAY): Có 4 HIOKI 3334
RS-232C Máy tính
NrQKWѭѫQJӭng vӟi 4 kênh hiӇn thӏ trên thiӃt bӏ thӵc tӃ, mӛi (LabVIEW)
I +/- U +/-
kênh có nhiӅXÿҥLOѭӧQJÿӇ lӵa chӑn hiӇn thӏ QKѭWUrQWKLӃt bӏ;
Mҧng dҧLÿRRANGE): DҧLÿRÿmÿѭӧc lұp trình ӣ chӃ ÿӝ
tӵ ÿӝng chӑn dҧLÿRSKKӧp và hiӇn thӏ giá trӏ cӫa dҧLÿӕi vӟi ĈqQ
~ 220 V
dҧLÿLӋQiSOjNK{QJYѭӧWTXi9ÿӕi vӟi giá trӏ GzQJÿLӋn
OjNK{QJYѭӧt quá 30 A; a) b)
Mҧng cҩu hình (CONFIG): Bao gӗm khӕi chӍQKOѭXchӑn Hình 4. HӋ thӕQJÿRF{QJVXҩt tiêu thө cӫDEyQJÿqQ
chӃ ÿӝ ÿRÿLӋn mӝt chiӅu hoһc xoay chiӅu); sӕ Oѭӧng mүXÿR D6ѫÿӗ khӕi kӃt nӕi; b) HӋ thӕng thӵc tӃ.
ÿӇ tính trung bình; hӋ sӕ GzQJ ÿLӋn và hӋ sӕ ÿLӋn áp (trong 2. 3KpSÿR 2: Áp dͭng FK˱˯QJWUuQKÿ͉ xṷt ÿ͋ ÿRNL͋m
WUѭӡng hӧS ÿR WK{QJ WKѭӡng, hai hӋ sӕ Qj\ ÿһt ӣ giá trӏ 1, WUDGXQJO˱ͫng pin, ̷c quy
WUѭӡng hӧp giá trӏ ÿRYѭӧWQJѭӥQJTX\ÿӏnh phҧi sӱ dөng thiӃt &KѭѫQJWUuQKÿӅ xuҩWÿѭӧc thӱ nghiӋPWURQJTXiWUuQKÿR
bӏ chia dòng hoһc biӃn áp thì phө thuӝc vào tӍ lӋ cӫa thiӃt bӏ kiӇPWUDGXQJOѭӧng pin sҥc Eneloop 2000 mAh HR-3UTGB
chia dòng, biӃQiSÿӇ ÿһt giá trӏ); SLQÿmTXDVӱ dөng)6ѫÿӗ ÿRÿѭӧFWUuQKEj\QKѭKuQK5, hӋ
274

thӕng gӗm thiӃt bӏ Hioki 3334, máy tính có chӭDFKѭѫQJWUuQK Trong quá trình thӱ nghiӋPFKѭѫQJWUuQKÿӇ ÿRF{QJVXҩt
ÿӅ xuҩt, 01 biӃn trӣ có dҧLÿLӋn trӣ tӯ 0,1 ÿӃQYjNKD\ tiêu thө cӫa thiӃt bӏ ÿLӋn, ngoài viӋc hiӇn thӏ giá trӏ công suҩt
ÿӵng pin AA. Thӵc hiӋn các thӫ tөc theo Tiêu chuҭn [2] và YjFiFÿҥLOѭӧQJOLrQTXDQFKѭѫQJWUuQKFzQ[ӱ OêÿӇ ÿѭDUD
theo yêu cҫu trong chӍ tiêu kӻ thuұt cӫa sҧn phҭm [4]: Sҥc pin FiFÿӗ thӏ biӇu diӉn chúng theo thӡLJLDQJL~SQJѭӡi kiӇm tra
vӟi dòng 200 mA trong thӡi gian tӯ ÿӃn 16 tiӃng ӣ nhiӋt ÿӝ kiӇm soát tӕWTXiWUuQKÿo.
25 o&VDXÿyÿӇ pin nghӍ trong thӡi gian 1 tiӃQJWUѭӟc khi thӵc
2. 3KpSÿR
hiӋQTXiWUuQKÿRTrong qXiWUuQKÿRWhӵc hiӋn 3 lҫn thӱ vӟi
Ӣ hình 8, kӃt quҧ kiӇm tra ÿѭӧFÿӕi chiӃu vӟi thông tin mà
dòng phóng lҫQOѭӧt là 400 mA, 2000 mA và 4000 mA ӣ ÿLӅu
nhà sҧn xuҩt cung cҩp: Thӵc tӃ kiӇm tra, dXQJOѭӧng cӫa pin
kiӋn nhiӋWÿӝ P{LWUѭӡng 25 oC.
ÿҥt 1850 mAh, 1780 mAh và 1690 mAh lҫQ Oѭӧt ӣ dòng
HIOKI 3334
RS-232C Máy tính
phóng 400 mA, 2000 mA, 4000 mA nҵm trong phҥm vi cho
(LabVIEW) phép cӫa nhà sҧn xuҩt; WX\ QKLrQ ÿiQK JLi WtQK әQ ÿӏnh cӫa
I +/- U +/-
ÿLӋn áp pin thì mӭF ÿLӋn áp әQ ÿӏnh trong thӵc tӃ kiӇm tra
NK{QJ ÿҥW QKѭ \rX Fҫu cӫa nhà sҧn xuҩt ĈLӅu này có thӇ lý
giҧi bӣi pin mà nhóm tác giҧ thӱ nghiӋPOjSLQÿmTXDVӱ dөng
��n/ ҲF-��y %LӃQWUӣ
trong thӡi gian dàiÿmFyVӵ hao hөt vӅ GXQJOѭӧQJFǊQJQKѭ
suy giҧm vӅ chҩW OѭӧQJ Ĉӗ thӏ biӇu diӉQ ÿLӋn áp theo dung
a) b)
Oѭӧng pin cho ta thҩy không chӍ giá trӏ GXQJOѭӧng mà còn cho
Hình 5. HӋ thӕQJÿRGXQJOѭӧng pin sҥc AA
D6ѫÿӗ khӕi kӃt nӕi; b) HӋ thӕng thӵc tӃ.
thҩy mӭFÿӝ sөt áp cӫDSLQOjPFѫVӣ ÿӇ ÿiQKJLiNKҧ QăQJ
hoҥWÿӝng và tuәi thӑ cӫa pin.
IV. KӂT QUҦ
1. 3KpSÿR
KӃt quҧ hiӇn thӏ WUrQ FKѭѫQJ WUuQK ÿӅ xuҩW Yj ÿӗ thӏ biӇu
diӉQFiFÿҥLOѭӧng theo thӡLJLDQÿѭӧc nêu trong hình 6. Các
ÿҥLOѭӧQJÿѭӧc ghi nhұn troQJFKѭѫQJWUuQKÿӅ xuҩt gӗm có:
giá trӏ ÿLӋn áp (V), giá trӏ GzQJ ÿLӋn (A), công suҩt tӭc thӡi
(W), hӋ sӕ công suҩt có ích (PF), công suҩt theo thӡi gian
(WH), dòng phóng theo thӡi gian (AH), tҫn sӕ )5(4ÿLӋn
iSÿӍQK9SNKD\GzQJÿӍnh (Apk) và thӡi gian (TIME). KӃt a) b)
WK~F TXi WUuQK ÿR FiF Gӳ liӋX ÿѭӧF OѭX WUӳ trong máy tính Hình 8. Ĉӗ thӏ mӕi liên hӋ giӳDÿLӋQiSSLQYjGXQJOѭӧng phóng
bҵQJILOHW[W&ѫVӣ dӳ liӋXÿѭӧFWUuQKEj\QKѭWURQJKuQK cӫa pin sҥc Eneloop 2000 mAh HR-3UTGB
a) Thӵc tӃ ÿREҵng Hioki 3334; b) Nhà sҧn xuҩt cung cҩp
V. KӂT LUҰN
&KѭѫQJWUuQKÿLӅu khiӇn, thu thұp và xӱ lý dӳ liӋXFiFÿҥi
OѭӧQJ ÿLӋQ ÿѭӧF ÿR NLӇm tra bҵng thiӃt bӏ ÿR F{QJ VXҩt
+,2., ÿDQJ WURQJ TXi WUuQK KRjQ WKLӋQ KѫQ Yj KLӋn
ÿDQJÿѭӧc áp dөQJWURQJF{QJWiFÿRNLӇm tra các trang thiӃt
bӏ ÿLӋn tҥLSKzQJ*LiPÿӏnh chҩWOѭӧQJĈLӋn-ĈLӋn tӱ&KѭѫQJ
WUuQK JL~S QJѭӡi kiӇm tra giҧQ Oѭӧc thao tác trên thiӃt bӏ, dӉ
dàng sӱ dөng vӟi giao diӋn thân thiӋn, thuұn tiӋn trong viӋc
OѭXWUӳ dӳ liӋXOjPFѫVӣ cho công tác xӱ lý dӳ liӋu offline.
Hình 6. KӃt quҧ ÿRYjÿӗ thӏ biӇu diӉQFiFÿҥLOѭӧng theo thӡi gian [1] HIOKI 3334 AC/DC Power HiTester -Instruction Manual
[2] Tiêu chuҭn IEC 61951-2 Secondary cells and batteries containing
alkaline or other non-acid electrolytes-Portable sealed rechargeable
single cells-Part2: Nikel-Metal hydride
[3] https://www.ni.com/visa/
[4] http://eneloop.prodejce.cz/Datasheety/HR-3UTGB.pdf
Hình 7. &ѫVӣ dӳ liӋXOѭXWUӳ
275

Mạng thế hệ mới – Tương lai của Internet và truyền

thông
Nguyễn Chiến Trinh Trần Minh Anh
Khoa Viễn Thông I, VNPT Đà nẵng
Học Viện Công Nghệ Bưu Chính Viễn Thông Email: anhtm.dng@vnpt.vn
Email: trinhnc@ptit.edu.vn
Abstract— Internet và truyền thông ngày nay đã thâm nhập hầu Sự bùng nổ nhu cầu dữ liệu đó cùng với số lượng host tăng
hết những khía cạnh của cuộc sống xã hội, thay đổi lối sống của lên hàng tỉ, nhu cầu về tốc độ truyền tải thông tin, băng thông
con người, công việc, thông tin và tác động xã hội. Tuy vậy, … ngày càng lớn theo [1-3], thì mạng viễn thông hiện nay càng
Internet hiện thời vẫn thiếu đi sự linh động, sự trong suốt, vấn đề trở thành “cái áo chật”. Việc sửa đổi, cải hoán … cũng như có
chuyển đổi, giao thức không phù hợp... Cho nên, đến nay rất cần
những thay đổi cục bộ chỉ có thể đáp ứng tạm thời, còn việc
có những nghiên cứu cho Internet tương lai, trên cơ sở xem xét
những khía cạnh của Internet hiện tại, và thiết kế mới với các yêu đáp ứng và đáp ứng tốt cho nhu cầu của hiện tại và tương lai
cầu mới, phù hợp cho các nhu cầu hiện tại cũng như trong tương của xã hội thông tin, thì rất cần các giải pháp căn cơ, và sự
lai. chung tay toàn cộng đồng. Vì thế, nhiều dự án nghiên cứu đã
được bắt đầu ở các quốc gia như Mỹ, Pháp, Nhật Bản … để
Keywords- NwGN, mạng, thế hệ mới, tương lai ,Internet; giải quyết căn bản những vấn đề còn tranh cãi, còn gặp phải
vướng mắc trong Internet và để nghiên cứu, thiết kế mạng
I. GIỚI THIỆU Internet tương lai thay thế cho mạng hiện tạ ự án như
Trong thời đại ngày nay, thời đại của nền kinh tế tri thức thì AKARI, FIND, FP7, New Arch … hay các nghiên cứu của
nhu cầu thông tin và truyền thông trở nên cực kỳ quan trọng, là ITU-T (nhóm FN) sử dụng những cách gọi tên khác nhau như
điều kiện sống còn của mọi hoạt động của xã hội. Việc phát mạng Internet tương lai hay mạng thế hệ mới, song mụ
triển mạnh mẽ của Internet đã và đang là nền tảng phát triển chính của những nghiên cứu này bao gồm mộ ạch dài
của xã hội, và cũng là nền tảng của sự phát triển của các dịch hạn với việc thiết kế từ đầu, dần hoàn thiện và định hình một
vụ viễn thông. Vì thế, công nghệ mà nhất là công nghệ ngành mạng Internet mới (còn được gọi là NwGN). Mạng tương lai
Thông tin-Truyền thông phải đi trước một bước phục vụ cho sự này (NwGN) đã và đang là cái hướng đích hướng đến của cộng
phát triển chung của xã hội. đồng mạng trong việc xây dựng một thế hệ mạng mang tính
Tuy vậy, mạng viễn thông hiện nay lại đang đối mặt với mới, tính mở [4,5], và mang tính định hướng cho toàn cầu về
những thách thức nặng nề, do được thiết kế và sử dụng từ một Internet có tính khả dụng cao, vừa đáp ứng được nhu cầu
những năm 1960 nên tầm nhìn thiết kế, cấu trúc chỉ gói gọn hiện tại, vừa có tầm nhìn đến tương lai, cho những nhu cầu cần
trong việc chuyển tải thông tin, truyền tin trong phạm vi hẹp, thiết trong tương lai.
tốc độ hạn chế, chất lượng đôi lúc chưa đáp ứng yêu cầu.
Trong khi đó, theo nghiên cứu của Cisco [1], lưu lượng
Internet trong những năm tiếp theo là một sự bùng nổ, với dự
đoán lưu lượng dữ liệu sẽ vượt qua mức zettabyte
(1000exabyte) vào năm 2016 và đạt 2,1 zettabyte vào năm
2019 (khoảng 168,5exabyte/tháng) (xem hình 1), đây là mức
dữ liệu cực kỳ cao, với mức tăng trưởng bình quân hàng năm Hình 2.Các dự án, nghiên cứu về mạng thế hệ mới
(CAGR) khoảng 23% đến năm 2019. Các dự án trên đều tập trung nghiên cứu, thiết kế, cấu trúc,
cấu tạo mạng … của Internet thế hệ mới và các mục tiêu nhằm
để mạng thế hệ mới có thể đáp ứng tốt được nhu cầu của cộng
đồng xã hội cũng như sự phát triển nhanh của xã hội ngày nay.
Bài báo tập trung vào phân tích chi tiết các yếu tố liên quan
đến NwGN như tầm nhìn chiến lược về Internet trong giai đoạn
tới, từ đó, nêu bật khả năng và những mục tiêu ngắn hạn và dài
hạn của NwGN. Các mục tiêu này chính là đích đến của mọi
quốc gia, mọi nhà sản xuất, kinh doanh, khai thác mạng trong
tương lai. Trên cơ sở đó, bài báo đề xuất các định hướng mang
tính chiến lược, tầm nhìn và tư duy mới về Internet nói riêng,
công nghệ nói chung, trong đó, việc đề xuất liên quan đến tiệm
Hình 1. Dự báo lượng thông tin trên mạng đến 2019-Nguồn [1] cận hoá mạng viễn thông Việt nam hiện tại hướng đến NwGN
ISBN: 978-604-67-0635-9 276

với mục tiêu đi tắt, đón đầu hiệu quả, ít tốn kém và đảm bảo Bên cạnh đó, việc xây dựng các giá trị của mạng thế hệ mới
phát triển lâu dài, bền vững cho nền kinh tế trong thời đại (NwGN) đóng vai trò quan trọng. Nó hình thành nên tầm nhìn
thông tin mới. mang tính chiến lược, từ đó, khuyến khích các tổ chức, cá
nhân, các nhà nghiên cứu tập trung xây dựng và hình thành.
II. TẦM NHÌN MỚI VỀ INTERNET Các giá trị đó, tựu trung là : Giảm thiểu các yếu tố tiêu cực của
Với định hướng vượt trên khả năng của mạng NGN hiện tại, các vấn đề xã hội hiện tại, tối ưu hoá các yếu tố tích cực, tiềm
NwGN nhắm đến việc duy trì và tạo lập một mạng mới có khả năng, đóng góp vào việc tổng hoà các giá trị xã hội.
năng đáp ứng và đáp ứng tốt cho một xã hội thông tin trong Để hiện thực hoá các giải pháp và tầm nhìn mới về mạng
giai đoạn bùng nổ mới. NwGN, việc tận dụng các giải pháp hiện hành bao gồm các
Để xây dựng một khung pháp lý chung, ngay từ năm 2009, tổ giải pháp về các vấn đề xã hội, các vấn đề về viễn cảnh tương
chức viễn thông quốc tế (ITU) đã xây dựng một nhóm công tác lai và các giải pháp cho việc tổng hoà các yếu tố xã hội, trong
đặc biệt về vấn đề trên gọi là nhóm FG-FN (Focus Group on đó tôn trọng tính đa dạng và khuyến khích sự hợp tác của các
Future Network). Nhóm trên đã đề xuất một tầm nhìn mang thành viên trong xã hội đó.
tính tổng quát và chiến lược cho mạng tương lai, tựu trung ở
việc đáp ứng 4 yêu cầu chính : Môi trường, Dịch vụ, Dữ liệu và III. KHẢ NĂNG VÀ MỤC TIÊU CỦA MẠNG THẾ HỆ MỚI
Kinh tế xã hội [17]. Qua đó, có thể thấy được xu hướng dịch Với tầm nhìn được xác định như phần II, khả năng của NwGN
chuyển dịch vụ từ tĩnh sang động, từ cố định sang di động, từ được xác định là một mạng đem lại những giá trị cơ bản cho xã
một vài điểm đến khắp nơi… đã trở thành xu hướng chung của hội, trong đó thông tin, truyền thông ngày càng đóng vai trò
mạng viễn thông, trong đó việc mạng viễn thông hướng đến quan trọng, đủ sức giải quyết các thách thức của điều kiện mới.
quảng đại quần chúng, đa dạng cách thức kết nối và sử dụng Việc đảm bảo chất lượng dịch vụ, đáp ứng tốt hơn về mặt hiệu
dẫn đến số lượng thiết bị viễn thông, chủng loại, loại hình dịch quả kinh tế, cũng như đảm bảo thích ứng tốt với điều kiện môi
vụ và số lượng người tham gia thị trường mạng ngày càng tăng trường, giảm công suất điện trên từng byte thông tin để đáp
mạnh mẽ. Không chỉ thụ động hưởng thụ dịch vụ, người sử ứng sự phát triển liên tục, mạnh mẽ của xã hội trong giai đoạn
dụng còn hướng đến các dịch vụ chủ động hơn, thông qua các từ nay đến năm 2020 và những năm tiếp theo, chính là những
dịch vụ tương tác trực tiếp hay trực tiếp lựa chọn hệ thống cung yếu tố mà khả năng của NwGN phải đạt được.
cấp tốt hơn khi sử dụng dịch vụ. Để có được những khả năng trên, việc đặt ra các mục tiêu cụ
thể của NwGN cũng đóng vai trò quan trọng, nhất là mang tính
định hướng, hướng đến một mạng mới, có khả năng đáp ứng
mọi nhu cầu thông tin, mọi nơi, mọi lúc, với tốc độ cao, chất
lượng tốt. Việc đặt ra các mục tiêu này được định nghĩa bởi
nhiều dự án, của nhiều quốc gia, nhiều nhà nghiên cứu như
phần I đã đề cập, cụ thể các nhóm mục tiêu chính, là :
Nhóm mục tiêu mang tính xã hội
Nhóm mục tiêu hướng về không gian truy nhập
Nhóm mục tiêu định hướng cơ sở hạ tầng
Nhóm mục tiêu về môi trường, năng lượng
Nhóm mục tiêu về giải pháp kỹ thuật, công nghệ
Nhóm mục tiêu bảo an, an ninh, an toàn dữ liệu
Để đảm bảo các mục tiêu mang tính xã hội, các mục tiêu cụ thể
Hình 3. Nhu cầu sử dụng dịch vụ ngày càng tăng, đa dạng hơn. Nguồn Keio
University như : NwGN phải là một mạng có thể phục vụ hàng tỉ người,
phổ biến từ trẻ em đến cả các cụ ông cụ bà ... đều có thể sử
Từ đó, việc chấp nhận tính đa dạng của nhu cầu con người,
dụng mạng và trở thành một thành viên của mạng. Từ đó, ta có
hướng đến đáp ứng nhu cầu thực tế của người dùng, mạng
thể thấy được mọi nhu cầu, ứng xử, giao tiếp của mọi người
NwGN chính là nền móng cho hạ tầng thông tin và truyền
tham gia mạng cần phải được xử lý, quản lý phù hợp với tiêu
thông mới đáp ứng sự phát triển liên tục, mạnh mẽ của xã hội
chí của một xã hội thông tin rộng mở như [4,7] đề xuất, đồng
hiện nay, từ nay đến những năm 2020 và các năm tiếp theo.
thời đáp ứng ngay các yêu cầu bức xúc mang tính xã hội cùng
Với tầm nhìn như vậy, trước mắt các định hướng chính về mặt
các giải pháp thông tin nhanh chóng, hỗ trợ việc xử lý các nhu
giải pháp và công nghệ cần được thực hiện cụ thể như :
cầu của thực tiễn. Do đó, NwGN cần được nâng cao vai trò
Hướng đến các mục tiêu và các giá trị thực tiễn của
trong việc hỗ trợ các nhu cầu thông tin tuỳ theo lứa tuổi, thu
Internet.
hẹp khoảng cách về năng lực sử dụng mạng của các thành viên
Chia sẻ nhận thức mới về các giải pháp liên quan đến các xã hội [18], đảm bảo các nguyên tắc kinh tế, thiết kế kỹ thuật,
vấn đề xã hội trong tương lai. yêu cầu thực tiễn trong hoạch định chính sách [9].
Xây dựng một hình ảnh của xã hội truyền thông và thông Để làm được điều đó, chúng ta cần tạo điều kiệ
tin tương lai.
Xây dựng một mạng thế hệ mới có tầm nhìn hướng xa về [10],
tương lai, trong đó yếu tố mọi lúc, mọi nơi, mọi đối tượng đồng thời phát huy tính hòa nhập, thân thiện với môi trường, và
được đặc biệt nhấn mạnh ... với người sử dụng mạng [6]. Các tài liệu, diễn đàn dẫn ở trên
277

đều liên hệ cụ thể đến những công nghệ mới, kỹ thuật mới khả phục vụ cho đại đa số người dân trong quá trình sử dụng mạng,
dĩ đáp ứng từng bước nhu cầu xã hội, sẽ được đề cập ở phần trong đó việc đầu tư về nghiên cứu và phát triển (R&D) một
sau. cách trọng điểm để tiến tới xây dựng một mạng có công nghệ
Về không gian truy nhập, với NwGN, việc truy nhập mạng mới nhất phục vụ cho việc phát triển mạng xanh, mạng hiệu
được hiểu là mọi nơi, bằng mọi hình thức khả dĩ : di động, cố quả nhất cho các nhu cầu thông tin tương lai. Các công nghệ
định/ có dây, không dây … còn gọi là mạng khắp nơi [11], truyền dẫn mới như IPoMPLS, OTN ... kết hợp phát triển các
trong đó các loại hình dịch vụ đều sử dụng chung hạ tầng công nghệ chuyển mạch toàn quang, bộ đệm quang, ghép bước
mạng. Hay nói cách khác, hạ tầng mạng cung cấp các loại dịch sóng ở mức nano với hàng nghìn bước sóng trong trên một sợi
vụ yêu cầu, với tốc độ đủ đáp ứng nhu cầu, với khả năng đáp quang ... sẽ giúp cho mạng có tốc độ đạt đến mức Pbps trên các
ứng tốt các nhu cầu thiết yếu của người sử dụng [18]. tuyến quang, thay đổi toàn diện diện mạo của mạng viễn thông
hiện thời. Với công nghệ truyền dẫn mới, việc mạng lõi đạt tốc
độ hàng tỷ Mbps sẽ giúp cho việc truyền tải thông tin ngày
càng thuận tiện, tạo ra một mặt phẳng dữ liệu mới, trên đó việc
truyền tải thông tin được thực hiện nhanh hơn, đồng thời các
thiết bị truyền dẫn có thể thay đổi cấu hình tự động, đáp ứng
được nhu cầu ngày càng cao về dữ liệu trong tương lai (như
hình 1 đã trình bày), đồng thời giúp cho việc tích hợp hệ thống
mạng trên nền mạng quang tiên tiến, tốc độ cao và đa nhiệm.
Hình 4. Hội tụ dịch vụ và hạ tầng mạng

Về nhóm mục tiêu định hướng cơ sở hạ tầng, thì cần phải xây
dựng cơ sở hạ tầng (CSHT) đồng bộ, thống nhất, đa năng, đa
dạng như [11] khẳng định. Mục tiêu xây dựng CSHT chất
lượng tốt, khả năng đáp ứng tốt được yêu cầu ngày càng cao
của các loại hình dịch vụ mới, công nghệ mới, nhằm ngày càng
góp phần tạo ra các giá trị thực tiễn cuộc sống, gắn liền với các
nhu cầu đích thực của xã hội, như : khám chữa bệnh, điều hành
chính phủ e-Gov, giáo dục e-Edu, e-School ... [18]. Bên cạnh Hình 5. Tích hợp các mạng trên nền chung-Nguồn NTT
đó, việc xây dựng mạng thông minh, đa dạng [5,6,11] ... cũng Bên cạnh các nhóm mục tiêu trên, nhóm mục tiêu an ninh, an
là một vấn đề rất quan trọng trong việc hoạch định cụ thể các toàn dữ liệu cũng là một nhiệm vụ rất quan trọng của mạng
khâu trong thiết kế cơ sở hạ tầng mạng trong điều kiện mới. mới. Hiện tại, hầu hết các khía cạnh của cuộc sống hiện đại đều
Về môi trường, năng lượng, đây là nhóm mục tiêu chiếm phần gắn liền với mạng : chuyển tiền, bình chọn, ví điện tử… đến
lớn sự quan tâm của các dự án, vì chính nó quyết định việc chính phủ điện tử, quản lý hệ thống vũ khí, an ninh quốc phòng
chuyển mình sang NwGN có thành công hay không, có đủ sức … nên các mục tiêu về an toàn, an ninh dữ liệu đã được đặt ra
thu hút hay không. Với các điều kiện đặt ra như lượng tiêu thụ từ lâu, ngay từ các dự án NGN về trước. Đến giai đoạn NwGN,
điện của mạng thế hệ mới ngày càng nhỏ, bao gồm : giảm tổng các yêu cầu về an toàn, an ninh mạng lưới được đặt lên cao
lượng điện năng tiêu thụ, kiểm soát lưu lượng dữ liệu đi qua hơn, nhằm đảm bảo an ninh mạng tốt hơn cho người sử dụng,
mạng, tối ưu hóa việc định tuyến thông tin, sử dụng mạng tiết cho nhà quản lý cũng như các nhà hoạch định chính sách, đồng
kiệm và đạt hiệu quả tối đa với tài nguyên số, tài nguyên sóng thời cần thiết kế sao cho hệ thống có thể thực hiện được an
điện từ, tài nguyên khác ... [11,18,19], thì rõ ràng tiêu chí về toàn và khả năng hoạt động trong những điều kiện khó khăn
“xanh” hóa mạng là rất hiệu quả và đầy sức thu hút. NICT [18] như khi xảy ra thảm họa, hay bị tấn công. Dù rằng việc nâng
đã đặt ra các mục tiêu về mạng “xanh”, về sử dụng năng lượng cao khả năng bảo mật sẽ làm tăng chi phí đầu tư nghiên cứu,
tái tạo, tiết kiệm năng lượng ... để đảm bảo một mạng mới có tăng nhân sự quản lý, giảm tốc độ khai thác mạng, nhưng việc
những yếu tố thuyết phục các quốc gia, đặc biệt là các quốc gia đảm bảo bảo mật vẫn luôn là một yêu cầu bức thiết, quan trọng
đang phát triển ứng dụng và triển khai mạng mới. Mục tiêu về khi triển khai NwGN đồng bộ.
mạng chịu đựng được các thách thức của môi trường, về biến Với các nhóm mục tiêu đầy tham vọng trên, NwGN hy vọng sẽ
đổi khí hậu ... được đề cập trong [5] cũng như nhiều dự án trở thành một hình mẫu đa năng mà các nước, các nền kinh tế
khác, nhằm xây dựng một mạng mới có khả năng chống chọi lớn trên toàn cầu hướng đến nhằm xây dựng cho mình một
lại với các điều kiện khắc nghiệt của môi trường, và rõ ràng, chuẩn tiên tiến trên hình mẫu đó. Bên cạnh đó, các mục tiêu
đây là một trong những vấn đề gai góc nhất trong cách tiếp cận trên, định hình cho thế giới, một hình mẫu mạng tương lai, để
của mạng thế hệ mới. các nhà nghiên cứu, các nhà sản xuất thiết bị viễn thông có
Đối với mục tiêu về giải pháp kỹ thuật, công nghệ, thì rõ ràng, định hướng cụ thể để hướng đến, từ đó, tiệm cận dần sang
cần áp dụng các công nghệ mới nhất, công nghệ hiệu quả nhất mạng mới với chi phí thấp nhất, và hiệu quả cao nhất.
278

IV. MỘT SỐ ĐỀ XUẤT TRONG VIỆC HOẠCH ĐỊNH 4.2 Đề xuất tiệm cận NwGN cho mạng viễn thông hiện nay
CHIẾN LƯỢC PHÁT TRIỂN MẠNG VIỄN THÔNG 4.2.1 Hướng tiệm cận NwGN về phát triển và ứng dụng công
HƯỚNG ĐẾN XÂY DỰNG NWGN CHO MẠNG VIỄN nghệ tiên tiến :
THÔNG HIỆN NAY
Về mặt kỹ thuật, vẫn phải khẳng định cần phải xây dựng một
4.1 Các định hướng trong việc hoạch định chiến lược phát nền hạ tầng kỹ thuật cơ bản, trên cơ sở tích hợp các hệ thống
triển mạng viễn thông hiện tại trên nền mới, đồng thời mở ra khả năng mạnh mẽ trong
Để có thể định hình một cách rõ nét việc chuyển dịch mạng việc đáp ứng các mục tiêu lâu dài.
viễn thông hiện nay sang mạng tiên tiến mới, hoặc mạng thế hệ Một đề xuất tiệm cận hoá như hình 7, trong đó, việc tích hợp hạ
mới (NwGN), chính là một hướng phát triển mạng hiện thời tầng dịch vụ “điện”, “quang” trên một hạ tầng chung một cách
nhằm đáp ứng nhu cầu trong tương lai. Việc hoạch định chính mềm mại, uyển chuyển, hoàn toàn “trong suốt” với người sử
sách phát triển mạng trong giai đoạn sắp đến cần đi nhanh vào dụng dịch vụ, đáp ứng được yếu tố “ubiquitous” (mọi lúc, mọi
việc hiện đại hóa mạng, tăng cường và phát triển mạng lõi viễn nơi, mọi dịch vụ) của NwGN.
thông. Theo khuyến nghị của ITU, việc đưa ra các mô hình
chuẩn cho các mạng viễn thông thế hệ mới, với các mục tiêu
đầy tham vọng sẽ chính là mục tiêu hướng đến của các mạng
viễn thông hiện nay, cũng như là định hướng cho việc hoạch
định chiến lược phát triển mạng viễn thông hướng đến tương
lai, hoạch định lộ trình đi lên mạng thế hệ mới.
Hình 7. Hạ tầng viễn thông trong NwGN

Các mục tiêu chính khi tiệm cận sang NwGN về mặt công
nghệ truyền dẫn, công nghệ tích hợp và mạng lõi mới, như :
1. Tích hợp dịch vụ trên hệ thống IMS mới, đủ khả năng đáp
ứng nhu cầu của người dùng, theo hướng đa dịch vụ trên một
nền hạ tầng viễn thông.
Hình 6. Lộ trình đi lên NwGN-Nguồn NICT 2. Nhanh chóng phát triển và ứng dụng các công nghệ truyền
Do đó, định hướng chính trong việc hoạch định chiến lược phát tải quang thế hệ mới, trong đó tốc độ truyền tải cần đạt được
triển viễn thông hiện nay chính là hướng theo tầm nhìn của tốc độ Pbps cho mạng đường trục, 10 Gbps cho mạng truy
NwGN, và đáp ứng tốt các mục tiêu đặt ra cho mạng mới, với nhập quang trở lên. Việc các nhà mạng hiện nay của Việt nam
cách tiếp cận từng bước, trong đó việc hiện đại hoá mạng lõi, triển khai G-PON rộng khắp, cũng xem như là một cách tiếp
đa dạng hóa các loại hình dịch vụ, tập trung phát triển và hoàn cận NwGN về góc độ đa dịch vụ đến với người dùng. Để tiếp
thiện cơ sở hạ tầng truyền thông và thông tin để làm cơ sở cho tục cải thiện chất lượng dịch vụ, cần tiếp tục phát triển công
việc phát triển tiếp theo. nghệ truyền tải quang thế hệ mới bao gồm: công nghệ truyền
Hiện nay, dù đã được nhiều dự án, nhiều quốc gia tham gia dẫn quang; các loại sợi quang mới; công nghệ tái tạo tín hiệu
nghiên cứu, nhưng mô hình cụ thể cho NwGN vẫn ở mức đề ra quang 3R; giám sát chất lượng tín hiệu quang, chuyển mạch
các mục tiêu cần đạt được, và tùy thuộc sự phát triển từng quang và bộ đệm quang. Trong đó, kỹ thuật điều chế, mã hóa
nước, từng khu vực mà có những cách tiếp cận khác nhau. Do và ghép kênh phân chia theo bước sóng WDM cần được
vậy, việc đi lên NwGN đối với mạng viễn thông hiện nay, với nghiên cứu, cải tiến nhằm mục đích nâng cao tốc độ truyền dẫn
Việt nam chẳng hạn, thì việc ứng dụng và đi lên NwGN phải trên một kênh bước sóng. Các kết quả thực nghiệm với các
được tiến hành từng bước một, tiệm cận dần đến các mục tiêu định dạng điều chế mới như QPSK, 8-PSK và 16-QAM đã
của NwGN, các mục tiêu mà đa số các dự án, các khuyến nghị, được được tốc độ 100 Gbps trên một kênh bước sóng. Việc
đặc biệt là các khuyến nghị đã được ITU-T khẳng định, thông chuyển đổi bước sóng có vai trò rất trong việc ngăn chặn xung
qua nhóm thảo luận đặc biệt (2009) của ITU nghiên cứu về đột bước sóng trong một mạng quang. Hiện tại, các bộ chuyển
mạng thế hệ mới [17,21]. đổi quang/điện/quang (O/E/O) đang được sử dụng để chuyển
Cho nên, về định hướng chung, cần nhận thức được định đổi bước sóng. Để triển khai mạng lõi toàn quang băng rộng,
hướng đi lên NwGN là định hướng nhất quán, còn trong thực các bộ tái tạo tín hiệu kiểu quang/điện/quang phải được thay
tế, các nhà mạng cũng như các chính phủ cần có lộ trình, chính thế bởi các phần tử tái tạo tín hiệu 3R quang. Các bộ tái tạo
sách, định hướng rõ ràng, nhằm hướng đến một NwGN, mạnh, hoạt động ở tốc độ vượt quá 100 Gbps sử dụng bán dẫn hoặc
có tính đón đầu, nhằm đạt hiệu quả đầu tư cao nhất, tránh đầu sợi quang phi tuyến như các bộ chuyển mạch đã được ghi nhận
tư dàn trải, hoặc đầu tư vào các mục tiêu không hiệu quả. và cần được nhân rộng sử dụng trong tương lai.
279

3. Tăng cường ứng dụng vô tuyến thông minh để giải quyết 6. Ứng dụng công nghệ Web 3.0, cùng tính toán đám mây trên
những hạn chế trong sử dụng phổ tần hiện nay. Công nghệ truy các máy chủ. Việc ứng dụng các công nghệ mới này giúp cho
nhập phổ tần động cho phép Vô tuyến thông minh hoạt động việc tính toán, lưu trữ, trình bày, truy cập thông tin và tìm dữ
trong kênh tốt nhất có sẵn. Đặc biệt, công nghệ vô tuyến thông liệu được thông suốt, uyển chuyển và an toàn, đồng thời tăng
minh cho phép người dùng: Cảm nhận phổ, Quản lí phổ, Chia khả năng tính toán của thiết bị di động, tính phổ biến của mạng
sẻ phổ và Dịch chuyển phổ. Trong tương lai, công nghệ vô không dây, và sự phát triển của các công nghệ cảm ứng không
tuyến thông minh rất lí tưởng cho các ứng dụng yêu cầu khắt dây mới dẫn đến các đối tượng thông minh được kết nối, tạo
khe về thời gian thực như các dịch vụ khẩn cấp, dịch vụ đa nên Internet của mọi thứ.
phương tiện, băng rộng... Định hướng chung của việc tiệm cận NwGN về mặt kỹ thuật,
4. Triển khai mạnh việc ứng dụng các mạng cảm biến không công nghệ vẫn là ứng dụng các công nghệ mới đảm bảo yêu tố
dây (WSN) cấu thành từ các thiết bị cảm biến nhỏ gọn, tiêu thụ thân thiện môi trường : ngay từ bây giờ, việc đặt ra các tiêu
ít năng lượng, giao tiếp thông qua các kết nối không dây, có chuẩn về môi trường cần phải đặt ra sớm. Ví dụ : các tiêu
khả năng làm việc trong môi trường tự nhiên với nhiệm vụ cảm chuẩn về tiêu thụ năng lượng, các ưu tiên cho các thiết bị sử
nhận, đo đạc, tính toán các thông số môi trường xung quanh để dụng năng lượng tái tạo, năng lượng mặt trời... Các chính sách
thu thập thông tin về trung tâm để xử lý phù hợp theo sự biến của nhà nước về đầu tư cho các thiết bị, giải pháp công nghệ
đổi của môi trường. WSN được ứng dụng trong rất nhiều lĩnh tương ứng, đảm bảo cho việc ứng dụng càng nhiều càng tốt các
vực như quốc phòng, an ninh, dân sự, y tế, giao thông, môi thiết bị, giải pháp công nghệ mang tính đột phá về môi trường,
trường, nông nghiệp… ví dụ như: rà soát bom mìn, khí độc hại, giảm thiểu khí thải nhà kính, tiêu thụ năng lượng trên đầu byte
chống đột nhập; giám sát chu trình và sản phẩm trong sản xuất thấp, sử dụng vật liệu nhẹ, ít tỏa nhiệt, vật liệu tái chế ... sẽ là
công nghiệp; cảnh báo cháy nổ, nhà thông minh; kiểm tra giám định hướng ưu tiên khi đi lên NwGN. Ứng dụng các công nghệ
sát sức khỏe; kiểm soát lưu lượng giao thông; giám sát mức độ để đáp ứng các ứng dụng mang tính xã hội cao cần được ưu
ô nhiễm môi trường, dự báo thời tiết, khí hậu; đo nhiệt độ độ tiên giải quyết, như các ứng dụng về giải quyết việc làm, y tế,
ẩm, điều khiển tưới tiêu tự động theo độ ẩm không khí, theo giáo dục, cân bằng sinh thái, chống biến đổi khí hậu, cân bằng
dõi sự di chuyển của động vật hoang dã… và hợp lý trong giới tính, tuổi tác, năng lực tự nhiên của mỗi
5. Xây dựng và triển khai một lộ trình hiện đại hóa mạng lői người sử dụng mạng...
viễn thông, nhằm đáp ứng ngay nhu cầu hiện tại, đồng thời có Tóm lại, về mặt kỹ thuật và công nghệ, NwGN bao hàm hầu
hướng đến mạng viễn thông thế hệ mới. Công nghệ OTN, theo như tất cả các công nghệ mới nhất nhằm hướng đến một tầm
khuyến nghị G.709, G.872 ... của ITU-T tại [15,16], sẽ là một nhìn mới về NwGN như mục 2 đã nêu, là một mạng mang bản
hướng công nghệ rõ ràng của tương lai, ít nhất là vài thập kỷ chất xã hội, thân thiện môi trường.
nữa. Với Việt nam hiện nay, việc nâng cấp, đầu tư ngay mạng 4.2.2 Hướng tiệm cận NwGN về đẩy mạnh nghiên cứu phát
lõi công nghệ OTN sẽ là một hướng công nghệ rất đáng đầu tư triển ứng dụng:
ngay từ bây giờ [14,20] để hoàn thiện dần mạng lõi, mạng Xu hướng phát triển mạng sắp tới là phải đáp ứng tốt nhất các
gom. Về mạng truy nhập và các mạng ngoại vi, cần có tiến nhu cầu của xã hội nên việc nghiên cứu phát triển các dịch vụ
trình hiện đại hoá cụ thể, nâng cấp tốc độ của các mạng biên, ứng dụng đã và đang là trọng tâm hiện nay. Trong đó, việc
kết nối lõi với tốc độ cao, đồng thời tổ chức quang hoá đến cấp chuyển đổi bản chất dịch vụ mạng từ chỗ người sử dụng thay
thấp nhất trong mạng viễn thông, càng nhiều, càng sớm càng đổi hành vi để sử dụng thông tin thì đến nay hệ thống thông tin
tốt. Việc tích hợp môi trường truyền tải dịch vụ có dây, không phải thay đổi để đáp ứng chính nhu cầu thực tế của người sử
dây, sensor, wifi … để có thể phục vụ nhu cầu sử dụng dịch vụ dụng, đảm bảo dịch vụ mọi lúc, mọi nơi và mọi thứ cần thiết,
mọi lúc, mọi nơi … Riêng về công nghệ mạng, việc nghiên cứu và đó chính là một hướng tiệm cận đến NwGN hiện nay. Với
ứng dụng các giải thuật định tuyến đa năng, các mô hình mới sự tiện lợi mà mạng mang lại, đặc biệt là các ứng dụng mang
trong cấu trúc mạng cung cấp dịch vụ, phân bổ tài nguyên tính xã hội cao, sẽ rất cần một mạng mang tính “đa mạng”, đáp
mạng, chống tắc nghẽn cục bộ sẽ giúp cho mạng viễn thông ứng được “đa dịch vụ” trên một nền mạng mang tính phổ quát.
ngày càng đáp ứng được chất lượng dịch vụ cho người dùng. Do đó, NwGN cần được thiết kế hướng tới đáp ứng các ứng
dụng xã hội có tính phổ quát như vậy. Xem hình 9 (minh họa
của dự án EURO-NGI).
Hình 8. Hội tụ dịch vụ trên nền mạng quang tiên tiến Hình 9. Đa dịch vụ trên NwGN–Nguồn GS.Kofman (Dự án EURO-NGI)
280

Từ đó ta thấy, nhu cầu và việc đi sâu vào nhu cầu của xã hội đã việc đáp ứng nhu cầu thông tin, truyền thông ngày càng cao từ
đem lại cho người phát triển ứng dụng nguồn lợi cực kỳ to lớn. nay đến 2020 và các năm tiếp theo.
Do đó, việc đẩy mạnh các ứng dụng hướng đến nhu cầu xã hội Trong tiến trình đáp ứng với sự phát triển nhanh của dịch vụ,
là một hướng tiệm cận đến NwGN mang tầm chiến lược trung xu thế đi lên mạng thế hệ mới là một tất yếu, cũng như nhu cầu
và dài hạn đối với các nhà quản lý vĩ mô. Tuy thế, một yêu cầu băng thông, lưu lượng tăng vọt trong những năm sắp tới, đặc
lớn đặt ra là nhà nghiên cứu phát triển cần chú ý là các ứng biệt là lưu lượng trên di động cũng như băng rộng, việc tiệm
dụng phải đơn giản, nhỏ gọn, tiết kiệm năng lượng, đồng thời cận hoá với NwGN của Việt nam cũng như các nhà khai thác
phù hợp với thị hiếu của xã hội, hoặc một tầng lớp xã hội. mạng viễn thông trên thế giới là một thực tế khách quan, và là
Bên cạnh đó, các ứng dụng cũng cần có giá cả phải chăng, hoặc điều các nhà khai thác đang hướng đến để có thể định hướng
miễn phí và phải trực tiếp đến người dùng, phù hợp với nhu phát triển kinh doanh trong thời gian sắp đến.
cầu và khả năng đáp ứng của người dùng. Bài học của Google Trong khuôn khổ bài báo chỉ nêu lên những nét tổng quan về
Play Store, Apple Store … là minh chứng cho cách tiệm cận mạng thế hệ mới, những mục tiêu, yêu cầu và thách thức để
này. Các ứng dụng nhỏ gọn, phổ quát đến cộng đồng sẽ là định hướng phát triển mạng hiện tại sang mạng thế hệ mới
hướng đi giúp mạng viễn thông thể hiện là một con đường trong tương lai. Các đề xuất trong phần 4 cũng xoay quanh việc
ngắn nhất hướng đến nhu cầu của xã hội, và trên hết, hướng tiệm cận đến các mục tiêu cần đạt được trên, nhằm cung cấp
đến mục tiêu mọi thứ, mọi lúc, mọi nơi của NwGN. cho những nhà sản xuất, khai thác, cung cấp dich vụ mạng một
4.3 Mạng viễn thông Việt nam – Những bước chuyển biến định hướng để có thể bắt kịp với đà phát triển của ngành viễn
sang NwGN: thông trong thời gian tới.
Rõ ràng, việc mạng viễn thông Việt nam hiện nay đã và đang TÀI LIỆU THAM KHẢO
đáp ứng tốt cho các nhu cầu của nền kinh tế, đồng thời là một
[1] (Cisco White Paper): “The Zettabyte Era: Trends and Analysis”.
trong những nước ứng dụng 3G hiệu quả, và có giá cước thông
[2] Worldwide Bandwidth Demand Market Forecast, April 2010
tin trên mạng thuộc loại thấp nhất, cho thấy việc đầu tư nâng
[3] Tabulation and Estimation of Internet Traffic in Japan, Feb 21st, 2008
cấp mạng lưới đã và đang đem lại những hiệu quả không nhỏ
[4] http://www.nets-find.net/
cho nền kinh tế, nhất là trong thời đại thông tin và truyền thông
[5] http://cordis.europa.eu/fp7/ict/programme/challenge1_en.html
như hiện nay. Tốc độ trên 3G của Việt nam của các nhà mạng
[6] GENI Research Plan; GENI: Global Environment for Network
VNPT, Viettel, MobiFone … đã đạt trên 40Mbps trên các Innovations.
đường xuống, thì hướng đến 4G hay cả 5G trong thời gian tới, [7] FIND Observer Panel Report, 2009.
với tốc độ vượt trội, trên 1Gbps, tạo điều kiện rõ ràng cho việc [8] NSF Future Internet Summit, 2010.
cải thiện chất lượng mạng, tích hợp các loại dịch vụ trên nền vô [9] Euro-NF, Anticipating the Network of the Future – From Theory to
tuyến, cũng như trên nền quang … Về chính sách của chính Design, 2008.
phủ, việc triển khai rộng khắp e-Gov, e-Commerce… sẽ rất cần [10] EIFFEL – The EIFFEL Support Action: Laying the foundation for
băng thông rộng, tốc độ cao của mạng viễn thông hỗ trợ, để Future Networked Society, 2010.
giải quyết tốt các bức xúc của nền kinh tế-xã hội trong thời [11] New Generation Network Architecture – AKARI Conceptual Design,
2008.
gian sắp đến, và khi cả thế giới ngày càng thay đổi theo chiều
[12] New Network Architectures – The Path to the Future Internet, Springer,
hướng ứng dụng ngày càng nhiều mạng viễn thông để giải 2010.
quyết các vấn đề, các bức xúc xã hội, thì việc mạng viễn thông [13] eXpressive Internet Architecture, NFS Future Internet Architectture
phải thay đổi liên tục, và đi trước một bước là điều hiển nhiên. Project, 2011.
Các hướng tiệm cận đề xuất trong phần 4.2 đều là các bước [14] Nguyễn Trọng Tâm, 2013. Triển khai hiện đại hóa mạng với OTN (phần
triển khai rất hữu ích, giúp cho Việt nam nhanh chóng chuyển 1,2)http://tapchibcvt.gov.vn/TinBai/2610/Trien-khai-hien-dai-hoa-mang-
đổi, bắt kịp đà phát triển công nghệ trong tương lai. voi-OTN-phan-1(2), truy cập ngày 10/8/2013.
Cho nên, trong khi dự báo thị trường viễn thông ngày càng [15] ITU-T G.709 (01/03), Interfaces for the Optical Transport Network
(OTN)
bùng nổ như hiện nay, việc tiệm cận hoá sang NwGN là việc
[16] ITU-T G.872 (10/01), Architecture for the Optical Transport Network
hết sức cần thiết để có thể đi trước đón đầu, và thu lợi nhuận từ (OTN)
việc hoạch định chính sách đáp ứng nhu cầu của xã hội trong [17] http://www.itu.int/en/ITU-T/focusgroups/fn/Pages/default.aspx
lĩnh vực thông tin như hiện nay. [18] http://www.nict.go.jp/nrh/nwgn
[19] David Clark, Karen Sollins, John Wroclawski, Dina Katabi, Joanna
V. KẾT LUẬN Kulik, Xiaowei Yang, Robert Braden, Ted Faber, Aaron Falk, Venkata
Mạng thế hệ mới (NwGN) đến nay thực sự là giải pháp hữu Pingali, Mark Handley, Noel Chiappa, 2000. New Arch: Future
Generation Internet Architecture.
hiệu cho việc hiện đại hoá mạng viễn thông của các nhà khai
[20] (Ericsson WhitePaper), Hà nội 2010. “OTN – Tương lai của truyền tải
thác trên thế giới nói chung, Việt nam nói riêng. Việc hiện đại dữ liêu”. Tạp chí Công nghệ Thông tin và Truyền thông. Số 388(578),
hoá này nhằm đáp ứng một phần nhu cầu thông tin hiện tại, kỳ 1 tháng 11/2010, trang 24.
giải quyết một loạt vấn đề nảy sinh hiện nay như thiếu băng [21] ITU-T Recommendation Y.2012, “Functional Requirements and
thông, nghẽn cục bộ … đồng thời, là cơ sở quan trọng trong architecture of the NGN”, release 1, 2006.
281

Nghiên cứu và thiết kế Gương thông minh

kiêm thiết bị theo dõi sức khoẻ
Phan Ngọc Điệp Phạm Văn Tuấn

Khoa Điện tử - Viễn thông Trung tâm Xuất sắc,
Đại học Bách Khoa, Đại học Đà Nẵng Khoa Điện tử - Viễn thông
Đà Nẵng, Việt Nam Đại học Bách Khoa, Đại học Đà Nẵng
ngocdiep10dt2@gmail.com Đà Nẵng, Việt Nam
pvtuan@dut.udn.vn
Tóm tắt— Bài báo này sẽ trình bày tổng quan về đề tài Gương Hiện nay ở Việt Nam chưa có sản phẩm nào tương tự với
thông minh kiêm thiết bị theo dõi sức khoẻ và chi tiết thiết kế của đề tài nhưng trên thế giới đã xuất hiện một vài sản phẩm cũng
các mô đun chính phục vụ cho việc chăm sóc sức khoẻ người có tính năng tương tự như “Cybertecture mirror” của hãng
dùng như đo chiều cao, cân nặng, nhịp tim và bảng điều khiển Tech2o, nhưng thực chất là một chiếc máy tính bảng phóng to,
cảm ứng để điều khiển hoạt động của toàn bộ thiết bị. Bên cạnh dùng chính màn hình hiển thị của nó để làm gương soi, nên độ
đó cũng đánh giá tổng quan về mặt thẩm mĩ, tính tiện dụng và trung thực của hình ảnh phản chiếu là kém hơn so với 1 chiếc
chi phí. Về đánh giá chi tiết thì các mô đun đo sức khoẻ hoạt gương bình thường. Giá sản phẩm rất cao (từ $3.600 đến
động khá chính xác, đạt hiệu suất trên 96.5% (đo trọng lượng), $7.700 theo trang http://www.gizmag.com/ ). Ngoài ra cũng có
trên 93% (đo chiều cao từ 150 cm trở lên). Riêng bảng điều khiển
các thiết bị cân đo sức khoẻ riêng biệt như Cân điện tử -
cảm ứng chỉ hoạt động tốt trong phòng kín rèm, và bị vô hiệu hoá
Withings Wireless Scale WS-30 với giá khá cao là €149.95
khi mang ra ngoài trời. Tổng chi phí cho toàn bộ cho thiết bị là
khoảng 3 triệu đồng, với mức chi phí này là khá rẻ so với các
tương đương 3.844.000VNĐ…
thiết bị chăm sóc sức khoẻ ngoài thị trường. Với mục tiêu của đề tài là biến một chiếc gương thân thuộc
trong cuộc sống của chúng ta thành một thiết bị theo dõi tình
Từ khoá—Gương thông minh; chăm sóc sức khoẻ; đo chiều trạng sức khỏe cho mọi người,… nên trong bài báo này sẽ trình
cao; đo cân nặng; đo nhịp tim; bảng điều khiển cảm ứng. bày chủ yếu các thiết kế liên quan đến tính năng chăm sóc sức
khoẻ, còn các tính năng phụ như giải trí, hiển thị sẽ không
I. GIỚI THIỆU được trình chi tiết. Để thiết kế được một sản phẩm thoả mãn
Sự phát triển của khoa học kỹ thuật đã khiến thói quen vận yêu cầu đã đặt ra và giá thành rẻ thì việc lựa chọn các loại cảm
động của con người không còn diễn ra thường xuyên và cuộc biến, linh kiện sao cho phù hợp nhất. Việc đo chiều cao thì có
sống bận rộn khiến chúng ta không thể cân đo sức khỏe thường rất nhiều loại cảm biến với khoảng cách đo được là khác nhau,
xuyên, mà sử dụng nhiều thiết bị đơn lẻ làm mất nhiều thời ví dụ như: cảm biến tiệm cận (vài mm) [1], cảm biến hồng
gian để đo, ngoài ra thói quen đi khám sức khoẻ định kỳ như ngoại (nhỏ 80 cm) [2], cảm biến siêu âm (nhỏ hơn 400 cm) [3].
những nước tiên tiến trên thế giới là gần như không có. Hậu Vì vậy trong đề tài này, đối với chiều cao của con người là nhỏ
quả là nhiều nguy cơ bệnh tật tiềm ẩn có thể xảy ra mà không hơn 200 cm thì lựa chọn cảm biến siêu âm tối ưu nhất. Cảm
hề biết trước. Nếu có một sản phẩm tích hợp nhiều chức năng biến lực (load-cell) là thiết bị cảm biến dùng để chuyển đổi lực
đo sức khoẻ và đặt ở những vị trí mà mỗi buổi sáng thức dậy hoăc trọng lượng thành tín hiệu điện [4]. Load-cell có 2 loại
mọi người đều tiếp xúc mà kiêm luôn việc theo dõi sức khoẻ sẽ chính là load-cell tương tự và số, giá thành loại tương tự thì rẻ
thuận tiện hơn nhiều. Và chiếc gương là một vật dụng cá nhân hơn nhiều so với loại số, nên đã lựa chọn load-cell tượng tự để
thỏa mãn những yêu cầu đặt ra. làm cảm biến cho mô đun đo cân nặng. Và đo nhịp tim dùng
cảm biến hồng ngoại giúp tiết kiệm chi phí hơn nhiều so với
Mục đích đề tài: Nghiên cứu và thiết kế một sản phẩm các loại cảm biến cao cấp khác [5, 6].
Gương thông minh kiêm chức năng theo dõi, chăm sóc sức
khoẻ hằng ngày của con người. Sản phẩm có thể cân đo chiều Bài báo này được chia thành 4 phần: Giới thiệu tổng quan
cao, cân nặng, nhịp tim thông qua các việc điều khiển phím về toàn bộ hệ thống Gương thông minh được trình bày trong
cảm ứng trên bề mặt gương. Sau đó thiết bị sẽ tự động phân phần II. Thiết kế chi tiết các mô đun đo chiều cao, đo cân nặng,
tích các thông số và đưa ra lời khuyên sức khỏe qua hệ thống đo nhịp tim và bảng điều khiển cảm ứng được trình bày trong
loa ngoài hoặc hiển thị lên màn hình. Sản phẩm còn bao gồm phần III. Phần IV sẽ thể hiện kết quả đạt được và đánh giá chi
các ứng dụng có sẵn như hiển thị thời gian, lịch, ghi chú, thông tiết hoạt động của toàn bộ hệ thống. Và phần cuối cùng là kết
tin thời tiết… Sự thú vị ở thiết bị này không chỉ dừng lại ở đó, luận và hướng phát triển cho việc khắc phục các nhược điểm
mà còn có thể phát những bản nhạc với âm hưởng êm đềm hiện tại của thiết bị.
giúp bạn khới đầu một ngày mới tốt lành.

ISBN: 978-604-67-0635-9 282

II. TỔNG QUAN HỆ THỐNG

Hệ thống gồm 3 phần riêng biệt: Mạch điều khiển trung
tâm, moderm wifi, và cân điện tử, xem hình. 1.
Hình. 1. Sơ đồ trực quan của hệ thống

Cân điện tử có nhiệm vụ đo trọng lượng của người dùng
khi đứng lên bề mặt cân và lưu lại trong bộ nhớ chờ đến khi
nhận được lệnh từ bộ điều khiển trung tâm thì truyền giá trị đo
được về thông qua sóng RF.
Moderm wifi với kết nối mạng internet có nhiệm vụ thu
thập thông tin thời tiết tại thời điểm hiện tại cũng như thông tin
dự báo thời tiết các ngày tiếp theo và truyền về mạch điều
khiển trung tâm.
Hình. 2. Sơ đồ khối tổng thể của hệ thống
Mạch điều khiển trung tâm có nhiệm vụ đầu tiên là kiểm tra
tín hiệu từ mạch phát hiện chuyển động, nếu có người di mass
chuyển trong phạm vi trước Gương thì nó sẽ kích hoạt hệ thống     
hoạt động còn nếu không có người thì hệ thống sẽ chuyển qua
height 2
trạng thái chờ để tiết kiệm năng lượng. Khi ở trong chế độ hoạt
Bảng I. BẢNG ĐÁNH GIÁ THEO CHUẨN CỦA TỔ CHỨC Y TẾ THẾ GIỚI(WHO)
động, tuỳ thuộc vào tín hiệu điều khiển từ bảng điều khiển cảm VÀ DÀNH RIÊNG CHO NGƯỜI CHÂU Á ( IDI&WPRO) [8]
ứng hoặc từ khối nhận dạng giọng nói thì mạch trung tâm sẽ
kích hoạt từng mô đun tương ứng hoạt động. Ví dụ: Người WHO BMI IDI & WPRO BMI
Phân loại
dùng lựa chọn chức đo chiều cao trên bảng điều khiển cảm ứng (kg/m2) (kg/m2)
thì mạch trung tâm sẽ gửi tín hiệu kích hoạt cho mô đun đo Cân nặng thấp
<18.5 <18.5
chiều cao hoạt động sau đó thu thập dữ liệu, xử lý và hiển thị ra (gầy)
LED 7 đoạn. Tương tự như vậy, nếu người dùng lựa chọn chức Bình thường 18.5 - 24.9 18.5 - 22.9
năng đo cân nặng, mô đun cân điện tử sẽ chuyển từ chế độ chờ Thừa cân 25 23
sang chế độ hoạt động, thực hiện đo trọng lượng và trả kết quả Tiền béo phì 25 - 29.9 23 - 24.9
về mạch trung tâm thông qua sóng RF, xem hình. 2. Hai thông Béo phì độ I 30 - 34.9 25 - 29.9
số chiều cao và cân nặng này cũng chính là hai thông số quan
Béo phì độ II 35 - 39.9 30
trọng trong việc tính toán chỉ số BMI-Body mass index.
Béo phì độ III 40 40
Body mass index (BMI) là chỉ số khối cơ thể được các bác
sĩ và các chuyên gia sức khỏe sử dụng để xác định tình trạng cơ Mạch điều khiển trung tâm dựa vào chỉ số BMI, xem
thể của một người nào đó có bị béo phì, thừa cân hay quá gầy Bảng I, sau đó sẽ xử lý và hiển hiển thị một thông báo về tình
hay không [7]. Thông thường, người ta dùng để tính toán mức trạng sức khoẻ cũng như những lời khuyên cho người dùng lên
độ béo phì, chỉ số BMI được tính theo công thức (1). Trong đó màn hình. Ngoài ra mạch trung tâm này có thể điều khiển tắt,
mass là trọng lượng của cơ thể (đơn vị đo là kg) và height là mở hệ thống đèn chiếu sáng trên gương hoặc điều khiển chức
chiều cao (đơn vị đo là m). năng nghe nhạc, với dữ liệu nhạc được lưu trữ trong thẻ nhớ.

283
III. THIẾT KẾ biến dạng của điện trở khi có lực tác động (nén vào hay kéo
giãn ra), hình. 4. Thiết kế này sẽ giúp thiết bị cảm ứng sử dụng
A. Đo chiều cao Strain gauge trở nên chính xác hơn. Khi dây kim loại bị lực
tác động làm nén vào hay kéo giãn ra, sẽ thay đổi điện trở.
Để thực hiện đo chiều cao, cảm biến SRF05 được sử dụng Trong trường hợp bị nén, chiều dài của strain gauge giảm đi
để thực hiện trong đề tài này. Cảm biến SRF05 là một loại và điện trở cũng giảm. Ngược lại, trường hợp bị kéo dãn và
cảm biến khoảng cách dựa trên nguyên lý thu phát siêu âm. tăng chiều dài, điện trở cũng sẽ tăng. Điện trở thay đổi tuỳ
Cảm biến gồm một bộ phát và một bộ thu sóng siêu âm. Sóng
siêu âm từ đầu phát truyền đi trong không khí, gặp vật cản (vật
cản trong đề tài này chính là đỉnh đầu của người dùng) sẽ phản
xạ ngược trở lại và được đầu thu ghi lại, xem hình. 3. Vận tốc
truyền âm thanh trong không khí là một giá trị xác định trước,
ít thay đổi. Do đó chỉ cần xác định được khoảng thời gian từ
lúc phát sóng siêu âm tới lúc nó phản xạ về đầu thu sẽ quy đổi
được khoảng cách từ cảm biến tới vật thể. Cảm biến sẽ phát
thuộc, tỷ lệ với lực tác động (cụ thể là tuỳ thuộc vào cân nặng
một xung rất ngắn (5 μs), sau đó sẽ đo thời gian cho đến khi
nhận lại được sóng phản xạ về.
của vật đặt lên mặt cân).

Hình. 4. Mô tả hoạt động của Strain gauge và mạch cầu Wheatstone
Hình. 5. Nguyên lý hoạt động của cảm biến lực – load-cell
Một điện áp kích thích UB được cung cấp cho ngõ vào
load-cell (góc 2 và 3) và điện áp tín hiệu ra UA được đo giữa
hai góc còn lại (2 góc 1 và 4), hình. 4. Tại trạng thái cân bằng
(trạng thái không tải), điện áp tín hiệu ra là 0 hoặc gần bằng 0.
Sự thay đổi điện áp này là rất nhỏ, do đó nó chỉ có thể được đo
và chuyển thành số sau khi đi qua bộ khuếch đại. Mô đun
HX711 được sử dụng để khuếch đại tín hiệu UA và chuyển đổi
thành số bằng bộ chuyển đổi tương tự sang số 24 bit và kết
quả này sẽ được mạch điều khiển trung tâm thu thập, xử lý và
Hình. 3. Nguyên lý hoạt động của cảm biến đo chiều cao hiện lên LED 7 đoạn trên gương.
Tốc độ của âm thanh trong không khí là 340 m/s, tương C. Đo nhịp tim
đương với 29,412 μs/cm. Khi đã tính được thời gian, ta sẽ chia
cho 29,412 để nhận được khoảng cách. Theo ví dụ trong hình.
3, thời gian từ lúc phát xung đến khi nhận phản về là 3529,44
μs, suy ra khoảng cách từ cảm biến đến đỉnh đầu là 60 cm
(3529,44/2/29,412), từ đó tính được chiều cao của người dùng
là 140 cm (200 cm – 60 cm).
B. Cân điện tử
Để thực hiện đo trọng lượng, cảm biến lực (load-cell)

UDB–100Kg-Keli được sử dụng để thực hiện trong đề tài này.
Cấu tạo chính của load-cell gồm các điện trở Strain gauge R1,
R2, R3, R4 kết nối thành 1 cầu điện trở Wheatstone như hình. Hình. 6. Mô tả hoạt động của mạch đếm nhịp tim
4 và được dán vào bề mặt của thân loadcell, xem hình. 5.
Mạch hoạt động trên nguyên tắc sử dụng ánh sáng hồng
Strain Gauge là một trong những bộ phận quan trọng nhất ngoại phản xạ lại từ ngón tay theo lưu lượng máu qua ngón tay
quyết định tới nguyên lý hoạt động và độ chính xác của cân thay đổi theo sự co bóp của tim. Nó bao gồm một đèn LED
điện tử. Strain gauge bao gồm một dây kim loại mảnh được hồng ngoại để phát ánh sáng hồng ngoại đến ngón tay, một
đặt lên tấm cách điện đàn hồi. Sợi kim loại này được đặt theo phototransistor có nhiệm vụ nhận ánh sáng hồng ngoại phản xạ
hình dạng ziczac nhằm tăng mục đích tăng chiều dài, tăng độ về, xem hình. 6. Lượng máu thay đổi theo nhịp tim tạo ra một

284
dãy xung tại đầu ra của các phototransistor, độ lớn của xung Hình. 9. Các biểu tượng của bảng điều khiển cảm ứng
quá nhỏ để có thể đo trực tiếp bởi một vi điều khiển. Vì vậy, ta Để có thể nhận biết được thao tác chạm như vậy, ở bên
phải khuếch đại và lọc tín hiệu. Module được thiết kế bằng dưới mỗi phím ta đặt một cặp LED phát hồng ngoại (IR-LED)
cách sử dụng hai bộ khuếch đại thuật toán (OPAMP) để lọc và và một phototransistor, như hình. 10. IR-LED phát liên tục tia
khuếch đại tín hiệu, xem sơ đồ nguyên lý hình.7. Tín hiệu sau hồng ngoại đến bề mặt phím cảm ứng, phototransistor có
khi đi qua Opamp thứ nhất sẽ có hình dạng như hình. 8. Tín nhiệm vụ thu về ánh sáng hồng ngoại phản xạ về khi có ngón
hiệu ngõ ra của Opamp thứ hai là một chuỗi xung vuông, mạch tay chạm vào bề mặt phím đó. Sự thay đổi điện áp của ngõ ra
trung tâm sẽ đếm số lượng xung này trong 1 phút và hiển thị phototransistor được mô tả trong hình. 12. Khi không chạm
kết quả nhịp tim lên LED 7 đoạn. vào phím, tức phototransistor không thu được ánh sáng phản xạ
nên ngõ ra có mức điện áp 3,1 V xấp xỉ bằng Vdc = 3,3 V, và
mức điện áp này giảm xuống còn 2,8V khi có chạm tức có
nhận được ánh sáng hồng ngoại phản xạ về, làm
phototransistor dẫn mạnh hơn, sơ đồ nguyên lý hình. 11.
Hình. 7. Sơ đồ nguyên lý của mạch đếm nhịp tim
Hình. 10. Mô tả vị trí đặt cặp thu phát hồng ngoại
Hình. 8. Dạng sóng của nhịp tim ở ngõ ra của Opamp đầu tiên
D. Bảng điều khiển cảm ứng

Bảng điều khiển gồm có 8 phím cảm ứng, mỗi phím tương
Hình. 11. Mô tả hoạt động thu phát hồng ngoại
Tín hiệu điện áp ngõ ra của phototrasistor sẽ được chuyển

thành tín hiệu số và gửi đến mạch trung tâm xử lý.
ứng với việc kích hoạt một chức năng riêng. Như hình. 9, khi
chạm vào phím đầu tiên thì mô đun đo trọng lượng được kích Hình. 12. Dạng sóng ở ngõ ra của phototransistor
hoạt, tương tự như vậy phím thứ hai là đo chiều cao, thứ 3 là
đo nhịp tim, thứ 4 là kích hoạt chức năng nghe nhạc, thứ 5 là
bật tắt đèn chiếu sáng, thứ 6, 7, 8 là chuyển và dừng bài hát.

285
IV. KẾT QUẢ VÀ ĐÁNH GIÁ khỏe cho con người. Bên cạch đó còn có các chức năng về
thông tin và giải trí như dự báo thời tiết và nghe nhạc.
A. Kết quả
Thiết bị hiện nay đã được nghiên cứu, thiết kế thành công, là  Đánh giá độ chính xác của cân điện tử:
một sản phẩm hoàn chỉnh như hình 13, 14, 15 với 13 chức Để đánh giá độ chính xác của cân điện tử, dùng một dụng
năng khác nhau, các chức năng nổi bật phải kể đến: cụ đo cân nặng sử dụng trong y tế để so sánh.
 Hiển thị cân nặng, chiều cao, nhịp tim ngay trên bề mặt Bảng II. BẢNG SO ĐỘ CHÍNH XÁC GIỮA CÂN DÙNG TRONG Y TẾ VÀ CỦA
gương. THIẾT KẾ
 Thông báo tình trạng và đưa ra lời khuyên về sức khỏe Cân chuẩn trong y tế Cân thiết kế Độ chính xác
cho người sử dụng thông qua hệ thống loa ngoài. (kg) (kg) (%)
 Tích hợp cảm biến cảm ứng trên bề mặt gương. 90 90.5 99.4
 Nghe radio, nghe nhạc giải trí trực tiếp với gương. 72 72.3 99.6
 Hiển thị thông tin dự báo thời tiết. 64 65.2 98.1
49 50.7 96.5
40 40.6 98.5
32 32.4 98.8
20 20.5 97.5
Nhìn vào bảng II, có thể thấy chênh lệnh với giá trị cân
bằng cân chuẩn là không khác biệt nhiều, độ chính xác khá cao
từ 96.5% đến 99.5%. Nhưng trong quá trình sử dụng, có một
nhược điểm khá lớn là khi người dùng đứng lên bề mặt cân,
hình. 14, sảy ra hiện tượng bị bấp bênh do sự biến dạng của
cảm biến lực, hình. 5.
 Đánh giá độ chính xác của mô đun đo chiều cao:

Đánh giá độ chính xác của mô đun bằng cách so sánh kết
quả đo được với thước dây chuẩn. Bảng đánh giá độ chính xác
của mô đun đo chiều cao.
Bảng III. BẢNG SO ĐỘ CHÍNH XÁC CỦA MODULE ĐO CHIỀU CAO
Đo bằng thước dây Đo bằng mô đun Độ chính xác

Hình. 13. Hình ảnh thiết bị Gương thông minh (cm) (cm) (%)
190 190 100.0
185 185 100.0
172 172 100.0
164 165 99.4
150 151 99.3
120 123 97.5
70 74 94.3
30 35 83.3
Dựa vào bảng III, độ chính xác đạt được khá cao, chỉ lệch
Hình. 14. Mô đun đo trọng lượng
từ 1 đến 2 cm đối với chiều cao từ 150 cm trở lên. Khi chiều
cao càng thấp thì đồ chính xác càng giảm, độ chênh lệch 3 từ 5
B. Đánh giá cm. Vì vậy khi đo chiều cao cho người trưởng thành sẽ đạt hiệu
quả hơn cho trẻ em.
 Đánh giá tổng quan:
Sản phẩm Gương thông minh này đã được thiết kế một  Đánh giá độ chính xác của mô đun đếm nhịp tim:
cách tinh tế từ mẫu mã, màu sắc tới chức năng để có thể phù
hợp với nhiều không gian khác nhau, hình 13. Có thể đặt Đánh độ chính của mạch đếm nhịp tim bằng cách so sánh
Gương thông minh trong phòng tắm, phòng ngủ hay phòng kết quả đo bằng cảm biến với cách bắt mạch bằng tay truyền
khách, tùy vào nhu cầu của người sử dụng. Mặc cho được tích thống. Bảng IV cho kết quả so sánh đó:
hợp nhiều thiết bị trên gương nhưng nó vẫn không mất đi vẻ
đẹp của một chiếc gương soi bình thường. Các chức của
Gương thông minh chủ yếu hướng đến nhu cầu chăm sóc sức

286
Bảng IV. ĐÁNH GIÁ ĐỘ CHÍNH XÁC CỦA MẠCH ĐẾM NHỊP TIM V. KẾT LUẬN VÀ HƯỚNG PHÁT TRIỂN
Phương pháp truyền thống Bằng cảm biến Sai số
(Nhịp/phút) (Nhịp/phút) (Nhịp) A. Kết luận
86 86 0 Trong bài báo này đã trình bày tổng quan về thiết kế của
80 79 1 Gương thông minh kiêm thiết bị theo dõi sức khoẻ, và trình
65 67 0 bày chi tiết thiết kế của các mô đun chính như đo chiều cao,
cân nặng, nhịp tim, bảng điều khiển cảm ứng, bên cạnh đó
72 71 1
cũng đánh giá tổng quan về thiết bị có mặt thẩm mĩ và tính tiện
91 90 1 dụng cao. Các mô đun đo sức khoẻ hoạt động khá chính xác,
Dựa vào bảng IV, cho thấy kết quả đạt được độ chính xác đạt hiệu suất trên 96.5% (về đo trọng lượng), trên 93% (đo
khá cao, sai lệch chỉ 1 nhịp . chiều cao từ 150cm trở lên). Riêng bảng điều khiển cảm ứng
chỉ hoạt động tốt trong phòng kín rèm, và bị vô hiệu hoá khi
 Đánh giá chất lượng của bảng điều khiển cảm ứng: mang ra ngoài trời. Tổng chi phí cho toàn bộ sản phẩm là
Bảng điều khiển đáp ứng thao tác chạm rất nhanh, không bị khoảng 3 triệu đồng, với mức chi phí này là khá rẻ cho một sản
nhận dạng nhầm sang các phím lân cận. phẩm độc đáo, tiện dụng và phù hợp với điều kiện kinh tế của
người Việt Nam.
Nhưng có một nhược điểm lớn nhất là khi hoạt động ở
ngoài trời nắng sẽ bị nhiễu, do trong ánh sáng mặt trời có thành B. Hướng phát triển
phần hồng ngoại khá cao, nên cảm biến hồng ngoại nhận dạng Trong tương lai, sẽ tiếp tục nghiên cứu cảm ứng điện dung
sai, dẫn đến hoạt động của toàn bộ hệ thống mất ổn định.
thay thế cho cảm ứng hồng ngoại để khắc phục nhược điểm bị
nhiễu bởi ánh sáng mặt trời. Tiếp tục tối ưu mô đun cân điện tử
 Đánh giá chi phí: để tránh hiện tượng bấp bênh đi người dùng đứng lên mặt cân
bằng cách thay thế cảm lực biến lực thích hợp hơn. Và các mô
Bảng V. CHI PHÍ CỦA TOÀN BỘ HỆ THỐNG đun khác thiết kế lại nhỏ gọn hơn, tối ưu hơn để giảm chi phí
Chi phí sản xuất.
Thành phần
(VNĐ)
Mô đun đo trọng lượng 500.000 VI. LỜI CẢM ƠN
Mô đun đo chiều cao 200.000 Để đạt được kết quả như đã trình bày, xin gửi lời cảm ơn
Mô đun đo nhịp tim 50.000 đến tập thể nhóm nghiên cứu TRT 3DCS và Lê Tự Hiếu,
Bảng điều khiển cảm ứng 70.000 Nguyễn Hữu Vinh, Khoa Điện Tử Viễn Thông, Đại học Bách
Mạch trung tâm 100.000 Khoa, Đại học Đà Nẵng đã hỗ trợ, giúp đỡ rất nhiều trong quá
Mạch phát nhạc 150.000 trình thực hiện đề tài này.
Khuếch đại âm thanh 100.000
LED 7 đoạn, LCD graphic 128x64 450.000 VII. THAM KHẢO
Mạch nhận dạng giọng nói 150.000 [1] V. Osadcuks, A. Pecka, A. Lojans and A. Kakitis; Faculty of
Đèn chiếu sáng 50.000 Engineering, Latvia Universty of Agriulture, 5 J.Cakstes blvd., LV-3001
Jelgava, Latvia, “Experimental research of proximity sensors for
Mô đun giao tiếp không dây-RF 300.000 application”, Agronomy Research12(3), 955–966, 2014.
Mô đun giao tiếp internet không dây 200.000 [2] Hoang Thuan, “Measure the distance using infrared sensors”,
Mạch phát hiện chuyển động 60.000 Application Report; HMAR02 Rev 1.1; 10/2012.
Nguồn 200.000 [3] Labelsensors.com, "Label Sensor Types and Technologies, Clear Label
Gương và các phụ kiện khác 500.000 Sensor Choice", Retrieved 17-03-2015.
Tổng 3.080.000 [4] Maritime Journal (Mercator Media),"Load cell testing gets straight to the
point", 20 December 2010.
Dựa vào bảng V, chi phí cho toàn bộ thiết bị này khoảng [5] Warsuzarina Mat Jubadi, Siti Faridatul Aisyah Mohd Sahak - Dept. of
3.080.000 VNĐ, nhìn chung là khá rẻ, nếu so sánh với các thiết Electronics Engineering, University Tun Hussein Onn Malaysia, Batu
bị riêng lẻ ngoài thị trường, như riêng mô đun cân điện tử Pahat, Johor, Malaysia, “Heartbeat Monitoring Alert via SMS”, 2009
IEEE Symposium on Industrial Electronics and Applications (ISIEA
Withings Wireless WS-30 ngoài thị trường có giá lên đến 2009), October 4-6, 2009, Kuala Lumpur, Malaysia.
3.600.000 VNĐ, hay mô đun đo nhịp tim XY302 ngoài thị
[6] Mohamed Fezari, Mounir Bousbia-Salah, and Mouldi Bedda -
trường là 900.000 VNĐ. Với mức giá này thì khá phù hợp cho Department of electronics, “Microcontroller Based Heart Rate Monitor”,
người dùng có thể sở hữu được một sản phẩm tích hợp được University of Badji Mokhtar, Annabam, The International Arab Journal
nhiều chức năng, độc đáo, tiên dụng cho việc chăm sóc sức of Information Technology, Vol. 5, No. 4, October 2008.
khoẻ hàng ngày, và cũng phù hợp với điều kiện kinh tế của [7] Beyond BMI: Why doctors won't stop using an outdated measure for
người tiêu dùng Việt Nam hiện nay. obesity., by Jeremy Singer-Vine, Slate.com, ngày 20 tháng 7 năm 2009.
[8] WHO. Obesity: preventing and managing the global epidemic. Report of
a WHO Consultation. WHO Technical Report Series 894. Geneva:
World Health Organization, 2000.

287
Phân Loại Câu Trả Lời Giả Mạo Trên Các Trang Web
Hỏi Đáp Cộng Đồng Dựa Vào Quan Hệ Người Dùng
Nông Thị Hoa, Quách Xuân Trưởng, Nguyễn Thùy Linh, Vũ Thị Thúy Thảo, Nguyễn Xuân Hưng
Trường Đại học Công nghệ thông tin & Truyền thông, Đại học Thái Nguyên
Email: nongthihoa@gmail.com, qxtruong@ictu.edu.vn, gianglinhtn@gmail.com,vttthao@ictu.edu.vn, nxhung@ictu.edu.vn
Abstract – Việc xuất hiện các câu trả lời giả mạo (câu trả lời có giúp được gì cho người hỏi. Nếu người hỏi bị lừa bởi các câu
chứa thông tin quảng cáo) trên các trang web hỏi đáp cộng đồng trả lời giả mạo thì người hỏi sẽ không tin tưởng và ko ghé
sẽ làm giảm sự tin tưởng của người dùng đối với các tri thức của thăm trang web nữa. Vì vậy, một nhiệm vụ cơ bản là phân
trang. Vì vậy, nhu cầu loại bỏ các câu trả lời giả mạo này là hết loại để lọc ra những câu trả lời giả mạo.
sức cần thiết. Hiện nay, các tiếp cận thường tập trung vào phân
Trong bài báo này, chúng tôi trình bày cách phân loại các
loại dựa trên đặc điểm văn bản và ngữ cảnh. Dựa vào hoạt động
của các trang web hỏi đáp, các người dùng tốt thường thích hoặc câu trả lời giả mạo trên các trang web hỏi đáp cộng đồng
bầu chọn các câu trả lời xác thực. Ngược lại, người dùng chuyên thông qua mối quan hệ người dùng. Dựa vào đặc điểm: các
đăng quảng cáo thường thích hoặc bầu chọn các câu trả lời có người dùng tốt thường thích hoặc bầu chọn các câu trả lời xác
chứa quảng cáo. Vì vậy, việc dùng mối quan hệ này để phân loại thực còn người dùng chuyên đăng quảng cáo thường thích
các câu trả lời sẽ tăng thêm khả năng tìm được các câu trả lời giả hoặc bầu chọn các câu trả lời có chứa quảng cáo. Việc phân
mạo. Trong bài báo này, chúng tôi trình bày cách phân loại các loại các câu trả lời được thực hiện qua hai bước: (i) Phân loại
câu trả lời giả mạo trên các trang web hỏi đáp cộng đồng thông dựa trên các thuộc tính về văn bản thu được tập các câu trả lời
qua mối quan hệ người dùng. Các thử nghiệm được làm với hai giả mạo và tập các câu trả lời xác thực; (ii) Phân loại dựa trên
bộ dữ liệu được thu thập từ trang Yahoo hỏi đáp và Facebook.
quan hệ người dùng đối với các câu được xếp loại là xác thực
Kết quả cho thấy việc sử dụng quan hệ người dùng cho phép
phân loại tốt hơn các phương pháp phân loại dựa vào văn bản. ở bước trước.
Bài báo được tổ chức thành các phần sau: trong phần II,
Keywords – Câu trả lời giả mạo, quan hệ người dùng, phân chúng tôi tổng kết các nghiên cứu liên quan. Phần III trình bày
loại câu trả lời, trang web hỏi đáp cộng đồng, phân loại . các đặc điểm của câu trả lời. Tiếp theo, quan hệ người trong
phân loại câu trả lời được mô tả chi tiết trong phần IV. Phần V
I. GIỚI THIỆU thể hiện các kết quả thực nghiệm. Cuối cùng, kết luận được
đưa ra trong Phần VI.
Hiện nay, các trang web hỏi-đáp cộng đồng, chẳng hạn
như Yahoo! Hỏi & Đáp và WikiAnswers, đã trở thành một II. CÁC NGHIÊN CỨU LIÊN QUAN
trong những phương pháp thu thập thông tin quan trọng nhất.
Trong vài năm qua, tìm câu trả lời trên các trang web
Ngoài các công cụ tìm kiếm web có mục đích chung, các trang
đã trở thành một nhiệm vụ phổ biến để khai thác kiến thức từ
web hỏi-đáp cộng đồng đã trở lên phổ biến, có hiệu quả và trở
các trang web hỏi đáp cộng đồng. Các nghiên cứu gồm lấy các
thành phương tiện tìm kiếm thông tin trên web. Hiện nay có
cặp câu hỏi - câu trả lời đã tích lũy để tìm câu trả lời liên quan
hàng trăm triệu câu trả lời và hàng triệu câu hỏi tích lũy trên
cho một câu hỏi mới, tổng hợp các câu trả lời để cung cấp một
các trang web hỏi-đáp cộng đồng. Các nguồn tài nguyên của
kết quả chính xác [1][2][3][4][5][6]. Tuy nhiên, việc phát hiện
câu hỏi và câu trả lời trước đây được chứng minh là một cơ sở
các câu trả lời giả mạo chưa được quan tâm thực sự. Nếu thu
tri thức có giá trị. Từ các trang web hỏi-đáp cộng đồng, người
thập một tập hợp câu hỏi – câu trả lời có nhiều câu trả lời giả
dùng có thể trực tiếp nhận được các câu trả lời để đáp ứng một
mạo thì kiến thức thu được sẽ vô nghĩa. Do đó, bước đầu tiên
số nhu cầu thông tin cụ thể. Do đó, trong những năm gần đây,
là dự đoán để lọc ra những câu trả lời giả mạo. Một số nghiên
khai thác kiến thức trong các trang web hỏi-đáp cộng đồng đã
cứu khác tập trung vào dự đoán chất lượng câu trả lời [7] [8]
trở thành một chủ đề phổ biến trong lĩnh vực trí tuệ nhân tạo
[9][10].
Tuy nhiên, một số câu trả lời có thể là giả mạo. Các trang
Tuy nhiên, có sự khác biệt đáng kể giữa dự đoán chất
web hỏi-đáp cộng đồng có hàng triệu người dùng mỗi ngày.
lượng câu trả lời và dự đoán câu trả lời giả mạo. Dự đoán chất
Do các câu trả lời có thể chỉ dẫn hành vi của người dùng nên
lượng câu trả lời sẽ đo chất lượng tổng thể của câu trả lời,
một số người dùng độc hại đã cố ý cung cấp câu trả lời giả
thông qua tính chính xác, tính dễ đọc và đầy đủ của các câu trả
mạo để quảng cáo sản phẩm hoặc dịch vụ.
lời. Trong khi dự đoán câu trả lời giả mạo dự đoán mục đích
Câu trả lời giả mạo gây ra nhiều vấn đề đặc biệt là gây
của các câu trả lời có chứa quảng cáo hay không. Một số
hiểu lầm cho người dùng và làm người dùng đưa ra quyết định
nghiên cứu [7][10][11] xem việc chọn “câu trả lời tốt nhất”
sai. Về phía cộng đồng hỏi-đáp, các câu trả lời giả mạo sẽ làm
như câu trả lời chất lượng cao mà được chọn bởi người hỏi
tổn hại sức mạnh của các trang web hỏi-đáp cộng đồng. Một
trong các trang web hỏi đáp cộng đồng. Tuy nhiên, câu trả lời
trang web hỏi-đáp cộng đồng mà không có kiểm soát các câu
giả mạo có thể được lựa chọn là câu trả lời chất lượng cao bởi
trả lời giả mạo thì chỉ có lợi nhưng kẻ gửi thư rác mà không
ISBN: 978-604-67-0635-9 288

các người dùng độc hại, hoặc vì người dùng hiểu lầm. Trong Theo quan sát, các câu trả lời giả mạo thường dài hơn các
khi đó, một số câu trả lời từ những người không phải người câu trả lời xác thực bởi vì câu trả lời giả mạo được chuẩn bị
bản xứ có thể có lỗi ngôn ngữ mà làm cho câu trả lời có chất tốt để quảng cáo các mục tiêu. Vì vậy, số từ và số câu trong
lượng thấp nhưng vẫn là câu trả lời xác thực. các câu trả lời được xét như một thuộc tính.
Một số nghiên cứu cũng dùng đồ thị người dùng để nghiên
B. Các thuộc tính theo ngữ cảnh
cứu các mối quan hệ người dùng [12][13]. Các nghiên cứu chủ
yếu xây dựng các đồ thị người dùng với mối quan hệ người Bên cạnh các thuộc tính theo văn bản, có thể xem xét đến
hỏi-người trả lời để ước tính số điểm chuyên môn với quan các thuộc tính khác từ ngữ cảnh của câu trả lời.
điểm người trả lời có hiểu biết hơn người hỏi. Tuy nhiên, bài 1) Sự liên quan giữa câu hỏi và câu trả lời
toán này không quan tâm người dùng nào có kiến thức hơn, Đặc điểm chính của câu trả lời trong trang web hỏi-đáp
mà cho biết cả hai người dùng là hai kẻ gửi thư rác hoặc hai cộng đồng là câu trả lời được cung cấp để trả lời câu hỏi tương
người dùng xác thực. Vì vậy, mối quan hệ giữa các người ứng. Vì vậy, câu hỏi tương ứng được dùng như một thuộc tính
dùng mới được đưa vào để nâng cao chất lượng phân loại câu ngữ cảnh bằng cách đo sự liên quan giữa các câu trả lời và câu
trả lời giả mạo. Lý do là người gửi thư rác đưa ra câu trả giả hỏi. Ba mô hình phổ biến được dùng để xác định sự liên quan
mạo và thăng cấp các câu trả giả mạo còn người dùng xác thực giữa câu hỏi và câu trả lời:
thường gửi các câu trả lời xác thực và giáng cấp các câu trả lời Mô hình không gian vector
giả mạo. Quan hệ giữa người dùng được xây dựng dựa trên Mỗi câu trả lời hoặc câu hỏi được xem như là một vector
đánh giá câu trả lời của người dùng khác là “hữu ích” hoặc lựa từ. Cho một câu hỏi q và câu trả lời a, mô hình vector sử dụng
chọn là “câu trả lời tốt nhất”. bộ đếm từ có trọng số và sự tương tự cosine của các vector từ
như là một hàm liên quan [15].
III. CÁC ĐẶC TRƯNG CỦA CÂU TRẢ LỜI Tuy nhiên, mô hình vector chỉ xem xét sự đối chiếu từ
Đầu tiên, xem việc dự đoán câu trả lời giả mạo là một vấn chính xác trong khi các câu hỏi và câu trả lời thường là ngắn
đề phân loại nhị phân. Hai loại thuộc tính của câu trả lời được hơn so với tài liệu. Ví dụ, Hà nội và thủ đô của Việt Nam là
dùng trong phân loại gồm các thuộc tính theo văn bản và các cùng một thành phố. Nhưng mô hình vector sẽ cho thấy chúng
thuộc tính theo ngữ cảnh. phải khác nhau.
Mô hình dịch
A. Các thuộc tính theo văn bản Một mô hình dịch là một mô hình toán học mà việc dịch
Đầu tiên, dự đoán câu trả lời giả mạo bằng cách phân tích ngôn ngữ được mô hình hóa dựa trên các thống kê dữ liệu.
nội dung câu trả lời. Một số thuộc tính theo văn bản được lấy Khả năng dịch một câu nguồn (câu trả lời) sang câu mục tiêu
ra từ nội dung câu trả lời. (câu hỏi) thu được bằng cách gióng các từ để cực đại tích xác
1) Unigrams và Bigrams suất các từ. Với mô hình dịch, có thể tính điểm dịch cho câu
Loại phổ biến nhất của thuộc tính để phân loại văn bản là hỏi và câu trả lời mới.
túi từ (bag of words). Sử dụng các phương pháp lựa chọn Mô hình chủ đề
thuộc tính để chọn 200 từ đơn và từ ghép như thuộc tính về từ. Để giảm lỗi đối chiếu từ trong mô hình vector, dùng mô
Danh sách các từ này có liên quan đến mục đích quảng cáo hình chủ đề để mở rộng việc đối chiếu ngữ nghĩa của chủ đề.
gồm: chuyên nghiệp, dịch vụ, khuyên dùng, địa chỉ, số điện Mô hình chủ đề xem xét một tập hợp các tài liệu với các chủ
thoại, email, điều trị, giới thiệu, hoàn hảo, tốt nhất, tel, mobile, đề [17]. Về bản chất, mô hình ánh xạ thông tin từ số chiều của
address, phone, liên hệ, dt, điện thoại. từ sang số chiều chủ đề ngữ nghĩa.
2) Các thuộc tính URL 2) Các thuộc tính về hồ sơ của người dùng
Một số người dùng độc hại có thể quảng bá sản phẩm bằng Từ số liệu thống kê hoạt động của người dùng, các thuộc
cách liên kết với một URL. Do đó, URL là thể hiện tốt cho câu tính về hồ sơ cá nhân được xây dựng bao gồm mức độ sử dụng
trả lời giả mạo. Tuy nhiên, một số URL có thể cung cấp các tài các trang web hỏi-đáp cộng đồng, số lượng câu hỏi, số lượng
liệu tham khảo cho câu trả lời xác thực. Ví dụ, nếu hỏi thời tiết câu trả lời, và tỷ lệ câu trả lời tốt nhất.
ở vùng núi, một người nào đó chỉ có thể gửi liên kết đến 3) Điểm thẩm quyền của người dùng
“http://www.weather.com/". Vì vậy, bên cạnh sự tồn tại của Các chuyên gia tìm kiếm nhiệm vụ thực hiện chấm điểm
URL, cần sử dụng thêm thuộc tính URL sau đây: thẩm quyền cho mỗi người dùng [5][12][13]. Điểm này biểu
- Chiều dài của các URL: các URL dài có nhiều khả năng thị số điểm chuyên môn của người dùng. Để tính điểm thẩm
là rác. quyền, đầu tiên cần xây dựng một đồ thị có hướng thể hiện sự
- Điểm xếp hạng trang: sử dụng số điểm xếp hạng trang tương tác của người dùng trong cộng đồng. Mỗi nút của đồ thị
của mỗi URL như điểm phổ biến [14]. Trang có độ phổ biểu diễn cho một người dùng. Một cạnh giữa hai người dùng
biến ít là trang có trong câu trả lời giả mạo. chỉ hình thành khi người dùng này trả lời câu hỏi của người
3) Số điện thoại và email dùng kia. Trọng lượng của một cạnh cho biết số tương tác.
Câu trả lời giả mạo thường có nhiều thông tin liên lạc như 4) Các thuộc tính tự động
số điện thoại, địa chỉ và email. Câu trả lời xác thực ít tham Loại thứ ba của thuộc tính liên quan đến tác giả được sử
khảo đến số điện thoại hoặc địa chỉ email hơn. Số lần xuất dụng để phát hiện xem tác giả có là một robot được lập trình
hiện của email và số điện thoại được coi như một thuộc tính. để gửi câu trả lời tự động. Theo quan sát, sự phân phối thời
4) Chiều dài gian gửi bài trả lời rất khác nhau giữa người dùng và robot.
289

Robot có thể gửi câu trả lời liên tục nên khoảng thời gian giữa “không hữu ích”, và người dùng u6 bỏ phiếu câu trả lời thứ hai
hai câu trả lời là nhỏ hơn người dùng thực bởi vì con người là “hữu ích”. Cuối cùng, người hỏi u1 đã chọn câu trả lời đầu
cần thời gian để suy nghĩ và xử lý giữa hai bài viết. tiên là “câu trả lời tốt nhất”. Do người dùng u4 và u5 cùng đưa
5) Đánh giá từ người dùng khác ra đánh giá “không hữu ích” đối với câu trả lời đầu tiên nên
Trên các trang web hỏi-đáp cộng đồng, người dùng có thể hai người dùng này có quan hệ với nhau.
bày tỏ ý kiến hoặc đánh giá các câu trả lời. Ví dụ, người hỏi có Về phía đánh giá “hữu ích” thực sự, giả sử tác giả của câu
thể chọn câu trả lời tốt nhất. Ngoài ra, người dùng có thể dán trả lời cho đánh giá “hữu ích” đối với câu trả lời của mình.
nhãn cho mỗi câu trả lời là “hữu ích” hoặc “không hữu ích”. Sau đó, nếu người dùng u6 đưa ra đánh giá “hữu ích” với câu
Đánh giá của người dùng khác được tính theo tỷ lệ giữa số trả lời thứ hai của người dùng u3 thì người dùng u6 có quan hệ
phiếu bầu “hữu ích” trên số tổng số phiếu bầu. với người dùng u3.
6) Sao chép các câu trả lời Tiếp tục xác định quan hệ người dùng với lựa chọn “câu
Người dùng xấu có thể gửi các tài liệu quảng bá sản phẩm trả lời tốt nhất”. Nếu người hỏi đã chọn “câu trả lời tốt nhất”
được viết trước cho nhiều câu trả lời, hoặc chỉ thay đổi tên sản trong tất cả các câu trả lời thì người hỏi có quan hệ với tác giả
phẩm. Xét sự tương đồng giữa các câu trả lời cho thấy nếu hai của “câu trả lời tốt nhất”. Theo ví dụ, người dùng u1 có quan
câu trả lời là giống nhau nhưng câu hỏi là khác nhau thì các hệ với người dùng u2.
câu trả lời đó là giả mạo Trong các trang web hỏi đáp cộng đồng, kẻ gửi thư rác chủ
yếu quảng cáo các sản phẩm mục tiêu bằng cách đưa ra các
IV. DỰ ĐOÁN CÂU TRẢ LỜI GIẢ MẠO DỰA VÀO câu trả lời giả mạo. Kẻ gửi thư rác có thể làm cho câu trả lời
MỐI QUAN HỆ NGƯỜI DÙNG giả mạo trông có vẻ thật, bằng cách bầu chọn cho chúng là câu
trả lời chất lượng cao, hoặc lựa chọn chúng như là “câu trả lời
Bên cạnh các thuộc tính theo văn bản và các thuộc tính
tốt nhất". Tuy nhiên, người dùng xác thực thường có đánh giá
theo ngữ cảnh, mối quan hệ của người dùng cũng được dùng
riêng cho các câu trả lời xác thực và các câu trả lời giả mạo.
để dự đoán câu trả lời giả mạo. Giả sử, người dùng tương tự
Vì vậy, việc đánh giá đối với các câu trả lời phản ánh mối
có xu hướng thực hiện hành vi tương tự (cùng gửi câu trả lời
quan hệ người dùng. Tuy nhiên, vẫn có các quan hệ nhiễu khi
giả mạo hoặc cùng đăng câu trả lời xác thực). Đầu tiên, cần
người dùng xác thực bị lừa và chọn câu trả lời giả mạo là “câu
xác định mối quan hệ của người dùng thông qua phiếu bầu của
trả lời tốt nhất".
các người dùng về câu trả lời. Sau đó, dùng mối quan hệ người
dùng để dự đoán câu trả lời giả mạo. B. Kết hợp mối quan hệ người dùng và các thuộc tính về văn
bản để phân loại các câu trả lời giả mạo.
A. Xác định mối quan hệ người dùng
Ý tưởng dùng quan hệ người dùng để phân loại câu trả lời
Cho một câu hỏi Q1, sẽ có một số câu trả lời cho Q1 từ
giả mạo đã được trình bày chi tiết trong [18]. Trong nghiên
những người dùng khác nhau. Hai người dùng U1 và U2 có
cứu này, đồ thị quan hệ người dùng được xây dựng với trọng
mối quan hệ nếu ở một trong các trường hợp sau:
số cạnh thể hiện mức quan hệ giữa hai người dùng và dùng
(i) Người dùng U1 trả lời một câu hỏi Q1. Người dùng U2
hàm mục tiêu để cực tiểu sự khác biệt khi xác thực câu trả lời
bình chọn câu trả lời của người dùng U1 là “hữu ích” hoặc
của các người dùng có quan hệ. Do đó, kết quả phân loại sẽ có
“không hữu ích”;
độ chính xác cao nhưng đòi hỏi tính toán phức tạp hơn.
(ii) Người dùng U2 trả lời một câu hỏi Q1. Người dùng U1
Chúng đề xuất thủ tục phân loại đơn giản hơn dựa trên ý
bình chọn câu trả lời của người dùng U2 là “hữu ích” hoặc
tưởng của nghiên cứu trên. Do việc xây dựng quan hệ người
“không hữu ích”; và
dùng đơn giản hơn nên độ chính xác của kết quả phân loại sẽ
(iii) Cả người dùng U1 và người dùng U2 cùng bình chọn
giảm so với phương pháp nêu trên.
một câu trả lời A1 của một người dùng khác là “câu trả lời tốt
1) Thủ tục phân loại câu trả lời
nhất”.
Trong thủ tục này, người dùng có quan hệ với người dùng
độc hại cũng xem như người dùng độc hại. Việc phân loại câu
trả lời giả mạo được thực hiện qua các bước sau:
Bước 1: Phân loại các câu hỏi dựa trên các thuộc tính về
văn bản để lọc ra các câu trả lời giả mạo. Với mỗi câu trả lời
giả mạo thu được, lấy tác giả của câu trả lời đưa vào danh sách
các người dùng độc hại.
Bước 2: Với các câu trả lời còn lại, làm hai bước sau:
Bước 2.1: Tìm ra các người dùng có quan hệ với người
dùng độc hại trong danh sách thu được ở Bước 1 theo cách
xác định trong phần 4 mục A nếu số lần có cùng quan
Hình 1: Ví dụ về quan hệ người dùng điểm vượt qua ngưỡng q với q nguyên dương. Điều này để
tránh khi người dùng xác thực bị lừa bởi người dùng độc
Ví dụ: người hỏi, u1, hỏi một câu. Sau đó, người dùng u2 hại do chưa xem xét kỹ thông tin câu trả lời đã bình chọn.
và u3 trả lời cho câu hỏi này. Sau khi câu trả lời được cung Bước 2.2: Phân loại câu trả lời là giả mạo nếu người trả
cấp, người dùng u4 và u5 bầu chọn câu trả lời đầu tiên là lời là người dùng độc hại. Các câu trả còn lại là câu trả lời
xác thực.
290

2) Ưu điểm và nhược điểm x Câu trả lời chứa các từ liên quan đến quảng cáo gồm
Thủ tục đề xuất có tốc độ xử lý nhanh do các phương thức chuyên nghiệp, dịch vụ, khuyên dùng, địa chỉ, số điện
phát hiện câu trả lời giả mạo từ các thuộc tính về văn bản là thoại, email, điều trị, giới thiệu, hoàn hảo, tốt nhất,
khá đơn giản. Hơn nữa, việc xác định mối quan hệ người dùng tel, mobile, address, phone, liên hệ, dt, điện thoại.
cũng dễ thực hiện chỉ bởi các phép so sánh. x Với địa chỉ URL, chỉ xét phần địa chỉ đầu tiên gắn
Do thủ tục đạt được tốc độ xử lý nhanh nên chất lượng với tên miền. Các địa chỉ chia thành 3 nhóm: bắt đầu
phân loại sẽ bị giảm vì một số câu trả lời giả mạo vẫn được coi bằng www thì độ dài lớn hơn 10 ký tự, bắt đầu bằng
là các câu trả lời thật do chưa xét hết các thuộc tính liên quan http:// thì độ dài lớn hơn 17 ký tự, bắt đầu bằng
đến ngữ cảnh và mối quan hệ giữa người dùng chỉ ở mức đơn https:// thì độ dài lớn hơn 18 ký tự.
giản. Nếu mối quan hệ người dùng được xây dựng tốt hơn Kết quả thực nghiệm được trình bày trong Bảng 2. Số liệu
gồm các thông tin về trọng số của các mối quan hệ thì giải trong Bảng 2 cho thấy thủ tục đề xuất cải thiện đáng kể khả
quyết tốt hơn các mối quan hệ còn nhập nhằng. Ví dụ một năng phát hiện các câu trả giả mạo so với kết quả phân loại
người dùng có nhiều quan hệ với nhiều người dùng xác thực theo các thuộc tính văn bản.
hơn quan hệ với người dùng độc hại thì được coi là người
dùng xác thực. Với thủ tục trên, khi số lần người dùng xác Bảng 2: Tỷ lệ % phân loại đúng với tập dữ liệu từ Yahoo
thực đồng ý với ý kiến của người dùng độc hại vượt qua một Giả mạo Xác thực Tổng thể
ngưỡng nhất định thì vẫn bị coi là người dùng độc hại.
Số mẫu 88 744 832
V. KẾT QUẢ THỰC NGHIỆM Độ dài 6.82 91.67 49.25
Trong bài báo này, các thực nghiệm được làm trên hai tập Danh sách từ 29.55 97.18 63.37
dữ liệu được thu thập trừ trang Yahoo hỏi-đáp Việt Nam và
nhóm IELTS SHARE của Facebook. Với mỗi câu trả lời, Địa chỉ URL 29.55 98.25 63.90
chúng tôi tiến hành gán nhãn là giả mạo hay xác thực dựa vào Tổng hợp 57.95 100.00 78.98
nội dung câu hỏi và nội dung câu trả lời.
Quan hệ người dùng 85.23 100.00 92.62
Với mỗi tập dữ liệu, thực hiện phân loại theo 5 cách sau:
độ dài câu trả lời, danh sách các từ thường dùng trong quảng
cáo, địa chỉ URL, tổng hợp cả ba thuộc tính văn bản và thủ tục B. Thực nghiệm với tập dữ liệu từ Facebook
đề xuất. Để đánh giá hiệu quả phân loại, tỷ lệ phần trăm phân Tập dữ liệu gồm 250 mẫu được thu thập từ nhóm IELTS
loại đúng được dùng cho các câu trả lời giả mạo, các câu trả SHARE của Facebook – Nơi hỏi đáp về các tài liệu học tiếng
lời xác thực, và trên toàn tập dữ liệu. anh trình độ IELTS. Trong đó, có 31 mẫu là câu trả lời giả mạo
A. Thực nghiệm với tập dữ liệu từ Yahoo hỏi-đáp và 219 mẫu là câu trả lời xác thực. Bảng 3 thể hiện một số quan
hệ người dùng thu được từ tập số liệu.
Tập dữ liệu gồm 832 mẫu được thu thập từ nhiều chủ đề
khác nhau trên trang Yahoo hỏi-đáp Việt Nam. Trong đó, có
Bảng 3: Các quan hệ người dùng trong tập dữ liệu từ Facebook
88 mẫu là câu trả lời giả mạo và 744 mẫu là câu trả lời xác
thực. Bảng 1 thể hiện quan hệ người dùng thu được từ tập số Người trả lời Người thích câu trả lời
liệu. Thanh Hồ, Phương Mai, Dung Trinh,Yoo
Đỗ Trọng Su, Linh Chan, Len Pham, Nguyễn Đức
Bảng 1: Các quan hệ người dùng trong tập dữ liệu từ Yahoo Thiêm Nghĩa, Hằng Nga, Nguyễn Thảo, Dương
Người trả lời Người thích/chọn là câu trả lời hay nhất Trịnh
SGC ShopOnline4Sure, Vip Ooz
Hồ Trọng Đại Tuyết Anh, Linh Sogogi, Phương Thảoo
Viet Bup Be Mat troi Xanh, KYNGVI
Lực Nam, Trung Phuong Anh Bùi, Link Chee Twig, Trần
Thanh Phương, Trần Thảo Ngọc, Tuyết
Hehe Suri, Iu, Na Ngo Bla
Anh, Trâm Nguyễn, Nguyễn
chung doan, phuc, nguyen Thảo,Phương Thảoo, Nguy Hiểm
ngocn nam viet, thi, hung, uyên
Phạm Ngọc Diệp, Chi Phan, Phan Thị
Thoa Mỹ Vy, Hien Nguyễn Ngọc Ngọc Phú, Hạ Nhật, Thân Hương, Mun
Hưng Lê đức huệ, Xuan Thien, Trung Mun, AnhThu Tran,Kỵ Sỹ Văn Trần, Mai
Smart Dev Thành Mobile Anh BaeKarry
Mun Mun, Ha Cuong, Dương Trịnh,

Các tham số chọn cho các thuộc tính về văn bản dùng Hoàng Phúc
Phạm Ngọc Diệp, Thân Hương
trong thực nghiệm gồm:
x Số từ trong câu trả lời quá 80 từ
291

Kết quả thực nghiệm trong Bảng 4. cũng cho thấy thủ tục 1, COLING ’08, pages 497– 504, Stroudsburg, PA, USA. Association
for Computational Linguistics
cải tiến tăng mạnh khả năng phát hiện các câu trả giả mạo so
[4] Young-In Song, Chin-Yew Lin, Yunbo Cao, and HaeChang Rim (2008),
với kết quả phân loại theo các thuộc tính văn bản “Question utility: a novel static ranking of question search”. Proceedings
of the 23rd national conference on Artificial intelligence - Volume 2,
Bảng 4: Tỷ lệ % phân loại đúng với tập dữ liệu từ Facebook AAAI’08, pages 1231–1236. AAAI Press.
[5] X. Si, Z. Gyongyi, and E. Y. Chang (2010), “Scalable mining of topic-
Giả mạo Xác thực Tổng thể dependent user reputation for improving user generated content search
Số mẫu 31 219 250 quality”, In Google Technical Report.
[6] A. Figueroa and J. Atkinson (2011), “Maximum entropy context models
Độ dài 19.35 99.54 59.45 for ranking biographical answers to open-domain definition questions”,
Danh sách từ 6.45 99.54 53.00 Twenty-Fifth AAAI Conference on Artificial Intelligence
[7] Y.I. Song, J. Liu, T. Sakai, X.J. Wang, G. Feng, Y. Cao, H. Suzuki, and
Địa chỉ URL 48.39 98.17 73.28 C.Y. Lin (2010), “Microsoft research asia with redmond at the ntcir-8
community QA pilot task”, Proceedings of NTCIR.
Tổng hợp 74.19 100.00 87.10
[8] F. Maxwell Harper, Daphne Raban, Sheizaf Rafaeli, and Joseph A.
Quan hệ người dùng 90.32 100.00 95.16 Konstan (2008), “Predictors of answer quality in online q&a sites”,
Proceedings of the twenty-sixth annual SIGCHI conference on Human
factors in computing systems, CHI ’08, pages 865– 874, New York, NY,
USA. ACM.
VI. KẾT LUẬN
[9] Chirag Shah and Jefferey Pomerantz (2010), “Evaluating and predicting
Trong bài báo này, một thủ tục dự đoán các câu trả lời giả answer quality in community QA”, Proceedings of the 33rd international
mạo trong các trang web hỏi đáp cộng đồng đưoạc đưa ra. Với ACM SIGIR conference on Research and development in information
retrieval, SIGIR ’10, pages 411–418, New York, NY, USA. ACM.
hai tập dữ liệu đánh nhãn bằng tay, đầu tiên thực hiện dự đoán
[10] Daisuke Ishikawa, Tetsuya Sakai, and Noriko Kando (2010), “Overview
các câu trả lời giả mạo dựa vào các thuộc tính về văn bản và of the NTCIR-8 Community QA”, Pilot Task (Part I): The Test
thành lập danh sách các người dùng độc hại dựa trên các đánh Collection and the Task, pages 421–432. Number Part I
giá của người dùng đối với các câu trả lời. Tiếp theo, xác định [11] Jiang Bian, Yandong Liu, Ding Zhou, Eugene Agichtein, and Hongyuan
các người dùng có với các người dùng độc hại trong danh Zha (2009), “Learning to recognize reliable users and content in social
sách. Cuối cùng, áp dụng quan hệ người dùng để phân loại các media with coupled mutual reinforcement”, Proceedings of the 18th
international conference on World wide web, WWW ’09, pages 51–60,
câu trả lời. Các thực nghiệm trên hai tập dữ liệu lấy từ Yahoo NY, USA. ACM
và Facebook cho thấy việc sử dụng quan hệ người dùng cải [12] P. Jurczyk and E. Agichtein (2007), “Discovering authorities in question
thiện đáng kể độ chính xác trong việc dự đoán câu trả lời giả answer communities by using link analysis”, Proceedings of the
mạo. sixteenth ACM CIKM conference, pages 919–922. ACM.
Độ chính xác của dự đoán câu trả lời giả mạo còn có thể [13] Jing Liu, Young-In Song, and Chin-Yew Lin (2011), “Competition-
cải thiện khi kết hợp thêm nhiều thuộc tính trong khi phân based user expertise score estimation”, Proceedings of the 34th
international ACM SIGIR conference on Research and development in
loại. Hơn nữa, việc dự đoán các chủ đề của hàng loạt câu hỏi Information Retrieval, pages 425–434, ACM.
giả mạo và phát hiện nhóm người dùng độc hại cũng là các [14] Lawrence Page, Sergey Brin, Rajeev Motwani, and Terry Winograd.
nhiệm vụ quan trọng trong tương lai. (1999), “The pagerank citation ranking: Bringing order to the web”,
Technical Report 1999-66, Stanford InfoLab, SIDL-WP-1999-0120.
[15] Gerard Salton and Michael J. McGill (1986), “Introduction to Modern
TÀI LIỆU THAM KHẢO Information Retrieval”, McGraw-Hill, Inc., New York, NY, USA.
[1] Jiwoon Jeon, W. Bruce Croft, and Joon Ho Lee (2005), “Finding similar [16] Franz Josef Och and Hermann Ney (2003), “A systematic comparison
questions in large question and answer archives” in Proceedings of the of various statistical alignment models”, Comput. Linguist., 29:19–51,
14th ACM CIKM conference, 05, pages 84–90, NY, USA. ACM March.
[2] Lada A. Adamic, Jun Zhang, Eytan Bakshy, and Mark S. Ackerman [17] David M. Blei, Andrew Y. Ng, and Michael I. Jordan (2003), “Latent
(2008), “Knowledge sharing and yahoo answers: everyone knows dirichlet allocation”, J. Mach. Learn. Res., 3:993–1022, March.
something”, Proceedings of the 17th international conference on World [18] Fangtao Li, Yang Gao, Shuchang Zhou, Xiance Si, and Decheng Dai
Wide Web, WWW ’08, pages 665–674, New York, NY, USA. ACM. (2013), “Deceptive Answer Prediction with User Preference Graph”,
[3] Yuanjie Liu, Shasha Li, Yunbo Cao, Chin-Yew Lin, Dingyi Han, and Proceedings of the 51st Annual Meeting of the Association for
Yong Yu (2008), “Understanding and summarizing answers in Computational Linguistics, pages 1723–1732, ACL.
community-based question answering services”, Proceedings of the
22nd International Conference on Computational Linguistics - Volume
292

Đánh Giá Trải Nghiệm Khách Hàng Sử Dụng

Dịch Vụ IPTV
Phan Thanh Vy Lê Tuấn Anh
Trung tâm Kỹ thuật Khu vực III Khoa Công nghệ Thông tin
Tổng Công ty Mạng lưới Viettel Trường Đại học Thủ Dầu Một
vyphanthanh@gmail.com letuanh@tdmu.edu.vn
Tóm tắt— Quality of Experence (QoE) là nhận xét chủ khách hàng để nhìn nhận chất lượng dịch vụ, chưa biết
quan của khách hàng về dịch vụ họ đang sử dụng. Việc tìm được độ hài lòng của khách hàng.
hiểu những yêu cầu ảnh hưởng đến chất lượng trải nghiệm
QoE IPTV là cơ sở đánh giá đầy đủ chất lượng dịch vụ Trong bài báo này, chúng tôi sẽ đi sâu vào phương
IPTV đang cung cấp. Trong bài báo này, chúng tôi trình pháp đo và đánh giá chất lượng IPTV đặc biệt là đánh
bày phương pháp mới để đánh giá độ trải nghiệm dịch vụ giá độ trải nghiệm dịch vụ truyền hình IPTV (QoE
truyền hình IPTV giúp nhà cung cấp dịch vụ IPTV hiểu IPTV) và trên cơ sở đó sẽ đề xuất phương pháp mới để
biết chính xác chất lượng dịch vụ đang cung cấp, và từ đó đánh giá QoE IPTV. Các kết quả thực nghiệm trên hệ
có phương án xử lý hợp lý góp phần nâng cao chất lượng thống IPTV tại Tập đoàn Viễn thông Quân đội Viettel đã
dịch vụ và làm tăng mức độ hài lòng của khách hàng khi cho thấy phương pháp đề xuất là phù hợp và tính chính
sử dụng dịch vụ. Qua kết quả thực nghiệm thu được đã xác khá cao.
chứng minh tính đúng đắn và hiệu quả của phương pháp
đề xuất. Phần còn lại của bài báo được cấu trúc như sau: Phần
II sẽ trình bày các nghiên cứu liên quan; Phương pháp đề
Từ khóa— QoE chất lượng trải nghiệm dịch vụ, QoS xuất đánh giá QoE IPTV tại đầu cuối khách hàng sẽ
chất lượng dịch vụ, IPTV dịch vụ truyền hình tương tác trên được trình bày chi tiết tại Phần III; Kết quả thực nghiệm
nền IP, Key Performance Indicator (KPI) chỉ số chất lượng và đánh giá được trình bày ở Phần IV; Kết luận sẽ được
chính yếu để đánh giá hiệu năng của hệ thống. trình bày trong Phần V.
I. GIỚI THIỆU II. CÁC NGHIÊN CỨU LIÊN QUAN
Tại Việt Nam truyền hình IPTV được rất nhiều nhà ITU-T G.1080 đề cập phương pháp đánh giá QoE
mạng lớn đang cung cấp, tuy nhiên việc đánh giá chất IPTV gồm hai phương pháp chính là đánh giá khách
lượng dịch vụ truyền hình này chỉ hạn chế ở việc đánh quan (Objective) tập trung vào việc phân tích ảnh hưởng
giá dựa vào những thông số Key Performance Indicator của các thành phần QoS đến QoE và phương pháp đánh
(KPI) về tình hình phản ánh của khách hàng. Tuy nhiên, giá chủ quan (Subjective) dựa vào những yếu tố mang
những thông số KPI chưa phản ánh được mức độ hài tính chủ quan như cảm xúc, giá cả và độ trải nghiệm
lòng của khách hàng khi trải nghiệm dịch vụ. dịch vụ [13] như trong Hình 1.
Xuất phát từ nhu cầu đó, việc nghiên cứu đo lường, QoE
đánh giá mức độ trải nghiệm dịch vụ truyền hình IPTV
Objective
và xây dựng công cụ để giám sát, đánh giá chất lượng Subjective
dịch vụ gần nhất với mức độ hài lòng của khách hàng là
một nhu cầu rất thiết thực và hứa hẹn sẽ mang lại một Quality of Human
hướng đi mới giúp nhà cung cấp dịch vụ truyền hình trả Services Components
tiền ở Việt Nam. Một công cụ như thế có thể phản ánh
được chính xác chất lượng dịch vụ nhà mạng đang cung
cấp, dự đoán được khả năng lỗi của hệ thống và từ đó có Services Transport Application
Emotions Pricing Experience
phương án xử lý hợp lý góp phần nâng cao chất lượng factors factors factors
dịch vụ và làm tăng mức độ hài lòng của khách hàng khi Hình 1. QoE IPTV theo ITU-T G.1080.
sử dụng dịch vụ.
Tuy nhiên, việc nghiên cứu đánh giá QoE IPTV hiện
Một số nghiên cứu gần đây về QoE IPTV chỉ tập nay đang tập trung nhiều vào đánh giá khách quan đến
trung vào nghiên cứu đánh giá chất lượng luồng video từ những khía cạnh của dịch vụ IPTV như: chất lượng
đó đánh giá QoE hoặc đưa ra mối liên quan giữa QoE luồng video và audio trên mạng, ảnh hưởng QoS của
với QoS trong mạng IPTV nhưng chưa đứng từ phía mạng lưới, có rất ít nghiên cứu đi vào đánh giá chủ quan

ISBN: 978-604-67-0635-9 293
dựa vào những yếu tố cảm xúc, giá cả, hay độ trải
nghiệm của khách hàng sử dụng.
Một mô hình tương quan giữa QoE và QoS được đề
cập trong [5] cho thấy được mối liên quan giữa QoE và
QoS và mức độ quan trọng của những tham số QoS
được lựa chọn. Một số biến thể gần đây như: Phương
pháp đánh giá QoE dựa trên các tham số QoS trong
IPTV [1] cho thấy mối liên quan giữa QoE và QoS mà
chưa đề cập đến phương pháp đo và chưa đứng ở góc độ
người sử dụng để đánh giá dịch vụ. Một biến thể khác
chỉ tập trung vào việc nghiên cứu ảnh hưởng của tham Hình 2. QoE IPTV theo Control funtion & EPG (theo ITU-T
số QoS là Packet loss đến QoE [2]. G.1080).
Một mô hình khác được sử dụng để đánh giá QoE là Nội dung chính của phương pháp được đề xuất gồm
sủ dụng mạng neural. Chẳng hạn, H.EL Khattabi và các bước như sau:
đồng sự đã trình bày dự đoán được kết quả chất lượng - Xác định những yếu tố chính (K1, K2,…, Kn) ảnh
video theo điểm số Mean Opinion Score (MOS) cho hưởng đến trải nghiệm của khách hàng sử dụng
mạng LTE sử dụng mạng neural [7]. Liu Jing và đồng sự IPTV. Những yếu tố này là những tiêu chí chất lượng
cũng cho thấy được khả năng ứng dụng của mạng neural
chính ảnh hưởng lớn đến QoE IPTV được khuyến
nhân tạo để giải quyết bài toán dự đoán chất lượng trải
nghị bởi ITU-T G.1080. Trong nghiên cứu này,
nghiệm QoE [6].
chúng tôi sử dụng 8 yếu tố (n = 8, chi tiết trong Phụ
III. PHƯƠNG PHÁP ĐỀ XUẤT lục A).
- Khảo sát đánh giá cảm nhận chủ quan khả năng trải
Với yêu cầu cải thiện chất lượng dịch vụ phục vụ
khách hàng, nâng cao chất lượng mạng lưới, nhiều nhà nghiệm dịch vụ của khách hàng sử dụng theo điểm
cung cấp dịch vụ đã đầu tư chi phí khá lớn để nâng cao số MOS. Thu thập kết quả đánh giá chủ quan theo
chất lượng QoS cho toàn mạng lưới thông qua nhiều tiêu điểm MOS từ phía khách hàng sử dụng theo những
chí chất lượng. trải nghiệm dựa vào những yếu tố (K1, K2,…, Kn)
đưa ra theo “Phiếu khảo sát đánh giá trải nghiệm dịch
Những tiêu chí chất lượng đó được thể hiện rõ ràng vụ IPTV” Phụ lục A.
qua chỉ tiêu KPI của toàn mạng lưới được đo kiểm, giám - Thiết kế mạng neural để dự đoán kết quả của khách
sát thường xuyên. Chính vì thế, độ hài lòng của khách hàng sử dụng IPTV Viettel quy đổi ra thang điểm
hàng không còn phụ thuộc nhiều vào QoS mà phụ thuộc MOS. Từ những yếu tố thu thập sẽ được đưa vào
lớn vào sự trải nghiệm thông qua những tiện ích mang
mạng neural xử lý để cho ra kết quả đánh giá là điểm
tính tương tác giữa hệ thống với người sử dụng. Vì vậy,
đánh giá độ trải nghiệm dịch vụ của người dùng IPTV số MOS có giá trì từ 1 đến 5 tương ứng với đánh giá
thông qua khả năng đáp ứng, và thời gian tương tác giữa chất lượng từ “Kém” đến “Xuất sắc” như trong Hình
người sử dụng với hệ thống là một vấn đề rất mới, cần 3.
thiết cho việc đánh giá độ hài lòng của khách hàng sử
dụng dịch vụ IPTV. Do đó, đánh giá QoE IPTV nên xuất
phát từ ý kiến chủ quan của khách hàng (phần màu đỏ
trong Hình 1).
Làm cách nào để có thể hiểu biết được chính xác
được cảm nhận của chính khách hàng sử dụng là vấn đề
thực sự cần thiết. Xuất phát từ nhu cầu đó, tác giả đề
xuất phương pháp đánh giá QoE IPTV theo độ trải
nghiệm từ những yếu tố thu thập được bằng cách đo tính
tương tác của thao tác điều khiển (Control function) và
Hình III. Mô hình mạng neural đề xuất đánh giá QoE IPTV.
khả năng tương tác EPG tại phía đầu cuối khách hàng
kết hợp với ứng dụng mạng neural nhân tạo để đưa ra
kết quả đánh giá trải nghiệm khi sử dụng dịch vụ truyền IV. THỰC NGHIỆM VÀ ĐÁNH GIÁ
hình IPTV như trong phần đóng khung trong Hình 2. a) Mô hình đề xuất
Chúng tôi đề xuất mô hình thực nghiệm để đánh giá
QoE IPTV theo mô hình sau:

294
xu thế chuyển dịch của công nghệ giám sát mạng lưới
theo nhận định của Gartner.
Bên cạnh đó, ứng dụng được triển khai giúp tăng tính
chủ động của nhà mạng, giúp nhà mạng có khả năng
nhìn thấy chất lượng từng cá nhân trong cả một đám
đông hàng triệu, hàng chục triệu khách hàng để giám sát
chất lượng tới mức thiết bị đầu cuối từng khách hàng,
từng dịch vụ mà khách hàng sử dụng.
Hình III. Mô hình ứng dụng thiết kế để đánh giá QoE IPTV.
Set Top Box (STB) của người dùng sinh ra log file
và được lưu trong server lưu trữ. Chúng tôi xây dựng
một công cụ phần mềm thực hiện phân tích log file của
mỗi STB thành những yếu tố cần thiết ( K1, K2, …, K8),
và sau đó sử dụng mạng neural đã được huấn luyện
trước để đánh giá cho ra kết quả QoE dựa vào những yếu
tố đầu vào được phân tích ra từ log file.
b) Đánh giá kết quả thực nghiệm
Dữ liệu thu thập được 80 mẫu, trong quá trình khảo
sát tác giả nhận thấy một số phiếu đánh giá không đạt
những tiêu chuẩn mà nghiên cứu đề ra, tỉ lệ này chiếm
khoảng 5% mẫu khảo sát. Đồng thời theo nguyên tắc
thống kê chọn mẫu, tỉ lệ mẫu khảo sát không đạt tiêu
chuẩn xoay quanh mức 5% vì vậy sau khi kiểm tra, tác
giả loại bỏ đi 5% những giá trị mang tính cực đoan. 95% Hình 5. Kết quả thực nghiệm mô phỏng độ chính xác của
kết quả còn lại sẽ thực hiện 70% cho việc training và ứng dụng theo tỉ lệ chính xác R
25% cho việc kiểm tra và đánh giá.
Kết quả thực nghiệm được trình bày trong Hình 5.
[1] Vũ Minh Khánh (2013), Nghiên cứu phương pháp đánh giá QoE
Độ chính xác của quá trình huấn luyện (trainning) hơn dựa trên các tham số QoS, Học viện Công nghệ Bưu chính Viễn
90% cho thấy quá trình huấn luyện có độ chính xác rất thông, Hà Nội.
lớn, đáp ứng được mục tiêu của quá trình huấn luyện. [2] Hoàng Quang Khải (2014), Nghiên cứu phương pháp đánh giá
Kết quả quá trình kiểm tra (validation) là hơn 91% cho chất lượng trải nghiệm QoE trong mạng IPTV, Học viện Công
thấy được tính chính xác của bài toán cũng khá cao, phù nghệ Bưu chính Viễn thông, Hà Nội.
hợp với yêu cầu. Kết quả tổng hợp của ứng dụng với [3] Vụ Khoa học và Công nghệ (2014). QCVN 84:2014/BTTTT
mức độ chính xác trên 85% (All) là khá cao, hoàn toàn Quy chuẩn chất lượng Quốc gia về chất lượng dịch vụ IPTV trên
phù hợp với yêu cầu mà tác giả đặt ra. mạng viễn thông công cộng cố định, Bộ Thông tin và Truyền
thông, Hà Nội, 12 trang.
[4] T. Ghalut, H. Larijani, A. Shahrabi (2013), “Video Quality
V. KẾT LUẬN Prediction over LTE Using Random Neural Networks”, HET-
NET 2013 Working Conference.
Với phương pháp đề xuất và kết quả thực nghiệm.
Tác giả nhận định, đây là một phương pháp mới để đánh [5] Hyun Jong Kim, Ki Seong Cho, Hwa Suk Kim, Seong Gon Choi
(2010), “A Study on a QoS/QoE Correlation Model for QoE
giá chất lượng dịch vụ, nó giúp nhà mạng có cái nhìn Evaluation on IPTV Service”, Advanced Communication
mới hơn về chất lượng dịch vụ. Thông qua việc thu thập Technology (ICACT), 2, p.1377 – 1382.
đánh giá từ khách hàng sử dụng, nhà mạng có được [6] Liu Jing, Sunyoung Han, Li Xuan, Han Li and Sungchol Cho
thông tin phản hồi chính xác từ người dùng trực tiếp, (2014), “An Effective Quality of Experience Measurement and
biết thêm về nhu cầu khách hàng của mình từ đó có thể Calculation Method for IPTV Service”, International Journal of
nắm bắt được nhu cầu để phục vụ khách hàng tốt hơn Future Generation Communication and Networking, 7(3), p.141-
154.
giúp nâng cao uy tín, năng lực cạnh tranh của doanh
[7] H.EL Khattabi, A. Tamtaoui, D. Aboutajdine (2011), “Video
nghiệp. Quality assessment Measure with Neural Network”,
Phương pháp đề xuất cũng mở ra cách nhìn mới hơn International Scholarly and Scientific Research & Innovation,
5(3).
về giám sát dịch vụ theo hướng cá thể hóa phù hợp với
[8] R. ruzgiene, L. Narbutaite, T. Adomkus, R. Cibulskis (2013),
“Subjective and Objective MOS Evaluation of User’s Perceived

295
Quality Assessment for IPTV Service: a Study of the Là thời gian từ lúc sử dụng remote di chuyển giữa
Experimental Investigations”, ELEKTRONIKA IR các Tab và Thể loại trong menu “Phim Truyện” đến khi
ELEKTROTECHNIKA, 19(7).
nội dung hiển thị đầy đủ trên màn hình.
[9] Akira Takahashi (2009), “Framework and Standardization of
Quality of Experience (QoE) Design and Management for (K5) Thời gian yêu cầu dịch vụ ca nhạc
Audiovisual Communication Services” NTT Technical Review,
7(4). Thời gian yêu cầu dịch vụ ca nhạc được tính từ khi
[10] Kira Takahash (2007), Applications of objectives quality thao tác nút điều khiển vào menu “Ca nhạc” cho đến khi
assessment models in IPTV, ETSI, Japan. toàn bộ chương trình hiện lên đầy đủ.
[11] Agilent Technologies (2008). MDI measurement in the IPTV
Understanding and interpreting MDI value, 5 pages. (K6) Music navigation
[12] DSL Forum (2006). Triple play service Quality of
Experience(QoE) Requirements and Mechanism.
Là thời gian từ lúc sử dụng remote di chuyển giữa
các Tab và các thể loại trong menu “Ca nhạc” đến khi
[13] International Telecommunication Union (2008).
Recommendation ITU-T G.1080 Quality of experience nội dung được hiển thị đầy đủ trên màn hình.
requirements for IPTV services.
(K7) Thời gian yêu cầu dịch vụ TVoD
[14] International Telecommunication Union (2008).
Recommendation ITU-T G.1081 Performance monitoring points Thời gian yêu cầu dịch vụ TVoD được tính từ khi
for IPTV. thao tác nút điều khiển vào menu “TV xem lại” cho đến
[15] Tech Mahindra Pune (2010). IPTV End-to-End Performance khi toàn bộ chương trình hiển thị đầy đủ.
Monitoring, India, 13 pages.
[16] http://ictpress.vn/Tri-thuc-chuyen-nganh/Vien-thong/Tu-QoS- (K8) Tính thân thiện của giao diện EPG
den-QoE-Van-de-can-quan-tam-khi-cung-cap-cac-dich-vu-vien-
th, truy cập 21 tháng 4 năm 2015. Giao diện hiển thị trên màn hình rõ ràng, dễ hiểu,
[17] http://www.ntt.co.jp/qos/qoe/eng/technology/visual/01_5_1.html thuận tiện cho người sử dụng.
, truy cập ngày 25 tháng 4 năm 2015.
Sau khi thực hiện những thao tác đã hướng dẫn như
[18] https://takinginitiative.wordpress.com/2008/04/03/basic-neural-
network-tutorial-theory/, truy cập ngày 21 tháng 6 năm 2015.
trên, anh/chị có nhận xét gì về thời gian đáp ứng của hệ
thống theo những tiêu chí đã nêu ở trên và cho điểm
PHỤ LỤC A đánh giá từ 1 đến 5 tương ứng với mức độ hài lòng từ
Phiếu Khảo Sát Đánh Giá Trải Nghiệm Dịch Vụ IPTV
“Kém” đến”Xuất sắc”
Xuất sắc 5
Với mục đích nâng cao chất lượng, đáp ứng mức độ
hài lòng khi sử dụng dịch vụ, đặc biệt mức độ trải
nghiệm dịch vụ truyền hình tương tác NextTV, chúng tôi Tốt 4
tiến hành khảo sát mức độ hài lòng của quý khách hàng
với những tiêu chí chính sau: Trung bình 3
(K1) Thời gian chuyển kênh
Tạm chấp nhận
Thời gian chuyển kênh là khoảng thời gian tính từ 2
lúc bấm nút chuyển kênh hoặc chọn kênh mới trên điều
khiển tới khi kênh mới bắt đầu hiển thị trên Tivi. Kém 1
Điểm đánh giá:
Bấm số để chọn một kênh bất kỳ trên remote.
Bấm phím CH + hoạc CH- hoặc up/down để chuyển
đổi giữa các kênh.
(K2) Thời gian vào MENU chương trình
Thời gian di chuyển vào Menu được xác định từ lúc
bấm chọn phím “MENU“ trên điều khiển cho đến khi
màn hình Tivi hiển thị các Menu dịch vụ(Ca nhạc/Phim
truyện/Thiếu nhi/TV xem lại/ Bạn cần biết).
(K3) Thời gian yêu cầu nội dung phim
Thời gian yêu cầu nội dung phim được xác định từ
lúc thao tác chọn Menu “Phim Truyện” trên màn hình
đến khi màn hình hiển thị đầy đủ danh sách các phim để
lựa chọn.
(K4) VoD Navigation

296
THUẬT TOÁN XỬ LÝ KHÔNG GIAN

THÍCH NGHI
CÁC TÍN HIỆU Ở MẠNG ANTEN SỐ
Lê Ngọc Uyên và Nguyễn Trung Thành
Viện Ra đa,
Viện Khoa học và Công Nghệ Quân sự/ Bộ Quốc phòng
Email: uyenvrd2006@gmail.com, ntt7680@gmail.com.

Abstract— Để giải quyết hiệu quả bài toán phát hiện mục thu được số hoá trực tiếp ở ngay đầu ra của từng phần tử
tiêu của đài radar trong điều kiện nhiễu và mục tiêu phức tạp anten. Sơ đồ cấu trúc đơn giản phần thu của loại ra đa mô tả ở
cần phải sử dụng hiệu quả hơn sự khác biệt trong cấu trúc các hình 1. Trong đó tất cả có 2n+1 phần tử anten
tín hiệu thu ở các mốc không gian và thời gian. Trong mối
quan hệ này thì mạng anten số có một loạt những ưu điểm, cho an ,..., a0 ,....an với giản đồ đẳng hướng tạo nên hệ tương tự
phép thay đổi theo chương trình hay thích nghi hình dạng và biến đổi trường điện từ ở đầu vào mạng anten thành tín hiệu
định hướng không gian của Giản đồ hướng mạng anten tương vô tuyến ở tần số mang của các modul thu thực hiện bài toán
ứng với tình huống radar xảy ra. Những khả năng của mạng khuếch đại, biến đổi tần số và lọc tín hiệu cao tần không phụ
anten số cho phép giải quyết có hiệu quả tối ưu hoá xử lý
thuộc vào từng kênh phần tử thu. Tương ứng với các tham số
không gian - thời gian các tín hiệu trong điều kiện bất định tiền
định về cấu trúc và tham số phản xạ nhiễu. tin tức của tín hiệu (biên, tần, pha) kênh thu là phần tử tuyến
Keywords- Mạng anten số, xử lý không gian thích nghi, Tín tính. Các tín hiệu đầu ra kênh thu biến đổi thành dạng số trực
hiệu trực giao, Tổng hợp giản đồ hướng. tiếp ở trung tần hay ở các kênh cầu phương khi sử dụng tách
pha cầu phương. Các tín hiệu số song song đưa tới đầu vào tổ
I. ĐẶT VẤN ĐỀ hợp tính toán số (máy tính chuyên dụng) thực hiện các bài
Ở các đài ra đa hiện đại sử dụng những phương pháp số, toán xử lý tín hiệu nhận được nhờ các nhóm phần tử trong
phương tiện số, đã vượt ra ngoài những giới hạn giải quyết mạng an ten.
những bài toán xử lý tin tức. Khuynh hướng ứng dụng các
phương pháp số tạo các tín hiệu thăm dò (phát) cho phép mở
rộng đáng kể khả năng tin tức của đài Rađa như các nguồn tin
tức đa chức năng. Phương pháp số với những kết quả sử dụng
để giải quyết các bài toán tạo các tia, điều khiển giản đồ hướng
anten chỉnh sự méo của phương pháp pha. Với phương pháp
số điều khiển phương pháp pha có thể xây dựng hệ thống
chỉnh sửa sai số có hiệu quả khi bức xạ theo vị trí góc của giản
đồ hướng. Đồng thời tạo và điều khiển giản đồ hướng của
mạng anten nhất thiết lập pha của các phần tử, nói chung là nó
liên quan đến tổn hao năng lượng. Kết quả là, những khả năng
tạo các tia có hình dạng theo yêu cầu sẽ hạn chế. Đồng thời
cũng hạn chế khả năng tạo đồng thời nhiều tia, tức giản đồ
hướng nhiều tia. Vì vậy, trong tương lai, tiện lợi hơn cả là tạo
tia bằng phương pháp số các tia giản đồ hướng ở thị tần và tạo
phát đặc trưng không gian của an ten nhờ cộng trọng lượng
các tín hiệu đầu ra phức từ từng phần tử (nhóm phần tử) của
mạng anten đã được biến đổi về dạng số. Tiếp đó, việc cân
nhắc trọng lượng và cộng có thể thực hiện nhờ các thiết bị số, Hình 1. Sơ đồ cấu trúc đơn giản tuyến thu radar với mạng anten
thay vì các khối cao tần tương tự. Khi đó ta có mạng anten số. số
Nghiên cứu lý thuyết và kĩ thuật sử dụng các phương pháp Ra đa với mạng anten số so sánh với Ra đa có anten mạng
số tạo và điều khiển giản đồ hướng của mạng anten phát, thu pha có những ưu điểm sau:
là một trong những hướng phát triển của tương lai. - Không bị mất mát do xoay pha.
Phương pháp số và kĩ thuật tính toán trong rađa có thể tiếp - Không bị hạn chế về sử dụng các phương pháp xử lý số
cận từng bước tới Ra đa bằng mạng an ten số, trong đó tín hiệu đặc biệt với tín hiệu thu và dữ liệu Ra đa.
ISBN: 978-604-67-0635-9 297

- Xuất hiện khả năng tạo nhiều tia điều khiển không phụ trữ của các phương pháp được ứng dụng cũng như các thuật
thuộc với giản đồ hướng của an ten. toán xử lý tin tức và điều khiển, đảm bảo nâng cao được hiệu
Để giải quyết hiệu quả bài toán Ra đa hiện đại, ưu điểm sau suất về tổng thê. Đồng thời khi số hoá các tín hiệu thu được ở
cùng là quyết định. Khi đó thực hiện bằng phương pháp số tất đầu ra từng cụm mạng anten để tạo giản đồ hướng và xử lý các
cả các chức năng chính hoạt động của Rađa là cơ bản, trong tín hiệu (đặc biệt là xử lý không gian) yêu cầu thiết bị tính
quá trình thu các tín hiệu phản xạ hay bức xạ từ các đối tượng toán tốc độ rất cao. Chính vì vậy, khi tạo giản đồ hướng mạng
khác: Tạo giản đồ hướng nhiều tia của mạng anten (Mạng anten số khi thu thường dẫn đến hợp nhất các phần tử thu của
anten), điều khiển giản đồ hướng mạng anten, xử lí các tín mạng thành mạng con (modul), bên trong chúng là hợp nhất
hiệu thu và các dữ liệu Ra đa, thích nghi với sự thay đổi môi các tín hiệu thu (tạo giản đồ hướng của các modul) thực hiện
trường ngoài. nhờ các thiết bị tương tự, sau đó tín hiệu đầu ra của mạng con
Sử dụng kĩ thuật tính toán số ở tất các bước thu thập, xử lí biến đổi thành dạng số và tất cả các bước xử lý tiếp theo là
tin tức Ra đa, ngoài những ưu việt liên quan đến những đặc thực hiện trên số. Số các phần tử bức xạ liên kết thành mạng
trưng kĩ thuật (ổn định các tham số, tin cậy và đơn giản trong con theo thiết kế cụ thể và tương ứng với tài nguyên tính toán
chuyển chương trình…) đảm bảo mở rộng chức năng tăng đặc cụ thể. Lưu ý rằng, các modul càng lớn trong mạng thu số thì
trưng chất lượng nhờ: điều khiển chức năng càng phức tạp, càng bị tiêu hao theo hiệu
- Mở rộng phạm vi các bài toán cần giải quyết, ứng dụng suất điều khiển so với mạng anten số hoá các tín hiệu đầu ra
các phương pháp và thuật toán hiện đại do sử dụng những của từng phần xử lý bức xạ.
thành quả mới. Tính toán những điều kiện ban đầu đã nêu và trên cơ sở
- Ứng dụng cấu trúc thích nghi đảm bảo giải quyết có hiệu phân tích những kết quả nghiên cứu thiết kế đã biết sơ đồ cấu
quả những bài toán Rađa trong điều kiện phức tạp thay đổi trúc sơ bộ của rađa đa chức năng với modul mạng anten và tạo
nhanh. số giản đồ hướng khi thu, hình 2.
Sơ đồ thể hiện ở Hình 1 liên kết các kênh thu Rađa với
mạng anten và máy tính chuyên dụng, về thực chất là sơ đồ
tính toán dạng chuyên dụng để giải quyết các bài toán cơ bản
thu, xử lí tin tức Ra đa - đó là hệ thời gian thực gồm tất cả
phương tiện tính toán thời gian thực được thực hiện những
thuật toán tổng thể vận hành hệ thống. Thuật toán tổng thể hệ
thống gồm giải quyết những bài toán rời rạc, lượng tử tín hiệu,
xử lý không gian các tín hiệu, cắt nhiễu tiêu cực, tích luỹ tín
hiệu, phát hiện, ước lượng toạ độ, nhận dạng, bám và hàng
loạt những tính toán khác về mục tiêu. Những kết qủa tính
toán ở rất nhiều nguồn tài liệu chỉ ra rằng để thực hiện những
thuật toán cơ bản trong xử lí số các tín hiệu cần sự tác động
nhanh của hệ tính toán.
Rađa đa chức năng có loại là hệ thống với mạng anten cố
định, cho phép thực hiện quét diện tia theo hai toạ độ: phương
vị β, góc tà ε. Để quét 3600 theo góc phương vị thường là liên
kết 4-5 bộ mạng anten. Khi đó hoàn toàn loại bỏ việc quay
anten và không còn hạn chế nhịp độ quét không gian và bám
mục tiêu trong điều kiện nhiễu phức tạp, song kích thước, tính
Hình 2. Sơ đồ cấu trúc sơ bộ của rađa đa chức năng với modul
phức tạp, giá thành cũng cao với công nghệ cũ.
mạng anten và tạo số giản đồ hướng khi thu
Những khả năng về kĩ thuật tính toán số và những khả
năng của các hệ thống điều khiển tối ưu cho phép ngày nay tạo Thành phần của sơ đồ gồm các hệ thống con cơ bản:
được cách xay dựng đài rađa đa chức năng hỗn hợp về nguyên 1. Phần tạo và điều khiển giản đồ hướng mạng anten
tắc, thực hiện chế độ quay anten và quét điện giản đồ hướng. một tia phát, trong thành phần của hệ này gồm các khối tạo và
khi đó sử dụng mạng anten phẳng duy nhất đảm bảo quét điện phân chia các tín hiệu phát, bộ xử lý điều khiển tia giản đồ
theo phương vị và góc tà đồng thời với quay mạng anten theo hướng của anten, các mặt điều khiển các cum Mҥng anten và
phương vị như chuyển động cơ. Đài sẽ có chỉ số chất lượng hệ thống các bộ dịch pha điều khiển ở đầu vào từng bộ bức xạ
cao hơn, song kích thước và giá thành cũng cao. phát.
Tiếp tục phát triển, tính đến yếu tố những phép toán cơ bản 2. Phần tạo các mạng con, khuếch đại, dao dộng tương
tạo giản đồ hướng phát và thu, xử lý tin tức và phân bố tại can, tạo số các tín hiệu ở đầu ra mođul mạng anten. Trong
nguyên thời gian, năng lượng ở rađa đa chức năng với mạng thành phần của các hệ này gòm các bộ cộng, các mođul thu
anten cố định và mạng anten quay không có khác biệt về thực gồm khuếch đại cao tần, biến đổi tần số, khuếch đại trung tần,
chất khi xem xét các phương pháp các thuật toán các bài toán tách pha và biến đổi số các thành phần cầu phương các tín
này, đề xuất rađa đa chức năng với mạng anten cố định. hiệu thu của các hệ thống con.
Như đã lưu ý, sử dụng các phương pháp số tạo giản đồ 3. Phân hệ tạo số và điều khiển giản đồ hướng mạng
hướng mạng anten khi thu, cho phép mở rộng đáng kể tính dự anten khi thu thực hiện ở dạng khối số riêng biệt. Phân hệ này
298

liên quan trực tiếp và theo kênh hồi dẫn với khối xử lý không 'f AP - Giải thông mạng anten.
gian thích nghi các tín hiệu được nối khi tác động nhiễu tạp
Việc xử lý không gian - thời gian tối ưu các tín hiệu trong
tích cực.
trường hợp này dẫn đến cộng các dao động thu vector trọng
4. Phân hệ xử lý số các tín hiệu ra đa thu được gồm
lượng được tìm từ quan hệ:
điều khiển thích nghi như là hệ xử lý, cũng như dưa tin cho
người dùng tin. Phân hệ này được thực hiện nhờ các hệ tính 1 f
2 ³f
R W(s,T )G (t - s)ds X(t)X(T ) (6)
toán số chuyên dụng và đặc biệt (bộ vi xử lý).
ở đây: W(s,T ) - Vector hệ số trọng lượng
II. LẬP LUẬN BÀI TOÁN, MÔ HÌNH
CÁC TÍN HIỆU VÀ NHIỄU Theo tính chất lọc của hàm delta, từ (6) sẽ có:
W(s,T ) 2R -1 X (T ) X (t ) W(T )W(t) (7)
Xem xét bài toán xử lý không gian tối ưu, chính xác hoá
ở đây: W(T ) R X (T ) ; W(t) 2X(t)
-1
mô hình tín hiệu và nhiễu ở đầu ra mạng anten số.[1]
Tổng tích phân trọng lượng (tín hiệu ra) khi xử lý không
Tín hiệu có ích ở dạng : X (t , T ) X (t ) X (T ) (1)
gian - thời gian tối ưu dưới dạng:
X(t)- đại lượng vô hướng mô tả luật thay đổi theo thời gian f f
biên độ phức các dao động tín hiệu chung các phần tử mạng 1 1 T
2 ³f 2 ³f
z Y T (t ) W* (t , T )dt Y (t ) W* (T ) W* (t )dt
anten.
Vector X (T ) - phân bố biên độ - pha tín hiệu ở mặt mở (8)
mạng anten, phụ thuộc vào dạng gần đúng của sóng (cầu, Tách từ (8) tổng trọng lượng xử lý không gian:
phẳng) và các tham số của môi trường truyền sóng. N
Với các sóng phẳng Y (t ) Y (t ) W (T )
¦
T *
¦ Y (t )W (T )
i
*
(9)
X (T ) X i (T ) exp( jTi ) chỉ phụ thuộc vào i 1
Khi đó (8) dẫn đến dạng
hướng tới của tín hiệu Ti . 1
f f
³ Y (t ) W* (t )dt ³ Y¦ (t )X (t )dt
*
Nhiễu được giả thiết là quá trình ngẫu nhiên dừng và tạo Z (10)
bởi các nguồn không tương quan lẫn nhau. Vector cột của 2 f ¦ f
những biên độ phức điện áp nhiễu và nội tạp ở đầu ra các phần Vì vậy, xử lý không gian - thời gian được chia ra không
tử anten thể hiện dưới dạng: gian và thời gian (9) thực hiện bởi cộng trọng lượng các biên
n
độ phức dao động Yi (t ) thu được nhờ các phần tử của mạng
N (t ) N 0 (t ) ¦ X (Q J ) N J (t ) (2)
anten với các hệ số trọng lượng phức Wi (T ) được đưa vào
*
J 1
N 0 (t ) - Vector cột những biên độ phức điện áp nội tạp theo kênh thu.
Xử lý thời gian dẫn đến việc tính toán tích phân tương
X (Q J ) X i (Q J ) - Vector cột phân bố biên độ - pha quan phức, phương pháp lọc - tương quan.
Sơ đồ cấu trúc đơn giản phép xử lý không gian - thời gian
các tín hiệu nhiễu nguồn J phần tử thứ i của mạng anten.
tối ưu các tín hiệu ở radar đa chức năng mô tả ở hình 1.
NJ (t ) - Biên độ phức điện áp nhiễu nguồn C. Xử lý không gian theo hình 1 thực hiện bằng cách cộng
Theo giả thiết sự đúng đắn của mô hình tạp trắng cho nội tương can trọng lượng theo kênh các tín hiệu ở đầu ra các
tạp và nhiễu ngoài, ma trận tương quan của nhiễu tổng R(t,s) phần tử mạng anten và dẫn đến tạo giản đồ hướng khi thu.
xác định bằng biểu thức. Xử lý thời gian thực hiện bởi bộ lọc phối hợp (LPH), bộ
R(s, t ) >
M N (t ).N *T (s) / 2 @ RG (t s) (3)
thích luỹ tương can hay không tương can và tách biên độ. Dữ
liệu đầu vào của xử lý không gian - thời gian đưa đến đầu vào
n thiết bị điều khiển (PY), thực hiện bài toán toán phát hiện các
Ở đây : R R0 ¦ N J X (Q J ) X *T (Q J ) (4) tín hiệu và ước lượng toạ độ các điểm dấu phát hiện.
J 1 Vì vậy, để xây dựng sơ đồ xử lý không gian có tín hiệu ở
R0 - ma trận chéo ( M u M ) của mật độ công suất phổ mạng anten cần biết vector trọng lượng W(T ) hay ma trận
nội tạp của các kênh thu. 1
tương quan đảo R , biểu diễn nó (7). Khi đó trong điều kiện
N J - Mật độ công suất phổ nhiễu từ nguồn J . bất định về hướng tác động và cường độ nhiễu, các đại lượng
này cần phải ước lượng trên cơ sở hoàn cảnh nhiễu xảy ra.
Giả thiết thoả mãn điều kiện:
'f p 'fJ 'f AP (5) III. MẠNG ANTEN THÍCH NGHI, NGUYÊNTẮC XÂY
DỰNG VÀ HOẠT ĐỘNG
ở đây: 'f p - giải thông thiết bị xử lý
Trong những điều kiện hoàn cảnh bên ngoài thay đổi đa
'f J - Độ rộng hiệu dụng phổ năng lượng tín hiệu dạng và ngẫu nhiên do bức xạ nhiễu (nhiễu tích cực), Để đảm
nhiễu.
299

bảo yêu cầu hiệu quả về phát hiện và bám các đối tượng trên Xo(t). Vì vậy nhờ tín hiệu chuẩn Xo(t) có thể phân biệt được
không, mạng anten thích nghi được sử dụng rông rãi. đâu là tín hiệu có ích và nhiễu, đảm bảo việc tạo giản đồ
hướng của mạng anten với vùng lõm ở hướng nguồn nhiễu.
[2,3]
Để khắc phục những khó khăn đã thấy để thực hiện mạng
anten số hoàn toàn thích nghi, có ít nhất là 2 phương pháp:
Thứ nhất là là chuyển tiếp đến thích nghi những Modul
mạng anten số, trong đó đầu tiên là tích luỹ tương tự các tín
hiệu ở các nhóm những phân tử mạng anten, từ đó lọc thích
nghi số các tín hiệu đầu ra của các Modul theo sơ đồ hình 4.
Khi đó tín hiệu đầu ra nhận được rõ ràng là không trùng với
những tín hiệu đầu ra của mạng thích nghi toàn phần, những
kết quả tương ứng có thể xem là tự thích nghi.
Hình 3. Sơ đồ cấu trúc đơn giản phép xử lý không gian - thời Một phương pháp khác được sử dụng rộng rãi trong thực tế
gian tối ưu các tín hiệu ở radar đa chức năng là thiết kế mạng anten số (mạng anten số thích nghi). Trong
đó để thích nghi chỉ sử dụng một phần các phần tử (mạng xây
Mạng anten gọi là thích nghi, trong đó hiệu suất hoạt động dựng theo Modul hoặc không theo Modul), những mạng này
phải là cực đại theo tiêu chuẩn định trước, khi điều kiện bên gọi là thích nghi cục bộ. Sơ đồ cấu trúc đơn giản của thích
ngoài thay đổi đảm bảo việc hiệu chỉnh liên tục hình dạng nghi cục bộ tuyến tính với kênh chính tách biệt sử dụng để
Giản đồ hướng của chúng trên cơ sở phân tích môi trường thích nghi M trong N các phần tử của mạng anten thể hiện ở
ngoài và điều kiện hoạt động của đài rađa. hình 5.
Sơ đồ cẩu trúc của mạng anten thích nghi tuyến tính tạo
giản đồ hướng bằng phương pháp số (mạng này được gọi là
mạng anten số thích nghi) trình bày ở hình 4. Phần tử cơ bản
của nó là bộ lọc số thích nghi để tạo các hệ số w1 ,..., wM ,
xem xét trọng lượng của các tín hiệu mạng anten được biến
đổi sơ bộ về dạng số ở các modul thu tương tự số.
Ở các bộ lọc này tín hiệu chuẩn đã biết Xo(t) thích nghi với
mạng anten, tức tín hiệu đầu ra của mạng U 6 (t) được so sánh
với nó. Khi đó tín hiệu sai lệch được tạo ra.
H (t ) Xo(t) + U 6 (t)
Hình 5. Sơ đồ cấu trúc đơn giản của thích nghi cục bộ tuyến
tính với kênh chính tách biệt sử dụng để thích nghi M trong N các
phần tử của mạng anten
Nguyên tắc tạo Giản đồ hướng tổng hợp ở mạng anten

thích nghi tuyến tính với 2 kênh bù khử thể hiện ở hình 6, ở
đây Fo( T ) là Giản đồ hướng kênh chính, F1( T ), F2( T ) là
Giản đồ hướng các kênh bù khử, F*( T ) là Giản đồ hướng tổng
khi có tác động 2 nguồn nhiễu từ các hướng T 1, T 2.
Hình 4. Sơ đồ cẩu trúc của mạng anten thích nghi tuyến tính tạo
Fo* (T ) Fo (T )
giản đồ hướng bằng phương pháp số
Dùng bộ lọc thích nghi để tính toán và điều khiển các hệ số

trọng lượng phức Wm (m=1,2,3...M) tương ứng với các tiêu
chuẩn tối ưu được chọn. Khi đó tín hiệu thu bất kỳ (không có FK1 (T ) FK 2 (T )
trong Xo(t)), coi như tín hiệu nhiễu và hệ thống điều chỉnh các
hệ số trọng lượng sao cho loại trừ nó khỏi tín hiệu đầu ra. Kết T0 T1 T 2 T
quả là ở hướng có tín hiệu này thiết lập giản đồ hướng của
mạng anten là 0. Nếu tín hiệu thu có thể hiện trong Xo(t), hệ Hình 6. Giản đồ hướng tổng hợp ở mạng anten thích nghi tuyến
tính với 2 kênh bù khử
thống giữ nó ở tín hiệu đầu ra với biên độ và pha giống như ở
300

IV. TỐI ƯU HÓA XỬ LÝ KHÔNG GIAN CÁC TÍN HIỆU

M (Y1* >K @X 0 >K @
TRONG MẠNG ANTEN THÍCH NGHI, PHƯƠNG PHÁP
THỐNG KÊ M (Y2* >K @X 0 >K @
RM = = M(Y* [K]X0 [K]) – Vector các
Nhiệm vụ chính của bộ lọc thích nghi ở mạng anten là ........................
điều chỉnh liên tục các hệ số trọng lượng W, đảm bảo tối ưu
hoá tiêu chuẩn xác định của hiệu suất xử lý không gian các tín M (YM* >K @X 0 >K @
hiệu. Tiêu chuẩn hiệu suất xác định thuật toán làm việc của bộ modul tương quan tín hiệu thu Y[K] và tín hiệu chuẩn X0 [K]
lọc thích nghi và cần phải chọn từ những yêu cầu với đặc Nếu những tín hiệu nhiễu N[K] không tương quan với tín
trưng của mạng anten thích nghi ở chế độ làm việc thiết lập. hiệu chuẩn X0 [K] tức:
Phạm vi các tiêu chuẩn hiệu suất được sử dụng rộng rãi gồm M(N[K]X0 [K]) = 0 thì: RM [K] = M(Xm [K] X0 [K]), đặc
có: trưng cho sự phân bố biên – pha tín hiệu có ích ở các kênh thu
x Tiêu chuẩn cực tiểu sai số trung bình bình phương độ tương ứng với phân bố biên pha của tín hiệu chuẩn.
lệch tín hiệu đầu ra mạng anten thích nghi với tín hiệu chuẩn Từ (12), phương sai tín hiệu sai lệch là hàm bình phương
cho trước ở AДP với các kênh như nhau. 2
W, ma trận RM [K] xác định là dương, nên hàm б H [K] có cực
x Tiêu chuẩn cực tiểu phương sai nhiễu ở đầu ra với
2
mạng anten thích nghi kênh chính tách biệt. tiểu duy nhất, còn vector Wopt tương ứng б HMin [K] tìm từ
Ngoài ra còn có tiêu chuẩn khá quan trọng vì hiệu suất
nghiệm phương trình:
các thuật toán thích nghi là tốc độ hội tụ về quá trình thiết lập
dV H2 >K @
cũng như năng lực tính toán thực hiên bằng những công cụ ¦ WV H2 >K @ 0
tính toán. Thuật toán tốt nhất trong từng trường hợp cụ thể cần dW T
chọn tính đến nhiều yếu tố khác nhau gồm những đặc trưng Kết quả vi phân nhận được: ¦ WV H2 >K @ = - 2RM [K] + 2RM
của tín hiệu và nhiễu, sự tồn tại những tin tức tiền định, tốc độ
thích nghi cần thiết để thể hiện ở các thiết bị tính toán.... [K] Wopt = 0
4.1. Thuật toán tạo các hệ số trọng lượng theo tiêu chuẩn cực Từ đó:
1
tiểu phương sai sai số Wopt = R M [K]RM [K] (13)
Xem xét hệ thống thích nghi số, ở đó tất cả các phần tử Phương trình (13) gọi là phương trình “ Vinhera – xovpha”.
mạng anten là như nhau, ngoài ra các tham số của tín hiệu Vì vậy nghiệm nhận được là nghiệm có tên Vinhexovsco”.
mong đợi là đã biết, được thu thay vì các tham số của tín hiệu Để giải phương trình (13) những ước lượng cần thiết của ma
chuẩn (hình 4). Trong hệ thống thực hiện xử lý trọng lượng
phức các tín hiệu số đến từ tất cả các phần tử mạng anten , tạo 1
trận tương quan nghịch đảo R M [K] và vector rM [K] được
T
được điện áp đầu ra so sánh với tín hiệu chuẩn, hiệu của chúng
tính trong quá trình thích nghi theo mẫu các tín hiệu ở đầu ra
là tín hiệu sai lệch:
các phần tử mạng anten hay hồi quy, bằng cách tính chính xác
H [K] = Xo [K] – WT* Y[K] = Xo [K] – YT* [K] .W (11)
hoá liên tiếp các ước lượng.
Ở đây: Y [K] = Y1 [K] Y2 [K]...Ym [K] T – Vector hình Sau khi tính các ước lượng Wopt , có thể viết biểu thức cho
bao phức của các tín hiệu Mạng anten ở thời điểm Kt. giá trị cực tiểu của phương sai sai số lệch tín hiệu đầu ra mạng
2 1 1
W= W1 W2 ....Wm...WM - 1 WM T
– Vector anten với tín hiệu chuẩn - б HMin [K]. Tính đến R M =(R M )T ,
các tham số trọng lượng. đúng với Hecmit, nên với ma trận tương quan, biểu thức cuối
T* - Dấu hiệu chuyển vị và liên hiệp phức. cùng cho phương sai sai số tối thiểu có dạng:

Ym [K] = Xm [K] + Nm [K] m=1,2,....M
Xm [K] - Mẫu hình bao phức của tín hiệu có ích
2
б HMin [K] =
2
M(X o >K @ ) - r T
M [K] M
1
R [K] r [K] *
M (14)
Nm [K] - Mẫu hình bao phức của nhiễu. Qua nhiều lần khảo sát nghiên cứu, tổng hợp ở tài liệu [1,
Tín hiệu sai lệch H [K] đến đầu vào của bộ lọc thích nghi, ở 2, 3] chỉ ra rằng khi tối ưu các vecto W theo các tiêu chuẩn
đây thực hiện nhiệm vụ tính toán kỳ vọng của bình phương sai khác cần phải tính thống kê, như trong trường hợp đã xem xét
số (phương sai của tín hiệu sai số). - tức nghiệm tối ưu dần đến nghiệm của phương trình “
Sau những biến đổi không phức tạp nhận được: Vinhera – xovpha”.
M( H 2 [K]) = бs2 [K] = M(Xo2[K])-2WTiRM [K] + 4.2. Thuật toán tạo các hệ số trọng lượng theo tiêu chuẩn cực
Ti
W RM [K] W (12) tiểu phương sai nhiễu ở đầu ra mạng anten
Ở đây: RM [K] = M(Y* [K] YT [K]) – Ma trận tương quan diện Bài toán tối ưu hoá mạng anten trong trường hợp này là
áp ở các kênh mạng anten thích nghi (hệ số ½ bỏ qua vì xác định thuật toán tối ưu để tính các vector trọng lượng W
không đáng kể) các tín hiệu bù khử. Thay vì hiệu suất có thể chọn tiêu chuẩn
Thêm vào đó là: RM [K]= RMX [K] + RMN [K] kênh cực tiểu phương sai (công suất) nhiễu ở đầu ra mạng
Ở đây: RMX [K] - Ma trận tương quan các tín hiệu có ích, RMN anten trong điều kiện tín hiệu có ích không có.
[K] – Ma trận tương quan nhiễu Viết biên độ phức tín hiệu ở đầu ra mạng anten dưới dạng
U6 >K @ = U o >K @ - W T *
YM >K @ (15)
301

Ở đây: U o >K @ - Biên độ phức tín hiệu kênh chính Trong sơ đồ tính đến hỗ dẫn tương quan mạnh, để tính
Y M >K @ - Véctơ cột M chiều biên độ phức các tín

* > @ > @
RM K , thay vì Uo K sử dụng tín hiệu đầu ra mạng anten
hiệu các kênh bù khử U 6 >K @ .

Bình phương điện áp ra mạng anten viết dưới dạng:
V. KẾT LUẬN
U
2
6 >K @ = U
2
0 >K @ - 2WTY
*
M >K @ U o >K @
1. Hoàn thiện các phương pháp và các thuật toán xử lí số tín
*
> @
+WTY M K Y M K W*
T
> @ hiệu và dữ liệu. Kết hợp hài hoà và sử dụng trong các thuật
Giá trị trung bình của nó (phương sai nhiễu ở đầu ra mạng toán các dạng song song hoá để giảm thời gian thực hiện công
anten) việc.
2. Hoàn thiện cơ sở dữ liệu và kiến trúc công cụ tính toán số
V 62 >K @ = M(U 02 >K @ ) -2W Tr >K @ + WTRM >K @ W*
M
(16) dạng chuyên dụng để xử lý tín tức số Ra đa.
Ở đây: RM K = > @ K *
M(Y M > @ T
YM >K @ ) – Ma trận tương quan 3. Phân bố tối ưu các bài toán xử lý giữa công cụ tính toán
và điều khiển chương trình và điều khiển thiết bị.
nhiễu trong các kênh bù khử.
4. Thiết kế và ứng dụng phương pháp hệ thống một cách
M (Y1* >K @U 0 >K @) thống nhất để thiết kế chi tiết các phần tử của hệ tính toán tin
tức liên kết Ra đa có mạng anten với máy tính, từ đặc điểm
M (Y2* >K @U o >K @)
rM >K @ =
của những thuật toán riêng và thuật toán tổng thể xử lý tin tức
và điều khiển tính đến ảnh hưởng của môi trường ngoài.
.........................
5. Trong mạng anten mà ta xem xét khi có tác động của
M (YM* >K @U o >K @) nhiễu tạp tích cực theo cánh sóng phụ, ở hướng tác động cuả
chúng tạo được các vùng lõm rất sâu ở giản đồ hướng mạng
> @
rM K - Véctơ hố tương quan các tín hiệu đầu ra kêmh chính anten , cánh sóng chính của giản đồ hướng bị méo không đáng
và các kênh bù khử kể;
Giá trị tói ưu của véctơ các hệ số trọng lượng, như trước đây TÀI LIỆU THAM KHẢO
được tính từ điều kiện:
dV 62 [1] Маркович И.И., Семеняк П.Л., Цифровая пространственно-временная
2rM >K @ 2 RM >K @ ¦OPT 0 обработка сигналов в многоканальной гидроакустической системе
dW T* // Информационно-измерительные и управляющие системы. Т. 6. –
2008. – №3. – С. 72-75.
Từ đó nhận được: [2] Ковалев Э.П., Маркович И.И.Реализация алгоритмов цифровой
1 пространственно-временной обработки гидроакустических сигналов
WOPT = R M rM = 0 (17) в многолучевых эхолотах Труды IX Всероссийской конференции
«Прикладные технологии гидроакустики и гидрофизики» (ГА-2008).
Biểu thức (17) tương tự (13) ở mục trước. Trong từng biểu – СПб.: Наука, 2008.– С. 183-187.
thức để tính véctơ tối ưu của yêu cầu cần phải ước lượng ma [3] Маркович И.И., Жирнов В.С. Интеллектуальная система
цифрового формирования и обработки сигналов в многолучевом
trận tương quan đảo và vectơ tương quan số các tín hiệu kênh эхолоте. Материалы IX Международной научно-технической
chuẩn và các kênh tham gia bù khử nhiễu. конференции «Искусственный интеллект. Интеллектуальные
Sơ đồ cấu trúc của bộ xử lý thích nghi số mạng anten thích системы». Донецк: ИПИИ, Наука i освiта. Т. 2.– 2008. – С. 54-58.
nghi cục bộ mô tả ở hình 7. [4]. Слюсар В. Цифровые антенные решетки будущее радиолокации / В.
Слюсар ЭЛЕКТРОНИКА: Наука, Технология, Бизнес. – 3/2011. – С.
42-46.
[5]. Скачков В.В. Адаптивный алгоритм компенсации гауссовой
шумовой помехи с произвольным пространственным спектром
мощности / В.В. Скачков, Ю.М. Поповнин // Научно-технический
сборник. – 2012. – №3. ч.1. – С. 64-70.
[6].Харланов А.В. Поляризационные характеристики радиоволны и их
использование в адаптивной фильтрации сигналов / А.В. Харланов //
Збірник наукових праць Севастопольського ВМІ ім. П.С. Нахімова. –
Севастополь, 2011. – Вип. 1(12). – С. 41-51.
Hình 7. Cấu trúc bộ xử lý thích nghi số
302

Sử dụng quay pha phụ tối ưu sóng mang thu để

giảm ảnh hưởng riêng của méo phi tuyến trên
hệ thống MIMO STBC 2 × nR
Nguyễn Tất Nam∗ , Nguyễn Quốc Bình† .
∗ Khoa Vô tuyến Điện tử, Học viện Kỹ thuật Quân sự;
† Đại học Sư phạm Kỹ thuật Hưng yên.
Email: namnguyentat@gmail.com; nqbinhdi@yahoo.com.
Tóm tắt—Trong bài báo này, chúng tôi nghiên cứu sử Tuy nhiên, các kết quả đạt được của nhóm này chỉ với
dụng phương pháp quay pha phụ tối ưu sóng mang thu giả thiết HPA kết hợp với bộ méo trước lý tưởng vì vậy
đề giảm ảnh hưởng riêng của méo phi tuyến gây bởi các HPA trở thành bộ hạn biên đường bao mềm (SEL: Soft-
bộ khuếch đại công suất trên hệ thống MIMO STBC 2 ×
Envelope Limiter) hoặc chỉ xét HPA với mô hình của bộ
nR . Từ đó, mối quan hệ giữa góc quay pha phụ tối ưu
(OAPS: Optimum Additional Phase Shift) của sóng mang khuếch đại công suất bán dẫn (SSPA: Solid-State Power
thu và tham số lượng thiệt hại khoảng cách (dd: distance Amplifier), tức là các công trình nghiên cứu đã không
degradation) do méo phi tuyến gây bởi bộ khuếch đại công tính đến tác động AM/PM. Trong khi đó, giải pháp bù
suất (HPA: High Power Amplifier) cũng được đưa ra đối tác động của méo phi tuyến gây bởi bộ khuếch đại công
với hệ thống. Kết quả mô phỏng bằng phần mềm Matlab suất dạng đèn sóng chạy (TWTA: Travelling-Wave Tube
cho thấy, nếu tăng số lượng ăng-ten thu của hệ thống thì
Amplifier) được sử dụng nhiều trong hệ thống thông tin
giá trị OAPS thay đổi không đáng kể so với giá trị OAPS
của hệ thống sử dụng một ăng-ten thu. Ngoài ra, hiệu quả vệ tinh hoặc trạm gốc, với đầy đủ biến điệu AM/AM và
của biện pháp hạn chế méo phi tuyến bằng OAPS còn AM/PM vẫn chưa được nghiên cứu. Ngoài ra, trong mô
được đánh giá thông qua việc xác định mối quan hệ giữa hình hệ thống khảo sát, Aissa và cộng sự cũng chưa đề
tham số lượng thiệt hại tỉ số công suất tín hiệu/tạp âm cập đến thành phần thường thấy trên hệ thống thực tế
(SNRD: Signal-to-Noise Degradation) và tham số dd. là bộ lọc căn bậc hai côsin nâng (S-RRC: Square-Root
Từ khóa—Méo phi tuyến, MIMO, mã khối không gian- Raised Cosine) ở phía phát và thu. Chúng đóng vai trò
thời gian, quay pha phụ tối ưu sóng mang thu.
quan trọng trong hạn băng tín hiệu nhưng đồng thời
cũng gây ra các tác động có nhớ làm cho bài toán trở
I. GIỚI THIỆU
lên rất phức tạp. Hiện nay, việc tìm biểu thức giải tích
Gần đây, một số bài báo đã nghiên cứu việc bù tác ở dạng tường minh để đánh giá ảnh hưởng của méo phi
động của méo phi tuyến gây bởi HPA cũng như các tuyến gây bởi HPA dạng TWT đến phẩm chất hệ thống
ảnh hưởng khác như mất cân bằng I/Q (I/Q Imbalance) hoặc biểu thức giải tích về mối quan hệ giữa tham số
và crosstalk trên hệ thống MIMO STBC. Cụ thể trong giảm méo phi tuyến (OAPS chẳng hạn) và tham số phi
[1], Aissa và các cộng sự đã đề xuất phương pháp bù tuyến của HPA rất khó thực hiện. Cho nên việc nghiên
ảnh hưởng của méo phi tuyến trong trường hợp biết và cứu xác định công thức ở dạng kinh nghiệm của các
không biết các tham số của HPA trên hệ thống MIMO mối quan hệ trên là một công việc có ý nghĩa.
mã hóa khối không gian-thời gian trực giao (OSTBC: Trong hệ thống đơn ăng-ten, đơn sóng mang sử dụng
Orthogonal Space–Time Block Coding). Tiếp theo [2], điều chế biên độ cầu phương QAM, việc bù ảnh hưởng
phương pháp bù ảnh hưởng đồng thời của méo phi tuyến, phi tuyến của HPA dạng TWTA và SPPA bằng biện pháp
mất cân bằng I/Q và crosstalk đã được đề xuất trên hệ sử dụng OAPS đã được nghiên cứu và đưa ra được các
thống MIMO OSTBC. Kết quả đạt được của các công biểu thức kinh nghiệm xác định mối quan hệ giữa OAPS
trình này đã đưa ra được giới hạn trên của xác suất và dd [4]. Vấn đề được đặt ra là có thể sử dụng OAPS
lỗi symbol trung bình và giới hạn dưới của dung lượng để bù ảnh hưởng riêng của méo phi tuyến gây bởi HPA
hệ thống. Ngoài ra, giải pháp bù tác động đồng thời dạng TWT trên hệ thống MIMO STBC 2 × nR nữa hay
của méo phi tuyến, mất cân bằng I/Q và crosstalk cũng không? Nếu có thì biểu thức kinh nghiệm xác định mối
được đề xuất trên hệ thống MIMO tạo búp sóng [3]. quan hệ giữa OAPS và dd là gì?

ISBN: 978-604-67-0635-9 303

Bảng I
Từ những kết quả nghiên cứu đã đạt được về OAPS THAM SỐ CỦA MÔ HÌNH SALEH
trên hệ thống đơn sóng mang và những hạn chế của các
Tên HPA HPA267 HPA1371 HPA1373
công trình nghiên cứu do nhóm Aissa thực hiện, chúng Tham số [6] [5] [5]
tôi đề xuất việc sử dụng OAPS để giảm ảnh hưởng riêng αa 2 1.9638 2.1587
của méo phi tuyến gây bởi HPA dạng TWT trên hệ thống βa 1 0.9945 1.1517
MIMO STBC 2 × nR . αp π/3 2.5293 4.0033
βp 1 2.8168 9.1040
Phần còn lại của bài báo được tổ chức như sau. Trong
phần II và phần III, chúng tôi lần lượt trình bày mô hình
hệ thống, mô hình bộ khuếch đại công suất và đề xuất
sử dụng OAPS để giảm ảnh hưởng riêng của méo phi Với r và θ lần lượt là biên độ và pha tín hiệu đi vào
tuyến. Phần IV đưa ra kết quả xây dựng công thức kinh HPA, j 2 = −1 thì symbol ở đầu ra HPA có thể biểu
nghiệm về mối quan hệ giữa OAPS và dd trên hệ thống diễn:
MISO STBC 2 × 1 và MIMO STBC 2 × 2. Ngoài ra, ŝ = A(r)ejϕ(r) ejθ , (3)
mối quan hệ giữa SNRD và dd đạt được khi hệ thống sử
dụng OAPS cũng được trình bày trong phần này. Từ đó, A(r) và ϕ(r) là các biến điệu AM/AM và AM/PM tương
chúng tôi rút ra mối quan hệ giữa OAPS và dd, SNRD ứng được xác định theo mô hình Saleh [5].
và dd trong trường hợp với số ăng-ten thu bất kì. Cuối Bảng I liệt kê các tham số theo mô hình Saleh của
cùng, kết luận bài báo được trình bày trong phần V. các bộ khuếch đại công suất thực tế ứng với các bài báo
đã sử dụng. Để cho đơn giản trong việc tính toán và
II. MÔ HÌNH HỆ THỐNG mô phỏng, giả sử các HPA trên các nhánh phát có cùng
Để giảm tác động riêng của méo phi tuyến gây bởi đặc tính phi tuyến. Khi đó, dạng tín hiệu MIMO STBC
HPA dạng TWT, chúng tôi đề xuất xây dựng mô hình 2 × nR trong điều kiện có HPA phi tuyến có thể được
hệ thống phi tuyến MIMO STBC 2 × nR như trên Hình biểu diễn lại như sau:
1, với số ăng-ten phát nT = 2 và số ăng-ten thu nR
(nR ≥ 1), chỉ có tác động của tạp âm Gauss trắng chuẩn Y = HŜ + N, (4)
cộng tính (AWGN: Additive White Gaussian Noise), bộ với Ŝ biểu diễn ma trận tín hiệu phát khi đã đi qua HPA.
lọc ở phía phát và thu là các bộ lọc căn bậc hai côsin
nâng đã được bổ sung ở hai phía thu phát có tác dụng B. Khối APS
hạn băng tín hiệu và giúp hệ thống tiệm cận với hệ thống Tín hiệu thu trên mỗi ăng-ten được đưa qua khối quay
thực tế hơn. Tín hiệu thu được theo mô hình trên khi pha dao động nội thu hay khối quay pha phụ (APS:
không có HPA và khối quay pha phụ tối ưu sóng mang Additional Phase Shift). Khối APS có nhiệm vụ thêm
thu với một khung dữ liệu có thể biểu diễn như sau: vào một góc pha cố ý. Góc pha bất kỳ được thêm cố
Y = HS + N, (1) ý có thể làm tăng hoặc giảm tỉ lệ lỗi. Khi đó, tín hiệu
thu trước khi đi vào bộ ước lượng và kết hợp tín hiệu
với Y là ma trận tín hiệu thu được nR × T , T là chu
có dạng:
kì của ma trận truyền dẫn STBC. S biểu diễn ma trận
Ỹ = p.Y, (5)
symbol tín hiệu phát nT ×T , N là ma trận nhiễu nR ×T
gồm các phần tử có phân bố Gauss phức độc lập, đồng trong đó, Ỹ là ma trận tín hiệu thu được khi qua khối
nhất với nhau và không tương quan với các symbol phát. APS, p giá trị góc quay pha phụ cố ý thêm vào.
nR ,nT
H = [hm,n ]m,n=1 là ma trận kênh truyền có kích thước Phía thu sử dụng bộ kết hợp Alamouti [7] và bộ tách
nR × nT , trong đó hm,n là hệ số của kênh giữa ăng-ten tín hiệu hợp lẽ cực đại (MLD: Maximum Likelihood
phát thứ n và ăng-ten thu thứ m. Trường hợp, hệ thống Detector):
chỉ có tác động của AWGN thì các hệ số hm,n = 1.

S̄ = args min Ỹ − HS . (6)
A. Mô hình bộ khuếch đại công suất HPA
Trong bài báo này, chúng tôi sử dụng HPA được mô III. ĐỀ XUẤT SỬ DỤNG GÓC QUAY PHA PHỤ TỐI
hình hóa như một kênh phi tuyến không nhớ và mô tả ƯU SÓNG MANG THU CHO HỆ THỐNG MIMO
bằng các đường đặc tính AM/AM và AM/PM [5]. Theo STBC 2 × nR
mô hình này, biểu diễn symbol tín hiệu đầu vào theo
Tương tự như cách định nghĩa và xác định OAPS
tọa độ cực như sau:
trên hệ thống đơn sóng mang sử dụng điều chế QAM
s = rejθ . (2) tại công trình [4]:

304
1 1
ŝk y1k ỹ1k

S-RRC S-RRC APS1 Estimator
Tx1 Rx1
HPA1 s̄k
s̃k
sk STE 2 nR n1k Combiner MLD s̄k+1
sk+1
s̃k+1
ŝk+1 ynR k ỹnR k

S-RRC S-RRC APS Estimator
Tx2 Rx nR nR
HPA2
nnR k
Hình 1. Mô hình sử dụng OAPS trên hệ thống MIMO 2 × nR STBC.
Tác động cơ bản của biến điệu AM/PM gây bởi bộ giá thông qua tăng ích quay pha phụ tối ưu, ký hiệu
khuếch đại công suất dạng TWT trong làm móp dạng là TOAP S . TOAP S được xác định là chênh lệch giữa
chòm sao tín hiệu thu là làm quay pha các tín hiệu thu SNRD gây bởi méo phi tuyến của HPA khi hệ thống sử
trên mặt phẳng pha. Mức quay pha không đồng đều đối dụng và không sử dụng OAPS, tính tại một mức BER
với các tín hiệu có công suất khác nhau dẫn đến là các quan tâm nào đó. TOAP S được xác định theo (7):
cụm điểm thể hiện ISI phi tuyến trên không gian tín (7)
TOAP S = SN RDAP S=0 − SN RDAP S=OAP S
hiệu có các trọng tâm bị quay đi các góc khác nhau
tùy vào biên độ của từng tín hiệu đã phát. Ở phía thu, trong đó: SNRDAP S=OAP S , SNRDAP S=0 tương ứng
khi mạch khôi phục sóng mang hoạt động tốt, một góc là SNRD của hệ thống khi sử dụng và không sử dụng
quay pha trung bình bởi biến điệu AM/PM tính trên toàn OAPS.
bộ tập tín hiệu sẽ được tự động bù trên mỗi nhánh, bộ
khôi phục sóng mang trên hệ thống nghiên cứu được IV. KẾT QUẢ MÔ PHỎNG
điều khiển bám pha sóng mang thu theo trung bình các Để xác định mối quan hệ giữa OAPS và dd hoặc
góc pha của tín hiệu tới. Góc quay pha tự động do bộ SNRD và dd tại BER = 10−3 và BER = 10−6 , chúng
khôi phục sóng mang thực hiện như thế vẫn chưa phải tôi tiến hành mô phỏng với cấu hình hệ thống như trên
là tốt nhất và do vậy giá trị SNRD của hệ thống vẫn Hình 1 sử dụng tín hiệu điều chế 16-QAM, số symbol
còn có thể giảm tiếp được bằng cách quay cố ý một góc mô phỏng: 3×107 . Bộ lọc căn bậc hai côsin nâng ở phía
pha sóng mang thu thêm một góc nào đó. Tuy nhiên, phát và thu: trễ nhóm (Delay Group = 10), hệ số uốn
việc quay pha này không thể tiến hành tùy tiện do thoạt lọc (Rolloff = 0.5), tần số lấy mẫu đầu vào (Fd = 1), tần
đầu việc tăng APS sẽ dẫn đến SNRD giảm dần vì việc số lấy mẫu đầu ra (FS = 8). Giá trị mỗi bước lặp trong
quay của hệ đường biên quyết định ban đầu sẽ cải thiện vòng lặp xác định OAPS thô và OAPS tinh lần lượt là
khoảng cách từ các điểm tín hiệu tới biên quyết định 1.0 độ và 0.1 độ nhằm đảm bảo độ chính xác của giá
gần nhất xét theo ngược chiều kim đồng hồ. Mặt khác, trị OAPS tìm được là 0.1 độ. Vì chỉ bù ảnh hưởng riêng
nếu cứ tăng mãi APS thì đến giá trị nào đó của APS, của méo phi tuyến nên chúng tôi phải chọn kênh khảo
các biên quyết định mới lại bị quay đi quá mức, dẫn sát là AWGN. Các bộ khuếch đại công suất với các tham
đến các điểm tín hiệu thu lại tiến lại gần hơn các biên số của mô hình Saleh trong Bảng I.
quyết định khác xét theo chiều kim quay đồng hồ và do
vậy SNRD lại tăng. Điều đó có nghĩa là tồn tại một giá A. Hệ thống MISO STBC 2 × 1
trị APS tốt nhất ứng với từng BOP của HPA khảo sát. 1) Mối quan hệ giữa OAPS và dd: Dựa vào kết quả
Giá trị góc quay phụ làm cực tiểu SNRD gây bởi méo mô phỏng đạt được khi hệ thống sử dụng các HPA như
phi tuyến của HPA trên hệ thống MIMO STBC 2 × nR trong Bảng I ứng với từng giá trị BOP xác định được
được gọi là quay pha phụ tối ưu (OAPS). một giá trị OAPS, chúng tôi sử dụng thuật toán bình
phương tối thiểu (LS: Least square) để xác định được
Hiệu quả của việc quay pha phụ tối ưu sóng mang mối quan hệ chung duy nhất giữa OAPS và dd cho cả
thu trên hệ thống MIMO STBC 2 × nR có thể đánh 03 HPA trong Bảng I. Mối quan hệ này là một đa thức

305
2) Mối quan hệ giữa SNRD và dd: Bằng các giá trị

12
OAPS tìm được ở phần trước, chúng tôi tiến hành mô
phỏng và sử dụng thuật toán bình phương tối thiểu để
10 tìm mối quan hệ giữa SNRD và dd của hệ thống khi sử
dụng và không sử dụng OAPS để thấy được hiệu quả
của phương pháp quay pha phục tối ưu sóng mang thu.
8
Cụ thể, các công thức kinh nghiệm chung cho hệ thống
sử dụng OAPS để giảm méo phi tuyến đạt được tại BER
OAPS [Degree]
6 = 10−3 và BER = 10−6 lần lượt là (10), (11).

Tại BER = 10−3 :
(dd,OAPS) tai BER=10−3
4 (dd,OAPS)
HPA267
HPA1371
tai BER=10
−3 SNRDOAPS = − 60.15dd4 + 64.89d3 − 6.58dd2
(dd,OAPS)HPA1373 tai BER=10
−3
+ 6.82dd. (10)
Moi quan he gan dung giua OAPS va dd
−6
2
(dd,OAPS)
HPA267
tai BER=10
−6
Sai số ước lượng: 0.27 [dB].
(dd,OAPS) tai BER=10−6

Tại BER = 10−6 :
HPA1373
0
0 0.1 0.2 0.3
0.4 0.5 0.6 0.7
SNRDOAPS = 45.99dd4 − 21.85dd3 + 27.28dd2
(11)
dd
+ 7.86dd.
Hình 2. Mối quan hệ giữa OAPS và dd trên hệ thống MISO 2 × 1
STBC.
Khi hệ thống khảo sát tại Hình 1 với một ăng-ten thu
(nR = 1) không sử dụng khối APS để giảm méo phi
bậc 4 nhưng khuyết hệ số tự do tại BER = 10−3 và BER tuyến, mối quan hệ giữa SNRD và dd được thể hiện ở
= 10−6 như trên Hình 2. Cụ thể: Hình 3 và các công thức kinh nghiệm đạt được là:
Tại BER = 10−3 : Tại BER = 10−3 :
OAPSBER=10−3 = 171.42dd4 −153.98dd3 +9.70dd2 SNRD = 820.26dd4 −356.67dd3 +111.77dd2 + 4.47dd.
(12)
+ 28.01dd. (8)
Sai số ước lượng: 0.16 [độ]. Tại BER = 10−6 :
Tại BER = 10−6 :
SNRD = 17917dd4 −8569dd3 +1448dd2 − 52dd.
OAPSBER=10−6 = 168.41dd4 −142.74dd3 −1.98dd2 (13)
+ 33.16dd. (9) Sai số ước lượng: 0.39 [dB].
Từ kết quả so sánh tại Hình 3, chúng ta dễ dàng nhận
Sai số ước lượng: 0.17 [độ]. thấy, khi dd càng lớn, hệ thống chịu tác động càng mạnh
bởi méo phi tuyến hay điểm làm việc của HPA tại vị trí
Từ kết quả mô phỏng, chúng ta dễ dàng nhận thấy có giá trị AM/PM lớn nên hiệu quả của việc sử dụng
khi hệ thống MISO STBC 2 × 1 sử dụng các HPA trong OAPS càng được khẳng định. Cụ thể, tại dd = 0.2661,
Bảng I với cùng một giá trị dd khảo sát thì giá trị OAPS hệ thống đạt được tăng ích quay pha phụ tối ưu lớn
đạt được tại BER = 10−3 luôn có xu hướng nhỏ hơn giá nhất là: {TOAP S }max = 4.12 [dB] tại BER = 10−3 và
trị OAPS tại BER = 10−6 . Điều này có thể giải thích như {TOAP S }max = 12.41 [dB] ở BER = 10−6 .
sau: méo phi tuyến ảnh hưởng lên hệ thống càng tăng Giá trị dd càng nhỏ tức là hệ thống khảo sát càng gần
tại giá trị Eb /N0 càng cao. Do vậy, cùng điểm làm việc vùng tuyến tính hay điểm làm việc của HPA tại ví trí
của HPA hay cùng giá trị dd khảo sát, giá trị Eb /N0 tại có giá trị AM/PM nhỏ nên hiệu quả của việc sử dụng
BER = 10−6 luôn lớn hơn nhiều so với Eb /N0 ở BER OAPS cũng giảm dần.
= 10−3 . Điều này có nghĩa là lượng méo phi tuyến của Ngoài ra, sử dụng OAPS cũng giúp tăng hiệu quả về
hệ thống ở BER = 10−6 luôn nhiều hơn so với méo phi mặt công suất của bộ khuếch đại công suất. Thật vậy,
tuyến tại BER = 10−3 . Cho nên, góc quay pha phụ tối không sử dụng OAPS thì hệ thống có thể hoạt động
ưu sóng mang thu để giảm méo phi tuyến có thể đạt được với dd lớn nhất chỉ là 0.2661 nhưng khi sử dụng
được tại BER = 10−6 luôn lớn hơn so với giá trị OAPS OAPS, hệ thống có thể làm việc với HPA có giá trị dd
ở BER = 10−3 . lên đến 0.6567.

306
12
22
−3
M�SO 2�1 S�B� �u dung OAPS tai BER=10
−6
20 M�SO 2�1 S�B� �u dung OAPS tai BER=10
M�SO 2�1 S�B� �hong �u dung OAPS tai BER=10−3
10
−6
18 M�SO 2�1 S�B� �hong �u dung OAPS tai BER=10
16
8
14
OAPS [Degree]
SNRD [dB]
12
6
10
−3
8 4 −3
−3
6
−6
4 2
−6
−6
2 (dd,OAPS)HPA1373 tai BER=10
0
0 0 0.1 0.2 0.3 0.4 0.5 0.6 0.7
0 0.1 0.2 0.3 0.4 0.5 0.6 0.7 dd
dd
Hình 3. Mối quan hệ giữa SNRD và dd khi hệ thống MISO 2 × 1 Hình 4. Mối quan hệ giữa OAPS và dd trên hệ thống MIMO 2 × 2
STBC sử dụng và không sử dụng OAPS. STBC.
B. Hệ thống MIMO STBC 2 × 2 SNRDOAPS = 45.77dd4 − 19.24dd3 + 24.63dd2

1) Mối quan hệ giữa OAPS và dd: Tương tự cách + 8.50dd. (17)
làm như trên hệ thống MISO STBC 2 × 1, chúng tôi
tiến hành mô phỏng hệ thống và sử dụng thuật toán
Khi hệ thống khảo sát tại Hình 1 với hai ăng-ten thu
bình phương tối thiểu nhằm xác định mối quan hệ giữa
(nR = 2) không sử dụng OAPS để giảm méo phi tuyến,
OAPS và tham số dd tại BER = 10−3 và BER = 10−3 .
mối quan hệ giữa SNRD và dd được thể hiện ở Hình 5
Mối quan hệ giữa OAPS và dd cũng là một đa thức bậc
và các công thức kinh nghiệm đạt được là:
4 khuyết hệ số tự do như trên Hình 4. Cụ thể:
Tại BER = 10−3 :
Tại BER = 10−3 :
OAPSBER=10−3 = 201.01dd4 −197.39dd3 +29.69dd2 SNRD = 2253.30dd4 −1201dd3 +276.50dd2 − 6.80dd.
(18)
+ 25.30dd. (14)
Sai số ước lượng: 0.17 [độ]. Tại BER = 10−6 :
Tại BER = 10−6 :
SNRD = 17683dd4 −8428dd3 +1419dd2 + 50dd.
OAPSBER=10−6 = 162.12dd4 −129.73dd3 −9.33dd2 (19)
+ 34.16dd. (15)
Sai số ước lượng: 0.21 [độ]. Từ Hình 5, chúng ta dễ dàng tính được tăng ích quay
pha phụ tối ưu lớn nhất của hệ thống MIMO STBC
2) Mối quan hệ giữa SNRD và dd: Tương tự như hệ 2 × 2. Cụ thể tại dd = 0.2661, chúng tôi xác định
thống MISO STBC 2 × 1, nhóm tác giả xác định mối được {TOAP S }max = 4.29 [dB] tại BER = 10−3 và
quan hệ giữa SNRD và dd trong trường hợp hệ thống {TOAP S }max = 13.24 ở BER = 10−6 . Hiệu quả của
MIMO STBC 2 × 2 sử dụng OAPS và không sử dụng biện pháp quay pha phụ tối ưu sóng mang thu trên hệ
OAPS. Từ đó, hiệu quả của phương pháp dùng OAPS thống cũng giảm dần như trên hệ thống MISO STBC
được xác định một cách cụ thể thông qua biểu thức (7). 2 × 1 khi giá trị dd nhỏ hay méo phi tuyến giảm dần.
Tại BER = 10−3 : So sánh tương ứng các biểu thức (8)-(13) và (14)-
SNRDOAPS = − 50.06dd4 + 48.41dd3 + 2.38dd2 (19) xác định tại BER = 10−3 , BER = 10−6 , chúng ta
dễ dàng nhận thấy giá trị OAPS và SNRD trên cả hai
+ 4.95dd. (16)
hệ thống không có thay đổi nhiều trong cùng điều kiện
Sai số ước lượng: 0.20 [dB]. khảo sát như bỏ qua sự tương quan giữa kênh phía phát,
Tại BER = 10−6 : HPA trên hai kênh phía phát giống nhau hoàn hảo. Hình

307
2 × nR với số ăng-ten thu bất kì dưới tác động riêng

14
�uan he giua OAPS va dd t�en M�SO S�B� 2�1 tai BER=10
�uan he giua OAPS va dd t�en M�SO S�B� 2�1 tai BER=10
−3
−6
của méo phi tuyến, chúng ta có thể sử dụng biểu thức
�uan he giua OAPS va dd t�en M�MO S�B� 2�2 tai BER=10−3 (8) hoặc (9) để tính giá trị OAPS cho hệ thống MIMO
�uan he giua OAPS va dd t�en M�MO S�B� 2�2 tai BER=10−6
12 STBC 2 × nR có số ăng-ten thu bất kì và sử dụng HPA
bất kì mà không phải mất thời gian mô phỏng hệ thống.
10
OAPS [Degree]
8
V. KẾT LUẬN
Từ kết quả bài báo cho thấy, đối với hệ thống phi tuyến
6 MIMO STBC 2×nR vẫn có thể dụng phương pháp quay
pha phụ tối ưu sóng mang thu để giảm ảnh hưởng riêng
4 của méo phi tuyến, đồng thời cải thiện đáng kể hiệu
quả về mặt công suất của HPA dạng TWT. Ngoài ra,
2
bài báo xác định được công thức kinh nghiệm duy nhất
0 0.1 0.2 0.3 0.4 0.5 0.6 0.7
dd về mối quan hệ giữa OAPS và dd tại BER = 10−3 và
BER = 10−6 cho nhiều HPA. Biểu thức quan hệ giữa
Hình 6. So sánh mối quan hệ giữa OAPS, dd trên hệ thống MISO
OAPS và dd là một đa thức bậc bốn khuyết hệ số tự do.
STBC 2 × 1 và MIMO STBC 2 × 2. Từ đó, bài báo còn đưa ra được công thức kinh nghiệm
chung duy nhất về mối quan hệ giữa SNRD và dd của
22
M�MO 2�2 S�B� �hong �u dung OAPS tai BER=10−3
HPA bất kì của hệ thống khi sử dụng và không sử dụng
20
M�MO 2�2 S�B� �hong �u dung OAPS tai BER=10
−6
OAPS. Công thức kinh nghiệm về mối quan hệ giữa
−3
M�MO 2�2 S�B� �u dung OAPS tai BER=10
M�MO 2�2 S�B� �u dung OAPS tai BER=10
−6 SNRD, OAPS và dd hỗ trợ người thiết kế hệ thống ước
18
lượng nhanh SNRD gây bởi ảnh hưởng riêng của méo
16 phi tuyến, ước lượng nhanh giá trị OAPS cần thiết để
14 giảm ảnh hưởng riêng của méo phi tuyến.
12 TÀI LIỆU THAM KHẢO
SNRD [dB]
10 [1] Q. Jian and S. Aissa, “Analysis and Compensation of Power

Amplifier Nonlinearity in MIMO Transmit Diversity Systems,”
8
IEEE Trans. Veh. Technol, vol. 59, no. 6, pp. 2921-2931, Jul.
6
2010.
[2] Q. Jian and S. Aissa, “Joint compensation of multiple RF impair-
4 ments in MIMO STBC systems,” in Proc. IEEE 22nd Int. Symp.
on PIMRC, Toronto, Italy, pp. 1500-1505, Sep. 2011.
2 [3] Q. Jian and S. Aissa, “Analysis and compensation for the joint
effects of HPA nonlinearity, I/Q imbalance and crosstalk in MIMO
0
0 0.1 0.2 0.3 0.4 0.5 0.6 0.7 beamforming systems,” in Proc. IEEE Wireless Communications
dd
and Networking Conference, Quintana Roo, Mexico, pp. 1562-
1567, Mar. 2011.
[4] N. Q. Binh, N. T. Bien, and N. T. Thang, “The Usability of
Hình 5. Mối quan hệ giữa SNRD và dd khi hệ thống MIMO 2 × 2 Distance Degradation in Estimation of Signal to Noise Ratio
STBC sử dụng và không sử dụng OAPS. Degradation Caused by the Effect of Nonlinear Transmit Ampli-
fiers and Optimum Additional Phase Shift in 256-QAM Systems,”
6 minh họa sự khác nhau không đáng kể về giá trị OAPS in Proc. Int. Conf. on ATC, Ha Noi, Viet Nam, pp. 258-261, Oct.
tại BER = 10−3 , BER = 10−6 trên hai hệ thống MISO 2008.
STBC 2 × 1 và MIMO STBC 2 × 2. Ngoài ra, tăng ích [5] A. A. M. Saleh, “Frequency-Independent and Frequency-
Dependent Nonlinear Models of TWT Amplifiers,” IEEE Trans.
lớn nhất và nhỏ nhất của hệ thống trong điều kiện sử on Commun., vol. 29, no. 11, pp. 1715-1720, Nov. 1981.
dụng một ăng-ten thu hoặc hai ăng-ten thu có sự sai [6] W. Sung, S. Kang, P. Kim, D.-I. Chang, and D.-J. Shin, “Per-
khác không đáng kể. Cho nên, khi tăng số ăng-ten thu formance analysis of APSK modulation for DVB-S2 transmission
over nonlinear channels,” International Journal of Satellite Com-
lên ba hay bốn hoặc với nR ≥ 4 thì kết quả đạt được munications and Networking, vol. 27, issue.6, pp. 295-311, Dec.
về mối quan hệ giữa OAPS và dd hoặc SNRD và dd 2009.
cũng không có sự sai khác nhiều so với trường hợp sử [7] S. Alamouti, “A Simple Transmit Diversity Technique for Wireless
Communications,” IEEE J. Select. Areas Commun., vol. 16, no.
dụng một ăng-ten thu. Do vậy, trong quá trình thiết kế hệ 8, pp. 1451-1458, Oct. 1998.
thống hoặc ước lượng phẩm chất hệ thống MIMO STBC

308
Kỹ Thuật Sắp Xếp Can Nhiễu Cho Hệ Thống Phối

Hợp Nhiều Cell Với Thông Tin Trạng Thái Kênh
Không Hoàn Hảo
Nguyễn Quang Tuấn1 , Hà Hoàng Kha1 , Tạ Quang Hùng2 , Võ Quế Sơn1
1 Khoa Điện-Điện Tử, Đại Học Bách Khoa-Tp.HCM
2 Khoa Công Nghệ Thông Tin, Đại Học Hà Nội
Email: nqtuan9999@gmail.com, hhkha@hcmut.edu.vn, hungqta@gmail.com, sonvq@hcmut.edu.vn
Tóm tắt nội dung—Bài báo nghiên cứu vấn đề thiết kế các ma mặt toán học [1], [4]. Gần đây, bậc tự do (degrees of freedom)
trận xử lý tuyến tính ở bộ phát và thu trong hệ thống thông được dùng như chỉ tiêu thiết kế trong mạng thông tin có can
tin nhiều cell sử dụng nhiều antenna phát và nhiều antenna thu nhiễu. Bậc tự do được định nghĩa là số luồng dữ liệu mà các
nhằm tối đa hóa bậc tự do của hệ thống. Khác với các kỹ thuật
user có thể phát mà không gây ra can nhiễu lẫn nhau [6], [7].
sắp xếp can nhiễu truyền thống, kỹ thuật sắp xếp can nhiễu
trong bài báo sẽ tập trung giảm thiểu ảnh hưởng của can nhiễu Bậc tự do tối ưu có thể đạt được bằng kỹ thuật sắp xếp can
rò rỉ vào không gian tín hiệu ở mỗi user, đồng thời can nhiễu nhiễu (interference alignment) [7], [8]. Ý tưởng cơ bản của
giữa các luồng tín hiệu và nhiễu của từng user cũng được tối kỹ thuật sắp xếp can nhiễu là tìm các ma trận phát và thu
thiểu. Hơn nữa, phần lớn các nghiên cứu trước đây liên quan để tín hiệu can nhiễu từ các người sử dụng được sắp xếp vào
đến kỹ thuật sắp xếp can nhiễu giả sử thông tin trạng thái kênh một không gian can nhiễu, trong khi tín hiệu mong muốn nằm
truyền là hoàn hảo. Tuy nhiên, thông tin trạng thái kênh hoàn trong không gian tín hiệu trực giao với không gian can nhiễu.
hảo không thể đạt được trong thực thế, bài báo của chúng tôi
Các kỹ thuật sắp xếp can nhiễu đã chỉ ra rằng tổng dung lượng
sẽ xem xét trạng thái kênh không hảo trong vấn đề thiết kế ma
trận phát và thu. Khi đó, vấn đề tối ưu bền vững khi trạng thái của mạng vô tuyến nhiều người sử dụng đồng thời có thể tăng
thông tin kênh không chắc chắn được giới thiệu. Vấn đề thiết kế tuyến tính với số người sử dụng trong mạng [9], [10].
được biểu diễn dưới dạng bài toán tối ưu, và phương pháp tối Bài báo hiện tại sẽ tập trung nghiên cứu vấn đề kỹ thuật sắp
ưu luân phiên được sử dụng đề tìm các ma trận phát thu tối xếp can nhiễu cho kênh đường xuống trong mạng thông tin vô
ưu. Các kết quả mô phỏng được cung cấp để đánh giá sử hiệu tuyến nhiều cell. Mỗi trạm gốc được trang bị nhiều antenna
quả của phương pháp tối ưu bền vững so với trường hợp thiết phát và phát nhiều luồng dữ liệu đến một thiết bị thu tại một
kế không bền vững khi thông tin trạng thái kênh không hoàn
hảo. thời điểm. Để sử dụng tần số hiệu quả, các cell sử dụng cùng
Từ khóa— Kỹ thuật sắp xếp can nhiễu, hệ thống nhiều cell, phổ tần số và các kỹ thuât xử lý tín hiệu MIMO sẽ được áp
MIMO, tối ưu bền vững. dụng để giảm thiểu ảnh hưởng can nhiễu giữa các user. Kỹ
thuật sắp xếp can nhiễu sẽ được áp dụng để tối ưu hóa bậc tự
I. GIỚI THIỆU do của hệ thống. Khác với các phương pháp sắp xếp trước đây
Trong các hệ thống thông tin vô tuyến tế bào truyền thống, chỉ tập trung vào công suất can nhiễu rò rỉ vào không gian
các trạm gốc được thiết kế để thông tin với các user của nó tự hiệu [8], [10], [11], phương pháp trong bài báo xét thêm
và không quan tâm đến các user ở cell lân cận. Các kỹ thuật ảnh hưởng của can nhiễu giữa các luồng tín hiệu của user vào
xử lý tín hiệu thực hiện độc lập trong từng cell và các can trong hàm mục tiêu thiết kế. Các phương pháp sắp xếp can
nhiễu từ cell lân cận được xem như nhiễu nền [1]. Tuy nhiên, nhiễu có tính đến công suất tín hiệu mong muốn cũng được
trong các thế thông tin thế hệ mới, kỹ thuật truyền phối hợp trình bày trong [12]–[14]. Hơn nữa, các phương pháp trước
giữa các cell và kỹ thuật sử dụng nhiều antenna phát nhiều đây [8], [10], [11] giả sử trạng thái thông tin hoàn hảo được
antenna thu (MIMO: Mupltiple-Input Multiple Output) đang biết các thiết bị đầu cuối. Trong thực tế, trạng thái thông tin
được sử dụng để tăng hiệu suất phổ [1]–[3]. Các kỹ thuật xử của kênh có thể đạt được ở bộ thu bằng kỹ thuật ước lượng,
lý tín hiệu phối hợp giữa các cell đã chứng minh có thể cải trong khi bộ phát có thể đạt trạng thái thông tin từ phản hồi từ
thiện đáng kể dung lượng của hệ thống [1], [4], [5]. Các tác bộ thu, hoặc ước lượng kênh đường lên trong hệ thống song
giả trong [5] đã giới thiệu các kỹ thuật điều khiển búp sóng công trong miền thời gian. Do đó, trạng thái thông tin kênh
phối hợp giữa các cell để tăng tổng tốc độ bit của hệ thống. hoàn hảo là không thể có trong thực tế. Chúng tôi xem xét
Các phương pháp được giới thiệu bao gồm truyền phối hợp trường hợp trạng thái thông tin kênh không hoàn hảo trong
năng lượng tín hiệu cực đại, truyền phối hợp để tối thiểu can khi thiết kế kỹ thuật sắp xếp can nhiễu. Khi đó, bài báo sử
nhiễu. Tuy nhiên, hệ thống được xem xét trong bài báo giới dụng tối ưu bền vững để đề thiết kế ma trận thu phát. Vấn
hạn chỉ một luồng dữ liệu được truyền giữa trạm gốc và user. đề thiết kế ma trận thu phát đồng thời sẽ là bài toán tối ưu
Vấn thiết kế các ma trận thu phát để tối ưu dung lượng của không lồi và do đó việc tìm lời giải tối ưu là khó khăn. Vì
hệ thống bao gồm can nhiễu của nhiều user là khó khăn về vậy, phương pháp tối ưu luân phiên giữa ma trận phát và thu
ISBN: 978-604-67-0635-9 309

được sử dụng với biểu thức toán học của các ma trận phát và Bộ thu thứ k sử dụng ma trận xử lý tuyến tính W k ∈
thu được tính ở mỗi bước lặp. Sự hội tụ của giải thuật cũng C Nrk ×dk để khôi phục lại tín hiệu mong muốn x k . Tín hiệu
được chứng minh. Các kết quả mô phỏng chỉ ra rằng khi thiết ngõ ra bộ xử lý tuyến tính là
kế bền vững có xem xét đến ảnh hưởng của trạng thái thông
k
x =WH
k yk
tin không hoàn hảo cải thiện dung lượng của hệ thống so với
K
thiết kế dựa trên thông tin trạng thái kênh ước lượng. =WH
k H kk F k x k + WH H
k H klF lx l + W k z k .
Ký hiệu: Các ký tự hoa và ký tự thường in đậm dùng cho l=1,l�=k
(3)
ma trận và vector tương ứng. X H là chuyển vị và lấy liên
Khi đó, tốc độ bit của user k được xác định bởi
hiệp phức của ma trận. I and 0 là ma trận đơn vị và ma trận
zero có số chiều tương ứng. trace(.), rank(.) and E(.) là các Rk = log2 |II dk + W H H H −1
k H kk F k F k H kk W k R zk | (4)
toán tử trace, hạng ma trận và kỳ vọng. ||X X ||F là Frobenius K
norm. vec(XX ) là thành lập vector cột từ các cột của ma trận với R zk = H H H 2 H
�=1,��=k W k H k,�F �F � H k,�W k + σnW k W k
x, Rx ) nghĩa là x là vector biến ngẫu nhiên phức
X . x ∼ CN (x̄ là ma trận tương quan của can nhiễu và nhiễu ở bộ thu. Tổng
có phân bố Gauss với trung bình x̄ x và ma trận hiệp phương tốc độ bit của toàn hệ thống là
sai R x . K

II. MÔ HÌNH HỆ THỐNG
R= Rk . (5)
k
Mô hình hệ thống được xem xét trong bài báo bao gồm một
mạng thông tin vô tuyến có K cell như hình 1. Mỗi trạm gốc Mục tiêu quan trọng là thiết kế các ma trận thu phát để tối
trong cell thứ k (k ∈ K = {1, 2, ..., K}) được trang bị Ntk và ưu hóa tổng tốc độ bit của hệ thống. Tuy nhiên, vấn đề tối đa
sẽ phát dk luồng dữ liệu đến user thứ k có Nrk antenna thu hóa tổng tốc độ bit tương đối khó khăn vì sự ảnh hưởng qua
trong cell. Chú ý, mỗi cell có thể có nhiều user, tuy nhiên tại lại lẫn nhau của các biến thiết kế và bản chất không lồi của
mỗi thời điểm chỉ một user được phục vụ trên một kênh tần bài toán tối ưu [4]. Gần đây, một thông số được sử dụng đánh
số. Để sử dụng hiệu quả tần số, các trạm phát có thể dùng giá dung lượng hệ thống can nhiễu là bậc tự do (DoF). DOF
chung một tần số tại một thời điểm. Mô hình này được biết được định nghĩa như sau [9]
đến như mô hình kênh MIMO có can nhiễu [9]. K

Rk
k
DoF = lim
SN R→∞ log2 (SN R)
Các bậc tự do tối ưu có thể đạt được bằng kỹ thuật sắp xếp
can nhiễu [6], [7]. Theo kỹ thuật sắp xếp can nhiễu [9], bộ thu
sẽ khôi phuc được dk luồng tín hiệu mà không bị ảnh hưởng
can nhiễu từ các user khác nếu các điều kiện sau được thỏa
mãn:

rank W H k H k,k F k = dk (6a)
WH
k H k,�F � = 0, ∀� �= k, � ∈ K. (6b)
Trong các bài báo [8], vấn đề thiết kế các ma trận thu phát
thỏa điều kiện (6) được viết lại dưới dạng bài toán tối thiểu
Hình 1. Mô hình hệ thống phối hợp giữa các cell. công suất can nhiễu rò rỉ.
Giả sử tín hiệu x k ∈ C dk ×1 là dk luồng tín hiệu được phát từ III. KỸ THUẬT SẮP XẾP CAN NHIỄU KHI THÔNG TIN TRẠNG
trạm gốc thứ k đến user thứ k. Trạm gốc tiền mã hóa tín hiệu THÁI KÊNH HOÀN HẢO
bằng kỹ thuật xử lý tín hiệu tuyến bởi ma trận F k ∈ C Ntk ×dk . Kỹ thuật sắp xếp can nhiễu trong [9], [10] chỉ tập trung vào
Khi đó, tín hiệu thu ở user thứ k được cho bởi phương trình tối thiểu công suất can nhiễu rò rỉ vào không gian tín hiệu,
K
nó không quan tâm đến nhiễu cũng như can nhiễu giữa các
yk = H klF lx l + z k (1) luồng tín hiệu. Gần đây, các phương pháp sắp xếp can nhiễu
l=1 có xét đến ảnh hưởng của nhiễu và công suất tín hiệu mong
trong đó H kl ∈ C Nrk ×Ntl là ma trận kênh truyền từ trạm phát muốn được giới thiệu trong [12]–[14]. Từ (3), ta có thể tính
thứ l đến user thứ k. z k ∼ CN (00, σn2 I ) là nhiễu ở bộ thu. Với công suất thành phần tín hiệu không mong muốn ở bộ thu k
giả sử E[x như sau:
k ] = I , công suất phát ở bộ phát thứ k bị ràng
xkx H
buộc bởi điều kiện W k, F k)
ξk (W WH
= �W 2
k H kk F k − I dk �F
K
F k �2F ≤ Pk,max
�F (2) + WH
�W 2 2 W
k H klF l �F + σn �W
2
k �F .
l=1,l�=k
với Pk,max là công suất phát tối đa cho phép. (7)
310

Trong đó, số hạng thứ nhất trình bày thành phần can nhiễu và kết quả là
giữa các luồng tín hiệu, số hạng thứ 2 là công suất can nhiễu K

của các user khác rò rỉ vào không gian tín hiệu mong muốn Fk = ( HH H −1 H
lk W lW l H lk + λk I Ntk ) H kk W k (15)
và sau cùng là công suất nhiễu ở bộ thu thứ k. Chú ý rằng, l=1
công suất tín hiệu không mong muốn ở mỗi bộ thu bị ảnh trong đó λk được tìm để thỏa điều kiện ràng buộc công suất.
hưởng bởi các chiến lược phát của tất cả các bộ phát trong
mạng. Do đó, khi thông tin trạng thái kênh được biết ở các Algorithm 1 : Tối ưu ma trận thu phát khi CSI hoàn hảo
trạm phát, các trạm phát sẽ phối hợp nhau để tìm chiến lược 1: Inputs: K, Ntk , Nrk , d, H k,� , σn2
, Pk,max , ∀k, l ∈ K, κ =
phát tối ưu nhằm làm giảm tổng công suất các tín hiệu không 0, κmax , trong đó κ là lần lặp thứ κ;
mong muốn ở tất cả các user. Vấn đề thiết kế các ma trận 2: Khởi tạo: ma trận phát {F F (0)
k }k=1 thỏa điều kiện công
K
phát-thu được biểu diễn toán học như sau: suất (2).
K
3: Tính ma trận thu từ (11) và hàm mục tiêu ξ(W W (0) (0)
k ,F k )
min W k, F k) =
ξ(W W k, F k)
ξk (W (8a) 4: repeat
Fk
W k ,F
k=1 5: κ = κ + 1;
s.t. F k �2F ≤ Pk,max , k = 1 . . . K.
�F (8b) 6: Cố định {W W (κ−1)
k k=1 , tính {F
}K F (κ)
k }k=1 từ (15).
K
(κ) K (κ) K
7: Cố định {F F k }k=1 , tính {W W k }k=1 từ (11);
Chúng ta có thể quan sát rằng bài toán tối ưu (8) không lồi
theo biến (WW k , F k ), tuy nhiên nó là bài toán tối ưu lồi cho 8: Tính giá trị hàm mục tiêu ξ(W W (κ) (κ)
k ,F k )
từng biến W k hoặc F k riêng biệt. Do đó, chúng tôi áp dụng 9: until κ = κmax or |ξ(W W (κ) (κ)
k ,F k ) −
(κ−1) (κ−1)
phương pháp tối ưu luân phiên để tìm nghiệm tối ưu. Wk
ξ(W ,F k )| ≤ �.
Thiết kế ma trận thu: Cho trước các chiến lược phát, vấn
đề thiết kế ma trận thu có thể biểu diễn thành Trong đó κmax số lần lặp tối đa cho phép và � độ chính xác
K mong muốn. Chú ý rằng khi cố định ma trận thu hoặc phát,

W k, F k) =
min ξ(W W k , F k ).
ξk (W (9) bài toán (8) là tối ưu lồi cho biến còn lại. Do đó, mỗi bước
Wk
k=1
lặp trong giải thuật 1 sẽ làm cho hàm mục tiêu không tăng.
Hơn nữa, hàm mục tiêu bị chặn dưới bởi zero. Do đó, sự hội
Chú ý, các bộ lọc thu k chỉ ảnh hưởng chất lượng tín hiệu ở tụ của giải thuật 1 luôn được đảm bảo.
bộ thu k mà không ảnh hưởng đến các bộ thu khác. Do đó,
lời giải tối ưu có thể tìm từ điều kiện sau: IV. KỸ THUẬT SẮP XẾP CAN NHIỄU KHI THÔNG TIN TRẠNG
THÁI KÊNH KHÔNG HOÀN HẢO
K
∂ξk Trong phần trên, các trạng thái thông tin của kênh được giả
∗ =( H klF lF H H
W k − H kkF k + σn2 W k = 0.
l H kl )W
Wk
∂W
l=1
sử là hoàn hảo và được biết ở các thiết bị thu-phát. Tuy nhiên,
(10) trong thực tế, trạng thái thông tin của kênh đạt được là do ước
Kết quả ma trận thu tối ưu là lượng và sai số ước lượng là không thể tránh khỏi. Trong phần
K
này, chúng ta xem xét kênh truyền không hoàn hảo được mô

Wk = ( H klF lF H H 2 −1
(11) tả bới phương trình [16]:
l H kl + σnI Nrk ) H kk F k .
l=1 H kl = H kl + Δ kl (16)
Thiết kế ma trận phát: Cố định các ma trận thu, vấn đề thiết trong đó H kl là trạng thái thông tin kênh được ước lượng và
kế ma trận phát từ (8) là sai số ngẫu nhiên Δ kl có các thành phần phân bố Gaussian
K
với
min W k, F k) =
ξ(W W k, F k)
ξk (W (12a) E(vec(Δ Δkl )H ) = σΔ
Δkl )vec(Δ 2
I Ntk Nrk . (17)
Fk
k=1 Khi đó, trung bình công suất tín hiệu không mong muốn ở bộ
s.t. F k �2F ≤ Pk,max , k = 1 . . . K.
�F (12b) thu k được tính bằng
Bài toán tối ưu trên là bài toán tối ưu lồi theo biến F k . Để tìm
K
ξ˜k = EΔ kl [ξk ] = �W
WH 2
k H kk F k − I dk �F + WH
�W 2
k H klF l �F
nghiệm tối ưu, chúng ta định nghĩa hàm Lagrange như sau: l=1
K

K
+σn2 �W
W k �2F + σΔ
2 W
�W k �2F F l �2F .
�F
W k, F k) +
L(λk , F k ) = ξ(W F k �2F − P k,max ). (13)
λk (�F
l=1
k=1 (18)
Sử dụng điều kiện KKT (Karush–Kuhn–Tucker), ta có thể tìm Vấn đề thiết kế bộ thu phát tối ưu bền vững khi kênh truyền
nghiệm tối ưu từ phương trình [15] không hoàn hảo được cho bởi
K

K
∂L min ˜ W k, F k) =
ξ(W ξ˜k (W
W k, F k) (19a)
∗ =( HH H
Fk − HH
lk W lW l H lk )F kk W k + λk F k = 0 Wk
F k ,W
Fk
∂F k=1
l=1
(14) s.t. F k �2F ≤ Pk,max , k = 1 . . . K.
�F (19b)
311

So sánh với bài toán (8), ta thấy phương pháp tối ưu bền vững Algorithm 2 : Tối ưu bền vững cho ma trận thu phát khi CSI
hướng tới tối thiểu công suất của thành phần không chắc chắn không hoàn hảo
của kênh ở ngõ ra bộ lọc thu. 1: Inputs: K, Ntk , Nrk , d, H k,� , σn
2
, σΔ2
, Pk,max , ∀k, l ∈ K,
Thiết kế ma trận thu tối ưu bền vững: Vấn đề thiết kế ma κ = 0, κmax , trong đó κ là lần lặp thứ κ;
trận thu bền vững khi thông tin trạng thái kênh không hoàn 2: Khởi tạo: ma trận phát {F F (0)
k }k=1 thỏa điều kiện công
K
hảo đươc viết thành suất (2).
K 3: Tính ma trận thu từ (22) và hàm mục tiêu ξ(W ˜ W (0) , F (0) )
k k
˜ W k, F k) =
min ξ(W ξ˜k (W
W k , F k ). (20) 4: repeat
Wk
k=1 5: κ = κ + 1;
6: Cố định {W W (κ−1)
k k=1 , tính {F
}K F (κ)
k }k=1 từ (26);
K
Bởi vì các ma trận thu W k không ảnh hưởng qua lại lẫn nhau, 7: Cố định {F
(κ) K
F k }k=1 , tính {W (κ) K
W k }k=1 từ (22);
các bộ thu tối ưu có thể tìm từ điều kiện ˜ W (κ) , F (κ) )
8: Tính giá trị hàm mục tiêu ξ(W k k
K
9: until κ = κmax or |ξ(W ˜ W (κ) , F (κ) ) −
k k
∂ ξ̃k klF lF H H
H + σ 2 I d )W
W∗
∂W =( H l kl n k Wk ˜ W (κ−1) , F (κ−1) )| ≤ �.
ξ(W
k k k
l=1 (21)
kkF k + σ 2 ( �F
K
−H e F l �2F )W
W k = 0.
l=1
V. KẾT QUẢ MÔ PHỎNG
Khi đó, ta rút ra bộ lọc thu tối ưu là Phần này sẽ cung cấp các kết quả mô phỏng để đánh giá sự
K hiệu quả của phương pháp được trình bày trong bài báo. Hệ
K
Wk = H klF lF H H 2
l H kl + σe ( F l �2F )II Nrk
�F thống được mô phỏng bao gồm K = 3 cell. Mỗi trạm phát
l=1 l=1 (22) được trang bị Ntk = Nt = 4 antenna phát và mỗi bộ thu sử
−1
+σn2 I Nrk H kkF k . dụng Nrk = Nr = 4 antenna. Các cập thu phát đồng thời và
trên cùng phổ tần số. Mỗi cặp thu-phát sẽ truyền dk = d = 2
Thiết kế ma trận phát bền vững: Từ (19), vấn đề thiết kế luồng dữ liệu độc lập. Kênh truyền ước lượng được giả sử có
ma trận phát khi biết được ma trận thu được viết thành phân bố Rayleigh với phương sai bằng 1 và các thành phần
K
sai số ước lượng có phân bố Gaussian phức với phương sai
min ˜ W k, F k) =
ξ(W ξ˜k (W
W k, F k) (23a) σΔ2
. Phương sai của nhiễu được chuẩn hóa σn2 = 1. Công
Fk
k=1 suất phát của các trạm giả sử bằng nhau Pk,max = Pmax . Tỷ
s.t. F k �2F ≤ Pk,max , k = 1 . . . K.
�F (23b) số công suất tín hiệu trên công suất nhiễu được định nghĩa
SN R = Pmax /σn2 .
Tương tự như phần thiết kế bộ phát khi thông tin trạng thái Ví dụ 1: Trong ví dụ này, chúng ta sẽ khảo sát đặc tính hội
kênh hoàn hảo, ta sử dụng phương pháp Lagrange để tìm tụ của giải thuật 1 và 2. Chọn tùy ý SNR và một lần thực
nghiệm tối ưu. Hàm Lagrange được xác đinh bởi biểu thức hiện kênh ngẫu nhiên, chúng ta sẽ khảo sát giá trị của hàm
sau mục tiêu qua các bước lặp. Hình 2 minh họa đặc tính hội tụ
K của giải thuật tại SN R = 20 dB. Chúng ta có thể quan sát

˜ W k, F k) +
L(λk , F k ) = ξ(W F k �2F − P k,max ). (24)
λk (�F từ hình 2 rằng hàm mục tiêu đơn điệu giảm sau mỗi bước lặp
k=1
và hội tụ đến lời giải tối ít hơn 100 bước lặp.
Ví dụ 2: Ví dụ này đánh giá tổng tốc độ bit của toàn mạng
Bộ phát tối ưu thỏa điều kiện khi thông tin trạng thái kênh hoàn hảo và không hoàn hảo.
K
Ba phương pháp được so sánh bao gồm: giải thuật 1 khi trạng
thái thông tin kênh hoàn hảo (Perfect CSI), giải thuật 2 bền
∂L
=( H W lW H H
H lk )F
Fk − HH
F∗ lk l kk W k
∂F k vững (robust) khi trạng thái thông tin kênh không hoàn hảo, và
l=1
K (25) phương pháp khi bộ thu chỉ sử dụng trạng thái thông tin ước

2
+σΔ ( W l �2F )F
�W Fk + λkF k = 0. lượng và không tối ưu bến vững (non-robust). Kết quả tổng tốc
l=1 độ bit trung bình của 3 phương pháp được trình bày trong hình
3 khi phương sai của sai số ước lượng kênh σΔ2
= {0.01, 0.05}.
Kết quả bộ phát tối ưu là
Từ hình 3, ta có thể thấy rằng khi thông tin trạng thái kênh
K K không hoàn hảo, dung lượng của hệ thống giảm, và tổng bậc

Fk = HH H 2
lk W lW l H lk + σΔ ( W l �2F ))II Ntl
�W tự do giảm. Ngoài, ra phương pháp bền vững cải thiện được
l=1 l=1 tổng tốc độ bit khoảng 3 bps/Hz so với phương pháp tối ưu
−1 H W k.
+λkI Ntk ] H kk không bền vững.
(26)
Giải thuật luân phiên tối ưu ma trận thu phát khi thông tin VI. KẾT LUẬN
trạng thái kênh không hoàn hảo được tóm tắt trong giải thuật Bài báo đã trình bày một kỹ thuật sắp xếp can nhiễu trong
2. Tương tự giải thuât 1, giải thuật 2 cũng đảm bảo hội tụ. hệ thống thông tin vô tuyến nhiều cell. Phương pháp giới thiệu
312

hoàn hảo và tối ưu bền vững có thể cải thiện dung lượng của
1.4
hệ thống.
1.2 Perfect CSI LỜI CẢM ƠN
Robust σ2 =0.05
Δ Nghiên cứu này được tài trợ bởi Quỹ phát triển khoa học và
1
công nghệ quốc gia (NAFOSTED) trong đề tài mã số 102.04-
Objective function ξ
0.8
2013.46.
TÀI LIỆU
0.6
[1] H. Dahrouj and W. Yu, “Coordinated beamforming for the multicell
multi-antenna wireless system,” IEEE Trans. Wireless Commun., vol. 9,
0.4 pp. 1748–1759, May 2010.
[2] A. Tolli, H. Pennanen, and P. Komulainen, “Distributed coordinated
0.2 multi-cell transmission based on dual decomposition,” pp. 1–6, Nov
2009.
[3] E. Bjornson, M. Bengtsson, and B. Ottersten, “Optimality properties and
0
10 20 30 40 50 60 70 80 90 100 low-complexity solutions to coordinated multicell transmission,” pp. 1–
Iteration index 6, Dec 2010.
[4] C. Ng and H. Huang, “Linear precoding in cooperative MIMO cellular
networks with limited coordination clusters,” IEEE J. Sel. Areas Com-
Hình 2. Đặc tính hội tụ của các giải thuật lặp. mun., vol. 28, pp. 1446–1454, Dec. 2010.
[5] R. Zakhour, Z. Ho, and D. Gesbert, “Distributed beamforming coordi-
nation in multicell mimo channels,” in IEEE Veh. Technol. Conference
60 (VTC), pp. 1–5, April 2009.
Perfect CSI [6] S. Jafar and S. Shamai, “Degrees of freedom region of the MIMO X
Robust σ2 =0.05
channel,” IEEE Trans. Inform. Theory, vol. 54, pp. 151–170, Jan 2008.
50 Δ [7] S. A. Jafar, “Interference alignment: a new look at signal dimensions in
Non−robust σ2 =0.05 a communication network,” Foundations and Trends in Communications
Average Sum Rate (bps/Hz)
Δ
and Information Theory, vol. 7, no. 1, pp. 1–136, 2011.
40 Non−robust σ2 =0.01 [8] K. Gomadam, V. Cadambe, and S. Jafar, “A distributed numerical ap-
Δ
Robust σ2Δ=0.01 proach to interference alignment and applications to wireless interference

networks,” IEEE Trans. Inform. Theory, vol. 57, pp. 3309–3322, June
30 2011.
[9] V. Cadambe and S. Jafar, “Interference alignment and degrees of
freedom of the K -user interference channel,” IEEE Trans. Inform.
20 Theory, vol. 54, pp. 3425–3441, Aug 2008.
[10] S. Peters and R. Heath, “Interference alignment via alternating minimiza-
tion,” in Proc. IEEE International Conference on Acoustics, Speech and
10
Signal Processing, (ICASSP), pp. 2445–2448, April 2009.
[11] D. Papailiopoulos and A. Dimakis, “Interference alignment as a rank
0
constrained rank minimization,” IEEE Trans. Signal Process., vol. 60,
0 5 10 15 20 25 30 35 40 pp. 4278–4288, Aug 2012.
SNR (dB) [12] A. Dong, H. Zhang, D. Yuan, and X. Zhou, “Interference alignment
transceiver design by minimizing the maximum mean squared error for
MIMO interfering broadcast channel,” IEEE Trans. Veh. Technol., p. to
Hình 3. Tổng tốc độ bit của hệ thống.
appear, 2015.
[13] H. Shen, B. Li, M. Tao, and X. Wang, “MSE-based transceiver designs
for the MIMO interference channel,” IEEE Trans. Wireless Commun.,
trong bài báo không những giảm công suất can nhiễu giữa các vol. 9, pp. 3480–3489, Nov. 2010.
cell mà còn giảm can nhiễu giữa các luồng tín hiệu. Ngoài ra, [14] S. Ma, H. Du, T. Ratnarajah, and L. Dong, “Robust joint signal
and interference alignment in cognitive radio networks with ellipsoidal
vấn đề thông tin trạng thái kênh không hoàn hảo cũng được channel state information uncertainties,” IET Commun., vol. 7, pp. 1360–
xem xét trong tối ưu bền vững để thiết kế các bộ thu phát. 1366, Sept. 2013.
Các phương pháp trình bày trong bài báo thực sự hiệu quả vì [15] S. Boyd and L. Vandenberghe, Convex Optimization. Cambridge
University Press, 2003.
tìm được biểu thức ở mỗi bước lặp, đồng thời giải thuật tối [16] X. He and Y.-C. Wu, “Probabilistic QoS constrained robust downlink
ưu đảm bảo sự hội tụ. Các kết quả mô phỏng cho thấy rằng multiuser mimo transceiver design with arbitrarily distributed channel
dung lượng hệ thống giảm khi thông tin trạng thái kênh không uncertainty,” IEEE Trans. Wireless Commun., vol. 12, pp. 6292–6302,
Dec. 2013.
313

HộiHội
ThảoThảo Quốc
Quốc GiaGia 2015vềvềĐiện
2015 ĐiệnTử,
Tử,Truyền
TruyềnThông
Thông và
và Công
CôngNghệ
NghệThông
ThôngTinTin
(ECIT 2015)
(ECIT 2015)
PHÂN TÍCH TỶ SỐ TÍN HIỆU/ TẠP CỦA

HỆ THỐNG RADAR MIMO
Lê Ngọc Uyên, Võ Văn Phúc, Đinh Văn Trường và Cao Văn Vũ
Viện Ra đa,
Viện Khoa học và Công Nghệ Quân sự/ Bộ Quốc phòng
Email: uyenvrd2006@gmail.com, phuchvktqs@gmail.com, dinvit2403@gmail.com, vucaovan@gmai.com
Abstract— Bài báo phân tích so sánh về tỷ lệ tín hiệu/ tạp của hệ Do đó, diện tích phản xạ hiệu dụng (RCS) của mục tiêu sẽ
thống radar với anten mạng pha chủ động thông thường và không phụ thuộc vào sự thay đổi ngẫu nhiên của đường truyền
radar MIMO với các anten phát bố trí cùng vị trí, tín hiệu được khác nhau. Cho nên, mỗi thành phần được tách ra bằng các bộ
mã hóa và với các anten riêng biệt, gọi là "radar MIMO thống lọc máy thu sẽ mang thông tin độc lập về mục tiêu. Vì thế chất
kê”.
lượng phát hiện sẽ tốt hơn.
Keywords- Hệ thống radar MIMO, mạng pha tích cực MIMO radar với các anten phát được bố trí cùng vị trí, như
vậy RCS được quan sát bởi một đường truyền giống nhau. Các
I. ĐẶT VẤN ĐỀ thành phần được tách ra bằng các bộ lọc phối hợp trong mỗi
Trong những năm gần đây, các giới khoa học nước ngoài, anten thu mang thông tin của một đường truyền từ một phần tử
người ta quan tâm tới sự phát triển của MIMO (Multiple Input anten phát đến một phần tử anten thu. Bằng cách sử dụng toàn
- Multiple Output) radar [1-5]. Theo nghĩa chung nhất, các hệ bộ thông tin của các đường truyền, có thể đạt được độ phân
thống MIMO ra đa (Hình. 1) được thiết lập bởi K phần tử phát giải không gian tốt hơn.
(vị trí phát), phát xạ K tín hiệu và L phần
tử thu (vị trí thu), đảm bảo thu đồng thời và xử lý các tín hiệu
này bởi tổng tương ứng của nó [5].
Hệ thống các tín hiệu này là tín hiệu có dạng sóng trực giao
với nhau.
Theo định nghĩa tổng quát, nhiều hệ thống ra đa truyền
thống có thể được xem như những trường hợp đặc biệt của
MIMO ra đa. Ví dụ, ra đa có mặt mở tổng hợp, sử dụng một
anen phát đơn và một anten thu đơn, các vị trí của hai anten
này được tách biệt có thể được coi như MIMO ra đa với sự
phân bố đều (quan hệ trực giao) theo tín hiệu thời gian. Hình 2. Hai loại chính MIMO ra đa
Hiện nay, MIMO radar có thể được phân chia thành hai
loại chính (Hình 2). Loại thứ nhất bao gồm MIMO radar với Những ưu điểm chính của MIMO radar so với radar mạng
các anten phát bố trí cùng vị trí và tín hiệu được mã hóa. Loại pha truyền thống [1,5] là: nâng cao khả năng phát hiện mục
thứ hai bao gồm một radar với các anten riêng biệt, gọi là tiêu, nâng cao độ chính xác ước lượng góc, có khả năng quan
"radar MIMO thống kê.” sát mục tiêu với vận tốc tối thiểu, khả năng thích nghi tốt hơn.
Các đặc tính chiến thuật của radar được xác định bởi [2]:
vùng quan sát, các tọa độ được xác định, các tham số chuyển
động của mục tiêu, và độ chính xác đo chúng, chống nhiễu, độ
tin cậy.
Các đặc tính kỹ thuật chung của radar liên quan đến tần số
sóng mang f0 (độ dài bước song λ), công suất đỉnh xung P0;
dạng tín hiệu phát xạ, hệ số tạp máy thu Kt; các phương pháp
quan sát không gian, các phương pháp đo tọa độ; các phương
pháp tách tín hiệu trên nền phản xạ phức tạp (PxPt); dạng và
độ rộng giản đồ hướng anten (GDHA), hệ số đường truyền
(KD), mức cánh sóng bên, mức công suất yêu cầu từ nguồn
nuôi, kích thước và trọng lượng.
Để so sánh các đặc tính của MIMO radar với các loại radar
Hình 1. Nguyên lý chung MIMO ra đa truyền thống, ta xét MIMO radar với mạng anten bố trí cùng vị
MIMO radar với các anten riêng biệt là một trường hợp trí và radar với anten mạng pha (AMP) có cùng tham số kỹ
đặc biệt của hệ thống radar đa vị trí (MPRLS) [6,7]. Mỗi phần thuật như nhau: tần số sóng mang f0 (hay độ dài bước sóng λ);
tử anten phát sẽ quan sát một hướng khác nhau của mục tiêu. công suất phát xung của một kênh (modul) P0; số kênh phát
ISBN: 978-604-67-0635-9 314
314
HộiHội
Thảo Quốc
Thảo GiaGia
Quốc 2015
2015vềvềĐiện
ĐiệnTử,
Tử,Truyền
TruyềnThông
ThôngTinTin (ECIT
(ECIT 2015)
2015)
(K) và số kênh thu (L), dạng tín hiệu phát xạ; độ dài xung T0; (7)
độ rộng dải thông Δf0; hệ số tạp của mỗi kênh thu Kth; cự ly
với các hệ số phức, mà được xác định từ hướng yêu cầu
mục tiêu điểm rmt và mặt phẳng phản xạ hiệu dụng của mục
để giản đồ hướng anten thu đạt giá trị lớn nhất:
tiêu σmt. Ngoài ra trong bài báo này ta chỉ xem xét trong phạm
vi hệ thống dải thông hẹp.
Trước tiên ta cần xác định mô hình cấu trúc của MIMO Khi đó từ (7) ta thấy MPC nội tạp ở đầu ra của bộ cộng
radar và radar với AMP để ta có thể tiện so sánh tiếp theo. (hình 2), sẽ bằng MPC tạp trong một kênh thu và tỷ số tín
hiệu/ tạp đối với radar anten mạng pha được xác định:
II. TỶ SỐ TÍN HIỆU/TẠP
(8)
Trong thực tế, việc phân tích các đặc tính quan trọng, cũng
như tỷ số tín hiệu/ tạp của MIMO radar là không nhiều. Ta sẽ
xem xét, sự kém đi bao nhiêu của tỷ số tín hiệu/ tạp của
MIMO radar so với radar dùng anten mạng pha. Một so sánh
được thực hiện cho các radar dùng anten mạng pha và MIMO
radar với các cấu trúc như hình 2. a, b tương ứng.
Để đơn giản cho việc kiểm nghiệm, các hệ thống anten của
cả hai loại radar sẽ được xem xét mạng anten dạng tuyến tính,
với K phần tử phát và L phần tử thu, đồng thời không ảnh
hưởng đến bộ xử lý giữa các chu kỳ. Kiểm nghiệm tỷ số tín
hiệu/ tạp đối với radar mạng pha và MIMO radar ta sẽ đưa ra
hai phương pháp đánh giá: xem xét trực tiếp và xem xét đồng
thời. Giá trị tỷ số tín hiệu / tạp đối với radar mạng pha sẽ được
xem xét ở đầu ra bộ lọc phối hợp, còn đối với MIMO radar ta
sẽ xem xét ở đầu ra thiết bị xử lý không gian (đầu ra ở bộ cộng
thứ hai).
2.1. Xem xét trực tiếp
2.1.1.Xác định tỉ số tín hiệu/ tạp đối với radar anten mạng
pha:
Đầu tiên, ghi mật độ thông lượng công suất tại các mục tiêu
tạo ra bởi một phần tử của mạng anten (AM)[7]:
(1)
Khi đó mật độ thông lượng công suất ở mục tiêu, tạo bởi K
phần tử AM:
(2)
Mật độ công suất dòng của anten thu:
(3)
Diện tích của L phần tử thu của AM:
(4)
Khi đó công suất nhận được ở đầu ra của bộ cộng (hình 2):
(5)
Tỷ số tín hiệu/ tạp ở đầu ra thiết bị xử lý bên trong chu kỳ
sẽ là [7]:
Hình 2. Các cấu trúc đài radar với anten mạng pha và MIMO
(6) radar
Ở đây: N0- Mật độ phổ công suất (MPC) của nội tạp ở đầu ra
thiết bị xử lý không gian.
Trong bộ cộng được thực hiện bởi tích lũy kết hợp không 2.1.2. Xác định tỉ số tín hiệu/ tạp đối với MIMO radar:
gian của các tín hiệu (tạo giản đồ hướng anten tuyến thu):
315
315
HộiHội Thảo
Thảo QuốcGia
Quốc Gia2015
2015về
về Điện
CôngNghệ
Thông (ECIT 2015)
(ECIT 2015)
Ta xét sơ đồ cấu trúc của thiết bị xử lý không gian MIMO Đồng thời xem xét mà không mất tính tổng quát, ta xét tỷ
radar (hình 2b) ở dạng tương đương (hình 3). số tín hiệu/ tạp trong một chùm tia đơn.
Mật độ dòng ở mục tiêu, tạo bởi m phần tử phát AM
Tỷ số tín hiệu/ tạp đối với radar anten mạng pha khi xem
( ), sẽ tương tự (1). Bởi vì các tín hiệu phát xạ tương
quan lẫn nhau, và tính mật độ tổng công suất dòng ở mục tiêu, xét đồng thời:
theo cách nhìn của tỷ số tín hiệu/ tạp, không chính xác. Tương Tương tự, từ (3), mật độ công suất dòng ở mục tiêu, tạo bởi
tự từ (3), xác định mật độ công suất dòng ở phần thu AM, tạo K phần tử AM:
bởi m phần tử phát xạ: (14)
(9) Mật độ công suất dòng ở anten thu:
(15)
Từ (4), công suất nhận được ở đầu ra bộ cộng:
(16)
Khi đó tỷ số tín hiệu/ tạp đối với radar anten mạng pha:
(17)
Đối với MIMO radar, tỷ số tín hiệu/ tạp không thay đổi. Từ
(12) và (17)
(18)
Tóm lại, kgi xem xét đồng thời tỷ số tín hiệu/ tạp đối với
radar anten mạng pha và MIMO radar là bằng nhau.
Hình 3. Cấu trúc tương đương của thiết bị xử lý không gian các tín
hiệu trong MIMO radar 2.3. Khả năng bù sự mất mát tỷ số tín hiệu/ tạp:
Tỷ số tín hiệu/ tạp bị xấu đi khi xem xét trực tiếp đã được
Khi đó công suất nhận được từ tín hiệu phát xạ thứ m tại nghiên cứu [1, 2]. Để bù sự mất mát này [1] đề xuất tăng thời
đầu ra của bộ cộng thứ hai (hình 2): gian quan sát thông qua thực hiện xem xét đồng thời. Tỷ số tín
(10) hiệu/ tạp ở đầu ra thiết bị tích lũy tổng hợp (TLTC) có thể
được xác định:
Tỷ số tín hiệu/ tạp ở đầu ra thứ m của bộ lọc phối hợp được
xác định: (19)
(11) ở đây: – hiệu quả của thiết bị tích lũy tương can; –
Ở đây: - mất mát từ bộ giải mã kết quả từ tổng các đầu ra tần số lặp của các xung, – độ rộng đặc tính tần số của
bộ lọc phối hợp của hàm tự tương quan với phần còn lại của thiết bị tích lũy tương can; – số xung tích lũy tương can.
hàm tương quan chéo của các tín hiệu khác. Khi đó, để bù sự mất mát tỷ số tín hiệu/ tạp có tính đến TLTC,
Với sự phát xạ đồng thời K tín hiệu trực giao, tỷ số tín cần phải tăng số lượng xung tích lũy lên LTLTC lần. Đối với các
hiệu/ tạp (11) sẽ ở đầu ra của mỗi K bộ lọc phối hợp. Trên bộ tín hiệu phản xạ:
cộng thứ hai được thực hiện tích lũy không gian kết hợp, và III . KẾT QUẢ MÔ PHỎNG
tương ứng tỷ số tín hiệu/ tạp tăng lên K lần. Tỷ số tín hiệu/ tạp
tại đầu ra của bộ cộng thứ hai là: Để thuận lợi phân tích ảnh hưởng của tỷ số tín hiệu/ tạp, ta
xem xét khả năng phát hiện mục tiêu của đài radar mạng pha
truyền thống và radar MIMO, mục tiêu được giả định phần
(12) lớn là mục tiêu tán xạ nhỏ tuân theo phân bố Gauss. Nhiễu tạp
Từ (8) và (12) ta có:
của hệ thống là nhiễu tạp trắng Gausian có các tham số đã
K. (13) biết. các đường cong RCO (đặc trưng hoạt động của máy thu)
của ra đa MIMO trong phân bổ khác nhau được thể hiện trong
Nếu bỏ qua sự mất mát do bộ giải mã thì từ (13) ta thấy khi hình 5.
xem xét trực tiếp tỷ số tín hiệu/ tạp của MIMO radar kém hơn
Các đường cong ROC phản ánh mối quan hệ giữa xác
K lần so với radar anten mạng pha. Điều này cho thấy trong
MIMO radar thiếu giản đồ hướng của mạng phát. suất báo động lầm và xác suất phát hiện đúng tương ứng. Đài
ra đa mạng pha truyền thống trong hình 2 tương ứng với chỉ
2.2. Xem xét đồng thời
316
316
HộiHội
Thảo Quốc
Thảo Gia
Quốc 2015
Gia 2015về
vềĐiện
ĐiệnTử,
Tử,Truyền
NghệThông
ThôngTinTin (ECIT
(ECIT 2015)
2015)
một mảng truyền yếu tố, M là số đường dẫn khởi động độc Trong hình 3 ta thấy, cùng một SNR, xác suất phát hiện của
lập. Ra đa MIMO tăng lên với việc tăng phần tử mạng phát.
Như trong hình 4, với cùng một xác suất báo động lầm Nhưng khi SNR là tương đối nhỏ, khả năng phát hiện của
thì xác suất phát hiện đúng của mảng ra đa truyền thống là nhỏ mảng ra đa truyền thống là tốt hơn so với ra đa MIMO. Chỉ
hơn so với Ra đa MIMO. Ra đa MIMO nhiều phần tử phát độc khi SNR lớn hơn l0dB , khả năng phát hiện của ra đa MIMO
lập mang lại hiệu suất phát hiện tốt hơn. sẽ tốt hơn các ra đa mảng truyền thống. Do đó, số lượng tín
hiệu phát nên được xác định theo nhiễu hệ thống khi thiết kế
các hệ thống ra đa MIMO
IV. KẾT LUẬN
Nhược điểm chính của radar MIMO - sự suy giảm tỷ lệ tín
hiệu / tạp ở đầu ra của thiết bị xử lý không gian-thời gian, là
do truyền phát xạ không định hướng và tổng nội tạp lớn (K
lần) trong các kênh thu. Nhược chế này đã hạn chế phạm vi áp
dụng của radar MIMO. Khắc phục nhược điểm này bằng cách
tăng thời gian quan sát có thể không phải lúc nào cũng thực
hiện được. Rõ ràng là bù toàn bộ hoặc một phần mất mát tỷ số
tín hiệu/ tạp do tích lũy tổng hợp đạt được chỉ khi sử dụng số
phần tử AM không lớn.
Hình 4. Mối quan hệ của xác suất phát hiện đúng và xác suất báo TÀI LIỆU THAM KHẢO
động lầm [1]. Черняк В. С. О новом направлении в радиолокации: MIMO РЛС. //
Прикладная радиоэлектроника. 2009.— № 7.— С. 34—46.
Các mối quan hệ xác suất phát hiện mục tiêu của ra đa [2]. Черняк В. С. Многопозиционные радиолокационные системы на
MIMO và SNR (tỷ số tín hiệu/ tạp) được thể hiện trong hình 3. основе MIMO РЛС // Успехи современной радиоэлектроники.—
2012.— № 8.— С. 29—45.
[3]. Li J., Stoica P., Xie Y. On probing signal design for MIMO radar // IEEE
Trans. on Signal Processing. 2007.— Vol. 55, N 8. P. 4151—4161.
[4]. Li J., Stoica P. MIMO radar signal processing.— New Jersey: A John
Wiley & sons inc., 2009.
[5]. Daum F., Huang J. MIMO Radar: Snake Oil or Good Idea // IEEE A&E
Systems Magazine, May 2009.
[6]. Черняк В. С. Многопозиционная радиолокация.— Москва: Радио и
связь, 1993.— 416 с.
[7]. Охрименко А. Е. Теоретические основы радиолокации и РЭБ. Часть
I.— Москва: Воениздат, 1983.
Hình 5. Xác suất phát hiện và quan hệ SNR
317
317
Nâng cao tốc độ truyền tin trong một kênh nước biển
nông thuộc vịnh Bắc Bộ của Việt Nam
dùng điều chế OFDM
Trần Cao Quyền
Khoa Điện tử-Viễn Thông,
Trường Đại Học Công Nghệ (ĐHQGHN)
Email: quyentc@vnu.edu.vn
Abstract— Bài báo này giới thiệu về truyền tin quy mô nhỏ trong bằng phần mềm là chính. Chính vì tất cả các ưu điểm trên dẫn
một kênh nước biển nông thuộc vịnh Bắc Bộ của Việt Nam, với đến xem xét sử dụng điều chế OFDM cho kênh thủy âm. Các
độ sâu dưới 50 m, cự ly 1km. Độ phân tán thời gian (độ trải trễ) nghiên cứu theo hướng này trên thế giới có thể kể đến như [5-
tối đa trong kênh giả thiết là 10 ms, độ phân tán tần số tối đa 8].
(dịch tần Doppler cực đại) là 9Hz ứng với vận tốc cơ bản vài m/s
của các thiết bị chuyển động dưới nước (không phải tàu ngầm).
Các tính toán giải tích và mô phỏng sử dụng điều chế ghép theo Phần còn lại của bài báo được tổ chức như sau: trong phần
tần số trực giao (OFDM) với tần số sóng mang 9KHz được đưa II, chúng tôi miêu tả thềm lục địa vịnh Bắc Bộ. Phần III, mô
ra. Các kết quả đã chứng minh tính hiệu quả của sử dụng điều hình kênh nước biển nông được giới thiệu. Thiết kế hệ thống
chế OFDM trong loại hình kênh này, tốc độ truyền tin có thể đạt cho ở Phần IV. Phần V là các kết quả mô phỏng. Cuối cùng là
được tới 13Kbps kết luận bài báo.
Keywords- Kênh nước biển nông, OFDM, độ trải trễ, dịch tần II. THỀM LỤC ĐỊA VỊNH BẮC BỘ
Doppler, SONAR(định vị và đo xa dùng sóng âm).
Theo [1] thì thềm lục địa vịnh Bắc Bộ bao gồm toàn bộ đáy
vịnh Bắc Bộ kéo xuống tới vĩ độ 16o00’ Bắc ngang Đà Nẵng.
I. GIỚI THIỆU Thềm lục địa ở đây dạng một lòng chảo chạy ép sát về phía
Như chúng ta đã biết Việt Nam là một quốc gia biển, biển đảo Hải Nam và có sườn máng dốc hơn về phía Việt Nam. Độ
của ta là một phần của biển Đông. Theo Công ước Luật Biển sâu trung tâm vịnh đạt tới 70-80 m, vùng cửa vịnh khoảng
năm 1982 [1], vùng đặc quyền kinh tế mở rộng tới khoảng cách 100m và ở rìa thềm lục địa khoảng 200 m.
tối đa 200 hải lý (1 hải lý = 1.852 m) tính từ đường cơ sở. Hầu hết diện tích thềm lục địa có góc dốc 2’-5’. Mức độ
Nước CHXHCN Việt Nam có chủ quyền hoàn toàn về thăm chia cắt sâu nhỏ. Chiếm ưu thế ở đây là các dạng địa hình âm
dò, khai thác, bảo vệ và quản lý tất cả các tài nguyên thiên dạng máng trũng đan nhau kiểu phân nhánh. Chúng có hướng
nhiên, sinh vật và không sinh vật ở vùng nước, ở đáy biển và dốc về phía vịnh Bắc Bộ và là dấu vết của thung lũng cổ. Nơi
trong lòng đất dước đáy biển của vùng đặc quyền về kinh tế gặp nhau của các máng này là các hố trũng, đôi khi sâu đến
của Việt Nam. Hiện nay sự quan tâm nghiên cứu về biển và 108 m như đã phát hiện ở phía ngoài khơi đảo Cồn Cỏ 120 km
đảo đang có tính thời sự, có ý nghĩa kinh tế, xã hội và an ninh về phía Đông Bắc. Các dạng địa hình dương thường là các
quốc phòng. Trong đó nghiên cứu về truyền tin dưới nước mỏm đá ngầm, các vết lộ của các cồn đá cổ còn sót lại, chúng
đóng một vai trò quan trọng. phân bố ven bờ và quanh các đảo như Bạch Long Vĩ.,
Đặc điểm của truyền tin dưới nước cho một loại kênh phức Trong bài báo này chúng tôi chỉ mới khảo sát địa hình vịnh
tạp, chịu phân tán cả về tần số và thời gian nặng [2]. Các Bắc Bộ, tuy nhiên nước ta còn có 03 vùng biển khác là Trung
nghiên cứu gần đây về sử dụng điều chế khóa dời tần số (FSK) Bộ, Đông Nam Bộ và Tây Nam.
ở Mỹ đã có một số kết quả nhất định, đặc biệt về giảm giá
thành thiết bị [3]. Tuy nhiên vẫn còn bị hạn chế về mặt tốc độ
truyền tin, chỉ đạt 5400 bauds. Mặt khác kỹ thuật điều chế III. MÔ HÌNH KÊNH NƯỚC BIỂN NÔNG
OFDM cho phép truyền song song các sóng con nên tốc độ
A. Mô hình kênh nước biển nông
truyền tin có thể tăng lên tuyến tính theo số sóng con sử dụng.
Việc kéo dài độ rộng ký hiệu phát giảm ảnh hưởng của kênh Ta biết rằng vận tốc sóng âm trong nước biển thay đổi theo
quy mô nhỏ từ Fading lựa chọn tần số thành Fading phẳng. độ sâu, phụ thuộc vào nhiệt độ, khí quyển, áp suất và độ mặn
Dùng tiền tố vòng (CP) làm cho hệ thống có khả năng kháng của nước biển. Tại các kênh nước sâu khi có các lớp đảo nhiệt
Fading cao hơn, thay vì mất toàn bộ thông tin thì chỉ có một số độ thì vận tốc âm cũng biến đổi tạo nên các hiện tượng khúc
bit bị ảnh hưởng [4]. Các bộ biến đổi biến đổi Fourier nhanh xạ dương (tia sóng bị bẻ cong lên trên) hay khúc xạ âm (tia
thuận/ ngược (FFT, IFFT) cho phép thực thi hệ thống OFDM sóng bị bẻ cong xuống dưới).
318
ISBN: 978-604-67-0635-9 318
Tuy nhiên trong kênh nước biển nông thì tốc độ âm có thể trong [2] mô tả đáp ứng xung kênh thủy âm với các tham số
coi là hằng số. Chính vì vậy hiện tượng chính chi phối các f  5,10,15 KHz và dải thông 5KHz . Đáp ứng xung này
kênh nước nông là phản xạ âm tại bề mặt, đáy biển và vật thể. có 5 tap ứng với kết quả đo của 5 đường đầu tiên, đường trực
tiếp có công suất lớn nhất, đường thứ hai suy giảm một nửa so
với đường thứ nhất, các đường sau đóng góp ít hơn nữa vào
kết quả (Hình 2). Trong bài báo này chúng tôi sử dụng các kết
quả này là nguồn tham khảo cơ bản khi chưa có điều kiện tiến
hành các phép đo trên thực địa.
1.5
Kenh thuy am voi f=5,10,15KHz, bang thong 5KHz
Dap ung xung cua kenh

1
Hình 1. Mô hình đa đường trong kênh nước nông
Chúng tôi tiếp tục khảo sát kênh thủy âm với cự ly 1 km giống
như ở [9] và cũng để tiện cho tiến hành các thực nghiệm sau
này. 0.5
Đồng thời khi quan sát kênh thủy âm trên quy mô nhỏ, ta
cần quan tâm đến 03 yếu tố quan trọng: băng thông, trải trễ đa
đường tối đa và dịch tần Doppler cực đại.
A1. Băng thông 0
0 1 2 3 4 5 6 7
Do sử dụng sóng âm là phương tiện mang nên dải tần sẽ Do tre(don vi=10ms)
rất hẹp, thông thường khoảng 5KHz. Trước đây Mỹ dùng các
thiết bị SONAR dải siêu âm, tuy nhiên xu thế hiện nay họ Hình 2. Đáp ứng xung của kênh thủy âm với f=5,10,15 KHz, băng
chuyển sang dung các thiết bị âm tần với dải tần 0-20KHz thông 5KHz (tài liệu [2]).
[10]. A3. Dịch tần Doppler
A2. Trải trễ đa đường Do có sự chuyển động tương đối giữa máy phát và máy thu
Ở phía thu ngoài đường trực tiếp còn nhận các đường phản trong kênh thủy âm nên xảy ra hiện tượng dịch tần Doppler.
xạ từ hai biên (mặt và đáy biển) tạo ra hiện tượng đa đường. Chính vì thế ta luôn phải tính toán đến các dạng méo gây ra do
Chặt chẽ mà nói thì có vô số đường, nhưng chúng chịu phản loại chuyển động này trong các thiết kế, đặc biệt trong các
xạ nhiều lần và mất hết năng lượng nên bị bỏ qua, chỉ còn lại thuật toán đồng bộ. Biên độ của hiệu ứng Doppler tỉ lệ với hệ
một số hữu hạn các đường chính. v
Giả thiết cự ly truyền giữa Tx (phát) và Rx (thu) là lp. Đường số a  , trong đó v là vận tốc tương đối giữa Tx và Rx, c là
c
lp vận tốc sóng âm.
khỏe nhất truyền trực tiếp qua đoạn lp mất thời gian t0  ,
c Để có thể so sánh ta xét một hệ thống vô tuyến di động tốc
7
với c là vận tốc âm. Các đường phản xạ đến Rx sẽ trễ một giá độ cao, v=160 km/h thì ta có a  1.5  10 [2], dịch tần
l Doopler tương ứng là a. f c (với fc là tần số sóng mang). Giá
trị thời gian  i  i  t0 so với đường tham chiếu trực tiếp. Độ
c trị này nhỏ cho phép ta bỏ qua các ảnh hưởng lên đồng bộ ký
phân tán thời gian tối đa (độ trải trễ tối đa) xét ở đây là 10 ms, hiệu. Tuy nhiên xét kênh thủy âm, thì vận tốc sóng âm cơ bản
là một giá trị thường được quan sát trong kênh thủy âm [2]. chỉ 1500 m/s nên nếu một thiết bị chuyển động dưới nước
Vì mục tiêu của bài báo là nghiên cứu truyền tin quy mô (không phải tàu ngầm) với vận tốc vài m/s thì hệ số a  10 .
3
nhỏ nên đối tượng quan sát là đáp ứng xung của kênh thủy âm. Trong trường hợp sử dụng sóng siêu âm thì ta không thể bỏ
Nếu gọi hi là độ lợi của đường thứ i thì đáp ứng xung đơn qua các giá trị dịch tần Doppler này.
giản của kênh thủy âm có thể biểu diễn là Tóm lại kênh nước biển nông có các đặc điểm như ở Bảng I
sau
h(t )   hi (t   i ) (1)
Trên thực tế hi của một kênh thủy âm là một hàm của tần số.
Theo thông lệ thì chúng ta có thể mô tả kênh này như một
bộ lọc có đáp xung hữu hạn (FIR) (số tap hữu hạn), trong
đó đặc tính chọn lọc theo tần số thể hiện độ méo dạng của tín
hiệu do ảnh hưởng của kênh truyền. Trong Hình 3,4 và 5
319
319
HộiHội
Bảng I. Tham số kênh nước biển nông Việc chọn khoảng phân cách sóng con 17,6 Hz để trong điều
Tham số Giá trị kiện xấu nhất hệ thống chịu ảnh hưởng dịch tần Doppler
Băng thông (B) 5KHz chiếm khoảng 50% phân cách sóng con. Chọn tham số như vậy
Trải trễ tối đa (  m ) 10 ms cũng để tạo điều kiện thuận lợi cho việc sử dụng các kỹ thuật
bù khử dịch tần Doppler cần thiết.
Dịch tần Doppler cực 10-3x9000Hz=9Hz
Từ các tham số hệ thống OFDM ở Bảng II ta có thể tính
đại( f m  a. f c) được tốc độ lý thuyết của hệ thống OFDM là
Đáp ứng xung (f=5,10,15KHz) như Hình 2 hieu suat su dung phoQPSK  so song con
R
chu ky ky hieu
B. Đáp ứng xung kênh nước biển nông thuộc vịnh Bắc Bộ
Việt Nam 2  384
  13497 bps
Trên cơ sở các phân tích ở trên chúng tôi đề xuất mô 56,9  103
hình kênh nước biển nông thuộc vịnh Bắc Bộ Việt Nam có đáp Theo kết quả [3] hệ thống dùng điều chế FSK 2 mức thì đạt
ứng xung với biên độ tuân theo phân bố Rayleigh như sau: tốc độ lý thuyết là
h  a  jb (2) Rbit  hieu suat su dung pho BFSK  Rbaud
 1 5400  5400 bps
trong đó a , b  N (0,  ) , phân bố Gauss với trung bình
So sánh hai kết quả này thì rõ ràng dùng điều chế OFDM đạt
không và  là phương sai của tạp âm nền môi trường biển tốc độ tốt hơn. Đồng thời vì [3] dùng điều chế FSK với hai tần
vịnh Bắc Bộ. số sóng mang f=1200 Hz, 2200 Hz nên chu kỳ ký hiệu là 0,83
Giá trị tạp âm nền phụ thuộc vào nhiều yếu tố như trạng thái ms và 0,45 ms nhỏ hơn đáng kể so với độ trải trễ tối đa 10 ms,
của biển, tốc độ gió và mật độ lưu thông các phương tiện tàu do đó hệ thống sẽ chịu ảnh hưởng Fading rất lớn từ kênh thủy
thủy. Theo tài liệu [9], nếu trạng thái biển ổn định, tốc độ gió âm, trong nhiều trường hợp sẽ mất hoàn toàn thông tin.
trung bình, mật độ lưu thông tàu thủy vừa phải   90dB
2
Tuy nhiên xét thêm hiện tượng đa đường với độ trải V. KẾT QUẢ MÔ PHỎNG
trễ tối đa 10 ms và chuẩn hóa giá trị độ lợi 2 tap đầu tiên thì Phần này trình bày mô phỏng với các kịch bản sau đây:
đáp ứng xung kênh thủy âm như sau KỊCH BẢN 1
h(t )  0.6* h(t )  0.4* h(t   m ) (3) 1. Mô hình kênh nước biển nông ở vịnh Bắc Bộ Việt Nam
Hệ số phản xạ tại mặt biển là -1 (chỉ quay pha), tia âm phản như mô tả ở phần III. Ở đây sử dụng công thức (2) cho
xạ tại thềm lục địa giả thiết mỗi lần mất mát đi 3dB. mô phỏng. Đồng thời coi độ trễ giữa các tap đều nhau.
2. Mô hình máy phát và thu dùng điều chế OFDM với các
IV. THIẾT KẾ HỆ THỐNG tham số chỉ ra ở Bảng II.
Trước tiên chúng tôi thiết kế một hệ thống OFDM với các 3. Tiến hành mô phỏng Monte Carlo dùng
tham số như Bảng II sau đây
Bảng II. Các tham số của hệ thống OFDM
384  2  1500  1152000 bit , bằng máy tính , để
Tham số Giá trị kiểm tra chất lượng hệ thống.
Tần số lấy mẫu 9 KHz KỊCH BẢN 2
Số điểm lấy FFT, IFFT 512 1. Mô hình kênh nước biển nông ở vịnh Bắc Bộ Việt
Khoảng bảo vệ 128
Điều chế sóng con QPSK như mô tả ở phần III. Tuy nhiên xét thêm hiện tượng
Chu kỳ ký hiệu không có CP 56,9 ms đa đường với độ trải trễ tối đa 10 ms và chuẩn hóa
Chu kỳ ký hiệu có CP 71,1 ms giá trị độ lợi 2 tap đầu tiên, đáp ứng xung kênh thủy
Số sóng con 384 âm như công thức (3). Mô phỏng cho kịch bản 2 sử
Khoảng phân cách sóng con 17,6 Hz
dụng công thức này.
Nhìn trên Bảng II ta thấy tần số sóng mang là 9KHz, cơ sở 2. Các điều kiện khác như kịch bản 1.
để lựa chọn này là theo xu thế các thiết bị SONAR của Mỹ [10]
và cũng để phù hợp tần số, giảm giá thành của các đầu dò Sau khi tiến hành mô phỏng chúng tôi có được các kết
(transducer), một bộ phận không thể thiếu trong các thiết bị quả của Kịch bản 1 như ở Hình 3 và Kịch bản 2 như ở Hình
thủy âm. 4 sau đây.
Khoảng bảo vệ, CP chiếm 25% độ dài của chu kỳ ký hiệu,
để chống lại Fading đa đường.
Việc chọn chu kỳ ký hiệu 56,9 ms lớn hơn nhiều so với độ
trải trễ tối đa là 10 ms (chú ý là theo [2] thì độ trải trễ tối đa là
50 ms vì tác giả xét tới 5 tap), đảm bảo giảm ảnh hưởng của
Fading của kênh lên chất lượng tín hiệu.
320
320
HộiHội
Thảo Quốc
Thảo QuốcGia
Gia2015
2015về
Nghệ Thông
(ECIT 2015)
2015)
với đường trực tiếp (đây là kịch bản xấu nhất xảy ra trong hệ
thống truyền tin). Tại mức BER=10-3 kênh này sẽ phải bù
khoảng 14 dB so với kênh AWGN khi mà chỉ có ảnh hưởng
0
BER trong kenh Thuy am Rayleigh Fading của tạp âm nền của biển.
10
Duong ly thuyet kenh AWGN
Như vậy chúng tôi đã tiến hành mô phỏng hoàn chỉnh một
Mo phong kenh Rayleigh Fading hệ QPSK OFDM trong kênh thủy âm đề xuất đặc trưng cho
10
-1 kênh nước biển nông của vịnh Bắc Bộ, có thể nói rằng đây là
loại kênh phức tạp hơn kênh vô tuyến thông thường và đây là
những kết quả bước đầu trong nỗ lực nhằm nâng cao tốc độ
BER cua he QPSK OFDM
10
-2
truyền tin dưới biển.
10
-3
VI. KẾT LUẬN
Bài báo đã tiến hành quan sát lý thuyết một kênh nước biển
10
-4 nông thuộc địa hình vịnh Bắc Bộ Việt Nam. Một mô hình
kênh thủy âm cụ thể đã được đề xuất. Một hệ truyền tin vô
tuyến QPSK OFDM sử dụng sóng âm tần số 9KHz được thiết
10
-5
kế và mô phỏng hoàn chỉnh để truyền tin qua mô hình kênh đề
-2 0 2 4 6 8 10 12 14 16 18 20
Eb/No, dB xuất. Các ảnh hưởng của phân tán thời gian và tần số đã được
Hình 3. Tỷ lệ lỗi bit hệ QPSK OFDM cho kênh AWGN
xem xét. Trên quan điểm thiết kế mà nói thì thiết kế này đã
(đường màu xanh nước biển, có chấm vuông), tỷ lệ lỗi bit cho thành công khi đạt được tốc độ truyền tin hơn gần 2,5 lần so
kênh thủy âm Rayleigh Fading (đường màu hồng, có chấm chéo). với kết quả dùng FSK trong [3].
0
BER kenh Thuy am Fading Rayleigh co Da duong(2 tap, do loi chuan hoa)
10
Duong ly thuyet kenh AWGN TÀI LIỆU THAM KHẢO
Mo phong kenh Rayleigh Fading
-1
[1] Nguyễn Văn Phòng (2007), Bách Khoa về Biển, NXB từ điển bách khoa
10
[2] M. Stojanovic (2008), “Underwater acoustic communications: design
considerations on the physical layer”, IEEE Fifth annual conference on
BER cua he QPSK OFDM
wireless on demand network systems and services, pp. 1-10.

-2
10
[3] A. Dairo và cộng sự (2013), “Low cost frequency shift keying acoustic
modem for underwater wireless sensors networks”, Proceeding of the
Spring 2013 Mid-Atlantic Section Conference of the American Society
10
-3
of Engineering Education, pp.36-46.
[4] R.V. Nee và R. Prasad (2000), OFDM for wireless multimedia
communications, Artech House Boston, London.
-4
10 [5] M. Stojanovic (2008), “OFDM for underwater acoustic
communications: adaptive synchronization and sparse channel
estimation”, IEEE International conference on acoustic, speech and
10
-5 signal processing, pp. 5288-5291.
-2 0 2 4 6 8 10 12 14 16 18 20
[6] Baosheng Li và cộng sự (2009), “ MIMO-OFDM for high rate
Eb/No, dB
underwater acoustic communications”, IEEE Journal on Oceanic
Hình 4. Tỷ lệ lỗi bit hệ QPSK OFDM cho kênh AWGN Engineering, Vol.34, pp.634-644.
(đường màu xanh nước biển, có chấm vuông), tỷ lệ lỗi bit cho [7] M. Stojanovic (2006), “ Low complexity OFDM detector for underwater
kênh thủy âm Rayleigh Fading với 2 tap, độ lợi chuẩn hóa (đường acoustic channels”, pp.1-6, IEEE Conference Oceans, DOI:
màu hồng có chấm chéo). 10.1109/OCEANS.2006.307057.
[8] A. Radosevic và cộng sự (2013), “Adaptive OFDM modulation for
underwater acoustic communications: Design considerations and
Từ Hình 3 ta thấy rằng kênh thủy âm khảo sát là rất phức Experimental results”, IEEE Journal of Oceanic Engineering, pp. 357-
tạp, khi kể đến hiện tượng đa đường chất lượng tín hiệu thu bị 370. ISSN: 0360-9059.
hạn chế đáng kể. Với mức BER=10-3 trong kênh AWGN và [9] Trần Bá Tấn và Trần Cao Quyền (2015), “Design an power amplifier
kênh thủy âm Rayleigh Fading cần mật độ năng lượng bit trên for a digital underwater modem using FSK modulation”, Journal of
tạp âm, Eb/No tương ứng là 6 dB và 18 dB. Như vậy với mức Science and Technology-Hanoi University of Industry, pp.15-18.
BER=10-3 thì kênh thủy âm này sụt giảm 12 dB so với kênh ISSN 1859-3585.
AWGN. Sở dĩ có hiện tượng này là do sự phân tán thời gian [10] Bạch Nhật Hồng (2006), Đề tài “ Nghiên cứu ứng dụng một số cảm
xảy ra lớn trong kênh thủy âm. Tuy nhiên có thể tin rằng thông biến siêu âm để thiết kế chế tạo hệ thống phát hiện, đo đạc các tham số
tin chỉ có thể bị phá hủy một phần mà không bị mất hoàn toàn vật bay trên không và thiết bị truyền tin dưới nước phục vụ kinh tế- xã
hội, an ninh quốc phòng”, Quyển III, Nghiên cứu thiết kế chế tạo thiết
do đã sử dụng việc kéo dài độ rộng chu kỳ ký hiệu phát. bị liên lạc thủy âm.
Kết quả từ Hình 4 thể hiện sự xuống cấp hơn một chút nữa
của chất lượng tín hiệu thu khi ảnh hưởng của trải trễ tối đa
phát huy tác dụng và công suất đường phản xạ so sánh được
321
321
Nâng cao hiệu quả của mã BCH sử dụng

phương pháp giải mã dựa trên chuẩn syndrome
Phạm Khắc Hoan Lê Văn Thái
Khoa Vô tuyến điện tử, Học viện kỹ thuật Quân sự. Khoa Điện tử, Đại học Công nghiệp Hà Nội.
236, Hoàng Quốc Việt, Cầu Giấy, Hà Nội, Việt Nam Km 13, Minh Khai, Bắc Từ Liêm, Hà Nội, Việt Nam
Email: hoanpk2012@gmail.com Email: thailv@haui.edu.vn
Tóm tắt - Bài báo trình bày phương pháp thế giải mã syndrome cần xử lý nên có thể nâng cao chất lượng giải
BCH dựa trên chuẩn syndrome cho phép đồng thời sửa lỗi mã khi sửa lỗi bội cao [3,4].
ngẫu nhiên và lỗi chùm. Khi kết hợp với phép thế
cyclotomic có thể rút gọn đáng kể độ phức tạp của bộ giải Phần còn lại của bài báo được tổ chức như sau.
mã. Phương pháp đề xuất đạt độ lợi mã hóa đến 5dB tại Trong phần 2 trình bày phương pháp thế giải mã BCH
BER = 10-4 trên kênh pha đing Rayleigh phẳng so với dựa trên chuẩn syndrome cho phép đồng thời sửa lỗi
phương pháp đại số thông thường. ngẫu nhiên và lỗi chùm, phần 3 xem xét vấn đề kết hợp
phương pháp chuẩn syndrome với phép thế cyclotomic,
Từ khóa - Permuted decoding, BCH codes, norm of
trong phần 4 trình bày các kết quả mô phỏng và thảo
syndrome, random error, burst error, error correcting,
capability, cyclotomic permutation. luận, các phân tích, đánh giá được xem xét trong phần
kết luận.
II. ĐỒNG THỜI SỬA LỖI NGẪU NHIÊN VÀ LỖI
Các phương pháp đại số giải mã BCH yêu cầu phải CHÙM SỬ DỤNG PHƯƠNG PHÁP CHUẨN
giải phương trình khóa bậc cao trên trường Galoa như SYNDROME CHO MÃ BCH
thuật toán Berlekamp-Massey (BMA), thuật toán Euclid
Ma trận kiểm tra của mã BCH tổng quát với khoảng
(EA). Các thuật toán lặp BMA, EA và thủ tục tìm kiếm
cách cấu trúc δ  2t + 1 có dạng:
Chien có độ trễ xử lý lớn khi n và t tăng, điều đó hạn chế
việc ứng dụng mã BCH vào các hệ thống thông tin thời T
H    bi ,  (b 1)i , ....  ( b  2 t 1)i  , 0  i  n  1. (1)
gian thực. Mặt khác, trong các hệ thống truyền tin, lưu
trữ và xử lý thông tin thường xảy ra lỗi ở cả dạng lỗi Khi đó syndrome của vector lỗi tùy ý gồm δ-1 thành
ngẫu nhiên và lỗi chùm. Một số mã khối tuyến tính có phần thuộc trường GF(2m) là s(e)  (s1, s2, …, sδ-1).
khả năng đồng thời sửa được cả lỗi ngẫu nhiên và lỗi
chùm như mã tầng, mã Fire, mã có xáo trộn… tuy nhiên Ký hiệu σ là phép thế dịch vòng, dưới tác động của
việc giải mã chúng thường khá phức tạp, tốc độ mã hóa nó vector lỗi e = (e1, e2, …, en) dịch vòng phải đi một vị
thấp hoặc khả năng sửa lỗi không lớn [1,2]. trí σ(e) = (en, e1, e2, e3, …, en-1). Tập hợp tất cả các
vector khác nhau đôi một σλ(e) với 0 ≤ λ ≤ n – 1 của
Trên cơ sở nghiên cứu cấu trúc của mã BCH và các vector lỗi e tùy ý gọi là σ-orbit của nó. Các phần tử của
biến thể của nó, xây dựng một tham số mới là chuẩn σ-orbit chuyển hóa lẫn nhau dưới tác động của phép
syndrome. Chuẩn syndrome là bất biến với tác động của dịch vòng. Mỗi σ-orbit có một vector sinh, toạ độ đầu
nhóm các dịch vòng và syndrome của các nhóm khác tiên của vector này luôn có giá trị khác không.
nhau thì khác nhau. Khi sử dụng chuẩn syndrome, các
lỗi ngẫu nhiên và lỗi chùm có thể được sửa đồng thời do Cho e là vector lỗi tùy ý, với mã BCH có ma trận
chuẩn syndrome của các vector lỗi ngẫu nhiên và một số kiểm tra (1) ta có:
cấu hình lỗi chùm độ dài nhỏ, lỗi chùm đồng pha không s ( (e))  (  b s1 ,  b 1s2 ,...,  b  2 s 1 ). (2)
trùng nhau khi chọn đa thức sinh của trường một cách
thích hợp. Định nghĩa norm syndrome (chuẩn syndrome) là
2
Đặc biệt khi kết hợp phương pháp chuẩn syndrome vector N(S) có C 1 tọa độ Nij ,1≤ i < j ≤ δ -1 được xác
với phép thế cyctotomic cho phép giảm số lượng chuẩn định theo công thức:
322
ISBN: 978-604-67-0635-9 322
N  sj
( b  i 1) / hij ( b  j 1) / hij
/ si + Sửa tín hiệu nhận được bằng cách tính tổng tín
ij
hiệu nhận được với vector lỗi tìm được.
khi s i  0, hij 
USCLN (b  i  1, b  j  1);
(3) Một điểm đặc biệt của phương pháp chuẩn
N 
ij
syndrome là khi phân hoạch các vector lỗi thành các lớp
khi s j  0; s i 
0; N ij 
 khi s i 
sj 
0. không giao nhau có chuẩn syndrome phân biệt có thể
nâng cao khả năng sửa lỗi của mã BCH [5].
Đối với mã BCH nhị phân ta có:
Chú ý rằng với mã BCH có d = 5 (ký hiệu C5) chuẩn
S ( ( e ))  (  s1 ,  3 s 2 ,...,  2 t 1
s t ). (4) syndrome có n + 2 giá trị phân biệt, tương ứng với
n(n+2) vetor lỗi khác 0, trong khi đó với mã BCH
Gọi chuẩn (norm) của syndrome S(e)  (s1, s2, …, st) nguyên thuỷ C5 có 22m = (n+1)2 giá trị syndrome khác
với mã nguyên thủy theo nghĩa hẹp là vector N(S) có nhau. Khi lựa chọn đa thức sinh của trường một cách
C t2 tọa độ Nij, 1≤ i < j ≤ t được xác định theo công hợp lý, mã BCH nguyên thủy C5 sửa được đồng thời lỗi
thức: bội 2 và mọi lỗi chùm dài 4.
( 2i 1) / hij ( 2 j 1) / hij Xét mã C7 (15,5) trên GF(24) với đa thức sinh x4 + x
N ij  s j / si , + 1. Ký hiệu K – tập hợp các lỗi bội 1, bội 2, bội 3, chứa
(5)
hij  USCLN(2i  1,2 j  1) 39 σ-orbit (3 σ-orbit lỗi bội 3, 8 σ-orbit lỗi bội 2, 1 σ-
orbit lỗi đơn). Tập K chứa 38.15 + 5 = 576 vector lỗi. Bổ
Nij = ∞ nếu sj ≠ 0, si = 0; sung vào tập K các σ-orbit của các lỗi chùm có vector
Nij = - (không xác định) khi sj = si = 0. sinh dạng < ei > = < 1, 2, 3, ..., i > với i = 4, 5, 6, 7 và
cho phép tăng khả năng sửa lỗi của mã lên hơn 10%. Khi
Ví dụ với mã BCH nhị phân gốc có d = 5 (ký hiệu lựa chọn đa thức sinh của trường một cách hợp lý, mã
C5), norm syndrome có dạng: BCH C7 sửa được đồng thời các lỗi bội 1, 2, 3 và hầu hết
N  s 2 / s13 . (6) các lỗi chùm độ dài 5, 6. Mã BCH C7 có chiều dài n =
2m – 1, m ≥ 4 với các đa thức sinh của trường là x5 + x3
Tính chất cơ bản của chuẩn syndrome là tính bất + x2 + x +1, x5 + x4 + x3 + x2 +1, sửa được đồng thời
biến của nó với phép thế dịch vòng. Từ công thức (2), các lỗi bội 1, 2, 3 và tất cả các lỗi chùm độ dài đến 6.
(4) suy ra đối với mọi mã vector lỗi e của mã BCH thỏa
mãn đẳng thức sau: Cho mã thuận nghịch C5 có ma trận kiểm tra
 z ,  z  , syndrome S = (s1, s2) =
T
H
H H  
 2  
N ( s( (e)))  N ( s(e)) . (7) 1
(  i ,  j ), chuẩn syndrome có dạng:

Thuật toán giải cho giải mã theo phương pháp chuẩn
syndrome thực hiện tính toán qua các bước như sau: N = s1.s2. (8)
+ Tính syndrome S(e)  (s1, s2, …, st) với si là phần Trong [5] khảo sát khả năng sửa lỗi của mã thuận
tử của trường Galoa GF(2m). nghịch mở rộng. Giả sử sắp xếp các cột của H1 theo một
thứ tự khác và thay thế đồng bộ với các cột của H2. Cột
+ Tính bậc của chuẩn syndrome N. thứ i của H1 là biểu diễn m bit của số nguyên i - 1, 1 ≤ i
Tính degsj, degsi là bậc thành phần sj , si của ≤ n = 2m với m lẻ nhận được mã C~ có ma trận kiểm tra
syndrome S(e)  (s1, s2, …, si, ..., sj, ..., st) với 1 ≤ i < j ~ ~ ~
H  ( H 1 , H 2 , I ) T , khoảng cách mã d = 6. Mã thuận
≤ t. nghịch C~ cho phép sửa đồng thời lỗi ngẫu nhiên bội 1,
Chuẩn syndrome của syndrome S(e) tính theo công bội 2, các lỗi modul dài 4 bội 3, và cả các modul dài 4
thức (5), xác định bậc của nó degNij. bội 4 nếu chọn đa thức sinh phù hợp.
+ Theo degNij xác định vector sinh và bậc i0 của Mã BCH C7 có chiều dài n = 2m – 1, m ≥ 4 sẽ có C1n,
0 C2n, C3n vector lỗi tương ứng trọng lượng 1, 2, 3, chiếm
thành phần syndrome đầu tiên s1 ứng với vector sinh.
một nửa tập hợp tất cả các giá trị syndrome, giải mã
+ Tính số thứ tự bit lỗi đầu tiên bằng Li  (degsi – được (n+2)2 + (n+2) J- σ-orbit, tương ứng với n.(
0 (n+2)2 + (n+2)) = (n+1)3 – 1 vector lỗi khác 0, vì vậy
deg s1 ) mod n.
có thể mở rộng khả năng sửa lỗi của mã C7.
+ Tìm vector lỗi e bằng cách dịch vòng vector sinh đi Bổ sung thêm bit kiểm tra chẵn lẻ, nhận được mã
Li nhịp. BCH mở rộng Cˆ có ma trận kiểm tra Hˆ nhận được từ
323
323
H bằng cách bổ sung thêm một hàng toàn các bit 1. Mở một lớp cyclotomic theo modul n. Các phép thế φ, φ2, .. φm
rộng thêm một bit kiểm tra chẵn lẻ cho mã C5 nhận =1 gọi là nhóm cyclotomic Φ.
được mã Cˆ có khoảng cách Hamming lúc này d = 6,
bit kiểm tra chẵn (parity) của lỗi bội 2 bằng 0, của các 1 2 3 4 5 6 7
lỗi đặc bội lẻ bằng 1, nhờ đó phân biệt được 2 cấu e: 0 1 1 1 0 0 0
hình lỗi trên. Mã BCH có khoảng cách d = 6 cho phép
sửa đồng thời lỗi bội 2 cùng với các lỗi chùm đặc bội lẻ
và phần lớn các lỗi chùm đặc độ dài chẵn, vì vậy có thể φ(e): 0 0 1 0 1 0 1
mở rộng miền ứng dụng của nó.
Với mã thuận nghịch C  có ma trận kiểm tra
H  ( i ,   i , I ) T , với 0  i  2 m  2 , đây là biến thể φ2(e): 0 1 0 0 1 1 0
của mã thuận nghịch C5 có loại bỏ tất cả các từ mã trọng
lượng lẻ. Vì vậy mã C  cùng với lỗi bội 2 sửa được tất
e =φ3(e): 0 1 1 1 0 0 0
cả các lỗi chùm đặc độ dài lẻ và các lỗi đặc độ dài l chẵn
(l ≥ 4) nếu Trc = 1, với c  l 1 (1   2 )(1   2 l ) . Hình 1. Tác động của phép thế cyclotomic với vector
e = 0111000.
Trường hợp trên trong phần thứ nhất H1 ma trận
kiểm tra của mã thuận nghịch mở rộng tham số i được Với n = 31 trong trường GF(2) tồn tại 6 lớp
sắp xếp theo thứ tự tăng dần. Giả sử sắp xếp các cột của cyclotomic như sau: {1, 2, 4, 6, 8, 16}; {3, 6, 12, 24, 17};
H1 theo một thứ tự khác và thay thế đồng bộ với các cột {5, 10, 20, 9, 18}; {7, 14, 28, 25, 19}; {11, 22, 13, 26,
của H2 . Cột thứ i của H1 là biểu diễn m bit của số 21}; {15, 30, 29, 27, 23}. Trên bảng 1 biểu diễn giá trị
~ norm của các lỗi bội 2 (15 lớp vector) với mã có chiều
nguyên i - 1, 1 ≤ i ≤ n = 2m với m lẻ nhận được mã C
dài 31, với đa thức sinh của trường x5 + x3 + x2 + x + 1.
có ma trận kiểm tra H~  ( H~ 1 , H~ 2 , I ) T , khoảng
cách mã d = 6. Khảo sát khả năng sửa đồng thời lỗi bội BẢNG 1. VECTOR SINH LỖI BỘI 2 CỦA CÁC LỚP DỊCH
~ VÒNG VÀ NORM
1, bội 2 và các lỗi modul dài 4 của mã C . Các cột của
nó được chia thành các modul dài 4 ký hiệu là Mj với 0 ≤
~ STT N Vector sinh e0
j ≤ n/4 -1. Mã C với m lẻ cho phép đồng thời sửa lỗi
ngẫu nhiên bội 1,2 và các lỗi modul dài 4 nếu vết của 1 3 1100000000000000000000000000000
phần tử sau bằng 1. 2 6 1010000000000000000000000000000
3 14 1001000000000000000000000000000
c (1     2 ) 1 . (9)
4 12 1000100000000000000000000000000
Tương tự như mã C5, với mã C7, mở rộng 1 bit kiểm
5 30 1000010000000000000000000000000
tra chẵn lẻ, mã BCH C8 đồng thời sửa lỗi bội 3 trở xuống
6 28 1000001000000000000000000000000
và các lỗi chùm độ dài đến 5 và phần lớn các lỗi chùm độ
dài 6. 7 19 1000000100000000000000000000000
8 24 1000000010000000000000000000000
III. KẾT HỢP PHÉP THẾ CYCLOTOMIC VÀ 9 23 1000000001000000000000000000000
PHƯƠNG PHÁP CHUẨN SYNDROME GIẢI MÃ BCH 10 29 1000000000100000000000000000000
Phép thế cyclotomic theo modul n với trường GF(q) 11 27 1000000000010000000000000000000
là tập hợp: 12 25 1000000000001000000000000000000
13 15 1000000000000100000000000000000

C s  s , sq , sq 2 , ..., sq m s 1
, 14 7 1000000000000010000000000000000
(10)
sq m s
 s mod n 15 17 1000000000000001000000000000000
Định nghĩa trên tập T = {1, 2, ..., n} biến đổi φ thỏa
Chuẩn syndrome của các vector lỗi bội 2 thuộc 3 lớp
mãn φ(i) = 2i - 1 mod n khi đánh số tọa độ vector lỗi từ
cyclotomic ({3, 6, 12, 24, 17}; {7, 14, 28, 25, 19}; {15,
1 đến n. Với n lẻ, φ là song ánh trên tập T. Khi đánh số
30, 29, 27, 23}). Với các mã C5 có đa thức sinh khác
tọa độ của vector lỗi từ 0 đến (n - 1), ta có φ(i) = 2i mod
cũng phân phối norm của các lỗi bội 2 thành 3 lớp
n. Tương tự khi áp dụng biến đổi này k lần ta có:
cyclotomic. Số lượng các tổ hợp chọn lọc có thể rút gọn
φk(i)= i2k mod n. Khi đó các số i, 2i, 22i, ...2m-1i tạo thành
5 lần so với mã C5.
324
324
Ký hiệu norm của vector sinh của phần tử đầu tiên ngoài các lỗi ngẫu nhiên bội 1, 2, 3 còn sửa được hầu hết
trong các lớp cyclotomic là N ao , N b0 , N c 0 (trong trường lỗi chùm độ dài đến 6.
hợp trên N a  3, N b  7 , N c  15 ). Phương pháp giải
o 0 0
mã dựa trên phép thế cyclotomic với mã C5 như sau:

+ Tính syndrome S và chuẩn syndrome N của tổ hợp
nhận được.
+ So sánh giá trị N với mỗi giá trị N ao , N b0 , N c0 , nếu
N trùng với một trong các giá trị này sẽ xác định lớp
cyclotomic mà N thuộc về lớp đó.
+ Nếu N không trùng với cả ba giá trị
N a o , N b0 , N c0 , thực hiện phép dịch cyclotomic và lặp
lại bước 2.
+ Xác định lớp cyclotomic mà N thuộc về lớp đó,
theo số lượng phép dịch cyclotomic, xác định giá trị N =
Hình 2. Hiệu quả của mã BCH trên kênh Gauss.
Ndịch, vector sinh tương ứng e0.
+ Theo giá trị S, N, e0 tính giá trị vector lỗi tức thời. Trên hình 2 trình bày kết quả mô phỏng hiệu quả của
mã BCH trên kênh Gauss. Trên hình này cũng thể hiện
Để tiếp tục giảm độ phức tạp giải mã có thể sử dụng kết quả mô phỏng hiệu quả của phương pháp giải mã
phương pháp xử lý từng bước các lớp cyclotomic. Xét
Berlekamp – Massey và giới hạn trên của các phương
mã C5, n = 31, biểu thức
pháp đại số giải mã trong giới hạn khoảng cách mã. Khi
N co ( N b0  ) mod n ( N a0  2) mod n , xác định sử dụng mã BCH C7 (31,16) với đa thức sinh 067, so với
quy tắc chuyển từ một lớp cyclotomic này sang lớp khác. phương pháp giải mã Berlekamp – Massey, phương
Vì vậy có thể chọn 1 trong 3 phần tử của một lớp pháp chuẩn syndrome đạt độ cải thiện Eb/No khoảng
cyclotomic và ký hiệu là N0. Quy tắc giải mã theo các 2,8dB tại BER = 10-4, là do phương pháp đề xuất cho
bước sau: phép sửa lỗi ngoài giới hạn khoảng cách mã.
+ Tính syndrome S và chuẩn syndrome N.
+ Chọn N 0  N a 0 .
+ So sánh N và N0 (N trùng N0 chỉ ra lớp cyclotomic

chứa giá trị N tính được).
+ Nếu N không trùng với bất kỳ phần tử nào của lớp
cyclotomic thì giá trị phần tử sinh của lớp cyclotomic N0
tăng lên ∆ và so sánh N với N0.
+ Xác định lớp cyclotomic chứa giá trị norm N,
theo số lượng phép dịch đã thực hiện xác định giá
trị N0 = Ndịch theo bảng giá trị tìm vector sinh e 0
tương ứng với norm.
+ Theo giá trị S, N và e0 xác định vector lỗi hiện thời,
giá trị ∆ được chọn phụ thuộc vào lớp cyclotomic được
sử dụng.
IV. KẾT QUẢ MÔ PHỎNG VÀ THẢO LUẬN
Tiến hành mô phỏng Monte Carlo trên MATLAB,
Hình 3 Hiệu quả của mã BCH trên kênh Rayleigh phẳng
mã được khảo sát BCH C7(31,16) với đa thức sinh của
trường tương ứng là x5 + x4 + x2 + x + 1 (067), số lượng Trên hình 3 trình bày kết quả mô phỏng hiệu quả
bit đầu vào mã hóa 16.106. Với phương pháp đề xuất của mã BCH trên kênh pha đinh Rayleigh phẳng. Trong
325
325
mô hình mô phỏng sử dụng thêm khối ghép xen với độ Phạm Khắc Hoan, sinh năm 1976 tại
sâu L = 5. Độ lợi mã hóa khi sử dụng mã BCH C7 (31,16) Hải Dương, Việt Nam, nhận bằng kỹ sư
so với phương pháp Berlekamp – Massey với đa thức sinh thông tin năm 2001 tại Đại học kỹ thuật Lê
067 là 5,1dB tại BER = 10-4. Như vậy khi sử dụng phương Quý Đôn, nhận bằng tiến sĩ chuyên ngành
mạng và hệ thống viễn thông tại Đại học
pháp giải mã dựa trên chuẩn syndrome kết hợp với ghép
tổng hợp tin học và vô tuyến điện tử quốc
xen cho kênh pha đinh, độ sâu ghép xen có thể giảm đi
gia Belarus năm 2008, hiện công tác tại
đáng kể và cho phép giảm độ trễ xử lý. So sánh với hình 2 Khoa Vô tuyến điện tử, Đại học kỹ thuật
độ lợi mã hóa trên kênh pha đinh Rayleigh phẳng lớn hơn Lê Quý Đôn. Các hướng nghiên cứu: Lý thuyết thông tin và
trên kênh Gauss do trên kênh pha đinh Rayleigh phẳng mã hóa; Các biện pháp trinh sát, gây nhiễu các mạng và hệ
xảy ra lỗi chùm với xác suất lớn. Khi kết hợp với ghép thống thông tin; An toàn thông tin.
xen độ sâu không lớn, các lỗi này chuyển thành các lỗi
Lê Văn Thái, sinh năm 1973 tại Nam
ngẫu nhiên và các lỗi chùm độ dài ngắn, phương pháp Định, Việt Nam, tốt nghiệp đại học
chuẩn syndrome cho phép sửa được chúng, trong khi các chuyên ngành Điện tử viễn thông Đại học
phương pháp thông thường không sửa được. Bách khoa Hà Nội năm 1999. Nhận bằng
thạc sĩ xử lý thông tin và truyển thông tại
V. KẾT LUẬN Đại học Bách khoa Hà Nội năm 2004. Từ
Phương pháp thế dịch vòng giải mã mã BCH dựa năm 1999 đến 2015 giảng viên Khoa Điện
trên chuẩn syndrome không yêu cầu giải phương trình tử trường Đại học Công nghiệp Hà Nội.
trong trường Galoa. Để giải mã theo phương pháp này Hiện đang là giảng viên, Trưởng khoa
Điện tử, trường Đại học Công nghiệp Hà Nội, Nghiên cứu sinh
cần tính toán, lưu trữ giá trị chuẩn syndrome cho tập các
tại Học viên kỹ thuật Quân sự Việt Nam. Lĩnh vực nghiên cứu
vector lỗi có thể sửa được. Khi độ dài và khoảng cách chính: Xử lý thông tin và truyền thông; lý thuyết thông tin và
mã, cần không gian lưu trữ lớn, nhờ kết hợp sử dụng mã hóa; xử lý tín hiệu và lọc số.
phép thế cyclotomic có thể giảm đáng kể không gian bộ
nhớ. Phương pháp giải mã dựa trên phép thế cyclotomic
cho phép rút gọn số tổ hợp cần chọn lọc đến 5, 7, 11 lần
với mã C5 có độ dài n = 31, 127, 1047 tương ứng. Đặc
biệt phương pháp giải mã dựa trên chuẩn syndrome chỉ
sử dụng các phép toán logic đơn giản, dễ thực hiện trên
thiết bị logic khả trình. Ngoài ra khi sử dụng phương
pháp đề xuất mã BCH có khả năng đồng thời sửa được
lỗi ngẫu nhiên và các lỗi chùm độ dài ngắn, trong khi các
phương pháp truyền thống chỉ cho phép sửa lỗi ngẫu
nhiên, vì vậy có thể giảm đáng kể độ trễ xử lý do giảm
độ sâu ghép xen, mở rộng phạm vi ứng dụng của mã
BCH trong các hệ thống thông tin thực tế.

[1] R.H. Morelos-Zararoga. The art of error correcting coding, John
Wiley & Sons Ltd, 2002.
[2] Tood K. Moon. Error correction coding mathematical methods
and algorithms, John Wiley & Sons Ltd, 2005.
[3] Phạm Khắc Hoan, Vũ Sơn Hà, Phạm Việt Trung: Phương pháp
thế giải mã hiệu quả mã BCH, Tạp chí Nghiên cứu khoa học và
công nghệ quân sự, 05-2012 (1859-1043).
[4] В.А. Липницкий, В.К. Конопелько, Норменное
декодирование помехоустойчивых кодов и алгебраические
уравнения, Минск : Изд. центр БГУ, 2007.
[5] Pham Khac Hoan, Le Van Thai, Vu Son Ha: Simultaneous
correction of random and burst errors using norm syndrome for
BCH codes, National conference on Electronics and
Communications, REV – KC01 2013.
326
326
HộiHội
Thảo Quốc
Thảo QuốcGia
Gia2015
2015về
Nghệ Thông
(ECIT 2015)
2015)
Hiệu Năng Mã Hóa Với Tập Lệnh AES-NI

Nguyễn Tuấn Anh#, Lương Thế Dũng#, Nguyễn Thị Trang*
#
Khoa An toàn thông tin – Học viện Kỹ thuật mật mã
*
Khoa Công nghệ thông tin – Học viện Công nghệ bưu chính viễn thông
Email: tuananh1982act@gmail.com, thedungluong@gmail.com, trangmamcnttptit11@gmail.com
Abstract— Bài báo này giới thiệu tập lệnh hợp ngữ trong một số thể viết những chương trình mã hóa/giải mã bằng AES với tốc
dòng vi xử lý Intel thế hệ mới cho phép tăng đáng kể tốc độ mã độ cao hơn hẳn so với cài đặt mềm thông thường. Đến nay đã
hóa, giải mã với thuật toán AES. Các tác giả sẽ làm rõ những có nhiều ứng dụng và thư viện mật mã có khả năng làm việc
điểm đặc biệt khi sử dụng một trong số các lệnh đó để mở rộng với tập lệnh này. Danh sách cụ thể các ứng dụng và thư viện đó
khóa; đây là vấn đề chưa được trình bày trong các tài liệu về tập
có thể tham khảo tại [3].
lệnh này. Đồng thời, bài báo cũng giới thiệu kết quả thực nghiệm
về tốc độ mã hóa, giải mã mà các tác giả đã đạt được khi nghiên II. TẬP LỆNH AES-NI
cứu tập lệnh nói trên. Một trong những kết quả quan trọng mà
các tác giả thu được là sự chênh lệch không đáng kể về tốc độ mã Tập lệnh AES-NI bao gồm 6 lệnh hợp ngữ, trong đó có 2
hóa, giải mã khi sử dụng tập lệnh nói trên để viết chương trình lệnh để mã hóa, 2 lệnh để giải mã và 2 lệnh để tạo khóa vòng.
cho nền tảng 32 bit và nền tảng 64 bit. Hai lệnh để mã hóa là AESENC và AESENCLAST. Trong đó
lệnh AESENCLAST là để mã hóa vòng cuối cùng, lệnh
Keywords- AES-NI, cứng hóa AES, tăng tốc mã hóa. AESENC là để mã hóa một vòng đối với tất các vòng còn lại.
Tương tự, hai lệnh để giải mã là AESDEC và AESDECLAST.
I. GIỚI THIỆU Trong đó, lệnh AESDECLAST thực hiện giải mã vòng cuối
Như đã biết, mật mã là công cụ quan trọng hàng đầu trong cùng, còn lệnh AESDEC thực hiện giải mã một vòng đối với
lĩnh vực an toàn thông tin. Nếu xét riêng lĩnh vực công nghệ tất cả các vòng còn lại. Hai lệnh để tạo khóa vòng là
thông tin và viễn thông thì nhiệm vụ đảm bảo an toàn thông tin AESKEYGENASSIST và AESIMC. Trong đó,
sẽ không thể đạt được nếu không có mật mã. Tuy nhiên, việc AESKEYGENASSIST được sử dụng để tạo khóa vòng mã
áp dụng các thao tác mật mã vào quá trình xử lý thông tin sẽ hóa, tức là để mở rộng khóa (key expansion), còn AESIMC
làm chậm đáng kể quá trình này. Do vậy, bên cạnh việc nghiên được sử dụng để tạo khóa giải mã. AES hỗ trợ hai phương án
cứu và xây dựng những hệ mật tốt thì việc nghiên cứu các giải giải mã. Phương án thứ nhất là trong từng vòng phải đảo trật tự
pháp cải thiện hiệu năng làm việc của các hệ mật cũng có ý các phép biến đổi SubBytes, ShiftRow, MixColumn,
nghĩa to lớn trong an toàn thông tin. AddRoundKey. Trong trường hợp này, khóa giải mã cũng
Vào ngày 02/01/1997, Viện tiêu chuẩn và kỹ thuật quốc gia chính là khóa giải mã (nhưng dùng với trật tự đảo ngược).
Mỹ (NIST) đã khởi động chương trình xây dựng chuẩn mật mã Phương án thứ hai là giữ nguyên trật tự các phép biến đổi trên
mới để thay thế cho chuẩn mật mã lúc bấy giờ là DES [1]. trong từng vòng, nhưng bên cạnh việc sử dụng khóa vòng với
Trong đó, NIST xác định việc xây dựng chuẩn mật mã mới sẽ trật tự đảo ngược thì cần thực hiện biến đổi nhất định lên khóa
dựa vào công sức của cộng đồng quốc tế thông qua việc tổ vòng mã hóa để thu được khóa vòng giải mã. Phép biến đổi
chức cuộc thi để tìm ra thuật toán mật mã tốt nhất. Đồng thời, khóa vòng này chính là được thực hiện bởi lệnh AESIMC. Bên
NIST cũng đặt ra yêu cầu bắt buộc đối với các ứng viên là cạnh tập lệnh trên đây, Intel cũng đưa vào lệnh PCLMULQDQ
thuật toán của họ sẽ được miễn phí cho mọi người dùng nếu (Carry-Less Multiplication) cho phép thực hiện phép nhân trên
được chọn làm chuẩn. Đến ngày 02/10/2000, NIST công bố trường hữu hạn đối với các hạng tử 64 bit. Lệnh này được sử
thuật toán Rijndael được chọn làm chuẩn mật mã mới, gọi là dụng để cài đặt một cách hiệu quả thuật toán AES ở chế độ
AES (Advanced Encryption Standard); chuẩn này được ban Galois Counter Mode (AES-GCM) [4].
hành chính thức bởi NIST vào năm 2001 [2]. Đến nay, AES đã Cú pháp cũng như chức năng của các lệnh AES-NI được
được hỗ trợ bởi hầu hết các sản phẩm có chức năng mật mã. trình bày trong tài liệu [5] của Intel. Tuy nhiên nếu cách thức
Mặc dù AES được cho là có hiệu năng thực thi cao cả khi sử dụng các lệnh mã hóa, giải mã là đơn giản, rõ ràng thì lệnh
cái đặt bằng phần mềm và phần cứng, nhưng dù sao thì tốc độ tạo khóa vòng AESKEYGENASSIST lại khá rối rắm, khó
mã hóa/giải mã bằng phần mềm còn kém nhiều so với các phần hiểu. Có lẽ người lập trình sẽ mong đợi rằng mỗi lần gọi lệnh
cứng chuyên dụng. Tuy vậy, phần cứng mật mã chuyên dụng AESKEYGENASSIST thì sẽ thu được một khóa vòng, tức là
lại đắt đỏ và kém linh hoạt hơn hẳn so với phần mềm. Vào năm nó có tính trọn vẹn như các lệnh còn lại. Tuy nhiên thực tế
2008, hãng sản xuất vi xử lý Intel đã đưa ra giải pháp cho phép không như vậy. Dù rằng kích thước giá trị đầu ra của lệnh trên
dung hòa ưu, nhược điểm của cài đặt cứng và cài đặt mềm đối là 128 bit nhưng để tạo được một khóa vòng 128 bit thì cần gọi
với AES, đó là tập lệnh AES-NI (AES New Instructions) bao lệnh trên và sau đó là một loạt lệnh khác nữa. Trong tài liệu
gồm 6 lệnh hợp ngữ được hỗ trợ bởi một số dòng vi xử lý mới [5], Intel chỉ đưa ra đoạn mã để thực hiện sinh khóa vòng mà
của Intel và AMD. Bằng việc sử dụng tập lệnh này, người ta có hoàn toàn không giải thích bản chất của chúng; cũng như
không đề cập đến việc có thể sử dụng một bộ lệnh khác (sau
ISBN: 978-604-67-0635-9 327
327
HộiHội
Thảo Quốc
Thảo Gia
Quốc 2015
ĐiệnTử,
Tử,Truyền
NghệThông
ThôngTinTin (ECIT
(ECIT 2015)
2015)
lệnh AESKEYGENASSIST) để đạt được cùng mục đích là III. HIỆU NĂNG MÃ HÓA, GIẢI MÃ
sinh khóa vòng. Ví dụ, dựa trên mã nguồn của CyaSSL [6], Để đánh giá hiệu năng mã hóa, giải mã khi sử dụng tập lệnh
chúng tôi đã sử dụng một bộ 10 lệnh dưới đây để thay cho bộ AES-NI, chúng tôi viết chương trình mã hóa, giải mã sử dụng
20 lệnh mà Intel đề xuất trong [5]: tập lệnh này với hai phiên bản khác nhau: một cho nền tảng 32
aeskeygenassist xmm1, xmm2, 01h bit và một cho nền tảng 64 bit. Cả hai phiên bản này đều thực
pshufd xmm1, xmm1, 0FFh hiện mã hóa, giải mã theo chế độ ECB với AES-128. Nguyên
movdqu xmm3, xmm2 mẫu hàm mã hóa cho cả hai phiên bản có dạng:
pslldq xmm3, 4 void aes128_encrypt_ecb(unsigned char* buf,
pxor xmm2, xmm3 unsigned char *expanded_key, int block_num)
pslldq xmm3, 4 Trong đó tham số buf trỏ đến vùng đệm chứa dữ liệu cần
pxor xmm2, xmm3 mã hóa, bản mã sẽ được ghi lên chính vùng đệm này; tham số
pslldq xmm3, 4 expanded _key trỏ đến các khóa vòng mã hóa; và tham số
block_num cho biết kích thước dữ liệu tính theo khối (16
pxor xmm2, xmm3
bytes). Hàm mã hóa cũng có cú pháp hoàn toàn tương tự.
pxor xmm2, xmm1 Sở dĩ cần viết chương trình với hai phiên bản 32 bit và 64
Chức năng của lệnh AESKEYGENASSIST được Intel giải bit là vì lý do như sau. Các lệnh AES-NI chủ yếu được thực
thích trong [5] bằng đoạn giả mã như sau: hiện trên các thanh ghi XMM 128 bit. Khi viết chương trình
AESKEYGENASSIST xmm1, xmm2/m128, imm8 cho nền tảng 64 bit, người lập trình có thể sử dụng 16 thanh ghi
Tmp := xmm2/LOAD(m128) như vậy (XMM0-XMM15). Trong trường hợp đó, có thể nạp
X3[31-0] := Tmp[127-96]; sẵn tất cả các khóa vòng vào các thanh ghi này, sau đó các khối
X2[31-0] := Tmp[95-64]; được mã hóa/giải mã bằng khóa đã chứa sẵn trong các thanh
ghi; tức là cho dù có bao nhiêu khối dữ liệu trong vùng đệm đi
X1[31-0] := Tmp[63-32];
nữa thì cũng chỉ phải thực hiện duy nhất một lần việc nạp khóa
X0[31-0] := Tmp[31-0]; vòng từ bộ nhớ vào thanh ghi. Điều này giúp giảm thiểu thời
RCON[7-0] := imm8; gian truy xuất khóa vòng. Trong trường hợp viết chương trình
xmm1 := [Rot (SubWord (X3))  RCON, SubWord cho nền tảng 32 bit, chỉ có 8 trong số 16 thanh ghi (XMM0-
(X3), Rot (SubWord (X1))  RCON, XMM7) là có thể sử dụng được. Do đó, chỉ có thể nạp sẵn một
SubWord (X1)] phần khóa vòng; các khóa còn lại phải được nạp từ bộ nhớ mỗi
khi cần sử dụng để mã hóa các khối.
Theo đó, nếu biểu diễn 128 bit đầu vào (xmm2) dưới dạng
Trong phần này chúng tôi cũng sử dụng một chương trình
bộ 4 từ 32 bit (w0, w1, w2, w3) thì đầu ra (xmm1) sẽ có dạng
cài đặt AES bằng ngôn ngữ C++ đã được tối ưu hóa và không
(w4, w5, w6, w7). Trong khi đó, theo yêu cầu của AES thì
sử dụng AES-NI để so sánh hiệu năng với chương trình sử
khóa vòng tương ứng phải có dạng (w4w0, w4w0w1, dụng AES-NI nói trên. Việc thử nghiệm được tiến hành trên
w4w0w1w2, w4w0w1w2w3). Như vậy, để thu máy có cấu hình: Intel Core i5-3210M 2,5GHz, RAM 4GB,
được khóa vòng cần thiết thì sau khi gọi lệnh Windows 7 64-bit.Kết quả thử nghiệm mã hóa 10 GB dữ liệu
AESKEYGENASSIST cần phải thực hiện thêm các lệnh khác với các kích thước vùng đệm khác nhau được thể hiện trên
để đưa đầu ra về dạng mong đợi. Hình 1. Trong đó, trục hoành là kích thước của vùng đệm tính
- Lệnh pshufd đưa xmm1 về dạng (w4, w4, w4, w4). bằng số khối, mỗi khối 16 bytes; trục tung là tốc độ mã hóa
- Cặp lệnh (pslldq, pxor) thứ nhất đưa xmm2 về dạng (w0, tính bằng MB/s.
w0w1, w1w2, w2w3).
- Cặp lệnh (pslldq, pxor) thứ hai đưa xmm2 về dạng (w0,
w0w1, w0w1w2, w1w2w3).
- Cặp lệnh (pslldq, pxor) thứ ba đưa xmm2 về dạng (w0,
w0w1, w0w1w2, w0w1w2w3).
- Lệnh pxor cuối cùng đưa xmm2 về dạng (w4w0,
w4w0w1, w4w0w1w2, w4w0w1w2 w3). Và
đây chính là khóa vòng cần có.
Câu hỏi đặt ra là tại sao Intel không thiết kế lệnh
AESKEYGENASSIST để nó thực hiện tất cả các thao tác trên
đây? Có lẽ là vì AES hỗ trợ 3 kích thước khóa khác nhau, và
thủ tục mở rộng khóa có sự khác nhau nhất định cho ba kích
thước khóa này. Mặt khác, người ta chỉ phải thực hiện duy nhất Hình 1. Tốc độ mã hóa bằng AES.
một lần mở rộng khóa cho mỗi phiên mã hóa/giải mã, do đó tốc
độ thực thi mở rộng khóa không thực sự quan trọng. Có thể dễ dàng nhận thấy chương trình mã hóa sử dụng tập
lệnh AES-NI cho tốc độ cao hơn hẳn so với chương trình mã
hóa không sử dụng tập lệnh này. Cụ thể, chương trình mã hóa
không sử dụng tập lệnh AES-NI đạt được tốc độ 155 MB/s,
328
328
HộiHội
Thảo Quốc
Thảo Gia
Quốc 2015
ĐiệnTử,
Tử,Truyền
NghệThông
ThôngTinTin (ECIT
(ECIT 2015)
2015)
trong khi chương trình mã hóa sử dụng tập lệnh AES-NI đạt thước vùng đệm vào khoảng 60 khối, tức là 960 byte. Như vậy,
được tốc độ 2040 MB/s cho phiên bản 32 bit và tốc độ 2120 để đạt được tốc độ mã hóa, giải mã cao nhất, nên sử dụng vùng
MB/s cho phiên bản 64 bit. đệm có kích thước tối thiểu 1 KB. Đây là giá trị rất nhỏ so với
Mặt khác, kết quả thử nghiệm cho thấy sự chênh lệch tốc kích thước vùng đệm được sử dụng trong thực tế.
độ mã hóa giữa phiên bản 32 bit và phiên bản 64 bit không
như dự kiến. Trước khi thử nghiệm, chúng tôi dự kiến rằng, vì
trong phiên bản 64 bit chỉ phải nạp khóa vòng từ bộ nhớ một IV. KẾT LUẬN
lần duy nhất, trong khi đối với phiên bản 32 bit thì một số khóa Tập lệnh AES-NI trong các dòng vi xử lý đời mới của Intel
vòng sẽ phải được nạp từ bộ nhớ khi mã hóa mỗi khối, do đó và AMD cho phép đạt được tốc độ mã hóa và giải mã bằng
tốc độ của phiên bản 64 bit phải lớn hơn đáng kể so với phiên AES cao hơn hẳn so với khi cài đặt thuật toán này sử dụng các
bản 32 bit. Tuy nhiên, như có thể thấy trên Hình 1, chênh lệch lệnh tính toán đa dụng. Cụ thể, trên máy tính có CPU Intel
về tốc độ giữa hai phiên bản này là không nhiều. Điều này có Core i5-3210M 2,5 GHz, RAM 4GB và Windows 7 64-bit,
thể được giải thích bởi cơ chế bộ nhớ đệm (cache) trong các vi chúng tôi đạt được tốc độ mã hóa là 2120 MB/s và tốc độ giải
xử lý hiện đại của Intel. Theo đó, có những khóa vòng tuy mã là 1950 MB/s. Để đạt được tốc độ mã hóa và giả mã cao
không được nạp vào thanh ghi nhưng được lưu sẵn trong bộ nhất, cần sử dụng vùng đệm có kích thước tối thiểu là 1 KB.
nhớ cache, việc nạp khóa vòng được thực hiện từ bộ nhớ cache Phần mềm viết cho nền tảng 64 bit có lợi thế so với phần
chứ không phải từ RAM, do đó sự chênh lệch tốc độ giữa hai mềm viết cho nền tảng 32 bit về số lượng thanh ghi XMM để
phiên bản là không nhiều. nạp trước các khóa vòng; tuy nhiên lợi thế đó không mang lại
Tương tự như trên, chúng tôi thử nghiệm việc giải mã và sự khác biệt về tốc độ. Do vậy, khi phát triển phần mềm có
thu được kết quả như trên Hình 2. chức năng mật mã (và có sử dụng AES-NI) thì không cần phải
xây dựng hai phiên bản 32 bit và 64 bit nếu chỉ vì muốn đạt
được tốc độ mã hóa/giải mã cao hơn trong nền tảng 64 bit; thay
vào đó, chỉ cần xây dựng phiên bản 32 bit là đủ.
[1] Mitchell C. Richards, "AES: The Making of a New Encryption
Standard, SANS Institute," Tech. Rep. 2001.
[2] Advanced Encryption Standard (AES), NIST std. FIPS PUB 197, 2001.
[3] AES Instruction Set. [Online]. Available:
https://en.wikipedia.org/wiki/AES_instruction_set#Libraries.
Hình 2. Tốc độ giải mã bằng AES. [4] Shay Gueron , Intel® Carry-Less Multiplication Instruction and its
Usage for Computing the GCM Mode - Rev 2.02. [Online]. Available:
Trong trường hợp này, tốc độ giải mã của chương trình có https://software.intel.com/en-us/articles/intel-carry-less-multiplication-
instruction-and-its-usage-for-computing-the-gcm-mode/.
sử dụng tập lệnh AES-NI cũng cao hơn hẳn so với chương
[5] Intel Advanced Encryption Standard (AES) New Instructions Set, Intel,
trình không sử dụng tập lệnh này. Cụ thể, chương trình không 2012.
sử dụng tập lệnh AES-NI đạt được tốc độ 146 MB/s trong khi [6] AES Implementation in CYASSL. [Online]. Available:
chương trình có sử dụng tập lệnh đó đạt được tốc độ 1880 https://github.com/cyassl/cyassl/blob/master/ctaocrypt/src/aes_asm.s.
MB/s (đối với phiên bản 32 bit) và 1950 MB/s (đối với phiên [7] Manley, Raymond, and David Gregg, "A program generator for intel
bản 64 bit). Điều này cũng cho thấy rằng sự chênh lệnh tốc độ AES-NI instructions," Progress in Cryptology-INDOCRYPT 2010.
Springer Berlin Heidelberg, 2010, pp.311-327.
giữa phiên bản 32 bit và phiên bản 64 bit là không nhiều.
[8] Bharata Rao. Inline assembly for x86 in Linux. [Online]. Available:
Cũng từ Hình 1 và Hình 2 có thể thấy được tốc độ mã hóa http://www.ibm.com/developerworks/library/l-ia/.
và giải mã khi sử dụng tập lệnh AES-NI phụ thuộc rõ rệt vào [9] Reducing the Impact of Misaligned Memory Accesses. [Online].
kích thước vùng đệm. Nếu kích thước vùng đệm là 1 khối, Available: https://software.intel.com/en-us/articles/reducing-the-impact-
tương đương 16 byte, thì tốc độ mã hóa và giải mã chỉ đạt of-misaligned-memory-accesses.
khoảng 500 KB/s. Nếu tăng kích thước vùng đệm thì tốc độ mã
hóa, giải mã cũng tăng theo; tốc độ cực đại đạt được khi kích
329
329
Đánh Giá Hiệu Năng Máy Vector Hỗ Trợ Sử

Dụng Hàm Nhân Radial Basic trong Hệ Thống
Nhận Dạng Khuôn Mặt Sử Dụng Khối Trích
Xuất PCA-LDA
Phạm Văn Tuấn∗ , Hà Xuân Cường∗ , Hồ Đức Trung∗
∗
Trung tâm Xuất Sắc
Đại học Bách Khoa Đà Nẵng
Đà Nẵng, Việt Nam
Email: pvtuan@dut.udn.vn, haxuancuong187@gmail.com, trunghoduc_1992@yahoo.com.vn
Tóm tắt—Trong bài báo này, một phương pháp hiệu quả Mặt khác, PCA và LDA là các phương pháp trích xuất
để nhận dạng khuôn mặt được trình bày để giải quyết tốt thuộc tính cơ bản. Hai hướng tiếp cận này có thể giúp giảm
sự biến đổi về biểu cảm khuôn mặt, tư thế mặt, và điều kiện bớt đáng kể khối lượng tính toán cho hệ thống nhận dạng,
chiếu sáng. Phương pháp này được dựa trên sự kết hợp giữa
từ đó rút ngắn thời gian hoạt động. Chỉ riêng PCA hoặc
Phân tích thành phần chính (PCA), Phân tích sự khác biệt
tuyến tính (LDA) và máy vector hỗ trợ (SVM) sử dụng hàm LDA cũng tạo ra hiệu năng tốt khi kết hợp với SVM [5],
Radial Basic (RBF). Các thử nghiệm đã được tiến hành trên [6], [7].
tập cơ sở dữ liệu hình ảnh: Grimace, Sheffield, và Yale B
mở rộng (Extended Yale B). Hiệu năng của phương pháp
được đề xuất cũng được so sánh với ba phương pháp khác,
đó là: PCA và RBF SVM, PCA và Linear SVM, PCA-LDA
và Linear SVM. Kết quả đã chỉ ra rằng, phương pháp sử
dụng PCA-LDA và RBF SVM cho kết quả nhận dạng cao Hình 1. Sơ đồ khối của hệ thống nhận dạng
và đáng tin cậy đối với sự thay đổi về biểu cảm khuôn mặt,
tư thế mặt, và điều kiện chiếu sáng.
Từ khóa—Phân tích thành phần chính, Phân tích sự khác Trong bài báo này, một nghiên cứu đối sánh được thực
biệt tuyến tính, Máy vector hỗ trợ, Hàm Radial Basic, Máy hiện để đánh giá hiệu năng của hệ thống nhận dạng sử
vector hỗ trợ tuyến tính. dụng các phương pháp trích xuất thuộc tính cơ bản (PCA,
LDA) cùng với SVM. Sau khi tiến hành việc so sánh, hệ
I. ĐẶT VẤN ĐỀ thống tốt nhất được đề xuất. Hệ thống này phải có hiệu
Nhận dạng khuôn mặt là một trong lĩnh vực nghiên cứu năng cao và đáng tin cậy khi phải đối mặt với sự thay đổi
tiên phong có nhiều ứng dụng trong thực tiễn, thí dụ: hệ về biểu cảm khuôn mặt, tư thế mặt, và điều kiện chiếu
thống tương tác giữa người và máy, cỗ máy tìm kiếm, hệ sáng. Sơ đồ khối tổng quát của quy trình nhận dạng được
thống theo dõi, hệ thống đăng nhập,... Một hệ thống nhận mô tả ở hình 1. PCA và sự kết hợp PCA-LDA được sử
dạng khuôn mặt tốt phải đạt được các yêu cầu sau: độ dụng làm phương pháp trích xuất thuộc tính. Trong khối
chính xác cao, đáp ứng thời gian thực, ít bị ảnh hưởng bởi phân loại, có hai tùy chọn đó là Linear SVM và RBF
các điều kiện bên ngoài (biểu cảm khuôn mặt, tư thế mặt, SVM.
điều kiện chiếu sáng,...). Cấu trúc của bài báo như sau: Phần II trình bày các
Trong những năm gần đây, SVM nổi lên như một bước tiền xử lí ảnh, tiếp đó, Phần III mô tả các thuật toán
phương pháp đầy hứa hẹn cho việc phân loại khuôn trích xuất thuộc tính (PCA, và PCA-LDA). Phần IV trình
mặt [1], [2]. Trong số các thuật toán trích xuất thuộc tính, bày kiến thức về SVM cũng như cách xây dựng một SVM
wavelet Gabor đã được thừa nhận là một phương pháp rất nhiều lớp. Kết quả thí nghiệm và phân tích được trình bày
mạnh khi phải đối mặt với sự thay đổi độ sáng, tư thế mặt ở Phần V. Cuối cùng, kết luận và hướng phát triển được
và biểu cảm khuôn mặt, theo nguồn từ [3]. Nghiên cứu thảo luận ở Phần VI.
ở [4] chỉ ra rằng sự kết hợp giữa Linear SVM và bộ lọc II. TIỀN XỬ LÍ
Gabor đáp ứng tốt khi cần giải quyết nhiều mặt của việc
nhận dạng khuôn mặt. Tuy vậy, wavelet Gabor yêu cầu Các bước tiền xử lí ảnh được áp dụng trong nghiên cứu
một lượng tính toán cực lớn. Do đó, các hệ thống nhận này được trình bày như sau:
dạng khuôn mặt sử dụng wavelet Gabor thường rất chậm. • Cắt từ ảnh chụp gốc để lấy ảnh khuôn mặt
330
ISBN: 978-604-67-0635-9 330
• Thay đổi kích thước ảnh thành 64x64 trong đó xji là mẫu thứ i trong lớp thứ j, µj là trung bình
• Đổi ảnh màu sang ảnh xám của lớp j, c là số các lớp, và Nj là số các mẫu trong lớp
• Đổi ảnh xám sang vector ảnh j.
• Thường hóa các vector ảnh sao cho chúng có trung
Định nghĩa 2. Ma trận phân tán liên-lớp, kí hiệu là Sb ,
bình 0 và độ lệch chuẩn 1
được định nghĩa bởi:
• Giãn cường độ sáng
c

III. TRÍCH XUẤT THUỘC TÍNH Sb = (µj − µ)(µj − µ)T
j=1
Phần này mô tả cách thức hoạt động của các phương
pháp trích xuất thuộc tính (PCA và LDA). trong đó µ biểu diễn trung bình của tất cả các lớp.
Mục tiêu của LDA là tìm các hướng mà tối đa giá trị
A. Không gian PCA phân tán liên-lớp đồng thời tối thiểu giá trị phân tán cùng-
||W Sb W T ||
Cho trước một ma trận dữ liệu X trong không gian lớp. Tức là, tìm W mà tối thiểu được ||W Sw W T ||
. Cần lưu
N -chiều trong đó mỗi vector cột xi , i = 1, 2, . . . , M biểu ý rằng:
diễn một ảnh (nói cách khác, cơ sở dữ liệu ảnh có M ảnh, • Cần ít nhất N + c mẫu để đảm bảo rằng ma trận Sw
mỗi ảnh có N điểm ảnh), Phân Tích Thành Phần Chính không là ma trận đơn. Tuy nhiên vì N rất lớn (với cỡ
(PCA) có thể được sử dụng để tìm một không gian con ảnh 64×64 trong hệ thống của chúng tôi, N = 4096)
mà các vector cơ bản của nó tương ứng với các hướng nên điều này trở nên không khả thi đối với các ứng
phương sai tối đa trong không gian ban đầu. Để giai đoạn dụng thời gian thực.
nhận dạng theo sau giai đoạn trích xuất thuộc tính mạnh • Một hệ thống LDA thuần thường thể hiện không tốt
hơn, chúng tôi đã thực hiện một số thay đổi sau: lắm khi thử các mẫu thử không có trong cơ sở huấn
• Thứ nhất, vector ảnh xi được chuẩn hoá sao cho luyện.
||xi || = 1 để đảm bảo hệ thống không bị ảnh hưởng Một vài kĩ thuật đã được đề xuất để giải quyết vấn đề
bởi cường độ ánh sáng chiếu vào. này. Trong [10], PCA được dùng làm không gian trung
• Thứ hai, các ảnh đã được chuẩn hoá sẽ bị trừ đi trung gian. Không gian N -chiều ban đầu trước tiên được chiếu
bình của tất cả các vector được chuẩn hoá để đảm xuống không gian I-chiều của PCA. Kĩ thuật này do đó
bảo rằng các eigenvectors ứng với các eigenvalues được gọi là Phân Tích Khác Biệt của Thành Phần Cơ Bản
lớn nhất biểu diễn các hướng trong eigenspace cùng trong nhận diện khuôn mặt. Ý tưởng kết hợp PCA và LDA
với phương sai của tất cả vector là tối đa về phương là để tận dụng tính chất lưu giữ đặc trưng dữ liệu của PCA
diện tương quan, xi := xi − x̄, trong đó x̄ là vector và tính chất phân biệt dữ liệu của LDA.
ảnh trung bình.
Khi triển khai thuật toán PCA, chúng tôi rút ra một vài IV. NHẬN DẠNG SỬ DỤNG SVM
nhận xét sau: Trong đề tài này, SVM dựa trên hàm nhân Linear và
• Tập trung vào việc biểu diễn thông tin hơn là phân hàm nhân RBF được xây dựng và được tiến hành thực
loại, do đó nó tối ưu hơn cho việc biểu diễn. nghiệm dựa trên bộ công cụ LIBSVM [11]. Trước tiên,
• Nhạy với các thay đổi về tư thế của đầu, vị trí, và khái lược lý thuyết cơ bản về SVM trong bài toán phân
biểu cảm của mặt. loại nhị phân được trình bày [12]. Sau đó, kỹ thuật này
• Kết quả nhận dạng khuôn mặt được tối ưu khi ba được mở rộng để giải quyết bài toán phân loại nhiều lớp
eigenvector đầu tiên không được sử dụng (dường và áp dụng vào nhận diện khuôn mặt.
như chúng được dùng để biểu diễn sự thay đổi độ A. SVM trong bài toán phân loại nhị phân
sáng) [9], nhưng nếu xoá chúng đi, kết quả nhìn chung
là giảm. SVM là một giải thuật máy học dựa trên lý thuyết học
thống kê do Vapnik và Chervonenkis xây dựng. Bài toán
B. Không gian PCA-LDA cơ bản của SVM là bài toán phân loại nhị phân. Cho tập
mẫu xi , yi , i = 1, 2, . . . , N trong đó xi ∈ RD và yi ∈
LDA tìm các vector trong không gian mà phân chia rõ {1, −1}N , mục tiêu của thuật toán SVM là tìm một siêu
nhất các lớp (chứ không phải là mô tả dữ liệu tốt nhất phẳng phân cách sao cho khoảng cách lề giữa hai lớp đạt
giống như của PCA). cực đại. Tức là chúng ta cần tìm siêu phẳng H : w·x+b =
Định nghĩa 1. Với một dữ liệu X cho trước, ma trận phân 0 và hai siêu phẳng hỗ trợ H1 , H2 song song với H và có
tán cùng-lớp, kí hiệu là Sw , được định nghĩa như sau: cùng khoảng cách đến H. Với điều kiện không có phần
tử nào của tập mẫu nằm giữa H1 và H2 , khi đó:
Nj
c

Sw = (xji − µj )(xji − µj )T w · xi + b ≥ +1 với yi = +1
j=1 i=1 w · xi + b ≤ −1 với yi = −1
331
331
C. Tối ưu hóa tham số của SVM

Trong phạm vi của bài báo này, tham số cần cho hàm
nhân Linear là C. Đối với hàm nhân RBF, hai tham số
cần được tối ưu là C và γ. Quy trình cross-validation
được sử dụng để tìm các thông số tối ưu bởi vì nó có
thể ngăn cản vấn đề overfitting. Trong quy trình k-fold
cross-validation, tập huấn luyện sẽ được chia thành k
tập con có cùng kích thước. Lần lượt, từng tập con sẽ
được thử với máy phân loại đã được huấn luyện dựa trên
k − 1 tập con còn lại. Do đó, mỗi mẫu trong tập huấn
luyện đều sẽ được kiểm tra một lần nên độ chính xác
của cross-validation chính là phần trăm của dữ liệu được
Hình 2. Minh hoạ thuật toán SVM
phân loại đúng. Trong thực tế, k được chọn là 5, còn
C và γ được chọn bằng thuật toán đơn giản tìm lưới
Khoảng cách lề giữa hai lớp là ||w||2
. Ta cần tìm siêu (grid search), cụ thể là log2 C ∈ {−5, −4, . . . , 15} và
log2 γ ∈ {−15, −14, . . . , 3} [16], [17], [18].
phẳng H với lề lớn nhất, tức là giải bài toán tối ưu tìm
minw,b ||w|| với điều kiện yi (w · xi + b) ≥ 1. Tuy nhiên V. ĐÁNH GIÁ
cách làm như trên (được gọi là tìm lề cứng) chỉ thực hiện Trong bài báo này, hệ thống nhận diện khuôn mặt được
được khi tập mẫu hoàn toàn phân tách tuyến tính được. đánh giá dựa trên ba tập cơ sở dữ liệu, với hai mô hình
Đối với những tập dữ liệu nhiễu, sẽ trường hợp có một huấn luyện và ba kịch bản kiểm tra. Cuối cùng hiệu suất
vài mẫu không phân lớp được nếu vẫn sử dụng lề cứng. nhân dạng và độ tin cậy của hệ thống được so sánh theo
Trong trường hợp này, lề mềm nên được tìm thay lề cứng. các trường hợp sau:
Sử dụng toán tử Lagrange cùng với một vài phép biến đổi,
• Sự kết hợp giữa PCA và Linear SVM
vector pháp tuyến w được biểu diễn như sau:
• Sự kết hợp giữa PCA và RBF SVM
• Sự kết hợp giữa PCA-LDA và Linear SVM
N

w= yi αi xi • Sự kết hợp giữa PCA-LDA và RBF SVM
i=1
Thuật toán SVM có thể được mở rộng cho trường hợp A. Cơ sở dữ liệu
tập mẫu không thể phân tách tuyến tính bằng cách ánh • Grimace [19]: từ 18 người, mỗi người gồm 20 ảnh
xạ tập mẫu lên một không gian có số chiều lớn hơn bằng với góc chụp cố định là nhìn thẳng. Các bức ảnh mô
cách sử dụng một hàm nhân K. Một số hàm nhân hay tả mức độ tăng dần về cảm xúc và biểu cảm khuôn
được sử dụng đó là: mặt. Các sự thay đổi khác là không đáng kể.
Linear • Sheffield [20]: có tổng cộng 573 ảnh được chụp từ 20
K(xi , xj ) = xTi xj người (đa dạng về chủng tộc/giới tính/vẻ bề ngoài).
Polynomial Tập ảnh của mỗi người có sự thay đổi chủ yếu về
K(xi , xj ) = (γxTi xj + r)d , γ > 0 góc lệch giữa khuôn mặt và máy chụp theo phương
Radial Basic Function (RBF) ngang.
K(xi , xj ) = exp(−γ||xi − xj ||2 ), γ > 0 • Extended YaleB (YaleB+) [21]: bài báo này chỉ sử
Sigmoid dụng 1538/5760 ảnh của 10 đối tượng với sự khác
K(xi , xj ) = tanh(γxTi xj + r) biệt đáng kể về điều kiện chiếu sáng, tư thế mặt thay
đổi rất ít.
B. SVM trong bài toán phân loại nhiều lớp
Có vài phương pháp giúp mở rộng SVM cho bài toán B. Mô hình huấn luyện và kịch bản kiểm tra
phân loại nhiều lớp. Hai trong số đó là One-Against-One Hệ thống được huấn luyện dưới hai mô hình được gọi là
(OAO) và One-Against-All (OAA). Đối với OAA, để giải Clean model (CM) và Noisy model (NM). CM bao gồm
quyết một bài toán phân loại q-lớp với SVM, q SVM sẽ các ảnh khuôn mặt nhìn thẳng và khuôn mặt không có
được huấn luyện. Mỗi SVM sẽ phân chia một lớp với tất biểu cảm. NM bao gồm các ảnh khuôn mặt có sự thay đổi
cả các lớp còn lại [12], [13]. Đối với OAO, q(q−1)
2 SVM về góc nhìn so với máy chụp và các khuôn mặt có sự biểu
sẽ được huấn luyện khi ta cần phân loại q lớp. Mỗi SVM cảm. Với mỗi mô hình huấn luyện, hệ thống được kiểm tra
sẽ lần lượt phân chia một cặp hai lớp. dưới ba kịch bản: Well-Matched (WM), Medium-Matched
Trong công trình nghiên cứu này, OAO SVM được chọn (MM) and Highly-Mismatched (HM). Dữ liệu kiểm tra
để phân loại khuôn mặt người vì phương pháp OAO dường WM là một tập các ảnh tương tự với các ảnh huấn luyện.
như tốn nhiều thời gian hơn phương pháp OAA nhưng lại Dữ liệu kiểm tra MM bao gồm các ảnh có sự khác biệt
cho độ chính xác cao hơn [14], [15]. một phần về biểu cảm và tư thế khuôn mặt so với các ảnh
332
332
Bảng I Bảng II
MA TRẬN PHÂN LOẠI CHO HAI LOẠI ĐỐI TƯỢNG KẾT QUẢ RECALL (%)
Trạng thái Cơ Kịch Hệ thống

sở bản
Cho phép Từ chối PCA kết PCA PCA-LDA PCA-LDA
dữ kiểm
liệu tra hợp RBF kết hợp kết hợp kết hợp
Không thẩm quyền (N) False (F) True (T)
Loại đối tượng SVM Linear RBF Linear
Có thẩm quyền (P) True (T) False (F) SVM SVM SVM
CM NM CM NM CM NM CM NM
Gri- WM 96 40 100 100 100 100 100 100

huấn luyện. Với trường hợp HM, tập ảnh kiểm tra bao gồm mace MM 97 82 97 100 97 100 97 100
các ảnh về biểu cảm và tư thế có sự khác biệt rất lớn so
với tập ảnh huấn luyện. Shef- MM 86 100 83 100 79 100 95 100
field HM 64 100 64 100 31 90 74 100
C. Tiêu chí đánh giá WM 100 18 100 18 100 93 100 100

YaleB-
MM 99 27 99 27 92 89 92 97
Để đánh giá sự hiệu quả của hệ thống, ba đại lượng ext
được sử dụng đó là : Recall, Equal Error Rate (EER) và HM 31 25 27 25 6 84 5 96
Accuracy (ACC).
1) Recall: đại lượng này được sử dụng khi một phần
của cơ sở dữ liệu được dùng cho việc huấn luyện, phần a) Sự phụ thuộc vào thuật toán trích xuất thuộc tính:
còn lại được dùng cho việc kiểm tra. Tập ảnh kiểm tra sẽ Đối với tập cơ sở dữ liệu đơn giản nhất là Grimace, PCA
không có sự hiện diện của các bức ảnh chứa khuôn mặt và PCA-LDA cho hiệu quả cao và gần như tương đương.
của những người lạ. Recall = Số lần nhận diện đúng
Tổng số lần nhận diện Đối với tập dữ liệu có sự thay đổi đáng kể về góc khuôn
2) EER: : Với sự xuất hiện của người lạ, hệ thống sẽ mặt (Sheffield), PCA vẫn cho kết quả cao nhưng PCA-
sử dụng một chỉ số gọi là ngưỡng (threshold) để quyết LDA cho kết quả tốt hơn. Đối với tập cơ sở dữ liệu phức
định người đó có được chấp nhận hay không. Bảng I là tạp nhất (Extended Yale B), khi có sự thay đổi khắc nghiệt
ma trận phân loại cho hai loại đối tượng với P đại diện về điều kiện chiếu sáng, PCA-LDA cho thấy sự vượt trội
cho người không có thẩm quyền và N đại diện cho người hoàn toàn so với PCA. Kết quả kiểm tra của PCA-LDA
có thẩm quyền. Dựa vào bảng I, số lần người không có với NM là rất cao trong khi kết quả của PCA là rất thấp.
thẩm quyền được hệ thống cho qua là FN. Tương tự, ta b) Sự phụ thuộc vào hàm nhân: Dựa vào các kết
rút ra định nghĩa của TN, TP, và FP. Tỉ lệ chấp nhận sai quả thể hiện trên bảng II, rõ ràng rằng Linear SVM cho
(FAR - False Acceptance Rate) là tỉ lệ một người không độ chính xác cao hơn so với RBF SVM trong hầu hết các
có thẩm quyền bị chấp nhận sai bởi hệ thống. Tỉ lệ từ trường hợp. Đặc biệt, sự kết hợp giữa PCA-LDA và Linear
chối sai (FRR - False Rejection Rate) là tỉ lệ một người SVM tạo ra hệ thống tốt nhất bởi vì nó cho kết cả cao
có thẩm quyền bị từ chối bởi hệ thống. FAR và FRR được nhất gần như trong tất cả các trường hợp.
tính theo công thức:
PCA, linear, grimace, Noisy Model, WM, 1, 0, 0.98095, 0.016667
1
FP FN FAR
F RR = , F AR = 0.9
FRR
TP + FP TN + FN
0.8
Với các ngưỡng khác nhau, FAR và FRR sẽ cho các giá
0.7
trị tương ứng. EER được định nghĩa là giao điểm của hai
đường FAR và FRR. 0.6
3) ACC: ACC là tỉ lệ mà hệ thống nhận diện đúng các

Error
0.5
đối tượng. Nó được tính theo công thức: 0.4
0.3
TP + TN
ACC = 0.2
TP + FP + TN + FN
0.1
D. Kết quả và phân tích 0

0 0.1 0.2 0.3 0.4 0.5 0.6 0.7 0.8 0.9 1
Threshold
1) Với mục đích nhận dạng: Đầu tiên, mức độ hiệu quả
của bốn hệ thống được xem xét khi nhu cầu của người Hình 3. EER của PCA-Linear SVM được kiểm tra với Grimace-NM-WM
dùng là để xác định đúng danh tính của những đối tượng (số cuối cùng, EER = 0.016)
có trong cơ sở dữ liệu (không có sự tấn công của người
lạ). Bảng II trình bày tỉ lệ nhận dạng đúng khi hệ thống c) Sự phụ thuộc vào mô hình huấn luyện: Trong bài
được thử trên ba tập cơ sở dữ liệu với độ khó tăng dần. báo này, sự hiệu quả của bốn hệ thống được nghiên cứu
333
333
PCA−LDA, linear, grimace, Noisy Model, WM, 1, 0.11667, 1, 0 Bảng III

1
FAR KẾT QUẢ EER
FRR
0.9
0.8 Cơ Kịch Hệ thống

sở bản
0.7
dữ kiểm PCA kết PCA PCA-LDA PCA-LDA
0.6
SVM Linear RBF Linear
SVM SVM SVM
Error
0.5
0.4 CM NM CM NM CM NM CM NM
0.3
Gri- WM 0.13 0.51 0.02 0.02 0.00 0.00 0.05 0.00
0.2 mace MM 0.10 0.26 0.05 0.03 0.04 0.00 0.17 0.01
0.1
Shef- MM 0.27 0.16 0.25 0.11 0.28 0.00 0.25 0.22
0
0 0.1 0.2 0.3 0.4 0.5 0.6 0.7 0.8 0.9 1 field HM 0.36 0.16 0.40 0.16 0.50 0.08 0.55 0.25
Threshold
WM 0.02 0.57 0.00 0.55 0.00 0.09 0.02 0.05

Hình 4. EER của PCA-LDA-Linear SVM được kiểm tra với Grimace- YaleB-
MM 0.12 0.66 0.13 0.66 0.33 0.12 0.23 0.16
NM-WM (số cuối cùng, EER = 0) ext
HM 0.58 0.60 0.59 0.60 0.55 0.18 0.33 0.18
dựa trên hai mô hình huấn luyện là CM và NM. Các kết

quả thu được cho thấy rằng tỉ lệ nhận dạng của NM tốt Bảng IV
KẾT QUẢ ACC (%)
hơn so với tỉ lệ nhận dạng của CM. Điều này là hợp lý
bởi vì với NM, hệ thống được học với các ảnh huấn luyện
Cơ Kịch Hệ thống
có sự thay đổi đa dạng. Tuy nhiên, cần lưu ý rằng PCA sở bản
dường như hoạt động rất tốt với CM. Khi được kiểm tra dữ kiểm PCA kết PCA PCA-LDA PCA-LDA
với tập cơ sở dữ liệu khó nhất là Extended Yale B, PCA SVM Linear RBF Linear
luôn mang lại hiệu suất nhận dạng cao hơn đối với trường SVM SVM SVM
hợp sử dụng CM. Trong một vài trường hợp, cụ thể là khi CM NM CM NM CM NM CM NM
các ảnh kiểm tra thuộc tập WM và MM được sử dụng
để kiểm tra CM của tập cơ sở dữ liệu Extended Yale B, Gri- WM 88 37 98 98 100 100 96 100
mace MM 91 82 95 95 97 100 83 99
PCA thậm chí vượt trội so với PCA-LDA. Sau khi xem
xét các phân tích trên, một đề xuất được nêu ra đó là PCA Shef- MM 74 85 74 88 83 100 77 80
thích hợp cho các tập cơ sở dữ liệu đơn giản: không có field HM 63 84 59 86 53 95 42 76
sự thay đổi khắc nghiệt về điều kiện chiếu sáng và có số
lượng ít các ảnh của mỗi đối tượng. Công trình nghiên WM 98 42 100 46 100 94 98 95
YaleB-
MM 88 34 87 32 73 88 78 84
cứu trong [22] có thể phần nào chứng minh được đề xuất ext
này. HM 42 41 42 40 37 82 71 82
2) Với mục đích bảo mật: Mức độ hiệu quả mà hệ

thống có thể mang lại được xem xét khi có sự hiện diện
của những đối tượng lạ không có trong cơ sở dữ liệu.
EER và ACC được dùng để đánh giá độ tin cậy của các hầu hết các trường hợp, PCA-LDA cho kết quả EER và
hệ thống. độ chính xác tốt hơn so với PCA. Hình 3 và hình 4 minh
a) Sự phụ thuộc vào thuật toán trích xuất thuộc tính: họa cho các kết quả này.
Các hệ thống sử dụng PCA hoạt động khá tốt với tập b) Sự phụ thuộc vào hàm nhân: Linear SVM cho
Grimace và Sheffield. Chúng cho kết quả EER thấp và thấy hiệu quả tốt hơn so với RBF SVM khi chúng được
hiệu suất nhận dạng cao khi được thử với NM. Với cơ sở kết hợp với PCA. Tuy nhiên, RBF SVM lại cho kết quả
dữ liệu lớn có sự thay đổi khắc nghiệt về điều kiện chiếu EER và độ chính xác tốt hơn so với Linear SVM khi chúng
sáng (Extended YaleB), PCA tỏ ra không đáng tin cậy. kết hợp với PCA-LDA. Hệ thống sử dụng PCA-LDA và
Các hệ thống sử dụng PCA chỉ cho kết quả EER thấp và RBF SVM cũng là hệ thống đáng tin cậy nhất trong tất cả
hiệu suất nhận dạng cao khi tập ảnh kiểm tra WM và MM bốn hệ thống. Với yêu cầu về tính bảo mật, PCA-LDA và
được thử với CM. Kết quả trong bảng III và bảng IV một RBF SVM vượt trội hơn so với hệ thống sử dụng PCA-
lần nữa củng cố đề xuất rằng PCA chỉ nên được sử dụng LDA và Linear SVM.
cho các tập dữ liệu không có những sự thay đổi lớn và c) Sự phụ thuộc vào mô hình huấn luyện: Tương tự,
những tập dữ liệu có số lượng ảnh nhỏ. Ngược lại, các các kết quả trong bảng III và bảng IV một lần nữa cho
hệ thống sử dụng PCA-LDA thì ổn định và đáng tin cậy. thấy NM nổi trội hơn so với CM khi độ tin cậy của các
Chúng hoạt động tốt với cả ba tập cơ sở dữ liệu. Trong hệ thống được xét đến.
334
334
VI. KẾT LUẬN [4] G. Majumder, M. K. Bhowmik, Gabor-Fast ICA Feature Extraction
for Thermal Face Recognition Using Linear Kernel Support Vector
Một vài hệ thống nhận dạng khuôn mặt đã được xây Machine, IEEE 2015 International Conference on Computational
dựng bằng việc kết hợp các phương pháp trích xuất thuộc Intelligence and Networks (CINE), Bhubaneshwar, pp. 21 – 25,
tính và các hàm nhân trong khối nhận dạng. Các hệ thống Jan. 2015.
[5] Chengliang Wang, Libin Lan, Yuwei Zhang, and Minjie Gu, Face
này được kiểm tra với nhiều cơ sở dữ liệu ảnh dưới nhiều Recognition Based on Principal Component Analysis and Sup-
mức độ khác nhau của yêu cầu an ninh. Khi hiệu suất nhận port Vector Machine, IEEE 2011 3rd International Workshop on
dạng được ưu tiên, sự kết hợp PCA-LDA và Linear SVM Intelligent Systems and Applications (ISA), Wuhan, pp. 1 – 4,
May 2011.
là hệ thống tốt nhất, theo sau là PCA-LDA và RBF SVM. [6] S. L. Happy, A. Routray, Robust facial expression classification
Tuy nhiên, khi sự tin cậy của hệ thống được ưu tiên, hệ using shape and appearance features, IEEE 2015 Eighth Interna-
thống sử dụng PCA-LDA và RBF SVM vượt trội hệ thống tional Conference on Advances in Pattern Recognition (ICAPR),
Kolkata, pp. 1 – 5, Jan. 2015.
sử dụng PCA-LDA và Linear SVM. Trong ứng dụng thời [7] Abdulrahman, Muzammil, Eleyan, and Alaa, Facial expression recog-
gian thực, mục đích và môi trường sử dụng của hệ thống nition using Support Vector Machines, IEEE Signal Processing
and Communications Applications Conference (SIU), 2015 23th,
nhận dạng khuôn mặt cần được xem xét kĩ lưỡng. Tuy Malatya, Turkey, pp. 276 – 279, May 2015.
nhiên, trong thí nghiệm này, hệ thống sử dụng PCA-LDA [8] M. Turk and A. Pentland, Eigenface for Recognition, Journal of
và RBF SVM được đề xuất, với những điều kiện về cơ sở Cognitive Neuroscience, vol. 3, no. 1, pp. 71-86, 1991.
[9] A. Pentland, T. Starner, N. Etcoff, N. Masoiu, O. Oliyide, and M. Turk,
dữ liệu và yêu cầu cho trước. Về mặt tính chất của hình Experiments with Eigenfaces, Proc. Looking at People Workshop
ảnh, hệ thống đã nêu có thể xử lí được những thay đổi về Int’l Joint Conf. Artificial Intelligence, Aug. 1993.
điều kiện chiếu sáng, tư thế mặt, và biểu cảm khuôn mặt. [10] P. N. Belhumeror, J.P. Hespanha, and D.J. Kriegman, Eigenfaces vs.
Fisherfaces: Recognition Using Class Specific Linear Projection,
Thời gian kiểm tra là rất ngắn trên máy tính cá nhân, do IEEE Trans. Pattern Analysis and Machine Intelligence, vol. 19,
đó hệ thống có thể đáp ứng được yêu cầu của một ứng no. 7, pp. 711-720, 1997.
dụng thời gian thực. [11] LIBSVM – A Library for Support Vector Machines, [online]. Avail-
able: http://www.csie.ntu.edu.tw/~cjlin/libsvm/
Mục tiêu cuối cùng của bài báo này là xây dựng được [12] C. Cortes and V. Vapnik, “Support vector networks,” Machine
một hệ thống nhận dạng khuôn mặt hiệu quả và đáng tin Learning, 1995
cậy với thành phần cốt lõi là SVM. Một vài khó khăn cần [13] B. Scholkopf, C. Burges, and V. Vapnik. Extracting support data for a
given task in U. Fayyad and R. Uthurusamy, editors, Proceedings
phải vượt qua là: a) nghiên cứu thêm về các phương pháp of the First International Conference on Knowledge Discovery and
trích xuất thuộc tính khác: PCA-LDA hoạt động có hiệu Data Mining, Menlo Park, CA, 1995. AAAI Press.
quả, nhưng nó là phương pháp cơ bản. b) nghiên cứu bản [14] Ben Aisen, A Comparison of Multiclass SVM Methods, December 15,
2006.
chất của SVM: trong bài báo này, SVM được dùng như [15] R. Kyle Eichelberger, Victor S. Sheng, Does One-Against-All or One-
một công cụ với các tham số. Trong tương lai, cần xem Against-One Improve the Performance of Multiclass Classifica-
xét việc sử dụng các hàm nhân mới. tions?, Proceedings of the Twenty-Seventh AAAI Conference on
Artificial Intelligence.
TÀI LIỆU THAM KHẢO [16] Carl Staelin, Parameter selection for support vector machines, HP
Laboratories Israel, November 2003.
[1] Juneja, Komal, An improvement on face recognition rate using local [17] Chih-Wei Hsu, Chih-Chung Chang, and Chih-Jen Lin, A practical
tetra patterns with support vector machine under varying illumina- guide to support vector classification, April 2010.
tion conditions, IEEE Computing, 2015 International Conference [18] Zhigang Yan, Yuanxuan Yang and Yunjing Ding, An experimental
on Communication & Automation (ICCCA), India, pp. 1079 – study of the hyper-parameters distribution region and its optimiza-
1084, May 2015. tion method for support vector machine with Gaussian Kernel,
[2] Jia Jun Zhang, Yu Ting Shi, Face recognition systems based on International Journal of Signal Processing, Image Processing and
independent component analysis and support vector machine, Pattern Recognition, Vol.6, No.5 (2013), pp.437-446, 2013.
IEEE 2014 International Conference on Audio, Language and [19] Essex Grimace Database, [Online]. Available: http://cswww.essex.ac.
Image Processing (ICALIP), Shanghai, pp. 296 – 300, July 2014. uk/mv/allfaces/grimace.html
[3] F.Ahmad Bhat, M. Arif Wani, Gabor wavelet based face recognition [20] Sheffield Face Database, [Online]. Available:http://www.sheffield.ac.
under varying lighting, pose and expression conditions, IEEE uk/eee/research/iel/research/face
2015 2nd International Conference on Computing for Sustainable [21] Extended Yale B Database, [Online]. Available: http://www.vision.
Global Development (INDIACom), New Delhi, pp. 1314 – 1318, ucsd.edu/~leekc/ExtYaleDatabase/ExtYaleB.html
March 2015. [22] Aleix M. MartoAnez and Avinash C. Kak, PCA versus LDA, IEEE
Transactions on Pattern Analysis and Machine Intelligence, vol.
23, no. 2, pp. 228-233, February 2001.
335
335
Đánh giá bộ nhãn ngữ nghĩa LLOCE

Hồ Xuân Vinh∗ , Nguyễn Thị Thanh Thảo† , Đinh Điền‡
∗‡ Khoa Công nghệ thông tin - Đại Học Khoa Học Tự Nhiên TP. Hồ Chí Minh
†Khoa Công nghệ thông tin - Cao Đẳng Kinh Tế Kỹ Thuật TP. Hồ Chí Minh
Email: ∗ hovinh39@gmail.com, † nguyenthithanhthao@hotec.edu.vn, ‡ ddien@fit.hcmus.edu.vn
Tóm tắt—Theo đà phát triển của các phương pháp dịch Nói đến các bộ nhãn ngữ nghĩa ta có thể liệt kê như
máy, dịch máy thống kê dựa trên ngữ nghĩa (semantics- sau:
based Statistical Machine Translation) được đánh giá là
sẽ có triển vọng nhiều nhất. Tuy nhiên, phương pháp này • LLOCE (Longman Lexicon of Contemporary En-
đòi hỏi bộ ngữ liệu song ngữ lớn mà có gán nhãn ngữ glish): từ điển về chủ đề, mỗi chủ đề được chia
nghĩa (semantic-tag). Xây dựng bộ ngữ liệu như thế bằng thành nhiều nhóm, mỗi nhóm chứa nhiều lớp ngữ
phương pháp thủ công sẽ tốn nhiều thời gian và công sức. nghĩa với từ thuộc lớp nghĩa đó. Tên của mỗi lớp
Vì vậy, việc nghiên cứu xây dựng bộ ngữ liệu tự động
cũng chính là nhãn ngữ nghĩa. Từ điển bao gồm
đang được các nước quan tâm. Tuy nhiên đối với Tiếng
Việt thì vấn đề này chưa được giải quyết. Trong bài báo, 14 chủ đề, 129 nhóm, 2.449 lớp ngữ nghĩa với hơn
chúng tôi trình bày mô hình khảo sát tính hiệu quả của bộ 16.000 mục từ.
nhãn ngữ nghĩa thuộc từ điển LLOCE (Longman Lexicon • LDOCE (Longman Dictionary of Contemporary
Of Contemporary English) trong quá trình gán nhãn ngữ English): mỗi từ được phân loại dựa trên từ loại, mã
nghĩa tự động cho ngữ liệu song ngữ Anh-Việt. cú pháp, mã ngữ nghĩa, mã chủ đề và mã phong
Từ khóa—LLOCE, sense tag, semantic annotation, nhãn
ngữ nghĩa... cách. Từ điển bao gồm 100 chủ đề, 19 mã ngữ
nghĩa, 13 mã ngữ nghĩa phái sinh, 45.000 mục từ
I. GIỚI THIỆU với hơn 65.000 nghĩa.
• WordNet: hệ thống tri thức khổng lồ về ngữ nghĩa
Xử lý ngôn ngữ tự nhiên(Natural Language
trong Tiếng Anh với 117.000 ý niệm khác nhau.
Processing-NLP) là lĩnh vực quan tâm đến tương tác
Được xây dựng bởi đơn vị cơ bản là các tập từ
người máy về mặt ngôn ngữ. Khởi động từ năm 1950
đồng nghĩa, nó chứa đựng cả những quan hệ ngôn
với phép thử Turing và bài toán dịch máy, nhiều bài toán
ngữ phức tạp tương tác đa chiều.
mới đã được phát hiện và nghiên cứu. Độ khó cũng tỉ lệ
thuận theo thời gian, nhiều vấn đề không có thuật toán Ngoại trừ những ngôn ngữ giàu tài nguyên như Tiếng
tối ưu tồn tại, đơn giản vì ngôn ngữ luôn mang tính Anh (đơn cử là Wordnet [1], [2], [3], [4]), hầu hết các
nhập nhằng và dường như không thể tìm được một bộ ngôn ngữ còn lại không có bộ nhãn ngữ nghĩa cho riêng
luật tổng quát nào cho máy có thể tra cứu và thực hiện. mình. Những năm gần đây, nhiều nỗ lực từ phía ngôn
Riêng đối với bài toán dịch máy, hướng tiếp cận được ngữ học lẫn tin học đã xây dựng những bộ nhãn riêng
mô hình hóa theo dạng kim tự tháp từ thấp lên cao: dựa dựa trên WordNet như EuroWordNet [5] (khối Châu
trên từ (word-based), dựa trên cụm từ (phrase-based), Âu), Japanese Wordnet [6](Nhật). . . Như liệt kê ở trên,
dựa trên cú pháp (syntax-based) và dựa trên ngữ nghĩa ngoài Wordnet với bộ nhãn khá mịn (ngay cả con người
(semantic-based). Người ta nhận thấy rằng, càng lên cao cũng khó phân biệt một số nhãn trong từ điển này) và
thì độ chính xác càng tăng, tuy nhiên hiện nay phát triển có chi phí xây dựng cực kì mắc, có những bộ nhãn
sôi động nhất chỉ mới ở tầng phrase-based. Sẽ cực kì tiềm năng khác có thể phục vụ cho mục đích gán nhãn.
hiệu quả nếu chúng ta nằm ở đỉnh trên cùng của tháp, Không phổ biến như Wordnet, tuy nhiên LLOCE có bộ
khi đó đồng nghĩa với việc tồn tại bộ ngữ liệu song ngữ nhãn không quá thô cùng bộ từ vựng tương đối lớn, do
được gán nhãn ngữ nghĩa toàn bộ. Độ hiệu quả của các đó chúng tôi chọn bộ nhãn này làm đối tượng khảo sát
phương pháp trước đây sẽ được đẩy lên một giới hạn và đặt ra những tiêu chí mà bộ nhãn cần đạt yêu cầu.
mới. Để có ngữ liệu gán nhãn quý giá đó, cần có bộ Sau khi tiến hành thí nghiệm, kết quả thống kê sẽ được
nhãn để gán. Do đó, chúng tôi quan tâm đến tầng ngữ đối chứng với điều kiện ban đầu, giúp ta có những nhận
nghĩa với 2 câu hỏi chính: cần chọn bộ nhãn ngữ nghĩa xét về tính thực tiễn của bộ nhãn và các ứng dụng phù
nào để gán nhãn và liệu nó có đạt được những đặc tính hợp.
mà chúng tôi đề xuất hay không? Bài báo sẽ khảo sát LLOCE về khả năng khử nhập
336
ISBN: 978-604-67-0635-9 336

nhằng( hay tính đa nghĩa) của từ trong 90.000 cặp câu “Sự sống và vật thể sống” (Life and living things); chủ
song ngữ Anh –Việt. Ngữ liệu trong 2 ngôn ngữ được đề B là về “Cơ thể: chức năng và sự chăm sóc” (The
xử lý tách từ độc lập, sau đó đưa qua từ điển LLOCE Body: its Functions and Welfare); chủ đề L là “Không
để xử lý một lần nữa. Sử dụng toolkit GIZA++ (Och gian và thời gian”. Chủ đề A được tiếp tục phân thành
và Ney, 2003[7]) với 60.000 cặp câu đầu làm hạt giống, 10 nhóm con: “Sự sống và sự chết” chứa các lớp từ A1
30.000 cặp câu còn lại làm đối tượng khảo sát chính, đến A20; “Các sinh vật nói chung”, có chứa các lớp từ
chúng tôi kì vọng độ chính xác khi gióng hàng sẽ tăng A30 đến A43; “Động vật và động vật có vú” chứa các
cao với ngữ liệu này. Dữ liệu sau gióng hàng sẽ được lớp từ A50 đến A61...
gán nhãn độc lập và giao với nhau. Chúng tôi thống kê Mỗi lớp ngữ nghĩa trong LLOCE thường gắn với một
các kết quả giao bộ nhãn của các từ được gióng, đặc từ loại và mang một ý nghĩa cụ thể nào đó. Trong mỗi
biệt quan tâm đến các cặp có chung từ 2 bộ nhãn trở lớp này sẽ chứa một số từ thoả điều kiện từ loại và
lên. Theo như hiểu biết của chúng tôi, hiện tại chưa có ngữ nghĩa chung của lớp. Trong LLOCE sử dụng 3 từ
khảo sát tương tự đối với các bộ nhãn khác, do đó các loại chính là: danh từ, động từ và tính từ. Ví dụ: Lớp
đánh giá chỉ dựa trên số liệu, chưa có đối tượng so sánh. A1 gắn với động từ, có ý nghĩa: “Tồn tại và tạo sự tồn
Chúng tôi đưa ra các nhận xét, đánh giá kết quả và đưa tại”, lớp này bao gồm các động từ sau: exist, be(tồn tại),
ra các định hướng tương lai áp dụng kết quả này. Trong create(tạo ra), animate(tạo sự sống),. . .
phần còn lại của bài báo, chúng tôi sẽ giới thiệu cấu Mỗi lớp thường được liên kết chéo (cross-reference)
trúc từ điển LLOCE và tính chất cần khảo sát. Chúng với các lớp ngữ nghĩa khác theo các quan hệ logic –
tôi cũng trình bày bộ ngữ liệu song ngữ Anh - Việt sử ngữ nghĩa. Từ điển LLOCE đã được dịch sang tiếng
dụng và mô hình khảo sát tính hiệu quả bộ nhãn. Cuối Việt[9], do đó tồn tại bộ nhãn cho cả hai ngôn ngữ
cùng, kết quả sau thí nghiệm được đánh giá, lý giải và Anh và Việt.
chúng tôi sẽ đề xuất các hướng phát triển tương lai cho
bộ nhãn này. 2) Tính chất của bộ nhãn phù hợp: Từ những năm
2010 trở đi, cách tiếp cận thông dụng nhất trong NLP
II. NGỮ LIỆU VÀ TÀI NGUYÊN
là Máy học, do đó bộ nhãn phải phù hợp với việc huấn
Wordnet là hệ thống nhãn ngữ nghĩa lớn nhất hiện luyện. Một bộ nhãn tốt không nên quá nhỏ vì sẽ làm
nay, tuy nhiên chi phí xây dựng cực kì tốn kém. Chúng mất mát đi nhiều thông tin về nghĩa hữu ích. Tuy nhiên
tôi tiến hành khảo sát các tính chất của bộ nhãn LLOCE nếu quá lớn, cần phải có một ngữ liệu lớn tương ứng
để tìm hiểu xem nó có thể là giải pháp thay thế được hay để huấn luyện, hơn nữa phải được đánh nhãn bằng tay
không. Chúng tôi phỏng đoán đối với các cặp từ được để đảm bảo độ chính xác. Bên cạnh đó, ta cũng quan
gióng, nếu chúng tồn tại trong bộ từ vựng của LLOCE, tâm đến khả năng khử nhập nhằng của bộ nhãn bằng
khả năng khử nhập nhằng, tức có một nhãn đồng nhất sử dụng lợi thế ràng buộc song ngữ với giả định: giao
trong cặp từ là từ 70% trở lên. Nếu đúng, đây có thể là bộ nhãn của cùng một từ ở hai ngôn ngữ luôn là 1.
đối tượng phù hợp cho các ngôn ngữ nghèo tài nguyên Hai yếu tố then chốt kích thước và khả năng khử nhập
xây dựng bộ nhãn ngữ nghĩa cho riêng mình. nhằng là lý do chúng tôi chọn LLOCE tiếng Anh trong
A. Từ điển LLOCE và tính chất của bộ nhãn phù hợp các bộ nhãn bởi nó không quá mịn như Wordnet (2.449
so với 117.000 nhãn), cộng với bộ từ điển Tiếng Việt
1) Từ điển LLOCE: LLOCE (Longman Lexicon Of tương ứng, phù hợp cho việc gán nhãn bằng tay. Câu
Contemporary English)[8] là một từ điển ý niệm được hỏi còn để ngỏ chính là nó có đủ chi tiết để khử nhập
xây dựng dựa trên từ điển ý niệm LDOCE. Từ điển nhằng trong các trường hợp song ngữ hay không. Đây
LLOCE không sắp xếp các mục từ tiếng Anh theo thứ là tính chất quan trọng nhất và cần quan tâm sau thí
tự từ điển, mà sắp xếp thành các chủ đề, mỗi chủ đề nghiệm. Với đặc trưng bộ nhãn LLOCE, chúng tôi kì
được chia thành nhiều nhóm, mỗi nhóm được chia thành vọng khoảng 70% cặp từ sau khi gióng sẽ được gán
nhiều lớp (tạm gọi là lớp ngữ nghĩa) và mỗi lớp gồm các nhãn.
mục từ có quan hệ về nghĩa (nghĩa biểu vật hay nghĩa
biểu niệm) với nhau (như: đồng nghĩa, gần nghĩa,..). Tên B. Ngữ liệu song ngữ
của mỗi lớp chính là nhãn ngữ nghĩa và các lớp này có
mối liên hệ ngữ nghĩa (qua đường kết nối bên trong) với 91.983 cặp câu song ngữ Anh-Việt được trích từ 2
các lớp khác (có thể thuộc chủ đề khác) trong từ điển. ngữ liệu sau:
Tổng số LLOCE gồm 14 chủ đề, 129 nhóm, 2449 lớp • 60.032 cặp lấy từ Trung tâm Dữ liệu Đa ngữ Kim
ngữ nghĩa với hơn 16.000 mục từ. Ví dụ: chủ đề A là về từ điển (KMDC).
337
337
mỗi chữ cũng là từ nên chúng tôi không thực hiện tách.
Sau đó, chúng tôi tách từ một lần nữa bằng kĩ thuật
tham lam LRMM (Left Right Maximum Matching) với
LLOCE: duyệt các chữ trong câu, ở mỗi chữ tìm từ vựng
dài nhất trong từ điển LLOCE bắt đầu bởi chữ này và
chứa những từ liền nó. Ngữ liệu sẽ nối các chữ cấu thành
từ bởi dấu ‘_’. Ví dụ: ‘có thể’ thành ‘có_ thể’, ‘tam thừa’
thành ‘tam_thừa’. . . Để thực hiện bước lọc này, chúng
tôi đã thống kê từ vựng dài nhất trong từ điển LLOCE
ở cả 2 ngôn ngữ. Kết quả như sau:
• LLOCE Tiếng Anh: “come down on smb. like a
ton of bricks” với 9 chữ, tỉ lệ từ cấu tạo từ 2 chữ
trở lên chiếm 29,83%.
• LLOCE Tiếng Việt: “thay đổi từ một trạng thái
sang một trạng thái khác theo một trình tự đều
đều” với 17 chữ, tỉ lệ từ cấu tạo từ 2 chữ trở lên
Hình 1. Sơ đồ mô hình khảo sát bộ nhãn LLOCE.
chiếm 92,44%.
Có thể thấy “từ vựng” trong cả 2 từ điển khác với quan
niệm thông thường. Đối với từ điển gốc, nó cũng chứa
• 31.951 cặp lấy từ những câu ví dụ vốn trong từ điển cả những cụm từ và thành ngữ. Với Tiếng Việt, có những
LLOCE Tiếng Anh, sau đó được dịch thủ công bởi khái niệm không được từ vựng hóa, khiến người dịch
Bộ môn Phiên dịch- Khoa Ngữ văn Anh trường phải giải thích bằng một cụm từ do không có từ vựng
Đại học Khoa học xã hội và nhân văn TP.HCM tương ứng trong Tiếng Việt, đây là khác biệt đặc trưng
với chính bộ từ vựng tương ứng trong từ điển. Do văn hóa giữa các ngôn ngữ, chẳng hạn “Ông Táo” trong
đó ngữ liệu này chính xác hơn so với 60.032 câu. Tiếng Việt không tồn tại trong Tiếng Anh. Bảng I cho
thấy 1 cặp câu song ngữ đã biến đổi như thế nào sau
III. MÔ HÌNH khi qua 2 lớp tách từ. Nếu làm ngược lại, tách từ bằng
Mục tiêu của mô hình là gióng hàng từng từ trong LLOCE trước kết quả sẽ không cao, ví như trường hợp
song ngữ với nhau và gán nhãn độc lập cho từng ngôn ‘của chúng tôi’ sẽ tách thành ‘của_chúng tôi’ thay vì
ngữ. Kết quả được đánh giá bằng việc kiểm tra bao ‘của chúng_tôi’.
nhiêu từ không được gán nhãn, bao nhiêu từ được gán B. Gióng hàng song ngữ
nhãn và khả năng khử nhập nhằng. Hình 1 mô tả các
bước chính của mô hình: Mô hình IBM là mô hình dịch thống kê được đề
xuất để tính xác suất P (f |e) và P (a|f, e) thông qua
• Tiền xử lý ngữ liệu Anh – Việt bằng công cụ tách
P (f, a|e) với e, f , a lần lượt là ngôn ngữ đích, ngôn
từ và từ điển LLOCE. ngữ nguồn và kết quả được gióng giữa 2 bên. Hoàn toàn
• Gióng hàng bằng GIZA++.
dựa trên thống kê, mô hình không cần cung cấp các tri
• Gán nhãn cho từng cặp từ được gióng và thống kê
thức đặc thù của mỗi ngôn ngữ để giải quyết bài toán
kết quả. dịch. Đặc biệt, xác suất P (f, a|e) có thể được dùng như
mô hình dịch hoặc mô hình gióng hàng. Lưu ý mô hình
A. Tiền xử lý tách từ
chỉ giải quyết các trường hợp gióng 0:1, 1:0, 1:1 và 1:n.
Để đạt hiệu quả cao khi gióng hàng, cần thực hiện Mô hình dịch:
tách từ trong ngữ liệu trước. Tách từ tức nối những
chữ thuộc cùng một từ bằng dấu ‘_’. Ví dụ: ‘họa P (f |e) = P (f, a|e) (1)
phẩm’ thành ‘họa_ phẩm’, ‘khách sạn’ thành ‘khách_ a
sạn’. . . Với Tiếng Việt, chúng tôi sử dụng công cụ Mô hình gióng hàng:
tách từ được nhóm phát triển riêng áp dụng cả 5 đặc
P (f, a|e) P (f, a|e)
trưng để tách: BMM: Backward-Maximum Matching, P (a|e, f ) = =
(2)
P (f |e) a P (f, a |e)
FMM: Forward-Maximum Matching, ORTH: Ortho-
graphic Feature, STL: Surface Token Lower-case và Mô hình IBM gồm IBM1, IBM2, IBM3, IBM4 và
STU: Surface Token Upper-case. Tiếng Anh có đặc trưng IBM5. Mỗi phiên bản sau bổ sung cải tiến cho những
338
338
Bảng I Bảng II
VÍ DỤ MỘT CẶP CÂU TIẾNG ANH VÀ TIẾNG VIỆT QUA 2 LẦN TÁCH KẾT QUẢ MẪU SAU KHI GIÓNG HÀNG NGỮ LIỆU SONG NGỮ BẰNG
TỪ . GIZA++
Nguyên mẫu Công cụ tách từ LLOCE LRMM 10 bảng Anh là đủ tiền xăng cho cuộc_hành_trình
của_chúng_tôi .
An articulated ve- An articulated ve- An articulated ve-
hicle is usually a hicle is usually a hicle is usually a NULL £ 10 will cover our petrol for the journey .
large one in which large one in which large one in which
the front part with the front part with the front part_with {NULL - là}, {£ - bảng Anh}, {10 - 10}, {our -
the engine can be the engine can be the engine can_be của_chúng_tôi}, {petrol - đủ, tiền, xăng}, {for - cho}, {jour-
separated from the separated from the separated from the ney - cuộc_hành_trình}, {. - .}
large carrying part large carrying part large carrying part
and which can bend and which can bend and which can bend Bảng III
or turn easily where or turn easily where or turn easily where KẾT QUẢ MẪU SAU KHI GIAO BỘ NHÃN CỦA CÁC CẶP TỪ GIÓNG
the two parts join . the two parts join . the two parts join . HÀNG TRONG TRƯỜNG HỢP CÓ 1 NHÃN CHUNG VÀ 2 NHÃN CHUNG
TRỞ LÊN.
Một xe có khớp nối Một xe có khớp Một xe
thường là một xe nối thường là một có_khớp_nối
lớn phần phía trước xe lớn phần phía thường là một 1 Nhãn chung 2 Nhãn chung trở lên
chứa động cơ có thể trước chứa động_cơ xe_lớn phần family – gia đình(C11) view – thấy(F263),- cảnh(F265)
tách khỏi bộ phận có_thể tách khỏi phía_trước chứa journey - cuộc hành trình(M75) page – trang(G153),- giấy(G153)
lớn dùng để chở bộ_phận lớn dùng động_cơ có_thể
official – chính thức(C189) bankrupt – phá sản(J120),- mất(N105)
và dễ dàng rẽ được để chở và dễ_dàng tách_khỏi bộ_phận
hoặc quay lại được rẽ được hoặc quay lớn dùng để chở và if – nếu(G288) lucid – dễ hiểu(F270),-có thể hiểu được(G40)
nhờ ở hai bộ phận lại được nhờ ở hai dễ_dàng rẽ được area – vùng(C79) a lot – nhiều(N96),- quá(N96)
nối lại với nhau đó bộ_phận nối lại với hoặc quay_lại được
. nhau đó . nhờ ở hai_bộ_phận
nối_lại_với_nhau
đó . được kết quả tốt hơn so với chỉ huấn luyện bằng 30.000
câu sạch. Kết quả thu được có dạng như Bảng II. Những
từ Tiếng Việt không có từ tương ứng với Tiếng Anh sẽ
thiếu sót của phiên bản trước đó. được nối với NULL. Hầu hết các từ này là hư từ.

P (f, a|e) = P (J|I) P (aj )P (fj |eaj )

j C. Gán nhãn cho từng cặp từ gióng và thống kê
= P (aj )P (fj |eaj ) 1) Tiền xử lý: Trong từ điển LLOCE Tiếng Anh và
j
(3) Tiếng Việt, bộ nhãn có định dạng:
1 <nhãni > # <từ1 >,<từ2 >,. . . ., <từn >
= P (fj |eaj )
j
I + 1 Trường hợp một từ đa nghĩa khá cao trong bộ từ vựng
của từ điển (Tiếng Anh: 1,673 nhãn/từ, Tiếng Việt: 1,715
= P (fj |eaj )
(I + 1)J j nhãn/từ) do đó nếu tìm đủ tập nhãn của một từ, bắt buộc
phải duyệt hết từ điển, dẫn đến thời gian chạy tăng cao.
• IBM1 – sử dụng xác suất từ vựng (thông số trong Do đó chúng tôi sắp xếp chúng theo định dạng khác
công thức 3) để việc tìm bộ nhãn của 1 từ có chi phí tuyến tính:
• IBM2 – bổ sung từ vựng kết hợp vị trí tuyệt đối <từi > # <nhãn1 >,<nhãn2 >,. . . ,<nhãnm >
của từ 2) Gán nhãn: Chúng tôi tiến hành duyệt từng cặp
• IBM3 – bổ sung fertilities(khả năng mà 1 từ có thể từ đã được gióng hàng và liệt kê nhãn tương ứng của
gióng được với các từ khác) chúng. Sau đó tiến hành giao 2 tập hợp và đếm số bộ
• IBM4 – bổ sung gióng hàng theo vị trí ngược tương nhãn chung cũng như đếm số trường hợp các từ không
đối thuộc từ vựng trong từ điển. Bảng III cho 1 số ví dụ về
• IBM5 – phiên bản gióng hàng đầy đủ của IBM4 các cặp từ có 1 nhãn chung và 2 nhãn chung trở lên.
Với các mô hình xác suất, độ chính xác phụ thuộc vào Trong Bảng III, ở trường hợp 2 nhãn chung trở lên,
độ sạch cũng như độ lớn của dữ liệu, dữ liệu càng nhiều lấy ví dụ đầu tiên, thì sau khi gióng hàng, ‘view’ được
thì độ chính xác càng cao. Khi chạy GIZA++, chúng tôi gióng với 2 từ ‘thấy’ và ‘cảnh’. Cặp ‘view-thấy’ có nhãn
sử dụng mô hình IBM4 đã được cài đặt sẵn. 60.000 cặp chung là F263, cặp ‘view-cảnh’ có nhãn chung là F265.
câu được sử dụng làm hạt giống, kết hợp với 30.000 cặp Như vậy ta không tìm được một nhãn duy nhất cho
câu sạch lấy từ LLOCE, tập hợp 90.000 cặp câu sẽ đạt cặp từ được gióng này, đồng nghĩa tính nhập nhằng của
339
339
Bảng VI
‘view’ chưa được giải quyết. Xét thêm ví dụ cuối: cặp SỐ LƯỢNG VÀ TỈ LỆ CÁC CẶP ĐƯỢC GÁN NHÃN XẾP THEO SỐ LOẠI
‘a lot-nhiều’ và ‘a lot-quá’ đều có chung 1 nhãn là N96, NHÃN CHUNG TĂNG DẦN.
như vậy ‘a lot’ tuy gióng hàng với 2 từ nhưng vẫn giữ
lại 1 nhãn duy nhất, như vậy tính nhập nhằng của từ ‘a 90.000 Anh-Việt 30.000 Anh-Việt
lot’ đã được giải quyết. Cặp từ 2 phía có nhãn 334.019 (65,06%) 109.179 (65,33%)
khác nhau hoặc chỉ 1
phía có nhãn
IV. KẾT QUẢ - THẢO LUẬN
Cặp từ có 1 nhãn 178.215 (34.71%) 57.348 (34,32%)
Ở bước tiền xử lý tách từ, ta gọi mỗi đơn vị từ cách chung
nhau bởi khoảng trắng là token. Nếu 2 token được nối Cặp từ có 2 nhãn 1.199 (0,23%) 582 (0,35%)
với nhau bởi dấu ‘_’ thì trở thành 1 token. Bảng IV cho chung trở lên
thấy tỉ lệ token đạt được ở mỗi bước tách từ so với số
token gốc. Đối với Tiếng Anh, các từ đa phần là từ đơn, Bảng VII
cộng với tỉ lệ từ có 2 tiếng trở lên trong từ vựng của THỐNG KÊ TỈ LỆ CẶP TỪ CÓ 2 NHÃN TRỞ LÊN CÓ CHUNG 1 LOẠI VÀ
CÓ CHUNG TỪ 2 LOẠI TRỞ LÊN SO VỚI TỔNG SỐ CẶP TỪ ĐƯỢC GÁN
từ điển chỉ chiếm 29,83%, do đó sau khi tách từ, không NHÃN.
có thay đổi lớn. Tiếng Việt ngược lại, tỉ lệ từ ghép lớn,
tỉ lệ từ vựng có 2 tiếng trở lên trong từ điển là 92,44% 90.000 Anh-Việt 30.000 Anh-Việt
nên đến 25,34% token bị mất đi so với số token gốc. Cặp từ 2 phía có 2 1.199 (0,23%) 582 (0,35%)
nhãn chung trở lên
Bảng IV
Cặp từ có 2 nhãn 595 (0,11%) 278 (0,17%)
SỐ LƯỢNG VÀ TỈ LỆ CÁC TOKEN SAU KHI THỰC HIỆN 2 BƯỚC TÁCH
chung trở lên cùng 1
TỪ .
loại
Nguyên mẫu Công cụ tách từ LLOCE LRMM Cặp từ có 2 nhãn 604 (0,12%) 304 (0,18%)
Token Tỉ lệ Token Tỉ lệ Token Tỉ lệ
chung trở lên lớn hơn
1 loại
30k-Eng 276.927 100% 276.927 100% 271.892 99,18%
30k-Viet 371.663 100% 324.618 81,34% 294.027 79,11%
90k-Eng 873.804 100% 873.804 100% 858.179 99,21%
90k-Viet 1.135.844 100% 948.064 83,47% 847.356 74,66% Theo phân tích ở đầu bài báo, chúng tôi quan tâm
đến khả năng khử nhập nhằng của bộ nhãn ngữ nghĩa.
Kết quả thu được sau khi gióng hàng và gán nhãn Kết hợp số liệu Bảng VI và Bảng VII, nếu tạm thời
khá thú vị. Bảng V cho thấy 40,17% cặp từ trong bộ không xét đến các cặp không được gán nhãn, thì ta có
90.000 câu song ngữ không tồn tại trong từ điển nên 34,82% số cặp không nhập nhằng(34.71% cặp từ có 1
không được gán nhãn. Trung bình có 9,3 token/cặp câu, nhãn chung và 0.11% cặp từ có 2 nhãn chung nhưng chỉ
giả sử dấu câu chiếm 1 token, thì số lượng từ không cùng 1 loại).
tồn tại trong LLOCE chiếm 29,41%. Con số này cho Các trường hợp khác đều không phân định được nhãn,
thấy từ điển có vẻ không chứa đựng đầy đủ những từ do đó xem như thất bại trong việc khử nhập nhằng. Bộ
vựng thông dụng. Hơn nữa, LLOCE khi được dịch sang 30.000 câu lấy từ chính LLOCE có tỉ lệ cặp được gán
Tiếng Việt chưa chắc liệt kê hết tất cả những từ tương nhãn không những thấp, mà còn thấp hơn bộ 60.000 câu
ứng, như trường hợp từ A bên Tiếng Anh có thể dịch (34,49% so với 35,00%). Tổng quan hơn, nếu tính đến
sang từ B hay C bên Tiếng Việt, nhưng người dịch chỉ toàn bộ cặp từ được gióng thì tỉ lệ không gán nhãn của
chọn B mà thôi. Một số khái niệm không tồn tại trong 90.000 câu lên đến 79,17%, cho thấy độ bao phủ cực kì
Tiếng Việt cũng giới hạn lại tính khả dụng của bộ từ thấp trong từ điển, mặc dù trong đó có 30.000 câu sạch
vựng trong LLOCE Tiếng Việt. thuộc cùng lĩnh vực. Tuy nhiên, theo hiểu biết hiện tại
của chúng tôi, chưa có kết quả khảo sát với các bộ nhãn
Bảng V khác nên chưa thể kết luận kết quả này phản ánh tính
SỐ LƯỢNG VÀ TỈ LỆ CÁC CẶP SAU KHI GIÓNG HÀNG ĐƯỢC GÁN
chất bộ nhãn, hay là tình hình chung của hầu hết các bộ
NHÃN VÀ KHÔNG GÁN NHÃN
nhãn. Trong tương lai, quy trình này cần được áp dụng
90.000 Anh-Việt 30.000 Anh-Việt với các bộ nhãn như LDOCE, WordNet với cùng bộ dữ
Cặp từ không có nhãn 344.746(40.17%) 104.783(38,54%)
liệu song ngữ để ta có góc nhìn tổng quát và có cơ sở
so sánh các bộ nhãn. Để lý giải cho kết quả thu được,
Cặp từ có nhãn 513.433(59,83%) 167.109(61,46%)
chúng tôi kiểm tra lại toàn bộ quy trình và có một số
nhận xét sau:
340
340
• Nhiều trường hợp từ điển không phủ hết những từ nghiệm. Mô hình kiểm nghiệm khả năng gán nhãn được
tương ứng trong Tiếng Việt. Từ “sinh học” không đề xuất với 2 lớp tách từ, gióng hàng bằng GIZA++ và
có trong bộ từ vựng, nhưng “bộ môn sinh học” lại thống kê tỉ lệ các cặp từ có nhãn chung. Kết quả thu
có, mặc dù chúng là như nhau. được thấp hơn dự đoán ban đầu khi xét khả năng khử
• Tiếng Việt với đặc trưng nhiều từ ghép trở thành nhập nhằng (34,82% so với dự đoán 70%), đặc biệt hiệu
trở ngại lớn khi tra từ điển. “Run machine”E không suất còn thấp hơn nữa với ngữ liệu song ngữ trích xuất
thể chia thành “run/chạy” và “machine/máy” bởi từ trong chính từ điển. Chúng tôi chưa kết luận khả năng
không tìm được từ “máy” trong từ điển. Tuy nhiên, của LLOCE do không có các dữ liệu tương ứng ở các bộ
lại xuất hiện cụm “cho chạy máy”. nhãn còn lại để đối xứng. Tuy nhiên có thể nói LLOCE
• Một số từ Tiếng Anh không có từ Tiếng Việt tương tỏ ra yếu kém cho việc gán nhãn các câu thông dụng
ứng, dẫn đến phải dùng một cụm từ thay thế để giải bởi số lượng từ vựng khiêm tốn cũng như sự khác biệt
nghĩa, làm giảm số từ khả dụng trong bộ từ vựng trong hai phiên bản Tiếng Việt và Tiếng Anh. Trong
Tiếng Việt. tương lai, quy trình cơ bản này cần được thử nghiệm
• Bộ từ vựng trong 2 từ điển không chính xác là từ với WordNet, LDOCE... để có cái nhìn tổng quan hơn
vựng khi nó bao gồm cả các cụm từ, thành ngữ về độ bao phủ và khả năng khử nhập nhằng của các tập
cộng với số lượng mục từ chỉ có 16.000 khiến cho nhãn.
gần 1 nửa các cặp từ được gióng không có nhãn TÀI LIỆU THAM KHẢO
tương ứng để gán.
[1] G. A. Miller et al., “Five papers on wordnet,” 1993. [Online].
• Việc áp dụng kĩ thuật tham lam cho bước tách từ
Available: /bib/miller/Miller1993/5papers.pdf
thứ hai có thể làm cho kết quả bị sai lệch. [2] E. Niemann and I. Gurevych, “The people’s web
• Số lượng cặp từ phụ thuộc vào chất lượng và số meets linguistic knowledge: Automatic sense alignment of
wikipedia and wordnet,” in Proceedings of the Ninth
lượng của ngữ liệu tham gia gióng hàng. Có thể International Conference on Computational Semantics, ser.
90.000 cặp câu vẫn chưa đủ lớn để có kết quả chính IWCS ’11. Stroudsburg, PA, USA: Association for
xác. Computational Linguistics, 2011, pp. 205–214. [Online].
Available: http://dl.acm.org/citation.cfm?id=2002669.2002691
LLOCE là bộ nhãn kích cỡ trung bình so với các [3] F. M. Suchanek, G. Kasneci, and G. Weikum, “Yago: A
bộ nhãn đã giới thiệu ở phần đầu. Tuy nhiên, kết quả large ontology from wikipedia and wordnet,” Web Semantics:
Science, Services and Agents on the World Wide Web,
thu được sau thí nghiệm thấp hơn kì vọng ban đầu khá vol. 6, no. 3, pp. 203 – 217, 2008, world Wide Web
nhiều. Trong tương lai, để giải quyết những vấn đề trên, Conference 2007Semantic Web Track. [Online]. Available:
chúng tôi đề nghị những hướng sau: http://www.sciencedirect.com/science/article/pii/S1570826808000437
[4] E. Agirre, E. Alfonseca, K. Hall, J. Kravalova, M. Paşca,
• Xây dựng bộ ngữ liệu song ngữ lớn hơn. and A. Soroa, “A study on similarity and relatedness using
• Thêm từ vựng cho cả 2 từ điển để phục vụ cho việc distributional and wordnet-based approaches,” in Proceedings of
Human Language Technologies: The 2009 Annual Conference of
gán nhãn. Có thể bổ sung dựa theo 2 hướng: một the North American Chapter of the Association for Computational
là bộ từ vựng và nhãn của LDOCE hoặc WordNet, Linguistics, ser. NAACL ’09. Stroudsburg, PA, USA: Association
hai là dựa trên từ điển Hoàng Phê để tìm danh sách for Computational Linguistics, 2009, pp. 19–27. [Online].
Available: http://dl.acm.org/citation.cfm?id=1620754.1620758
các từ chưa được đánh nhãn, sau đó gán nhãn dựa [5] P. Vossen, “Eurowordnet: A multilingual database of
trên bộ nhãn có sẵn hoặc bổ sung bộ nhãn mới dựa autonomous and language-specific wordnets connected via
trên quy định phân loại nhãn của LLOCE. an inter-lingualindex,” International Journal of Lexicography,
vol. 17, no. 2, pp. 161–173, 2004. [Online]. Available:
• Xây dựng một dữ liệu lớn nếu chọn WordNet làm
http://ijl.oxfordjournals.org/content/17/2/161.abstract
bộ nhãn thay thế. [6] F. Bond, H. Isahara, S. Fujita, K. Uchimoto, T. Kuribayashi,
• Phát triển các bộ phân lớp xác định cặp từ nhập and K. Kanzaki, “Enhancing the japanese wordnet,” in
Proceedings of the 7th Workshop on Asian Language
nhằng và lựa chọn bộ nhãn chung ở các cặp có từ Resources, ser. ALR7. Stroudsburg, PA, USA: Association for
2 nhãn chung trở lên. Computational Linguistics, 2009, pp. 1–8. [Online]. Available:
• Kiểm tra bộ dữ liệu song ngữ 90.000 cặp câu với http://dl.acm.org/citation.cfm?id=1690299.1690300
[7] F. J. Och and H. Ney, “A systematic comparison of
các bộ nhãn như LDOCE, WordNet để có cơ sở various statistical alignment models,” Comput. Linguist.,
đánh giá khả năng bao phủ và khả năng khử nhập vol. 29, no. 1, pp. 19–51, Mar. 2003. [Online]. Available:
nhằng của từng bộ nhãn. http://dx.doi.org/10.1162/089120103321337421
[8] Đinh Điền, “Xây dựng và khai thác ngữ liệu song ngữ anh việt,”
Ph.D. dissertation, ĐH Khoa học Xã hội & Nhân văn - ĐHQG
V. KẾT LUẬN – ĐỀ NGHỊ Tp.HCM, 2005.
[9] T. M. Arthur, Longman Lexicon Of Contemporary English (bản
Chúng tôi đã trình bày mục tiêu của bộ nhãn ngữ dịch tiếng Việt: “từ vựng tiếng Anh hiện đại” do Trần Tất Thắng
nghĩa và lý do lựa chọn LLOCE làm đối tượng thử chủ biên). NXB Giaó Dục, 1997.
341
341
HộiHội
Thảo Quốc
Thảo GiaGia
Quốc 2015
2015vềvềĐiện
ĐiệnTử,
Tử,Truyền
ThôngTinTin (ECIT
(ECIT 2015)
2015)
ánh giá hiu nng mt s mô hình hc máy thng kê

vi vn  nhn dng thanh iu ting Vit nói
Nguyn Hng Quang, Trnh Vn Loan
Vin Công Ngh Thông Tin và Truyn Thông,
Trng i hc Bách khoa Hà Ni
Email: quangnh@soict.hust.edu.vn, loantv@soict.hust.edu.vn
Abstract— Bài báo  xut phng pháp nhn dng thanh iu thanh iu dài). Nh vy nu so sánh vi hai ngôn ng trên thì
ting Vit nói s dng mô hình K láng ging gn nht KNN (K- ting Vit là ngôn ng có cu trúc thanh iu phc tp nht.
Nearest Neighbor) phân tích khác bit tuyn tính LDA (Linear iu này làm cho vic nhn dng thanh iu ting Vit tr nên
Discrimination Analysis), phân tích khác bit toàn phng QDA khó khn hơn.
(Quadratic Discrimination Analysis), b phân lp h tr véc t
Hin nay, các h thng tng hp và nhn dng ting nói
SVC (support vector classifier) và máy h tr véc t SVM
(Support Vector Machine). Theo các nhà ngôn ng hc, thanh ang c phát trin rt mnh trên th gii. Các h thng này
iu ting Vit có c tính siêu on, tn ti trên c âm tit. s óng vai trò quan trng trong vic thc hin tơng tác
Trong nghiên cu này, chúng tôi tin hành th nghim nhn ngi-máy (human-machine) hoc tơng tác máy-máy
dng thanh iu theo hai quan im: thanh iu tn ti trên c (machine-to-machine) trong tơng lai. Nghiên cu các h
âm tit và thanh iu ch tn ti trên phn hu thanh ca âm tit. thng tơng tác nh vy ang c thc hin bc u vi
Các tham s s dng cho nhn dng thanh iu gm có nng ting Vit. Vì vy nhn dng thanh iu cho các ngôn ng có
lng và tn s c bn ca ting nói.  nhn dng, các tham s thanh iu trong ó có ting Vit là mt vn  quan trng,
này c chun hóa theo thi gian. Kt qu c th nghim mang tính thi s hin nay.
trên 6221 t phát âm ri rc ca ting Vit vi 3 ngi nói. Các
Bên cnh ting Vit, ting ph thông Trung Quc và ting
th nghim c thc hin theo phng pháp so sánh chéo
(cross-validation). Các kt qu th nghim cho thy quan im Thái Lan cng là các ngôn ng có thanh iu. Vi c hai ngôn
coi thanh iu ch tn ti trên phn hu thanh ca âm tit cho ng này, Yang, W. [3], Charnvivit, P. [4] và cng s ã s
kt qu nhn dng cao hn so vi quan im coi thanh iu tn dng tn s cơ bn  làm tham s s dng cho quá trình nhn
ti trên c âm tit. Ngoài ra, trong các phng pháp nhn dng dng thanh iu. Kt qu ca các nghiên cu này cho thy F0
c th nghim, phng pháp QDA cho kt qu nhn dng cao là mt tham s hiu qu khi s dng mô hình HMM  biu
nht. din cho thanh iu.
Trong nhng nm gn ây, ã có mt s công trình nghiên
Keywords- thanh iu ting Vit, nhn dng thanh iu, tn s cu nhn dng ting Vit nói trong ó có b sung thông tin v
c bn F0, phân tích khác bit tuyn tính, phân tích khác bit toàn
phng, K láng ging gn nht, máy h tr véc t.
thanh iu. Lê Vit Bc và cng s [9][12] s dng phơng
pháp thích nghi t mt ngôn ng không có thanh iu (ting
I. GII THIU Pháp)  xây dng mô hình cho ting Vit. Trong khi ó, V
Hi Quân [10], V Ngc Thng [11] và cng s li b sung tn
Khác vi phn ln các ngôn ng trên th gii, ting Vit là s cơ bn F0 nh mt tham s cùng vi các tham s MFCC 
mt trong các ngôn ng có thanh iu. Vi loi ngôn ng này, dùng làm tham s c trng cho tng khung ting nói.
ng ngha ca âm tit s thay i khi thay i thanh iu ca Mt hng nghiên cu khác là tách ri, thc hin song
âm tit ó [1]. Hai yu t chính  phân bit bao gm cao  và song nhn dng âm tit cơ bn (âm tit coi nh không có thanh
mc  bin thiên phc tp ca thanh iu. Các thanh iu iu) vi nhn dng thanh iu riêng r. Nguyn Hng Quang
c phân bit vi nhau ch yu qua qui lut bin thiên theo và cng s [14] ã s dng các tham s MFCC, F0  xây
thi gian ca tn s cơ bn F0. Ting Vit bao gm 6 thanh dng mô hình HMM nhn dng cho thanh iu ting Vit.
iu: thanh ngang, thanh sc, thanh huyn, thanh hi, thanh ngã Tuy nhiên, cha có nhng kt qu rõ rt  c gng th
và thanh nng. Các thanh iu này có th c phân chia theo nghim nhn dng thanh iu ting Vit theo phơng pháp
cao : 3 thanh iu cao và 3 thanh iu thp và phân chia theo biu din mi thanh iu bng mt véc tơ tham s, cng nh
 t gãy (lut bng-trc): 4 thanh iu bin thiên ơn iu nghiên cu nh hng trc tip ca ng cong F0 n kt qu
(thanh bng) và 2 thanh iu t gãy (thanh trc). So vi mt nhn dng thanh iu. Bài báo này s thc hin nghiên cu
s ngôn ng có thanh iu khác nh ting ph thông Trung nhng vn  trên.
Quc (Mandarin) thì Mandarin ch có 4 thanh iu trong ó ch Phn còn li ca bài báo c t chc nh sau:
có 1 thanh iu t gãy [3]. Ting Qung ông Trung Quc có • Phn II mô t chi tit c im ca h thng thanh iu
ti 9 thanh iu, song tt c các thanh iu này u là các thanh ca ting Vit.
iu bin thiên ơn iu và phân bit vi nhau  3 cao  và  • Phn III phân tích u im và nhc im ca các
dài ca thanh iu (thanh iu ngn, thanh iu trung bình và phơng pháp nhn dng ã c áp dng: phân tích
khác bit tuyn tính LDA (Linear Discrimination
ISBN: 978-604-67-0635-9 342
342
HộiHội
Thảo Quốc
Thảo Gia
Quốc Gia2015
2015về
vềĐiện
Điện Tử,
Tử,Truyền
Nghệ Thông
Thông TinTin (ECIT
(ECIT 2015)
2015)
Analysis), phân tích khác bit toàn phơng QDA Cao  Thanh bng Thanh trc
(Quadratic Discrimination Analysis), K láng ging gn Cao Thanh ngang Thanh sc Thanh hi
nht KNN (K-Nearest Neighbor), b phân lp h tr Thp Thanh huyn Thanh nng Thanh ngã
véc tơ SVC (support vector classifier) và máy h tr
véc tơ SVM (Support Vector Machine). III. CÁC PHƠNG PHÁP TH NGHIM NHN DNG
• Phn IV trình bày các kt qu th nghim nhn dng Trong bài báo này,  thc hin nhn dng thanh iu ting
thanh iu và phân tích ánh giá các kt qu thu c. Vit, chúng tôi s dng các phơng pháp: K láng ging gn
• Kt lun và hng phát trin c a ra trong phn nht KNN (K-Nearest Neighbor), phân tích khác bit tuyn
V. tính LDA (Linear Discrimination Analysis), phân tích khác bit
toàn phơng QDA (Quadratic Discrimination Analysis), s
II. C IM THANH IU CA TING VIT dng b phân lp h tr véc tơ SVC (support vector classifier)
Trong phơng ng Bc ca ting Vit (c coi là phơng và máy h tr véc tơ SVM (Support Vector Machine).
ng chun ca Vit Nam) có 6 thanh iu khác nhau: ngang, Phng pháp phân tích khác bit tuyn tính LDA:
huyn, sc, nng, hi, ngã. Các thanh iu này thng c Gi s các i tng thuc vào K lp. k là xác sut tiên
các nhà ngôn ng hc phân bit vi nhau thông qua ng biu nghim  mt i tng n t lp th k.  =   =
din tn s cơ bn F0 ca thanh iu (Hình 1). Trong cách vit, | =  là hàm mt  xác sut  i tng X ly giá tr x
mi thanh iu c biu din bng mt du c bit, tr thanh khi ang  lp th k, gi nh  là hàm chun Gauss nhiu
ngang là không có du hiu quy c. bin (phơng trình 1).
Nu các âm tit kt thúc bng các ph âm tc /t/ và /p/ thì
 
các âm tit ó ch có th i vi thanh sc hoc thanh nng. Vì  =  −  −  Σ   −  (1)
/ ||/ 
vy mt s nhà nghiên cu [1] coi ting Vit là h thng bao
gm 8 thanh iu: trong ó thanh sc và thanh nng c coi
nh lý Bayes cho phép tính xác sut hu nghim i tng
nh có 2 bin th (trong các âm tit kt thúc hoc không kt
thuc vào lp k khi có giá tr bng x c mô t  phơng trình
thúc bng /t/ hoc /p/). Trong bài báo này,  ơn gin, chúng
2.
tôi gi nh ting Vit ch có 6 thanh iu chun nh cách biu   
din trong vn phong ting Vit.  = | =  =    2
   

i tng c nhn dng vào lp có giá tr xác sut hu
nghim ln nht (phơng trình 2) s tơng ng vi lp này.
Vi phơng pháp phân tích s khác bit tuyn tính LDA,
gi s mi lp có riêng giá tr k vng µ k song tt c các lp
u có chung ma trn hip phơng sai Σ. Thc hin ly logarit
phơng trình (4) s thu c phơng trình (3).

  =   Σ   −  Σ   +  (3)

Trong phơng trình (5),  c gi là hàm phân bit
(discriminant function). Vì  là hàm tuyn tính ca x nên
phơng pháp này c gi là LDA. Các tham s µ k và Σk c
xác nh da trên s c lng tham s t b d liu hun
luyn.
Phân tích khác bit toàn phng QDA:
Vi phơng pháp này, gi s mi lp s có mt ma trn
Hình 1. ng cong tn s c bn F0 biu din cho thanh hip phơng sai riêng Σ, khi ó hàm phân bit s c biu
iu ca ging n thuc phng ng Bc Vit Nam [5] din bng phơng trình 4.
Theo các nhà ngôn ng hc, có th phân loi các thanh iu   
theo mt s tiêu chí. Tiêu chí phân loi u tiên là cao  ca   = −   Σ  +   Σ   −  Σ   − Σ  +
  
thanh iu: các thanh ngang, thanh sc, thanh hi c coi   (4)
mc cao, trong khi ó các thanh huyn, thanh nng, thanh ngã
c coi  mc thp. Tiêu chí phân loi th hai là theo lut Các tham s  and Σ trong các phơng trình (3) và (4) s
bng-trc, tc là mc  t gãy trong ng biu din F0 ca c xác nh trong quá trình hun luyn da vào các d liu
thanh iu. Các thanh ngang, thanh sc, thanh huyn, thanh hun luyn.
nng c coi là thanh bng và thanh hi, thanh ngã c coi K láng ging gn nht KNN:
là thanh trc. Chi tit v phân loi các thanh iu ting Vit Vi mi i tng x trong tp th nghim, tính giá tr  ()
c mô t  bng 1. theo phơng trình 5.

Bng 1. Phân loi thanh iu theo cao  và theo lut  () = Σ ∈ ()  (5)

bng-trc.
343
343
Trong phơng trình 5,  () là láng ging ca x, bao gm  áp dng SVM cho bài toán phân lp nhiu mu, phơng
K im gn x nht trong tp hun luyn,  là trng s ca im 
pháp c s dng là one-versus-one: xây dng   b phân
trong tp hun luyn xi. i tng x c nhn dng vào lp L 2
nu () t giá tr ln nht khi so sánh vi các giá tr (). lp cho tng cp lp. Mi mu th nghim s c a qua tt
B phân lp phân tách tuyn tính vi l cc i (maximal c các b phân lp này. Lp nào chim a s s c coi là kt
margin classifier): qu nhn dng.
L cc i c xác nh nh sau: vi mi mu trong tp Nhn xét:
hun luyn, tính khong cách trc giao n biên gii phân lp; Trong ba phơng pháp u tiên, phơng pháp QDA thc
l là khong cách trc giao ti thiu tìm c. B phân lp này hin phân bit gia các lp thông qua biên gii phân lp tuyn
chn biên gii phân lp có l t giá tr ln nht, ngha là biên tính, nh vy là biên gii phân lp tơng i thô vi các b d
gii phân lp phân bit tt nht các mu trong tp hun luyn. liu phc tp. Trong khi ó vi phơng pháp KNN, kt qu
Các véc tơ nm trên l c gi là các véc tơ h tr (support nhn dng li quá ph thuc vào mt s mu nht nh (K mu)
vector). xung quanh mu cn nhn dng. Do ó phơng pháp KNN cho
B phân lp h tr véc t SVC: kt qu rt dao ng theo b d liu. Phơng pháp QDA là mt
Phơng pháp này là s m rng ca b phân lp phân tách ci tin ca phơng pháp LDA, phơng pháp này cho phép to
tuyn tính vi l cc i (maximal margin classifier), cho phép ra biên gii phân lp phi tuyn, nh vy cho phép nhn dng
phân lp vi các lp không th phân tách bng mt biên gii các mu mm do hơn.
tuyn tính [2]. Phơng pháp này s tìm biên gii phân lp phù Các phơng pháp trên ã s dng toàn b d liu hun
hp nht vi a s các mu, và chp nhn mt s mu hun luyn  xây dng biên gii phân lp. Trong khi ó, phơng
luyn b phân lp sai (c iu chnh bng tham s C – pháp SVM ch s dng các véc tơ h tr  quyt nh biên
phơng trình 7). gii phân lp. Phơng pháp s dng b phân lp h tr véc tơ
Máy h tr véc t SVM: ch s dng biên gii phân lp tuyn tính, trong khi ó phơng
Phơng pháp SVC ch có kh nng tìm c biên gii phân pháp SVM li cho phép xây dng biên gii phi tuyn, vi s
lp tuyn tính. Trong khi ó biên gii phân lp tuyn tính li m rng s lng tham s ln. Trên cơ s nhn xét trên, chúng
không phù hp vi mt s d liu c th.  vn có th s tôi hy vng phơng pháp QDA và SVM s cho kt qu nhn
dng biên gii phân lp tuyn tính, mt phơng pháp c  dng tt nht. Các th nghim nhn dng thanh iu cho ting
xut là m rng s tham s biu din i tng da trên các Vit c trình bày  phn tip theo.
tham s ã có. SVM là phơng pháp cho phép thc hin hiu IV. NHN DNG THANH IU CA TING VIT
qu s m rng này vi mc  tính toán hp lý.
Xét bài toán s dng SVM  phân chia các mu thành 2 C s d liu ting Vit nói:
lp. Gi s tp hun luyn bao gm N mu xi, i=1, 2,…, N. Các u tiên, chúng tôi xây dng tt c các t ơn âm tit ca
mu này c phân vào lp yi, i=1, 2, …, N; các giá tr y ch ting Vit nói. ây là các t c s dng trong ngôn ng giao
ly -1 hoc 1. Biên gii phân lp c biu din bng v trái tip thng ngày. Có tng cng 6221 t ã c tp hp. Phân
ca phơng trình 6. b thanh iu trong cơ s d liu c mô t trong bng 2.
() =  +  Bng 2. Phân b thanh iu trong c s d liu ting
  (,  ) (6)
Thc cht a phn các giá tr αi u bng 0, ch tr nhng nói.
Thanh iu Tng s t
giá tr αi ca các véc tơ h tr. Các giá tr này b gii hn theo Thanh ngang 1257
phơng trình 7. Thanh huyn 1022
0 ≤  ≤ ,  = 1, 2, … ,  (7) Thanh sc 1591
C là giá tr cho phép các mu b vi phm. Khi C càng nh Thanh nng 1203
thì l s càng rng, và ngc li khi C càng ln thì l s càng Thanh hi 706
hp. Thanh ngã 442
K là hàm kernel ca h thng, vi b phân lp h tr véc tơ Tng cng 6221
SVC thì K c tính theo phơng trình 8.
K(u, v) = uTv (8) Trong cơ s d liu, có 3 ging nam u n t phơng
Vi SVM, hàm K c s dng  bin i không gian ng Bc, có  tui t 22 n 24 tui. Mi ngi c yêu cu
tham s, và c tính theo phơng trình 9. phát âm mi t mt ln. Ting nói c thu âm trong phòng
K(u, v) = exp{-|u-v|2} (9) làm vic bình thng, vi tn s ly mu 16KHz, ơn kênh, 16
Khi ó gii thut thc hin tìm các giá tr 0 và αi theo bit/mu. Nh vy tng s file trong cơ s d liu là 18663 file.
phơng trình 10. Phng pháp nhn dng:
 
min  1 −  ( ) +   (10)
Phơng pháp so sánh chéo (cross-validation) c áp dng

 ,  th nghim nhn dng thanh iu. Mi th nghim c
vi K là ma trn NxN tính trên tt c các cp mu s dng thc hin ba ln: vi mi ln thì d liu ca 1 trong 3 ngi nói
trong quá trình hun luyn. c s dng làm d liu th nghim, trong khi ó d liu ca
Quá trình phân lp c thc hin tính hàm f (phơng trình hai ngi còn li c s dng  hun luyn h thng. Kt
6) trên mu cn th nghim. Tùy vào du ca hàm f mà mu qu ca th nghim là trung bình cng các kt qu ca ba th
th nghim s c phân vào 1 trong 2 lp. nghim. Các th nghim c thc hin s dng các phơng
344
344
HộiHội
Thảo Quốc
Thảo Gia
Quốc Gia2015
2015về
vềĐiện
Điện Tử,
Tử,Truyền
Nghệ Thông
Thông TinTin (ECIT
(ECIT 2015)
2015)
pháp nhn dng LDA, QDA và KNN. Mi phơng pháp c pháp QDA (các kt qu trên ct LDA nh hơn so vi các kt
thc hin 2 th nghim: mt th nghim vi quan im coi qu trên ct QDA tơng ng). Ngoài ra phơng pháp coi thanh
thanh iu tn ti trên c âm tit và th nghim th hai c iu ch tn ti trên phn hu thanh ca âm tit cng cho kt
thc hin trên quan im coi thanh iu ch nm trên phn hu qu tt hơn so vi phơng pháp coi thanh iu tn ti trên c
thanh ca âm tit. âm tit. Các kt qu tt nht t c vi s thành phn chun
Biu din tham s cho mi thanh iu: hóa N = 5. Giá tr này c s dng cho th nghim nhn dng
Hai tham s c s dng là tn s cơ bn F0 và nng thanh iu theo phơng pháp KNN, SVC và SVM.
lng thi gian ngn E. Khong thi gian  tính toán là s S dng phng pháp KNN:
dng ca s có  rng 100 miligiây,  dch ca ca s là 10  th nghim phơng pháp KNN, mt tham s cn xác
miligiây. Phơng pháp t tơng quan AC (auto-correlation) nh chính là s láng ging K s dng  xác nh kt qu cho
c s dng  xác nh tn s cơ bn F0. Do trong ting nói, tng mu th nghim. Các giá tr K c th nghim bao gm
ch các on hu thanh mi có tn s F0, vì vy nhng on tín t 1 n 40. Th nghim c thc hin vi phơng pháp
hiu không tính c F0 thì c coi nh các on vô thanh. KNN và quan im coi thanh iu tn ti trên toàn b âm tit.
 tin hành chun hóa các giá tr tn s cơ bn F0 và nng Kt qu c mô t trên hình 2.
lng E theo thi gian, vi mi thanh iu chiu dài tn ti ca
thanh iu c chia thành N phn. Ti mi im chia s xác
nh tn s F0 và nng lng tơng ng. Nh vy mi âm th
hin cho mt thanh iu s c biu din bng mt véc tơ
tham s có N thành phn. Các giá tr N c th nghim trong
bài báo là t 2 n 10. Các kt qu th nghim c mô t 
phn V.
Trong bài báo này, chúng tôi th nghim hai quan im v
cu trúc ca thanh iu trong âm tit ting Vit. Quan im th
nht coi thanh iu nm trên toàn b âm tit, trong khi ó quan
im th hai coi thanh iu ch tn ti trong phn hu thanh
ca âm tit. Vi quan im th hai, phn hu thanh s c
Hình 2. Kt qu nhn dng thanh iu theo phng
chúng tôi xác nh là phn có tn s cơ bn F0 trong âm tit.
pháp KNN vi các giá tr K t 1 n 40.
Còn  th nghim theo quan im u tiên, nhng phn vô
Hình 2 cho chúng ta thy kt qu nhn dng tt nht t
thanh trong âm tit (thng là phn u và phn cui âm tit)
c ti K=15. Giá tr K này c s dng cho th nghim
không có tn s cơ bn F0 s c ni suy tuyn tính F0 t các
nhn dng thanh iu vi các thành phn chun hóa thanh iu
giá tr F0 ã có.
theo thi gian N khác nhau. Kt qu thu c mô t trong bng
V. KT QU NHN DNG THANH IU CA TING 4.
VIT Bng 4. Kt qu nhn dng thanh iu úng (t l phn
trm) s dng phng pháp KNN.
S dng phng pháp LDA và QDA:
S thành Thanh iu tn Thanh iu ch tn
Kt qu th nghim vi phơng pháp LDA và QDA c phn chun ti trên toàn b ti trên phn hu
mô t  bng 3 vi quan im thanh iu tn ti trên c âm tit hóa N âm tit thanh ca âm tit
và vi quan im thanh iu ch tn ti trên phn hu thanh 2 36.77 37.71
ca âm tit. Trong bng 3, N là s thành phn chun hóa theo 3 38.69 42.42
thi gian ca mi th hin ca thanh iu. 4 46.63 47.97
Bng 3. Kt qu nhn dng thanh iu úng (t l phn 5 47.32 48.96
trm) s dng phng pháp LDA và QDA. 6 47.36 49.07
S thành Thanh iu tn ti Thanh iu ch tn 7 47.69 48.94
phn trên toàn b âm tit ti trên phn hu 8 47.02 49.09
chun thanh ca âm tit 9 47.16 49.29
hóa N LDA QDA LDA QDA 10 47.25 48.87
2 39.03 40.66 36.03 39.50
3 39.86 40.61 42.86 45.11 Kt qu  bng 4 cho thy vi phơng pháp KNN, kt qu
4 39.04 49.20 46.57 50.88 tt nht vi trng hp thanh iu tn ti trên toàn b âm tit
5 39.27 47.94 48.33 51.88 và trng hp thanh iu ch tn ti trên phn hu thanh ca
6 38.43 47.46 47.75 51.50 âm tit tơng ng vi s thành phn chun hóa N=7 và N=9.
7 37.36 47.38 47.79 51.17
S dng phng pháp SVC và SVM:
8 37.55 46.92 48.28 51.28
Mt tham s chung quyt nh n t l nhn dng úng
9 37.71 46.27 48.30 50.39
ca hai phơng pháp này là C (phơng trình 7). Ngoài ra vi
10 37.44 45.20 48.15 49.22
SVM tham s  (phơng trình 9) cng quyt nh n kt qu
nhn dng. Bng 5 mô t kt qu nhn dng ca hai phơng
Kt qu trên bng 3 cho thy phơng pháp LDA cho kt
pháp vi các giá tr khác nhau ca C và . Th nghim c
qu nhn dng chính xác thanh iu kém hơn so vi phơng
345
345
HộiHội
Thảo Quốc
Thảo Gia
Quốc 2015
Gia 2015về
vềĐiện
ĐiệnTử,
Tử,Truyền
NghệThông
ThôngTinTin (ECIT
(ECIT 2015)
2015)
thc hin s thành phn chun hóa ca thanh iu N = 5 và trên toàn b âm tit, và LDA_2, QDA_2, KNN_2, SVC_2,
quan im coi thanh iu tn ti trên toàn b âm tit SVM_2 là ca phơng pháp coi thanh iu ch tn ti trên phn
hu thanh ca âm tit.
Bng 5. Kt qu nhn dng thanh iu úng (t l phn Hình 3 cho thy vi s thành phn chun hóa N thp (N=2
trm) s dng phng pháp SVC và SVM vi s thành và N=3), kt qu nhn dng thanh iu kém nht. Trong các
phn chia thanh iu N=5. thành phn N còn li thì kt qu không thc s khác bit nhiu.
Phng pháp Giá tr C Các kt qu nhn dng thanh iu tt nht thc hin trong
0.1 1 10 bài báo c mô t  bng 7.
SVC 43.52 43.53 43.51 Bng 7. Tng kt các kt qu nhn dng thanh iu ca
SVM, =0.5 39.46 43.82 42.33 ting Vit nói.
SVM, =1 29.96 40.60 40.72 Phng Thanh iu nm Thanh iu ch nm
SVM, =2 25.80 34.35 35.16 pháp nhn trên toàn b âm trên phn hu thanh
dng tit ca âm tit
Bng 5 cho thy phơng pháp SVC cho kt qu tt nht vi LDA 39.86 48.33
C=1, và phơng pháp SVM cho kt qu tt nht vi C=1 và KNN 47.69 49.29
=1. Các giá tr này c s dng cho th nghim trên tt c QDA 49.20 51.88
các phn chia thanh iu. Kt qu th nghim c mô t  SVC 43.52 51.86
bng 6. SVM 45.52 51.23
Bng 6. Kt qu nhn dng thanh iu úng (t l phn
trm) s dng phng pháp SVC và SVM. Các kt qu th nghim cho thy quan im coi thanh iu
S thành Thanh iu tn ti Thanh iu ch tn ch tn ti trên phn hu thanh ca âm tit cho kt qu nhn
phn trên toàn b âm tit ti trên phn hu dng cao hơn so vi quan im coi thanh iu tn ti trên c
chun thanh ca âm tit âm tit. Ngoài ra, trong các phơng pháp nhn dng c th
hóa N SVC SVM SVC SVM nghim, phơng pháp QDA cho kt qu nhn dng cao nht.
2 41.01 40.29 41.36 44.04
3 41.34 36.63 44.23 45.17
4 41.60 45.52 50.33 51.23 VI. KT LUN
5 43.52 43.82 51.34 50.52 Bài báo ã  xut phơng pháp nhn dng thanh iu ca
6 41.79 43.75 50.50 50.17
ting Vit nói s dng mô hình phân tích khác bit tuyn tính
7 41.21 42.16 51.52 49.43
LDA (Linear Discrimination Analysis), phân tích khác bit
8 41.36 40.00 51.86 48.70
9 40.95 38.98 51.26 47.75
toàn phơng QDA (Quadratic Discrimination Analysis), K láng
10 40.98 38.18 51.55 46.96 ging gn nht KNN (K-Nearest Neighbor), b phân lp h tr
véc tơ SVC (support vector classifier) và máy h tr véc tơ
SVM (Support Vector Machine). Các th nghim nhn dng
thanh iu c tin hành theo hai quan im: thanh iu tn
ti trên c âm tit và thanh iu ch tn ti trên phn hu thanh
ca âm tit. Các kt qu th nghim cho thy quan im coi
thanh iu ch tn ti trên phn hu thanh ca âm tit cho kt
qu nhn dng cao hơn so vi quan im coi thanh iu tn ti
trên c âm tit. Ngoài ra, trong các phơng pháp nhn dng
c th nghim, phơng pháp QDA cho kt qu nhn dng
cao nht.
Hng nghiên cu tip theo s là áp dng phơng pháp
mng nơ ron và hc sâu. Ngoài ra có th kt hp tiêu chí phân
loi thanh iu nh phân loi theo cao  hay theo lut bng-
trc trong nhn dng thanh iu. K thut nhn dng thanh iu
cng s c áp dng trong nghiên cu ca chúng tôi v nhn
dng và tng hp ting Vit nói.
TÀI LIU THAM KHO
Hình 3. Kt qu nhn dng thanh iu theo s thành [1] oàn Thin Thut, “Ng âm ting Vit”, Nhà xut bn Giáo dc, Hà
phn chun hóa theo thi gian N. Ni, 1997.
[2] Trevor Hastie, Robert Tibshirani, Jerome Friedman, “The Elements of
 ánh giá nh hng ca s thành phn chun hóa N n Statistical Learning, Data Mining, Inference, and Prediction ”, Springer,
kt qu nhn dng thanh iu, chúng tôi biu din kt qu ca USA 2014.
các phơng pháp nhn dng theo s thành phn chun hóa N [3] Yang, W.-J. & Lee, J.-C. & Chang, Y.-C. & Wang, H.-C. ”Hidden
Markov model for Mandarin lexical tone recognition”, Acoustics,
nh trong hình 3. Trong hình này, LDA_1, QDA_1, KNN_1, Speech and Signal Processing, IEEE Transactions on (Volume:36 ,
SVC_1, SVM1 là kt qu ca phơng pháp coi thanh iu nm Issue: 7 ), 2002
346
346
HộiHội
Thảo Quốc
Thảo Gia
Quốc 2015
Gia 2015về
vềĐiện
Điện Tử,
Tử,Truyền
Nghệ Thông
Thông TinTin (ECIT
(ECIT 2015)
2015)
[4] Charnvivit, P. & Jitapunkul, S. & Ahkuputra, V & Maneenoi, E & [11] Ngoc, Thang V. & Schultz, T. ”Vietnamese large vocabulary continuous
Thathong, U. & Thampanitchawong, B. ”F0 Feature Extraction by speech recognition”, Automatic Speech Recognition & Understanding,
Polynomial Regression Function for Monosyllabic Thai Tone 2009
Recognition”, INTERSPEECH, 2001. [12] Viet Bac Le & Besacier, L. ”Automatic Speech Recognition for Under-
[5] Brunelle, M. ”Coarticulation effects in northern Vietnamese tones”, Resourced Languages: Application to Vietnamese Language”, Audio,
Proceedings of the 15th International Conference of Phonetic Sciences, Speech, and Language Processing, IEEE Transactions on (Volume:17 ,
2003. Issue: 8 ), 2009
[6] Michaud, A. ”Final Consonants and Glottalization: New Perspectives [13] Davis, S.; Mermelstein, P. ”Comparison of parametric representations
from Hanoi Vietnamese”, 2004. for monosyllabic word recognition in continuously spoken sentences”,
[7] Pham, H. ”Vietnamese Tone – A New Analysis”, New York: Routledge, IEEE Trans. Acoust., Speech, Signal Processing, vol. 28, pp. 357-366,
ISBN 0-415-96762-7, 2003. 1980.
[8] Chu, Mai N. ”Cơ s ngôn ng hc và ting Vit”, Vietnam Education [14] Hong Quang Nguyen; Nocera, P.; Castelli, E.; Van Loan, T., ”Tone
Publishing House, 1997. recognition of Vietnamese continuous speech using hidden Markov
[9] Viet Bac Le & Besacier, L. ”First steps in fast acoustic modeling for a model”, Communications and Electronics, 2008. HUT-ICCE 2008.
new target language: Application to Vietnamese”, ICASSP 2005 Second International Conference on , vol., no., pp.235,239, 4-6 June
[10] Quan, V. & Kris, D. & Dirk, V. ”Vietnamese Automatic Speech 2008.
Recognition: The FLaVoR Approach”, Chinese Spoken Language
Processing Lecture Notes in Computer Science Volume 4274, 2006.
347
347
HộiHội
Thảo Quốc
Thảo Gia
Quốc 2015
ĐiệnTử,
Tử,Truyền
NghệThông
ThôngTinTin (ECIT
(ECIT 2015)
2015)
Dự Báo Dịch Tả Dựa Trên Mô Hình

Học Máy Phân Lớp
Lê Thị Ngọc Anh và Hoàng Xuân Dậu
Email: lengocanh@hmu.edu.vn, dauhx@ptit.edu.vn
Abstract—Dự báo bệnh dịch nói chung và dự báo dịch tả nói dụng để phân tích và giải nghĩa dữ liệu. Tuy nhiên, nó khác
riêng là một trong các nội dung quan trọng của công tác y tế dự thống kê ở chỗ phương pháp học máy có thể triển khai được
phòng. Trong việc xây dựng mô hình dự báo bệnh dịch, phương với các toán tử logic (AND, OR, NOT), các toán tử điều kiện
pháp được áp dụng nhiều nhất hiện nay là dịch tễ học toán học (IF, THEN, ELSE), các toán tử xác xuất, hoặc tối ưu hóa mô
dựa trên thống kê hồi quy đa biến hoặc phân tích mối tương hình dữ liệu hay phân lớp. Học máy vẫn dựa chủ yếu vào thống
quan. Các phương pháp dựa trên thống kê xác suất này cho kết kê và xác suất, nhưng nó hiệu quả hơn khi cho phép suy luận
quả tốt với giả định rằng các biến là độc lập và dữ liệu có thể mô hoặc quyết định mà ở các phương pháp thống kê khác không
hình hóa bằng cách tổ hợp tuyến tính giữa các biến. Tuy nhiên, thực hiện được [11,12].
khi mối quan hệ của các biến là phi tuyến tính và các biến có điều
kiện phụ thuộc thì các phương pháp dựa trên thống kê thuần túy Trong học máy, phân lớp dữ liệu (classification) là một
không còn phù hợp. Do vậy, việc nghiên cứu các phương pháp trong những hướng chính được nghiên cứu và ứng dụng rộng
xây dựng mô hình dự báo mới có khả năng khắc phục các điểm rãi. Phân lớp dự đoán giá trị của những nhãn xác định
yếu của các phương pháp dựa trên thống kê xác suất là cần thiết. (categorical label) hay những giá trị rời rạc (discrete value), có
Trong nghiên cứu này, chúng tôi xây dựng mô hình dự báo dịch nghĩa là phân lớp thao tác với những đối tượng dữ liệu mà có
tả dựa trên học máy, từ đó tiến hành thực nghiệm để đánh giá bộ giá trị là biết trước. Trong khi đó, dự đoán lại xây dựng mô
ảnh hưởng của các tham số, đồng thời lựa chọn thuật toán phân hình với các hàm nhận giá trị liên tục. Không phải lúc nào
lớp tối ưu cho mô hình dự báo dịch tả ở thành phố Hà Nội. phương pháp học máy cũng đảm bảo thành công. Cũng giống
như các phương pháp khác, việc thấu hiểu được vấn đề và đánh
Keywords- Học máy, phân lớp, dự báo dịch bệnh, dự báo dịch
tả. giá được những giới hạn của dữ liệu là rất quan trọng. Trong
nghiên cứu này, chúng tôi xây dựng mô hình dự báo dịch tả
dựa trên học máy, từ đó tiến hành thực nghiệm để đánh giá ảnh
I. GIỚI THIỆU hưởng của các tham số mô hình cũng như các biến số khí hậu,
Trong các loại dịch bệnh, dịch tả là một bệnh dịch nguy đồng thời lựa chọn thuật toán phân lớp tối ưu cho mô hình dự
hiểm có khả năng lây lan nhanh, ảnh hưởng lớn đến sức khỏe báo dịch tả ở thành phố Hà Nội.
của cộng đồng, thậm chí còn gây ra thiệt hại không nhỏ về Phần còn lại của bài báo được bố cục như sau: Phần 2 trình
người. Việc nghiên cứu dự báo sớm nguy cơ xảy ra dịch tả, bày về việc lựa chọn thuật toán phân lớp cho các thử nghiệm
giúp cho công tác chuẩn bị phòng chống dịch hiệu quả, giảm và phương pháp đánh giá; Phần 3 giới thiệu chi tiết mô hình dự
thiểu các thiệt hại khi dịch bùng phát là rất cần thiết. Đã có báo dịch tả đề xuất; Phần 4 giới thiệu tập dữ liệu sử dụng cho
nhiều mô hình dự báo tả được công bố [14-20]. Các phương thử nghiệm, nội dung và các kết quả thử nghiệm; Phần 5 phân
pháp được áp dụng nhiều nhất là dịch tễ học toán học dựa trên tích các kết quả thử nghiệm thu được và Phần 6 là Kết luận và
thống kê hồi quy đa biến hoặc phân tích mối tương quan. Các hướng phát triển.
phương pháp dựa trên thống kê xác suất này cho kết quả tốt với
giả định rằng các biến là độc lập và dữ liệu có thể mô hình hóa II. LỰA CHỌN THUẬT TOÁN VÀ ĐÁNH GIÁ ĐỘ
bằng cách tổ hợp tuyến tính giữa các biến. Tuy nhiên, khi mối CHÍNH XÁC PHÂN LỚP
quan hệ của các biến là phi tuyến tính và các biến có điều kiện
Lựa chọn thuật toán phân lớp
phụ thuộc thì các phương pháp dựa trên thống kê thuần túy
Trong những thập niên gần đây, ứng dụng học máy nói
không còn phù hợp. Do vậy, việc nghiên cứu các phương pháp
xây dựng mô hình dự báo mới có khả năng khắc phục các điểm chung và phân lớp nói riêng có xu hướng lan rộng trong rất
yếu của các phương pháp dựa trên thống kê xác suất là cần nhiều ngành khoa học để dự đoán một số thông tin của dữ liệu
thiết. dựa trên những đặc tính đã biết. Có nhiều thuật toán phân lớp
Trong những năm gần đây, học máy nổi lên là một phương được sử dụng rộng rãi cho các ứng dụng nhận dạng mẫu với dữ
pháp hiệu quả trong xây dựng các mô hình dự báo trong nhiều liệu đầu vào là chuỗi thời gian, như Cây quyết định (Decision
lĩnh vực, như nhận dạng mẫu, xử lý ngôn ngữ, tiếng nói, tin
sinh,… Trong học máy, một loạt các kỹ thuật thống kê, xác Tree), Rừng ngẫu nhiên (Random Forests, RF) [3], Mạng nơ-
xuất, tối ưu hóa,… được sử dụng cho phép máy tính “học” từ ron, các phương pháp Bayes [4], các mô hình Markov [4], k
các ví dụ trong quá khứ và phát hiện ra các mô hình từ những hàng xóm gần nhất (k-nearest neighbor, k-NN) [11], hay Máy
tập dữ liệu lớn và phức tạp. Học máy giống thống kê vì sử vector hỗ trợ (Support Vector Machines, SVM) [2, 6]. Các
ISBN: 978-604-67-0635-9 348
348
thuật toán phân lớp/phân cụm kể trên đã được chứng minh là phố Hà Nội. Chuỗi dữ liệu đầu vào được biến đổi thành các đặc
hiệu quả trong việc phân lớp dữ liệu trong nhiều ứng dụng và trưng trước khi áp dụng kỹ thuật học máy thống kê.
lĩnh vực khác nhau [4]. Trong nghiên cứu này, chúng tôi trước
hết áp dụng thuật toán Random Forests để huấn luyện xây
dựng mô hình dự báo dịch tả ở Hà Nội, sau đó sử dụng kết quả
này làm cơ sở để so sánh với một số thuật toán phân lớp học
máy phổ biến khác nhằm tìm kiếm được thuật toán tối ưu cho
Hình 1. Các nước xử lý của mô hình dự báo
bài toán dự báo. Mô hình sử dụng thuật toán được lựa chọn sau
đó sẽ được dùng để dự báo tình trạng dịch tả với các vector đặc Do dữ liệu đầu vào là chuỗi biến thiên liên tục theo thời gian,
trưng đầu vào. nên để xác định khoảng thời gian nào có khả năng xảy ra dịch
Lựa chọn phương pháp đánh giá độ chính xác của thuật hay bùng phát dịch, cần thực hiện phân chia dữ liệu thành các
toán phân lớp đoạn dữ liệu gọi là frame, sử dụng một khung cửa sổ trượt
(sliding window) với kích cỡ w ngày. Các frame có thể tách
Ước lượng độ chính xác của bộ phân lớp rất quan trọng bởi
rời, hoặc chồng lấn lên nhau với một khoảng cố định. Trong
nó cho phép dự đoán được độ chính xác của các kết quả phân
thực nghiệm xây dựng mô hình, chúng tôi sử dụng các khung
lớp những dữ liệu tương lai. Độ chính xác còn là cơ sở để so
cửa sổ trượt với các kích cỡ là 7 ngày, 14 ngày, 22 ngày và 30
sánh các mô hình phân lớp khác nhau. Có hai phương pháp
ngày. Kích cỡ cửa sổ trượt được lựa chọn dựa trên các đặc
đánh giá độ chính xác phổ biến là holdout và k-fold cross-
điểm dịch tễ học của bệnh tả và phân bố dữ liệu tả.
validation [10, 14]. Cả hai phương pháp này đều dựa trên các
Trong dịch tễ học, để xác định mức độ bùng phát dịch, giá trị
phân hoạch ngẫu nhiên tập dữ liệu ban đầu.
số ca bệnh trung bình tháng khu vực, tính trên 0.000 dân được
 Trong phương pháp holdout, dữ liệu dưa ra được phân chia sử dụng. Gọi giá trị này là a, trạng thái dịch tả có thể được chia
ngẫu nhiên thành 2 phần là: tập dữ liệu huấn luyện và tập dữ thành 3 nhóm:
liệu kiểm tra. Thông thường, 2/3 dữ liệu cấp cho tập dữ liệu •Nhóm không có dịch tả, hoặc nhóm “0” nếu a = 0;
huấn luyện, phần còn lại cho tập dữ liệu kiểm tra [14]. •Nhóm dịch tả thấp, hoặc nhóm “ ” nếu 0 < a ≤ 1;
 Trong phương pháp k-fold cross validation, tập dữ liệu ban •Nhóm dịch tả cao, hoặc nhóm “2” nếu a > .
đầu được chia ngẫu nhiên thành k tập con (fold) có kích Mô hình sử dụng các đặc trưng thống kê cơ bản bao gồm
thước xấp xỉ nhau S1, S2, …, Sk. Quá trình học và kiểm tra mean, min, max, variance, standard deviation để tách các đặc
được thực hiện k lần. Tại lần lặp thứ i, Si là tập dữ liệu kiểm trưng của chuỗi dữ liệu đầu vào như sau:
tra, các tập còn lại hợp thành tập dữ liệu huấn luyện. Có
nghĩa là, đầu tiên việc huấn luyện được thực hiện trên các 1. Mean:  S  1  N si , trong đó Si là các giá trị số
tập S2, S3,…, Sk, sau đó kiểm tra trên tập S1; tiếp tục quá N i 1
trình huấn luyện được thực hiện trên tập S1, S3, S4,…, Sk, trong frame S.N là độ dài của S.
sau đó kiểm tra trên tập S2; và tiếp tục cho đến khi tập Sk Standard deviation: 1 2
 s  S 
N
  S i
được sử dụng làm tập kiểm tra. Độ chính xác là toàn bộ số 2. N i 1
1
 s  s 
N
phân lớp đúng từ k lần lặp chia cho tổng số mẫu của tập dữ Var ( S )
 i
2
3. Variance: N i 1
liệu ban đầu [10].
Nghiên cứu này lựa chọn sử dụng phương pháp k-fold cross 4. Min: giá trị nhỏ nhất trong Si
validation để đánh giá độ chính xác của các thuật toán phân
lớp, với k = 4. 5. Max: giá trị lớn nhất trong Si
III. ĐỀ XUẤT MÔ HÌNH DỰ BÁO DỊCH TẢ Mô hình đề xuất sử dụng bộ phân loại Rừng ngẫu nhiên đề
Nghiên cứu này đề xuất mô hình phân lớp để dự đoán tỷ lệ xuất bởi L. Breiman và A. Cutler [5] với công cụ Weka phiên
bệnh tả trong một khoảng thời gian định sẵn, sử dụng các số bản 3.7 [21] để phân loại và đánh giá mức độ ảnh hưởng của
liệu về khí hậu, môi trường dựa trên học máy thống kê rời rạc. các tham số của mô hình, các biến số khí hậu, thời tiết đến hiệu
Mô hình đề xuất gồm các bước xử lý như mô tả trong Hình 1. năng của mô hình. Các độ đo: độ chính xác (Precision), độ bao
Dữ liệu đầu vào sử dụng cho mô hình dự báo là chuỗi dữ liệu phủ (Recall) và độ đo F được lấy trung bình trên các lớp, áp
theo thời gian, gồm chuỗi các giá trị liên tục của các biến số dụng theo phương pháp kiểm tra chéo 4 lần (4-folds cross-
(khí hậu, thời tiết, độ ẩm, số giờ nắng …) trong khu vực thành validation).
349
349
HộiHội
ThảoThảo Quốc
Quốc Gia
2015 ĐiệnTử,
Tử,Truyền
TruyềnThông
Thông và
và Công
CôngNghệ
NghệThông
ThôngTinTin
(ECIT 2015)
(ECIT 2015)
IV. THỰC NGHIỆM VÀ KẾT QUẢ Bảng 1: Ảnh hưởng của kích cỡ cửa sổ trượt tới các độ đo của mô
hình
Trong phần này, chúng tôi thực hiện thử nghiệm mô hình với
các dữ liệu các dữ liệu về thời tiết, dân số được cung cấp bởi
2. Ảnh hưởng của độ chồng lấn frame
các cơ quan, gồm Viện nghiên cứu khí tượng thủy văn, Tổng
Để đánh giá ảnh hưởng của độ chồng lấn giữa các frame kế
cục dân số và Viện khoa học và môi trường. Dữ liệu cụ thể bao
tiếp nhau với hiệu năng hệ thống, nghiên cứu đã thực hiện
gồm: số dân của 29 quận huyện trong thành phố Hà Nội, từ
thực nghiệm với các độ chồng lấn khác nhau, với kích cỡ cửa
năm 2007 đến năm 20 0; diện tích, mật độ dân số của từng
sổ trượt là 4 ngày. Độ chồng lấn giữa hai frame liền nhau có
quận huyện. Các thông số thời tiết bao gồm: nhiệt độ trung
thể từ 0 đến 13 ngày/14 ngày. Hình 2 thể hiện mức độ ảnh
bình, nhiệt độ cao nhất, nhiệt độ thấp nhất, tổng lượng mưa, độ
hưởng của độ chồng lấn tới hiệu năng của mô hình theo độ đo
ẩm trung bình, độ ẩm cao nhất, độ ẩm thấp nhất trong ngày,
F1.
trung bình số giờ nắng trong ngày, tốc độ gió và chỉ số biến đổi
1
khí hậu SOI (ENSO). Về số liệu thống kê bệnh nhân tả được
0.95
cung cấp bởi Trung tâm y tế dự phòng Hà Nội: năm 2007 có
0.9
79 ca, năm 2008 có 2057 ca, năm 2009 có 89 ca và năm 0.85
2010 có 251 ca. Với mục đích đánh giá ảnh hưởng của các 0.8
F1
tham số (kích cỡ cửa số trượt, độ chồng lấn cửa sổ, các tham số 0.75
khí hậu, trễ thời gian) lên mô hình dự báo đề xuất và tìm ra 0.7
thuật toán cho kết quả phân lớp chính xác cao nhất, chúng tôi 0.65
tiến hành các thực nghiệm sau: ( ) Đánh giá ảnh hưởng của 0.6
0 1 2 3 4 5 6 7 8 9 10 11 12 13
kích cỡ cửa sổ trượt, (2) Đánh giá ảnh hưởng của độ chồng lấn Overlap (Ngày)
frame, (3) Đánh giá ảnh hưởng của tập các đặc trưng, (4) Đánh Hình 2. Ảnh hưởng của độ chồng lấn frame độ đo F1
giá ảnh hưởng của các biến số, (5) Đánh giá ảnh hưởng của độ 3. Ảnh hưởng của tập đặc trưng
trễ thời gian và (6) Thử nghiệm mô hình dự báo với một số Tiến hành thực nghiệm với 2 trường hợp: có sử dụng tập
thuật toán phân lớp. Với mỗi thử nghiệm độ đo F được tính đặc trưng thống kê (mean, variance, standard deviation, min,
toán làm cơ sở cho các phân tích, so sánh. max) và chỉ sử dụng các giá trị thô ban đầu của các biến số về
1. Ảnh hưởng của kích cỡ cửa sổ trượt khí hậu. Đối với trường hợp không sử dụng các đặc trưng
Thực nghiệm được thực hiện với các kích cỡ cửa sổ trượt thống kê mà chỉ sử dụng các giá trị thô (số giá trị của từng
khác nhau (7, 14, 22 và 30 ngày) và tham số độ chồng lấn là frame), thu được giá trị độ đo F là 0.902, còn khi sử dụng các
50%. Ngoài ra, các biến số về khí hậu được xem xét bao gồm: đặc trưng thống kê nêu trên, giá trị F thu được cao hơn là
nhiệt độ trung bình, nhiệt độ cao nhất, nhiệt độ thấp nhất, tổng 0.973.
lượng mưa, độ ẩm trung bình, độ ẩm cao nhất, độ ẩm thấp nhất, 4. Ảnh hưởng của các biến số
trung bình số giờ nắng trong ngày, tốc độ gió và ENSO. Dữ Để xác định mức độ ảnh hưởng của từng biến số, chúng tôi
liệu tả đầu vào được gán nhãn gồm 3 loại: không có dịch, mức loại dần các biến số ra khỏi tập dữ liệu ban đầu và đánh giá sự
dịch tả thấp và mức dịch tả cao, tương ứng với các giá trị a = 0; thay đổi của giá trị độ đo F so với tập đầy đủ các biến số. Kết
0 < a ≤ 1; a > 1. Sử dụng phương pháp kiểm tra chéo 4 lần, các quả thu được cho ở Bảng 2.
dữ liệu huấn luyện đầu vào được dùng để tách đặc trưng, sau Biến số bị loại trừ F1
đó các vector đặc trưng được sử dụng để huấn luyện sử dụng Không loại biến số nào 0.973
bộ phân loại Random Forests. Kết quả thu được cho trên Bảng Nhiệt độ trung bình 0.970
1. Từ kết quả thử nghiệm cho ở Bảng 1 ta thấy, với kích cỡ cửa Nhiệt độ cao nhất 0.973
Nhiệt độ thấp nhất 0.971
sổ trượt 14 ngày, mô hình cho kết quả các độ đo tốt nhất. Trên
Tổng lượng mưa 0.972
cơ sở này, chúng tôi lựa chọn cửa sổ trượt là 14 ngày cho các Độ ẩm trung bình 0.973
thử nghiệm tiếp theo. Độ ẩm cao nhất 0.971
Kích cỡ cửa sổ trượt Độ chính xác Độ bao phủ F1 Độ ẩm thấp nhất 0.973
Trung bình số giờ nắng 0.969
7 ngày 0.730 0.785 0.736 Tốc độ gió 0.972
14 ngày 0.747 0.796 0.751 Nhiệt độ trung bình, nhiệt độ cao nhất, nhiệt độ thấp
0.966
nhất
22 ngày 0.709 0.754 0.714 Độ ẩm trung bình, độ ẩm cao nhất, độ ẩm thấp nhất 0.972
ENSO 0.972
30 ngày 0.626 0.684 0.628
Bảng 2: Ảnh hưởng của các biến số đến độ đo F1
350
350
HộiHội
Thảo Quốc
Thảo Gia
Quốc 2015
ĐiệnTử,
Tử,Truyền
NghệThông
ThôngTinTin (ECIT
(ECIT 2015)
2015)
5. Thử nghiệm mô hình với biến số khí hậu hiện tại và mô Khi sử dụng tập đặc trưng thống kê thì độ dài vector đặc
hình với các biến số khí hậu có độ trễ trưng ngắn hơn (gồm 5 đặc trưng tương đương mỗi vector có
Để đánh giá khả năng xuất hiện ca bệnh tả sau một khoảng độ dài là 5) giúp cho thời gian huấn luyện cũng như thời gian
dự đoán của bộ phân loại nhanh hơn, làm tăng tính hiệu quả
thời gian có tác động của các yếu tố thời tiết, khí hậu trong quá
của tập đặc trưng thống kê khi thử nghiệm với mô hình đề xuất.
khứ, chúng tôi tiến hành thử nghiệm mô hình với biến số khí Giá trị độ đo F khi sử dụng tập đặc trưng thống kê cao hơn
hậu khác nhau, từ đó đánh giá được ảnh hưởng yếu tố khí hậu, đáng kể so với khi không sử dụng tập đặc trưng này (0.973 so
thời tiết tới khả năng gây ra dịch tả sau các khoảng thời gian với 0.902).
tính theo tuần. Kết quả thử nghiệm cho trên Bảng 3. Các kết quả ở Bảng 2 cho thấy các biến số khí hậu có ảnh
Trễ (tuần) 0 2 4 6 8 10 12 hưởng đáng kể đến độ đo F . Giá trị F1 thấp nhất là 0,966 và
F1 0.973 0.973 0.974 0.978 0.979 0.979 0.976 0,969 khi loại bỏ cùng lúc cả 3 biến số về nhiệt độ và biến
Bảng 3: Ảnh hưởng của các yếu tố khí hậu các tuần trước đó tới độ trung bình số giờ nắng. Giá trị F1 cao nhất là 0,973 khi không
loại bỏ biến nào.
đo F1 Kết quả ở Bảng 3 cho thấy khi sử dụng độ trễ thời gian là 8
6. Thử nghiệm với một số bộ phân loại khác với mô hình tuần hoặc 10 tuần thì F1 có giá trị lớn nhất là 0.979. Khi không
biến số khí hậu có độ trễ sử dụng độ trễ hoặc sử dụng độ trễ 2 tuần thì F1 có giá trị nhỏ
Trong các thực nghiệm trên đã thực hiện, chúng tôi sử dụng bộ nhất là 0.973. Như vậy, yếu tố khí hậu, thời tiết trong quá khứ
phân loại là Random Forest [3] và đã đạt được độ chính xác có ảnh hưởng đến tỷ lệ mắc bệnh tả ở thành phố Hà Nội, và các
yếu thời tiết từ 8 tuần hoặc 10 tuần trước đó ảnh hưởng nhiều
khá cao (giá trị cao nhất của F1 = 0.979 như cho trên Bảng 3).
nhất. Kết quả này là tương đồng với những nghiên cứu được
Để có thêm căn cứ lựa chọn mô hình dự báo tối ưu cho bệnh tả thực hiện ở Đông Phi, Tazania khi nghiên cứu thời gian bùng
ở Hà Nội, chúng tôi tiến hành bổ sung một số thực nghiệm với phát và các yếu tố khí hậu ảnh hưởng đến sự xuất hiện của
các bộ phân loại học máy phổ biến khác, nhằm so sánh khả bệnh tả [14-20].
năng phân lớp của chúng. Kết quả thực nghiệm so sánh giữa Kết quả trong Bảng 4 cho thấy khả năng phân lớp tốt nhất
các bộ phân lớp được trình bày trong Bảng 4. trong tất cả các trường hợp là của thuật toán Random Forests
Trễ (tuần) trong trường hợp trễ 6 tuần, và 1-NN trong trường hợp trễ 10
0 2 4 6 8 10 12 tuần, cùng với giá trị F1=0.981. 1-NN là bộ phân lớp đơn giản,
Random
0.979 0.980 0.978 0.981 0.979 0.980 0.976
tốc độ nhanh và không phụ thuộc vào tham số. Ưu điểm của
Forest thuật toán Random Forests so với các thuật toán phân lớp khác
J48 0.947 0.957 0.949 0.943 0.947 0.950 0.955 là tốc độ cao, độ chính xác cao, chống nhiễu tốt và đặc biệt là
NaiveBayes 0.545 0.631 0.641 0.640 0.636 0.655 0.633
hiếm khi rơi vào tình trạng “quá vừa” (overfit) [7, 8, 9]. Như
F
Random
0.943 0.930 0.938 0.962 0.936 0.958 0.951 vậy, cả 2 thuật toán Random Forests và 1-NN đều có thể được
Tree
1 chấp nhận cho xây dựng mô hình dự báo tả tại Hà Nội.
1-NN 0.979 0.978 0.978 0.976 0.976 0.981 0.974
Logistic 0.826 0.895 0.902 0.907 0.902 0.908 0.901 VI. KẾT LUẬN
Multilayer
Perceptron
0.961 0.968 0.964 0.960 0.975 0.975 0.975 Nghiên cứu đã đề xuất mô hình sử dụng học máy phân lớp
(SVM) SMO 0.773 0.851 0.870 0.859 0.864 0.870 0.853 thống kê để dự báo dịch tả tại Hà Nội dựa trên việc phân tích
Bảng 4. Bảng so sánh khả năng phân lớp của các bộ phân lớp phổ dữ liệu về các ca bệnh trong nhiều năm liên tiếp và các mối
biến
liên hệ với các yếu tố thời tiết, khí hậu. Các thực nghiệm đã
được thực hiện để xem xét ảnh hưởng của các tham số như
V. BÀN LUẬN
kích cỡ cửa sổ trượt, mức độ chồng lấn giữa các khung dữ liệu
Phân lớp và dự đoán là hai dạng của phân tích dữ liệu nhằm liên tiếp nhau, các loại đặc trưng thống kê, các yếu tố thời tiết,
trích rút ra một mô hình mô tả các lớp dữ liệu quan trọng hay khí hậu và ENSO với kết quả giá trị phân lớp a = 0; 0 < a <=
dự đoán xu hướng dữ liệu tương lai. Các kết quả thử nghiệm 1; a > 1. Kết quả thu nhận được cho thấy các tham số này đều
của nghiên cứu này là một minh chứng cho sự phù hợp của có ảnh hưởng đối với hiệu năng của mô hình. Các yếu tố thời
phương pháp phân lớp ứng dụng trong dự báo bệnh dịch trong tiết có ảnh hưởng quan trọng nhất tới việc dự báo là các biến
lĩnh vực y tế. Trong mô hình dự đoán bệnh dịch tả dựa trên số về nhiệt độ trung bình, trung bình số giờ nắng và ENSO.
phương pháp phân lớp, các thử nghiệm đã được thực hiện Ngược lại, các yếu tố hầu như không ảnh hưởng tới kết quả dự
nhằm đánh giá độ chính xác của mô hình và ảnh hưởng của các báo là độ ẩm. Các kết quả thực nghiệm cũng chỉ ra rằng các
tham số. yếu tố khí hậu trong quá khứ có ảnh hưởng quan trọng tới mô
Các kết quả ở Bảng 1 và Hình 2 cho thấy kích cỡ cửa số hình ở các thời điểm 4, 8 và 10 tuần. Dựa trên các kết quả thực
trượt và độ chồng lấn có ảnh hưởng đáng kể đến độ chính xác nghiệm thu được, có thể khẳng định hai thuật toán tối ưu nhất
phân lớp. Cửa sổ trượt dài 4 ngày cho độ chính xác cao nhất. được đề xuất để sử dụng cho mô hình dự báo trên thực tế là 1-
Khi độ chồng lấn nhỏ hơn 50% thì giá trị F có xu hướng tăng NN và Random Forests, với độ chính xác dự báo tỷ lệ mắc
dần, tuy có một số thời điểm giảm, nhưng khi độ chồng lấn bệnh tả đạt khoảng 98%.
càng tăng thì giá trị F tăng ổn định, đạt giá trị lớn nhất là gần Để tăng độ tin cậy của kết quả thực nghiệm trước khi có thể
0.973 với độ chồng lấn là 13 ngày. triển khai ứng dụng trong công tác dự báo bệnh dịch tả, nhóm
351
351
HộiHội
Thảo Quốc
Thảo Gia
Quốc 2015
ĐiệnTử,
Tử,Truyền
NghệThông
ThôngTinTin (ECIT
(ECIT 2015)
2015)
nghiên cứu dự kiến sẽ tiếp tục thử nghiệm mô hình với các dữ 13. Fred Brauer, Pouline Van de Driessche and Jianhoo Wu,
liệu ca bệnh trong một thời gian dài hơn nữa và bổ sung thêm Mathematical Epidemiology, Springer, 2008.
các yếu tố khác, như môi trường, điều kiện sống và dân trí 14. J. Wang and S. Liao, A generalized cholera model and
trong khu vực nghiên cứu. epidemic- endemic analysis, Hournal of Biological Dynamics,
p.568-589, 2012.
15. Y. Yue, J. Gong, D. Way, B. Kan, B. Li and C. Ke, Influence of
1. X. Wu (2008) “Top 10 algorithms in data mining,” Knowl. Inf. Climate factors on Vibro cholera dynamics in the Pearl River
Syst., vol. 14, no. 1, pp. 1–37, 2008. estuary, South China, World J. Microliol Biotechnol, 2014.
2. C. J. C. Burges, “A tutorial on support vector machines for
16. R.C. Rainer, A. King, M. Emch, M. Yunus, S.G. Faruque and
pattern recognition,” Data Min. Knowl. Discov., vol. 2, no. 2,
M. Paucula, Highly localized sensitivity to climate forcing
pp. 121–167, 1998.
drives endemic cholera in a megacity, Proc.Nalt. Âcd. Sci.
3. L. Breiman, “Random forests,” Mach. Learn., vol. 45, no. , pp.
U.S.S, 109,2033-2036, 2012.
5–32, 2001.
4. C. M. Bishop, Pattern recognition and machine learning. 17. Z. Mukandavire, S. Liao, J. Wang, H. Gaff, D.L. Smith, and
Springer, 2006. J.G. Morris, Estimating the reproductive numbers for the 2008–
5. N. S. Altman, “An introduction to kernel and nearest-neighbor 2009 cholera outbreaks in Zimbabwe, Proc. Natl Acad. Sci. 108
nonparametric regression,” Am. Stat., vol. 46, no. 3, pp. 175– (2011), pp. 8767–8772.
185, 1992.
6. C.-W. Hsu, C.-C. Chang, C.-J. Lin, and others, “A practical 18. R. Reyburn, D. R. Kim, M. Emch và các cộng sự. (2011),
guide to support vector classification.” 2003. "Climate variability and the outbreaks of cholera in Zanzibar,
7. L. Breiman, J. Friedman, C. J. Stone, and R. A. Olshen, East Africa: a time series analysis", Am J Trop Med Hyg, 84(6),
Classification and regression trees. CRC press, 1984. tr. 862-9.
8. Caruana, R.; Niculescu-Mizil, A. (2006). An empirical 19. Sara L. M. Trærup;Ramon A. Ortiza;Anil Markandya (2011),
comparison of supervised learning algorithms. Proc. 23rd "The Costs of Climate Change: A Study of Cholera in
International Conference on Machine Learning . Cite SeerX: Tanzania", International Journal of Environmental Research
10.1.1.122.5901 and Public Health, 8, tr. 4386-4405.
9. Russell, Stuart; Norvig, Peter (2003). Artificial Intelligence: A
Modern Approach (2nd ed.). Prentice Hall. ISBN 978- 20. Michael Emch et al (2008), "Seasonality of cholera from 1974
0137903955. to 2005: a review of global patterns", International Journal of
10. J. Gray, Data mining – Concepts and Techniques, Chapter 7 – Health Geographics, 7(31).
Classification and Prediction series, Morgan Kaufmann 21. Bộ công cụ học máy Weka, www.cs.waikato.ac.nz/ml/weka/,
Publishers, August 2000. University of Waikato, truy nhập tháng 8.2015.
11. T. Michell, Machine Learning, McGraw Hill, 1997.
12. Duda RO, Hart PE, Stork DG (2001) Pattern classification (2nd
edition). New York: Wiley.
352
352
HộiHội
Thảo Quốc
Thảo Gia
Quốc 2015
Gia 2015về
vềĐiện
ĐiệnTử,
Tử,Truyền
Nghệ Thông
Thông TinTin (ECIT
(ECIT 2015)
2015)
Kỹ Thuật Tra Cứu Ảnh Cây Dược Liệu Dựa Vào Nội
Dung Phục Vụ Cho Phát Hiện, Quản Lý Và Khai Thác
Nguyễn Văn Huân và Nguyễn Văn Tảo
Trường Đại Học Công Nghệ Thông Tin và Truyền Thông – Đại Học Thái Nguyên
Email: nvhuan@ictu.edu.vn, nvtao@ictu.edu.vn
Abstract—Bài báo này đề xuất việc nghiên cứu và áp dụng kỹ lá cây được nhận dạng sẽ được trích đường viền đặc trưng sau
thuật tra cứu ảnh về cây dược liệu theo nội dung sử dụng dấu đó so sánh với các mẫu lá cây có trong cơ sở dữ liệu.
hiệu nhị phân của ảnh như xác định véc tơ đặc trưng, biểu diễn Tuy nhiên, khi số lượng ảnh được lưu trữ trở nên rất lớn thì
và trích rút đặc trưng và tính độ tương tự nhằm hỗ trợ cho công vấn đề đặt ra là phải có những phương pháp tổ chức cơ sở dữ
tác tìm kiếm, nhận dạng và phát hiện về cây dược liệu. Đồng thời,
liệu ảnh tốt cùng với những kỹ thuật tra cứu, tra cứu ảnh hiệu
đề xuất cài đặt ứng dụng thực nghiệm có sử dụng kỹ thuật tra
cứu ảnh cây dược liệu vào phục vụ cho việc quản lý, khai thác và quả, có độ chính xác cao và có hiệu năng tốt mới đáp ứng được
duy trì một cách có hiệu quả các nguồn cây dược liệu của Việt nhu cầu ngày càng cao của con người. Việc xây dựng các hệ
Nam. Kết quả đề xuất này sẽ góp phần giúp cho các nhà quản lý, thống tra cứu ảnh là rất cần thiết. Trong thực tế, bài toán tra
nhà dược liệu có được một công cụ hữu ích nhằm theo dõi, thống cứu ảnh số có rất nhiều ứng dụng quan trọng. Ví dụ trong lĩnh
kê, nhận dạng và quản lý cây dược liệu một cách hiệu quả. vực ngân hàng việc so sánh chữ ký của khách hàng với mẫu
chữ ký đã được lưu trữ sẵn có thể thực hiện rất nhanh và chính
Keywords- Cây dược liệu, Véc tơ đặc trưng, Tính độ tương tự, xác nếu có được một phần mềm so sánh mẫu chữ ký tốt. Các
Đo khoảng cách. ứng dụng phức tạp hơn như so sánh mẫu vân tay, tra cứu ảnh
tội phạm v.v... là những bài toán tra cứu ảnh được áp dụng
I. GIỚI THIỆU trong ngành khoa học hình sự.
Cây thuốc (cây dược liệu) có một vai trò quan trọng đối với Phần còn lại của bài báo được tổ chức như sau: trong phần
đời sống của mỗi con người, đặc biệt trong chăm sóc sức khỏe. II, chúng tôi trình bày kỹ thuật đề xuất. Trong phần III, chúng
Ngày nay, cây dược liệu đã được con người phát hiện, nhận tôi đưa ra kết quả thực nghiệm. Phần IV đánh giá kết quả và
dạng và khai thác trên cơ sở công dụng của chúng đối với đời phân tích lý thuyết. Cuối cùng, chúng tôi kết luận bài báo
sống chúng ta, đặc biệt là cây dược liệu đem lại giá trị kinh tế trong phần V.
cao. Tuy nhiên hiện nay, nguồn cây dược liệu đang ngày càng
II. KỸ THUẬT TRA CỨU ẢNH CÂY DƯỢC LIỆU
bị cạn kiệt do nhiều nguyên nhân. Việc ứng dụng Công nghệ
thông tin vào quản lý các loài cây dược liệu đã được phát hiện THEO NỘI DUNG DỰA VÀO DẤU HIỆU NHỊ PHÂN
không còn là mới, tuy nhiên ứng dụng vào phát hiện và tra cứu, Trong bài báo sử dụng kỹ thuật tra cứu ảnh cây dược liệu theo
cụ thể là kỹ thuật xử lý ảnh [3] hiện nay không có nhiều. nội dung dựa vào dấu hiệu nhị phân và vector đặc trưng.
Liên quan tới vấn đề cây dược liệu và nhận dạng lá cây có - Dựa vào dấu hiệu nhị phân:
một số công trình, bài báo trong và ngoài nước đã nghiên cứu Việc lưu trữ các đặc trưng của ảnh có thể sẽ tốn rất nhiều
vấn đề này như công trình nghiên cứu của tác giả Đỗ Tất Lợi không gian lưu trữ. Để giảm bớt việc tiêu tốn không gian lưu
[4] cây dược liệu có vai trò rất quan trọng đối với cuộc sống trữ, tác giả sử dụng dấu hiệu nhị phân, là các chuỗi bit nhị phân
của mỗi chúng ta, nó là nguyên liệu để chăm sóc sức khỏe con có kích thước được xác định trước đại diện cho sự phân bố màu
người và góp phần phát triển kinh tế. Trong công trình nghiên sắc của một hình ảnh. Khi ta tra cứu ảnh, giả định rằng dấu
cứu của tác giả cũng đã chỉ ra nhiều loài cây dược liệu với hiệu nhị phân của hình ảnh được lưu trữ tuần tự trong một tập
những công dụng quan trọng. Trong các công trình nghiên cứu tin. Để xử lý một tra cứu, tập tin được quét và tất cả các dấu
của nhóm tác giả K. Lee và cộng sự [8], A. Bhardwaj và cộng hiệu nhị phân của hình ảnh được so sánh với dấu hiệu nhị phân
sự [1], C. Sari [2] đã sử dụng kỹ thuật nhận dạng dựa vào của các hình ảnh tra cứu bằng cách sử dụng một số liệu tương
đường viền và hình dạng của lá để nhận dạng lá cây. Kết quả tự cũng được xác định. Các hình ảnh được so sánh sẽ được lấy
bài báo đã nhận dạng và phát hiện với khoảng gần 2000 lá của ra và xếp hạng theo tương đồng với hình ảnh truy vấn.
32 loài cây khác nhau. Công trình nghiên cứu của nhóm tác giả Hệ thống tra cứu ảnh dựa vào dấu hiệu nhị phân gồm hai pha.
Patil và cộng sự [10] đã sử dụng kỹ thuật nhận dạng ảnh dựa Pha thứ nhất, tạo cơ sở dữ liệu đặc trưng. Các ảnh trong cơ sở
vào mầu, cấu trúc và hình dạng của ảnh. Một cơ sở dữ liệu ảnh dữ liệu được xác định để lấy các vector đặc trưng, các đặc
gồm các thông tin như trên được tạo và ảnh cần nhận dạng sẽ trưng được trích rút thành một cơ sở dữ liệu đặc trưng. Pha thứ
được trích rút các đặc trưng và so sánh với những ảnh mẫu hai, truy vấn cơ sở dữ liệu. Khi ảnh cây dược liệu cần truy vấn
trong cơ sở dữ liệu ảnh. Kết quả nghiên cứu của nhóm tác giả được đưa vào hệ thống, nó sẽ được xác định vector đặc trưng và
J. Du và cộng sự [6], [5,7,9] đã sử dụng kỹ thuật phân lớp các được đối sánh với các đặc trưng của các ảnh cây dược liệu mẫu.
lá cây. Các lá cây mẫu được phân lớp và lưu vào cơ sở dữ liệu,
ISBN: 978-604-67-0635-9 353
353
Hình 1. Kiến trúc của kỹ thuật tra cứu ảnh cây dược liệu sử dụng dấu hiệu nhị phân
Trong đó, pos( BQj ), pos( B I ) là các vị trí của các bit được
j
Các đặc trưng của ảnh lá cây dược liệu truy vấn được so sánh
với các đặc trưng của tất cả các ảnh lá của cây dược liệu mẫu thiết lập trong chuỗi dấu hiệu nhị phân của ảnh Q và I (hay các
sử dụng độ đo tương tự. Vì thế, ba quá trình quan trọng trong bin được thiết lập) bin Bj của hình ảnh Q và I.
hệ thống tra cứu ảnh theo nội dung sử dụng dấu hiệu nhị phân 1 2 3
là: xác định vector đặc trưng; biểu diễn, trích rút đặc trưng và Ta có pos( B A = 2, pos( B A ) = 1,và pos( B A ) = 8. Tuy
tính độ tương tự. nhiên phương pháp này không mạnh mẽ và không thể hiện
- Đo độ tương tự: được sự khác biệt rõ ràng của các ảnh. Để minh họa cho thuật
Khi ta đưa một ảnh lá cây dược liệu vào để thực hiện tra cứu, toán ta xét dấu hiệu nhị phân của ba ảnh A, B và C.
đầu tiên ảnh đầu vào cũng được xác định chuỗi dấu hiệu nhị Ta thấy mật độ màu (cột thứ hai trong bảng), hình ảnh A và C
phân của nó. Tiếp theo chuỗi đó sẽ được so sánh với tập các là tương tự như nhau hơn so với hình ảnh A và B. Tuy nhiên,
chuỗi dấu hiệu nhị phân của tập ảnh lá cây dược liệu mẫu. Nó chúng ta có: d0(A, B) = (4 - 4) + (4-4) + (5 - 3) = 2 và d0 (A,
là cơ bản của việc tính toán độ tương tự giữa các chuỗi dấu C) = (4 - 3) + (4-3) + (5-5) = 2, điều này cho thấy rằng cả ảnh
hiệu nhị phân của hình ảnh lá cây dược liệu truy vấn được B và C đều có giá trị như nhau tương tự như ảnh A, do đó trái
người dùng chỉ định và tất cả các hình ảnh lá cây dược liệu ngược với trực giác. Nhưng nếu chúng ta bình phương khoảng
mẫu khác. Ngay từ đầu, tôi sử dụng các phương pháp sau đây cách giữa các bộ số nhị phân, chúng ta có thể có thấy được sự
để tính độ tương tự giữa ảnh truy vấn và ảnh mẫu: khác biệt rõ ràng của các hình ảnh. Và khoảng cách giữa các
n
bộ số nhị phân là:
d 0 (Q, I ) ( pos( BQj ) pos( BIj )
j 1
(1)
354
354
Bảng 1. Chuỗi dấu hiệu nhị phân minh họa sự giống và khác nhau của ảnh
Bin màu sắc Mật độ màu Dấu hiệu nhị phân
được thiết
b1 b2 b3 b4 b5 b6 b7 b8 b9 b10
lập
Ảnh A
c1/B1A 30% 0 0 0 1 0 0 0 0 0 0
2
c2/B A 30% 0 0 0 1 0 0 0 0 0 0
c3/B3A 40% 0 0 0 0 1 0 0 0 0 0
Ảnh B
c1/B1B 39% 0 0 0 1 0 0 0 0 0 0
2
c2/B B 39% 0 0 0 1 0 0 0 0 0 0
3
c3/B B 22% 0 0 1 0 0 0 0 0 0 0
Ảnh C
1
c1/B C 29% 0 0 1 0 0 0 0 0 0 0
c2/B2C 29% 0 0 1 0 0 0 0 0 0 0
3
c3/B C 42% 0 0 0 0 1 0 0 0 0 0
Thuật toán tính độ tương tự giữa hai ảnh Q và I:

Đầu vào: Các chuỗi dấu hiệu nhị phân của ảnh Q và I
Bài toán đặt ra là khi người sử dụng cung cấp một ảnh lá cây
Đầu ra: Khoảng cách d(Q, I) dược liệu cần tra cứu. Hệ thống có nhiệm vụ tìm kiếm trong
dữ liệu ảnh lá cây dược liệu đã có và đưa ra kết quả là tỷ lệ độ
j
Tìm Pos( BQ ) và Pos( B I )
j
tương đồng của ảnh cần truy vấn với các ảnh trong cơ sở dữ
liệu ảnh.
j j
Pos( BQ ) và Pos( B I ) là các vị trí của các bit được Ban đầu, ảnh lá cây dược liệu mẫu sẽ được tiền xử lý (bởi
công đoạn tiền xử lý) để trích rút các véc tơ đặc trưng. Công
thiết lập trong chuỗi dấu hiệu nhị phân của ảnh Q và I (hay đoạn tra cứu nhận dạng ảnh lá cây dược liệu được truy vấn từ
các bin được thiết lập) bin Bj của hình ảnh Q và I. người sử dụng thông qua giao diện đồ họa, trích rút các véc tơ
Tính khoảng cách d(Q, I) đặc trưng từ ảnh truy vấn, so sánh với các cụm đặc trưng của
ảnh lá cây dược liệu mẫu trong cơ sở dữ liệu ảnh và trả về các
n ảnh có độ tương tự lớn nhất với ảnh truy vấn.
j
[pos ( BQ ) – pos ( B I )]2 - Công đoạn tiền xử lý được thực hiện như sau:
j
d(Q, I)= (2)
j 1 Thông qua bước này, ảnh truy vấn sẽ được loại bỏ những
thông tin nhiễu hay những thông tin không cần thiết. Tập ảnh
Return d(Q, I).
thô ban đầu được xử lý lưu trữ dưới các định dạng .JPG,
.JPEG, hay .GIF để giảm độ lớn dung lượng khi lưu vào cơ sở
Nhận xét: Bằng cách sử dụng các khoảng cách tương tự thu dữ liệu ảnh. Kích thước của ảnh cũng được giảm xuống còn
được, các thiết lập hình ảnh sau đó được sắp xếp lại đối với 1x1 cm. Tại công đoạn này ảnh được truy vấn sau loại bỏ
khoảng cách tăng dần của các ảnh lá cây dược liệu mẫu (so nhiễu sẽ được trích rút vector đặc trưng của ảnh và biểu diễn
với hình ảnh truy vấn) và ảnh nào có khoảng cách tương tự so hình ảnh dưới dạng chuỗi dấu hiệu nhị phân.
với ảnh truy vấn nhỏ nhất, nó chính là ảnh giống với ảnh truy Hình 2 dưới đây sẽ minh họa quá trình tiền xử lý ảnh, cụ thể:
vấn nhất. với các tập ảnh thô thu nhận được bằng cách sử dụng máy ảnh,
Trước khi ảnh lá cây dược liệu được cho vào cơ sở dữ liệu ảnh scanner,… Sau đó, chúng ta sử dụng các công cụ như
và ảnh truy vấn, ảnh lá cây sẽ được tiền xử lý. Ảnh lá cây dược Photoshop, Paint,… xử lý các ảnh thô về các ảnh tinh với kích
liệu thu được ở giai đoạn thu nhận ảnh vẫn còn nhiều “nhiễu” thước 1x1 cm để phục vụ cho quá trình nhận dạng và tra cứu
làm cho quá trình nhận dạng ảnh và quản lý phức tạp gây chậm sau này.
hệ thống, do đó cần phải xử lý trước khi trích rút các đặc trưng.
355
355
Hình 2. Tiền xử lý ảnh dữ liệu
- Công đoạn tra cứu được thực hiện như sau:

Người sử dụng cung cấp cho hệ thống ảnh truy vấn thông qua Chuỗi dấu hiệu nhị phân của ảnh truy vấn sẽ được so sánh với
giao diện đồ họa. Sau đó hệ thống phân đoạn ảnh truy vấn chuỗi dấu hiệu nhị phân của các ảnh trong cơ sở dữ liệu. Kết
thành các vùng ảnh và trích rút các véc tơ đặc trưng của các quả trả về là tập các ảnh có độ tương tự với ảnh truy vấn nhất.
ảnh. Tập ảnh kết quả được phân hạng theo thứ tự giảm dần của độ
tương tự.
Hình 3. Hiển thị kết quả tra cứu
Hình 3 ở trên cho biết, với ảnh nguồn đưa vào (Source) và ảnh Đồng thời, hiển thị ra kết quả là các ảnh đích được sắp xếp theo
thứ tự từ ảnh có độ chính xác cao đến độ chính xác thấp hơn so
đích – kết quả cần tìm (Destination). Sau đó, thực hiện tra cứu,
với ảnh nguồn.
trong quá trình thực hiện tra cứu, hệ thống sẽ hiện thị ra độ
tương tự giữa hai ảnh nguồn và đích dưới dạng biểu đồ.
356
356
HộiHội
Thảo Quốc
Thảo Gia
Quốc 2015
ĐiệnTử,
Tử,Truyền
NghệThông
ThôngTinTin (ECIT
(ECIT 2015)
2015)
IV. ĐÁNH GIÁ KẾT QUẢ thấy độ chính xác ứng với số lượng ảnh nguồn là 20; 30;
Chương trình thử nghiệm được xây dựng dựa trên kỹ thuật tra 50 sẽ cho kết quả tương ứng là 52%; 50%; 45%. Như vậy,
cứu ảnh sử dụng dấu hiệu nhị phân của màu. Với kết quả của kỹ với kết quả này khẳng định là độ chính xác của kết quả
thuật tra cứu này sẽ góp phần giúp cho các nhà quản lý, nhà truy vấn là tương đối cao
nghiên cứu dược liệu có những giải pháp nhận dạng, xử lý và Nhận xét: Qua ba nhóm dữ liệu cuả ba nhóm nguồn ảnh thử
phát hiện những cây dược liệu quý một cách nhanh chóng, hiệu nghiệm đầu vào trên, cho thấy qua những lần thử nghiệm khác
quả trên cơ sở những đặc trưng, đặc tính và công dụng của nhau với số lượng ảnh nguồn đầu vào tăng dần khác nhau thì
chúng. kết quả cho thấy độ chính xác trong kết quả nhận dạng, tra cứu
Ảnh lá cây dược liệu đầu vào được thực hiện với các loài cây sẽ giảm dần.
như Rau má, Ráy, Diệp hạ châu,… Mỗi ảnh cần truy vấn sẽ
được thực hiện tối thiểu 3 lần tương ứng với số lượng ảnh lá V. KẾT LUẬN
cây dược liệu nguồn đầu vào lần lượt là 20, 30 và 50 lá.
Bảng 2. Kết quả thực hiện truy vấn Cây dược liệu là một trong những loài cây không chỉ có vai trò
hết sức quan trọng trong chăm sóc sức khỏe cho con người,
Lần Số lượng ảnh Kết quả động vật,… mà còn đem lại giá trị kinh tế cao cho đất nước.
STT Ảnh đầu vào Nhằm tìm kiếm, khai thác, sử dụng, bảo vệ, quản lý, duy trì và
thử nguồn (%) phát triển một cách hiệu cây dược liệu của Việt Nam. Trong
bài báo này, chúng tôi đã nghiên cứu và đề xuất áp dụng kỹ
1 20 98 thuật tra cứu ảnh dựa vào nội dung sử dụng dấu hiệu nhị phân
và véc tơ đặc trưng vào thực hiện truy vấn ảnh lá cây dược liệu.
1 2 Rau má 30 98 Kết quả của bài báo đã đánh giá được tỷ lệ phần trăm độ tương
tự khi thực hiện truy vấn ảnh lá cây dược liệu đối với kho dữ
3 50 97 liệu ảnh mẫu được xây dựng thông qua các công đoạn từ việc
thu thập ảnh, tiền xử lý đến thực hiện trích chon các đặc trưng
1 20 54 của ảnh. Kết quả của bài báo có thể giúp cho các nhà quản lý
xem xét và áp dụng vào quy trình quản lý, bảo tồn các loài cây
2 2 Ráy 30 53 quý hiếm đặc biệt là các loài cây dược liệu quý một cách hiệu
quả hơn.
3 50 47 Kết quả của bài báo đã được cài đặt, thử nghiệm và đánh giá
thông qua hệ thống phần mềm và kết quả cho thấy độ chính
1 20 52 xác cao, bước đầu đã thấy khả quan.
3 2 Diệp hạ châu 30 50 TÀI LIỆU THAM KHẢO
[1] A. Bhardwaj, M. Kaur, and A. Kumar, “Recognition of plants by Leaf Image
3 50 45 using Moment Invariant and Texture Analysis”, International Journal of
Innovation and Applied Studies, Vol. 3, No. 1, pp. 237-248, 2013.
Kết quả truy vấn là tỷ lệ phần trăn độ tương đồng của ảnh truy [2] C. Sari. (2013), “Shape Based Leaf Recognition”, Proceedings of Sistem
ve Kontrol Mühendisli˘gi Bölümü.
vấn với cơ sở dữ liệu ảnh nguồn. Tỷ lệ phần trăm càng lớn có
[3] Đỗ Năng Toàn, Phạm Việt Bình, Xử lý ảnh (Nhà xuất bản Khoa học và
nghĩa là ảnh cây dược liệu cần truy vấn càng giống với bộ ảnh kỹ thuật), 2008.
dữ liệu đầu vào. [4] Đỗ Tất Lợi, Những cây thuốc và vị thuốc Việt Nam, NXB Y Học, 2004.
Trong bảng 2. Minh họa độ chính xác của kết quả thử nghiệm [5] H. Ehsanirad and S. Kumar Y, “Leaf recognition for plant classification
using GLCM and PCA methods”, Oriental Journal of Computer Science
trên ba nhóm dữ liệu đầu vào: & Technology, Vol. 3, No 1, pp. 36-38, 2010.
- Nhóm 1: Ảnh đầu vào là Rau má với ba lần thử nghiệm [6] J. Du, X. Wang and G. Zhang, “Leaf shape based plant species
recognition”, Applied Mathematics and Computation, Vol. 185, No
với số lượng ảnh nguồn khác nhau. Kết quả cho thấy độ 2007, pp. 883-893, 2007.
chính xác ứng với số lượng ảnh nguồn là 20; 30; 50 sẽ cho [7] J. Chaki and R. Parekh, “Plant Leaf Recognition using Shape based
kết quả tương ứng là 98%; 98%; 97%. Như vậy, với kết Features and Neural Network classifiers”, International Journal of
quả này khẳng định là độ chính xác của kết quả truy vấn là Advanced Computer Science and Applications, Vol. 2, No. 10, 2011.
tương đối cao. [8] K. Lee, K. Hong, “Advanced Leaf Recognition based on Leaf Contour
and Centroid for Plant Classification”, International Journal of Bio-
- Nhóm 2: Ảnh đầu vào là Ráy với ba lần thử nghiệm với số Science and Bio-Technology, Vol. 5, No. 2, 2012.
lượng ảnh nguồn khác nhau. Kết quả cho thấy độ chính [9] N.Valliammal and Dr.S.N.Geethalakshmi, “Automatic Recognition
xác ứng với số lượng ảnh nguồn là 20; 30; 50 sẽ cho kết System Using Preferential Image Segmentation For Leaf And Flower
Images”, Computer Science & Engineering: An International Journal
quả tương ứng là 54%; 53%; 47%. Như vậy, với kết quả (CSEIJ), Vol.1, No.4, 2011.
này khẳng định là độ chính xác của kết quả truy vấn là cao. [10] S. R Raj, V. R Patil, P.S Jaiswal, N. Subhash, Plant regeneration from
leaf explants of mature sandalwood (Santalum album L.) trees under in
- Nhóm 3: Ảnh đầu vào là Diệp Hạ Châu với ba lần thử vitro conditions. In Vitro Cell. Dev. Biol. Plant 49, 216–222, 2013.
nghiệm với số lượng ảnh nguồn khác nhau. Kết quả cho
357
357
Thiết kế chế tạo thiết bị sưởi ấm máu và dịch truyền

Nguyễn Phan Kiên(1,*) , Đỗ Thị Thu Hằng(3), Truong Duc Thuan(2)
(1)
Viện Điện tử Viễn thông, Đại học Bách Khoa Hà Nội
(2)
Trường Cao đẳng nghề Kỹ thuật thiết bị y tế
(3)
Bệnh viện Đa khoa tỉnh Bắc Giang
Email: knguyenp@gmail.com, thuan.omronbg@gmail.com, hangdtt.be5@gmail.com
Abstract- Phương pháp đông lạnh hồng cầu giúp dự trữ với một một thể tích lớn cho bệnh nhân có nhóm máu bất kỳ nào mà
lượng máu lớn trong thời gian lâu hơn (tối đa tới 10 năm) [1].. không sợ nguy hiểm do tai biến truyền nhầm nhóm máu vì các
Chế phẩm máu lưu trữ bằng phương pháp này có thể truyền một kháng thể α, β còn lại rất ít và bị phá hủy trong thời gian dự trữ.
thể tích lớn cho bệnh nhân có nhóm máu bất kỳ mà không sợ Tuy nhiên đi kèm phương pháp này cần thiết phải có thiết bị
nguy hiểm do tai biến truyền nhầm nhóm máu vì các kháng thể sưởi ấm máu, dịch truyền. Bài báo này tập trung nghiên cứu
α, β còn lại rất ít và bị phá hủy trong thời gian lưu trữ [2]. Tuy
thiết kế thiết bị sưởi ấm máu và dịch truyền dùng thuật toán
nhiên máu lưu trữ bằng phương pháp này muốn truyền cho bệnh
nhân nhất thiết phải sưởi ấm lên nhiệt độ 37 độ C [3]. Vì vậy PID điều khiển nhiệt độ đầu ra.
phương pháp này cần thiết phải có thiết bị sưởi ấm máu, dịch
II. PHƯƠNG PHÁP
truyền. Bài báo này tập trung nghiên cứu thiết kế thiết bị sưởi
ấm máu và dịch truyền sử dụng thuật toán PID để điều khiển Bộ điều khiển PID là một bộ điều khiển vòng kín được sử
nhiệt độ đầu ra của dịch truyền dựa trên một số tiêu chuẩn an dụng rộng rãi trong các lĩnh vực điện tử. Sử dụng bộ điều
toàn trong lĩnh vực y tế [3], đáp ứng được yêu cầu chức năng của khiển PID để điều chỉnh sai lệch giữa giá trị đo được của hệ
thiết bị. Thêm vào đó, vi điều khiển PIC 18F4550 là một lựa chọn thống (process variable) với giá trị đặt (setpoint) bằng cách
hợp lý về tính đa chức năng và giá thành; ứng dụng Peltier
tính toán và điều chỉnh giá trị điều khiển ở ngõ ra.
Cooler đem lại việc gia nhiệt một cách đơn giản và hiệu quả, tuổi
thọ cao. Dựa trên những cơ sở đó, nhóm nghiên cứu đã đưa ra
Sơ đồ một hệ thống điều khiển dùng PID:
thiết kế hoàn chỉnh và chế tạo thành công thiết bị sưởi ấm máu Một bộ điều khiển PID gồm 3 thành phần: P (proportional) –
và dịch truyền đảm bảo nhiệt độ đầu ra không vượt quá ngưỡng tạo tín hiệu điều khiển tỉ lệ với sai lệch (error – e), I (integral)
37 độ C hoàn toàn phù hợp với các tiêu chuẩn của thiết bị sưởi
– tạo tín hiệu điều khiển tỉ lệ với tích phân theo thời gian của
ấm máu và dịch truyền trên thế giới. Điều này kết hợp với cách
sử dụng thiết bị đơn giản mang lại khả năng ứng dụng rộng rãi sai lệch, và D (derivative) – tạo tín hiệu điều khiển tỉ lệ với vi
của thiết bị. phân theo thời gian của sai lệch.
Keywords- sưởi ấm máu, PID, vi điều khiển, ổn định nhiệt độ,

huyết học và truyền máu.
I. GIỚI THIỆU
Hàng ngày, hàng giờ do những nguyên nhân khác nhau như
bệnh lý, chấn thương, phẫu thuật,… có hàng nghìn nguời cần
được truyền máu. Trong khi máu người được coi là một loại
“thuốc” đặc biệt mà hiện nay chưa có chế phẩm nào thay thế Hình 1 Sơ đồ hệ thống điều khiển PID
được. Vì vậy, để có máu truyền điều trị và cứu sống bệnh nhân
cần huy động từ những người tham gia hiến máu. Máu nhận Khâu P tạo ra tín hiệu điều khiển tỉ lệ với giá trị của sai
được từ người hiến máu (máu toàn phần) tới bệnh nhân phải lệch.Việc này được thực hiện bằng cách nhân sai lệch e với
trải qua quá trình sàng lọc, ly tâm, phân tích thành phần hằng số KP – gọi là hằng số tỉ lệ.
máu,… tạo ra các chế phẩm máu. Sau đó các chế phẩm máu
này phải được bảo quản ở nhiệt độ từ 2 đến 6oC (tùy loại chế Khâu P được tính dựa trên công thức (1):
phẩm). Tuy nhiên máu bảo quản ở nhiệt độ này có hạn sử dụng Pout  K p e(t )
rất ngắn, do đó một phương pháp bảo quản máu mới được
nghiên cứu áp dụng có thể bảo quản trong vòng 3 năm đó là lấy Pout: giá trị ngõ ra
máu toàn phần sau đó tách hồng cầu ra khỏi huyết tương, cho
KP: hằng số tỉ lệ
hồng cầu vào dung dịch glyxerol sau đó cất giữ ở nhiệt độ -700
đến -800 oC, khi nào dùng thì sưởi ấm lên 37oC [4], tách rửa e: sai lệch: e = SP – PV
hồng cầu rồi sử dụng. Rõ ràng phương pháp bảo quản này
mang lại rất nhiều lợi ích như: tiết kiệm và tận dụng triệt để Sơ đồ khối của khâu P:
lượng máu được thu gom. Phương pháp này cũng có thể dự trữ
với một lượng máu lớn trong thời gian lâu hơn. Có thể truyền
ISBN: 978-604-67-0635-9 358

358
Khâu I thường đi kèm với khâu P, hợp thành bộ điều khiển

PI.Nếu chỉ sử dụng khâu I thì đáp ứng của hệ thống sẽ chậm
và thường bị dao động.
Hàm truyền (2): Hình 3 chỉ ra sự khác biệt giữa khâu I và PI. Ta có thể nhận
thấy là khâu I làm cho đáp ứng của hệ thống bị chậm đi rất
Gp ( s)  K P nhiều, còn khâu PI giúp triệt tiêu sai số xác lập.
Khâu D cộng thêm tốc độ thay đổi sai số vào giá trị điều
Nếu chỉ có khâu P thì trong mọi trường hợp sai số tĩnh luôn
khiển ở ngõ ra.Nếu sai số thay đổi nhanh thì sẽ tạo ra thành
xuất hiện, trừ khi giá trị đầu vào của hệ thống bằng 0 hoặc đã
phần cộng thêm vào giá trị điều khiển.Điều này cải thiện đáp
bằng với giá trị mong muốn.Trong hình sau thể hiện sai số
tĩnh xuất hiện khi thay đổi giá trị đặt. ứng của hệ thống, giúp trạng thái của hệ thống thay đổi nhanh
chóng và mau chóng đạt được giá trị mong muốn.
Khâu D được tính theo công thức:
de (1)
Dout  K d
dt
Dout: ngõ ra khâu D
KD: hệ số vi phân
e: sai số: e = SP – PV
Sơ đồ khối khâu D:
Hình 2: Đáp ứng khâu P
Nếu giá trị khâu P quá lớn sẽ làm cho hệ thống mất ổn định.
Khâu I cộng thêm tổng các sai số trước đó vào giá trị điều
khiển. Việc tính tổng các sai số được thực hiện liên tục cho Hàm truyền:
đến khi giá trị đạt được bằng với giá trị đặt, và kết quả là khi
hệ cân bằng thì sai số bằng 0. U ( s) (2)
G
 (s)  Kd s
Khâu I được tính theo công thức (3): E ( s)
t
Khâu D thường đi kèm với khâu P thành bộ PD, hoặc với PI
I
out K i  e( ) d  để thành bộ PID.
0
Iout: giá trị ngõ ra khâu I

Ki: hệ số tích phân
e: sai số: e = SP – PV
Sơ đồ khối khâu I:
Hình 4: Đáp ứng khâu D và PD
Theo hình trên, bộ PD tạo đáp ứng có thời gian tăng trưởng
nhỏ hơn so với bộ P. Nếu giá trị D quá lớn sẽ làm cho hệ
thống không ổn định.
Rời rạc hóa bộ điều khiển PID
Bộ điều khiển số không thể lấy mẫu liên tục theo thời gian, nó
Hình 3: Đáp ứng của khâu I và PI cần được rời rạc ở một vài mức. Khi cho hệ số lấy mẫu ngắn
bên trong thời gian vi phân có thể đạt được xấp xỉ một sai
Hàm truyền (4):
phân có giới hạn và tích phân qua việc lấy tổng. Chúng ta sẽ
U (s) K I 1
G (
s)   quan tâm mỗi dạng ở một thời điểm, và sai số được tính ở mỗi
E ( s) s Ti s khoảng lấy mẫu theo công thức (7):
e
(n) X (n)  Y (n)
Bộ PID rời rạc đọc sai số, tính toán và xuất ngõ ra điều khiển
theo một khoảng thời gian xác định (không liên tục) – thời
359
359
HộiHội Thảo Quốc Gia 2015 về Điện Tử, Truyền Thông và Công Nghệ Thông Tin (ECIT 2015)
gian lấy mẫu T. Thời gian lấy mẫu cần nhỏ hơn đơn vị thời Trong đó:
gian của hệ thống. Khối nguồn: Cấp nguồn cho khối điều khiển và khối gia nhiệt
và toàn bộ mạch. Trong thiết kế này, nguồn được thiết kế đơn
Không giống các thuật toán điều khiển đơn giản khác, bộ điều
giản dựa trên việc sử dụng IC ổn áp nguồn.
khiển PID có khả năng xuất tín hiệu ngõ ra dựa trên giá trị
Khối cảm biến (sử dụng cảm biến đo nhiệt độ NTC MF58)
trước đó của sai số cũng như tốc độ thay đổi sai số. Điều này
chịu trách nhiệm thu nhận tín hiệu nhiệt độ tại tấm gia nhiệt để
giúp cho quá trình điều khiển chính xác và ổn định hơn.
làm cơ sở thực hiện các thuật toán PID trong mạch điều khiển.
Khối gia nhiệt trong hệ thống được thực hiện bằng nhôm và
gia công trên máy CNC (Spinner TD42-Triplex, Hãng sản
xuất: SPINNER, Germany). Gia nhiệt cho tấm nhôm sử dụng
pentier cooler (TEC1-12706, HB) công suất nhỏ nhằm đảm
bảo tốc độ gia nhiệt cũng như các yếu tố về công suất tiêu thụ
cho thiết bị. Đây là tấm gia nhiệt có dòng thấp nhưng đảm bảo
đủ khả năng cung cấp nhiệt cho thiết bị
Khối điều khiển: Lấy nhiệt độ đầu vào từ khối cảm biến và
điều chỉnh mức độ gia nhiệt của khối gia nhiệt. Khối điều
khiển được thiết kế dựa trên nền vi điều khiển PIC18F4550
Hình 5: Sơ đồ khối PID (Microchip, Mỹ). Thuật toán điều khiển ứng với điều khiển
PID trong vi điều khiển sẽ được đề cập trong phần sau.
Hàm truyền của hệ thống: Sau khi thiết kế, mạch nguyên lý tổng thể của máy được chỉ ra
trong hình 7.
u  1  (3)
( s) H ( s) K P 1   Td s 
s  Ti s 
Hàm chuyển đổi:
 1
t
de(t )  (4)
K P  e(t )   e( )d  TD
u (t )  
 Ti 0 dt 
Tính gần đúng theo công thức:

t n
(5) Hình 7: Mạch nguyên lý cho máy
 e  d  T  e  k 
0 k 0
B. THIẾT KẾ CHI TIẾT CƠ KHÍ
de  t  e  n   e(n  1) (6)

dt T
t  nT (với n là bước rời rạc tại t.)

Kết quả thu được:
n
(7)
 K Pe  n   K I  e  k   K D  e  n   e  n  1 
u  n
k 0
Với: K  K PT KD 
K PTd
i
TI T
III. PHÂN TÍCH VÀ THIẾT KẾ HỆ THỐNG

A. THIẾT KẾ MẠCH ĐIỀU KHIỂN Hình 8: Mô hình thiết bị khi lắp tấm gia nhiệt
Để thiết kế thiết bị sưởi ấm máu và dịch truyền thì các khối Thiết kế cơ khí của thiết bị được chỉ ra trong hình 8. Trong
của thiết bị được chỉ ra trong hình vẽ sau : thiết kế này, dây truyền dịch sẽ được đặt trong rãnh dây truyền
dịch từ đầu vào đến đầu ra, cho phép dịch được sưởi ấm trong
cả khoảng cách truyền.
Trên thực tế, vỏ thiết bị ban đầu được thiết kế bằng vỏ gỗ do
dễ dàng chế tạo và phù hợp với điều kiện thử nghiệm ban đầu
so với thiết kế vỏ nhựa. Việc đầu tư chế tạo vỏ nhựa cho thiết
bị sẽ được đầu tư trong tương lai khi thiết bị hoạt động thử
nghiệm tốt trong quá trình ứng dụng thực tế.
Hình 6: Sơ đồ khối thiết bị
360
360
Mặt khác, để nâng cao hiệu quả gia nhiệt và tăng tốc độ gia
nhiệt của thiết bị, rãnh đặt dây truyền dịch cũng có thể được
kéo dài theo như thiết kế trong hình 9. Tuy nhiên, trong phiên
bản đầu tiên, thiết kế rãnh truyền được sử dụng như trong mô
hình hình 8.
Hình 12: Đồ thị quá trình xác lập điều khiển PID
Sai số xác lập: Sai lệch của đáp ứng so với giá trị đặt => Lựa
chọn xác định các hệ số theo phương pháp Ziegler – Nichols2
Nguyên tắc cân chỉnh dựa theo bảng:
Bảng 1: Bảng căn chỉnh hệ số
Đáp ứng Thời Thời gian Sai số
Độ vọt lố
Hình 9: Bản vẽ chi tiết của tấm gia nhiệt vòng kín gian lên xác lập xác lập
Thay đổi
C. Thuật toán điều khiển. Tăng Kp Giảm Tăng Giảm
nhỏ
Thuật toán PID là thuật toán cổ điển trong nền điều khiển tự Giảm Ti Giảm Tăng Tăng Loại Bỏ
động. Như đã trình Thay đổi Thay đổi
bày ở phần cơ sở lý Tăng Td Giảm Giảm
PID Controller nhỏ nhỏ
thuyết. Trong thiết
kế này, để kiểm soát Chọn Kp trước tiên (cho đến mức đáp ứng hệ thống không thể
nhiệt độ tấm gia Error = SP - PV
tốt hơn) tiếp theo cân chỉnh Kd để giảm độ vọt lố và giảm thời
nhiệt thiết kế này đã gian xác lập, và cuối cùng cân chỉnh Ki để giảm thiểu sai số
ứng dụng thuật toán P_term = Kp * Error
xác lập.
điều khiển PID. Tuy
nhiên, do sử dụng vi IV. KẾT QUẢ THỰC NGHIỆM
điều khiển để tính I_term = Ki * SumE
Sau khi thực hiện chế tạo thiết bị theo các thiết kế trên, thiết bị
toán và xác lập các được thử nghiệm thông qua quá trình xác định các hệ số K để
thông số P, I, D cho đảm bảo khống chế được thông số đầu ra đạt như mong muốn.
D_term = Kd * (Error – Pre_error)
hệ thống, vi điều
khiển sẽ sử dụng Các kết quả thực nghiệm về xác định các tham số điều khiển,
thuật toán như trong PID = P_term + I_term + D_term
kết quả khảo sát nhiệt độ dịch truyền tại đầu ra của thiết bị và
hình 11. Áp dụng đưa ra đánh giá.
giải thuật PID vào Xác định Kp
bài toán kiểm soát PID_out = 0 <= PID <= 255
nhiệt độ của máy Dựa vào các yêu cầu bài toán việc xác định Kd dựa vào thực
sưởi ấm dịch truyền. nghiệm. Phương pháp xác định cho Kd=1÷10 và các hệ số
Trong hình 11, các
Update PWM Ki=Kd=0. Nhận xét kết quả và lựa chọn thông số thích hợp.
thông số tính toán Hình 11: Lưu đồ chương trình
cho PID được thực PID
hiện như sau. Đầu
tiên tính toán giá trị sai số e, sau đó tính toán các giá trị P, tính
toán giá trị I. tính toán các giá trị D. Từ các giá trị tính toán
này, phần mềm vi điều khiển sẽ tính toán giá trị PID và từ đấy
để đưa ra các thông số cập nhật cho quá trình điều khiển của vi
điều khiển (sử dụng phương pháp băm xung-PWM).
Tuy nhiên, các hệ số Ki, Kp, Kd cần được xác định một cách
rõ ràng đối với việc ứng dụng trong lưu đồ thuật toán PID của Hình 13: Biểu đồ so sánh hệ số Kd dựa trên độ vọt lố và thời
vi xử lý, trong đó các thông số và ý nghĩa của việc tăng giảm gian xác lập
các hệ số K được chỉ ra trong bảng 1trong đó các khái niệm
đáp ứng hệ thống được mô tả như sau: Chọn Kd = 0.4 do có sự cân đối giữa độ vọt lố và thời gian
Thời gian lên: Là khoảng thời gian hệ thống đạt được giá trị đáp ứng (độ vọt lố nhỏ, thời gian xác lập nhỏ)
xác lập. Xác định Ki
Độ vọt lố: giá trị sai lệch lớn nhất của đáp ứng thực so với giá
Xác định hệ số Ki bằng thực nghiệm vói Kp=6 và Kd=0.2.
trị đặt mong muốn
Qua thực tế nghiên cứu đo đạc và so sánh, lựa chọn Ki = 0.2
Thời gian xác lập: Thời gian để hệ thống đạt được độ ổn định
do ít làm thay đổi các yếu tố như độ vọt lố, thời gian xác lập
361
361
và loại bỏ được sai số xác lập. Đồ thị thu được tương đối qua đã hỗ trợ tinh thần và vật chất cho dự án được thực hiện
phẳng. thành công.
Ki=0.2 TÀI LIỆU THAM KHẢO
[1] Valeri, C. R., et al. "An experiment with glycerol-frozen red blood cells
stored at–80 C for up to 37 years." Vox sanguinis 79.3 (2000): 168-174.
[2] J. Lecak, K. Scott, C. Young, J. Hannon, J.P. Acker “Evaluation of red
blood cells stored at -80◦C in excess of 10 years”. The Department of
Laboratory Medicine and Pathology, University of Alberta; and
Canadian Blood Services, Research and Development, Edmonton,
Alberta, Canada.
[3] TT.26.2013.TT – BYT ngày 16 – 9 – 2013.
[4] Lecak, J., Scott, K., Young, C., Hannon, J., & Acker, J. P. (2004).
Hình 14: Đồ thị nhiệt độ tấm gia nhiệt theo thời gian với hệ Evaluation of red blood cells stored at− 80 C in excess of 10
years. Transfusion, 44(9), 1306-1313.
số Ki= 0.2
[5] Tú Kim, Giới thiệu thuật toán điều khiển PID [Online]. Available:
http://vi.scribd.com/doc/73335013/GIỚI-THIỆU-THUẬT-TOAN-
Kết quả thực nghiệm nhiệt độ dịch truyền đầu ra ĐIỀU-KHIỂN-PID.
Phương án thực hiện đo: Đặt nhiệt độ tấm gia nhiệt từ 37 độ C [6] ELLTECco.LTD, Blood warmer ANIMEC AM-2S, Japan 9 – 2001.
và tăng dần nhiệt độ tấm gia nhiệt đến nhiệt độ nào mà kết quả [7] MICROCHIP, PIC18F2455/2550/4455/4550 Data Sheet.
nhiệt độ dịch truyền ra đạt gần 37 0C với tốc độ truyền thấp
nhất là 1ml/phút.
Kết quả thu được: Nhiệt độ tấm gia nhiệt để kết quả đầu ra đạt
gần 370C. Các kết quả thực nghiệm đo được cho thấy với nhiệt
độ tấm gia nhiệt là 400C thì nhiệt độ dịch đầu ra ở nhiệt độ gần
Hình 16: Đồ thị quan hệ giữa nhiệt độ và tốc độ truyền
Hình 15: Nhiệt độ dịch truyền ra với nhiệt độ tấm gia nhiệt 400C
370C nhất.
Từ đồ thị sự phụ thuộc của nhiệt độ dịch truyền ở đầu ra vào
tốc độ truyền dịch ở trên, ta thấy rằng, ở mỗi một tốc độ thì
nhiệt độ đầu ra tương đối ổn định và trong phạm vi cho phép
theo yêu cầu thiết kế ban đầu.
Thiết bị sưởi ấm dịch truyền do nhóm nghiên cứu thiết kế đã
được chế tạo hoàn chỉnh đảm bảo chức năng sưởi ấm máu và
dịch truyền tại dải nhiệt độ làm ấm cho phép (37 độ C). Có thể
điều khiển nhiệt độ tấm gia nhiệt ổn định; thời gian quá độ
thấp. Nhiệt độ đầu ra ổn định đáp ứng yêu cầu. Tấm gia nhiệt
được gia công chi tiết chính xác và cho hiệu quả truyền nhiệt
tốt.
Thiết bị được thiết kế chế tạo có đủ các chức năng thu nhận,
điều khiển, cảnh báo. Ngoại hình nhỏ gọn dễ sử dụng và lắp
đặt. Tiết kiệm năng lượng và an toàn trong quá trình hoạt
động. Trong tương lai, nhóm nghiên cứu sẽ tiếp tục hoàn thiện
mẫu mã sản phẩm, song song với việc xin giấy phép để thử
nghiệm thiết bị trong lâm sàng và thực hiện các thủ tục đăng
ký để cho phép lưu hành thiết bị trong thực tế khám chữa bệnh
ở Việt Nam.
LỜI CẢM ƠN
Nhóm nghiên cứu xin gửi lời cảm ơn chân thành tới công ty
TNHH Công nghệ ứng dụng Bách Khoa trong suốt thời gian
362
362
HộiHội
Thảo Quốc
Thảo Gia
Quốc Gia2015
2015về
vềĐiện
Điện Tử,
Tử,Truyền
Nghệ Thông
Thông TinTin (ECIT
(ECIT 2015)
2015)
Một phương pháp đo đạc tính chất điện môi cho chất
lỏng tổn hao cao ở tần số vi ba
Nguyễn Đạt Sơn, Lâm Tấn Phát và Lê Nguyên Ngân
Phòng thí nghiệm công nghệ Nano,
Đại học quốc gia Thành phố Hồ Chí Minh
Email: ndson@vnuhcm.edu.vn, ltphat@vnuhcm.edu.vn, lnngan@vnuhcm.edu.vn
Abstract — Trong bài báo này, một phương pháp linh hoạt và chi đạc tính chất điện môi của vật liệu, đặc biệt là chất lỏng có tổn
phí thấp cho phép đo đạc hằng số điện môi của các chất lỏng tổn hao lớn hoặc các loại thực phẩm theo thời gian nhằm tích hợp
hao cao dựa trên phương pháp hốc cộng hưởng chữ nhật đã được vào các ứng dụng như mạng cảm biến không dây hoặc hệ
trình bày. Phương pháp đề nghị được thử nghiệm trên các phép thống RFID nhằm quản lý chất lượng theo thời gian thực là rất
đo đạc của chế độ truyền sóng TE101 với chất lỏng tiêu chuẩn và
cần thiết [11-12]. Tuy nhiên, việc sử dụng hốc cộng hưởng để
so sánh với các dữ liệu chuẩn được đề cập trong các công trình
liên quan. Các kết quả thu được cho thấy sai số phép đo của đo đạc hằng số điện môi tương đối của chất lỏng vẫn còn gặp
phương pháp đề nghị có thể được giảm với thể tích chất lỏng tối rất nhiều khó khăn do cần phải sử dụng các vật liệu hỗ trợ để
ưu trong các phép đo. Ngoài ra, những hạn chế và thảo luận về cố định chất lỏng khi đặt vào bên trong hốc. Vật liệu hỗ trợ này
hướng phát triển tiếp theo của phương pháp đề nghị cho các ứng có thể làm thay đổi độ chính xác của các thông số đo được
dụng thực tế cũng được trình bày trong báo cáo này. cũng như làm thay đổi kết quả tính toán sau cùng. Do đó,
chúng tôi đề nghị một kỹ thuật mới nhằm đo đạc hằng số điện
Keywords- Hốc cộng hưởng chữ nhật; chế độ truyền sóng môi phức của các chất lòng ở tần số vi ba dựa trên phương
TE101; tần số vi ba; hằng số điện môi phức; chất lỏng tổn hao cao pháp hốc cộng hưởng truyền thống như một giải pháp linh
động và tiết kiệm chi phí trong các ứng dụng thực tế.
I. GIỚI THIỆU Phần còn lại của bài báo được trình bày như sau: trong phần
Những năm gần đây, các kỹ thuật đo đạc tính chất điện môi II, chúng tôi miêu tả các lý thuyết cũng như khái niệm cơ bản
của vật liệu ngày càng thu được mối quan tâm lớn từ các nhà cho hướng tiếp cận của phương pháp đề nghị trong báo cáo.
khoa học và được ứng dụng nhiều hơn do độ chính xác cao Trong phần III, chúng tôi trình bày các kết quả thực nghiệm
cũng như tính đơn giản cho cấu hình đo đạc các đặc tính vật cũng như thảo luận phân tích. Cuối cùng, chúng tôi kết luận về
liệu như các phương pháp sử dụng ống dẫn sóng (waveguide các kết quả thu được cũng như hướng phát triển tiếp theo trong
cavity) và bộ cộng hưởng dựa trên mạch in (printed-line phần IV.
resonator). Một số kỹ thuật đo đạc hằng số điện môi tương đối
II. CÁC KHÁI NIỆM CƠ BẢN
hiện nay có thể được phân loại chủ yếu: phương pháp truyền-
phản xạ (transmission-reflection), phương pháp không gian tự Hằng số điện môi tương đối hay còn gọi là hằng số điện
do (free space) và phương pháp cộng hưởng (resonance môi phức là tiêu chuẩn để đánh giá mức độ phản ứng của một
techniques) [1-10]. vật liệu khi được đặt trong một điện trường E. Thông thường,
Các hốc cộng hưởng hình chữ nhật và hình trụ đã được sử hằng số điện môi phức thường được biểu diễn dưới dạng:
dụng rộng rãi trong một thời gian dài trong việc đo đạc hằng số   r'  j r" (1)
r
điện môi của các vật liệu tổn hao thấp ở dạng rắn [2-5] do hệ số
Trong đó:  r và  r lần lượt là hằng số điện môi và hệ số
' "
phẩm chất cao của các phương pháp này. Kỹ thuật hốc cộng
hưởng (resonant cavity techniques) thường được sử dụng để đo tổn hao của vật liệu điện môi.
lường hằng số điện môi phức của các loại vật liệu điện môi
khác nhau ở tần số vi sóng (microwave). Rất nhiều bài báo và
những công trình nghiên cứu tập trung vào các vấn đề đánh giá
hằng số điện môi tương đối của chất lỏng cũng như các khía
cạnh khác nhau của phương pháp đo đạc [2-5]. Ưu điểm của
hốc cộng hưởng là cấu hình đơn giản và dễ chế tạo hơn so với
các phương pháp khác, điều này làm cho chi phí của phương
pháp này là tôi ưu hơn so với các phương pháp khác như không
gian tự do hay đầu dò đồng trục.
Trong thực tế, các đặc tính của các loại vật chất lỏng, đặc
biệt là các chất lỏng có tổn hao cao, luôn luôn có rất nhiều triển
vọng và ứng dụng quan trọng trong các ngành công nghiệp
sinh học và thực phẩm. Việc nghiên cứu các phương pháp đo Hình 1. Các kích thước của hốc cộng hưởng hình chữ nhật [2]
ISBN: 978-604-67-0635-9 363
363
phẩm chất Q. Trong trường hợp này, một số công trình nghiên
cứu đề nghị sử dụng phương pháp con trỏ [6], một phương
pháp để xác định hằng số điện môi phức dựa trên phương
pháp thử tiêu chuẩn. Theo đó, công thức để tính toán hệ số
phẩm chất Q được đưa ra như sau:
f o  BW ( )
Q (5)
f 2 ( )  f1 ( )
BW
 ( ) 10 /10  1 (6)
Trong đó, BW(α) là băng thông của S21 tại giá trị α dB và
f0 là tần số trung tâm của băng thông. Từ các công thức trên,
Hình 2. Nguyên lý của phương pháp đo đạc dùng hốc cộng hưởng chúng ta có thể xác định được hằng số điện môi tương đối của
Trước tiên, chúng ta hãy cùng xem xét trường điện từ bên chất lỏng hay các vật liệu cần đo đạc.
trong một hốc cộng hưởng hình chữ nhật (Hình 1). Các chế độ Từ những thông số và các công thức sẵn có ở trên, chúng
của sóng điện từ có thể truyền bên trong hốc cộng hưởng là ta có thể tính được các tần số cộng hưởng cho các mode TE
TE hoặc TM. Tần số cộng hưởng của các chế độ truyền sóng đầu tiên. Khi chúng ta đặt mẫu điện môi bên trong hốc cộng
TEmnp (được đánh thứ tự theo các chỉ số m, n, p) được tính hưởng, sự suy hao điện trường của các mode không chiếm ưu
theo các kích thước a, b và d như phương trình sau [2]: thế (các mode có tần số cộng hưởng cao hơn mode chiếm ưu
2 2 2 thế TE101) sẽ lớn hơn và các mode cao hơn cũng có tần số
c m n  p cộng hưởng gần nhau hơn dẫn đến việc xác định hằng số điện
( f r )mnp        (2)
2 r  r  a  b d  môi thông qua hệ số S21 sẽ trở nên phức tạp hơn. Do đó, đa số
Trong đó: a, b, d lần lượt là chiều rộng, chiều cao và chiều các phương pháp hốc cộng hưởng đều tập trung vào mode ưu
dài của hốc cộng hưởng. m, n, p là các chỉ số gắn với các thế TE101 để xác định hằng số điện môi tương đối của mẫu
mode dọc theo các phương x, y, z điện môi. Từ độ dịch chuyển tần số cộng hưởng và hệ số phẩm
Một thông số khác cũng khá quan trọng với phương pháp chất (Q-factors) trong 2 trường hợp có và không có mẫu điện
hốc cộng hưởng là hệ số phẩm chất Q cho phép chúng ta xác môi bên trong hốc cộng hưởng, hằng số điện môi tương đối
định các tổn hao điện từ bên trong hốc cộng hưởng. Như đã của vật liệu cần đo có thể được xác định thông qua các công
nói ở trên, năng lượng tích trữ bên trong hốc cộng hưởng sẽ thức sau [13]:
được hấp thụ một phần bởi vật liệu điện môi. Sự thay đổi này  f o  f s  2Vo 
biểu hiện ở độ dời tần số cộng hưởng và cả sự suy giảm hệ số  r'  1    (7)
phẩm chất (Hình 2). Các giá trị phần thực và phần ảo của  f s  Vs 
hằng số điện môi phức của vật liệu đo đạc có thể được rút ra
 1 1  V 
từ sự dịch chuyển tần số cộng hưởng và sự thay đổi của hệ số  r"    o 
 (8)
phẩm chất (hệ số Q) của hốc cộng hưởng khi các mẫu vật liệu
đo đạc được đặt vào bên trong.
 Qs Qo  Vs 
Theo Pozar [2], chúng ta có thể biểu diễn hệ số phẩm chất Trong đó: f0 và fs lần lượt là tần số cộng hưởng của thông
của chế độ truyền sóng chiếm ưu thế (TE101) bên trong hốc số S21 (insertion loss) trong trường hợp không có và có mẫu
cộng hưởng theo các kích thước của nó: vật liệu đo đạc bên trong hốc cộng hưởng. Q0 và Qs lần lượt là
hệ số phẩm chất trong trường hợp không có và có mẫu vật liệu
TE   b(a 2  d 2 )3/2  đo đạc bên trong hốc cộng hưởng. Vo và Vs lần lượt là thể tích
Q101   2 2 3 3  (3) của hốc cộng hưởng và thể tích của mẫu vật liệu cần đo.
Rs  ad (a  d )  2b(a  d )  Như đã trình bày ở trên, các phương pháp nhanh gọn, cấu
Trong đó:  là trở kháng trong không gian tự do và bằng hình đơn giản và chi phí thấp để xác định và đánh giá chất
120π. Rs là điện trở bề mặt của hốc cộng hưởng. lượng thực phẩm nhằm cung cấp một hệ thống hoặc cơ chế
Với 2 phép đo khác nhau trong trường hợp có và không kiểm soát chất lượng hiệu quả trong quá trình phân phối thực
có mẫu bên trong hốc cộng hưởng hình chữ nhật, sự thay đổi phẩm thu được sự quan tâm rất nhiều trong công nghiệp. Tuy
tần số gây ra bởi sự xuất hiện của mẫu vật liệu được thể hiện nhiên, các phương pháp phổ biến dùng để đo đạc hằng số điện
như sau [4] : môi tương đối như hốc cộng hưởng thường khó áp dụng cho
các mẫu dạng lỏng như thực phẩm trong khi các phương pháp
đo đạc bằng đầu dò đồng trục hay không gian tự do vẫn còn
khá đắt tiền. Mục tiêu của nhóm nghiên cứu là xây dựng một
phương pháp đơn giản, giá thành thấp để đo đạc tính chất điện
môi của các loại vật liệu lỏng dựa trên phương pháp hốc cộng
Tuy nhiên, khi mẫu đo đưa vào hốc cộng hưởng là vật liệu hưởng truyền thống.
tổn hao cao, việc quan sát băng thông nửa công suất (-3dB) từ Kỹ thuật đo đạc bằng phương pháp hốc cộng hưởng
các dữ liệu đo S21 là rất khó khăn và rất khó để có được hệ số thường yêu cầu mẫu vật liệu phải đủ nhỏ vì khi đó trường điện
364
364
Hình 3. Cấu hình đo đạc hằng số điện môi của chất lỏng bằng
phương pháp hốc cộng hưởng
từ bên trong hốc cộng hưởng mới có thể được xem như là
không đổi trong thể tích bên ngoài mẫu vật liệu. Theo đó,
thông thường mẫu đo cần có chiều dài tương đương chiều dài
của hốc cộng hưởng do chiều dài của hốc cộng hưởng thường
tỷ lệ thuận với chiều dài bước sóng ở tần số tương ứng [14].
Yêu cầu này khiến cho việc đo đạc các mẫu vật liệu lỏng hoặc
dạng keo ở các tần số thấp trở nên khó khăn. Bên cạnh đó,
mẫu vật liệu cũng cần phải có bề dày không quá lớn để các
Hình 4. Đo đạc hằng số điện môi của chất lỏng bằng phương pháp
mode trường điện từ có thể tương tác hiệu quả với mẫu đo và
hốc cộng hưởng
không ảnh hưởng quá nhiều lên kết quả sau cùng. Do vậy, việc
ứng dụng phương pháp hốc cộng hưởng này cho các mẫu vật trong lần lượt là 74mm, 150mm và 26 mm như Hình 3. Hốc
liệu như chất lỏng là rất khó khăn. Để giải quyết các vấn đề cộng hưởng sẽ được kết nối với thiết bị Vector Network
này, một số phương pháp cải thiện đã được đề xuất và thảo Analyzer HP 8720D có tầm đo từ 50MHz tới 20GHz để đo
luận trong các công trình liên quan [15]. đạc như Hình 5. Tất cả các kết quả đo đều được thực hiện ở
Từ tài liệu tham khảo [16-17], mẫu đo cần được đặt ở nhiệt độ phòng là 25oC.
trung tâm của hốc cộng hưởng để tối đa tương tác với trường Sự tương đồng giữa kết quả mô phỏng trên phần mềm
điện từ bên trong (Hình 3). Khi đó, hằng số điện môi của mẫu CST Microwave Studio® và kết quả đo đạc thực tế với hốc
vật liệu cần đo sẽ được tính theo công thức: cộng hưởng được trình bày như trong Hình 6. Khi chúng ta
đặt chén đựng chất lỏng (PTFE) vào bên trong khoang cộng
 f o  f s  2Vo  hưởng, các tính chất điện từ và hình dạng của chén (độ dày
 r'  1 k '    (9) của chén PTFE là 2 mm) làm dịch chuyển tần số cộng hưởng
 f s  Vs  của chế độ truyền TE101 từ 2.26GHz về 2.23GHz. Trong thực
 1 1  V  tế, tần số cộng hưởng đã chuyển từ trạng thái của hốc cộng
 r" k "    o  (10) hưởng trống sang trạng thái chén PTFE trống bên trong hốc
 Qs Qo  Vs  cộng hưởng. Vì vậy, sự cân chỉnh cho việc tính toán hằng số
Phương pháp đo đạc đề nghị trong báo cáo này được mô điện môi chất lỏng bằng cách thêm vào các hệ số hiệu chỉnh k'
tả trong Hình 4. Đầu tiên, chúng ta đo độ suy hao về mặt và k" là cần thiết cho kỹ thuật được đề xuất trong báo cáo này,
truyền công suất (S21) với chén đựng chất lỏng (chén PTFE) nếu chúng ta muốn sử dụng các hệ số fo, fs, Qo và Qs trong
bên trong hốc cộng hưởng. Tiếp theo, chúng ta cho dung dịch trạng thái chén PTFE trong hốc cộng hưởng.
chất lỏng chuẩn (nước cất) vào bên trong chén PTFE và đặt Từ mỗi phép đo ở trên, chúng ta có thể trích xuất các tần
vào bên trong hốc cộng hưởng để đo S21 trong trường hợp này. số cộng hưởng f0 và fs, các hệ số phẩm chất Qo và Qs từ các
Từ kết quả đo S21 với chất lỏng chuẩn (Standard Liquid) bên
trong hốc cộng hưởng, chúng ta có thể tính toán 2 hệ số hiệu
chỉnh k 'và k" trong các công thức (9) và (10) từ hằng số điện
môi của dung dịch chuẩn (nước cất). Sau đó, chúng ta lặp lại
phép đo S21 với chất lỏng cần đo (Liquid Under Test) đặt bên
trong chén PTFE và cho vào trong hốc cộng hưởng. Với 2 hệ
số hiệu chỉnh k' và k" tính toán trong bước trước đó (với dung
dịch chuẩn), chúng ta có thể tính toán hằng số điện môi tương
đối của chất lỏng cần đo bởi các công thức (9) và (10).
Như đã đề cập ở trên, việc đo đạc hằng số điện môi tương
đối bằng phương pháp hốc cộng hưởng cần phải sử dụng một
hốc cộng hưởng. Ở đây, chúng ta sử dụng hốc cộng hưởng
hình chữ nhật chế tạo bằng đồng thau và có các kích thước bên Hình 5. Cấu hình đo đạc bằng phương pháp hốc cộng hưởng
365
365
HộiHội
đã được thực hiện với cùng thể tích chất lỏng chứa bên trong
chén PTFE và đặt tại cùng vị trí trung tâm của hốc cộng
hưởng. Việc tính toán hằng số điện môi của chất lỏng cần đo
từ 2 hệ số hiệu chỉnh k' và k" đều dựa trên cùng tham chiếu từ
trạng thái chén PFTE trống đặt bên trong hốc cộng hưởng.
Dung dịch chất lỏng cần đo được sử dụng trong nghiên
cứu này là một hỗn hợp pha loãng của Acetone và nước với độ
tinh khiết 70% về thể tích của Acetone. Trong tài liệu tham
khảo [18], hằng số điện môi của hỗn hợp này được xác định là
40. Trong các phép đo đạc thí nghiệm của đề tài này, hai chén
đựng chất lỏng PTFE (cùng hình dạng, kích thước và vật liệu)
sẽ được sử dụng để đo thông số S21 của các trạng thái tương
ứng (với dung dịch chuẩn và chất lỏng cần đo) để đảm bảo độ
lặp lại giữa các lần đo. Mục đích của việc này là để khảo sát
độ chính xác cũng như hạn chế của phương pháp đề xuất với
Hình 6. Tần số cộng hưởng khi không có và có chén đựng chất các thể tích chất lỏng khác nhau.
lỏng (chén PTFE) bên trong hốc cộng hưởng Trong đề tài này, chúng ta sẽ chuẩn bị một số mẫu dung
đường S21 đo được bằng các phương trình (5) và (6). Để tính dịch chuẩn (nước cất) và dung dịch cần đo (acetone) với thể
toán các hệ số hiệu chỉnh k' và k", các hệ số fo và Qo được tính tích khác nhau từ 2ml tới 5ml để khảo sát những ảnh hưởng
từ kết quả S21 đo được trong trường hợp chén PTFE trống của thể tích chất lỏng lên độ chính xác của giá trị hằng số điện
(không có chất lỏng bên trong chén) đặt bên trong hốc cộng môi của chất lỏng đo được bằng phương pháp được đề xuất ở
hưởng, trong khi fs và Qs được tính toán từ kết quả S21 đo trên. Với mục đích này, thể tích của các chất lỏng (dung dịch
được trong trường hợp cốc PTFE có chứa dung dịch chuẩn và chuẩn và dung dịch cần đo) được điều chỉnh bởi các ống tiêm
đặt bên trong hốc cộng hưởng. Theo đó, chúng ta có thể tính với sai số 0.1ml và thể tích được thay đổi từ 2ml tới 5ml với
toán 2 hệ số hiệu chỉnh k' và k" trong các công thức (9) và bước 1ml (Hình 7 và Hình 8) để xác định ảnh hưởng của thể
(10) từ hằng số điện môi của chất lỏng chuẩn (nước cất). Đây tích chất lỏng lên độ chính xác của các kết quả thu được.
cũng là 2 hệ số hiệu chỉnh k' và k" sẽ được sử dụng để tính Với phương pháp mô tả trong Hình 4, chúng ta sẽ tính
toán hằng số điện môi của chất lỏng cần đo trong trường hợp toán 2 hệ số hiệu chỉnh trong công thức (9) và (10) từ hằng số
chén PTFE chứa dung dịch chất lỏng cần đo (với cùng chất điện môi của dung dịch chuẩn (nước cất). Từ tài liệu tham
liệu, hình dáng và kích thước như trường hợp chất lòng tiêu khảo [19], chúng ta thu được giá trị hằng số điện môi của nước
chuẩn) và đặt bên trong hốc cộng hưởng. cất là 80+8j (ở 2GHz và 25oC). Với kết quả đo S21 trong
Việc tính toán hằng số điện môi của dung dịch cần đo trường hợp của dung dịch chuẩn, chúng ta có được các hệ số
được thông qua các hệ số hiệu chỉnh (k' và k" đã tính toán với hiệu chỉnh k' và k" như trong Bảng 1, sau đó sử dụng 2 hệ số
dung dịch chuẩn) ở bước tiếp theo. Chúng ta sẽ áp dụng các này để việc tính toán hằng số điện môi của dung dịch cần đo
công thức (9) và (10) bằng cách sử dụng các hệ số f0 và Q0 từ (hỗn hợp của Acetone và nước) cũng theo các công thức (9) và
S21 đo được trong trường hợp chén PTFE trống đặt bên trong (10). Đối với mỗi thí nghiệm đo S21 của các trạng thái ứng với
hốc cộng hưởng. Các hệ số fs và Qs vẫn được trích ra từ S21 đo các chất lỏng khác nhau, chúng ta sẽ giữ thể tích của các chất
được chén PFTE có chứa dung dịch chất lỏng cần đo đặt bên lỏng bên trong chén PTFE giữa 2 tình huống (ứng với nước
trong hốc. Các phép đo S21 tương ứng trong các trường hợp cất và dung dịch Acetone) là như nhau. Giá trị của các hệ số
của dung dịch chuẩn (nước cất) và chất lỏng cần đo (acetone) hiệu chỉnh k', k" và hằng số điện môi tính toán cho dung dịch
Hình 7. Kết quả đo S21 của dung dịch chuẩn (nước cất) tại các Hình 8. Kết quả đo S21 của dung dịch cần đo (Acetone) tại các thể
thể tích khác nhau tích khác nhau
366
366
Thể tích chất r' tính toán cho r" tính toán cho Ʌ%r so với giá trị
k' k" chuẩn từ tài liệu [18]
lỏng (ml) dung dịch Acetone dung dịch Acetone
2 ± 0.1 7.60 ± 0.38 41.27 ± 2.06 35.19 ± 0.01 6.31 ± 0.01 19.84%
3 ± 0.1 6.36 ± 0.22 15.74 ± 0.53 39.26 ± 0.01 0.78 ± 0.01 2.69%
4 ± 0.1 6.26 ± 0.16 18.29 ± 0.46 46.74 ± 0.01 4.01 ± 0.01 19.61%
5 ± 0.1 5.90 ± 0.12 15.55 ± 0.31 44.95 ± 0.01 1.94 ± 0.01 13.29%
Bảng 1. Các giá trị tính toán cho các hệ số hiệu chỉnh và hằng số điện môi của chất lỏng cần đo theo phương pháp đề xuất
cần đo theo phương pháp đề xuất được trình bày như trong tăng tương ứng và làm giảm sự ổn định của kỹ thuật được đề
Bảng 1. Trong đó, sai số tương đối giữa các giá trị hằng số xuất. Thêm nữa, thể tích nhỏ hơn của chất lỏng có thể dẫn đến
điện môi ɛ' và ɛ" tính toán được so với giá trị chuẩn (40 theo ít tương tác hơn giữa chất lỏng và trường điện từ phân bố bên
tài liệu tham khảo [18]) được tính toán theo công thức sau: trong hốc cộng hưởng. Ngược lại, với các thể tích chất lỏng
lớn hơn (giữa 4ml và 5ml), hằng số điện môi thu được tiếp tục
dao động và sai lệch xa giá trị tham khảo của hỗn hợp acetone
( r' ( Acetone )   r' [18] ) 2  ( r"( Acetone )   r"[18] ) 2
% r  100% (11) hơn nữa (cả trong hằng số điện môi và hệ số tổn hao).
( r' [18] ) 2  ( r"[18] ) 2 Các giá trị tính toán cho hằng số điện môi của dung dịch
chất lỏng cần đo tại thể tích 3ml (39.26+j0.78) rất gần so với
giá trị tham khảo cho thấy tính khả thi của kỹ thuật được đề
Trong đó: Ʌ%ɛr' là sai số tương đối của hằng số điện môi
xuất trong đề tài này. Từ các kết quả thử nghiệm, thể tích tối
phức tính toán được so với giá trị chuẩn từ tài liệu tham khảo
ưu cho các dung dịch chất lỏng cần đo với kỹ thuật được đề
[18]. ɛr'(Acetone) và ɛr"(Acetone) lần lượt là hằng số điện môi và hệ
xuất sẽ nằm giữa các giá trị 3ml và 4ml. Tuy nhiên, kỹ thuật
số tổn hao tính toán được cho dung dịch Acetone theo phương
được đề xuất trong nghiên cứu này vẫn còn một số hạn chế và
pháp đề xuất. ɛr'[18] và ɛr"[18] lần lượt là hằng số điện môi và
có thể được cải thiện trong tương lai.
hệ số tổn hao của dung dịch Acetone (70% về thể tích) theo tài
Nhận xét đầu tiên là giá trị hằng số điện môi của chén
liệu tham khảo [18].
đựng chất lỏng (PTFE) dao động từ 2.1 tới 2.3 [20]) và rất
Từ Bảng 1, chúng ra rút ra được một lưu ý rằng tần số
khác biệt so với hằng số điện môi của 2 dung dịch chuẩn và
cộng hưởng sẽ được dời tới các tần số thấp hơn khi thể tích
dung dịch cần đo. Điều đó có nghĩa rằng các kết quả thực
của các chất lỏng tăng, điều này là hoàn toàn hợp lý đúng như
nghiệm có thể được cải thiện nếu chúng ta sử dụng một chén
dự đoán từ lý thuyết trường điện từ. Thể tích chất lỏng tăng
đựng chất lỏng làm bằng vật liệu có giá trị hằng số điện môi
lên sẽ dẫn đến một hiện tượng: sai số trong kết quả tính toán
càng gần với giá trị hằng số điện môi của không khí càng tốt
của 2 hệ số hiệu chỉnh k' và k" giảm dần và giá trị này dần hội
để làm giảm sự gián đoạn tương tác trường điện từ trường bên
tụ khi thể tích chất lỏng tăng. Các kết quả thu được cho thấy
trong hốc cộng hưởng và chất lỏng. Trong thực tế, nếu chén
rằng kỹ thuật này là ổn định hơn nhưng đồng thời cũng dẫn
đựng chất lỏng có hằng số điện môi gần với giá trị của không
đến sai số lớn hơn trong hằng số điện môi thu được khi thể
khí sẽ có thể cải thiện tính đồng nhất của hỗn hợp trong các
tích chất lỏng tăng lên.
thí nghiệm (các chất lỏng và chén đựng chất lỏng). Để giải
Trong Bảng 1, sai số trong tính toán cho 2 hệ số hiệu
thích hiện tượng này, Schroeder và các cộng sự [21] đã cung
chỉnh k' và k" do sai lệch về thể tích chất lỏng giảm một cách
cấp các công thức phân tích cần thiết cho việc tính toán của
liên tục khi thể tích của chất lỏng tăng. Điều này có thể được
giá trị hằng số điện môi tương đương trong một hỗn hợp 2 pha
giải thích rằng tỷ lệ giữa sai số về thể tích của ống tiêm (0.1ml
vật chất khác nhau:
như mô tả ở trên) và thể tích thực sự của các chất lỏng (dung
dịch chuẩn và dung dịch cần đo) giảm tương ứng khi thể tích  inc   w
 eff  w  3.v f . w (12)
chất lỏng tăng lên. Điều này chứng tỏ sự ổn định của kỹ thuật  inc  2 w  v f ( inc   w )
này khi thể tích của các mẫu chất lỏng tăng. Ngược lại, các giá
trị hằng số điện môi tính toán của dung dịch chất lỏng cần đo Trong đó: ɛeff là hằng số điện môi hiệu dụng của hỗn hợp,
tăng liên tục giữa 2ml và 4ml rồi sau đó giảm khi thể tích của ɛw là hằng số điện môi của nước (hoặc một dung môi khác
chất lỏng lớn hơn 4ml. Từ các kết quả này, chúng ta có thể rút chiếm ưu thế trong hỗn hợp gồm 2 pha khác nhau), ɛinc là
ra được rằng phải có một giá trị thể tích tối ưu nào đó cho các hằng số điện môi của vật chất hòa tan trong hỗn hợp và vf là tỷ
chất lỏng đo đạc bằng phương pháp này. số giữa thể tích của vật chất hòa tan và thể tích của dung môi
Ngoài ra, các giá trị hằng số điện môi theo tính toán của chiếm ưu thế. Từ công thức này, chúng ta có thể tạo ra một
dung dịch cần đo (39.26+j0.78 tương ứng với thể tích 3ml) là hỗn hợp đồng nhất của chất lỏng cần đo bên trong hốc cộng
giá trị gần nhất so với giá trị hằng số điện môi của hỗn hợp hưởng nếu sử dụng một chén đựng chất lỏng với hằng số điện
Acetone (40 với dung dịch 70% về thể tích của Acetone ở môi càng gần với hằng số điện môi của không khí (hoặc của
250C) theo tài liệu tham khảo [18]. Với các thể tích chất lỏng chất lỏng cần đo) càng tốt. Nhưng thể tích hiệu dụng của hỗn
nhỏ (giữa 2ml và 3ml), sai số trong giá trị tính toán cho các hệ hợp trong 2 trường hợp này sẽ khác nhau và cần được khảo sát
số hiệu chỉnh k' và k" trở nên lớn hơn vì tỷ lệ giữa sai số về lại kỹ càng để tìm ra thể tích tối ưu mới cho phương pháp
thể tích ống tiêm (0.1ml) và thể tích thực của chất lỏng cũng được đề xuất.
367
367
HộiHội
Thảo Quốc
Thảo Gia
Quốc 2015
ĐiệnTử,
Tử,Truyền
NghệThông
ThôngTinTin (ECIT
(ECIT 2015)
2015)
Hằng số điện môi tham chiếu của nước cất (80+j8 tại 25oC [4] Robinson G. H.: “Resonant frequency calculations for microstrip
cavities (correspondence)", IEEE Transactions on Microwave Theory
như trình bày trong tài liệu tham khảo [19]) có thể thay đổi khi Tech. , Vol. 19, No. 7, pp. 244-246, 2003
đo đạc thực tế do sự khác biệt về nhiệt độ, độ ẩm, và độ chính [5] A. Baysar, and J. L. Kuester: “Dielectric property measurements of
xác của thiết bị đo. Nhiệt độ trong phòng được giữ ở 250C materials using the cavity technique", IEEE Transactions on Microwave
nhưng có thể dao động do ảnh hưởng của môi trường xung Theory Tech. , Vol. 40, No. 11, pp. 2108-2110, 1992
quanh. Như đã nói, chúng ta sử dụng dung môi của Acetone [6] Howell J. Q.: “A quick accurate method to measure the dielectric
với độ tinh khiết 70% về thể tích nhưng giá trị này có thể sai constant of microwave integrated circuit substrates", IEEE Transactions
on Microwave Theory Tech. , Vol. 51, No. 4, pp. 142-143, 1973
khác khoảng ±5% do thông số cung cấp từ nhà sản xuất (theo
[7] Ivanov, S. A. and V. N. Peshlov: “Ring-resonator method - Effective
đó, hằng số điện môi của hỗn hợp Acetone có thể dao động procedure for investigation of microstrip line", IEEE Microwave and
giữa 40 và 44.5 như đề cập trong tài liệu tham khảo [18]). Hơn Wireless Components Letters , Vol. 13, No. 6, pp. 665-666, 1971
nữa, hình dạng của chén đựng chất lỏng nên có dạng đối xứng [8] Bernard, P. A. and J. M. Gautray: “Measurement of dielectric constant
và tương tự với hình dạng của hốc cộng hưởng (trong đề tài using a microstrip ring resonator", IEEE Transactions on Microwave
Theory Tech. , Vol. 39, No. 3, pp. 592-595, 1991
này là hình chữ nhật) để có được một sự tương tác trường điện
từ tốt hơn với các chất lỏng đặt bên trong hốc. Do khó khăn [9] Napoli, L. S. and J. J. Hughes: “A simple technique for the accurate
determination of the microwave dielectric constant for microwave
trong việc kiểm soát độ chính xác về thể tích của chất lỏng, integrated circuit substrates (correspondence)", IEEE Transactions on
nhóm nghiên cứu không thể thay đổi thể tích của các chất lỏng Microwave Theory Tech. , Vol. 19, No. 7, pp. 664-665, 1971
với bước đo 0.1ml. Theo đó, một nghiên cứu sâu hơn với độ [10] R. F. Harrington: “Time harmonic electromagnetic fields”, Mc Graw-
phân giải 0.1ml trong thể tích thực nghiệm của các chất lỏng Hill, New York, 1961
nên được thực hiện để xác định khoảng giá trị tối ưu về thể [11] Ning Wang, Naiqian Zhang, Maohua Wang: “Wireless sensors in
agriculture and food industry-Recent development and future
tích chất lỏng cho kỹ thuật đề nghị trong báo cáo này. perspective”, Journal of Computers and Electronics in Agriculture, Vol.
50, Issue 1, January 2006, pp. 1-14.
[12] N. Dat Son, et al., "Development of novel wireless sensor for food
IV. KẾT LUẬN quality detection," Advances in Natural Sciences: Nanoscience and
Trong báo cáo này, nhóm nghiên cứu đề xuất một phương Nanotechnology, vol. 6, p. 045004, 2015
pháp mới linh hoạt và chi phí thấp cho việc đo đạc hằng số [13] Andrew A.P. Gibson, Sing K. Ng, Badaruzzaman B.M. Noh, Hong S.
Chua, Arthur D. Haigh, Graham Parkinson, Paul Ainsworth and Andrew
điện môi phức của chất lỏng ở tần số vi sóng dựa trên phương Plunkett: “An overview of microwave techniques for the efficient
pháp hốc cộng hưởng cổ điển. Thể tích tối ưu của chất lỏng measurement of food materials “, Journal of Food Manufacturing
thử nghiệm trong bài viết này đã chứng minh tính khả thi của Efficiency, IFIS Publishing 2008, Vol. 2, Issue 1, pp. 1-8, ISSN:
17502683
phương pháp đo đạc được đề xuất. Một số hạn chế của kỹ
[14] R.Seaman, E. Burdete and R. Dehaan, “Open-ended Coaxial Exposure
thuật này cũng được thảo luận và cần được cải thiện trong Device for Applying RF/Microwave Fields to very small Biological
tương lai. Hằng số điện môi của chén đựng chất lỏng nên càng Preparation”, IEEE Trans. Microwave Theory Tech., vol. 37, pp. 102-
gần với hằng số điện môi của không khí hoặc chất lỏng cần đo 111, January 1989
càng tốt để tăng độ chính xác của phương pháp. Hơn nữa, hình [15] K.Staebel and D. Misra, “An Experimental Technique for in vivo
dạng của chén đựng chất lỏng và độ phân giải của thể tích chất Permittivity Measurement of Materials at Microwave Frequencies”,
IEEE Trans. Microwave Theory Tech., vol. MTT-38, pp. 337-339,
lỏng cần được khảo sát kỹ lưỡng hơn. March 1990
[16] M. Lin, Y. Wang, and M.N. Afsar: “Precision measurement of complex
permittivity and permeability by microwave cavity perturbation
LỜI CẢM ƠN technique”, The Joint 30th International Conference on Infrared and
Millimeter Waves and 13th International Conference on Terahertz
Công trình này được hỗ trợ bởi kinh phí của Phòng thí Electronics, September 2005, pp. 62– 63
nghiệm Công nghệ Nano (Đại học quốc gia Thành phố Hồ Chí [17] Z. Wang, et al., "Permittivity measurement of biological materials with
Minh) và một khoản trợ cấp từ vùng Rhône-Alpes (cộng hòa improved microwave cavity perturbation technique," Microwave and
Pháp). Các tác giả xin chân thành cảm ơn phòng thí nghiệm Optical Technology Letters, vol. 50, pp. 1800-1804, 2008
LCIS (Grenoble-INP/ESISAR tại Valence, cộng hòa Pháp) đã [18] A. C. Kumbharkhane, S. N. Helambe, M. P. Lokhande, S. Doraiswamy
cung cấp hốc cộng hưởng và các thiết bị đo lường trong khuôn and S. C. Mehrotra: “Structural study of aqueous solutions of
tetrahydrofuran and acetone mixtures using dielectric relaxation
khổ dự án hợp tác giữa các bên. technique”, Pramana – Journal of physics, Vol 46, No.2, February 1996,
pp. 91-98
[19] Http://www.intechopen.com/articles/show/title/broadband-complex-
TÀI LIỆU THAM KHẢO permittivity-determination-for-biomedical-applications
[1] Chen, L. F., C. K. Ong, C. P. Neo, V. V. Varadan, and V. K. Varadan: [20] V. Svorcik, O. Ekrt, V. Rybka, J. Liptak and V. Hnatowicz,
“Microwave Electronics: Measurement and Material Characterization”, “Permittivity of polyethylene and polyethyleneterephtalate”, Journal of
John Wiley & Sons Inc., 2004. Materials Science Letters, Vol 19, Number 20, pp. 1843-1845, DOI:
[2] Pozar D. M., “Microwave Engineering”, John Wiley & Sons Inc., 2005 10.1023/A:1006715028026
[3] Baker-Jarvis, J. R. G. Geyer, J. H. Grosvenor, Jr., M. D. Janezic, C. A. [21] Mark J. Schroeder, Anupama Sadaasiva, Robert M. Nelson, “An
Jones, B. Riddle, C. M. Weil, and J. Krupa: “Dielectric characterization Analysis on the Role of Water Content and State on Effective
of low-loss materials: A comparison of techniques", IEEE Transactions Permittivity Using Mixing Formulas”, Journal of Biomechanics,
on Dielectrics and Electrical Insulation , Vol. 5, No. 4, pp. 244-246, Biomedical and Biophysical engineering, Vol. 2, Issue 1, 2008
1998.
368
368
Nghiên cứu và thiết kế chip xử lý đa nhân sử dụng

Multi2Sim
Ngô Quang Vinh, Đỗ Đức Hào Hoàng Trang, Vũ Đình Thành
Trung tâm ICDREC, ĐHQG TPHCM Đại học Bách khoa, ĐHQG TPHCM
Email : {vinh.ngoquang, hao.doduc}@icdrec.edu.vn Email: {hoangtrang, vdthanh}@hcmut.edu.vn
Tóm tắt nội dung—Chip đa nhân (CMP) ngày càng được đó đã làm cho CMP ngày càng phổ biến trên thị trường
sử dụng rộng rãi nhờ vào năng lực tính toán được nâng cũng như không ngừng được nghiên cứu, cải tiến nhằm
cao rõ rệt so với các thế hệ chip một nhân. Tốc độ cũng nâng cao chất lượng.
như hiệu quả của CMP chủ yếu đến từ quá trình phân Để nhanh chóng và dễ dàng trong việc tìm hiểu,
cấp bộ nhớ. Tùy vào cách thiết kế mà các thành phần bộ
nghiên cứu cũng như thiết kế CMP thì một phần mềm
nhớ cùng nhau chia sẻ dữ liệu hay sử dụng một cách độc
quyền. Điều đó làm cho khả năng lưu trữ của bộ nhớ vô
mô phỏng là không thể thiếu. Phần mềm này sẽ giúp
cùng linh hoạt và qua đó trực tiếp cải thiện tốc độ xử chúng ta thiết kế một CMP dễ dàng, mô phỏng về hiệu
lý. Chúng tôi tập trung tìm hiểu và phân tích quá trình năng tính toán, từ đó so sánh các thiết kế khác nhau
phân cấp này nhằm lý giải phần nào về sự cải thiện rõ nhằm rút ra ưu nhược điểm của từng thiết kế. Có rất
rệt về mặt tốc độ xử lý của CMP. Mặt khác, hiệu suất nhiều phần mềm dạng này, trong đó đa phần là miễn
của CMP chỉ đạt tối ưu khi sự phân cấp bộ nhớ là phù phí như : Gem5, Multi2Sim, SimpleScalar [?][?][?], ...
hợp với chương trình ứng dụng thực tế. Trong nghiên cứu Trải qua một quá trình tìm hiểu và sử dụng hầu hết các
này, chúng tôi trình bày mối liên hệ giữa cấu trúc bộ nhớ chương trình trên, chúng tôi nhận thấy Multi2Sim là một
thứ bậc của chip CMP và những đặc tính chính của một
công cụ rất tốt để tìm hiểu và nghiên cứu về CMP cho
chương trình ứng dụng chạy trên nó. Chúng tôi sử dụng
công cụ Multi2Sim để thiết kế và chạy mô phỏng CMP. Bên nhiều đối tượng, từ người mới bắt đầu đến các chuyên
cạnh đó, chương trình ứng dụng được chon là benchmark gia.
Splash-2, là benchmark được dùng phổ biến để ước lượng Bên cạnh đó, Multi2Sim cũng hỗ trợ các chương trình
hiệu suất của thiết kế CMP. Kết quả thí nghiệm cho thấy benchmark phổ biến nhất hiện nay cho chip CMP là
Splash-2 đạt được hiệu suất cao nhất khi dung lượng L1 Splash-2 và Parsec [?][?][1]. Thông qua thực hiện thí
là 64 KB. nghiệm trên những chương trình benchmark chuẩn này,
Từ khóa—Phân cấp bộ nhớ, vi xử lý đa nhân, bộ nhớ chúng tôi phân tích và rút ra một số đặc tính chính của
cache, Multi2Sim benchmark và từ đó đưa ra các thông số thiết kế bộ nhớ
có thứ bậc phù hợp nhằm tạo ra mô hình tối ưu nhất cho
benchmark đó. Trong nghiên cứu, này chúng tôi chọn sử
I. GIỚI THIỆU
dụng Splash-2 vì nó đã được phát triển khá lâu và có độ
Ngày nay, khi mà máy tính càng ngày càng phổ biến ổn định cao [?]. Splash-2 bao gồm nhiều bài toán ứng
và tham gia vào nhiều mặt của cuộc sống con người, yêu dụng khác nhau về tính toán hiệu năng cao và về đồ hoạ.
cầu về năng lực xử lý của một bộ vi xử lý dường như Đặc biệt, Splash-2 là benchmark được thiết kế để đánh
là một điều tất yếu. Kể từ năm 2001, khi IBM lần đầu giá các kiến trúc xử lý song song đa luồng hoặc đa nhân
tiên giới thiệu chip đa nhân (CMP) ra thị trường, loại [1][?].
chip này đã dần thống trị thị trường vi xử lý [?]. Những Kết quả thí nghiệm cho thấy benchmark Splash-2 có
thế hệ chip một nhân vào hàng xa xỉ của vài chục năm sự phân bổ các tác vụ vào các nhân một cách cân bằng
trước thì ngày nay vẫn không thể đáp ứng được nhu cầu thể hiện ở tỷ lệ số lượng truy xuất bộ nhớ cache và thể
của một người dùng bình thường. Cho dù được cải tiến hiện ở tỷ lệ hit giữa các nhân. Tỷ lệ hit ở cache đạt được
bằng cách tăng mật độ transitor hay tăng xung nhịp, các mức trung bình cao nhất lên tới 99.3% tương ứng với
loại chip này vẫn không thể chạy những phần mềm ứng dung lượng L1 và L2 tương ứng là 64 KB và 512 KB.
dụng, những trò chơi điện tử có đồ họa cao cấp một cách Trong phần II, chúng tôi trình bày về kiến trúc tổ
mượt mà [?][?]. Chip CMP ngoài khả năng xử lý mạnh chức bộ nhớ có phân cấp của một chip xử lý đa nhân.
mẽ còn có độ bền cao, hoạt động ổn định và ít bị nóng Phần giới thiệu về Multi2Sim được trình bày ở mục III.
nhờ khả năng tản nhiệt tốt [?][?]. Chính những lý do Trong phần này, chúng tôi đi sâu vào những phần liên
ISBN: 978-604-67-0635-9 369

369
HộiHội
ThảoThảo Quốc
2015 ĐiệnTử,
Tử,Truyền
TruyềnThông
Thông và
và Công
CôngNghệ
NghệThông
ThôngTinTin
(ECIT 2015)
(ECIT 2015)
quan đến phần phân cấp bộ nhớ để minh họa một cách
trực quan cho nội dung của phần trước. Phần IV giới
thiệu một quá trình xuyên suốt của việc thiết kế CMP,
từ khâu hình thành ý tưởng, triển khai, cấu hình, chạy mô
phỏng cho đến khâu thống kê và đánh giá. Cuối cùng,
phần V là những nhận định và đánh giá của chúng tôi
về Multi2Sim đối với việc nghiên cứu và thiết kế chip
vi xử lý đa nhân.
II. PHÂN CẤP BỘ NHỚ TRÊN CMP

Như đã trình bày trong phần I, một CMP xét về bản
chất là sự ghép nối của nhiều chip một nhân tạo thành.
Tương tự như chip một nhân, CMP khi vận hành cũng
nhận mã lệnh (Inst) và dữ liệu (Data) từ bộ nhớ để tiến Hình 1: Phân cấp bộ nhớ
hành xử lý. Các nhân trong chip gần như không thể cải
tiến gì thêm, mật độ các đơn vị xử lý gần như đã bão
hòa. Mặt khác việc nâng cao hiệu năng hoạt động của này, thực chất là sự kết hợp giữa các ưu điểm của các
nhân thông qua việc tăng tần số hoạt động đã gặp giới cách bố trí bộ nhớ: bộ nhớ chính, dung lượng lớn sẽ chứa
hạn rõ ràng là công suất tiêu thu của chip và mức toả toàn bộ nội dung chương trình, và dĩ nhiên nằm xa chip;
nhiệt cao [?]. một bộ nhớ nhỏ hơn nhiều, được thiết kế nằm trong
Do đó, mọi sự thay đổi hay tác động lên chip với chip, có nhiệm vụ lưu trữ những Inst và Data thường
mong muốn cải thiện hiệu năng đều được thực hiên tại dùng nhất, nhằm tiết kiệm thời gian truy xuất đến bộ
các thành phần bộ nhớ, từ kiến trúc cho đến mạng nội nhớ chính, bộ nhớ như vậy được biết đến với tên gọi
bộ giữa chúng với nhau. bộ nhớ truy cập nhanh hay bộ nhớ đêm (cache) [?]. Sự
khác nhau giữa cache trong chip đơn nhân và CMP được
A. Phân cấp bộ nhớ trình bày rõ hơn trong hai mục II-A1 và II-A2.
Chip và bộ nhớ chính của máy tính là hai bộ phận 1) Cache của chip một nhân: Như đã trình bày, bộ
riêng biệt, tách rời nhau và được liên kết với nhau bởi nhớ được đặt càng gần chip thì truy xuất càng nhanh,
một mạng nội bộ [?]. Rõ ràng, khi chip yêu cầu một dung lượng phải càng nhỏ. Người ta thường chia cache
Inst hay Data thì không thể có ngay được, phải chờ tín thành các mức : L1, L2, L3, ... L1 là cache nhỏ nhất,
hiệu yêu cầu đi từ chip đến bộ nhớ chính, rồi thông tin có tốc độ truy xuất nhanh nhất, L2 có sức chứa lớn hơn
cần thiết sẽ đi từ bộ nhớ chính về lại chip. Nếu bộ nhớ L1 và truy xuất chậm hơn L1, tương tự cho các mức cao
càng gần chip thì quãng đường đi lại càng ngắn, thời hơn [2][?]. Chip một nhân chỉ có một bộ nhớ cache cho
gian thực thi càng ít, và ngược lại. Nhưng mặc khác, mỗi mức, và do đó, mạng nội bộ nối từ chip, qua các
chip được cấu thành từ các mạch bán dẫn cực nhỏ, và mức cache, đến bộ nhớ chính rất đơn giản, đó chỉ là một
phải được nuôi bởi những nguồn điện tương ứng và thật đường thẳng.
sự ổn định. Nếu ta thiết kế một bộ nhớ chính với dung 2) Cache của CMP: CMP là nhiều nhân hợp lại mà
lượng lớn đặt ngay bên trong chip hay quá gần chip đều thành. Mỗi nhân đều có cache riêng, tùy theo cách chúng
có thể làm hư hỏng chip, thậm chí gây cháy nổ. Qua ta bố trí mà có được các kiến trúc khác nhau. Thông
đó, chúng ta nhận thấy rằng, khoảng cách từ bộ nhớ đến thường, mỗi nhân đều có cache L1 riêng, còn ở các mức
chip tỉ lệ thuận với thời gian truy xuất thông tin và tỉ cao hơn thì có thể dùng chung hoặc riêng đều được. Vì
lệ nghịch với dung lượng bộ nhớ. Bộ nhớ càng gần chip ở cùng một mức cache, có nhiều module nên chúng ta
thì truy xuất càng nhanh nhưng dung lượng sẽ giảm đi, có thể cấu hình để thu được các đồ hình (topology) khác
và ngược lại, những bộ nhớ với dung lượng lưu trữ lớn nhau, qua đó thời gian truy xuất và hiệu năng tính toán
phải được đặt xa chip [?]. Hình 1 cho ta một cái nhìn cũng khác nhau. Giả sử CMP có 4 module L2, chúng ta
trực quan về phân cấp bộ nhớ. có thể cho chúng nối thẳng đến L3, hoặc cho chúng nối
Nhưng những nhu cầu ứng dụng của người dùng cuối thành một vòng (ring network), rồi nối một nút trên vòng
thường rất ngặt nghèo: phần mềm ứng dụng lớn, nhưng đến L3, hoặc nối chúng thành hình sao (star network),
yêu cầu xử lý phải nhanh. Đó là thách thức, nhưng cũng rồi nối đến L3 ... Qua đó, chúng ta có thể nhận thấy
là động lực để bộ nhớ máy tính được phát triển đến một rằng phân cấp bộ nhớ của CMP phức tạp và đa dạng
mức độ cao hơn: phân cấp bộ nhớ [2][?][?]. Quá trình hơn nhiều so với chip một nhân [?][?]. Khi số khả năng
370
370
phân cấp càng lớn, chúng ta càng có quyền hi vọng một way. Khi muốn kiểm tra xem một địa chỉ đã có trong
trong số chúng sẽ đem lại hiệu quả tính toán mong muốn cache hay chưa, chúng ta chỉ cần tìm trong set tương
cho chúng ta. ứng. Đây cũng là cách tổ chức phổ biến nhất hiện nay
bởi các hãng lơn như Intel hay AMD, trong đó k thường
B. Những thành phần chính của bộ nhớ Cache nhận giá trị 4 hoặc 8, nghĩa là tổ chức theo kiểu 4-way
hoặc 8-way.
Cache là một tập hợp các cache line [?]. Cache line
Trong cache được tổ chức theo kiểu k-way, tuy kích
là đơn vị cơ bản của cache, mỗi cache line chứa thông
thước của một set là không nhỏ, nhưng không chắc chứa
tin đang được lưu trữ tại một địa chỉ nào đó trong bộ
đủ tất cả các dữ liệu cần thiết cho CPU tại một khoảng
nhớ. Tùy theo các cách ánh xạ địa chỉ bộ nhớ lên cache
thời gian xác định. Một vấn đề rất tự nhiên nảy sinh, khi
line mà ta có các kiểu cache khác nhau [3] [4]. Hình 2
set đã chứa đầy dữ liệu nhưng chúng ta cần lưu thêm một
cho ta một minh họa trực quan.
địa chỉ nữa, vậy cần loại bỏ địa chỉ nào hiện tại. Có rất
nhiều chiến lược thay thế được dùng trong thực tế như:
chọn ngẫu nhiên một địa chỉ để loại ra, dành chỗ cho địa
chỉ mới; chọn địa chỉ có số lần sử dụng ít nhất để loại
ra; First In First Out (FIFO) [?][?]; hay chọn địa chỉ ít
sử dụng nhất trong thời gian gần đây để loại bỏ (LRU)
[?][?]... Mỗi chiến lược đều có ưu điểm riêng, không
chiến lược nào là tốt toàn diện, và đây cũng chỉ là theo
(a) Ánh xạ trực tiếp (b) ánh xạ 2-way (c) Hỗ trợ toàn phần
dự đoán, không ai dám chắc địa chỉ vừa loại bỏ có được
Hình 2: Các kiểu ánh xạ địa chỉ từ bộ nhớ vào cache sử dụng trong tương lai gần hay không. Tuy nhiên, theo
khảo sát của chúng tôi, chiến lược LRU được sử dụng
Trong hình 2a, mỗi địa chỉ trong bộ nhớ chỉ có thể khá phổ biến. Đặc biệt là trong cache L2, ở đó dữ liệu
được chứa trong duy nhất một cache line. Điều này sẽ Instr và data được lưu trữ chung. Theo hoạt động căn
rất thuận lợi khi truy xuất vì cache line chứa địa chỉ cần bản nhất của vi xử lý thì CPU đọc Instr vào và có xu
tìm, nếu có, là duy nhất. Tuy nhiên, khi có nhiều địa hướng không đọc hay ghi lên địa chỉ đó nữa mà có xu
chỉ đáng lẽ ra được lưu trong cùng một cache line được hướng đọc hoặc ghi lên các địa chỉ data. Khi đó các địa
sử dụng thì chỉ có tối đa một địa chỉ được lưu lại trong chỉ chứa Instr sẽ có thể bị thay thế một cách thích đáng
cache, điều này làm giảm hiệu quả của cache. Để hạn nếu sử dụng chiến lược LRU.
chế điều này, một giải pháp được đề nghị trong hình 2c,
mỗi địa chỉ có thể được lưu trong bất kỳ cache line nào,
miễn là cache line đó đang trống. Điều này rất thuận C. Phân loại Cache theo cấu trúc
lợi trong lưu trữ nhưng lại tốn thời gian trong khâu tìm Qua phần II-A, chúng ta biết rằng cache có nhiều mức
kiếm. Vì không biết địa chỉ mà CPU yêu cầu cầu đã có khác nhau, mức càng cao thì dung lượng càng lớn và tốc
trong cache hay chưa, nên ta phải duyệt toàn bộ cache độ truy xuất càng chậm. Điều này có nghĩa L2 lớn hơn
line để có câu trả lợi. Qua đó, ta nhận thấy khả năng lưu rất nhiều so với L1, và L3 lớn hơn hẳn so với L2 ... Một
trữ và tốc độ truy xuất, một lần nữa, lại tỉ lệ nghịch với câu hỏi tự nhiên đặt ra là: liệu L2 có chứa L1 hay không?
nhau. Lý do là gì, và làm thế được lợi gì? Như đã trình bày
Một giải pháp vừa đảm bảo tốc độ truy xuất và khả ngay từ đầu, chúng tôi tập trung vào tìm hiểu và nghiên
năng lưu trữ được minh họa trong hình 2b. Bộ nhớ cache cứu về chip xử lý đa nhân, nên phần này chúng tôi sẽ bỏ
được chia làm đôi, khi đó, mỗi địa chỉ trong cache có qua việc phân tích cấu trúc cache trong chip một nhân.
thể được chứa trong 2 cache line. Ở một khía cạnh nào Một phân cấp đơn giản được cho trong hình 3. Thông
đó, ta có thể nói điều này làm tăng sức chứa lên gấp đôi thường, khi có 2 mức cache, mỗi core có một module
so với trường hợp ánh xạ trực tiếp và giảm thời gian đi cache L1 riêng, và cùng nhau chia sẻ một module L2.
một nửa khi so với trường hợp hỗ trợ toàn phần. Tổng Trong trường hợp này, chúng ta có 3 sự lựa chọn cho
quát, ta có thể chia cache thành k phần, mỗi phần chứa mối quan hệ giữa L1 và L2 [?]. Cách thứ nhất: L2 bao
m cache line. Khi đó, ta gọi tập hợp m cache line trong gồm L1, tất cả những địa chỉ có trong L1 đều phải có
một phần là một way, nói cách khác, chúng ta có k way. trong L2 [?]. Điều này thật sự rất hữu ích, bởi vì L2
Một địa chỉ trong bộ nhớ có thể thuộc vào một cache line chứa cả L1-A và L1-B. Khi CPU yêu cầu L1-A một địa
nào đó trong một way bất kỳ, chúng ta gọi một tập hợp chỉ mà L1-A không có địa chỉ này nhưng L1-B có, nếu
các khả năng như vậy là một cache set. Do đó, chúng L2 không chứa hai module L1 thì sẽ rất khó để L1-A
ta có m cache set, bằng đúng số cache line trong một lấy được thông tin mà CPU yêu cầu. Ở đây, vì L2 chứa
371
371
địa chỉ đang chứa dữ liệu ghi bị loại ra để lấy chỗ cho
địa chỉ mới thì mới ghi vào bộ nhớ chính [?]. Cho dù
được ghi chép nhiều lần lên cùng địa chỉ, nhưng vì địa
chỉ được lưu trên cache nên việc ghi dữ liệu chiếm rất
ít thời gian. Vấn đề nảy sinh khi nhiều chip xử lý cùng
ghi, hoặc một số chip đọc và một số chip ghi, khi đó,
ta cần đến một cache coherency protocol [5], nghĩa là
một cách thức để đảm bảo sự toàn vẹn và thống nhất dữ
liệu. Chi tiết về các giao thức này chúng tôi không trình
Hình 3: Hai module cache L1 cùng chia sẻ một module bày ở đây, bạn đọc nếu muốn tìm hiểu có thể tham khảo
L2 trong [6], [7], [8].
III. MÔ PHỎNG CMP BẰNG MULTI2SIM

cả L1-B nên sẽ chứa luôn dữ liệu mà L1-A đang cần.
Tuy thuận lợi cho truy xuất là vậy, nhưng cách tổ chức Multi2Sim (M2S) [?] là một công cụ rất linh hoạt để
này có một nhược điểm rất lớn: tốn chi phí lưu trữ. Mọi người dùng tìm hiểu về CMP. M2S là một phần mềm mã
dữ liệu lưu ở một mức cache nào đó đều được lưu lại nguồn mở, cho phép người dùng tạo ra, thay đổi và can
trong những mức cache cao hơn, đây thật sự là một lãng thiệp đến mức sâu nhất đối với CMP. Tuy nhiên, chúng
phí lớn trong khi kích thước của các module cache rất tôi không trình bày tất cả những gì M2S cung cấp mà
nhỏ. Bên cạnh đó, cách làm này cần phải đảm bảo một chỉ giới hạn ở những phần thiết kế tổ chức bộ nhớ cache.
ràng buộc để tận dụng được ưu thế của mình, đó là dung M2S thật sự là một môi trường bắt đầu không thể tốt
lượng L2 phải không được nhỏ hơn tổng dung lượng của hơn cho những ai có ý định tìm hiểu và nghiên cứu về
các module L1. Cách lưu trữ thứ hai khắc phục nhược CMP. Chúng ta có thể giả lập một CMP rất đơn giản
điểm của cách thứ nhất: Tất cả những gì được chứa trong bằng các file INI dưới dạng text. Một CMP gồm có
L1 thì không được chứa trong L2, và tương tự cho các nhiều nhân, nhiều cache ở các mức khác nhau, mạng
module cao hơn [?]. Cách lưu trữ này tận dụng tối đa nội bộ nối các module lại với nhau, và cuối cùng là bộ
không gian lưu trữ, nhưng sẽ rất tốn chi phí về băng nhớ chính. Tất cả những phần này được trình bày chi tiết
thông trên chip khi dữ liệu cần thiết đang chứa ở một trong những mục tiếp theo.
module cache cùng cấp. Một cách tổng quan, cách thứ
nhất tận dụng tối đa thời gian truy xuất, và cách thứ hai A. Phần nhân
tận dụng tối đa không gian lưu trữ, ưu điểm của cách
Cấu hình phần nhân là một phần quan trọng trong việc
làm này là nhược điểm của cách còn lại. Trong thực tế,
giả lập một CMP. Những gì chúng ta cần làm là viết các
ngoài hai cách này, người ta còn có cách thứ ba: dữ liệu
dòng cấu hình vào tập tin mem-config. Nội dung chúng
có ở L1 thì có thể có hoặc có thể không có ở L2 [?][?].
ta viết được cho trong bảng I.
Tuy không có ưu điểm rõ ràng như hai cách trên, nhưng
giải pháp này cũng không vướng phải những nhược điểm Tham số Ý nghĩa
tương ứng. [Entry <Tên>] Tên của nhân
Type Loại nhân (CPU hay GPU)
Arch Kiến trúc tập lệnh
D. Phân loại Cache theo chiến lược ghi Core Số thứ tự của nhân trong CMP
Mọi thao tác mà CPU tác động lên bộ nhớ chính đều Thread Số lượng tiểu trình chạy trên nhân
ComputerUnit Số thứ tự của đơn vị tính toán trong GPU
thông qua bộ nhớ cache với vai trò trung gian. Khi CPU
DataModule Nơi nhận lệnh
muốn ghi vào bộ nhớ chính, dữ liệu sẽ được ghi tạm lên InstModule Nơi nhận dữ liệu
cache, và cache sẽ chọn thời điểm tốt nhất để ghi vào Module Đơn vị phục vụ cho GPU
bộ nhớ chính. Về cơ bản, có 2 thời điểm cache ghi dữ
Bảng I: Cấu hình cho một nhân CMP
liệu vào bộ nhớ chính, tương ứng với hai kiểu hoạt động
khác nhau [?]. Kiểu thứ nhất tốn thời gian, ghi lại nhiều
lần nhưng rất an toàn, không lo có sai sót: ghi dữ liệu Những thành phần bắt buộc phải có, nếu chúng ta
xuống bộ nhớ chính ngay sau khi CPU ghi xuống cache. không thực hiện cấu hình thì cấu hình mặc định sẽ được
Trong trường hợp chúng ta cần ghi nhiều lần lên một địa sử dụng. Do đó, trong các tập tin INI, chúng ta chỉ
chỉ nào đó, phương pháp này tỏ ra kém hiệu quả vì tốn cấu hình những tham số thật cần thiết hoặc những phần
băng thông hệ thống kết nối trên chip. Trường hợp thư chúng ta quan tâm mà không cần bận tâm quá nhiều về
hai tối ưu hơn, nhưng cũng phức tạp hơn: chờ đến khi hệ thống.
372
372
B. Phần bộ nhớ net-config chứa nội cung chi tiết cho từng mạng. Bảng
Để cấu hình cho các module của bộ nhớ, chúng ta IV cung cấp các tham số cơ bản để cấu hình một mạng
cần hai bước : cấu hình hình dạng và cấu hình cho từng nội bộ trong tập tin mem-config.
module. Trước hết là phần cấu hình hình dạng. Bảng II Tham số Ý nghĩa
cho ta chi tiết cấu hình. Cũng như cấu hình cho nhân, [Network <Tên>] Tên mạng
phần này được thực hiện trong tập tin mem-config. DefaultInputBufferSize Kích thước vùng nhớ tạm
cho việc đọc dữ liệu
Tham số Ý nghĩa DefaultOutputBufferSize Kích thước vùng nhớ tạm
[CacheGeometry <Tên>] Tên hình dạng cho việc ghi dữ liệu
Set Số lượng set trong module đang xét DefaultBandwidth Băng thông
Assoc Số lượng Associative, hay số way
BlockSize Kích thước 1 block (line) Bảng IV: Cấu hình cơ bản cho mạng
Latency Độ trễ
Policy Chính sách thay thế
MSHR Số lượng truy cập cache tối đa Để cấu hình chi tiết cho mạng, chúng ta can thiệp vào
tại một thời điểm tập tin net-config. Tập tin này gồm các lệnh trong bảng
Port số lượng cổng IV và được bổ sung thêm các tham số trong bảng V
Bảng II: Cấu hình hình dạng bộ nhớ trong trường hợp mạng phức tạp.
Tham số Ý nghĩa
Phần hình dạng này cho phép chúng ta xác định những [Network.<Tên mạng>.Node.<Tên>] Tên của nút
Type Loại nút
tham số cơ bản nhất, chung nhất cho một mức cache hay [Network.<Tên mạng>.Link.<Tên>] Tên của liên kết
một loại module nào đó. Ví dụ như dòng đầu tiên có nội Source Nút nguồn của liên kết
dung "CacheGeometry L1" thì đây là các tham số chung Dest Nút đích của liên kết
Type Loại liên kết
cho tất cả các module trong CMP. Khi đó, các module
(một chiều hay hai chiều)
L1 trong CMP có cùng số set, assoc, cùng kích thước,
cùng chính sách thay thế ... Một điều lưu ý là tham số Bảng V: Cấu hình chi tiết cho mạng
Policy chỉ được nhận một trong ba giá trị: LRU, FIFO
hoặc Random. Như vậy, chúng ta đã có mọi tham số cần thiết để
Sau khi đã có những tham số chung cho các mức trong cấu hính ra một CMP cho riêng mình. Phần tiếp theo
bộ nhớ, bảng III cung cấp cho chúng ta các tham số cần sẽ cung cấp cho chúng ta phương tiện để đánh giá một
thiết để cấu hình hoàn chỉnh cho một module. thiết kế CMP có hiệu quả hay không.
Tham số Ý nghĩa
Type Loại module (cache, bộ nhớ chính) D. Đánh giá hiệu năng khi thực hiện mô phỏng bằng
Geometry Hình dạng Multi2Sim
LowNetwork Mạng bên dưới
LowNetworkNode Nút mạng bên dưới Để đánh giá hiệu quả của một chip nói chung và một
HighNetwork Mạng bên trên CMP nói riêng, chúng ta cần chạy thử một số chương
HighNetworkNode Nút mạng bên trên trình ứng dụng nào đó để có được kết quả thực tế
LowModules Các module phía dưới
BlockSize Kích thước 1 block
nhất. Trong nghiên cứu và cả trong công nghiệp, những
Latency Độ trễ chương trình chuyên dùng để kiểm tra hiệu quả của chip
Ports Số lượng cổng được gọi là benchmark. Có rất nhiều benchmark khác
DirectorySize Kích thước Directory nhau, phù hợp với các mục đích khác nhau. Chúng tôi
DirectoryAssoc Số way của Directory
chọn benchmark Splash-2 để kiểm tra hiệu quả khi thiết
AddressRange Khoảng địa chỉ có thể
lưu trong module đang xét kế CMP trên M2S. Splash-2 là một gói benchmark gồm
11 benchmark khác nhau. Tất cả chúng đều là các tập tin
Bảng III: Cấu hình các module của bộ nhớ thực thi nhằm giải quyết các vấn đề kinh điển trong lý
thuyết tính toán song song như: N-Body, LU, Cholesky
Factorization ... [1][?]
C. Phần mạng nội bộ
IV. THỬ NGHIỆM MULTI2SIM VÀO THIẾT KẾ CMP
Mạng nội bộ là mạng nối các module trong cùng một
mức cache hay giữa các mức cache với nhau. Để cấu A. Thiết kế
hình một mạng, chúng ta làm việc trên hai tập tin: mem- Trước tiên, chúng ta cần một sơ đồ cấu trúc cho CMP.
config chứa những thông tin cơ bản về mạng và tâp tin Một thiết kế được đề nghị trong hình 4.
373
373
Hình 7: Cấu hình cho các module L2
Các module của bộ nhớ chính được cấu hình tương tự

trong hình 8. Phần địa chỉ sử dụng phương pháp xen kẽ
với kích thước các khoảng xen kẽ là 64 bytes, bằng với
Hình 4: Thiết kế CMP
dung lượng của một blocksize trong bộ nhớ chính.
CMP mà chúng tôi đề nghị có 8 nhân, tương ứng với

đó là 8 module data-L1 được ký hiệu d0 đến d7 và 8
module inst-L1 được ký hiệu i0 đến i7. Mỗi nhóm gồm
4 cặp module L1 data - inst cùng chia sẻ một module
L2. Bên canh đó, bộ nhớ chính được chia thành 4 phần
(4 banks) bằng phương pháp xen kẽ (interleave). Những
phần này được liên kết với các module L2 bởi một mạng
nội bộ dạng vòng.
B. Cấu hình
Trước tiên, chúng ta cấu hình phần hình dạng cho các
mức cache, chi tiết như trong hình 5.
Hình 5: Cấu hình phần hình dạng cho các mức cache
Hình 6 cho chúng ta cấu hình của một cặp module

L1 data và L1 inst. Bảy cặp còn lại cấu hính hoàn toán
tương tự. Hình 8: Cấu hình cho các module bộ nhớ chính
Đến đây, phần cấu hình cho các module đã hoàn tất.
Tiếp theo là phần cấu hình cho các nhân. Việc cấu hình
các nhân là tương tự nhau nên chúng tôi chỉ trình bày
cấu hình cho một nhân trong hình 9.
Hình 6: Cấu hình cho các module L1 Cuối cùng, phần cấu hình cho mạng nội bộ được trình
bày trong hình 10. Cấu hình một mạng phải hoàn tất rất
Trong hình 7, các module L2 được cấu hình với dung nhiều chi tiết nhỏ về nút mạng và các liên kết, do khuôn
lượng lớn hơn nhiều so với các module L1. khổ bài báo có giới hạn nên chúng tôi chỉ trình bày tiêu
374
374
Hình 11: Sự biến thiên của MissRatio khi thay đổi dung
Hình 9: Cấu hình cho các nhân lượng cache
cache. Đầu tiên, chúng ta cùng xem xét HitRatio trung

biểu một số phần.
bình tại các cache L1, ứng với 8 nhân của CMP.
(a) Tổng quan về mạng (b) Cấu hình nút
(c) cấu hình liên kết
Hình 10: Cấu hình cho mạng nội bộ Hình 12: HitRatio ở mức L1 tại các cache tương ứng với
8 nhân của chip CMP
Một cách trực quan, hình 13 cho chúng ta nhận thấy

C. Chạy mô phỏng và thống kê kết quả
ngay HitRatio ở các cache Inst, hay các cache chứa lệnh,
Đầu tiên, chúng tôi muốn tìm một mức dung lượng cao hơn hẳn so với ở các cache dữ liệu. Điều này được
L1, và L2 tối ưu nhất cho Splash-2. Hình 11 cho ta lý giải như sau: trong kiến trúc X86, mỗi lệnh đều có
thấy thống kê về tỷ lệ cache miss ở L1 theo thay ít nhất một đối số, trong đó chủ yếu là các lệnh có 2
đổi theo dung lượng cache L1 và L2. Dễ hiểu rằng đối số. Do đó, số lượng lệnh trong một chương trình ít
khi dung lượng cache L1 tăng lên thì tỷ lệ miss ở hơn nhiều, có khi chỉ bằng phân nửa số lượng địa chỉ
L1 sẽ giảm. Trục hoành là dung lượng của cache dữ liệu. Điều này dẫn đến cache dữ liệu nhanh đầy hơn,
L1/L2 tương ứng là: 8K/64K, 16K/128K, 32K/256K, số địa chỉ bị loại ra cũng nhiều hơn dẫn đến nhân phải
64K/512K, 128K/1024K, 256K/2048K. Từ kết quả trên truy xuất xuống bộ nhớ chính để lấy dữ liệu tại địa chỉ
hình 11, chúng ta thấy khi dung lượng L1 tăng lên đến đó trong tương lai khi cần.
64K thì tỷ lệ cache miss không giảm nữa mà đạt tới mức Tiếp theo, chúng ta cùng xem xét MissRatio tại các
bão hoà. Điều này chứng tỏ các ứng dụng trong Splash-2 mức cache theo các chương trình khác nhau. Những
có không gian địa chỉ làm việc nằm trong tầm 64 KB. chương trình khác nhau sẽ chứa những lệnh và dữ liệu
Do đó trong các bước mô phỏng tiếp theo, chúng tôi khác nhau, do đó, kết quả sẽ rất khác nhau giữa các
chọn sử dụng dung lượng cache L1 bằng 64 KB. chương trình. Chúng ta cùng xem hình 13 để thấy sự
Tiếp theo, chúng tôi chạy mô phỏng nhiều lần cho tất khác biệt này.
cả 11 chương trình benchmark trong Splash-2 với thiết Trong nhiều trường hợp, chúng ta có thể quan sát được
kế đã trình bày ở phần trước. Ứng với mỗi chương trình, dễ dàng MissRatio ở L2 là cao nhất, và L1-Inst là thấp
chúng tôi cho cả 8 nhân cùng chạy, mỗi nhân chạy một nhất. Benchmark thứ 9 - Raytrace là một ngoại lệ khi
tiểu trình giải quyết một phần của bài toán. Với mục tiêu MissRatio ở L1 rất cao. Lý do là chương trình Raytrace
xem xét hiệu quả của phân cấp bộ nhớ, chúng tôi quan làm việc trên một kích thước dữ liệu lớn và có mức
tâm đến các thông số HitRatio và MissRatio, chính là độ rời rạc cao hơn so với các chương trình khác trong
tỉ lệ truy xuất dữ liệu thành công và thất bại ở bộ nhớ Splash-2. Cache L2 có tỉ lệ MissRatio cao nhất cũng là
375
375
D. Thảo luận về kết quả

Phần IV-C chỉ trình bày các kết quả một cách trực
quan, chúng ta sẽ thảo luận chi tiết hơn về kết quả. Tính
toán cụ thể cho ta các kết quả trong bảng VI.
Cache HitRatio
L1-Inst 98.5 %
L1-Data 90.8 %
L1-Average 94.7 %
L2 86.6 %
Bảng VI: HitRatio ở các mức cache

Hình 13: MissRatio ở các mức cache khi chạy 11
benchmark trong Splash-2
Từ bảng VI, chúng ta dễ dàng tính được tỉ lệ truy xuất
thất bại ở cả 2 mức cache là 0.7%, nghĩa là cache đã
điều dễ hiểu khi L1 là nơi chứa các lệnh và dữ liệu phổ hỗ trợ CMP trong việc truy xuất bộ nhớ ở 99.3% trường
biến nhất, những gì lưu ở L2 có mức độ phổ biến thấp hợp. Đây thật sự là một con số rất ấn tượng.
hơn nên khả năng tái truy xuất cũng thấp hơn, từ đó dẫn
đến MissRatio tăng.
V. KẾT LUẬN
Để phân tích sự cân bằng của Splash-2 trong việc sử
dụng nguồn lực trên chip, chúng tôi thực hiện thí nghiệm Nghiên cứu này đã trình bày có kết hợp thực nghiệm
như trên hình 14 và 15. Hai hình này thể hiện tương ứng việc thiết kế vi xử lý đa nhân sử dụng Multi2Sim. Chúng
phần trăm yêu cầu đọc và ghi từ các nhân trên chip. Kết tôi cũng đã sử dụng benchmark chuẩn Splash-2 để đánh
quả trên cả 2 hình cho thấy các tác vụ thực thi được giá thiết kế CMP và từ đó đánh giá một số đặc tính của
phân chia một cách cân bằng giữa các nhân xử lý. Riêng Splash-2 như dung lượng tối ưu của cache L1 và L2 để
nhân xử lý số 1 luôn có tỷ lệ truy xuất bộ nhớ cao vì thực thi Splash-2, sự phân chia tác vụ của Splash-2 lên
đây là nhân mặc định là nhân chủ, ngoài việc thực hiên các nhân trong hệ thống. Kết quả cho thấy sự phân bố
riêng tác vụ được phân, nhân này sẽ thực hiện việc quản tác vụ khá đều của Splash-2 lên 8 nhân của hệ thống
lý toàn bộ chương trình. và hệ thống tối ưu về hiệu suất ở dung lượng cache L1
bằng 64 KB.
VI. CÁM ƠN
Nghiên cứu này được tài trợ một phần kinh phí từ
đề tài cấp nhà nước theo hợp đồng số 01/2011/HD-
KHCN/ICDREC.
TÀI LIỆU
[1] IBM Research Laboratoty. “64-Bit CPUs: Alpha, SPARC, MIPS,
and POWER,” PC Magazine. February 21, 2002
Hình 14: Phân bố lệnh Read theo các nhân của CMP
[2] Sandeep Shukla et al. "A Brief History of Multiprocessors and
EDA". Design and Test of Computer. Vol 28, issue 03, pp: 96.
May/June 2011
[3] W. Wolf, “The future of multiprocessor systems-on-chips”. Proc.
41st Annu. Des. Autom. Conf. pp. 681–685. 2004
[4] D. E. Culler, J. P. Singh, and A. Gupta. Parallel Computer
Architecture: A Hardware/Software Approach. San Francisco,
CA: Morgan Kaufmann. 1999
[5] Nathan Blinker et al. The Gem5 Simulator. ACM SIGARCH
Computer Architecture News, 2011
[6] Rafael Ubal and David Kaeli et al. “The Multi2Sim Simulation
Framework: A CPU-GPU Model for Heterogeneous Computing”.
The 20st International Conference on Parallel Architectures and
Compilation Techniques (PACT). 2011
[7] Doug Burger and Todd M. Austin. "The SimpleScalar Tool
Hình 15: Phân bố lệnh Write theo các nhân của CMP Set, Version 2.0". University of Wisconsin-Madison Computer
Sciences Department Technical Report No. 1342. June, 1997
376
376
[8] Christian Bienia, Sanjeev Kumar, Jaswidner Pal Singh and Kai Management Policies". In International Symposium on Microar-
Li. "The PARSEC Benchmark Suite: Characterization and Ar- chitecture (MICRO), Atlanta, Georgia. December 2010
chitectural Implications". Technical Report TR-811-08, Princeton [29] Ying Zheng, Brian T. Davis and Matthew Jordan. "Performance
University. January 2008 Evaluation of Exclusive Cache Hierarchies". Performance Anal-
[9] Major Bhadauria, Vince Weaver and Sally A. McKee. "A Char- ysis of Systems and Software, IEEE International Symposium on
acterization of the PARSEC Benchmark Suite for CMP De- - ISPASS. 2004
sign". Technical Report CSL-TR-2008-1052, Cornell University. [30] Norman P. Jouppi. "Cache Write Policies and Performance".
September 2008 Proc. 20th International Symposium on Computer Architecture
[10] Barrow-Williams, Nick, Christian Fensch, and Simon Moore. (ACM Computer Architecture News), pp 191-201. 1993
"A communication characterisation of Splash-2 and Parsec." [31] Gernot Heiser. "Cache write policy". Lecture notes in Advanced
Workload Characterization, 2009. IISWC 2009. IEEE Interna- Operating Systems course. UNSW 2002
tional Symposium on. IEEE, 2009 [32] Daniel J. Sorin, Mark D. Hill, David A. Wood. "A Primer on
[11] Steven Cameron Woo et al. "The SPLASH-2 Programs: Char- Memory Consistency and Cache Coherence". Morgan Claypool
acterization and Methodological Considerations". Proceedings Publishers. 2011
of the 22nd Annual International Symposium on Computer [33] Hesham Altwaijry, Diyab S. Alzahrani. "Improved-MOESI
Architecture. June 1995 Cache Coherence Protocol". Arabian Journal for Science and
[12] Maurice V. Wilkes. "Moore’S law and the future". Technical Engineering, Volume 39, Issue 4, pp 2739-2748. 2014.
report. 2002 [34] F. J. JIMÉNEZ et al. "Teaching the cache memory coherence
[13] Clements, Alan. "Principles of Computer Hardware". Oxford with the MESI protocol simulator". Spain.
University press. 2006 [35] K. Hwang and Z. Xu. "Scalable Parallel Computing: Tech-
[14] Toy, Wing and Zee, Benjamin. "Computer Hardware/Software nology, Architecture, Programming". McGraw-Hill, New York.
Architecture". Prentice Hall. 1986 1998.
[15] Hennessy, John and David A. Patterson. "Patterson, David.
Computer Architecture: A Quantitative Approach (Fifth ed.)".
Elsevier publishing house. 2012
[16] Rajeev Balasubramonian et al. "Memory Hierarchy Reconfigu-
ration for Energy and Performance in General Purpose Processor
Architectures". Proceeding MICRO 33 Proceedings of the 33rd
annual ACM/IEEE international symposium on Microarchitec-
ture. Pages 245-257. 2000
[17] Harvey G. Cragon. "Memory systems and pipelined processors,
Chapter 4.1: Cache Addressing, Virtual or Real". 1996
[18] Nader Khammassi and Jean-Christophe Le Lannn. "Design and
implimentation of a cache hierachy aware task scheduling for
parallel loops on multicore architectures". Computer Science and
Information Technology, pp 427-439. 2014
[19] Fang Zheng, Chitra Venkatramani, Rohit Wagle and Karsten
Schwan. "Cache Topology Aware Mapping of Stream Processing
Applications onto CMPs". IEEE 33rd International Conference
on Distributed Computing Systems. 2013
[20] Sukumar Ghosh. "Cache memory". Lecture notes in Computer
Organization course. 2015
[21] Mark D.Hill and Alan Jay Smith. "Evaluating Associativity in
CPU Caches". IEEE Transactions on Computers. Vol 38. 1989
[22] Paul Genua. "A Cache Primer". Freescale Secmiconductor. 2004
[23] Sangyeun Cho and Lory Al Moakar. "Augmented FIFO cache
replacement policies for low power embedded processor". Jour-
nal of Circuits, Systems, and Computers, Vol. 18, No. 6, pp
1081–1092. 2009
[24] Nan Guan, Xinping Yang, Mingsong Lv and Wang Yi. "FIFO
Cache Analysis for WCET Estimation: A Quantitative Ap-
proach". Proc. of DATE. 2013
[25] O’Neil, Elizabeth J. O’Neil, Patrick E. Weikum, Gerhard.
"The LRU-K Page Replacement Algorithm for Database Disk
Buffering". Proceedings of the ACM SIGMOD International
Conference on Management of Data, pp 297–306. 1993
[26] Nimrod Megiddo and Dharmendra S. Modha. "Outperforming
LRU with an Adaptive Replacement Cache Algorithm". Com-
puter journal. Published by the IEEE Computer Society. 2004
[27] Natalie Enright and Dana Vantrease. "To Include or Not To
Include: The CMP Cache Coherency Question". Final report
CS838
[28] Aamer Jaleel, Eric Borch, Malini Bhandaru, Simon C. Steely
Jr, and Joel Emer. "Achieving Non-Inclusive Cache Performance
With Inclusive Caches Temporal Locality Aware (TLA) Cache
377
377
Phát hiện bất thường trong dáng đi ở người dựa

trên khung xương sử dụng mô hình Markov ẩn
Nguyễn Trọng Nguyên, Huỳnh Hữu Hưng
Khoa Công nghệ Thông tin, Đại học Bách khoa, Đại học Đà Nẵng, Việt Nam
Email: {ntnguyen, hhhung}@dut.udn.vn
Tóm tắt—Phát hiện bất thường trong dáng đi ở người là thông tin về dáng đi và thông số về thăng bằng được
bài toán đang được nghiên cứu rộng rãi trong lĩnh vực thị xác định thông qua cảm biến gắn trên người. Trong 44
giác máy tính nói chung và chăm sóc sức khỏe nói riêng. thông số thu được từ các cảm biến, 29 giá trị cho hiệu
Đây là một vấn đề phức tạp bởi sự tồn tại của nhiều loại
bất thường trong dáng đi khác nhau, ví dụ lê bước do đau
quả phân loại tốt giữa hai nhóm bệnh nhân: có và không
khớp gối hay trọng tâm cơ thể thay đổi liên tục khi đi có tiền sử chấn thương do té ngã. Kết quả dự đoán khả
khom lưng, và không phải tất cả đều có sẵn mẫu. Trong năng bị ngã trong quá khứ đạt hiệu quả gần 80% với sự
bài báo này, chúng tôi đề xuất giải pháp phát hiện dáng hỗ trợ của mô hình hồi quy. Mặc dù các nghiên cứu nêu
đi bất thường ở người dựa trên việc xây dựng một mô trên mang lại hiệu quả hứa hẹn trong việc phát hiện sự
hình dáng đi bình thường. Cụ thể, mô hình này được tạo cố trong quá trình di chuyển cũng như đánh giá nguy
ra dựa trên mối quan hệ về vị trí của một tập các khớp
cơ té ngã, nhưng việc sử dụng các cảm biến lại mang
xương và sự biến đổi của các thông số này theo thời gian.
Kết quả thực nghiệm trên 5 đối tượng với hai kiểu dáng đến sự bất tiện bởi người dùng luôn phải gắn chúng lên
đi bất thường cho thấy giải pháp đề xuất mang lại kết quả người. Bên cạnh đó, chức năng theo dõi của cảm biến
hứa hẹn trong việc giải quyết bài toán đặt ra. bị gián đoạn trong quá trình nạp lại năng lượng (ví dụ
Từ khóa—Dáng đi, chu kỳ, khung xương, phân cụm, sạc pin). Ngoài ra, chi phí cho thiết bị khá lớn khi mỗi
mô hình hóa. người cần trang bị một bộ cảm biến riêng.
Để khắc phục các hạn chế nêu trên, các nhà nghiên
I. GIỚI THIỆU cứu hướng đến các hệ thống thị giác máy tính và xây
Các chấn thương liên quan đến xương được xem như dựng các giải pháp tương ứng. Ở [4], các tác giả sử dụng
các tác nhân nguy hiểm có ảnh hưởng lớn đến sức khỏe một cặp camera đã hiệu chuẩn, gắn cố định tại ví trí cao
ở người cao tuổi. Nhiều giải pháp đánh giá sức khỏe trên tường nhà. Các camera thu ảnh với tốc độ 5 khung
người già đã được đề xuất với sự hỗ trợ của các hệ hình mỗi giây cùng với độ phân giải 640 × 480 điểm
thống tự động. Một số nghiên cứu thực hiện việc phân ảnh. Hình chiếu của đối tượng chuyển động được xác
tích dáng đi với sự hỗ trợ của các cảm biến gia tốc được định dựa trên thông tin màu và kết cấu. Các kết quả thu
gắn trong giày [1] hoặc trên người [2]. Các thiết bị này được sau đó được ánh xạ vào một không gian rời rạc
được dùng để ước lượng các thông số liên quan đến dựa trên các thông số nội và ngoại của quá trình hiệu
dáng đi như độ dài sải chân, chiều dài bước, hay tốc độ chuẩn, từ đó xây dựng đối tượng 3 chiều tương ứng. Với
di chuyển. mỗi chuỗi ảnh bước đi, các vị trí của bước chân được
Ở [1], một mô hình dáng đi bất thường ở người được đánh dấu. Cuối cùng, các thông số (liên quan đến tọa
xây dựng dựa trên kĩ thuật mô hình Markov ẩn kết hợp độ 3 chiều) của các vị trí này được tính toán. Mặc dù
với thông tin ngón chân được thu bởi cảm biến gắn trong các thông số vật lý có thể được ước tính tương đối chính
giày bao gồm các con quay hồi chuyển ba chiều và gia xác, nhưng độ phức tạp cùng với chi phí tính toán của
tốc kế có tác dụng ước lượng vận tốc góc và gia tốc của quá trình hiệu chuẩn và đồng bộ có thể trở thành vấn đề
bàn chân. Ngoài ra, bốn điện trở cảm biến lực căng và ảnh hưởng đến hiệu suất hoạt động của hệ thống, đặc
cảm biến uốn cong cũng được gắn trên đế giày để thu biệt là việc tái cấu trúc đối tượng 3 chiều.
nhận thông tin về lực. Các đặc trưng dùng cho việc mô Một số nghiên cứu khác phân tích dáng đi dựa trên
hình hóa được trích xuất dựa trên phương pháp phân ảnh màu thu từ một camera duy nhất. Giải pháp đề xuất
tích thành phần chính (PCA) [3]. Việc đánh giá dáng đi ở [5] sử dụng luồng quang học kết hợp với phân tích
được thực hiện dựa trên độ đo tương tự. Nghiên cứu [2] thành phần chính để xây dựng đặc trưng. Thuật toán
đánh giá nguy cơ té ngã ở 349 người cao tuổi dựa trên k láng giềng gần nhất (k-NN) dựa trên khoảng cách
378
ISBN: 978-604-67-0635-9 378

Hausdorff được sử dụng để thực hiện việc phân lớp. tôi chỉ sử dụng xương thuộc phần nửa dưới cơ thể, bao
Hạn chế lớn nhất của giải pháp này là khả năng tích gồm xương hông, xương đùi, cẳng chân và bàn chân.
hợp vào các hệ thống xử lý theo thời gian thực bởi chi Các xương này cung cấp thông tin đáng tin cậy trong
phí tính toán dựa trên luồng quang học khá lớn. Ngoài việc phân biệt các kiểu bước đi khác nhau. Lưu ý rằng
ra, mức độ tổng quát hóa của giải pháp không được khái niệm khung xương trong bài báo này ý chỉ dạng
đảm bảo bởi việc thực nghiệm chỉ được áp dụng trên thông tin được cung cấp bởi Kinect, không hoàn toàn
hai bộ dữ liệu thu bởi một người duy nhất. Ở [6], các giống xương trong lĩnh vực sinh học, y tế. Đối với việc
nhà nghiên cứu mã hóa hình dạng đối tượng dựa trên bước đi bình thường, tư thế người thường thỏa mãn một
việc chia lưới. Thông tin về chuyển động của đối tượng số điều kiện nhất định, ví dụ góc hình học tương ứng
được xây dựng bằng cách ghép nối chuỗi các vectơ đặc với các khớp xương sẽ nằm trong một miền giá trị cụ
trưng tương ứng với các khung hình theo thời gian. Mỗi thể, tùy thuộc từng loại khớp. Nhiều nghiên cứu đã chỉ
mẫu như vậy được phân loại dựa trên bộ phân lớp máy ra rằng con người thực hiện việc di chuyển bằng cách
vectơ tựa (SVM). Mặc dù độ chính xác đạt được 70- lặp lại một dạng thức chuyển động nhất định [7]. Ngoài
80%, việc đánh giá dáng đi trong một khoảng thời gian ra, sự tuần hoàn trong chuyển động của các bộ phận
theo phương pháp trên vẫn tồn tại hạn chế. Sự xuất hiện cơ thể cũng có thể được quan sát rõ đối với việc bước
của một vài tư thế bất thường (ví dụ trường hợp ảnh thu đi bình thường, trong khi sự ngẫu nhiên thường tồn tại
được bị ảnh hưởng bởi nhiễu) trong một chuỗi chuyển trong dáng đi bất thường.
động bình thường sẽ làm sai lệch đáng kể kết quả phân Sự bất thường trong dáng đi ở người có thể không
lớp. Giải pháp được đề xuất trong bài báo này hướng tồn tại cả trong trường hợp không có sự xuất hiện của
đến việc khắc phục các hạn chế nêu trên. tư thế bất thường, mà có thể là một chuỗi các tư thế
Qua khảo sát, chúng tôi nhận thấy rằng tư thế người bình thường. Nói cách khác, thông tin về tư thế là chưa
có thể được đánh giá dựa trên khung xương, và một đủ để đánh giá dáng đi. Do đó, ta cần xem xét sự kết
chuỗi các khung xương như vậy có thể biểu diễn thông hợp của một loạt tư thế theo thời gian. Ví dụ, tư thế
tin về dáng đi. Trong bài báo này, chúng tôi đề xuất giải khác thường có thể không quan sát được trong quá trình
pháp xây dựng mô hình dáng đi bình thường nhằm phát đi lại ở người bị nhức xương (nhẹ), nhưng có thể nhận
hiện sự bất thường trong quá trình di chuyển ở người. thấy dựa trên tốc độ di chuyển. Vì vậy, chúng tôi xem xét
Đầu vào của hệ thống là khung xương và tọa độ 3 chiều dáng đi theo từng quãng thời gian, cụ thể là chu kỳ bước
của các khớp được cung cấp bởi camera Kinect. Thông đi trong nghiên cứu này, tương ứng với một chuỗi tư thế
tin này được xác định dựa trên ảnh độ sâu được thu bởi p(t). Ý tưởng chính được chúng tôi đưa ra là mô hình
hệ thống cảm biến hồng ngoại bên trong Kinect. Ảnh hóa dáng đi bình thường ở người trong một chu kỳ. Cụ
này có thể được thu với tốc độ 30 khung hình mỗi giây thể, mỗi chuỗi ảnh biểu diễn việc di chuyển được tách
và độ phân giải 640 × 480, đồng thời không bị tác động thành các chu kỳ, mỗi chu kỳ được biểu diễn bởi một
bởi ánh sáng môi trường. Tư thế người trong mỗi khung dãy các từ mã tương ứng với các vectơ đặc trưng trích
hình được chúng tôi biểu diễn bởi các góc khớp thuộc xuất từ khung xương ở tư thế p(t). Một giá trị ngưỡng
nửa dưới cơ thể và một thông số hình học liên quan. được ước lượng tự động trong quá trình huấn luyện được
Phần còn lại của bài báo được tổ chức như sau. Phần dùng để quyết định một chu kỳ là bình thường hay bất
II trình bày ý tưởng chính giải quyết vấn đề đặt ra. Giải thường. Quá trình xử lý cụ thể được trình bày chi tiết
pháp đề xuất được trình bày chi tiết trong phần III. Trong trong phần tiếp theo.
phần IV, chúng tôi tiến hành thực nghiệm và phân tích
kết quả. Cuối cùng, kết luận được đưa ra trong phần V. III. GIẢI PHÁP ĐỀ XUẤT
Tổng quan giải pháp được thể hiện ở hình 1.
II. PHÁT HIỆN DÁNG ĐI BẤT THƯỜNG
Trong một chuỗi ảnh biểu diễn quá trình bước đi ở A. Trích xuất đặc trưng
người, thông tin dễ dàng quan sát nhất là tư thế tại một Dữ liệu vào của hệ thống là chuỗi khung xương với
thời điểm t cụ thể, p(t). Thông thường, mỗi tư thế chứa các khớp cơ bản (cổ, vai, gối,...) tương ứng với cơ thể
đựng thông tin về hướng, vị trí và mối quan hệ giữa người được xác định dựa trên ảnh độ sâu cùng với mật
các đoạn xương nối tiếp trong khung xương tương ứng độ xác suất tương ứng với từng loại khớp [8]. Tập hợp
với cơ thể người. Đây được xem là đơn vị thông tin cơ các xương và khớp được sử dụng để mô tả tư thế người
bản dùng để biểu diễn dáng đi ở người theo thời gian. có thể khác nhau tùy thuộc từng bài toán. Ở đây, vì dáng
Trên thực tế, việc trích xuất thông tin tất cả các xương đi được đặc trưng bởi chuyển động của vùng xương nửa
là điều không cần thiết. Để đánh giá dáng đi, chúng dưới cơ thể, nên chúng tôi chỉ sử dụng các khớp xương
379
379
Khung hình: F1 F2 ... Ft Ft+1 ... Fm ... Fn

−
→
v = (xC − xB , yC − yB , zC − zB ) = (v1 , v2 , v3 )
Khung xương: S1 S2 ... St St+1 ... Sm ... Sn (2)

Đặc trưng: V1 V2 ... Vt Vt+1 ... Vm ... Vn →
−u .−
→
v
= (−
ABC →u,−
→v ) = cos−1 →
u −
− →v
u 1 v 1 + u2 v 2 + u 3 v 3
Từ mã: W1 W2 ... Wt Wt+1 ... Wm ... Wn −1
= cos 2 (3)
u1 + u22 + u23 v12 + v22 + v32
Chu kỳ bước đi: C1 C2 ... Cx Sáu đặc trưng đầu tiên được ước lượng dựa trên cả ba
phương trình (1), (2) và (3), trong khi đặc trưng thứ 7 ở
Xây dựng mô hình / Nhận dạng bảng I có một ít khác biệt. Tọa độ của cả 6 khớp tương
ứng với 6 đặc trưng trước đó đều được sử dụng, chia
Hình 1: Tổng quan giải pháp đều cho mỗi chân. Giá trị góc đặc trưng được tính dựa
trên góc giữa hai vectơ pháp tuyến tương ứng với từng
mặt phẳng chân. Cho đến lúc này, tư thế người trong
mỗi khung hình được biểu diễn bởi một vectơ 7 phần
tử. Nhằm đơn giản hóa việc biểu diễn dáng đi, các vectơ
này được chuyển đổi thành một tập các từ mã.
2 1
B. Chuyển đổi vectơ sang từ mã
Quá trình này hướng đến mục tiêu biểu diễn tư thế
KP
3 KT người trong mỗi khung hình bởi một giá trị vô hướng
4
thay vì vectơ. Điều này giúp loại bỏ các sai lệch nhỏ
của cùng một tư thế (tồn tại bởi nhiễu hay bởi các dáng
6 5 người khác nhau). Việc chuyển đổi này được thực hiện
bởi giải thuật phân cụm k-means, được sử dụng khá
Hình 2: Các đặc trưng và vị trí khớp tương ứng nhiều trong các nghiên cứu về thị giác máy tính bởi
KT: các khớp tạo thành mặt phẳng chân trái tính đơn giản và hiệu quả. Các vectơ được nhóm lại dựa
KP: các khớp tạo thành mặt phẳng chân phải trên khoảng cách trong không gian. Trước hết, k tâm
tương ứng với k cụm được khởi tạo ngẫu nhiên từ các
điểm dữ liệu sẵn có. Tiếp theo, khoảng cách giữa tất cả
từ phần hông trở xuống. Để tránh bị ảnh hưởng bởi các các điểm dữ liệu đến mỗi tâm được đo. Mỗi điểm như
kích thước cơ thể khác nhau, chỉ có các giá trị góc được vậy được gán vào cụm có tâm nằm gần nó nhất. Tọa độ
sử dụng thay vì những thông tin liên quan đến độ dài tâm từng cụm được cập nhật bằng cách tính trung bình
của xương. Có tất cả 7 giá trị, gồm 6 góc khớp và 1 góc tọa độ tất cả các điểm trong cụm. Quá trình này lặp lại
mặt phẳng hình học, được chúng tôi sử dụng để mô tả cho đến khi không có sự thay đổi tâm cụm bất kỳ. Các
tư thế cơ thể người trong mỗi khung hình như trình bày vectơ bên trong mỗi cụm được chuyển đổi thành một từ
ở bảng I và minh họa trong hình 2. mã có giá trị nhất định, mỗi cụm mang một giá trị từ
Đặc trưng tương ứng với mỗi khớp được tính toán mã khác nhau.
dựa trên tọa độ ba chiều của ba khớp liên quan. Giả
C. Phân tách chu kỳ bước đi
sử ta quan tâm đến góc khớp B được tạo thành bởi
các đoạn xương BA và BC, trong đó A(xA , yA , zA ), Chúng tôi định nghĩa các chu kỳ bước đi dựa trên một
B(xB , yB , zB ) và C(xC , yC , zC ) là các khớp. Giá trị thông số vật lý có tính tuần hoàn một cách tương đối.
góc khớp B có thể được xác định dễ dàng dựa trên các Trong giải pháp đề xuất, chúng tôi chọn khoảng cách
công thức hình học sau: giữa hai mắt cá chân bởi giá trị này có biến đổi dạng
sóng theo thời gian. Tuy vậy, khoảng cách này thường
−
→ bị dao động nhẹ bởi kĩ thuật định vị khớp của Kinect.
u = (xA − xB , yA − yB , zA − zB ) = (u1 , u2 , u3 ) Do đó, việc áp dụng một bộ lọc làm mượt là điều cần
(1) thiết trước khi tiến hành phân tách chu kỳ bước đi. Kĩ
380
380
ID Góc đặc trưng Góc tạo thành bởi

1 Hông trái Xương hông trái Xương đùi trái
2 Hông phải Xương hông phải Xương đùi phải
3 Đầu gối trái Xương đùi trái Ống chân trái
4 Đầu gối phải Xương đùi phải Ống chân phải
5 Mắt cá chân trái Ống chân trái Bàn chân trái
6 Mắt cá chân phải Ống chân phải Bàn chân phải
7 Hai mặt phẳng chân Mặt phẳng các khớp chân trái Mặt phẳng các khớp chân phải
Bảng I: Các đặc trưng mô tả tư thế khung xương
thuật làm mượt theo hàm mũ được sử dụng với công
khoảng cách (cm)

thức tổng quát

xt t=0
st = (4)
αxt + (1 − α)st−1 t>0
với α là hệ số làm mượt (0 < α < 1), t là thứ tự khung hình

khung hình theo thời gian, xt và st lần lượt là khoảng trung vị
cách đo được và khoảng cách đã làm mượt. cực đại cực đại
Sau khi có được các giá trị khoảng cách (dạng sóng),
khoảng cách (cm)
mỗi chu kỳ bước đi được xác định dựa trên từng cặp
giá trị cực đại cục bộ liên tiếp với sự hỗ trợ của một
cửa sổ trượt có kích thước cố định. Chúng tôi sử dụng
kĩ thuật này không chỉ bởi sự đơn giản và trực quan mà chu kỳ
còn bởi khả năng ứng dụng trong các hệ thống thực thi
theo thời gian thực. Tại thời điểm t, cửa sổ trượt xem xét khung hình
một chuỗi giá trị khoảng cách từ thời điểm (t − n + 1)
đến t, với n là chiều rộng cửa sổ. Nếu giá trị cực đại Hình 3: Quá trình phân tách chu kỳ bước đi
của chuỗi nằm ở trung vị, tư thế người ở khung hình Biểu đồ trên: dữ liệu thô
tương ứng được xem như một đầu của chu kỳ, tương Biểu đồ dưới: dữ liệu đã làm mượt
ứng với điểm kết thúc của chu kỳ trước và điểm bắt đầu
của chu kỳ tiếp theo. Để tránh trường hợp vẫn tồn tại
dao động nhỏ sau khi làm mượt, các ngưỡng thống kê chuỗi bằng nhau để tính khoảng cách, ví dụ dynamic
(ví dụ độ lệch chuẩn) hoặc các kĩ thuật hồi quy có thể time warping [9]. Trong khi đó, độ dài của chuỗi, hay
được áp dụng để xử lý vấn đề này. Vì Kinect có miền thời gian thực hiện chu kỳ, là một đặc điểm quan trọng
quan sát thuộc một phạm vi độ sâu cố định nên ta có để đánh giá chu kỳ đó. Việc bước đi một quãng đường
thể ước lượng kích thước cửa sổ dựa trên vị trí lắp đặt ngắn với một quãng thời gian lớn là biểu hiện của việc
camera thực tế mà vẫn đảm bảo độ ổn định trong việc cơ thể có vấn đề.
tách chu kỳ. Một ví dụ minh họa cách tách chu kỳ dựa Mô hình dáng đi bình thường được chúng tôi xây
trên khoảng cách giữa hai mắt cá chân được trình bày dựng dựa trên kĩ thuật mô hình Markov ẩn (HMM) [10]
trong hình 3. cùng với một tập các chu kỳ tương ứng với dáng đi bình
thường. HMM được chọn bởi nó có thể biểu diễn tốt sự
D. Xây dựng mô hình dáng đi bình thường chuyển đổi giữa các tư thế trong quá trình di chuyển ở
Có nhiều kĩ thuật khác nhau thường dùng để giải quyết người. Một lý do khác nữa để chọn HMM là bởi các
bài toán nhận dạng, trong đó phổ biến nhất là so khớp vectơ đặc trưng của các chu kỳ có độ dài khác nhau.
mẫu và sử dụng mô hình. Chúng tôi sử dụng phương Điều này khá quan trọng bởi trên thực tế, độ dài của
pháp thứ hai để thực hiện việc phân loại dáng đi vì lý do những vectơ này chịu ảnh hưởng bởi tốc độ di chuyển.
chính sau đây. Các chuỗi từ mã tương ứng với các chu Cấu trúc tổng quan của mô hình chúng tôi sử dụng được
kỳ bước đi có độ dài khác nhau. Do đó các kĩ thuật so minh họa ở hình 4. Lưu ý rằng số quan sát của mô hình
khớp thường co dãn các chuỗi này nhằm tạo ra các cặp được xác định bởi tham số k trong quá trình phân cụm.
381
381
a11 a22 an,n
a12 a23 an−1,n

q1 q2 qn
Hình 4: Mô hình Markov ẩn với n trạng thái qi , aij là

xác suất chuyển trạng thái từ i sang j.
E. Ước lượng ngưỡng

Giá trị ngưỡng dùng để phân biệt một chu kỳ thuộc
dáng đi bình thường hay bất thường được ước lượng dựa
trên giá trị trung bình và độ lệch chuẩn của logarit xác
suất các chu kỳ huấn luyện được sinh ra bởi mô hình đã
Hình 5: Các dáng đi thử nghiệm theo thứ tự từ trên
xây dựng. Độ lệch chuẩn thường được dùng trong thống
xuống: bình thường, bất đối xứng trái-phải và khom lưng
kê để xác định một giá trị nằm gần trị trung bình (bình
thường) hay quá lớn hoặc quá nhỏ (bất thường). Công
Người Bình thường Khom lưng Bất đối xứng hai chân
thức ước lượng ngưỡng có dạng tổng quát 01 26 42 41
02 43 48 48
n 03 68 59 56
i=1 (ζi − µ)2 04 27 45 46
θ =µ+λ (5) 05 21 48 35
n
với θ là ngưỡng, λ là một hằng số, n là số lượng chu Bảng II: Số lượng chu kỳ tương ứng với từng loại dáng
kỳ huấn luyện, ζ và µ lần lượt là logarit xác suất các đi được sử dụng trong thực nghiệm
chu kỳ đó và giá trị trung bình. Lưu ý rằng µ và λ là
các giá trị âm bởi logarit xác suất không phải số dương.
Một chu kỳ bước đi được xem là bình thường nếu logarit là bước đi với giả định lưng bị đau. Lúc này, trọng tâm
xác suất của nó tương ứng với mô hình đã xây dựng lớn cơ thể có xu hướng đổ về trước và một tay đặt vào chỗ
hơn ngưỡng θ. Ngược lại, hệ thống cho rằng có sự bất đau sau lưng. Vì vậy, trọng tâm cơ thể luôn chuyển đổi
thường xảy ra trong quá trình di chuyển ở người. Trong qua lại giữa hai chân, tùy vào chân bước về phía trước,
ứng dụng thực tế, một số luật có thể được áp dụng để và cơ thể có xu hướng nghiêng về cả hai bên trong quá
nâng cao hiệu quả nhận dạng, ví dụ như yêu cầu lượng trình di chuyển. Trong trường hợp tay đặt sau lưng, vị
tối thiểu các chu kỳ bất thường trong một quãng thời trí tay được Kinect định vị không chính xác, nhưng điều
gian để xác nhận. này không ảnh hưởng đến giải pháp chúng tôi đề xuất.
Cả ba dáng đi thực nghiệm được minh họa trong hình 5.
IV. THỰC NGHIỆM VÀ KẾT QUẢ Số lượng chu kỳ bước đi (được phân tách bởi kĩ thuật
Hiện nay chưa có bộ dữ liệu chuẩn về khung xương trình bày ở phần III.C) tương ứng với từng người trong
người trong quá trình bước đi cũng như các nghiên cứu bộ dữ liệu được trình bày ở bảng II.
tương tự trên đối tượng này, do đó chúng tôi sử dụng Mô hình dáng đi bất thường được xây dựng dựa trên
dữ liệu tự ghi và một số dữ liệu mocap thu thập từ 2/3 lượng chu kỳ dáng đi bình thường được chọn ngẫu
internet. Chúng tôi xây dựng hệ thống thử nghiệm dựa nhiên, với hệ số làm mượt α trong phương trình (4)
trên ngôn ngữ C#. Dữ liệu thử nghiệm được thu bởi 5 là 0.2 và hằng số λ trong (5) là −1.28. Qua khảo sát,
người thông qua Kinect trong môi trường nhà ở thực tế. chúng tôi nhận thấy chưa có giải pháp tối ưu hóa bài
Dữ liệu được chia thành 3 nhóm, bao gồm dáng đi bình toán chọn tham số cho mô hình Markov ẩn. Vì thế việc
thường, bất đối xứng trái-phải và khom lưng. Nhóm dữ thực nghiệm được tiến hành trên một lượng lớn các mô
liệu đầu tiên được ghi khi từng người đều bước đi một hình khác nhau và chọn ra mô hình cho hiệu quả cao
cách bình thường. Nhóm thứ hai mô phỏng việc bước đi nhất. Độ chính xác nhận dạng tương ứng với hơn 400
với một khớp gối bị đau. Khi đó, chân tương ứng không mô hình Markov ẩn thử nghiệm được trình bày ở hình 6.
thể co gối như thường lệ mà phải kéo lê, dẫn đến việc Mô hình cho kết quả cao nhất bao gồm 33 quan sát
trọng tâm dồn sang chân còn lại và cả thân người có xu và 16 trạng thái với độ chính xác 86.06%. Việc sử dụng
hướng nghiêng về một bên. Dáng đi bất thường còn lại một lượng lớn hơn các trạng thái hoặc quan sát sẽ làm
382
382
khớp. Việc sử dụng một ngưỡng thời gian có thể khắc

phục vấn đề này: chu kỳ quá ngắn có thể được bỏ qua
khỏi quá trình nhận dạng hoặc được nối với chu kỳ tiếp
số trạng thái
theo để tạo thành chu kỳ mới. Ngoài ra, việc xác nhận
sự bất bình thường với yêu cầu một lượng tối thiểu chu
kỳ bước đi bất thường trong một quãng thời gian cũng
có thể cải thiện độ chính xác của hệ thống.
V. KẾT LUẬN
Trong bài báo này, chúng tôi đã đề xuất giải pháp hỗ
số quan sát trợ việc đánh giá một dáng đi là bình thường hay không
Hình 6: Hiệu quả nhận dạng với các mô hình Markov bình thường ở người. Cụ thể, chúng tôi xây dựng mô
ẩn khác nhau hình dáng đi bình thường và ước lượng một ngưỡng tự
động giúp phân loại một chu kỳ bước đi có thuộc về mô
Bình thường
hình đó hay không. Đóng góp chính trong bài báo này
Bất thường là cách sử dụng những đặc trưng hình học trong khung
xương để biểu diễn dáng đi ở người theo chiều thời gian
số chu kỳ
và đánh giá trên từng phân đoạn (chu kỳ). Kết quả thực
nghiệm cho thấy giải pháp đề xuất mang lại hiệu quả
đầy hứa hẹn đồng thời đưa ra hướng cải tiến cho một
vài hạn chế còn tồn tại. Trong các nghiên cứu mở rộng,
chúng tôi sẽ tiếp tục đánh giá các đặc trưng mới và thử
áp dụng cho bài toán mô hình hóa dáng đi bệnh lý.
|ζ| TÀI LIỆU THAM KHẢO
Hình 7: Trị tuyệt đối logarit xác suất, |ζ| trong (5), được [1] M. Chen, B. Huang, and Y. Xu, “Human abnormal gait modeling
tính dựa trên mô hình Markov ẩn gồm 33 quan sát và via hidden markov model,” in Information Acquisition, 2007.
ICIA ’07. International Conference on, July 2007, pp. 517–522.
16 trạng thái. Ngưỡng được xác định tự động trong quá [2] B. Greene, A. Donovan, R. Romero-Ortuno, L. Cogan, C. N.
trình huấn luyện. Scanaill, and R. Kenny, “Quantitative falls risk assessment
using the timed up and go test,” Biomedical Engineering, IEEE
Transactions on, vol. 57, no. 12, pp. 2918–2926, Dec 2010.
[3] I. T. Jolliffe, “Principal Component Analysis and Factor Anal-
tăng chi phí tính toán, giảm khả năng áp dụng giải pháp ysis,” in Principal Component Analysis, ser. Springer Series in
Statistics. New York: Springer New York, 2002, ch. 7, pp.
này cho các hệ thống nhận dạng trực tiếp. Trong thực 150–166.
nghiệm, hệ thống của chúng tôi có thể thực thi theo [4] E. Stone and M. Skubic, “Passive in-home measurement of
thời gian thực. Giá trị tuyệt đối (nhằm nâng cao tính stride-to-stride gait variability comparing vision and kinect sens-
ing,” in Engineering in Medicine and Biology Society,EMBC,
trực quan) của logarit xác suất tương ứng với các chu 2011 Annual International Conference of the IEEE, Aug 2011,
kỳ bước đi bình thường và bất thường được biểu diễn pp. 6491–6494.
trong biểu đồ ở hình 7. [5] L. Wang, “Abnormal walking gait analysis using silhouette-
masked flow histograms,” in Pattern Recognition, 2006. ICPR
Độ chính xác trong thực nghiệm cho thấy giải pháp 2006. 18th International Conference on, vol. 3, 2006, pp. 473–
đề xuất mang lại hiệu quả hứa hẹn trong việc phát hiện 476.
sự bất thường trong quá trình bước đi ở người. Một số [6] “Automatic detection of abnormal gait,” Image and Vision Com-
puting, vol. 27, no. 1–2, pp. 108 – 115, 2009, canadian Robotic
cải tiến có thể được thực hiện để nâng cao chất lượng Vision 2005 and 2006.
của hệ thống. Một dáng đi bình thường có thể xuất hiện [7] D. A. Winter, Biomechanics and motor control of human move-
một vài chu kỳ bất thường nếu quỹ đạo chuyển động ment. John Wiley & Sons, 2009.
[8] J. Shotton, T. Sharp, A. Kipman, A. Fitzgibbon, M. Finocchio,
của các chu kỳ đó có dạng cong đáng kể. Tuy vậy, trên A. Blake, M. Cook, and R. Moore, “Real-time human pose
thực tế, người ta hiếm khi thay đổi hướng đi đột ngột recognition in parts from single depth images,” Commun. ACM,
trong nhiều chu kỳ bước đi liên tiếp. Vì vậy, hệ thống vol. 56, no. 1, pp. 116–124, Jan. 2013.
[9] “Correlation based dynamic time warping of multivariate time
có thể bỏ qua các chu kỳ có quỹ đạo cong (với mức series,” Expert Systems with Applications, vol. 39, no. 17, pp.
độ tùy chọn) để hạn chế trường hợp phân loại sai. Bên 12 814 – 12 823, 2012.
cạnh đó, một số chu kỳ với thời gian thực hiện rất ngắn [10] P. Fieguth, Statistical image processing and multidimensional
modeling. Springer Science & Business Media, 2010.
có thể tồn tại do sai số trong quá trình định vị tọa độ
383
383
HộiHội
ThảoThảo Quốc
2015 ĐiệnTử,
Tử,Truyền
TruyềnThông
Thông và
và Công
CôngNghệ
NghệThông
ThôngTinTin
(ECIT 2015)
(ECIT 2015)
Kỹ Thuật Nén Tiếng Nói Số Ứng Dụng Trong Thông

Tin Vô Tuyến Sóng Ngắn
TS. Nguyễn Nam Hải
Học viện Kỹ thuật mật mã
Email: nam_haivn@yahoo.com
Abstract— Trong thông tin liên lạc tầm xa qua kênh sóng sở cho một số hệ thống bảo mật thoại. Ban đầu, LPC được sử
ngắn HF, có nhiều nguyên nhân như nhiễu tầng điện li, giao thoa dụng với tốc độ 2.400bps, sau đó các phiên bản 1.200bps,
sóng, tín hiệu đến qua nhiều đường… nên tiếng nói thu được tại 800bps và 600bps được đưa ra trong các hệ thống chuẩn hoặc
máy thu khó có thể luôn đảm bảo được chất lượng tốt. Trong khi hệ thống riêng.
đó việc truyền số liệu tin cậy có thể đạt được chất lượng tốt ngay
cả trong điều kiện rất xấu. Điều này đã mang lại cho kỹ thuật Bộ nén tiếng nói “vocoder” thực chất là sự thực hiện quá
thoại số cả một lĩnh vực ứng dụng rộng lớn. Việc ứng dụng kỹ trình nén và giải nén tiếng nói bằng kỹ thuật số. Bộ nén tiếng
thuật tiếng nói đã đươc số hóa trong thông tin liên lạc HF tạo nói 600bps thường sử dụng các kỹ thuật nén khác hơn đối với
điều kiện cho việc bảo mật tiếng nói đạt được độ bảo mật cao. bộ nén 2.400bps. Trong ứng dụng thực tế có một sự “thỏa
Trước đây, việc bảo mật thoại được thực hiện bằng kỹ thuật xáo hiệp” nhất định giữa các bộ nén với các tốc độ khác nhau. Với
trộn ở trường tương tự. Mặc dầu kỹ thuật xáo trộn tương tự tốc độ số liệu 2.400bps, mang nhiều thông tin, tiếng nói thu
mang lại chất lượng tiếng nói tốt nhưng nó rất dễ bị những người được có chất lượng sẽ tốt. Ngoài ra, tại tốc độ này, độ trẽ toàn
nghe lén giải mã. Trong khi đó, mã thoại số được mã hóa dưới bộ quá trình xử lí sẽ ngắn nên độ trễ tín hiệu giũa hai đầu Phát-
dạng số hoàn toàn và có độ bảo mật cao như đối với số liệu. Thu sẽ ngắn. Tuy nhiên, lí do vì sao tốc độ nén 600bps cực kì
Trong phạm vi bài báo này chúng tôi không bàn đến vấn đề bảo hữu dụng trong thông tin liên lạc HF, đặc biệt đối với dòng
mật tiếng nói mà chỉ tập trung hệ thống một số kỹ thuật nén tiếng thiết bị cơ động mang vai khi yêu cầu liên lạc là 24h/ngày, đó
nói phổ biến và triển khai thực tế một giải pháp nén tiếng Việt
là dòng số liệu 600bps có thể thu được qua kênh truyền với tỉ
600 bps Twelp ứng dụng truyền thoại trên kênh HF.
số Tín/Tạp nhỏ hơn 10dB so với dòng số liệu 2.400bps. Đây là
Từ khóa— Sóng ngắn, kỹ thuật tiếng nói, HF, bảo mật tiếng lần đầu tiên người ta nhận thấy tiêng nói số tin cây hơn tiếng
nói. nói tương tự nhiều lần. Thêm vào đó, trong trường hợp truyền
tiếng nói số, tín hiệu nhiễu và tín hiệu từ máy phá sóng có thể
I. GIỚI THIỆU sẽ bị tự động lọc bỏ nhờ có khả năng cắt bỏ của Modem đơn
tone nối tiếp sử dụng trong việc truyền số liệu. Với ưu điểm
Tiếng nói là phương tiện chủ yếu mà con người sử dụng để
này kỹ thuật tiếng nói số có giá trị thật sự cao không thể phủ
liên lạc và giao tiếp hằng ngày. Ngày nay khi các phương tiện
nhận được trong lĩnh vực thông tin liên lạc dành cho quân sự.
truyền thông phát triển và số người sử dụng các phương tiện
liên lạc tăng lên thì mã hoá tiếng nói được nghiên cứu và ứng Trong bài báo này sẽ trình bày việc lựa chọn phương pháp
dụng rộng rãi trong các cuộc gọi điện thoại truyền thống, gọi nén tiếng nói tối ưu đối với tiếng Việt và việc tích hợp bộ nén
qua mạng di dộng, qua mạng Internet, qua vệ tinh, v.v... tiếng nói được chọn vào trong một hệ thống thu phát qua kênh
sóng ngắn.
Trong thông tin liên lạc tầm xa qua kênh sóng ngắn HF, do
có rất nhiều nguyên nhân như nhiễu tầng điện li, giao thoa II. CÁC PHƯƠNG PHÁP NÉN TIẾNG NÓI
sóng, tín hiệu đến qua nhiều đường nên tiếng nói thu được tại
máy thu khó có thể luôn có chất lượng tốt. Trong khi đó việc Để nén tín hiệu tiếng nói người ta sử dụng hai phương pháp:
truyền số liệu tin cậy luôn đạt được thậm chí trong những điều - Phương pháp nén dựa trên dạng sóng
kiện cực kì xấu. Sự thật này đã mang lại cho kỹ thuật thoại số - Nén theo thông số và nén theo thông số hỗn hợp (hybrid)
cả một lĩnh vực ứng dụng rộng lớn. Đối với phương pháp nén dựa trên dạng sóng, tiếng nói được
nén bằng việc giảm thiểu độ dư giữa các mẫu tiếng nói.
Không những thế, việc ứng dụng kỹ thuật tiếng nói số trong Phương pháp này chỉ có thể nén tiếng nói trong khoảng
thông tin liên lạc HF đã hỗ trợ cho việc bảo mật tiếng nói đạt
64kbps đến 16kbps.
được cấp độ mã hóa cao. Trước đây, việc bảo mật thoại được
thực hiện bằng kỹ thuật xáo trộn ở trường tương tự. Mặc dầu Ngược lại với phương pháp nén tiếng nói dựa trên dạng sóng,
kỹ thuật xáo trộn tương tự mang lại chất lượng tiếng nói tốt phương pháp nén theo thông số dựa trên cách tiếng nói được
nhưng nó rất dễ bị những người nghe lén giải mã. Trong khi tạo ra như thế nào. Thay vì truyền các mẫu dạng sóng tín hiệu
đó, thoại số được mã hóa dưới dạng số hoàn toàn và nó có thể tiếng nói người ta sẽ chỉ truyền các thông số liên quan đến cơ
có độ bảo mật cao như đối với số liệu. chế tạo ra tiếng nói đến bên thu và tại bên thu tiếng nói sẽ
được từ mô hình tạo tiếng nói. Như vậy bằng phương pháp
Kỹ thuật tiếng nói số được đưa vào các hệ thống máy thu này người ta sẽ đạt được tỉ lệ nén rất cao. Mô hình nén tiếng
phát sóng ngắn vào đầu năm 1980 và liên tục phát triển cho đến nói đầu tiên LPC- Linear Prediction Coding - do Phòng thí
ngày nay. Trong những thập kỉ 80 và 90, kỹ thuật thoại số phổ nghiệm Bell Labs, Atal vào năm 1971. Mô hình này được thiết
biến nhất đó là Mã Dự đoán Tuyến tính (LPC). Biến thể chuẩn
kế nhằm mô phỏng cơ chế tạo tiếng nói con người và tỉ lệ nén
thực sự theo kỹ thuật này đó là LPC-10e và nó đã trở thành cơ
ISBN: 978-604-67-0635-9 384
384
HộiHội
đạt được đến tận 800bps, tuy nhiên tốc độ thông dụng được MELP cơ bản dựa trên LPC10e nhưng có thêm 05 đặc điểm
khuyến cáo sử dụng là 1200bps - 4800bps. Tiếng nói tái tạo khác cùng với sự tích hợp bộ tiền xử lí (Pre-processor). Nhờ
theo mô hình LPC nghe tựa như tiếng người máy, tuy nhiên độ có bộ tiền xử lí nên mô hình MELP có thể ứng dụng tại cả ba
nghe hiểu rất cao. tốc độ 2400, 1200 & 600bps.
Với lý do là phương pháp nén dựa theo thông số khó có thể
đạt được chất lượng tiếng nói cao kể cả đối với âm vô thanh
và hữu thanh người ta đã đề xuất một phương pháp thứ ba tích
hợp các đặc trưng của phương pháp dạng sóng và nén theo
thông số. Phương pháp này giữ nguyên bản chất của phương
pháp theo thông số bao gồm bộ lọc thanh âm và bộ phân tích
tần số âm cơ bản và quyết định về âm vô thanh hoặc hữu
thanh. Thay vì sử dụng một chuỗi xung tuần hoàn để thể hiện
tín hiệu kích hoạt dành cho đoạn tiếng nói hữu thanh người ta
sử dụng tín hiệu giống dạng sóng dành cho các đoạn tiếng nói
vô thanh và hữu thanh.
Trong thông tin liên lạc sóng ngắn có băng thông hẹp (300 -
3000Hz), các phương pháp nén tiếng nói theo thông số và
phương pháp hỗn hợp được quan tâm phân tích khả năng ứng
dụng thực tế.
A. Mô hình LPC
Bộ nén tiếng nói (Vocoder) LPC10 đã từng được sử dụng rộng Hình 1. Mô hình hệ thống mã hóa MELP
rãi như là một phần của hệ thống bảo mật trong các thiết bị thu
phát sóng ngắn HF của NATO và quân sự Mỹ. Mô hình phổ Bộ nén tiếng nói MELP 600bps xử lí đoạn tiếng nói 25ms, bộ
biến nhất của LPC đó là LPC10e. Quá trình phân tích LPC10e đệm có thể chứa 5 đoạn và độ dài là 100ms. Thông số của
(phía bên phát) đưa ra các hệ số dự đoán, những hệ số này mô MELP 600bps được mã bao gồm 64 bit cho một đoạn 100ms
phỏng bộ lọc thanh quản của người như là một tập hợp tuyến hoặc tốc độ là 600bit/s. Bảng mã chi tiết của các thông số như
tính của các mẫu tiếng nói trước. Để có được chất lượng tốt sau:
hơn về lượng tử hóa, nội suy, dánh giá độ ổn định và sửa sai Aperiodic Flag: 0bit; Band-pass Voicing: 4bit; Energy: 11 bit;
người ta chuyển những hệ số dự đoán đó sang thành các hệ số Pitch: 7 bit; Spectrum: 10+10+9+9.
phản xạ. Quá trình xử lý thoại để truyền như trong hình 2.
Tiếng nói tổng hợp tại đầu ra của LPC10e là kết quả của phép
tích chập có khuyêchs đại của những hệ số dự đoán hoặc là
với chuỗi xung có chu kì tại tần số âm cơ bản ước lượng hoặc
là với chuỗi xung ngẫu nhiên thể hiện âm vô thanh.
Mô hình LPC10e ba gồm hai thông số xác định âm vô thanh
và âm hữu thanh có độ dài là 1/2 khung, âm cơ bản ước lượng
của khung 22,5ms, giá trị năng luuwongj của khung 22,5ms và
Hình 2. Quá trình xử lý thoại để truyền
phổ thời gian ngắn được đại diện bởi bộ lọc dự đoán bậc 10.
Ưu điểm của mô hình LPC10e là độ nghe hiểu rất cao tại tốc
Xét tín hiệu tiếng nói đầu vào trong một khung thời gian 22,5
độ 2400bps, tuy nhiên tiếng nói mang màu sắc tổng hợp,
ms sau khi qua bộ chuyển đổi AD, thì ta được 180 mẫu x 14
không tự nhiên. Ngoài ra, tiếng nói tổng hợp sẽ giảm chất
bit. Sau đó dữ liệu được cho qua bộ mã hóa Melp đầu ra bộ
lượng rất rõ rệt tại tốc độ thấp.
mã hóa còn lại là 54 bit. Ta thêm vào các bit chẵn lẻ và sau đó
Trong thực tế, để có thể truyền tại tốc độ 24000bps với độ tin
cho qua bộ mã hóa Reed-Solomon và sau đó thêm vào các bít
cậy có thể chấp nhận được thì kênh truyền HF phải rất tốt với
đồng bộ được 180 mẫu. Cuối cùng cho dữ liệu này qua bộ
tỉ lệ tín trên tạp rất cao (lớn hơn +12dB). Điều này đã hạn chế
chuyển đổi DAC và truyền lên băng cơ sở.
sự thành công của LPC10 vocoder đáng kể. Ngoài ra, kể cả
trong trường hợp truyền 2400bps tốt thì chất lượng tiếng nói
của LPC10 cũng chỉ đạt ở mức tối thiểu do nó rất nhậy cảm
với nhiễu.
B. Mô hình MELP
MELP được tổ chức nhà nước Mỹ DoD Digital Voice
Processing Consortium phát triển và trở thành một chuẩn cho Hình 3. Quá trình xử lý thoại khi nhận về
các ứng dụng trong kênh dải hẹp. Mô hình mới này thể hiện sự
nâng cấp rõ rệt đối với chất lượng tiếng nói và độ nghe hiểu.
385
385
Tín hiệu từ băng cơ sở sau khi qua bộ chuyển đổi ADC thì
được là 180 mẫu. Sau đó cho qua bộ giải mã Reed-Solomon
thì còn lại 54 bit. Tiếp tục cho qua bộ giải mã MELP thu được
180 mẫu và sau đó cho qua bộ chuyển đổi DAC. Cuối cùng
tín hiệu tiếng nói được đưa ra LOA.
C. Mô hình TWELP
Nhằm nâng cao chất lượng tiếng nói sau giải nén tại các tốc độ
thấp, trong những năm gần đây các chuyên gia Nga đã phát
triển mô hình mới mang tên TWELP (Tri–Wave Excited
Linear Prediction). Mô hình này được phát triển dựa trên mô
hình LPC với một số thay đổi quan trọng như sau:
- Phương pháp ước lượng âm cơ bản rất tiên tiến và tin cậy. Hình 5. Độ nghe hiểu của hai phương pháp MELPe và TWELP
- Phân tích âm cơ bản đồng bộ.
Mô hình kích ba–sóng: Sóng kích thành phần hữu thanh; Sóng
kích thành phần vô thanh và sóng kích thành phần quá độ (âm
bật giữa hai nguyên âm)
Sơ đồ lượng tử hóa mới nhất như mô tả trong hình 1.
Hình 6. Chất lượng ngôn ngữ TWELP 1200 và MELPs 1200
Hình 4. Sơ đồ lượng tử hóa
III. ỨNG DỤNG MÔ HÌNH TWELP TRONG MÔI

TRƯỜNG THÔNG TIN LIÊN LẠC SÓNG NGẮN HF
Theo tiêu chí PESQ (sự đánh giá theo nhận thức về chất lượng
tiếng nói– Perceptual Evaluation of Speech quality) tại các tốc
độ 2400, 1200, 600bps bộ nén tiếng nói TWELP được đánh
giá là tốt hơn MELPe một cách rõ rệt. Trong danh sách thử
nghiệm đánh giá có cả tiếng châu Á đó là tiếng Trung quốc và
tiếng Nhật.
Hai biểu đồ trong hình 5 và 6 thể hiện kết quả đánh giá độ Số lượng ngôn ngữ
nghe hiểu PESQ của hai phương pháp MELPe và TWELP tại
tốc độ 12000bps & 600bps và biểu đồ trong hình 7 so sánh độ Hình 7. So sánh chất lượng ngôn ngữ TWELP 2400 với AMBE+
nghe hiểu PESQ của ba phương pháp AMBE+2 ở tốc độ 2450 24500 và MELPe 2400.
bps, MELPe tốc độ 2400 bps và TWELP tốc độ 2400 bps.
Với kết quả đánh giá qua ba sơ đồ, ta thấy đối với cả hai tốc IV. TÍCH HỢP BỘ NÉN TWELP TRONG HỆ THỐNG
độ phương pháp TWELP đều cho hệ số PESQ tốt hơn MELPe TRUYỀN QUA KÊNH SÓNG NGẮN VÀ ĐÁNH GIÁ
và phương pháp nén TWELP được xem xét ứng dụng trong dự
Bộ nén tiếng nói TWELP hai tốc độ 1200bps và 600bps được
án “tiếng nói số tốc độ thấp trong thông tin liên lạc qua kênh
thiết kế và tích hợp trong hệ thống như ở hình 8. Modem kỹ
sóng ngắn”.
thuật số điều chế /giải diều chế theo chuẩn BPSK
(Bidirectional Phase Shift Key). Bộ vi xử lý ARM
AT91SAM7S256 điều khiển dòng số liệu vào/ra giữa bộ nén
tiếng nói và modem truyền. Thiết bị thu phát được sử dụng là
máy IC 700PRO. Cự ly thử nghiệm khoảng 300Km giữa hai
386
386
HộiHội
địa điểm Hà nội và Hà Tĩnh, tín hiệu được truyền qua sóng [3] Charles Brain and Andy Talbot- High-quality Voice Communications is
possible without exceeding SSB bandwidth or expensive broadcast
trời trên cự li này. studio equipment, QEX June 2000.
[4] Kihong Kim, the Attached Institute of ETRI, Youseong , Daejeon,
Korea and Jinkeun Hong, Baekseok University, Korea – Evaluation of
Transmission and Quality Performance of Digital Voice
Communications in an HF Network; 2009 IEEEE.
[5] ANDREAS SPANIAS, Speech coding: A tutorial review, Arizona State
University, USA - 1994.
[6] http://twelp.pro
[7] www.electronicsarena.co.uk
[8] Wai C. Chu, Speech Coding Algorithms- Foundation and Evolution of
Standardized Coders, John Wiley & Sons, 2003.
Hình 8. Sơ đồ hệ thống truyền tiếng nói số qua kênh sóng ngắn
Với phương thức đánh giá chất lượng tiếng nói trong thông tin
liên lạc vô tuyến:
****** = 6/6 Chất lượng tuyệt vời
***** = 5/6 Chất lượng rất tốt
**** = 4/6 Chất lượng tốt
*** = 3/6 Chấp nhận được
** = 2/6 Tạm được
* = 1/6 Kém
Thì chất lượng tiếng nói bên tại bên máy thu đối với hai tôc độ
1200bps và 600bps thể hiện trong bảng I.
BẢNG I. CHẤT LƯỢNG TIẾNG NÓI
Phương
Tốc Độ Nhận Giới hạn
thức Dải
độ nghe biết thấp nhất
điều thông
nén hiểu giọng nói SNR
chế
1200 BPSK 3kHz **** *** 4.0dB
600 BPSK 3 kHz *** ** 0.5dB
V. KẾT LUẬN
Việc phân tích, thực hiện và tích hợp bộ nén thoại TWELP
vào trong hệ thống thu phát sóng ngắn trình bày trong bài báo
này đã giải quyết được vấn đề nan giải nhất trong truyền thoại
số qua kênh sóng ngắn HF. Đó là thông tin tiếng nói có thể
truyền đi và hiểu được ngay cả khi chất lượng đường truyền
rất kém (tỷ lệ tín/tạp 0.5dB).
Cho đến ngày nay, trên thế giới, tiếng nói số trong thông tin
liên lạc sóng ngắn vẫn đang được sử dụng phổ biến tại tốc độ
1200bps. Với tốc độ này việc liên lạc khó có thể thực hiện
được trong những khoảng thời gian khi có nhiễu lớn và fading
liên tục đặc biệt là về đêm từ 22 giờ đến 5 giờ sáng.
Với tốc độ 600bps tiếng nói có thể truyền và nhận với độ nghe
hiểu được khi kênh truyền kém và việc liên lạc có thể được
duy trì trong phần lớn thời gian.
[1] Carl Kritzinger - Low Bit rate Speech Coding , April 2006. Thesis
presented in partial fulfiment of the requirement for the degree of
Master of Science in Engineering Science at the University of
Stellenbosch.
[2] Mark W. – a 600bps MELP Vocoder for use on HF channel, Harris
Corporation , RF Communications Division , 1680 University Avenue
Rochester , New York 14610.
387
387
HộiHội
ThảoThảo Quốc
Quốc Gia
2015 ĐiệnTử,
Tử,Truyền
TruyềnThông
Thông và
và Công
CôngNghệ
NghệThông
ThôngTinTin
(ECIT 2015)
(ECIT 2015)
Hệ Thống Gợi Ý Bài Báo Khoa Học

Sử Kim Anh và Nguyễn Thái Nghe
Trường Đại học Cần Thơ
Email: {skanh,ntnghe}@ctu.edu.vn
Tóm tắt - Trong nghiên cứu này, chúng tôi đề xuất giải pháp xây nghiên cứu khoa học, đặc biệt là hỗ trợ công tác tìm kiếm, gợi
dựng hệ thống gợi ý bài báo khoa học nhằm gợi ý cho người đọc ý nguồn tài nguyên học tập, gợi ý các tài liệu, hay cụ thể ở đây
những bài báo được hệ thống dự đoán là phù hợp với sở thích và là gợi ý các bài báo khoa học vẫn còn chưa được khai thác tốt,
lĩnh vực nghiên cứu của họ. Để xây dựng hệ thống, trước hết mặc dù trên thế giới đã có các nghiên cứu liên quan trong xây
chúng tôi đề xuất phương pháp thu thập thông tin phản hồi
dựng hệ thống gợi ý bài báo, như sử dụng kỹ thuật láng giềng
(feedback) từ người dùng, sau đó đề xuất sử dụng phương pháp
tập hợp các mô hình phân rã ma trận để dự đoán các phản hồi lân cận và tìm kiếm theo ngữ nghĩa đã được giới thiệu trong
đó. Do mỗi bài báo khoa học có thể chỉ phù hợp cho một số đối các nghiên cứu [4, 7].
tượng nhất định trong cùng lĩnh vực nên chúng tôi cũng đề xuất Trong bài viết này, chúng tôi đề xuất giải pháp “Xây dựng hệ
áp dụng phương pháp gợi ý lọc theo ngữ cảnh đầu ra trên các kết
quả đã được dự đoán từ đó gợi ý top-N bài báo phù hợp. Sau khi
thống gợi ý bài báo khoa học” dùng kỹ thuật phân rã ma trận
xây dựng xong mô hình gợi ý, bước kế đến là việc phân tích, thiết [21][14] kết hợp với xử lý ngữ cảnh đầu ra [3] nhằm tối ưu
kế và cài đặt hệ thống quản lý bài báo đồng thời tích hợp giải hóa việc hiển thị nội dung các bài báo phù hợp với từng đối
thuật đã xây dựng vào hệ thống. Khi đã có hệ thống hoàn chỉnh, tượng người đọc.
chúng tôi thu thập ý kiến phản hồi từ người dùng thực để đánh
giá hiệu quả của hệ thống. Kết quả cho thấy khả năng gợi ý phù II. HỆ THỐNG GỢI Ý
hợp cho người dùng đạt độ tin cậy khá tốt và có thể triển khai
Hệ thống gợi ý (Recommender Systems - RS) là một dạng
vào thực tế.
của hệ thống lọc thông tin (information filtering), nó được sử
Từ khóa- Kỹ thuật phân rã ma trận, hệ thống gợi ý, lọc cộng tác, dụng để dự đoán sở thích (preference) hay xếp hạng (rating)
gợi ý bài báo khoa học. mà người dùng có thể dành cho một mục thông tin (item) nào
đó mà họ chưa xem xét tới trong quá khứ (item có thể là bài
I. GIỚI THIỆU báo, bộ phim, đoạn video clip, sách,..) [14] nhằm gợi ý các
Ở các trường đại học, bên cạnh công tác giảng dạy thì mục thông tin “có thể được quan tâm” bởi người dùng. Hệ
nghiên cứu khoa học là một nhiệm vụ quan trọng của bất cứ thống gợi ý sẽ đưa ra các gợi ý dựa trên quá trình thu thập, xử
giảng viên nào. Hoạt động nghiên cứu khoa học là tất yếu lý và phân tích dữ liệu từ người dùng. Dữ liệu đó được chia
trước xu thế phát triển ngày một sâu và rộng trên tất cả lĩnh làm 2 loại là tường minh (explicit) bằ ng cá ch yêu cầu người
vực của thế giới. Do đó, để đảm bảo chất lượng đào tạo thì vấn dùng phản hồi trực tiếp và tiềm ẩn (implicit) bằ ng cách tự
đề nghiên cứu khoa học phải được đầu tư xuyên suốt, song động suy luận dựa trên những tương tác của người dùng với hệ
hành với quá trình đào tạo của mình, chính vì thế mà các công thống như: số lần nhấp chuột, thời gian quan sát...
trình khoa học của các trường cũng không ngừng tăng lên. Với Trong phần lớn các trường hợp, bài toán gợi ý được coi là
lượng bài ngày càng tăng, việc tìm kiếm tốn thời gian hơn thì bài toán dự đoán việc xếp hạng (rating) của các sản phẩm
việc tự động gợi ý bài báo thật sự đáp ứng yêu cầu nghiên cứu (phim, sản phẩm tiêu dùng, sách, nhạc…) chưa được người
và tìm kiếm thông tin của từng cán bộ hoặc sinh viên đồng dùng biết đến. Việc dự đoán này thường dựa trên những đánh
thời phù hợp với chuyên ngành, trình độ, và lĩnh vực nghiên giá đã có của chính người dùng đó hoặc những người dùng
cứu của người sử dụng là vấn đề rất có ý nghĩa và cần thiết. khác. Ví dụ, những bài báo được dự đoán là sẽ có xếp hạng
Bên cạnh đó, Hệ thống gợi ý (recommender systems) hiện cao nhất sẽ được dùng để gợi ý.
nay được phát triển và ứng dụng rất mạnh mẽ [1, 2, 8, 13] . Hệ thống gợi ý đã chứng minh được ý nghĩa to lớn: giúp
Đây là một trong những lĩnh vực khá quan trọng trong khai cho người sử dụng trực tuyến đối phó với tình trạng quá tải
phá dữ liệu. Những nghiên cứu và ứng dụng về lĩnh vực này thông tin. Hệ thống gợi ý trở thành một trong những công cụ
cũng tăng mạnh trong những năm gần đây, đặc biệt là ở lĩnh mạnh mẽ và phổ biến trong thương mại điện tử. Mục đích của
vực thương mại như Hệ thống gợi ý sản phẩm của Ebay, hệ thống gợi ý là dựa vào hành vi từ thói quen, nhu cầu...
Amazon,..; lĩnh vực giáo dục; lĩnh vực giải trí như hệ thống trong quá khứ của người sử dụng để dự đoán sở thích trong
gợi ý phim ảnh của Movielens, Netflix,.. [2]; và trong những tương lai của họ. Một cách hình thức, gọi U là tập tất cả người
lĩnh vực khác [1, 2, 8, 16]. dùng và I là tập tất cả các mục tin có thể được gợi ý như máy
Trong nước, cũng đã có nhiều nhóm nghiên cứu về xây tính, sách, phim ảnh, bài báo... Để dự đoán xếp hạng của bài
dựng hệ thống gợi ý như: Hệ thống gợi ý môn học [9], gợi ý báo ứng với người dùng thì người ta đưa ra hàm r̂ : U x I  R
phim [19]; gợi ý bài hát [12]; và trong những lĩnh vực khác trong đó R là tập được thứ tự toàn phần (ví dụ số nguyên
cũng như việc xây dựng các giải thuật cho hệ thống gợi ý [10, dương hoặc số thực trong tập xác định). Sau khi dự đoán, kết
15, 13]. Tuy vậy, việc xây dựng hệ thống gợi ý trong lĩnh vực
ISBN: 978-604-67-0635-9 388
388
quả sẽ được sắp xếp giảm dần và ta có thể chọn top-N bài báo A. Phương pháp thu thập thông tin phản hồi từ người dùng
để gợi ý cho người dùng.
Hệ thống được xây dựng dưới dạng một website cung
Trong hệ thống gợi ý bài báo này chúng tôi sử dụng Matrix cấp thông tin về bài báo giúp người dùng có thể chọn các bài
Factorization (MF), là một state-of-the-art trong hệ thống gợi báo mà mình cần đến. Khi người dùng truy cập vào hệ thống,
ý [1][20], cùng với nhân tố phản hồi tiềm ẩn là số lần click có thể tìm kiếm, xem và tải những bài báo về máy của mình.
trên item và nhân tố phản hồi tường minh (rate) là mức độ Ngoài ra, hệ thống còn phân loại các bài báo theo từng thể
quan tâm của người dùng đến mỗi bài báo. Tích hợp thông tin loại, nhằm mang đến sự tiện lợi cho người sử dụng và cung
dự đoán bằng phương pháp tập hợp mô hình cho cả hai nhân cấp thông tin chi tiết về các bài báo như: tên bài báo, tác giả,
tố trên. tóm tắt…
Trong hệ thống gợi ý bài báo này, mỗi người dùng (giảng Với đặc điểm là một hệ thống gợi ý, hệ thống phải có
viên, sinh viên) được xem như là một user, mỗi bài báo khoa chức năng thu thập những phản hồi từ người dùng. Thông
học là item, và người dùng đó đạt bao nhiêu lần truy cập vào thường hệ thống ghi nhận sự phản hồi của người dùng dưới
từng bài báo hay số bình chọn của người dùng trên mỗi bài hình thức ghi nhận một giá trị xếp hạng cụ thể (thích (1) /
báo được xem là rating như minh họa trong Hình 1. không thích (0), từ 1 đến 5) gọi là phản hồi tường minh
(explicit feedback). Tuy nhiên, với cách này thì hệ thống
thường khó có thể ghi nhận được nhiều phản hồi từ người
dùng. Vì người dùng phải tự thể hiện sự phản hồi của mình
một cách tường minh. Điều này bất tiện và thường làm cho
người dùng không thích.
Do đó, để tạo sự tiện lợi cho người dùng và hệ thống có
Hình 1. Minh họa kỹ thuật phân rã ma trâ ̣n thể thu thập được nhiều phản hồi một cách dễ dàng, trong hệ
thống gợi ý bài báo này, chúng tôi đề xuất ghi nhận các phản
hồi của người dùng dưới dạng phản hồi tiềm ẩn (implicit
Mục tiêu chính của kỹ thuật này là phân rã ma trận X thành 2
ma trận nhỏ hơn W và H sao cho ta có thể xây dựng lại X từ 2 feedback). Hệ thống sẽ tự động ghi nhận lại thông tin của
ma trận con này. người dùng thông qua đăng ký tài khoản, ngoài ra giá trị phản
hồi - trọng số xếp hạng được ghi nhận bằng số lần click vào
(1) bài báo khi người dùng lựa chọn bài báo khi truy xuất hay
đăng nhập vào hệ thống. Chức năng lưu trữ số lần chọn (click)
Với W và H là 2 ma trận con. xem bài báo được hệ thống tự động cập nhật vào cơ sở dữ liệu
I ×K (2) và được đếm theo địa chỉ IP (IP address) của người truy xuất.
W =ℜ
U ×K
H =ℜ Khi thực hiện đăng nhập vào tài khoản, hệ thống sẽ so sánh
giữa IP address và người dùng và lưu trữ lại số liệu này theo
K: là số nhân tố tiềm ẩn (latent factors) K << |U|; K << |I |. tài khoản người sử dụng và được sử dụng làm trọng số (rate)
cho xếp hạng của người sử dụng.
Để xác định W và H, người ta thường sử dụng kỹ thuật tối ưu
hàm mục tiêu, như: B. Cài đặt các giải thuật và Tích hợp các mô hình dự đoán
2 Trong các hệ thống gợi ý truyền thống, người ta thường sử
 K

O MF
= ∑ ( rui − rûi ) = ∑  rui − ∑ wuk hik 
2 dụng một thông tin phản hồi tường minh từ người dùng như
u ,i∈D train u ,i∈D train  k =1  xếp hạng (từ 1 đến 5) hay dựa trên thông tin tiềm ẩn (như số
lần click chuột trên item).
Sau quá trình tối ưu (có thể dùng stochastic gradient descent)
Trong hệ thống gợi ý bài báo này, chúng tôi đề xuất sử
ta có được W và H, khi đó xếp hạng (đánh giá) của người
dụng phương pháp tập hợp mô hình (ensemble method) để tận
dùng u cho bài báo i được dự đoán theo công thức:
dụng cả thông tin phản hồi tường minh và tiềm ẩn do trong
K những nghiên cứu trước đây đều cho thấy phương pháp tập
rûi = ∑ wuk hik = wu hiT (3) hợp mô hình cho độ chính xác cao hơn bất kỳ một phương
k =1 pháp đơn lẽ nào [18].
Chi tiết về kỹ thuật này, bạn đọc vui lòng xem thêm trong tài Cụ thể, hệ thống được tích hợp giải thuật gợi ý MF1 để gợi
liệu [20, 14]. ý các bài báo mới phù hợp cho từng người dùng dựa vào các
phản hồi tiềm ẩn (click) và MF2 dựa trên phản hồi tường minh
III. PHƯƠNG PHÁP ĐỀ XUẤT (bình chọn theo mức độ quan tâm của người dùng từ 1 đến 5),
Trước tiên chúng tôi đề xuất phương pháp thu thập các kết quả dự đoán sau cùng sẽ dùng phương pháp tập hợp mô
thông tin phản hồi từ người dung, sau đó đề xuất và cài đặt các hình (ví dụ, trung bình) của cả hai kết quả dự đoán này.
mô hình tương ứng và đánh giá các mô hình đó trước khi tích Cách tính được mô tả như sau:
hợp chúng vào hệ thống thực.
389
389
HộiHội Thảo
Thảo Quốc
Quốc Gia
Gia 2015về
2015 vềĐiện
ĐiệnTử,
Tử,Truyền
TruyềnThông
Thông và
và Công
CôngNghệ
NghệThông
ThôngTinTin
(ECIT 2015)
(ECIT 2015)
Gọi r1 là kết quả dự đoán sử dụng phản hồi là số lần mà đặt và triển khai hệ thống. Phần quan trọng nhất của hệ thống
người dùng click chuột trên bài báo, sử dụng mô hình MF1 này là tích hợp các giải thuật gợi ý vào hệ thống. Do giới hạn
về số trang của bài viết, chúng tôi chỉ giới thiệu một vài mô
K
rˆ1 ui = ∑ w 1 uk h1 ik (4) hình cơ bản như bên dưới.
k =1
A. Đặc tả hệ thống
Gọi r2 là kết quả dự đoán sử dụng phản hồi là xếp hạng Hệ thống quản lý các tạp chí khoa học cho phép cán bộ và
mà người dùng đã đánh giá trên bài báo, sử dụng mô hình sinh viên trường có thể quản lý, tìm kiếm và xem các bài báo
MF2 khoa mà họ cần. Hệ thống sẽ hiển thị các bài báo và các nội
dung theo đúng nhu cầu khách hàng quan tâm. Hệ thống có
K (5) chức năng cho khách hàng chấm điểm, đánh giá chất lượng
rˆ2 ui = ∑ w2 uk h2 ik của bài báo.
k =1
Đặc biệt hệ thống sẽ gợi ý các cho người dùng trong quá
Kết quả dự đoán sau cùng là tập hợp (ensemble method) trình lựa chọn sử dụng kỹ thuật phân rã ma trận và hiển thị các
của các mô hình trên, để đơn giản chúng tôi sử dụng cách tập bài báo tương tự mà họ đang xem, sử dụng các thuộc tính về
hợp trung bình (average voting for regression model), mặc dù chủ đề bài báo và lĩnh vực của người dùng.
vậy các phương pháp khác hoàn toàn có thể được áp dụng.
B. Sơ đồ các trường hợp sử dụng của người dùng
( r1ui + r2 ui )
rûi = (6)
2
Bên cạnh đó, chúng tôi cũng nhận thấy rằng nếu hệ thống
gợi ý bài báo thuộc lĩnh vực chuyên ngành này (ví dụ, xã hội)
cho người dùng thuộc chuyên ngành khác (ví dụ, CNTT) thì
có thể chưa phù hợp (trừ các bài viết dạng liên ngành), do vậy
khi gợi ý đến người dùng, để tăng sự hợp lý và độ chính xác
chúng tôi còn lưu ý đến việc xử lý ngữ cảnh đầu ra (contextual
post-filtering [3]), là lĩnh vực của bài báo và lĩnh vực nghiên
cứu của người dùng phải tương tự nhau, nhằm giúp cho người
dùng có thể tìm được những bài báo mà mình cần một cách
nhanh chóng và tiện ích.
Chi tiết về việc cài đặt các giải thuật MF minh hoạ như
trong Hình 2, ở đây sử dụng Stochastic gradient descent cho
giải thuật học. Hình 3. Sơ đồ use case của người dùng
Giảng viên và sinh viên muốn thực hiện các chức năng trên
chỉ khi là thành viên của hệ thống. Sau khi đăng nhập vào hệ
thống, nếu là người dùng mới thì hệ thống sẽ dựa vào thông
tin về chuyên ngành của họ để tư vấn theo thông tin vừa thu
thập. Tuy nhiên, nếu người dùng đã có chấm điểm cho bài
báo, hệ thống sẽ gợi ý các bài báo theo giải thuật đã đề xuất.
Ngoài ra, hệ thống còn cung cấp các công cụ quản trị như:
quản trị người dùng, quản trị thông tin bài báo, công cụ cho
phép người quản trị có thể xuất thông tin đánh giá của người
dùng trên bài báo để huấn luyện lại mô hình của giải thuật và
chức năng kiểm tra hiệu quả của hệ thống gợi ý bài báo.
Hình 2. Cài đặt kỹ thuật Phân rã ma trận (MF) [14]
IV. XÂY DỰNG HỆ THỐNG VÀ TÍCH HỢP GIẢI THUẬT

Tương tự như những hệ thống thông tin quản lý khác, hệ
thống này cũng phải được phân tích, thiết kế các mô hình, cài
390
390
Hội Thảo Quốc
Hội Thảo GiaGia
2015 Điện Tử,Tử,
Điện Truyền Thông
Truyền Thôngvà
Tin(ECIT
(ECIT2015)
2015)
C. Lược đồ Cơ sở dữ liệu
1
RMSE = ∑ (rui − r̂ui )2
| D test | u,i, r∈D test
(7)
Trong đó: Dtest ⊆ U × I × R là tập dữ liệu kiểm thử; U: tập

người dung (user); I: Tập bài báo (item); rui: giá trị xếp hạng
thực tế; r̂ : giá trị dự đoán
B. Đánh giá trên tập dữ liệu chuẩn
Để kiểm tra tính đúng đắn của việc cài đặt giải thuật,
chúng tôi kiểm tra các mô hình bằng cách sử dụng tập dữ liệu
về tạp chí khoa học Bisonomy để đánh giá giải thuật
(www.bibsonomy.org) với khoảng 15.000 người dùng, khoảng
1.800.000 bài báo và có trên 3 triệu đánh giá. Đây là tập dữ
liệu được dùng để đánh giá giải thuật gợi ý dùng cho các tạp
chí khoa học.
Trong quá trình đánh giá, chúng tôi chỉ sử dụng khoảng
30000 đánh giá (dùng nghi thức 3-folds cross validation) trên
tập dữ liệu và được chia làm 2 phần: lấy ngẫu nhiên 2/3 dữ
liệu dùng để huấn luyện (train) và 1/3 còn lại dùng để kiểm tra
(test). Lặp lại 3 lần để lấy kết quả trung bình. Kết quả thực
Hình 4. Lược đồ CSDL của hệ thống nghiệm được trình bày trong Bảng dưới đây.
Bảng 1. Bảng độ đo lỗi RMSE
D. Thiết kế hệ thống và tích hợp giải thuật Trung
Lần 1 Lần 2 Lần 3
Hệ thống được xây dựng trên nền Web với ngôn ngữ lập bình
trình PHP kết hợp với hệ quản trị cơ sở dữ liệu MySQL theo MF 1.0441 0.9707 0.9084 0.9744
mô hình MVC (Model-View-Controller). Thành phần Global
Controller sẽ nhận các dữ liệu GET/POST, xử lý những dữ 1.1112 1.0524 1.0509 1.0715
Average
liệu này, sau đó chuyển sang Model xử lý. Model sẽ trả dữ
liệu về phía Controller, sau đó Controller sinh mã Ở đây chúng tôi so sánh nhằm mục đích kiểm tra xem quá
HTML/XHTML để thể hiện trên View. trình cài đặt giải thuật MF có đúng đắn hay không chứ không
Mô hình tổng thể của hệ thống được mô tả thông qua hình nhằm mục đích so sánh giữa các phương pháp. Việc so sánh
sau này đã được các nghiên cứu trước đây thực hiện và đã cho
thấy kỹ thuật MF vẫn là một trong các state-of-the-art trong hệ
thống gợi ý hiện nay [3][13]
C. Kết quả minh họa
1. Giao diện hệ thống
Hệ thống được phát triển trên môi trường web, dùng ngôn
ngữ PHP và hệ quản trị cơ sở dữ liệu MySQL. Hệ thống đang
được triển khai tại địa chỉ: http://crd.ctu.edu.vn/journals/,
trang chủ của hệ thống được minh họa trong Hình 6. Hê ̣ thố ng
chia thành 2 phần chính kết nối và tương tác nhau là Giao diện
người dùng và Giao diện quản trị.
Hình 5. Mô hình tổng thể của hệ thống Tại giao diện trang chính: người dùng có thể truy cập vào
thông tin các bài báo ở mức độ: tên bài báo, tác giả, lĩnh vực
V. KẾT QUẢ NGHIÊN CỨU và tóm tắt bài báo. Khi người dùng click chọn hệ thống sẽ tự
A. Độ đo dùng để đánh giá giải thuật động lưu trữ số lần chọn, mã bài báo dựa vào địa chỉ IP của
mỗi người dùng. Các bài báo được hiển thị theo các tiêu chí
Chúng tôi sử dụng độ đo lỗi RMSE (Root Mean Squared như: Bài báo được xem (click) nhiều nhất; Bài báo được hiển
Error) là độ đo phổ biến mà cộng đồng người dùng trong lĩnh thị dựa vào giá trị dự đoán trung bình toàn cục; Bài báo được
vực máy học (machine learning) thường sử dụng. RMSE được hiển thị theo Năm, Theo Loại, Theo lĩnh vực và theo từng Số.
xác định bằng công thức: Khi người dùng đăng ký/ đăng nhập vào hệ thống sẽ tự động
lưu trữ số lần chọn của người dùng vào cơ sở dữ liệu so sánh
với địa chỉ IP. Với sự tương tác của người dùng thông qua giải
391
391
HộiHội Thảo
Thảo QuốcGia
Quốc Gia2015
2015về
vềĐiện
Điện Tử,
Tử,Truyền
Truyền Thông
Thông và
vàCông
CôngNghệ
NghệThông TinTin
Thông (ECIT 2015)
(ECIT 2015)
thuật sẽ thấy được kết quả dự đoán của hệ thống dựa vào ngữ Ở giao diện của người quản trị: Các chức năng thông
cảnh được áp dụng là lĩnh vực ở mỗi bài báo và lĩnh vực của thường để quản trị một hệ thống quản lý các bài báo như:
người dùng. Quản lý bài báo, Quản lý người dùng, Quản lý số bài báo,
Quản lý lĩnh vực bài báo, Tìm kiếm thông tin. Hệ thống cũng
có thể thống kê các bài báo theo năm, theo lĩnh vực, theo các
rating của người dùng.
Bên cạnh đó, hệ thống cũng cho phép người quản trị huấn
luyện lại các mô hình sau một thời gian sử dụng. Người quản
trị còn được cung cấp công cụ để tìm các siêu tham số cho giải
thuật cũng như đánh giá giải thuật thông qua các độ đo lỗi
RMSE, MAE và tính độ chính xác (precision) của hệ thống.
2. Đánh giá hiệu quả sử dụng hệ gợi ý
Sau khi tích hợp giải thuật gợi ý và và xây dựng hoàn
chỉnh hệ thống, chúng tôi tiến hành thu thập phản hồi từ người
dùng thực để kiểm tra hiệu quả của việc gợi ý. Dữ liệu thu
thập từ người dùng (Giảng viên ĐHCT) đánh giá khoảng 40
Hình 6. Trang chủ của hệ thống bài báo thuộc 4 lĩnh vực: Công nghệ thông tin, Công nghệ,
Môi trường và Tự nhiên. Dữ liệu được thu thập khoảng 40
Gợi ý bài báo cho người dùng người dùng với khoảng trên 400 đánh giá bài báo theo mức độ
từ 1 đến 5 (từ không quan tâm đến rất quan tâm).
Người dùng có thể chấm điểm cho bài báo hoặc gửi góp ý
(feedback) cho bài báo đó như trong Hình 9. Sau khi người Tiếp theo, chúng tôi tiến hành đánh giá hiệu quả của việc
dùng đã chấm điểm bài báo, hệ thống sẽ gợi ý một số bài báo gợi ý xem nó có phù hợp cho mỗi người dùng hay không dựa
mới cho người dùng thông qua các mô hình đã được tích hợp theo hướng dẫn và điều chỉnh từ tài liệu [5]. Gợi ý được xem
như minh họa trong Hình 10. Bên cạnh đó, hệ thống cũng có là phù hợp khi người dùng có chọn bài báo từ danh sách
thêm các mục chức năng khác như: gợi ý TOP các bài báo những bài báo đã được gợi ý cho họ. Các bước được thực hiện
được nhiều người xem, các bài báo cùng thể loại, cùng lĩnh như sau:
vực với bài báo đang xem. • Tạo tập dữ liệu train và test theo từng user. Với mỗi user
(người dùng) chọn 70% dữ liệu cho train, 30% còn lại
dùng vào tập test.
• Tiến hành huấn luyện mô hình trên tập dữ liệu train vừa
tạo.
• Dự đoán cho từng user trên tất cả các item không có trong
tập train.
• Lấy Top K (K=10) item có giá trị dự đoán cao nhất để
kiểm tra, so sánh các giá trị này với tập dữ liệu test. Với
mỗi lần gợi ý Top K như thế, nếu các item này có trong
tập test của user tương ứng, xem như lần gợi ý đó là phù
hợp.
• Lặp lại cho tất cả các user được chọn thử nghiệm
Bảng 2. Minh họa trực quan kết quả dự đoán cho 5 người
Hình 7. Giao diện đánh giá bài báo dùng
Để minh hoạ trực quan kết quả, chúng tôi chọn ngẫu nhiên
5 user để hiển thị trực quan kết quả. Thử nghiệm trên 5 lần
Hình 8. Giao diện gợi ý bài báo cho người dùng
392
392
HộiHội
ThảoThảo Quốc
Quốc Gia
2015 ĐiệnTử,
Tử,Truyền
TruyềnThông
Thông và
và Công
CôngNghệ
NghệThông
ThôngTinTin
(ECIT 2015)
(ECIT 2015)
chạy, với mỗi lần lấy Top 10 bài báo trong danh sách dự đoán 5. Guy Shani and Asela Gunawardana. Evaluating recommendation
systems. In Recommender Systems Handbook, pages 257–297.
để kiểm tra trong tập test, kết quả trình bày trong Bảng 2.
Springer, 2011.
Trong bảng này, mỗi cột là một người dùng, mỗi hàng là 6. Herlocker J. L., Konstan j. A., Borchers a., Andriedl J. (1999), “An
kết quả thống kê số lượng bài đã được gợi ý trong Top 10 có algorithmic framework for performing collaborative filtering”. In
Proceedings of the 22nd ACM SIGIR, New York, NY, 230–237.
xuất hiện trong tập test với các mã bài báo cụ thể. Ví dụ: ở lần
7. Lee, Joonseok, Kisung Lee, and Jennifer G. Kim. "Personalized
kiểm tra thứ nhất, các bài báo được gợi ý cho user 25 có xuất
academic research paper recommendation system." arXiv preprint
trong tập test là 1 bài với mã bài báo là 68. Như vậy, trong lần arXiv:1304.5457 (2013).
gợi ý này, user 25 có sản phẩm phù hợp (chính xác) với sở 8. Li Chen, Guanliang Chen, and Feng Wang. 2015. Recommender
thích của mình. Minh họa tương tự cho các user khác. systems based on user reviews: the state of the art. User Modeling and
User-Adapted Interaction 25, 2 (June 2015), 99-154.
Nhận xét: Độ chính xác của kết quả gợi ý qua mỗi lần DOI=10.1007/s11257-015-9155-5 http://dx.doi.org/10.1007/s11257-
kiểm tra khá cao đối với các người dùng, trung bình cho 5 015-9155-5
người dùng được chọn ngẫu nhiên là 80%. Người dùng đăng 9. Huỳnh Lý Thanh Nhàn, Nguyễn Thái Nghe (2013): Hệ thống dự đoán
nhập có bình chọn và tham gia càng nhiều thì độ chính xác của kết quả ho ̣c tâ ̣p và gợi ý lựa chọn môn học. Kỷ yếu hội thảo quốc gia lần
thứ XVI: Một số vấn đề chọc lọc của CNTT&TT (@2013), trang 110-
hệ thống sẽ đạt giá trị cao.
118. Nhà xuất bản Khoa học kỹ thuật. ISBN: 987-604-67-0251-1
VI. KẾT LUẬN VÀ HƯỚNG PHÁT TRIỂN 10. Nguyễn Duy Phương và Từ Minh Phương. 2013. Lọc cộng tác với độ đo
tương tự dựa trên đồ thị. Chuyên san Các công trình nghiên cứu, phát
Trong nghiên cứu này, chúng tôi đề xuất giải pháp xây triển và ứng dụng CNTT&TT, Số 30 (2013).
dựng hệ thống quản lý bài báo khoa học có tích hợp hệ gợi ý 11. Nguyễn Hùng Dũng, Nguyễn Thái Nghe (2014): Hệ thống gợi ý sản
nhằm gợi ý cho bạn đọc những bài báo mới được hệ thống dự phẩm trong bán hàng trực tuyến sử dụng kỹ thuật lọc cộng tác. Tạp chí
Khoa học Trường Đại học Cần Thơ, số 31a (2014), trang 36-51. ISSN:
đoán là phù hợp với sở thích và lĩnh vực nghiên cứu của họ. 1859-2333
Sở thích của người dùng trên các bài báo mới được dự đoán 12. Nguyễn Tấn Phong, Nguyễn Thái Nghe. 2014. Một giải pháp trong xây
dựa trên kết hợp giữa dữ liệu về lĩnh vực chuyên ngành của dựng Hệ thống gợi ý bài hát. Trang 149-154, kỷ yếu hội thảo quốc gia
người dùng và xếp hạng của người dùng trên các bài báo trong lần thứ XVII: Một số vấn đề chọc lọc của CNTT&TT (@2014). Nhà
quá khứ. xuất bản Khoa học và kỹ thuật. ISBN: 978-604-67-0426-3.
13. Nguyen Thai-Nghe, Lars Schmidt-Thieme. 2015. Factorization
Sau quá trình dự đoán, chúng tôi cũng đã đề xuất phương Forecasting Approach for User Modeling. Journal of Computer Science
pháp xử lý ngữ cảnh đầu ra (contextual post-filtering, ví dụ lọc and Cybernetics. 133-148. Vol 31, No 2. ISSN: 1813-9663. DOI:
lại theo chuyên môn của người dùng) nhằm hiển thị kết quả 10.15625/1813-9663/31/2/5860
phù hợp hơn nữa cho từng đối tượng sử dụng. 14. Nguyen Thai-Nghe. 2013. An introduction to factorization technique for
building recommendation systems. Vol. 6/2013, pp. 44-53, Journal of
Để xây dựng hệ thống, nghiên cứu này đã đề xuất phương Science - University of Da Lat, ISSN 0866-787X.
pháp thu thập thông tin phản hồi từ người dùng, sau đó cài đặt 15. Pham Minh Chuan, Le Thanh Huong, Tran Dinh Khang va Cao Xuan
kỹ thuật phân rã ma trận – đang được áp dụng thành công Bach, “Hệ thống khuyến nghị công việc”, Hội nghị khoa học Quốc gia
lần thứ VIII - Nghiên cứu cơ bản và ứng dụng Công nghệ thông tin
trong nhiều ứng dụng gợi ý hiện nay. Tiếp theo, chúng tôi 2013. DOI 10.15625/FAIR VII.2014-0336, pages 153-159.
kiểm tra tính đúng đắn của giải thuật trên tập dữ liệu chuẩn. 16. Su, X. & Khoshgoftaar, T.M. (2009). A survey of collaborative filtering
Kế đến là việc phân tích, thiết kế và cài đặt hệ thống quản lý techniques. Advances in Artificial Intelligence, 2009, 4:1-4:19.
bài báo đồng thời tích hợp giải thuật gợi ý vào hệ thống để có 17. Takacs, G., Pilaszy, I., Nemeth, B., & Tikk, D. 2009. Scalable
thể gợi ý bài báo phù hợp cho người dùng. Sau khi đã có hệ collaborative filtering approaches for large recommender systems.
thống hoàn chỉnh, chúng tôi thu thập ý kiến phản hồi từ người Journal of Machine Learning Research, 10, 623-656.
dùng thực để đánh giá hiệu quả của hệ thống. Hệ thống đang 18. Thomas G. Dietterich, Ensemble Methods in Machine Learning. Lecture
được thử nghiệm trên dữ liệu thực lấy từ hệ thống quản lý các Notes in Computer Science Volume 1857, 2000, pp 1-15. Springer.
bài báo của trường Đại học Cần Thơ, kết quả cho thấy việc 19. Triệu Vĩnh Viêm, Triệu Yến Yến, Nguyễn Thái Nghe (2013): Xây dựng
hệ thống gợi ý phim dựa trên mô hình nhân tố láng giềng. Số chuyên đề:
tích hợp hệ gợi ý vào hệ thống quản lý bài báo khoa học là Công nghệ Thông tin (2013): 170-179, Tạp chí Khoa học Trường Đại
hoàn toàn khả thi. học Cần Thơ, ISSN: 1859-2333
20. Yehuda Koren, Robert Bell, and Chris Volinsky. 2009. Matrix
TÀI LIỆU THAM KHẢO Factorization Techniques for Recommender Systems. Computer 42, 8
(August 2009), 30-37. DOI=10.1109/MC.2009.263
1. Bobadilla J., Ortega F., Hernando A., Gutiérrez H. 2013. Recommender
systems survey. Knowledge-Based Systems. 46 (2013) 109–132. 21. Yehuda Koren and Robert Bell. "Advances in collaborative
Elsevier. filtering."Recommender systems handbook. Springer US, 2011. 145-186.
2. Francesco Ricci, Lior Rokach, Bracha Shapira, and Paul B. Kantor.
2010. Recommender Systems Handbook (1st ed.). Springer-Verlag New
York, Inc., New York, NY, USA.
3. Gediminas Adomavicius, Alexander Tuzhilin. Context-Aware
Recommender Systems, Recommender Systems Handbook. 2011, pp
217-253. Spinger.
4. Gipp, Bela, Jöran Beel, and Christian Hentschel. "Scienstein: A research
paper recommender system." Proceedings of the international
conference on emerging trends in computing (ICETiC’09). 2009.
393
393
HộiHội
Thiết kế anten mảng tái cấu hình tần số sử dụng cấu

trúc DGS
Nguyễn Ngọc Lan1, Vũ Văn Yêm1, Bernard Journeet2, Lâm Hồng Thạch1 và Trịnh Thị Hương3
1
Viện Điện tử Viễn thông, Trường Đại học Bách khoa Hà Nội, Việt Nam
2
Đại học Sư phạm Cachan, Cộng hòa Pháp
3
Đại học Giao thông Vận tải, Hà Nội, Việt Nam
Email: dtvt2006@gmail.com, yem.vuvan@hust.edu.vn, bernard.journet@ens-cachan.fr,
thach.lamhong@hust.edu.vn, us.trinh@utc.edu.vn
Tóm tắt - Trong những năm gần đây, các thiết bị vô tuyến Bài báo này đề xuất việc thiết kế anten mảng tái cấu hình hoạt
ngày càng được thu nhỏ về kích thước, nhưng đồng thời cũng động tại băng X ở tần số trung tâm 7.5 GHz và 9 GHz sử dụng
được tích hợp ngày càng nhiều chức năng phục vụ cho nhiều mục
PIN diode. Anten gồm 4 phần tử tuyến tính (2x2) được thiết kế
đích. Do đó, việc thiết kế anten cũng phải đáp được các nhu cầu
trên tấm FR4 có độ dày hsub = 1.575 mm, hằng số điện môi εr =
trên. Với việc có tính định hướng cao cũng như có thể thay đổi
pha và biên độ, anten mảng tái cấu hình cho phép chúng ta có thể
4.4 và suy hao tanδ = 0.02.
thay đổi đồ thị của anten mà không cần phải thay đổi cả hệ thống
anten. Bên cạnh đó, việc có thể tái cấu hình theo cả tần số và đồ II. THIẾT KẾ ANTEN
thị bức xạ, anten mảng đã trở nên thông minh và có thể đáp ứng
được hầu hết các yêu cầu hiện nay. Bài báo này đề xuất thiết kế
anten mảng tái cấu hình tần số với kích thước tại những tần số 1. Mô hình anten
trung tâm 7.5 Ghz và 9 GHz sử dụng cấu trúc Defected Ground Mô hình của anten được hiển thị trong hình 1. Cấu trúc của
Structure (DGS) và chuyển mạch bằng cách sử dụng pin diode. anten bao gồm lớp đất sử dụng cấu trúc Defected Ground
Anten mảng gồm 4 phần tử (2x2) được chế tạo sử dụng lớp điện
môi FR4 với các tham số: hằng số điện môi εr = 4.4, chiều dày lớp
Structure (DGS) với chiều dày t = 0.035 mm. Phía trên của lớp
điện môi hsub = 1.575 mm, suy hao tanδ = 0.02. Anten đề xuất có đất là tấm điện môi FR4 với chiều dày h = 1.575 mm, hằng số
hiệu suất cao và băng thông rộng. Anten được thiết kế và mô điện môi εr = 4.4, suy hao tanδ = 0.02.
phỏng sử dụng phần mềm CST Microwave Studio.
Index Terms: anten mảng, Defected Ground Structure (DGS),

anten tái cấu hình, băng thông rộng, pin diode
I. GIỚI THIỆU
Anten là một thành phần không thể thiếu trong các hệ thống
thông tin vô tuyến. Có nhiều loại anten khác nhau như anten
dipole, anten PIFA, anten loga chu kỳ, anten gương, ... Mỗi
loại anten có đặc tính hoạt động khác nhau và phù hợp với
những ứng dụng cụ thể.
Anten tái cấu hình là anten mà có thể thay đổi các đặc tính
hoạt động như tần số, đồ thị bức xạ và phân cực hoặc tổ hợp
của các đặc tính trên. Khái niệm anten tái cấu hình lần đầu
được đưa ra bởi D. Schaubert năm 1983 [1]. Những kỹ thuật
được sử dụng để tái cấu hình là RF-MEMS (Radio Frequency
MicroElectroMechanical System) [2][3], PIN diodes [4][5],
diode biến dung [6][7], quang dẫn [8][9]. Với khả năng có thể
thay đổi các đặc tính hoạt động, anten tái cấu hình đã trở nên
mềm dẻo và có thể đáp ứng cho nhiều ứng dụng khác nhau. a)
PIN diode là một thiết bị bán dẫn với hai trạng thái hoạt
động là ON và OFF. Trong mạch RF, PIN diode đóng vai trò
như một công tắc để đóng mở mạch. Với tốc độ chuyển mạch
nhanh và dễ dàng sử dụng, PIN diode ngày càng được sử dụng
rộng rãi, trong đó có lĩnh vực anten.
ISBN: 978-604-67-0635-9 394
394
khi trạng thái là OFF, nó tương đương với một điện trở rất lớn.
Với PIN diode, chúng ta có thể điều khiển một lượng lớn các
tín hiệu RF thông qua việc sử dụng dòng một chiều ở mức rất
nhỏ. Mô hình của PIN diode được hiển thị trong hình 2.
Hình 2: Mô hình của PIN diode [11]

b) Như được chỉ ra trong hình 2, cấu tạo của PIN diode gồm
Hình 1: Mô hình của anten: a) mặt trên; b) lớp đất. 3 vùng: vùng I ở giữa là vùng Silicon, vùng P và vùng N ở hai
Anten gồm 4 phần tử và những đường truyền tín hiệu được bên. Hiệu suất của PIN diode phụ thuộc chính vào hình dạng
điều khiển bằng pin diode. Anten được thiết kế lần lượt tại các chip và vật liệu bán dẫn ở vùng I. Sơ đồ tương đương của Pin
tần số trung tâm 7.5 GHz và 9 GHz. Để tăng cường băng diode được chỉ ra trong hình 3 [12].
thông cho anten, bài báo này sử dụng cấu trúc DGS ở lớp đất.
Rõ ràng là, khi lớp đất được khoét theo một hình dạng nào đó
thì điều này đồng nghĩa với việc chúng ta đã tạo ra các phần tử
ký sinh điện dung (C) và điện cảm (L).
Như chúng ta đã biết, tần số cộng hưởng của anten được
cho bởi biểu thức:
1
f  (1)
2 LC
Hình 3: Sơ đồ tương đương của PIN diode: a) trạng thái
Từ phương trình trên, rõ ràng là kích thước của anten đã ON; b) trạng thái OFF
được giảm khi chúng ta tăng giá trị L và C. Hơn nữa, việc
khoét ở lớp đất như vậy đồng thời đã tạo nên các hốc cộng 3. Defected Ground Structure (DGS)
hưởng, và việc này góp phần làm tăng băng thông cho anten.
Bảng 1 hiện thị giá trị của một số tham số trong lớp đất (đơn DGS là một cấu trúc tuần hoàn hoặc không tuần hoàn được
vị: mm). khoét trong mặt phẳng đất của đường truyền phẳng (ví dụ như
đường truyền vi dải, đường truyền đồng phẳng, v.v...). Khi mặt
W 70 L 70 phẳng đất được khoét theo một cấu trúc DGS bất kì, nó sẽ làm
dgs 6 w_dgs2 18 thay đổi sự phân bố dòng trên mặt phảng đất. Điều này sẽ làm
l_dgs2 10 w_dgs 3 thay đổi các đặc tính của đường truyền như điện dung và điện
cảm. Điều này sẽ có tác dụng làm giảm kích thước của anten
thông qua việc tăng điện dung và điện cảm.
Hiện nay, có rất nhiều loại pin diode. Mỗi loại PIN diode
có những đặc tính riêng và nó phù hợp với từng loại anten cụ Hiện nay, DGS được ứng dụng rộng rãi trong lĩnh vực RF
thể. Sau khi tìm hiểu, bài báo này đã chọn pin diode nói chung và anten nói riêng. Bằng việc sử dụng cấu trúc DGS,
MACOM-MA4AGBLP912[10] cho mô hình anten. chúng ta có thể cải thiện một số tham số của anten như: giảm
nhỏ kích thước, tăng băng thông, tăng độ lợi, v.v...
Anten sử dụng 8 PIN diode. Các PIN được đảm bảo bằng
nguồn một chiều 5V. Các PIN diode trong anten này đóng vai Hiện nay, có nhiều loại cấu trúc DGS khác nhau. Có thể
trò như các công-tắc có chức năng đóng/mở. Khi PIN diode chia DGS ra thành 2 loại: đó là DGS đơn vị và DGS tuần hoàn.
D1, D2, D3, D4 ở trạng thái ON; D5, D6, D7, D8 ở trạng thái Hình 4 liệt kê một vài cấu trúc DGS đơn vị và DGS tuần hoàn.
OFF, khi đó ta thu được tần số cộng hưởng của anten là 9
GHz. Ngược lại, khi các PIN diode D1, D2, D5 và D6 là ON;
D3, D4, D7 và D8 là OFF, ta thu được tần số cộng hưởng là
7.5 GHz.
2. Pin diode
PIN diode là một thiết bị bán dẫn. Trong các mạch RF, a)
PIN diode hoạt động như một biến trở. Khi trạng thái là ON,
PIN diode tương đương với một điện trở rất nhỏ. Ngược lại,
395
395
b)
Hình 4: Một số cấu trúc DGS hiện nay: a) cấu trúc DGS đơn
vị; b) cấu trúc DGS tuần hoàn [13]
Sơ đồ tương đương của cấu trúc DGS đơn vị được hiển thị
trong hình 5
b)
Hình 6: Kết quả mô phỏng của anten: a) tần số 7.5 GHz; b)
tần số 9 GHz
Từ hình 6, chúng ta có thể thấy rằng anten được phối hợp
trở kháng rất tốt. Tổn hao ngược của anten là rất nhỏ (dưới -25
dB). Hơn nữa, anten có băng thông rộng > 500 MHz. Với
băng thông này, anten có thể đáp ứng tốt cho các ứng dụng
cần băng thông lớn.
Hình 7 hiển thị kết quả đo kiểm của anten và so sánh với kết
Hình 5: Sơ đồ tương đương của cấu trúc DGS đơn vị[13]
quả mô phỏng.
Khi đó, các giá trị R, L, C lần lượt được tính như các biểu
thức sau [14]:
c
C

2 Z 0 0  c
2 2


L  1 / 4 f 0 C
2 2
 (2)
  
2
1 1
R    2Z 0 /  2 Z 0 C  1
S11   
2
L
a)
III. KẾT QUẢ MÔ PHỎNG VÀ ĐO KIỂM
Anten được chế tao trên tấm điện môi FR-4 với hằng số
điện môi εr = 4.4, chiều dày lớp điện môi hsub = 1.575 mm,
suy hao tanδ = 0.02. Hình 6 hiển thị kết quả mô phỏng của
anten lần lượt tại tần số cộng hưởng 7.5 GHz và 9 GHz.
b)
Hình 7: Kết quả mô phỏng và đo lường S11 của anten tại tần
a) số: a) 7.5 GHz; b): 9 GHz
Từ hình 7, chúng ta có thể thấy rằng mặc dù kết quả đo của

anten bị lệch so với kết quả mô phỏng. Tuy nhiên, kết quả này
396
396
là chấp nhận được do kết quả đo vẫn bao phủ được các băng
tần, và giá trị tổn hao ngược của anten vẫn được đảm bảo dưới
-10 dB. Hơn nữa, cũng từ hình 7, chúng ta có thể thấy rằng
anten có băng thông rộng và điều này là đủ để đáp ứng cho các
ứng dụng tại các băng tần 7.5 GHz và 9 GHz.
Có sự sai khác giữa kết quả đo lường và kết quả như vậy là
do một số nguyên nhân:
+ Do sự sai số về mặt kích thước giữa quá trình chế tạo và
mô phỏng.
+ Ảnh hưởng của việc hàn các linh kiện. Điều này ảnh
hưởng trực tiếp tới việc phối hợp trở kháng.
+ Ảnh hưởng từ các dây dẫn để tiếp điện cho Pin diode.
Việc này là nguyên nhân chính dẫn đến việc sai số trên.
Hình 8 minh họa đồ thị 3D và đồ thị cực của anten lần lượt
tại các băng tần 7.5 GHz và 9 GHz.
b)
Hình 8: Đồ thị của anten tại tần số: a) 7.5 GHz, b) 9 GHz
Anten có gain lần lượt tại các băng tần 7.5 Ghz và 9 GHz
là 4.8 dB và 5.5 dB. Cuối cùng, hình 9 minh họa anten được
thiết kế và chế tạo.
a)
a)
397
397
[5] Guang-Min Zhang, Jing-song Hong, Bing-Zhong Wang “A

novel pattern reconfigurable wideband slot antenna using PIN
diodes,” International Conference on Microwave and
Millimeter Wave Technology (ICMMT), pages: 22 - 24, May
2010.
[6] Khidre, A.; Xiao Liu ; Fan Yang ; Elsherbeni, A.Z.;
“Reconfigurable dual-band patch antenna using varactor-
loaded slot,” IEEE Antennas and Propagation Society
International Symposium (APSURSI),pages: 1 - 2, Jul 2012.
[7] Nishamol, M.S.; Aanandan, C.K.; Mohanan, P.;
Vasudevan, K.; “Dual frequency reconfigurable microstrip
antenna using varactor diodes,” XXXth URSI General
Assembly and Scientific Symposium, pages: 1 - 4, Aug 2011.
b)
[8] Y. Tawk, A. R. Albrecht, S. Hemmady, G. Balakrishnan,
Hình 8: Anten được chế tạo: a) mặt trên, b) mặt dưới and C. G. Christodoulou, “Optically pumped frequency
reconfigurable antenna design,” IEEE Antennas and Wireless
IV. KẾT LUẬN Propagation Letters, vol. 9, pp. 280–283, Mar. 2010.
Trong bài báo này, chúng ta đã thiết kế và chế tạo thành [9] Chaharmir, M.R.; Shaker, J.; Cuhaci, Michel; Sebak, A.;
công anten mảng tái cấu hình tần số sử dụng cấu trúc DGS. “Novel photonically-controlled reflectarray antenna,” IEEE
Băng thông của anten đã được cải thiện đáng kể thông qua Transactions on Antennas and Propagation, pages: 1134 -
việc sử dụng cấu trúc DGS. Mặc dù có sự sai lệch nhất định 1141, Apr 2006.
giữa kết quả mô phỏng và kết quả đo lường, tuy nhiên kết quả
đo lường bước đầu vẫn bao phủ được các băng tần cần thiết. [10] Datasheet: http://www.macom.com/products/product-
Vì vậy kết quả này là chấp nhận được. detail/MA4AGBLP912.
Hướng nghiên cứu tiếp theo của bài báo này là tìm giải [11] Bill Doherty, “PIN Diode Fundamentals” Microsemi
pháp để tăng băng thông cũng như hạn chế sai số trong việc Corporation.
chế tạo, hàn gắn linh kiện để từ đó có được kết quả đo kiểm
tốt hơn. [12] Doherty, W. E., and R.D. Joos., “PIN Diode Circuit
Designers' Handbook,” Watertown, MA: 02472.
Với sự mềm dẻo và linh hoạt của anten tái cấu hình, đó là
việc có thể thay đổi được các đặc tính của anten mà không [13] L. H. Weng, Y.-C. Guo, X.-W. Shi, and X.-Q. Chen, “An
phải thay đổi cả hệ thống như: tần số, đồ thị bức xạ, phân cực, Overview on Defected Ground Structure,” Progress In
.... anten tái cấu hình có thể đáp ứng cho các hệ thống thông Electromagnetics Research B, Vol. 7, 173-189, 2008.
minh ngày nay. Hơn nữa, với việc áp dụng công nghệ vi dải đã
góp phần làm giảm giá thành, dễ dàng chế tạo và kích thước [14] Insik, C. and L. Bomson, “Design of defected ground
nhỏ. Do đó, anten có thể được ứng dụng rộng rãi trong các hệ structures for harmonic control of active microstrip antenna,”
thống thông tin vô tuyến cũng như định vị vô tuyến. IEEE Antennas and Propagation Society International
Symposium, Vol. 2, 852–855, 2002.
[1] D. Schaubert, “Frequency-agile polarization diversity

microstrip antennas and frequency scanned arrays,” US Patent
#4,367,474, Jan. 1983.
[2] Zohur, A.;Mopidevi, H. ; Rodrigo, D. ; Unlu, M. ; Jofre, L.
; Cetiner, B.A.; “RF MEMS Reconfigurable Two-Band
Antenna,” IEEE Antennas and Wireless Propagation Letters;
pages: 72 - 75; Mar 2013.
[3] Cetiner, B.A.; Crusats, G.R. ; Jofre, L. ; Biyikli, Necmi;
“RF MEMS Integrated Frequency Reconfigurable Annular
Slot Antenna,” IEEE Transactions on Antennas and
Propagation; pages: 626 - 632; Mar 2010
[4] Lee, S.W.; Sung, Y. ; Park, J.Y. ; Lee, S.J. ; Hur, B.J.;
“Frequency reconfigurable antenna using a PIN diode for
mobile handset application,” 7th European Conference on
Antennas and Propagation (EuCAP); pages: 2053 - 2054; Apr
2013.
398
398
Nghiên cứu, thiết kế, chế tạo bộ thiết bị thực hành

điện tâm đồ phục vụ đào tạo
TS. Nguyễn Lê Cường, Ths.Hoàng Vân Đông, Ths. Đinh Văn Tuấn
Khoa Điện tử viễn thông - Trường Đại học Điện Lực
Email: cuongnl@epu.edu.vn, tuandv85@epu.edu.vn, hoangvandong@epu.edu.vn
Tóm tắt – Sử dụng Điện tâm đồ để chẩn đoán là một khâu Tuy nhiên nhiễu từ mạng cung cấp điện 50Hz (hoặc 60Hz)
quan trọng trong cấp cứu hay điều trị các bệnh về tim mạch. có ảnh hưởng nhiều nhất vì tính chất phổ biến và khó kiểm
Trong quá trình đào tạo, sinh viên các chuyên ngành Điện tử y soát của loại nhiễu này. Các loại can nhiễu còn lại, do có dải
sinh, cơ sinh học…rất cần các thiết bị thực hành, được dàn trải tần ổn định nên có thể giải quyết triệt để bằng các bộ lọc cố
thành các khâu xử lý từ đầu vào tới đầu ra, để có thể nắm bắt
định. Chính vì vậy trong bài báo này chúng tôi sẽ tập trung
kỹ càng lý thuyết đã học. Bài báo trình bày quá trình nghiên
cứu, thiết kế, chế tạo bộ thiết bị thực hành điện tâm đồ ứng vào hướng triệt nhiễu 50Hz từ lưới điện cung cấp, để thiết
dụng trong đào tạo. kế, chế tạo bộ công cụ thực hành điện tâm đồ, nhằm giúp
Abstract – Using ECG (Electrocardiogram) for diagnosis is cho người thực hành có thể quan sát và hiểu chính xác cơ
an important step in emergency or treat heart disease. During chế tác động và hậu quả do nhiễu này gây ra đối với tín hiệu
training, students of specialized biomedical electronics, điện tim. Có hai trường do lưới điện sinh ra có thể gây tác
biomechanics… needed practice equipment which is động lên thiết bị đo điện tim. Đó là điện trường và từ trường.
widespread to describe clearly the process steps from input to
output. This paper presents the research, design and produce a 1. Ảnh hưởng của điện trường 50/60Hz
practical device for applications in education.
Từ khóa –Thiết bị thực hành ECG.
Những dây điện lưới và những vật dẫn nối với lưới điện đều
sinh ra điện trường quanh nó. Điện trường này tác động tới
I. TÍN HIỆU ĐIỆN TIM thiết bị đo điện tim, dây điện cực và cơ thể bệnh nhân. Vì
Tín hiệu ECG (Electrocardiogram) ghi lại những hoạt động vậy điện áp lưới dao động tuần hoàn với tần số 50Hz hoặc
mang tính chất điện của tim. Tín hiệu ECG thông thường 60Hz nên điện trường do nó sinh ra cũng biến thiên tuần
bao gồm các đỉnh lồi và lõm được đặt tên theo thứ tự các hoàn cùng tần số. Dòng điện dịch mà nó ảnh hưởng tới các
chữ cái P, Q, R, S, T, U, như hình 1 dưới đây. vật khác có thể mô tả qua điện dung tạp tán giữa vùng điện
lưới sinh ra điện trường đó và vật thể.
Hình 1. Tín hiệu điện tim thông thường

 Đoạn PQ gồm thời gian khử cực nhĩ và truyền xung
động từ nhĩ tới thất. Hình 2. Dòng điện từ dây nóng lưới điện qua trở kháng giữa
 Phức bộ QS: Khử cực của tâm thất. cơ thể và đất.
 Đoạn ST: Thời kỳ khử cực hoàn toàn của thất.
 Sóng T: Tái cực của tâm thất. Hình 2 cho thấy ảnh hưởng của điện trường 50/60Hz lên cơ
Để thực hiện việc đo lường các đạo trình trên, người ta chế thể bệnh nhân làm sai lệch kết quả đo điện tim. Dòng điện
tạo ra các thiết bị đo ECG. Các tín hiệu của điện tâm đồ có dịch Idb qua điện dung tạp tán Cb vào cơ thể bệnh nhân,
dải tần trong khoảng 0.05-150Hz, biên độ: 0.5-5mV. Sóng qua trở kháng Zg xuống đất. Điện áp đồng pha Vcm sẽ xuất
điện tim có biên độ nhỏ, cho nên rất dễ bị ảnh hưởng bởi hiện trên cơ thể bệnh nhân.
nhiễu. Các can nhiễu chính ảnh hưởng đến chất lượng ghi Vcm = Idb.Zd (1)
tín hiệu điện tim là:
Nếu dòng Idb = 1µA, Zd = 50 KΩ thì
 Nhiễu từ mạng cung cấp điện có tần số thay đổi ngẫu Vcm = x5x = 50mV
nhiên.
 Nhiễu sóng cơ do bệnh nhân mất bình tĩnh khi đo gây Điện áp vi sai giữa A và B là UA- UB
ra.
 Nhiễu do tiếp xúc không tốt giữa điện cực và bệnh UA- UB = Vcm( ) (2)
nhân gây ra.
Vì Zin >> Z1, Z2 (trở kháng tiếp xúc điện cực – da)
 Nhiễu do tần số thấp gây trôi đường nền
ISBN: 978-604-67-0635-9 399

399
Băng các phép biến đổi toán học ta dễ xác định được điện
UA- UB = Vcm( ) (3) áp đồng pha bằng biểu thức sau:
Ở đây chỉ xét trường hợp cơ thể bệnh nhân cách điện hoàn
Ucm = (5)
toàn, dòng điện Idb là dòng điện dịch qua điện dung tạp tán
Cb. Còn nếu bệnh nhân không được cách điện tốt nghĩa là
Thí dụ chọn Rf = 5MΩ, Ra = 10KΩ trong trường hợp như
có dòng điện dò do môi trường cách điện kém (ẩm) thì Idb
thí dụ nêu ở trên Id= 1µA thì:
còn lớn hơn nhiều. Và ở đây coi hệ thống kim loại trừ nhiễu
đồng pha của tầng tiền khuếch đại máy điện tim là vô cùng
lớn. Trong thực tế không phải như vậy. Nhiễu 50/60Hz tác ) (6)
động lên cơ thể bệnh nhân ảnh hưởng tới kết quả đo còn lớn
hơn nữa. Như vậy so với ví dụ ở trên thì ở đây Vcm đã giảm đi 10 lần.
2. Ảnh hưởng từ trường 50/60Hz Hơn nữa Vcm không còn phụ thuộc vào Zd.
Nếu tiến hành đo điện tim ở những nơi có từ trường mạnh Sử dụng các bộ lọc: Một biện pháp hữu hiệu để loại trừ
như quạt, chấn lưu đèn neon, động cơ điện và dây điện có can nhiễu 50/60Hz là dùng lọc chắn dải tích cực. Bộ lọc IIR
dòng điện lớn chạy qua thì nhiễu 50/60Hz sẽ gây ảnh hưởng. với đáp ứng xung vô hạn dựa trên tần số lấy mẫu 500Hz,
Theo định luật cảm ứng điện từ: Um = dФ/dt với chiều rộng khe là 10Hz. Hàm lọc như sau:
Ở đây Ф là từ thông qua diện tích S.

Giả sử từ trường vuông góc với mặt S thì : Um = S/dt (7)
Sau khi tính toán ta được phương trình đệ quy đưa vào
Nếu dây điện cực và cơ thể bệnh nhân tạo vòng kín có diện
MCU như sau:
tích là S, từ trường động cơ hoặc do dòng điện lưới 50/60Hz
sinh ra là B thì y(n) = x(n) - 1.168x(n-1) + x(n-2) + 1.1564y(n-1)
-0.8783y(n-2) (8)
Um = BS (4)
Ở đây f = 50/60Hz - là tần số điện lưới Sử dụng FDAtool của matlab ta vẽ được đáp ứng tần số của
hàm lọc trên như sau:
Ví dụ: B = 10µT, f = 50Hz, S = 0.5 thì
Um = x0.5x 2x3.14x50 = 1,6mV
Như vậy từ trường cỡ 10 µT qua diện tích 0.5 đã gây
ra nhiễu lớn hơn tín hiệu điện tim (cỡ 1.5mV).
3. Chống ảnh hưởng của can nhiễu 50/60Hz
Qua phân tích ở trên ta thấy rằng: tiếp xúc da – điện cực tốt,
trở kháng vào của tầng tiền khuếch đại lớn, hệ số loại trừ
nhiễu đồng pha của tầng tiền khuếch đại cao, cơ thể bệnh
nhân được cách điện tốt hoặc giường nằm của bệnh nhân
được nối đất tốt, tầng tiền khuếch đại dùng nguồn cách ly
(tầng tiền khuếch đại cách điện) thì nhiễu 50/60Hz tác động
lên có thể bệnh nhân sẽ ảnh hưởng ít tới kết quả đo. Ngoài
ra chúng tôi còn sử dụng một số phương pháp chống nhiễu Hình 4. Đáp ứng tần số của bộ lọc 50Hz
tích cực khác trong thiết kế của mình.
Sử dụng mạch kéo chân phải: Hình 3 dùng mạch kéo Tầng khuếch đại cách ly và nguồn cách ly có nhiệm vụ
(drive) chân phải để giảm nhỏ ảnh hưởng của can nhiễu chính là đảm bảo độ an toàn cao cho bệnh nhân nhưng ngoài
đồng pha. ra nó còn giảm rất nhiều ảnh hưởng của can nhiễu điện lưới
50Hz. Phần mạch cụ thể sẽ xét ở phần sau.
II. THIẾT KẾ, CHẾ TẠO BỘ THỰC HÀNH ĐIỆN TÂM ĐỒ

Mục tiêu: Thiết kế, chế tạo máy đo và xử lý tín hiệu ECG.
Thiết bị có khả năng đo tín hiệu điện tim, lọc nhiễu nguồn
điện 50Hz, hiển thị dạng sóng, giá trị nhịp tim, lưu trữ và
truyền thông tin về máy tính.
Hình 3. Mạch kéo (drive) chân phải
400
400
Hội Thảo
Hội Thảo QuốcQuốc
GiaGia 2015
ĐiệnTử,
Tử,Truyền
Truyền Thông
Thông và
vàCông
CôngNghệ
NghệThông Tin (ECIT
Thông 2015)
Tin (ECIT 2015)
Sơ đồ nguyên lý mạch đo tín hiệu điện tim K2 =

K3 = 1+
Tần số cắt
f1 = 0.05 Hz
f2 = =
2. Khối xử lý trung tâm

Khối này thực hiện nhiệm vụ đầu tiên là biến đổi tín hiệu
điện tim sau khối Đo ECG thành tín hiệu số để thực hiện
cho các mục đích tiếp sau.
Hình 5. Sơ đồ khối nguyên lý mạch đo tín hiệu điện tim.
Lọc loại bỏ can nhiễu: Để loại bỏ nhiễu cho tín hiệu ECG
Tín hiệu điện tim được đo là tín hiệu vô cùng nhỏ và dễ bị
chúng tôi sử dụng bộ lọc IIR với đáp ứng xung vô hạn dựa
can nhiễu. Tín hiệu này được đo và khuếch đại, tiếp theo là
được loại bỏ các can nhiễu bằng các mạch lọc. Tín hiệu điện trên tầ n số lấy mẫu 500Hz. Bộ lọc thứ nhất để loại bỏ nhiễu
tim là tín hiệu tương tự sẽ được chuyển đổi sang tín hiệu số 50Hz đã trình bày ở mục (I.2) của bài báo này. Bộ lọc thứ 2
để xử lý, truyền thông, lưu trữ… là bộ lọc thông dải với tần số cắt dưới là 0,5Hz và tần số cắt
Từ sơ đồ nguyên lý và mục tiêu thiết kế, chúng tôi phân tích, trên là 100Hz đáp ứng được giải tần của tín hiệu điện tim là
thiết kế và đưa ra sơ đồ khối cũng như sơ đồ nguyên lý chi từ 0,5Hz-100Hz. Hàm lọc như sau:
tiết cho từng khối như sau:
Khối Hiển
Khối
Truyền
Khối chỉ thị (9)
Thị từ xa
Thông Sau khi tính toán ta được phương trình đệ quy đưa vào
MCU như sau:
Khối Đo Khối Lưu
ECG
Khối MCU
Trữ y(n) = 0.4206 x(n) – 0.4206 x(n-2) +1.1582y(n-1) –
0.1582y(n-2)
Khối nguồn
Hình 6. Sơ đồ khối Bộ điện tâm đồ.

Dưới đây chúng tôi sẽ đưa ra và trình bày một số khối chức
năng trong thiết kế của mình.
1. Khối đo ECG
Hình 8. Đáp ứng tân số của bộ lọc thông dải 0.5-100Hz.
Ngoài ra khối này còn thực hiện các chức năng khác như
điều khiển hiể n thị tín hiệu điện tim lên màn hình
touchscreen LCD TFT 3.2 inch, lưu trữ, truyền tín hiệu điện
tim nên máy tính… Trong thiết kế của mình chúng tối sử
dụng chíp Atmega2560 của ATMEL.
Hình 7. Sơ đồ nguyên lý khối đo ECG.

Khối đo ECG sẽ thực hiện việc đo lường tín hiệu điện tâm
đồ từ cơ thể người sau đó khuếch đại, tiếp theo loại bỏ các
thành phần nhiễu tần số cao và thấp. Khối này sử dụng các
Hình 9. Bộ thiết bị thực hành điện tâm đồ.
bộ lọc thông thấp, thông cao để thu được tín hiệu với dải tần
từ 0.05-70Hz theo chuẩn FDA của Mỹ. Hình 9 là Bộ thiết bị điện tâm đồ do nhóm tác giả nghiên
cứu, chế tạo với mục đích phục vụ đào tạo thực hành cho
Hệ số khuếch đại là K = K1xK2xK3. Trong đó: sinh viên trong Trường Đại học Điện lực. Các đặc điểm cơ
bản của bộ thiết bị này như sau:
K1 =
401
401
- Nguồn cấp: 9VDC - 12VDC. MỤC ĐÍCH
- Màn hình hiển thị: Loại touchscreen LCD TFT 3.2 inch Bài thực hành này cung cấp cho sinh viên những nguyên lý
cho phép hiển thị dạng sóng tín hiệu và thực hiện các thao cơ bản về việc đo, xử lý, hiển thị và đọc tín hiệu điện tim.
tác trên đó.
CHUẨN BỊ
- Lưu trữ: Sử dụng bộ nhớ SD Card cho phép lưu trữ nhiều - Bộ thiết bị thực hành Điện tâm đồ: 01 bộ
lần đo.
- Điện cực sử dụng 1 lần: 03 bộ
- Kết nối máy tính: Cho phép kết nối máy tính theo giao
diện cổng truyền thông RS232. - Máy tính có cài phần mềm ART_ECG theo dõi tín hiệu
điện tim: 01 bộ
- Loại điện cực sử dụng: Loại điện cực dán sử dụng một lần.
- Nguồn cấp 12VDC: 01 bộ
III. BÀI THỰC HÀNH MẪU TRÊN THIẾT BỊ
CÁC BƯỚC TIẾN HÀNH
1. Bài thực hành do tín hiệu điện tâm đồ không có bộ lọc Bước 1: Kết nối apdapter, cáp kết nối RS232 với bộ thiết bị
MỤC ĐÍCH đo. Kết nối cáp kết nối RS232 với máy tính và cắm nguồn.
Bài thực hành này cung cấp cho sinh viên những nguyên lý Bước 2: Bật nguồn máy tính, bật phần mềm ART_ECG theo
cơ bản về việc đo, xử lý, hiển thị và đọc tín hiệu điện tim. dõi tín hiệu điện tim. Bật công tắ c nguồn cho bộ thiết bị đo.
CHUẨN BỊ Bước 3: Dán 3 điện cực vào vị trí đạo trình trước tim.
- Bộ thiết bị thực hành Điện tâm đồ: 01 bộ Bước 4:Lựa chọn đo không có bộ lọc, quan sát tín hiệu đo
- Điện cực sử dụng 1 lần: 03 bộ trên màn hình. Nếu thấy tín hiệu đo đã ổn định thì lựa chọn
lưu trữ sau đó lựa chọn truyền thông.
- Máy tính có cài phần mềm ART_ECG theo dõi tín hiệu
điện tim: 01 bộ Bước 5: Lựa chọn ngừng đo.
- Nguồn cấp 12VDC: 01 bộ Bước 6: Quan sát kết quả đo trên máy tính, vẽ lại dạng tín
hiệu điện tâm đồ đo được, ghi lại các chỉ số của tín hiệu này.
CÁC BƯỚC TIẾN HÀNH
Bước 7: Bấm nút lọc tín hiệu 50Hz, quan sát dạng sóng và
Bước 1: Kết nối apdapter, cáp kết nối RS232 với bộ thiết bị so sánh nó với dạng sóng trước khi lọc.
đo. Kết nối cáp RS232 với máy tính và cấ p nguồn.
Bước 8: Trả lời câu hỏi
Bước 2: Bật nguồn máy tính, bật phần mềm ART_ECG theo
dõi tín hiệu điện tim. Bật công tác nguồn cho bộ thiết bị đo. Câu 1: Nhiễu 50Hz được loại bỏ theo thuật toán nào.
Bước 3: Dán 3 điện cực vào vị trí đạo trình trước tim. Câu 2: So sánh tín hiệu thu được sau khi lọc với tín hiệu gốc
có nhiễu
Bước 4: Lựa chọn đo không có bộ lọc, quan sát tín hiệu đo
trên màn hình. Nếu thấy tín hiệu đo đã ổn định thì lựa chọn Dưới đây là dạng tín hiệu điện tim thu được khi thực hiện
lưu trữ sau đó lựa chọn truyền thông. đo bằng bộ thiết bị mà sử dụng bộ lọc số để loại bỏ can
nhiêu 50Hz. Chúng ta thấy sự khác biệt rõ giữa dạng tín
Bước 5: Lựa chọn ngừng đo. hiệu thu được ở Hình 10 và Hình11.
Bước 6: Quan sát kết quả đo trên máy tính, vẽ lại dạng tín
hiệu điện tâm đồ đo được, ghi lại các chỉ số của tín hiệu này.
Bước 7: Trả lời câu hỏi.
Câu 1: Xác định số xung nhip trên một phút.
Hình 11. Tín hiệu điện tim đo được có sử dụng lọc.
Câu 2: So sánh dạng tín hiệu đo được với tín hiệu chuẩn,
đưa ra những đánh giá về ảnh hưởng của nhiễu 50Hz. VI. KẾT LUẬN
Dưới đây là dạng tín hiệu điện tim thu được khi thực hiện Bài báo đã trình bày tóm lược quá trình nghiên cứu, thiết kế
đo bằng bộ thiết bị mà không sử dụng bộ lọc số để loại bỏ và chế tạo bộ thực hành Điện tâm đồ ứng dụng trong đào tạo.
can nhiêu 50Hz. Thiết bị hiện được chúng tôi sử dụng trong việc đào tạo sinh
viên chuyên ngành Điện tử y tế tại trường Đại học Điện lực,
mang lại sự trực quan cho sinh viên, nâng cao chất lượng
đào tạo chuyên ngành.
[1] TS. Lê thị Bích Thuận, “Điện tâm đồ bệnh lý”.
Hình 10. Tín hiệu điện tim đo được không sử dụng lọc. [2] BS. Đinh Hiếu Nhân, “Điện tâm đồ căn bản”.
[3] GS. Trần Đỗ Trinh, “Hướng dẫn đọc điện tim”, 2010.
2. Bài thực hành do tín hiệu điện tâm đồ có bộ lọc [4] www.yhoc.net
[5] Kester W, “Which ADC Architecture is Right for Your
Application ?”, Analog Dialogue, 2
402
402
Những Ảnh Hưởng Của Thời Tiết Đối Với

Kết Nối Mạng Quang Vô Tuyến
Lê Quốc Cường, Sở Thông tin và Truyền thông TPHCM, email: cuonglequoc@gmail.com
Tăng Chí Kiệt, Học viện Công nghệ Bưu Chính Viễn thông (TPHCM), email: kiettc@gmail.com
Tóm tắt – Với những ưu điểm mang lại của hệ thống quang hiếm khi xảy ra đồng thời vì thế ta tiến hành nghiên cứu nó
vô tuyến thì quang vô tuyến (FSO) là mạng của kết nối trong riêng biệt [2].
tương lai. Tuy nhiên, quang vô tuyến bị ảnh hưởng rất lớn các Một giải pháp hiệu quả để giảm thiểu suy hao hiệu suất
yếu tố khách quan của các điều kiện khí quyển thường xuyên của hệ thống FSO là sử dụng các kỹ thuật chuyển tiếp hỗ trợ.
thay đổi dẫn đến làm suy hao hiệu suất kênh truyền. Do đó việc
Trong một kênh truyền đa bước nhảy, tổng đường truyền được
sử dụng nút chuyển tiếp là một trong những phương pháp hứa
hẹn nhất đế giảm thiểu suy hao của hiệu suất truyền trong mạng chia thành những khoảng cách nhỏ. Tại mỗi nút chuyển tiếp,
quang vô tuyến. Trong bài báo này, chúng ta xem xét một mạng các tín hiệu quang nhận được, xử lý và truyền sang nút kế tiếp.
FSO nhiều nút, các nút được phân phối tại các vị trí cố định trên Bằng cách đó, một mạng lưới nối tiếp có thể truyền tín hiệu
một đường truyền nhất định. Tôi tính đến các hiện tượng thời tiết đến những nơi khoảng cách xa [3]. Một mạng nối tiếp được
quan trọng nhất như là: sương mù, mưa và tuyết, và rút ra biểu cho là kết nối khi tồn tại một kết nối từ một nút đến một nút
thức giải tích xác suất nút cách ly. Tiếp theo, chúng ta tìm thấy số bất kỳ khác. Việc thiếu kết nối giữa ít nhất một cặp nguồn–
lượng trạm thu phát cho một chiều dài kết nối nhất định để đạt đích có nghĩa là mạng được cho là bị ngắt kết nối [4]. Một
được hiệu suất đáng tin cậy. Ngoài ra, tôi cũng xem xét các tham số quan trọng để mô tả kết nối là xác suất một nút bị
trường hợp ngược lại, nghĩa là, với một số lượng máy thu phát
cách ly, là xác suất mà một nút ngẫu nhiên không thể kết nối
nhất định ta có thể tìm được chiều dài kết nối nhất định để đạt
được hiệu suất đáng tin cậy. Các phân tích cũng cung cấp những với bất kỳ nút khác [5].
hiểu biết đáng kể vào những yếu tố chính làm giảm hiệu suất của Số lượng trạm chuyển tiếp
mạng FSO. Nó là một công cụ có giá trị cho các nhà nghiên cứu
viễn thông để thiết kế mạng lưới như vậy trong thực tế.
Từ khóa – Quang vô tuyến, xác suất cách ly nút, ảnh hưởng T 1 2 … n R

thời tiết, quỹ công suất đường truyền, mạng đa chặng.
1 2 3 N-1 N
Quang vô tuyến (FSO) là một kỹ thuật rất hiệu quả cho
việc tiết kiệm chi phí và băng thông cao cho các dịch vụ băng Số lượng trạm
thông rộng qua mô hình kết nối điểm – điểm. Cách thức mà
Hình 1: Kiến trúc mạng
FSO hoạt động thì cũng khá giống như trong sợi quang. Tuy
Các đường kết nối trong kết nối mạng không dây đóng
nhiên, khi tín hiệu quang truyền qua môi trường không khí, thì
vai trò rất quan trọng vì khả năng mất kết nối trong mạng
suy hao đường truyền giữa máy phát và thu bị nâng lên do tác
không dây cao hơn nhiều so với các mạng hữu tuyến. Hiện
động các yếu tố trong môi trường không khí xuất hiện. Thời
nay, các công trình nghiên cứu về mạng quang vô tuyến rất
tiết, khoảng cách truyền, tán xạ, hấp thụ, sự nhiễu động, ảnh
hạn chế về các tài liệu kỹ thuật chi tiết, vì đây là lĩnh còn khá
hưởng pointing error, bước sóng truyền và tốc độ truyền là
mới. Đó là động lực cho tôi bắt đầu làm việc về chủ đề này, tôi
một trong các yếu tố xác định và ngẫu nhiên tác động đến hiệu
nhận thấy vấn đề kết nối chính là thách thức mạng lưới FSO
suất kênh truyền quang vô tuyến.
mà bị chủ yếu là từ các điều kiện thời tiết bất lợi.
Trong các yếu tố tác động trên thì các hiện tượng khí
tượng đóng vai trò rất quan trọng trong việc thiết kế, triển khai II. CÁC MÔ HÌNH GIẢ ĐỊNH
kết nối FSO. Sương mù, tuyết và mưa gây ra sự tán xạ của tín
A. Mô Hình Phân Bố Nút
hiệu quang trong khí quyển. Tán xạ làm cho một phần của
Một mô hình phân bố nút không gian là cần thiết để phù
chùm ánh sáng truyền từ một nguồn làm chệch hướng đi so
hợp với hiệu quả cấu trúc động của một mạng truyền thông
với phương truyền ban đầu. Một hiệu ứng khí quyển dưới điều
[8]. Đối với các hệ thống vô tuyến, mô hình xử lý điểm
kiện thời tiết cụ thể được gây ra bởi những thay đổi ngẫu
Poisson (Poisson point-process - PPP) là phổ biến nhất do tính
nhiên trong chiết suất khí quyển. Kết quả là có sự biến động
đơn giản của nó [6]. Mô hình PPP giả định một số lượng lớn
ngẫu nhiên và bức xạ (nhấp nháy) của các tín hiệu quang được
các máy thu phát phân tán ngẫu nhiên trên một khu vực phục
quan sát thấy tại máy thu [1]. Hơn nữa, các kết nối FSO còn
vụ giới hạn và giả định mật độ nút liên tục. Tuy nhiên, cách
phụ thuộc vào hiệu suất lỗi pointing error. Lỗi Pointing error
tiếp cận đó là không chính xác cho các mạng trong thực tế
xảy ra do sự không thẳng cơ học hoặc sai sót trong hệ thống.
thường bao gồm một số hữu hạn các nút thông tin. Vì lý do
Trong số tất cả các hiện tượng, sương mù mang lại những ảnh
đó, sự phát triển của một mô hình thực tế hơn trong đó giả
hưởng lớn nhất, nó được cấu thành từ các giọt nước nhỏ có
định một số các nút đã biết và cố định có phân bố độc lập
kích thước gần kích thước của bước sóng hồng ngoại. ngoài ra
trong một khu vực nhất định gần đây đã được đề xuất trong
mưa và tuyết cũng tác động đến hiệu suất FSO, mặc dù tác
[9]. Mô hình này, được gọi là xử lý điểm nhị thức (binomial
động của nó ít hơn của sương mù. Trong các yếu tố ảnh hưởng
point-process - BPP), cũng có thể tìm thấy ứng dụng cho
của các điều kiền thời tiết khác nhau thì các hiện tượng này
mạng một chiều FSO nơi các nút được đặt cách nhiều km.
ISBN: 978-604-67-0635-9 403
403
Do đó chúng ta xem xét một kiến trúc mạng nối tiếp gồm Một nút trở nên bị cách ly khi nút kế đầu tiên của nó
n chuyển tiếp, tức là, N nút thu phát FSO phân bố đều trong vượt ra ngoài phạm vi kết nối ( R ); do đó, xác suất cách ly
một khoảng phục vụ theo một mô hình BPP (Hình 1). Khoảng nút, Piso , có thể suy ra:
cách giữa một nút và nút kế thứ k của nó tuân theo phân phối Piso Pr(r  R ) 
1 Pr(r  R )
beta tổng quát được cho bởi [11]: N 1
1 r
R N  r
 f Rk (r )  ( ; k , N  k  1), (1) 1 
 1  l  dr (5)
l l
0 l  
N
ớǣ  R
 ( x; a, b) biểu thị hàm mật độ beta.  1   ,
 l 
 ( x; a, b) (1/ B(a, b)) x a 1 (1  x)b 1
 Từ phương trình trên, chúng ta có thể kết luận rằng xác
và hàm beta B(a, b) được xác định bởi: suất cách ly nút phụ thuộc với chiều dài nhất định (l), phụ
1 thuộc vào phạm vi truyền dẫn tối thiểu ( R ), và số lượng các
t
x 1
B
( x, y) (1  t ) y 1 dt nút ( N ).
0
Chứng minh: Phạm vi truyền dẫn tối thiểu đó liên quan trực tiếp đến sự
Xem xét mô hình xử lý điểm nhị phân (BPP) với N điểm xuất hiện của sương mù, khói mù, mưa, hoặc tuyết gây ra sự
phân bố ngẫu nhiên đều trong một quả cầu B có d chiều và hấp thụ và/hoặc tán xạ của các tín hiệu quang truyền đi. Theo
quan điểm trên, nghiên cứu này bắt nguồn từ số lượng các nút
tâm là O bán kính R Thể tích của quả cầu vd (W) là bằng
tối thiểu ( N ) điều đó là cần thiết để mạng hoạt động với xác
cd R d mà: suất cách ly nút tiến gần bằng không.
d B. Quỹ Công Suất Đường Truyền.
 2
Trong những năm gần đây, những các nhà nghiên cứu đã
Cd  , (2)
(1  d 2) nỗ lực để phát triển một mô hình kênh dự báo ảnh hưởng thời
Là thể tích đơn vị của quả cầu trong miền R d bao gồm các tiết trên truyền dẫn FSO [10]. Một mô hình khá hiệu quả cho
việc đánh giá quỹ công suất đường truyền được mô tả trong
trường hợp c2  và c3  4 .
c1 2,
3 [5] và cũng trong [11]. Theo mô hình này, công suất thu được
Mật độ của mô hình này là N (cd R d ) . biểu diễn theo phương trình truyền sóng như sau :
Hàm phân bố tích lũy bù (ccdf) của Rn là xác xuất có ít Ar
Pr  Pt e .R , (6)
 .R 
2
nhất có n điểm nằm trong quả cầu Bd (O, r ) :
n 1
N với:
  k  p 1  p 
N k
F Rn (r )
 k
,0r  R (3) Pr là công suất thu (Watt),
k 0  
Pt là công suất phát (Watt),
r R
d d
Với p c
 dr cd R d .
 là chùm tia phân kì (rad),
F Rn viết lại với dạng đầy đủ như sau: R là khoảng cách truyền (m),
F Rn
(r ) I1 p ( N  n  1, n), 0r R Ar là diện tích khẩu độ máy thu,
x e R là hàm mũ cơ số e của tích hệ số suy hao trong khí
I x ( a, b) 
0
t a 1 (1  t )b 1 dt quyển và khoảng cách.
B ( a, b) Xem xét phương trình trên, các biến có thể được kiểm
soát được là : công suất phát, diện tích của khẩu độ máy thu,
Hàm pdf của khoảng cách là f Rn  d F Rn / dr và ta có: sự phân kỳ chùm tia, và khoảng cách truyền. Trong đó, hệ số
d suy hao trong khí quyển là không kiểm soát được, phụ thuộc
f Rn (r ) - I1- p ( N - n  1, n) điều kiện môi trường bên ngoài và nó độc lập với khoảng
dr
N - n n -1 bước sóng trong điều kiện suy hao lớn. Nhận thấy rằng, công
 d (1- p)  (1- p) p suất thu được là phụ thuộc rất lớn vào hệ số suy hao trong khí
 - 
 dr  B( N - n  1, n) quyển và khoảng cách ; trong các tình huống điều kiện khí
dr
d -1
(1- p ) N - n p n -1 quyển thực tế, cho hệ thống mạng có yêu cầu độ sẳn sàng là
 99,9% hoặc cao hơn, hệ suy hao quyết định mọi yếu tố (chiếm
R  R  B ( N - n  1, n) ưu thế) trong phương trình trên.
d (1- p ) N - n p n -1 d B.1 Độ suy hao tín hiệu trong không khí:
 Kênh truyền suy hao khí quyển bao gồm hai hiện tượng
R B ( N - n  1, n)
hấp thụ và tán xạ. Nồng độ các chất trong khí quyển gây ra sự
d B  n -1 d  1, N - n  1   r  
d
1 suy hao tín hiệu theo thời gian và không gian khác nhau, và
     ; n   1, N  n  1 ,
R B( N - n  1, n)   phụ thuộc vào vị trí và điều kiện thời tiết hiện tại. Đối với kết
 R  d 
nối FSO mặt đất việc truyền tải tín hiệu quang từ máy phát
(4)
đến máy thu thông qua bầu khí quyển ở một khoảng cách L
Vì 0  r  R,
tuân theo định luật Beer-Lampert [7].
Với d  1 , ta có: P
1 r     , L   R e (  ) L , (7)
f Rn (r )    ; n, N  n  1 PT
R R  với y ( ) và  ( , L) là hai hệ số đại diện cho tổng suy hao và
việc truyền tải tín hiệu quang thông qua bầu khí quyển ở bước
404
404
sóng  tương ứng. Sự suy hao tín hiệu quang trong bầu khí k1 , k2 : là thông số mô hình phụ thuộc vào kích thước giọt
quyển bị gây ra bởi những thành phần phân tử khí và điều kiện mưa và nhiệt độ mưa.
thời tiết. Hệ số suy hao là tổng những hệ số hấp thụ và tán xạ từ Bảng 1. Các điều kiện mưa [14]
những thành phần phân tử và điều kiện thời tiết trong khí quyển. Lượng mưa Số lượng (mm/h)
 ( )  m ( )  a ( )  m ( )  a ( ), (8) Mưa ít 2.5
với  m ( ),  m ( ) là hai tham số biểu diễn cho sự hấp thụ bởi Mưa vừa 12.5
những phân tử và các hạt trong khí quyển. Mưa lớn 25
Hệ số suy giảm tạo nên từ sự hấp thụ và tán xạ các Mưa dông và nặng hạt 90
photon quang của các phân tử khí trong không khí. Vì các
bước sóng thường được lựa chọn để sử dụng (780nm, Các giá trị thông số k1 , k2 được sử dụng để ước lượng
850nm, 1550nm) nằm trong vùng cửa sổ truyền nên ảnh của sự suy giảm do mưa đã được khuyến nghị bởi ITU-R
hưởng hệ số hấp thụ nhỏ so với tổng suy hao. Do đó, ảnh P1814 [15].cụ thể:
hưởng của hệ số suy giảm do tán xạ đường truyền gây ra là Bảng 2: Các giá trị thông số suy hao do mưa
chủ yếu. Địa điểm k 
B.2 Suy hao tín hiệu do sương mù: Japan 1.58 0.63
Sự suy giảm của tín hiệu quang ở khoảng cách R , do France 1.076 0.67
sương mù và khói mù, được xác định bởi định luật Beer- Trong mô phỏng phía sau, ta áp dụng các giá trị k1 =
Lambert [12]:
 R 1.58, k 2 = 0.63, được dựa trên các số đo với R lên đến 90
Att fog  e fog , (9)
mm/h.
với: B.4 Suy hao tín hiệu do tuyết:
Att fog : hệ số suy hao do sương mù trong khí quyển. Suy hao do tuyết được phân thành khô và ướt [16]. Tuyết
 fog : hệ số suy hao trong điều kiện sương mù; ướt bị tan chảy một phần và dày đặc hơn trong khi tuyết khô ít
đậm đặc hơn và dễ dàng trôi theo gió. Sự suy hao cụ thể
R : khoảng cách truyền.
(dB/km) được cho bởi [15]:
Có một số mô hình cho phép để tính toán sự hấp thu ánh
sáng cụ thể cho các bước sóng quang học khác nhau dựa trên Attsnow  b1S b2 , (13)
các dữ liệu tầm nhìn. Hai mô hình được sử dụng rộng rãi nhất với:
là mô hình Kruse và các mô hình Kim. Trong khuôn khổ bài Attsnow : hệ số suy hao trong điều kiện thời tiết tuyết,
luận này tôi xin giới thiệu mô hình của Kruse [13], được bởi S : là tỷ lệ tuyết rơi mm/h,
công thức sau: b1 , b2 : là hàm bước sóng.
q
3.912    Các giá trị của các thông số b1 , b2 đã được khuyến nghị
 fog ( Km ) 
1
  , (10)
V  0  bởi ITU-R P1814 [15] như sau:
với: Bảng 3: Các giả trị suy hao bởi tuyết
 fog : hệ số suy hao trong điệu kiện sương mù, b1 b2
-5
V : tầm nhìn [km], Tuyết ướt 1.02 x 10 λ + 3.79 0.72
 : bước sóng của tín hiệu truyền [nm], Tuyết khô 5.42 x 10-5 λ + 5.50 1.38
0 : bước sóng chuẩn,
C. Phạm Vi Truyền Dẫn Tối Thiểu:
q : hệ số phân bố kích thước tán xạ được xác định theo
Phạm vi truyền dẫn đạt được tối thiểu của mỗi máy thu
mô hình Kruse. phát phụ thuộc nhiều vào điều kiện thời tiết trên các đường
Kết quả của công trình nghiên cứu và kiểm chứng thực truyền FSO. Nó có thể dễ dàng thu được bằng cách thế
nghiệm cho thất giá trị hệ số q được tính toán theo độ phân bố phương trình (9), phương trình (12), hoặc phương trình (13)
kích thước hạt và tầm nhìn (theo mô hình của Kruse) [13]: vào phương trình (6) và tính được R như sau:
1.6 if V  50 Km   fog Pt Ar 
 10W0  
q  1.3 if 6 Km  V  50 Km,  2 Pr 
(11) 
 R fog  , (14)
0.585*V if V  6 Km
13
 fog
Giá trị q tăng dần theo khoảng cách nhìn. Sương mù xuất
 ln z1 Pt Ar 
hiện khi tầm nhìn ít hơn 1 km. Mặt khác, khói mù xuất hiện 10W0  
 2 Pr
khi tầm nhìn dao động từ 2 km đến 5 km [14].  ,
Rrain  (15)
B.3 Suy hao tín hiệu do mưa: ln z1
Giọt nước mưa có kích thước đủ lớn cũng gây ra phản xạ
và khúc xạ của tín hiệu quang học. Suy hao cụ thể (đơn vị  ln z2 Pt Ar 
10W0  
dB/km) cho bởi [15]:  2 Pr
Rrain   , (16)
Attrain  k1 Rk2 , (12) ln z2
trong đó: k2 b2
với z1  10k1R và z2  10b1S .
Attrain : hệ số suy hao do mưa trong khí quyển,
Trong các phương trình trên, W0(.) biểu thị nhánh giá trị
R : là tỷ lệ mưa (mm/h) (xem bảng I),
thực chính của hàm Lambert W. Ta cũng có thể tính được biểu
405
405
thức giải tích xác suất cách ly nút (phương trình 5) bằng cách D. Tình Huống 1: Tìm Số Lượng Nút Chuyển Tiếp Cho Một
thay thế biến R được cho bởi các phương trình (14) - (16). Kênh Truyền Có Chiều Dài Xác Định.
Hình 2 là hình ảnh tác động của sương mù lên xác suất
III. MÔ PHỎNG VÀ THẢO LUẬN cách ly nút với các giá trị của tầm nhìn V, giả sử l = 50 km.
Trong chương này, các kết quả mô phỏng và lý thuyết sẽ Lúc đầu, ta nhận thấy khi V tăng, số lượng các nút cần thiết
được vẽ để kiểm chứng lẫn nhau và cũng để so sánh hiệu năng được giảm đáng kể, trong đó khi V có giá trị lớn thì tương
của các phương pháp khảo sát. Để tiến hành mô phỏng và ứng với điều kiện khí quyển rõ ràng hơn.
khảo sát tôi sử dụng các thông số mô hình, được đưa ra trong
Bảng 4 và được giữ không đổi nếu không có chú thích thêm.
Bảng 4: Các thông số mô hình hệ thống
Tham số Giá trị
Bước sóng 780 nm
Bước sóng tiêu chuẩn 550 nm
Công suất phát 80 mW
Độ phân kì bước sóng 5 mrad
Độ nhạy đầu thu 2 µW
Khoảng cách truyền 50 km
A. Kết Quả Mô Phỏng:
Mô phỏng Monte Carlo sẽ được thực hiện bằng Matlab
để kiểm chứng các kết quả tính toán trong phần II. Trên hình
vẽ, các kết quả mô phỏng sẽ được ký hiệu bằng các hình tròn
và được chú thích bằng chữ MP. Trong mỗi mô phỏng, 105
phép thử sẽ được thực hiện và kết quả sẽ là giá trị trung bình Hình 2: Xác suất cách ly nút so với số lượng nút trong
trên tổng số phép thử đó. điều kiện thời tiết sương mù.
B. Kết Quả Lý Thuyết. Chi tiết hơn khi tăng tầm nhìn với hệ số bằng bốn (từ
Kết quả lý thuyết sẽ được vẽ bằng các công thức (5; 14, sương mù dày đặc với V = 50 m đến sương mù dày với V =
15, 16) đã được dẫn ra trong phần II và sẽ được thể hiện vẽ 200 m) thì số lượng các nút cần thiết giảm khoảng 3,5 lần để
bằng các đường thẳng liền và ký hiệu bằng chữ LT. đạt được Piso = 10-3. Với việc tầm nhìn tăng từ 200m đến
500m thì số lượng nút này tiếp tục giảm theo hệ số 2. Như
C. Giải thuật mô phỏng: vậy, sương mù có tác động rất lớn đến hiệu quả của kênh
truyền và ảnh hưởng rất đến việc giảm số lượng các nút cần
Bắt đầu
thiết, như là khi cải thiện tầm nhìn từ V = 50 m đến V = 5 km
để làm giảm số lượng các nút giảm hơn 30 lần (từ  500 còn
Nhập các thông số đầu vào: công suất phát, thu;  15).
phân kỳ tia; điều kiện thời tiết; khoảng cách Ngoài ra, sự lựa chọn của các bước sóng truyền cũng là
một vấn đề quan trọng. Trong thực tế, các bước sóng truyền
truyền, bước sóng truyền;
thường gặp có 3 bước sóng truyền bước sóng 780 nm, 950 nm
và 1550 nm. Sự lựa chọn 3 bước sóng trên là vì các thành
phần quang học về phương diện thương mại đã được xác định
Tính toán các tham số suy hao trên kênh truyền vô
và được xây dựng để hoạt động ở những bước sóng nhất định
tuyến trong các điều kiện thời tiết khác nhau.
theo thông số kỹ thuật được sử dụng trong truyền thông cáp
quang. Nói chung, các bước sóng dài hơn nhiều khả năng bị
ảnh hưởng của tán xạ nhiều hơn [17].
Tính toán khoảng cách tối thiểu trên kênh truyền
Hình 3 thể hiện sự ảnh hưởng điều kiện thời tiết sương
vô tuyến trong các điều kiện thời tiết khác nhau.
mù (tầm nhìn V =2km và V =200m) cũng như khả năng cách
ly nút cho các bước sóng đặc trưng (λ) với khoảng cách
truyền l = 50. Ở đây, ta nhận thấy rằng số lượng các nút cần
Mối liên hệ khoảng cách tối thiểu với xác suất thiết để đạt được Piso = 10-3 tăng theo hệ số hai cho tầm nhìn
cách ly nút, số lượng nút, khoảng cách truyền
N
V = 200m và V =2 km với bước sóng hoạt động giảm từ
 R 1550 nm đến 780 nm, do đó, khẳng định rằng bước sóng
Piso 1   truyền 1550 nm sẽ bị ảnh hưởng của điều kiện thời tiết sương
 l 
mù nhiều hơn hai bước sóng còn lại.
Tác động điều kiện thời tiết mưa đến khả năng cách ly và
số lượng nút được mô tả trong Hình 4. Để đảm bảo xác xuất
cách ly nút 103 , ta nhận thấy với cư ly truyền là 50 km, sự gia
Tính toán xác suất cách ly của nút. tăng cường độ mưa từ mưa ít R =2.5 mm/h (  35 nút) đến
Vẽ mối liên hệ xác xuất cách ly với số lượng nút. mưa lớn R =5 mm/h (  80 nút) tăng đáng kể số lượng các nút
Rút ra mối quan hệ giữa xác suất cách ly với số được yêu cầu theo hệ số 2. Khi các điều kiện mưa tồi tệ hơn
lượng nút, khoảng cách truyền. R = 12.5 mm/h (  120 nút), hệ số này làm tăng thêm đến 3.
Một lượng mưa cực lớn R >90 mm/h đòi hỏi triển khai nút (
 250 nút) mật độ cao.
406
406
ràng, trong điều kiện thời tiết tuyết ướt sẽ tăng sự tác động hấp
thu tín hiệu quang so với điều kiện tuyết khô. Quan sát này ta
cũng có thể được rút ra bằng cách so sánh hai đường cong cho
một tỷ lệ tuyết rơi cụ thể. Chính xác hơn, khi tại S = 2 mm/h,
thì số lượng các nút tăng gấp 2 với điều kiện tuyết ướt để đạt
Piso =10-3, trong khi với S = 5 mm/h tỷ lệ này tăng gấp ba lần.
E. Tình Huống 2: Tìm Khoảng Cách Kênh Truyền Với Số
Lượng Nút Chuyển Tiếp Xác Định.
Trong tình huống thứ hai này, ta xem xét một số máy thu
phát cố định N và tìm kiếm chiều dài mạng yêu cầu l để đạt
được Piso trong trường hợp 103 . Tình huống này có thể cung
cấp thông tin cho các nhà khai thác mạng làm thế nào để từng
bước triển khai mạng lưới của họ trong một khu vực địa lý có
tính đến điều kiện khí tượng hàng năm. Trong trường hợp
sương mù dày đặc trong một thời gian dài, việc triển khai một
mạng lưới FSO là không có lợi vì chỉ bao phủ được có một vài
Hình 3: Xác suất cách ly nút với số lượng nút trong thời tiết km. Nhưng trong điều kiện sương mù và mưa trung bình là
sương mù tầm nhìn 2km và 200m với 3 bước sóng
chấp nhận được và một khoảng thời gian phục vụ đáng kể có
(750,950,1550).
thể được bao phủ thậm chí với 10 máy thu phát. Ví dụ, với
Vì vậy cường độ mưa rất quan trọng để thu thập các dữ
liệu tỷ lệ lượng mưa trong khoảng thời gian khác nhau trong Piso  103 , 10 nút chuyển tiếp và V  500m hoặc
năm để đạt được một sự cân bằng giữa các mạng có sẵn và số R  12.5 mm h , khoảng cách truyền có thể bao phủ 8 km. Như
lượng các nút cần thiết để đạt được giá trị Piso thấp. đã nhấn mạnh trước đây, tuyết ướt là một yếu tố làm suy giảm
chủ yếu, ví dụ khoảng cách truyền giảm đi một nửa tại tốc độ
tuyết rơi ướt 2 mm/h so với tốc độ tuyết khô.
Trong điều kiên để đạt được xác xuất cách ly nút 10-3 và
10 nút chuyển tiếp thì trong điều kiện khí hậu khắc nghiệt nhất
(Bảng 5) ta có thể truyền được gần 1.5km, ngược lại với điều
kiện thời tiết thuận lợi tầm nhìn lớn hơn 5km thì cự ly truyền
được mở rộng rất nhiều (40km).
Bảng 5: Khoảng cách truyền với xác suất cách ly nút Piso  103
Số lượng
Điều kiện Hệ số trạm thu phát
thời tiết thời tiết
N=10 N=20 N=50
V=0.05 1.83 3.28 7.67
V=0.2 5.62 10.1 23.56
Sương mù
Hình 4: Xác suất cách ly nút so với số lượng nút trong
(hệ số V=0.5 11.4 20.4 47.72
điều kiện thời tiết mưa.
thời tiết là
tầm hình V=1 18.9 34 79.43
Km) V=2 30.7 55.1 128.9
V=5 55.6 99.8 233.2
Mưa (hệ R=2.5 26.1 46.1 109.6
số thời
tiết là R=12.5 10.8 19.4 45.38
lượng R=25 7.37 13.2 30.91
mưa
mm/h) R=90 3.39 6.9 14.24
Su=1 23.2 41.7 97.44
Tuyết ướt
Su=2 11.9 21.4 49.92
(mm/h)
Su=5 3.25 5.82 13.61
Sk=1 32.3 57.9 135.4
Hình 5: Xác suất cách ly nút so với số lượng các nút và điều
Tuyết khô
kiện thời tiết tuyết khô (đường nét đứt) và tuyết ướt (đường Sk=2 20.9 37.5 87.66
(mm/h)
liên tục).
Sk=5 11 19.7 46.03
Cuối cùng, Hình 5 mô tả tác động của tuyết với các giá
trị khác nhau của tốc độ tuyết rơi, giả sử với l = 50 km. Rõ
407
407
IV. KẾT LUẬN

Trong bài báo này, tôi tập trung vào nghiên cứu xác suất
cách ly của nút trong mạng FSO nối tiếp đặt trong mô hình kết
nối nhị thức điểm một chiều BPP. Tôi sử dụng mô hình suy
hao trên đường truyền và xét đến các hiện tượng thời tiết quan
trọng như: sương mù, mưa, tuyết. Các tình huống đưa ra để
trình bày nhằm cho thấy rõ số lượng các nút, chiều dài của
đường truyền và các điều kiện thời tiết khác nhau để đạt được
Piso ≈0. Tức là trong trường hợp thời tiết xấu nhất (tầm nhìn
50m) thì để đảm bảo kết nối Piso=10-3 thì các nhà mạng cần
10 cho khoảng cách truyền 1.35 km. (Bảng 5). Ta có thể phát
triển tiếp các vấn đề trên theo các hướng khác như là: sử dụng
mô hình suy hao khác, xem xét các định dạng điều chế khác,
kết hợp tính toán với các tham số pointing error,…Đây là
những hướng phát triển rất quan trọng và cần thiết vì truyền
thông quang vô tuyến ngày này đang ngày càng được quan
tâm hơn.
[1] S. Arnon, J. Barry, G. Karagiannidis, R. Schober, and M. Uysal, Eds
(2012), Advanced Optical Wireless Communication Systems,
Cambridge University.
[2] S. Bloom, E. Korevaar, J. Schuster, and H. Willebrand (June 2003),
“Under-standing the performance of free-space optics” Journal of
Optical Networking, Vol. 2, Issue 6, pp. 178-200.
[3] G. K. Karagiannidis, T. A. Tsiftsis, and H. G. Sandalidis (Aug 2006),
“Outage probability of relayed free space optical communication
systems,” Electron Letters, vol. 42, no. 17, pp. 994–995.
[4] B. Bollobas (2001), Random Graphs, 2nd edition, Cambridge University.
[5] C. Bettstetter, J. Klinglmayr, and S. Lettner (May 2010), “On the degree
distribution of k-connected random networks” in IEEE Proc. of ICC, pp.
1–6.
[6] G. Mao and B. Anderson (Apr 2011), “On the asymptotic connectivity of
random networks under the random connection model” in IEEE Proc.
of INFOCOM, pp. 631–639.
[7] Al Naboulsi, M., Sizun H, de Fornel F, “Propagation of optical and
infrared waves in the atmosphere” in Université de Bourgogne. 9
Avenue Alain Savary, France.
[8] D. Stoyan, W. S. Kendall, and J. Mecke (2008), Stochastic Geometry and
Its Applications, 2nd edition Wiley.
[9] S. Srinivasa and M. Haenggi (Fed 2010), “Distance distributions in finite
uniformly random networks: theory and applications,” in IEEE
Transaction, Vehicular Technology, vol. 59, no. 2, pp. 940–949.
[10] S. S. Muhammad, P. Kohldorfer, and E. Leitgeb (July 2005), “Channel
mod-eling for terrestrial free space optical links,” in IEEE Proceeding
of International Conference, Vol. 1, pp. 407–410.
[11] T. Kamalakis, I. Neokosmidis, A. Tsipouras, S. Pantazis, and I.
Andrikopoulos (Sept 2007), “Hybrid free space optical/millimeter wave
outdoor links for broadband wireless access networks,” in IEEE
Proceeding of PIMRC, pp. 1–5.
[12] F. Nadeem, V. Kvicera, M. S. Awan, E. Leitgeb, S. Muhammad, and G.
Kandus (Dec 2009), “Weather effects on hybrid FSO/RF
communication link” IEEE Journal on Select Areas Communication,
vol. 27, no. 9, pp. 1687–1697.
[13 P. W. Kruse, L. D. McGlauchlin, and R. B. McQuistan (1962), Elements
of Infrared Technology: Generation, Transmission and Detection,
Wiley.
[14] I. Kim, B. McArthur, and E. Korevaar (July 2001), “Comparison of laser
beam propagation at 785 and 1550 nm in fog and haze for optical
wireless communications” Proc. SPIE, Optical Wireless
Communication III, vol. 4214, pp. 26–37.
[15] ITU recommendation ITU-R P.1814, “Prediction methods required for
the design fo terrestrial free space optical link”.
[16] M. S. Awan, P. Brandl, E. Leitgeb, F. Nadeem, T. Plank, and C. Capsoni
(June 2009), “Results of an optical wireless ground link experiment in
continental fog and dry snow conditions” in Proc. Of ConTEL, pp. 45–
49.
[17] F. Nadeem, E. Leitgeb, M. S. Awan, and G. Kandus, (Sept 2009 ),
“Optical wavelengths comparison for different weather conditions,” in
Proc. of IWSSC, pp. 279–283.
408
408
Kỹ Thuật Điều Chế QPSK Cho Hệ Thống

Thông Tin Quang Vô Tuyến DWDM
Lê Quốc Cường, Sở Thông tin và Truyền thông TPHCM, email: cuonglequoc@gmail.com
Lê Duy Hưng, Học viện Công nghệ Bưu Chính Viễn thông TPHCM, email: hungle10988@gmail.com
Tóm tắt – Truyền thông quang vô tuyến FSO là công nghiên cứu, nó cung cấp chất lượng dịch vụ tương đối cao
nghệ truyền dẫn tín hiệu quang qua môi trường vô tuyến cũng như các ứng dụng truyền dẫn cao. Nhưng khi ghép kênh
(không gian tự do). Truyền thông quang vô tuyến đang FSO sử dụng hệ thống coherent DWDM kết hợp với kỹ thuật
được xem như một giải pháp hứa hẹn thay thế cho các kết điều chế QPSK với tốc độ bit cao lên đến 1.28 Tbps thì vấn đề
nối vô tuyến băng rộng nhờ các ưu điểm mà nó có được này mới được đưa ra và nghiên cứu lần đầu tiên.
bao gồm: Triển khai nhanh, trọng lượng thiết bị nhẹ,
truyền thông dung lượng cao, chi phí thấp, không yêu cầu II. HỆ THỐNG KÊNH TRUYỀN QUANG VÔ
cấp phép tần số. Trong truyền dẫn quang vô tuyến việc sử TUYẾN FSO
dụng các kỹ thuật điều chế đã được đưa ra nhằm tăng hiệu A. Mô hình hệ thống quang vô tuyến FSO
suất kênh truyền, truyền dẫn dữ liệu tốc độ cao. FSO sử
dụng kỹ thuật điều chế trực tiếp IM/DD cho hiệu suất
kênh truyền không cao, bị ảnh hưởng nhiễu loạn do kênh
truyền fading…Khi sử dụng kỹ thuật điều chế coherent thì
có tính linh hoạt hơn có thể sử dụng với bất kỳ loại điều
chế nào như biên độ, tần số hoặc pha. Giải pháp đưa ra ở
đây là ứng dụng công nghệ ghép kênh theo bước sóng
DWDM kết hợp với kỹ thuật điều chế QPSK nhằm để tăng
hiệu suất kênh truyền, với kỹ thuật ghép kênh này cho
phép nhiều bước sóng cùng truyền được qua hệ thống
quang vô tuyến do đó có thể tăng dung lượng kênh truyền,
đồng thời giải pháp này cũng đáp ứng ứng dụng cho việc Hình 1: Mô hình kênh truyền quang vô tuyến FSO
truyền dẫn dữ liệu ở tốc độ cao.
Tín hiệu quang tại đầu vào của bộ tách sóng được xác
Từ khóa – Quang vô tuyến (FSO), kỹ thuật điều chế định:
IM-DD, QPSK, ghép kênh phân chia theo bước sóng mật 𝑦𝑦 𝑦 𝑎𝑎𝑎𝑎(𝑡𝑡𝑡𝑡𝑡 (1)
độ cao DWDM. Trong đó a, I, 𝑋𝑋𝑋𝑋𝑋𝑋, lần lượt là tổng suy hao đường truyền,
cường độ tín hiệu phát, quá trình ngẫu nhiên đại diện cho tín
hiệu nhấp nháy gây ra bởi nhiễu loạn không khí và y là tín
Các công nghệ FSO xuất hiện lần đầu tiên vào những hiệu quang nhận được.
năm 1960. Đến cuối những năm 1980 những sản phẩm thương
mại đã xuất hiện nhưng không thành công vì những rào cản Suy hao kênh truyền gây ra bởi hai nguyên nhân chính là
công nghệ, cự ly ngắn, dung lượng thấp. Hiệu suất của hệ do hấp thụ và tán xạ. Tổng suy hao kênh truyền được xác định
thống FSO bị ảnh hưởng bởi nhiều yếu tố như môi trường bởi:
truyền sóng, biến động ngẫu nhiên của không khí...trong quá 𝐴𝐴
trình thiết kế hệ thống FSO việc lựa chọn các kỹ thuật điều 𝑎𝑎 𝑎 𝜋𝜋(𝜑𝜑𝜑𝜑/2)2 𝑒𝑒𝑒𝑒𝑒𝑒(−𝛽𝛽𝑣𝑣 𝐿𝐿) (2)
chế thích hợp đóng một vai trò hết sức quan trọng và đòi hỏi
phải có khả năng thích nghi tốt cho hiệu suất tối ưu, nhưng Với A là khẩu độ thu, L khoảng cách truyền, 𝜑𝜑 góc phân kỳ
khả năng thích nghi này kỹ thuật khá phức tạp để thực hiện và trong radian và 𝛽𝛽𝑣𝑣 là hệ số dập tắt khí quyển.
trên thực tế là không thích hợp[4]. Khi cường độ quang bị ảnh B. Mô hình kênh truyền Log-normal
hưởng bởi các hiệu ứng như nhấp nháy, biến động do môi
trường gây ra, khi sử dụng kỹ thuật điều chế mang thông tin Khi tín hiệu quang qua kênh truyền không gian tự do nó
vào pha hoặc tần số của tín hiệu thì tốt hơn nhiều. Điều chế bị ảnh hưởng bởi các biến động ngẫu nhiên, hiệu ứng nhấp
khóa dịch pha (PSK) có khả năng thích nghi tốt, do đó nó nháy, nhiễu loạn không khí, ngay cả khi truyền ở khoảng cách
cung cấp hiệu suất cao hơn so với kỹ thuật điều chế IM/DD ngắn. Những nguyên nhân đó làm tăng tỉ lệ BER và làm giảm
khi có sự biến động của môi trường[4]. hiệu suất của hệ thống. Khi biến động là yếu thì ảnh hưởng
của nhiễu loạn 𝑋𝑋𝑋𝑋𝑋𝑋 là một quá trình ngẫu nhiên có hàm phân
Khi thiết kế hệ thống DWDM 40 Gbps 32 kênh sử dụng bố là log-normal. Giả sử rằng trung bình của quá trình ngẫu
kỹ thuật điều chế IM/DD cho chất lượng dịch vụ chưa cao và nhiên 𝑋𝑋 là bình thường thì hàm phân bố mật độ xác suất (pdf)
bị ảnh hưởng bởi sự biến động ngẫu nhiên trong môi cho bởi Majumdar được tính như sau[5].
2
trường[1]. Truyền dẫn quang vô tuyến FSO đơn kênh sử dụng 1 (𝑙𝑙𝑙𝑙𝑙𝑙𝑙𝑙𝑙𝑠𝑠2 ⁄2)
𝑓𝑓𝑋𝑋 (𝑥𝑥𝑥𝑥 𝑒𝑒𝑒𝑒𝑒𝑒 [− ] (3)
hệ thống coherent DWDM kết hợp với kỹ thuật điều chế √2𝜋𝜋𝜎𝜎𝑠𝑠 𝑥𝑥 2𝜎𝜎𝑠𝑠2
QPSK được đề suất với tốc độ bit từ 1Gbps đến 100 Gbps là Với 𝜎𝜎𝑠𝑠2 là phương sai cường độ log mà phụ thuộc vào đặc
mở rộng của kỹ thuật điều chế IM/DD vấn đề này đã được tính kênh truyền và được cho như sau:
ISBN: 978-604-67-0635-9 409

409
HộiHội
ThảoThảo Quốc
Quốc Gia
Gia 2015về
2015 vềĐiện
Điện Tử,
Tử,Truyền
Truyền Thông
Thông và
vàCông
CôngNghệ
Thông (ECIT 2015)
(ECIT 2015)
0.49𝜎𝜎𝑅𝑅2 0.51𝜎𝜎𝑅𝑅2 dụng là chất bán dẫn laser băng thông rộng có công suất lớn,
𝜎𝜎𝑠𝑠2 = 𝑒𝑒𝑒𝑒𝑒𝑒 𝑒 12/5 7/6
+ 12/5 5/6
] − 1 (4) máy thu được thiết kế sử dụng lượng thông tin truyền kết hợp
(1+0.18𝑑𝑑 2 +0.56𝜎𝜎𝑅𝑅 ) 2
(1+0.9𝑑𝑑 +0.62𝜎𝜎𝑅𝑅 )
đầu vào chẳng hạn như bộ tiền khuếch đại quang (PIN) hoặc
Với 𝑑𝑑 𝑑 √𝑘𝑘𝑘𝑘2 /4𝐿𝐿 , 𝑘𝑘 𝑘 𝑘𝑘𝑘⁄𝑘𝑘 là số sóng quang, L khoảng diode quang điện thác (APD) có kích thước khác nhau[16].
cách truyền và D là đường kính khẩu độ thu. Tham số 𝜎𝜎𝑅𝑅2 là
phương sai Rytov, giả sử sự lan truyền sóng được cho bởi:
𝜎𝜎𝑅𝑅2 = 1.23𝐶𝐶𝑛𝑛2 𝑘𝑘 7/6 𝐿𝐿11/6 (5)
Với 𝐶𝐶𝑛𝑛2
là chỉ số độ cao phụ thuộc của chiết suất và có giá
trị trong khoảng 10-17 đến 10-12 tùy thuộc độ mạnh, yếu trong
kênh truyền nhiễu loạn không khí. Hình 2: Khoảng cách truyền của IM/DD trong FSO
C. Mô hình kênh truyền Gamma-gamma Tại đầu ra của bộ tách sóng APD có tín hiệu điện là khác
nhau ở trạng thái "on" hoặc "off" và được cho bởi:
Khi kênh truyền nhiễu động mạnh, phân bố log-normal 𝑔𝑔𝑔𝑔𝑔𝑔2𝑃𝑃𝑡𝑡 + 𝑛𝑛𝑛𝑛𝑛𝑛𝑛𝑛𝑛𝑜𝑜𝑜𝑜"
tạo ra sự khác biệt lớn với các kết quả ở thực nghiệm. Lý do là 𝑟𝑟𝑒𝑒 = { (13)
𝑛𝑛𝑛𝑛𝑛𝑛𝑛𝑛𝑛𝑛𝑛𝑛𝑛𝑛𝑛𝑛𝑛𝑛𝑛𝑛
hàm pdf log-normal đánh giá thấp sự ảnh hưởng ở những đoạn Với 𝑔𝑔 độ lợi trung bình, 𝑃𝑃𝑡𝑡 công suất phát quang trung bình,
cuối so với kết quả thực nghiệm. Trong trường hợp này 𝑋𝑋𝑋𝑋𝑋𝑋 R độ nhạy bộ tách sóng APD. Ngược lại với nhiễu nhiệt, nhiễu
có thể được mô hình hóa như một quá trình dừng với phân bố bắn phụ thuộc vào thành phần của bên trong bộ tách sóng
gamma-gamma và được tính bởi[5]: APD nó khác nhau ở trạng thái "on" và "off". Nhiễu bắn có
2(𝛼𝛼𝛼𝛼)(𝛼𝛼𝛼𝛼𝛼)⁄2 (𝛼𝛼𝛼𝛼𝛼)⁄ thể được mô hình hóa ngẫu nhiên như nhiễu Gaussian
𝑓𝑓𝑋𝑋 (𝑥𝑥) = 𝑥𝑥 2−1 𝐾𝐾𝛼𝛼𝛼𝛼𝛼 (2√𝛼𝛼𝛼𝛼𝛼𝛼) (6) (AWGN) với nghĩa 0 và phương sai 𝜎𝜎𝑆𝑆𝑆 2
Γ(𝛼𝛼𝛼𝛼𝛼𝛼𝛼𝛼
2
2 2𝑞𝑞𝑞𝑞 𝐹𝐹𝐴𝐴 𝑅𝑅𝑅𝑅𝑅𝑅𝑅𝑅𝑅𝑡𝑡 ∆𝑓𝑓𝑓𝑓𝑓𝑓𝑓𝑓𝑓𝑜𝑜𝑜𝑜"
Với Γ(. ) là hàm gamma, 𝐾𝐾𝛼𝛼𝛼𝛼𝛼 (. ) là hàm sửa đổi Bessel và 𝜎𝜎𝑆𝑆𝑆 ={ (14)
0, "𝑜𝑜𝑜𝑜𝑜𝑜𝑜
có thứ tự 𝛼𝛼 𝛼 𝛼𝛼. 𝛼𝛼 và 𝛽𝛽 là tham số pdf mô tả những biến động Trong đó q là điện tích electron, 𝐹𝐹𝐴𝐴 biểu thị hệ số nhiễu vượt
diễn ra của sóng. Trong trường hợp thang đo nội tại là 0 quá của APD được cho bởi:
(𝑙𝑙0 = 0) được tính: 𝐹𝐹𝐴𝐴 = 𝑘𝑘𝐴𝐴 𝑔𝑔 𝑔 (1 − 𝑘𝑘𝐴𝐴 )(2 − 1⁄𝑔𝑔𝑔 (15)
−1 Với 𝑘𝑘𝐴𝐴 là hệ số ion hóa. Phương sai của tổng số lượng nhiễu
2
0.49𝜎𝜎𝑅𝑅 APD được cho bởi[16]:
𝛼𝛼 𝛼 𝛼𝑒𝑒𝑒𝑒𝑒𝑒 [ 12/5 7/6
] − 1} (7)
(1+1.11𝜎𝜎𝑅𝑅 )
𝑇𝑇
4𝑘𝑘𝐵𝐵 𝐹𝐹 ∆𝑓𝑓 𝑓𝑓𝑓𝑓𝑓𝑓2 𝐹𝐹𝐴𝐴 𝑅𝑅𝑅𝑅𝑅𝑅𝑅𝑅𝑅𝑡𝑡 ∆𝑓𝑓𝑓𝑓𝑓𝑓𝑓𝑓𝑓𝑜𝑜𝑜𝑜"
−1 𝑅𝑅𝐿𝐿 𝑛𝑛
2
0.51𝜎𝜎𝑅𝑅
𝜎𝜎𝑛𝑛2 ={ 𝑇𝑇 (16)
𝛽𝛽𝛽𝛽𝑒𝑒𝑒𝑒𝑒𝑒 [ ] − 1} (8) 4𝑘𝑘𝐵𝐵 𝐹𝐹𝑛𝑛 ∆𝑓𝑓𝑓𝑓𝑓𝑓𝑓𝑓𝑓𝑓𝑓𝑓𝑓
12/5 5/6 𝑅𝑅𝐿𝐿
(1+0.69𝜎𝜎𝑅𝑅 ) 2 2
Với: 𝜎𝜎𝑛𝑛2 = 𝜎𝜎𝑆𝑆𝑆 + 𝜎𝜎𝑇𝑇𝑇 (17)
Trong trường hợp thang đo nội tại khác 0 (𝑙𝑙0 ≠ 0). tham số
𝛼𝛼 và 𝛽𝛽 được tính: Trong thực tế hệ thống FSO sử dụng IM/DD với OOK vì nó
có thiết kế đơn giản và dễ thực hiện. Tuy nhiên, cần phải thiết
2 ]
𝛼𝛼 𝛼 {𝑒𝑒𝑒𝑒𝑒𝑒[𝜎𝜎𝑙𝑙𝑙𝑙𝑙𝑙 − 1}−1 (9) lập một ngưỡng để phát hiện tỷ lệ lỗi bit của tín hiệu. BER của
−1 hệ thống FSO sử dụng IM/DD được tính như sau [11][16]:
2
0.51𝜎𝜎𝑃𝑃 𝐵𝐵𝐵𝐵𝐵𝐵𝐵𝐵𝐵(1)𝑃𝑃(0|1) + 𝑃𝑃(0)𝑃𝑃(1|0) (18)
𝛽𝛽𝛽𝛽𝑒𝑒𝑒𝑒𝑒𝑒 [ 12/5 5/6
] − 1} (10)
(1+0.69𝜎𝜎𝑃𝑃 ) Trong đó 𝑃𝑃(1), 𝑃𝑃(0) đại diện cho xác suất truyền "on" và
2
"off" các bit tương ứng. Xác suất phát hiện bit "off" khi bit
Với 𝜎𝜎𝑙𝑙𝑙𝑙𝑙𝑙 được cho bởi: "on" được truyền là 𝑃𝑃(0|1) và 𝑃𝑃(1|0) là ngược lại. Với 𝑃𝑃(1)
2 𝜂𝜂𝑥𝑥 𝑄𝑄 7/6 𝜂𝜂𝑥𝑥
1
2 𝜂𝜂𝑥𝑥
7
12
= 𝑃𝑃(0) = 0.5 khi nhiễu phương sai là khác nhau ở trạng thái
𝜎𝜎𝑙𝑙𝑙𝑙𝑙𝑙 = 0.16𝜎𝜎𝑅𝑅2 ( ) × [1 + 1.75 ( ) − 0.25 ( ) ] (11) "on" và "off". Xác suất 𝑃𝑃(0|1) và 𝑃𝑃(1|0) là không bằng nhau
𝜂𝜂𝑥𝑥 +𝑄𝑄 𝜂𝜂𝑥𝑥 +𝑄𝑄 𝜂𝜂𝑥𝑥 +𝑄𝑄
và chúng phụ thuộc vào ngưỡng quyết định. Khi điều kiện
Các thông số cần thiết còn lại có thể tìm thấy như: 𝑃𝑃(0|1) = 𝑃𝑃(1|0) thì BER được tính như sau:
1 𝑄𝑄
𝜂𝜂𝑥𝑥 =
2.61
; 𝑄𝑄 𝑄
10.89𝐿𝐿 𝐵𝐵𝐵𝐵𝐵𝐵𝐵 𝑒𝑒𝑒𝑒𝑒𝑒𝑒𝑒 𝑒 ) (19)
2 𝑄𝑄 1/6
1+0.45𝜎𝜎𝑅𝑅 𝑘𝑘𝑘𝑘0 2 2 √2
Tham số Q được cho bởi:
11/12 𝑔𝑔𝑔𝑔𝑔𝑔𝑔𝑔𝑔𝑡𝑡 𝐼𝐼
𝜎𝜎𝑃𝑃2 = 3.86𝜎𝜎𝑅𝑅2 {(1 + 1⁄𝑄𝑄2 )
11
[𝑠𝑠𝑠𝑠𝑠𝑠 𝑠 6 𝑡𝑡𝑡𝑡𝑡𝑡−1 𝑄𝑄𝑄𝑄
1.51 4
𝑠𝑠𝑠𝑠𝑠𝑠 𝑠 𝑡𝑡𝑡𝑡𝑡𝑡−1 𝑄𝑄𝑄𝑄 𝑄𝑄 𝑄 (20)
1
3 𝜎𝜎𝑛𝑛𝑛𝑜𝑜𝑜𝑜+𝜎𝜎𝑛𝑛𝑛𝑛𝑛𝑛𝑛𝑛𝑛
(1+𝑄𝑄2 )4
0.27 5 Giá trị BER trong kênh truyền được tính[13][16]:
(1+𝑄𝑄2 )7/24
𝑠𝑠𝑠𝑠𝑠𝑠 𝑠 𝑡𝑡𝑡𝑡𝑡𝑡−1 𝑄𝑄𝑄] − 3.5𝑄𝑄5/6 } (12) 1 ∞ 𝑔𝑔𝑔𝑔𝑎𝑎𝑎𝑎𝑎𝑡𝑡 𝐼𝐼
4
𝐵𝐵𝐵𝐵𝐵𝐵𝐵 ∫0 𝑒𝑒𝑒𝑒𝑒𝑒𝑒𝑒 𝑒 ) 𝑓𝑓𝑋𝑋 (𝑥𝑥)𝑑𝑑𝑑𝑑 (21)
2 √2(𝜎𝜎 𝑛𝑛𝑛𝑜𝑜𝑜𝑜 +𝜎𝜎𝑛𝑛𝑛𝑛𝑛𝑛𝑛𝑛𝑛 )
III. KỸ THUẬT ĐIỀU CHẾ TRONG QUANG VÔ Trong kênh truyền gamma-gamma[5]:
TUYẾN FSO
1 ∞ 𝑔𝑔𝑔𝑔𝑔𝑔𝑔𝑔𝑔𝑡𝑡 𝐼𝐼
A. Kỹ thuật điều chế IM/DD 𝐵𝐵𝐵𝐵𝐵𝐵𝐵 ∫0 𝑒𝑒𝑒𝑒𝑒𝑒𝑒𝑒 𝑒 )×
2
√2(𝜎𝜎 𝑛𝑛 +𝜎𝜎 𝑛𝑛 )
Trong hệ thống thông tin quang vô tuyến FSO khoảng 𝑜𝑜𝑜𝑜 𝑜𝑜𝑜𝑜𝑜𝑜
cách truyền giữa máy phát và máy thu được kết nối với nhau
dựa trên tầm nhìn thẳng (LOS). Các máy phát thường được sử
410
410
2(𝛼𝛼𝛼𝛼)(𝛼𝛼𝛼𝛼𝛼)⁄2 (𝛼𝛼𝛼𝛼𝛼)⁄ −1 𝜆𝜆 : Bước sóng phát của tín hiệu.

×( 𝑥𝑥 2 𝐾𝐾𝛼𝛼𝛼𝛼𝛼 (2√𝛼𝛼𝛼𝛼𝛼𝛼)) 𝑑𝑑𝑑𝑑 𝑧𝑧: Khoảng cách kênh truyền giữa máy phát và máy thu.
Γ(𝛼𝛼)Γ(𝛽𝛽)
𝐺𝐺𝑇𝑇 , 𝐺𝐺𝑅𝑅 : Độ lợi máy phát và máy thu.
𝜋𝜋𝜋𝜋 𝜋𝜋𝜋𝜋
𝐺𝐺𝑇𝑇 = ( 𝑇𝑇)2 , 𝐺𝐺𝑅𝑅 =( 𝑅𝑅 )2 (25)
𝜆𝜆 𝜆𝜆
∞
= ∫ 𝑒𝑒𝑒𝑒𝑒𝑒𝑒𝑒
𝑔𝑔𝑔𝑔𝑔𝑔𝑔𝑔𝑡𝑡 𝐼𝐼 𝐷𝐷𝑇𝑇 , 𝐷𝐷𝑅𝑅 : Khẩu độ của thấu kính tại máy phát và máy
0 𝑇𝑇 𝑇𝑇
√2 (√4𝑘𝑘𝐵𝐵 𝑅𝑅 𝐹𝐹𝑛𝑛 ∆𝑓𝑓 𝑓 𝑓𝑓𝑓𝑓𝑓2 𝐹𝐹𝐴𝐴 𝑅𝑅𝑅𝑅𝑅𝑅𝑅𝑅𝑅𝑡𝑡 ∆𝑓𝑓 + √4𝑘𝑘𝐵𝐵 𝑅𝑅 𝐹𝐹𝑛𝑛 ∆𝑓𝑓)
thu.
( 𝐿𝐿 𝐿𝐿 ) 𝐿𝐿 𝑇𝑇 , 𝐿𝐿𝑅𝑅 : Hệ số định hướng tại máy phát và máy thu.
2(𝛼𝛼𝛼𝛼)(𝛼𝛼𝛼𝛼𝛼)⁄2 (𝛼𝛼𝛼𝛼𝛼)
⁄2−1
𝐿𝐿 𝑇𝑇 = exp(−𝐺𝐺𝑇𝑇 (𝜃𝜃𝑇𝑇 )2 ), 𝐿𝐿𝑅𝑅 = exp(−𝐺𝐺𝑇𝑇 (𝜃𝜃𝑅𝑅 )2 ) (26)
× ( 𝑥𝑥 𝐾𝐾𝛼𝛼𝛼𝛼𝛼 (2√𝛼𝛼𝛼𝛼𝛼𝛼)) 𝑑𝑑𝑑𝑑 (22)
Γ(𝛼𝛼)Γ(𝛽𝛽) 𝜃𝜃𝑇𝑇 , 𝜃𝜃𝑅𝑅 là gốc định hướng giữa máy phát và máy thu.
Trong kênh truyền log-normal[5]:
Với BER của hệ thống sử dụng bộ tách sóng APD khi
không khí nhiễu động có thể được mô hình hóa như dưới kênh
1 ∞ 𝑔𝑔𝑔𝑔𝑔𝑔𝑔𝑔𝑔𝑡𝑡 𝐼𝐼 truyền fading chậm. BER của hệ thống có thể được tính như
𝐵𝐵𝐵𝐵𝐵𝐵𝐵 ∫0 𝑒𝑒𝑒𝑒𝑒𝑒𝑒𝑒 𝑒 )×
2
√2(𝜎𝜎 𝑛𝑛 +𝜎𝜎 𝑛𝑛 )
sau:
𝑜𝑜𝑜𝑜 𝑜𝑜𝑜𝑜𝑜𝑜
∞
2 𝐵𝐵𝐵𝐵𝐵𝐵𝐵 ∫0 𝐵𝐵𝐵𝐵𝐵𝐵𝑖𝑖𝑖𝑖𝑖𝑖𝑖𝑖 𝑓𝑓𝑋𝑋 (𝑥𝑥)𝑑𝑑𝑑𝑑 (26)
1 (𝑙𝑙𝑙𝑙𝑙𝑙𝑙𝑙𝑙𝑠𝑠2 ⁄2)
[ 𝑒𝑒𝑒𝑒𝑒𝑒 [− ]] 𝑑𝑑𝑑𝑑 Để tính BER ta phải xem xét trường hợp cụ thể.
√2𝜋𝜋𝜎𝜎𝑠𝑠 𝑥𝑥 2𝜎𝜎𝑠𝑠2
2 𝜋𝜋 𝑚𝑚𝑚𝑚𝑚𝑚𝑚𝑚𝑠𝑠 𝑎𝑎
𝐵𝐵𝐵𝐵𝐵𝐵𝑖𝑖𝑖𝑖𝑖𝑖𝑖𝑖 ≈ 𝑄𝑄 𝑄√2𝛾𝛾𝛾 𝑠𝑠𝑠𝑠𝑠𝑠 𝑥𝑥𝑥 𝑥𝑥𝑥𝑥 𝑥𝑥𝑥 (27)
𝑙𝑙𝑙𝑙𝑙𝑙2 𝑀𝑀 𝑀𝑀 2𝜎𝜎𝑛𝑛
∞ 𝑔𝑔𝑔𝑔𝑔𝑔𝑔𝑔𝑡𝑡 𝐼𝐼 Với 𝛾𝛾𝛾 là tín hiệu trên nhiễu trung bình thu được. Vì là điều
= ∫0 𝑒𝑒𝑒𝑒𝑒𝑒𝑒𝑒 𝑒 𝑇𝑇 𝑇𝑇
)× chế QPSK nên ta có số mức trạng thái là M=4.
√2(√4𝑘𝑘𝐵𝐵 𝑅𝑅 𝐹𝐹𝑛𝑛 ∆𝑓𝑓𝑓𝑓𝑓𝑓𝑓𝑓2 𝐹𝐹𝐴𝐴 𝑅𝑅𝑅𝑅𝑅𝑅𝑅𝑅𝑅𝑡𝑡 ∆𝑓𝑓+√4𝑘𝑘𝐵𝐵 𝑅𝑅 𝐹𝐹𝑛𝑛∆𝑓𝑓)
𝐿𝐿 𝐿𝐿 Q(.) là Gaussian hàm Q có dạng[5]:
1 ∞ −𝑡𝑡 2
(𝑙𝑙𝑙𝑙𝑙𝑙𝑙𝑙𝑙𝑠𝑠2 ⁄2)
2 𝑄𝑄(𝑦𝑦) = ∫ 𝑒𝑒𝑒𝑒𝑒𝑒 ( 2 ) 𝑑𝑑𝑑𝑑 (28)
1 √2𝜋𝜋 𝑦𝑦
[ 𝑒𝑒𝑒𝑒𝑒𝑒 [− ]] 𝑑𝑑𝑑𝑑 (23) Giá trị BER trong kênh truyền được tính[5][13]:
∞ 𝑚𝑚𝑚𝑚𝑚𝑚𝑚𝑚𝑠𝑠 𝑎𝑎
𝐵𝐵𝐵𝐵𝐵𝐵𝐵 ∫0 𝑄𝑄 𝑄 𝑥𝑥𝑥 𝑥𝑥𝑋𝑋 (𝑥𝑥)𝑑𝑑𝑑𝑑 (29)
B. Kỹ thuật điều chế QPSK 2𝜎𝜎𝑛𝑛
Trong môi trường quang vô tuyến FSO kỹ thuật điều Trong kênh truyền gamma-gamma[5]:
∞ 𝑚𝑚𝑚𝑚𝑚𝑚𝑚𝑚𝑠𝑠 𝑎𝑎
chế QPSK được thể hiện trong hình 3[10]: 𝐵𝐵𝐵𝐵𝐵𝐵𝐵 ∫0 𝑄𝑄 𝑄 𝑥𝑥𝑥 𝑥
2𝜎𝜎𝑛𝑛
2(𝛼𝛼𝛼𝛼)(𝛼𝛼𝛼𝛼𝛼)⁄2 (𝛼𝛼𝛼𝛼𝛼)⁄
×[ 𝑥𝑥 2−1 𝐾𝐾𝛼𝛼𝛼𝛼𝛼 (2√𝛼𝛼𝛼𝛼𝛼𝛼)]dx
∞
𝑚𝑚𝑚𝑚𝑚𝑚𝑚𝑚𝑠𝑠 𝑎𝑎
= ∫ 𝑄𝑄 𝑥𝑥
0 𝑇𝑇
2√2𝑞𝑞𝑞𝑞2 𝐹𝐹𝐴𝐴 𝑅𝑅𝑅𝑅𝑃𝑃𝑠𝑠 𝑎𝑎𝑎𝑎∆𝑓𝑓 𝑓 𝑓𝑓𝑓𝐵𝐵 𝐹𝐹𝑛𝑛 ∆𝑓𝑓
( 𝑅𝑅𝐿𝐿 )
2(𝛼𝛼𝛼𝛼)(𝛼𝛼𝛼𝛼𝛼)⁄2 (𝛼𝛼𝛼𝛼𝛼)⁄ −1
× [ 𝑥𝑥 2 𝐾𝐾𝛼𝛼𝛼𝛼𝛼 (2√𝛼𝛼𝛼𝛼𝛼𝛼)] 𝑑𝑑𝑑𝑑 (30)
Trong kênh truyền log-normal[5]:

∞ (𝑙𝑙𝑙𝑙𝑙𝑙𝑙𝑙𝑙𝑠𝑠2 ⁄2)2
𝑚𝑚𝑚𝑚𝑚𝑚𝑃𝑃𝑠𝑠 𝑎𝑎 1
𝐵𝐵𝐵𝐵𝐵𝐵𝐵𝐵𝐵𝐵𝐵 𝑥𝑥𝑥𝑥𝑥 𝑒𝑒𝑒𝑒𝑒𝑒 𝑒𝑒 ]] 𝑑𝑑𝑑𝑑
0 2𝜎𝜎𝑛𝑛 √2𝜋𝜋𝜎𝜎𝑠𝑠 𝑥𝑥 2𝜎𝜎𝑠𝑠2
Hình 3: Sơ đồ điều chế QPSK trong FSO ∞ 𝑚𝑚𝑚𝑚𝑚𝑚𝑚𝑚𝑠𝑠 𝑎𝑎

Mô hình trên là tổng quan về kỹ thuật điều chế QPSK =∫0 𝑄𝑄 𝑄 𝑇𝑇
𝑥𝑥𝑥𝑥
2√2𝑞𝑞𝑞𝑞2 𝐹𝐹𝐴𝐴 𝑅𝑅𝑅𝑅𝑃𝑃𝑠𝑠 𝑎𝑎𝑎𝑎∆𝑓𝑓𝑓𝑓𝑓𝑓𝐵𝐵 𝐹𝐹 ∆𝑓𝑓
𝑅𝑅𝐿𝐿 𝑛𝑛
trong FSO. Phương pháp điều chế quang có thể được phân loại
thành hai nhóm chính đó là điều chế trực tiếp và điều chế 2
1 (𝑙𝑙𝑙𝑙𝑙𝑙𝑙𝑙𝑙𝑠𝑠2 ⁄2)
ngoài. Điều chế trực tiếp là một kỹ thuật đơn giản nó trực tiếp [ 𝑒𝑒𝑒𝑒𝑒𝑒 [− ]] 𝑑𝑑𝑑𝑑 (31)
điều chỉnh các biên độ của chùm tia laser nhưng lại bị ảnh
hưởng bởi hiệu ứng chirp làm ảnh hưởng nghiêm trọng đến
hiệu suất của hệ thống. Tuy nhiên điều này có thể được loại bỏ IV. MÔ PHỎNG VÀ THẢO LUẬN
bằng cách sử dụng kỹ thuật điều chế ngoài để điều chỉnh pha
của sóng mang quang. Do đó hệ thống có thể đáp ứng được A. Mô hình điều chế
các yêu cầu trong tương lai của các dịch vụ truyền dữ liệu tốc Mô hình điều chế QPSK trong DWDM FSO được mô tả
độ cao. như sau:
Công suất thu tại bộ tách sóng quang được cho bởi công
thức như sau[11]:
𝜆𝜆
𝑃𝑃𝑅𝑅 = 𝑃𝑃𝑇𝑇 𝜂𝜂 𝑇𝑇 𝜂𝜂𝑅𝑅 ( )2 𝐺𝐺𝑇𝑇 𝐺𝐺𝑅𝑅 𝐿𝐿 𝑇𝑇 𝐿𝐿𝑅𝑅 (24)
4𝜋𝜋𝜋𝜋
𝑃𝑃𝑅𝑅 : Là công suất của tín hiệu tại máy thu.
𝑃𝑃𝑇𝑇 : Là công suất phát của tín hiệu tại máy phát.
𝜂𝜂 𝑇𝑇 ,𝜂𝜂𝑅𝑅 : Hiệu suất lượng tử của photodiode máy phát
và máy thu.
411
411
B. Mô phỏng và đánh giá kết quả

 Sử dụng thu phát sóng trực tiếp IM/DD dùng kiểu
điều chế RZ:
Hình 4: Sơ đồ khối điều chế QPSK trong DWDM FSO

Kỹ thuật điều chế QPSK trong DWDM kênh truyền Hình 5: Kết quả mô phỏng BER RZ dùng 32 kênh sử dụng
quang vô tuyến được thiết kế gồm các khối: Bộ phát gồm có
PIN thu
32 khối điều chế QPSK với công suất phát từ 0 đến 10dBm.
Bộ tách/ghép kênh (Mux/DeMux) kênh truyền vô truyến FSO
với tần số kênh truyền là 193.1THz, băng thông kênh truyền là
40Gbps, tín hiệu thu sẽ được kết nối tới bộ giải ghép 32 kênh
và sau đó mỗi kênh tín hiệu sẽ được cho qua bộ giải điều chế
QPSK quang.
Các tham số của hệ thống quang vô tuyến DWDM FSO:
Bảng 1: Tham số của hệ thống DWDM trong FSO
Các Tham Số Giá Trị
Cấu hình FSO Tầm nhìn thẳng (LOS)
Dung lượng 32 kênh, 40Gbps
Hình 6: Kết quả mô phỏng BER RZ dùng 32 kênh sử dụng
Điều chế RZ, NRZ và QPSK
APD thu
quang coherent
Với điều chế RZ có công suất ngõ vào 10dBm thì
Tần số kênh truyền trung 193.1 THz
khoảng cách đạt được khoảng 614 km. Với giá trị hàm Q-
tâm của hệ thống DWDM. factor nhận được trên có kết hợp với thuật toán sữa lỗi
(FEC) thì giá trị nhận được 6.8 (BER<10 -12). Khi sử dụng
Công suất phát 0 dBm đến 10 dBm PIN thu và APD thu ta nhận thấy rằng ở tín hiệu nhận
Công suất dao động nội tại Giống công suất tại máy được khi sử dụng PIN thu có chất lượng tốt hơn nhưng khả
năng khuếch đại dòng điện lại thấp hơn so với APD thu.
máy thu phát. Nên khi sử dụng PIN thu cho hệ thống ta phải sử dụng
Chiều dài chuỗi 64 thêm bộ tiền khuếch đại cho dòng điện nhằm nâng cao
thêm chất lượng độ nhạy của máy thu.
Mẫu mỗi bit 256
Độ rộng dòng laser 0.1MHz  Sử dụng thu phát sóng trực tiếp IM/DD dùng kiểu
điều chế NRZ:
Dòng tối 10 nAmp
Độ nhạy của APD 1 A/W
Đường kính khẩu độ phát 150 mm
Đường kính khẩu độ thu 150 mm
Hiệu suất máy phát quang 0.8
Hiệu suất máy thu quang 0.8

Sai số định hướng phát 1.1
Sai số định hướng thu 1.1
Các suy hao thêm vào như 1dB
(suy giảm tầm nhìn, mất
Hình 7: Kết quả mô phỏng BER NRZ dùng 32 kênh sử
đồng bộ...) dụng PIN thu
412
412
Hình 11: Phổ tín hiệu thu sử dụng điều chế QPSK dùng 32
Hình 8: Kết quả mô phỏng BER NRZ dùng 32 kênh sử
dụng APD thu kênh
Với công suất ngõ vào 10dBm thì khoảng cách đạt được Hệ thống được mô phỏng từ kỹ thuật điều chế quang
khoảng 798 km. Tương tự như điều chế RZ khi sử dụng PIN coherent QPSK từ công suất nguồn phát là 10dBm. Hình 10
thu và APD thu ta nhận thấy rằng ở tín hiệu nhận được khi sử thể hiện phổ quang của điều chế QPSK nguồn phát với 32
dụng PIN thu có chất lượng tốt hơn nhưng khả năng khuếch kênh truyền từ mô hình cài đặt trên. Trong hình 11 là kết hợp
đại dòng điện lại thấp hơn so với APD thu. của nhiều tín hiệu quang thu được qua kênh truyền vô tuyến
phổ quang thu được sau khi kết hợp tại bộ thu. Mức công suất
 Sử dụng điều chế quang coherent QPSK: Với công nhận tại bộ thu bị giảm đi một khoảng là -52dBm tại khoảng
suất ngõ vào 10dBm cách 1360km.
 Hình 9 chỉ quang phổ của nguồn phát quang điều chế  Kết quả mô phỏng Q-factor và giản đồ mắt tín hiệu
QPSK trên một kênh của hệ thống với công suất phát khoảng điều chế QPSK dùng 32 kênh tại khoảng cách 1360km.
-6.8dBm ở bước sóng 1550nm ( 193.1 THz).
Hình 12: Sơ đồ mô phỏng Q-factor và giản đồ mắt tín hiệu

điều chế QPSK dùng 32 kênh tại khoảng cách 1360km
Hình 9: Phổ của tín hiệu sử dụng điều chế QPSK trên một  Từ hình 12 quan sát thấy hàm Q-factor đạt kết quả
kênh như mong đợi. Đây là giá trị cao nhất của hàm Q-factor quan
 Hình 10 chỉ phổ của tín hiệu quang 32 kênh sau khi sát được trong khoảng thời gian được mô phỏng tại phía bộ
đi qua bộ ghép kênh để truyền tín hiệu đi với công suất phát thu mà khi tín hiệu méo dạng nhận được.
khoảng -6.8dBm ở bước sóng 1550nm ( 193.1 THz).
V. KẾT LUẬN
Trong bài báo này chúng ta có thể kết luận rằng so với
kỹ thuật điều chế trực tiếp IM/DD (RZ và NRZ) thì kỹ thuật
điều chế quang coherent QPSK khoảng cách truyền đi xa hơn
khi ứng dụng trong hệ thống DWDM quang vô tuyến FSO.
Bởi vì, thông tin truyền đi của nó được chứa trong pha của
sóng mang từ kỹ thuật điều chế quang coherent QPSK tạo ra
và do đó nó có khả năng chịu những biến động từ môi trường
khí quyển tốt hơn so với kỹ thuật điều chế trực tiếp IM/DD.

[1] E.Ciaramella, Y. Arimoto, G. Contestabile, M. Presi, A. D. Errico,V.
Guarino, and M. Matsumoto, "1.28 Terabitls (32x40 Gbitls) WDM
Hình 10: Phổ tín hiệu phát sử dụng điều chế QPSK dùng 32
kênh Transmission System for Free Space Optical Communications," IEEE
 Hình 11 chỉ phổ của tín hiệu quang thu được ở Journal on selected Areas in Communications, Vol. 27, No. 9,
khoảng cách đường truyền khoảng 1360 km thì công suất nhận pp. 1639-1645, December 2009.
được giảm xuống khoảng -52 dBm.
413
413
[2] Bach T. Vu, Ngoc T. Dang, Truong C. Thang, and Anh T. Pham, " Bit
Error Rate Analysis of Rectangular QAM/FSO Systems Using an APD
Receiver Over Atmospheric Turbulence Channels," Optical Society of
America, Vol. 5, No. 5/ May 2013
[3] B. Patnaik and P. K. Sahu, "Design and study of high bit-rate freespace
optical communication system employing QPSK modulation," Int. J.
Signal and
Imaging Systems Engineering (in press).
[4] S. M. Haas and 1. H. Shapiro, "Capacity of wireless optical
communications," IEEE Journal on Selected Areas in Communications,
Vol. 21, October, pp.1346-13 57, 2003.
[5] D.A. Luong, T.C. Thang, A.T. Pham "Effect of Avalanche Photodiode and
Thermal Noises on the Performance of Binary Phase-shift
Keyingsubcarrier-intensity Modulation/free-space Optical Systems over
Turbulence Channels", IET Communications, Vol. 7, No. 8, May 2013,
pp. 738 – 744.
[6] Bach T. Vu, Ngoc T. Dang, Truong C. Thang, and Anh T. Pham "Bit Error
Rate Analysis of Rectangular QAM/FSO Systems Using an APD
Receiver Over Atmospheric Turbulence Channels," Optical Society of
America, Vol. 5, No. 5/May 2013.
[7] A. Belmonte and 1. M. Kahn, "Capacity of coherent free-space optical
links using diversity-combining techniques," Opt. Express, vol. 17, no.
15, pp. 12601-12611, July 2009.
[8] Ghassemloogy, Popoola(2010),Terrestrial Free-Space Optical
Communications, OpticalCommunications Research Group, NCRlab,
Northumbria University, Newcastle upon Tyne, UK.
[9] Murat Uysal, Jing Li (Tiffany) "Achievable Information Rate for Outdoor
Free Space Optical Communication with Intensity Modulation and Direct
Detection," Dept. of Electrical & Computer Engineering Lehigh
University, University of Waterloo.
[10] Nataraju, Laxmiprasad "Design And Simulation Of QPSK Modulator For
Optic Inter Satellite Communication," International Journal of Scientific
& Technology Research, Vol3 August 2014.
[11] Karim Kemih, Yacine Yaiche,"Optimization of Transmitter Aperture by
Genetic Algorithm in Optical Satellite," International Journal of
Electrical, Robotics, Electronics and Communications Engineering Vol:1
No:9, 2007
[12] Govind P. Agrawal , Fiber-Optic Communications Systems, Third
Edition, Vol 10, pp. 478- 510, 2002.
[13] Vincent W. S. Chan, Fellow, “Free-Space Optical Communications,”.
IEEE, Fellow, OSA.
[14] Tejbir Singh Hanzra, Gurpartap Singh " Performance of Free Space
Optical Communication System with BPSK and QPSK Modulation,"
IOSR Journal of Electronics and Communication Engineering, Vol 1, pp.
38- 43, May 2012.
[15] Sushank Chaudhary, Preety Bansal, Manisha Lumb " Effect of Beam
Divergence on WDM-FSO Transmission System," International Journal
of Computer Applications, Vol 93 – No 1, May 2014
[16] Milica I. Petković1, Goran T. Đorđević1, Dejan N. Milić1, Bata V.
Vasić1, " BER Analysis of IM/DD FSO System with APD Receiver Over
Gamma-Gamma Turbulence," Serbian Journal of Electrical Engineering,
Vol. 11, No. 1, February 2014.
414
414
Phân Tích Ảnh Hưởng Của Góc Truyền, Đường Phản Xạ

Và Sự Phân Bố Nguồn Sáng Trong Truyền
Thông Ánh Sáng Khả Kiến Dùng LED
Nguyễn Thanh Sơn và Trần Phú Cường
Trường Đại học Lạc Hồng, Biên Hòa, Đồng Nai
E-mail: nguyenthanhson@lhu.edu.vn, tphucuong07@gmail.com
Tóm tắt — Những năm gần đây đã gia tăng đáng kể các nghiên các đèn Led nhấp nháy thật nhanh để truyền dữ liệu có thể tạo
cứu tập trung khai thác ứng dụng của đèn Led dùng chung cho ra hệ thống kết nối mạng không dây tốc độ cao. Theo một
cả hai mục đích là chiếu sáng và truyền thông tốc độ cao. Tuy nghiên cứu được thực hiện bởi viện Fraunhofer của Đức, công
nhiên, hai hạn chế lớn nhất khi sử dụng ánh sáng Led trong nghệ này hiện có thể truyền dữ liệu với tốc độ lên đến 1
truyền thông là khoảng cách truyền ngắn và môi trường truyền
Gigabit/giây.
phải theo đường nhìn thấy (Line-of-sight). Trong nghiên cứu này,
chúng tôi đề xuất giải quyết ba vấn đề. Thứ nhất phân bố công Khái niệm hệ thống truyền thông bằng ánh sáng khả kiến
suất nguồn sáng, thứ hai phân tích ảnh hưởng của góc truyền, (Visible Light Communications, VLC) hay còn gọi là LiFi
cuối cùng là tính toán nguồn phản xạ ảnh hưởng lên năng lượng đã thu hút sự chú ý của nhiều nhà nghiên cứu, chủ yếu nhờ
thu của photodiode. Kết quả mô phỏng cho thấy năng lượng thu vào tính phổ biến của công nghệ đèn Led. Gầy đây, nghiên
của máy thu bị tác động rất lớn bởi góc truyền và sự phản xạ ánh cứu VLC đã bắt đầu được thực hiện ở Nhật. Phòng thí nghiệm
sáng, ngoài ra nếu phân bố nguồn sáng hợp lí sẽ cải thiện đáng kể
Nakagawa của đại học Keio đã xuất bản rất nhiều bài báo
năng lượng thu. Hơn nữa, kết quả nghiên cứu này sẽ làm cơ sở
nền tảng vững chắc cho những nghiên cứu tiếp theo nhằm nâng nghiên cứu về VLC, cụ thể như những phân tích cơ bản về
cao độ tin cậy cũng như khả năng ứng dụng của truyền thông VLC [1], sự kết hợp của VLC với truyền thông trên đường dây
dùng đèn Led trong tương lai. điện [2]. Ở Hàn Quốc cũng đã công bố rất nhiều nghiên cứu
như kết quả đo cho điều chế băng thông của Led [3]. Nghiên
Từ khóa— Phản xạ ánh sáng; ánh sáng khả kiến; phân bố cứu của đại học Oxford về vấn đề điều chế băng thông của
nguồn sáng; truyền thông ánh sáng
Led ứng dụng cho VLC cũng đã được công bố [4]. Tuy nhiên
tất cả những nghiên cứu trên đang gặp phải một vấn đề khó
I. GIỚI THIỆU khăn chung cần giải quyết đó là khoảng cách truyền thông đạt
Hiện nay, lượng điện dùng trong chiếu sáng ở Việt Nam được còn rất hạn chế, độ tin cậy truyền thông chưa cao do đầu
chiếm khoảng trên 25% và sẽ tăng cao hơn trong những năm phát và phía thu phải truyền theo đường nhìn thấy (Line-of-
sight). Một trong những giải pháp để giải quyết hai khó khăn
tới. Trong khi các nguồn cung cấp năng lượng ngày càng
trên đó là làm thế nào để tập trung năng lượng thu được tối ưu
khang hiếm, cạn kiệt không thể đáp ứng đủ yêu cầu. Để khắc
nhất ở máy thu.
phục, trên thế giới hiện nay, Mỹ và các nước như Nhật, Úc,
Nghiên cứu này, chúng tôi đã thực hiện tính toán chi tiết và
Hàn Quốc, Trung Quốc đã sử dụng đèn Led thay thế các loại
mô phỏng nhiều trường hợp phân bố khác nhau của các đèn
đèn chiếu sáng truyền thống. Với việc thay thế này, cùng với
Led, ngoài ra cũng đã phân tích ảnh hưởng của góc truyền,
chính sách quản lý hiệu quả, kết quả thu được có thể giảm
tính toán đường phản xạ ảnh hưởng lên năng lượng thu của
50% lượng điện dùng cho chiếu sáng. Chính vì điều đó, mà sử
Photo diode áp dụng cho một văn phòng làm việc tiêu chuẩn.
dụng đèn Led ngày càng phổ biến trên thế giới và hứa hẹn
Kết quả đã chứng minh rằng nếu phân bố hợp lí nguồn sáng
nhiều ứng dụng trong tương lai ở Việt Nam.
của các đèn Led sẽ thu được năng lượng tối ưu nhất. Đồng
Đèn thắp sáng dùng Led có ưu điểm là độ bền cao không
thời cũng cho thấy rõ những yếu tố quan trọng làm ảnh hưởng
sợ đứt tóc hay vỡ bóng, thời gian sử dụng cao do tuổi thọ Led
đến phân bố công suất thu tại máy thu.
đến khoảng 100.000 giờ, khả năng tiêu thụ điện năng ít do
hiệu suất phát sáng của Led rất cao, mềm dẻo trong sử dụng
Bố cục của bài báo được trình bày cụ thể theo thứ thự sau:
bởi vì led có kích thước nhỏ nên dễ ghép thành đèn hay mảng
Mô hình tính toán phân bố nguồn sáng được trình bày trong
phát sáng theo cấu hình bất kỳ, bức xạ nhiệt thấp do tổn hao
phần II, phần III sẽ phân tích ảnh hưởng của góc truyền,
năng lượng vì bức xạ nhiễu của Led rất bé.
đường phản xạ, phần IV thực hiện phân tích và mô phỏng.
Ngoài những tính năng nổi trội kể trên, đèn Led còn có
Cuối cùng kết luận được đưa ra trong phần thứ V.
một khả năng rất thú vị khác mà thời gian gần đây đang được
các nhà nghiên cứu trên thế giới quan tâm đó là khi điều khiển
ISBN: 978-604-67-0635-9 415
415
HộiHội
Thảo Quốc
Thảo Gia
Quốc Gia2015
2015về
vềĐiện
Điện Tử,
Tử,Truyền
Nghệ Thông
Thông TinTin (ECIT
(ECIT 2015)
2015)
Khuếch đại
Dữ liệu phát
Xử lí
Dữ liệu thu
Điều khiển
Hình. 1 Cấu trúc của một hệ thống VLC cơ bản
555 nm.
II. MÔ HÌNH TOÁN CỦA HỆ THỐNG VLC
Công suất phát quang Pt được tính bởi công thức:
A. Mô hình hệ thống VLC tiêu biểu
 max 2
Cấu trúc của một hệ thống VLC cơ bản được trình bày ở
hình 1. Hệ thống VLC phát tín hiệu số bằng cách điều khiển
Pt  
 min 0
 e d d  (4)
thay đổi liên tục ON/OFF của đèn LED và thu dữ liệu thông
 max ,  min : được xác định từ đặc tuyến độ nhạy của
qua photodiode. Bộ phận phát bao gồm khối dữ liệu số, khối
điều khiển, và khối các đèn LED. Khối đèn LED được điều photodiode.
khiển đóng ngắt với thời gian rất ngắn (vài chục nano-giây), Theo [6] và như trình bày trong hình 2 thì H (0) LOS được
do đó nó có thể vừa chuyển đổi dữ liệu tốc độ cao, vừa đảm
tính theo công thức:
bảo chiếu sáng. Dữ liệu số cần phát sau khi được điều chế, sẽ
được gửi đến mạch điều khiển để điều khiển LED phát dữ
 ( m  1) A cosm ( )T ( ) g ( ) cos( ), 0    
liệu. Ở máy thu, tín hiệu ánh sáng nhận được thông photo 
diode, tín hiệu này sẽ được đưa đến khối khuếch đại để H (0)   2 d 2 s con
khuyếch đại biên độ tín hiệu, loại bỏ tạp nhiễu, sau đó đưa đến 0 ,    con
khối giải điều chế xử lí để khôi phục lại dữ liệu ban đầu. (5)
B. Phân bố công suất thu của hệ thống VLC với một nguồn
sáng (single-source)  là góc tới đối với trục vuông góc với bề mặt thu, Ts ( ) và
Do Led được dùng cho hai mục đích chiếu sáng và truyền g ( ) là độ lợi của bộ lọc và bộ tổng hợp ánh sáng,  con là
thông, nên cần định nghĩa hai thông số là cường độ sáng và
FOV (field of view) của máy thu, d là khoảng cách giữa Led
công suất phát quang. Cường độ sáng dùng để mô tả độ sáng đến photodiode, A là vùng hoạt động tích cực của bộ thu
của Led, công suất phát quang là tổng số năng lượng tỏa ra từ Photodiode, m là những hệ số phản xạ Lambertian.
một đèn Led. Hệ số phản xạ Lambertian m xác định bởi:
Từ mô hình VLC trong hình 1, các tham số được cho như
trong hình 2 và tham khảo [5,6], ta có công suất thu được tại ln 2
m  (6)
máy thu là: ln(cos 1/2 )
P
r
Pt  H (0) LOS (1)
 1/2 là bán góc tại nữa cường độ sáng của 1 Led (FWHM)
Pt : công suất phát quang, H (0) LOS : path loss trong trong môi
xem trong hình 4.
trường truyền LOS. Độ lợi của bộ tổng hợp quang tại máy thu được cho bởi:
Cường độ sáng được cho bởi:
 n2
d  2 , 0     con
I  (2) g ( )   sin  con (7)
d
0,  > con

 : cường độ sáng,  : góc không gian
 có thể được tính toán từ dòng năng lượng  e như trình bày n là hệ số phản xạ thu được của photodiode.
trong [6]: C. Mô hình của VLC với đa nguồn sáng (multisource)
780
 K m  V (  ) e (  ) d  (3) Những nghiên cứu trước đây trên hệ thống VLC đều áp dụng
380
nguồn sáng đơn (single-source). Tuy nhiên, để đảm bảo chiếu
V ( ) : đường cong độ sáng tiêu chuẩn, K m : cường độ sáng sáng, hầu hết các phòng đều sử dụng nhiều nguồn sáng. Do đó
nếu nghiên cứu dựa trên một nguồn sáng thì không phù hợp thực
nhìn thấy lớn nhất, với K m 683 lm/W tại chiều bước sóng
tế.
416
416
HộiHội
ThảoThảo Quốc
Quốc Gia
2015 ĐiệnTử,
Tử,Truyền
TruyềnThông
Thông và
và Công
CôngNghệ
NghệThông
ThôngTinTin
(ECIT 2015)
(ECIT 2015)
III. TÍNH TOÁN ẢNH HƯỞNG CỦA ĐƯỜNG PHẢN XẠ

Theo các nghiên cứu [6, 7 và 8] thì cường độ các đường
phản xạ của ánh sáng Led phụ thuộc vào bước sóng và vật liệu
để xây tường. Cũng theo [7] khi xem xét trường hợp có một
đường phản xạ từ bức tường như trình bày trong hình 4. Công
suất thu được tại máy thu sẽ là tổng của độ lợi DC của đường
đến trực tiếp H d (0) và đường phản xạ H ref (0) :
N LEDS
 
Pr  H d
(0)   PdH
t d
(0)  (9)
 Reflections 
Độ lợi DC của đường phản xạ thứ nhất được cho theo [7] là:
 Ar ( m  1)  dA cos m ( ) cos( )
Hình. 2 Các thông số của hệ thống VLC  2( d d ) 2 wall r ir
Cáp quang  1 2
H ref (0)   cos(  ir )Ts ( ) g ( ) cos( r ), 0   r   con



0,  r   con
(10)
d 1 : là khoảng cách giữa đèn Led và điểm phản xạ, d 2 : là

khoảng cách giữa điểm phản xạ và bề mặt máy thu,  : là hệ
số phản xạ, dAwall : là một khu vực phản xạ của vùng nhỏ, r :
là góc của bức xạ đến một điểm phản xạ,  ir và  ir là góc của
bức xạ đến một điểm phản xạ và góc của bức xạ đến một máy
Hình. 3 Cấu trúc VLC của một dãy Led (multisource) thu,  r là góc tới từ các bề mặt phản xạ. Chi tiết các thông số
Trong bài báo này, chúng tôi đề xuất mở rộng nghiên cứu như trình bày trong hình 4.
cho cấu trúc VLC của một dãy Led (multisource) áp dụng cho
một căn phòng làm việc tiêu chuẩn như trình bày trong hình 3. IV. PHÂN TÍCH VÀ MÔ PHỎNG
Trong đề xuất này, mỗi Led được xem như một điểm
A. Ảnh hưởng của single-source và multisource tới công suất
nguồn sáng và đồ thị bức xạ của mỗi Led là một hàm của góc
thu của VLC
khối  trong không gian 3 bậc. Khi đó  được xác định như
sau: Để phân tích ảnh hưởng của single-source và multisource
tác động lên phân bố công suất quang thu được tại máy thu
f ( )
f ALED ( x, y , d )  2 (8) của hệ thống VLC như trình bày tính toán trong phần 1. Trong
2 2
x  y d nghiên cứu này, chúng tôi thực hiện mô phỏng sử dụng phần
mềm Matlab, áp dụng cho một căn phòng tiêu chuẩn như trình
bày trong hình 2 và 3, mô hình được ứng dụng trong môi
Nguồn sáng
trường truyền LOS (bỏ qua ảnh hưởng của nhiễu và phản xạ).
Thông số thiết lập cho mô phỏng được trình bày chi tiết trong
bảng 1.
Hình 5a trình bày chiếu sáng sử dụng nguồn sáng đơn với
bán góc  1/2 là 700 và thông lượng sáng cực đại tại trung tâm
là 568.10 lx. Đối với chiếu sáng đa nguồn, mô phỏng sử dụng
4 nguồn sáng với bán góc  1/2 là 700 và thông lượng sáng
trong khoảng 315-910 lx có giá trị trung bình là 717 lx được
trình bày trong hình 5b.
Kết quả mô phỏng cho thấy rằng tại máy thu hầu hết công
suất quang thu được cho cả hai trường hợp có sự phân bố đồng
đều tại trung tâm ứng với công suất cực đại 2.3 dBm và cực
Hình. 4 Cấu trúc VLC với 1 đường phản xạ
417
417
BẢNG 1. THÔNG SỐ MÔ PHỎNG CỦA HỆ THỐNG VLC
Thông số Giá trị
Phòng Kích thước 3

553 m
Hệ số phản xạ 0.8
Nguồn phát Vị trí (4 Led) (1.25, 1.25, 3), (1.25, 3.75, 3),
(3.75, 1.25, 3), (3.75, 3.75, 3)
Vị trí (1 Led) (2.5, 2.5, 3)
 1/2 70
Công suất phát/Led 20mW
Số Led/dãy 60  60
Cường độ sáng trung tâm 300-910 lx
Máy thu Máy thu đặt cách sàn nhà 0.85m
2
A 1 cm
 con (FOV) 60
t 0.5 ns
tiểu -2.3 dBm. Tuy nhiên, sử dụng 4 nguồn sáng thì phân bố
công suất sẽ phủ rộng hơn đáp ứng độ tin cậy truyền thông sẽ
tốt hơn.
(b)
Cường độ sáng (lx)
Hình. 5 (a) Phân bố công suất ứng với 1 Led (single-source);

(b) Phân bố công suất ứng với 4 Led (Multisource)
B. Ảnh hưởng của bán góc (FWHM) tới phân bố công suất
máy thu
Trong thí nghiệm thứ hai, Để phân tích ảnh hưởng của bán
góc (FWHM) tới phân bố công suất thu được tại máy thu,
chúng ta sẽ thay đổi giá trị bán góc  1/2 lần lượt là 700 và
12.50 áp dụng cho trường hợp 4 nguồn sáng . Kết quả thu được
trong hình 6a và 6b cho thấy rằng phân bố công suất sẽ không
đồng đều trong trường hợp  1/2 là 12.50 . Hơn nữa trong hình
6b chỉ rõ rằng công suất quang thu được có một sự thay đổi rất
lớn phân bố giữa giá trị max và min trong khoảng 35 dB, dẫn 0
Hình. 6 (a) Phân bố công suất ứng với  1/2 là 70 ;
đến SNR cao trong một vài vùng và tín hiệu sẽ bị gián đoạn
trong vài vùng. (b) Phân bố công suất ứng với  1/2 là 12.50
418
418
C. Ảnh hưởng của đường phản xạ tới phân bố công suất ở [6] F.R. Gfeller and U. Bapst, Wireless in-house data communication via
diffuse infrared radiation, Proceedings of the IEEE, 67, 1474–1486,
máy thu 1979.
Để phân tích ảnh hưởng của phản xạ đến phân bố công [7] T. Komine and M. Nakagawa, Fundamental analysis for visible-light
suất thu tại máy thu. Trong mô phỏng thứ 3 này, chúng ta sử communication system using LED lights, IEEE Transactions on
Consumer Electronics, 50, 100–107, 2004.
dụng mô hình như trình bày trong hình 4, ở đó có xem xét đến
[8] L. Kwonhyung, P. Hyuncheol and J.R.Barry, “Indoor channel
sự tác động của 1 đường phản xạ. Phân bố công suất thu được characteristics for visible light communications”, IEEE Communications
tại máy thu sẽ là tổng công suất được tạo ra giữa đường trực Letters, 15, 217–219.
tiếp và đường phản xạ từ bức tường căn phòng. Mô phỏng
trong hình 7 rõ ràng cho thấy công suất thu được tại máy thu
có giá trị trong khoảng -2.4 đến 2.8 dBm. Kết quả này chứng
minh rằng công suất trung bình thu được khi có xem xét yếu
tố 1 đường phản xạ sẽ lớn hơn 0.6 dBm so với công suất chỉ
tạo ra do đường trực tiếp như trình bày trong hình 5.
Hình. 7 Phân bố công suất ở máy thu với phản xạ
V. KẾT LUẬN
Hệ thống VLC phát dữ liệu bằng cách điều khiển Led và
nhận dữ liệu thông qua photodiode có rất nhiều ưu điểm, đầy
tiềm năng cho một thế hệ tiếp theo trong truyền thông không
dây tốc độ cao. Tuy nhiên bên cạnh đó kỹ thuật này cũng tồn
tại rất nhiều khuyết điểm cần giải quyết. Kết quả của nghiên
cứu này đã phân tích được 3 yếu tố ảnh hưởng rất lớn đến
phân bố công suất thu được tại máy thu. Hy vọng kết quả này
sẽ làm nền tảng cho những nghiên cứu tiếp theo trong việc
nâng cao, cải thiện khả năng ứng dụng của hệ thống VLC
trong tương lai.

[1] Y. Tanaka, T. Komine, S. Haruyama and M. Nakagawa, “Indoor Visible
Light Data Transmission System Utilizing White LED Lights,” IEICE
Trans. Communication, vol. E86-B, pp.2440-2454, 2003.
[2] T. Komine, M. Nakagawa, “Integrated system of white LED visiblelight
communication and power-line communication,” IEEE Trans.
Consumer Electronics, vol. 49, no. 1, pp.71-79, February 2003.
[3] Lee.C.G, Park.C.S, Kim.J.-H, Kim, D.H, “Experimental verification of
optical wireless communication link using high-brightness illumination
light-emitting diodes, Optical Engineering”, Vol. 46, No. 12, 2007.
[4] Minh, H.L, O’Brien.D.C, Faulkner.G.F, “Highspeed visible light
communicaitons using multiple-resonant equalization”, IEEE Photonics
Technology Letters, Vol. 20, No. 14, 2008.
[5] J. M. Kahn and J. R. Barry, “Wireless Infrared Communications,” in
proc. of IEEE, vol. 85. pp. 265-298, February1997.
419
419
Hội Hội
ThảoThảo Quốc
Quốc GiaGia 2015
ĐiệnTử,
Tử,Truyền
TruyềnThông
Thông và Công
Công Nghệ
NghệThông
ThôngTinTin
(ECIT 2015)
(ECIT 2015)
Mô Hình Đánh Giá Suy Hao Hai Vùng Truyền Sóng

Trong Hầm Mỏ Than Chữ Nhật
Nguyễn Văn Tài, Lâm Hồng Thạch, Nguyễn Hoàng Hải
Viện Điện tử Viễn thông,
Trƣờng Đại học Bách Khoa Hà Nội
Email: tai.nguyenvan-set@hust.edu.vn, thach.lamhong@hust.edu.vn
Tóm tắt— Sóng vô tuyến truyền trong đường hầm mỏ than chữ Mô hình mà chúng tôi đề xuất cũng đƣợc kiểm nghiệm bởi kết
nhật có tỷ lệ suy hao khác biệt giữa vùng gần và vùng xa antenna quả đo thử nghiệm trong hầm mỏ than Khe Chàm 3-tỉnh Qảng
phát. Trong bài báo này, chúng tôi đề xuất mô hình tính toán suy Ninh tại tần số 2.45GHz. Mô hình giúp cho việc triển khai một
hao truyền sóng hai vùng trong đường hầm mỏ than hình chữ hệ thống thông tin vô tuyến hoạt động hiệu quả, phục vụ quản
nhật, qua đó có thể xác định được điểm kỳ dị trong vùng truyền
lý, giám sát và định vị công nhân làm việc trong các đƣờng
sóng vô tuyến. Mô hình được thử nghiệm đo thực tế tại mỏ than
Khe Chàm 3-Tỉnh Quảng Ninh tại tần số 2.45GHz cho thấy mô hầm lò than ở Việt Nam.
hình chúng tôi đề xuất hoàn toàn phù hợp với kết quả đo mà
II. PHƢƠNG PHÁP THỰC HIỆN
chúng tôi thu được. Mô hình giúp cho việc thiết kế một hệ thống
thông tin vô tuyến hoạt động hiệu quả trong đường hầm mỏ than. Chúng tôi thực hiện đo công suất thu thực tế trong một nhánh
đƣờng hầm mỏ than Khe Chàm 3 hình chữ nhật có kích thƣớc
Từ khóa- Truyền sóng vô tuyến, điểm kỳ dị, suy hao truyền chiều rộng w=6m, chiều cao h=3m và một đƣờng hầm khác có
sóng trong hầm mỏ, mô hình hai vùng, suy hao ghép nối antenna. chiều rộng w=4m, chiều cao h=2m, chiều dài đƣờng hầm 150
I. GIỚI THIỆU mét nhƣ sau: sử dụng máy thu tín hiệu đặt vị trí cố định giữa
đƣờng hầm có tọa độ (0w, 0h, z0) với độ nhạy thu là -90dBm,
Môi trƣờng trong các hầm mỏ hết sức phức tạp bởi hầm máy phát tín hiệu di chuyển dọc theo đƣờng hầm mỏ theo tọa
mỏ thƣờng có không gian giới hạn, các bờ bao quanh hầm mỏ độ (0w, 0h, z) với công suất phát là 7dBm tại tần số 2.45GHz
có hằng số điện môi, dẫn suất, hệ số từ thẩm phụ thuộc vào (hình 1). Kết quả đo thực tế này đƣợc so sánh với mô hình suy
đặc tính lý hóa của vật chất cấu trúc nên các bờ bao quanh hao không gian tự do để chúng tôi đề xuất ý tƣởng xây dựng
đƣờng hầm. Đồng thời, không gian bên trong hầm mỏ là giới mô hình dự báo suy hao truyền sóng hai vùng phân biệt bởi
hạn nên gây ra sự hấp thụ, phản xạ và đa đƣờng của sóng vô điểm kỳ dị.
tuyến lan truyền bên trong đƣờng hầm.
Các yếu tố ảnh hƣởng đến suy hao truyền sóng trong hầm z
mỏ chữ nhật đã đƣợc nhiều tác giả nghiên cứu và công bố kết
quả trong những năm qua. Emslie [6] đã xây dựng mô hình
tính toán suy hao trong đƣờng hầm chữ nhật do ảnh hƣởng của
đặc tính phân cực sóng, độ nhám bề mặt thành hầm, độ
nghiêng của thành hầm.
Trong [1] cũng đƣa ra công thức tính toán điểm kỳ dị là
y
một hàm của bƣớc sóng và chiều cao của antennana phát và e r1
antennana thu, tuy nhiên mô hình này hoàn toàn không ứng
dụng đƣợc cho việc tính toán điểm kỳ dị trong đƣờng hầm mỏ.
Tác giả Y.P.Zhang [2] đã xây dựng mô hình mới dự báo suy h x
0
hao truyền sóng trong đƣờng hầm chữ nhật, mô hình này phân w er2
chia sóng lan truyền trong đƣờng hầm thành hai vùng phân
biệt nhau bởi điểm kỳ dị, sóng lan truyền trong vùng thứ nhất Hình 1. Mô hình mỏ than hình chữ nhật
là vùng gần nằm trong miền Fresnel nên nó chỉ chịu ảnh
hƣởng bởi suy hao do không gian tự do, sóng lan truyền trong Hình 2 và Hình 3 thể hiện kết quả đo công suất tín hiệu thu
miền thứ hai là miền xa chịu ảnh hƣởng bởi ống dẫn sóng điện đƣợc trong hai nhánh đƣờng hầm mỏ than Khe Chàm 3 nêu
môi, điểm phân biệt giữa vùng gần và vùng xa là điểm kỳ dị trên với tần số của tín hiệu 2.45GHz, antenna thu đặt ở giữa
thỏa mãn điều kiện cân bằng giữa hai phƣơng trình truyền đƣờng hầm, antenna phát di chuyển theo chiều dài đƣờng hầm
sóng trong hai vùng này. Tuy nhiên, [2] xây dựng mô hình suy mỏ với các tọa độ lần lƣợt là (0w, 0h, z0) và (0w, 0h, z).
hao truyền sóng trong vùng thứ hai theo phƣơng pháp quang Chúng tôi nhận thấy tỷ lệ suy hao tại vùng gần antenna phát có
tia. Vì vậy, trong bài báo này, chúng tôi xây dựng mô hình độ dốc suy hao lớn và tuân theo quy luật của suy hao do ảnh
đánh giá suy hao truyền sóng trong vùng gần và vùng xa theo hƣởng của không gian tự do, đến một khoảng cách khoảng
phƣơng pháp giải hệ phƣơng trình Maxwell, qua đó có thể xác 74m (Hình 2) và 37m (Hình 3) tính từ antenna phát đến
định đƣợc điểm kỳ dị phân biệt rõ rệt hai vùng truyền sóng. antenna thu thì tỷ lệ suy hao giảm chậm dần và tỷ lệ suy hao
ISBN: 978-604-67-0635-9 420
420
Hội Hội
Thảo Quốc
Thảo GiaGia
2015 ĐiệnTử,
Tử,Truyền
TruyềnThông
ThôngTinTin (ECIT
(ECIT 2015)
2015)
này không còn tuân theo mô hình suy hao không gian tự do  er r ,  
nữa.
-20
-30
Suy hao kh«ng gian tù do
§o thùc tÕ
 e0 0  Điểm kỳ dị
Anten phát
-40 θ
Tû lÖ suy hao (dB)
-50 Vùng gần Vùng xa

(I) (II)
-60
-70
Hình 4. Hai vùng lan truyền sóng phân biệt bởi điểm kỳ dị
-80
Sóng vô tuyến tryền trong hầm mỏ có đặc tính suy hao khác
-90 nhau rõ rệt ở vùng gần và vùng xa, hai vùng này đƣợc phân
0 20 40 60 80 100 120 140 150
Kho¶ng çch gi÷a antenna ph¸t vµ thu (m) biệt với nhau bởi điểm kỳ dị [3]. Trong vùng gần (vùng I), khi
góc tới bằng góc tới hạn (Hình 4) thì sóng lan truyền
Hình 2. Kết quả đo suy hao truyền sóng trong hầm mỏ chữ nằm hoàn toàn trong miền Fresnel, suy hao truyền sóng trong
nhật kích thƣớc w=6m, h=3m tại tần số 2.45GHz, máy thu có miền này là do đặc tính phân tán sóng mà không chịu ảnh
tọa độ (0w, 0h, z0), máy phát di chuyển theo chiều dài đƣờng hƣởng của hình dạng, kích thƣớc của hầm mỏ và thông số điện
hầm mỏ với tọa độ (0w, 0h, z). của vật liệu cấu trúc nên thành hầm. Vì vậy, suy hao lan
truyền sóng chỉ chịu ảnh hƣởng bởi không gian tự do. Do đó,
-20 đơn giản để viết đƣợc phƣơng trình suy hao lan truyền sóng
Suy hao kh«ng gian tù do trong miền gần theo công thức Fresnel [8]:
-30 §o thùc tÕ
( ) (1)
-40
Với d là khoảng cách và là bƣớc sóng tính theo đơn vị mét.

Vì môi trƣờng hầm mỏ than hết sức phức tạp, do đó sóng
-50
truyền trong hầm mỏ than không những chịu ảnh hƣởng suy
hao bởi các yếu tố nhƣ hằng số điện môi của thành hầm, trần
-60
và sàn của đƣờng hầm, tần số thông tin, chiều cao và chiều
rộng của đƣờng hầm [3,4] mà còn chịu ảnh hƣởng của suy hao
-70
phối ghép của antenna thu phát đặt trong đƣờng hầm [5,6]. Ở
vùng xa (vùng II), các tia sóng chịu sự phản xạ, khúc xạ và
-80
hấp thụ bởi hai thành hầm và trần, sàn của đƣờng hầm mỏ.
Trong vùng này, năng lƣợng sóng không còn suy hao theo mô
-90
0 20 40 60 80 100 120 140 150 hình suy hao không gian tự do nữa mà chỉ chịu suy hao do ảnh
Kho¶ng çch gi÷a antenna ph¸t vµ thu (m) hƣởng bởi kích thƣớc đƣờng hầm, thông số điện của vật liệu
cấu trúc nên thành hầm và suy hao phối ghép giữa antenna thu
Hình 3. Kết quả đo suy hao truyền sóng trong hầm mỏ chữ và antenna phát đặt trong đƣờng hầm.
nhật kích thƣớc w=4m, h=2m tại tần số 2.45GHz, máy thu có Chúng tôi xem xét một hệ thống thông tin vô tuyến đƣợc đặt
tọa độ (0w, 0h, z0), máy phát di chuyển theo chiều dài đƣờng trong một hầm mỏ than chữ nhật, dễ dàng viết đƣợc công suất
hầm mỏ với tọa độ (0w, 0h, z). thu PR của antennanal thu cách antennanal phát một khoảng d
nhƣ sau:
Lý do là ở các khoảng cách này, sóng lan truyền nằm ngoài
miền Fressnel. Sóng lan truyền nằm trong và ngoài miền (2)
Fressnel chúng tôi gọi lần lƣợt là vùng gần và vùng xa. Suy
Ở đây, chúng tôi sử dụng antenna thu và antenna phát đẳng
hao sóng lan truyền trong vùng xa do ảnh hƣởng của các yếu
hƣớng có hệ số tăng ích bằng 1. Do đó, từ phƣơng trình (2) có
tố hầm mỏ nhƣ: chiều cao, chiều rộng của hầm mỏ, thông số
thể viết đƣợc mô hình đánh giá suy hao truyền sóng ở vùng xa
điện của các thành hầm, suy hao phối ghép giữa antenna thu
trong hầm mỏ than chữ nhật:
và phát trong đƣờng hầm [3,6,7].
(3)
III. MÔ HÌNH DỰ BÁO SUY HAO HAI VÙNG Trong đó:
lần lƣợt là suy hao truyền sóng theo phân cực ngang và
Từ kết quả đo đạc thực tế và các nhận xét nêu trên, chúng tôi
phân cực đứng trong hầm mỏ [6]:
tiến hành xây dựng mô hình dự báo suy hao truyền sóng trong
vùng gần và vùng xa, giữa hai vùng suy hao này phân biệt ( ) (4)
nhau bởi điểm kỳ dị (Hình 4). √ √
421
421
HộiHội
với mô hình tính toán suy hao (3) với mức suy hao ở vùng gần
Và ( ) (5)
√ √ biến đổi mạnh hơn rất nhiều so với vùng xa.
Với: -20
Suy hao kh«ng gian tù do
d là khoảng cách tính bằng mét M« h×nh ®Ò xuÊt, antenna cã täa ®é (0w, 0h)
-30
Lt, Lr lần lƣợt là suy hao phối ghép của antenna thu tại vị trí §o thùc tÕ, antenna cã täa ®é (0w, 0h)
(xr, yr) và antenna phát tại vị trí (xt, yt) trong hầm mỏ [8] : -40

( ) (6) -50
( ) (7) -60
-70
Bảng 1: Suy hao ghép nối của antenna phát và antenna thu tại
vị trí (x,y) trong hầm mỏ chữ nhật có kích thƣớc (w=6m, -80
h=3m)
Tần số -90
0 20 40 60 80 100 120 140 150
(0w, 0h) (0.25w, 0h) (0.25w, 0.25h)
(MHz) Kho¶ng çch gi÷a antenna ph¸t vµ thu (m)
900 - 60.1 dB - 54.1 dB - 48.1 dB
1800 -72.2 dB - 66.1 dB - 60.1 dB Hình 5. Kết quả mô phỏng và đo suy hao truyền sóng trong
hầm mỏ than kích thƣớc w=6m, h=3m, máy thu có tọa độ (0w,
2450 -77.5 dB - 71.5 dB - 65.5 dB
0h, z0), máy phát di chuyển theo chiều dài đƣờng hầm mỏ với
Bảng 2: Suy hao ghép nối của antenna phát và antenna thu tại tọa độ (0w, 0h, z0).
vị trí (x,y) trong hầm mỏ chữ nhật có kích thƣớc (w=4m, -20
h=2m) Suy hao kh«ng gian tù do
Tần số -30 M« h×nh ®Ò xuÊt, antenna cã täa ®é (0.25w, 0h)
(0w, 0h) (0.25w, 0h) (0.25w, 0.25h) §o thùc tÕ, antenna cã täa ®é (0.25w, 0h)
(MHz)
900 -53.1 dB - 47.1 dB - 41 dB -40
1800 -65.1 dB - 59.1 dB - 53.1 dB -50

2450 -70.5 dB - 64.4 dB - 58.4 dB
Bảng 1 và bảng 2 thể hiện tỷ lệ suy hao ghép nối antenna phát -60
tại vị trí (xt, yt) và antenna thu tại vị trí (xr, yr) trong hầm mỏ
than tính toán công thức (6) và (7). Từ kết quả này có thể nhận -70
thấy rằng suy hao ghép nối antenna phụ thuộc vào tần số -80
thông tin, kích thƣớc của đƣờng hầm và vị trí của antenna
thu/phát đặt trong đƣờng hầm. Tuy nhiên, tỷ lệ suy hao này -90
phụ thuộc nhiều vào kích thƣớc chiều rộng-chiều cao của 0 20 40 60 80 100 120 140150
Kho¶ng çch gi÷a antenna ph¸t vµ thu (m)
đƣờng hầm và tần số thông tin. Chú ý là từ (6) và (7) có thể
thấy rằng nếu vị trí antenna thu/phát đặt tiếp giáp với thành Hình 6. Kết quả mô phỏng và đo đạc suy hao truyền sóng
hầm và trần-sàn của hầm mỏ, tức xr=xt=w/2 và yr=yt=h/2 thì trong hầm mỏ than kích thƣớc w=6m, h=3m, máy thu có tọa
hai công thức này không còn phù hợp để áp dụng vào mô hình độ (0.25w, 0h, z0), máy phát di chuyển theo chiều dài đƣờng
mà chúng tôi đề xuất nữa. hầm mỏ với tọa độ (0.25w, 0h, z0).
IV. KẾT QUẢ ĐO THỰC TẾ VÀ THẢO LUẬN Chú ý là khi máy thu và máy phát có tọa đọ lần lƣợt là (0w,
Để kiểm chứng lại mô hình tính toán suy hao trong hai vùng 0h, z0) và (0w, 0h, z) thì vùng gần rộng hơn (khoảng cách giữa
truyền sóng mà chúng tôi đề xuất ở (3), chúng tôi thực hiện máy phát và máy thu là 75 mét tƣơng ứng với tỷ lệ suy hao là -
mô phỏng và đo thử nghiệm đối với đƣờng hầm mỏ than Khe 77dB) trong khi đó khi máy thu và máy phát có tọa độ lần lƣợt
Chàm 3 với hai nhánh hầm mỏ có các kích thƣớc (w=6m, là (0.25w, 0h, z0) và (0.25w, 0h, z) thì vùng gần hẹp hơn
h=3m) và (w=4m, h=2m), hai bên thành hầm và trần của (khoảng cách giữa máy phát và máy thu là 37 mét tƣơng ứng
đƣờng hầm đƣợc gia cố bằng bê tông cốt thép nên có hằng số với tỷ lệ suy hao là -71dB). Các khoảng cách 75 mét và 37
điện môi e = 5.5 và dẫn suất  = 0.01S/m, tín hiệu phát ở tần mét này đƣợc xem là các điểm kỳ dị, các điểm kỳ dị này xấp
số 2.45GHz, thiết bị thu phát tín hiệu có các tham số đã nêu xỉ nhau trong cả trƣờng hợp tính toán theo mô hình chúng tôi
trong Phần II. Hình 5 và 6 thể hiện kết quả đo tỷ lệ suy hao đề xuất và kết quả đo thực tế. Thông qua điểm kỳ dị có thể
truyền sóng trong nhánh đƣờng hầm mỏ than kích thƣớc chiều nhận thấy tỷ lệ suy hao truyền sóng biến đổi nhanh phía trƣớc
rộng w=6 mét, chiều cao h=3 mét. điểm kỳ dị và chậm hơn ở phía sau điểm kỳ dị.
Trƣờng hợp thứ nhất chúng tôi đặt máy thu và máy phát lần Tƣơng tự, chúng tôi tôi thực hiện đo đạc suy hao truyền sóng
lƣợt tại tọa độ (0w, 0h, z0) và (0w, 0h, z), trƣờng hợp thứ hai trong một nhánh đƣờng hầm mỏ than Khe Chàm 3 có kích
chúng tôi đặt máy thu và máy phát lần lƣợt tại tọa độ (0.25w, thƣớc chiều rộng w=4 mét, chiều cao h=2 mét. Trƣờng hợp
0h, z0) và (0.25w, 0h, z), tần số tín hiệu 2.45GHz. Rõ ràng là thứ nhất máy thu đặt cố định tại tọa độ (0w, 0h, z0) và máy
kết quả đo thực tế mà chúng tôi thu đƣợc hoàn toàn phù hợp phát di chuyển theo chiều dài đƣờng hầm với tọa độ (0w, 0h,
422
422
HộiHội
ThảoThảo Quốc
Quốc Gia
2015 ĐiệnTử,
Tử,Truyền
TruyềnThông
Thông và
và Công
CôngNghệ
NghệThông
ThôngTinTin
(ECIT 2015)
(ECIT 2015)
z), trƣờng hợp thứ hai là máy thu đặt cố định tại tọa độ cho antenna thu và antenna phát phân cực đứng và phân cực
(0.25w, 0h, z0) và máy phát di chuyển theo chiều dài đƣờng ngang.
hầm với tọa độ (0.25w, 0h, z), tần số tín hiệu sử dụng Suy hao kh«ng gian tù do
2.45GHz. M« h×nh ®Ò xuÊt, antenna ph©n cùc ngang
-20 -30
Suy hao kh«ng gian tù do KÕt qu¶ ®o, antenna ph©n cùc ngang
M« h×nh ®Ò xuÊt, antenna ph©n cùc ®øng
M« h×nh ®Ò xuÊt, antenna cã täa ®é (0w, 0h) -40
-30

KÕt qu¶ ®o, antenna ph©n cùc ®øng
§o thùc tÕ, antenna cã täa ®é (0w, 0h)
-40 -50
-50 -60
-60 -70
-70 -80
-80 -90
0 20 40 60 80 100 120 140 150
Kho¶ng çch gi÷a antenna ph¸t vµ thu (m)
-90
0 20 40 60 80 100 120 140 150 Hình 9. Kết quả mô phỏng và đo đạc suy hao truyền sóng
Kho¶ng çch gi÷a antenna ph¸t vµ thu (m) trong hầm mỏ than kích thƣớc w=6m, h=3m, máy thu có tọa
Hình 7. Kết quả mô phỏng và đo đạc suy hao truyền sóng độ (0w, 0h, z0), máy phát di chuyển theo chiều dài đƣờng hầm
trong hầm mỏ than kích thƣớc w=4m, h=2m, máy thu có tọa mỏ với tọa độ (0.25w, 0h, z0) cho cả antenna thu và phát phân
độ (0w, 0h, z0), máy phát di chuyển theo chiều dài đƣờng hầm cực ngang và phân cực đứng.
mỏ với tọa độ (0w, 0h, z0).
Trong trƣờng hợp này, chúng tôi sử dụng antenna phân cực
-20 đứng thì điểm kỳ dị mô phỏng và đo đạc xấp xỉ là 78 mét
Suy hao kh«ng gian tù do tƣơng ứng với tỷ lệ suy hao là -78dB, trong khi sử dụng
-30 M« h×nh ®Ò xuÊt, antenna cã täa ®é (0.25w, 0h) antenna phân cực ngang thì điểm kỳ dị là 74 mét tƣơng ứng tỷ
§o thùc tÕ, antenna cã täa ®é (0.25w, 0h) lệ suy hao là -77dB. Nhƣ vậy, có thể nhận thấy là điểm kỳ dị
-40 phân chia vùng gần và vùng xa phụ thuộc vào sự phân cực của
antenna sử dụng để thu phát tín hiệu.

-50
Bảng 1: Vị trí các điểm kỳ dị đối với hầm mỏ có kích thƣớc
-60 (w=6m, h=3m)
Phân cực Phân cực
-70 Điểm kỳ dị đứng (mét) ngang (mét)
Đo Tính Đo Tính
-80 Tần số đạc toán đạc toán
(0w, 0h) 31.5 28.46
-90 900MHz (0.25w, 0h) 14.5 13.9
0 20 40 60 80 100 120 140 150
Kho¶ng çch gi÷a antenna ph¸t vµ thu (m) (0.25w, 0.25h) 7.0 6.8
(0w, 0h) 78 77.8 75 74.7
Hình 8. Kết quả mô phỏng và đo đạc suy hao truyền sóng 2.45GHz (0.25w, 0h) 38 37.8 37 37
trong hầm mỏ than kích thƣớc w=4m, h=2m, máy thu có tọa (0.25w, 0.25h) 19 18.6 19 18.5
độ (0.25w, 0h, z0), máy phát di chuyển theo chiều dài đƣờng
hầm mỏ với tọa độ (0.25w, 0h, z0). Bảng 2: Vị trí các điểm kỳ dị đối với hầm mỏ có kích thƣớc
(w=4m, h=2m)
Kết quả đo tỷ lệ suy hao thực tế và mô phỏng thể hiện trên Phân cực Phân cực
hình 7 và hình 8 cũng cho thấy rằng mô hình chúng tôi đề xuất Điểm kỳ dị đứng (mét) ngang (mét)
là hoàn toàn phù hợp trong cả hai trƣờng hợp này. Điểm kỳ dị Tần số Đo Tính Đo Tính
đo đƣợc cũng xấp xỉ với điểm kỳ dị tính toán đƣợc theo mô đạc toán đạc toán
hình chúng tôi đề xuất là 33 mét tƣơng ứng với tỷ lệ suy hao là
(0w, 0h) 15.5 4.6
-70dB trong trƣờng hợp thứ nhất và 16.5 mét tƣơng ứng với tỷ
900MHz (0.25w, 0h) 6.7 2.3
lệ suy hao là -65dB.
(0.25w, 0.25h) 3.2 1.2
Hình 9 thể hiện kết quả đo tỷ lệ suy hao truyền sóng và mô
hình chúng tôi đề xuất trong đƣờng hầm mỏ có kích thƣớc (0w, 0h) 36 35.7 33 33.5
chiều rộng w=6 mét, chiều cao h=3 mét cho máy phát và máy 2.45GHz (0.25w, 0h) 17 17.1 16 16.5
thu có tọa độ lần lƣợt là (0w, 0h, z0) và (0w, 0h, z), lần lƣợt (0.25w, 0.25h) 8.4 8.2
423
423
Hội Thảo Quốc
Hội Thảo Gia Gia
Quốc 2015 về Điện
2015 Tử,Tử,
về Điện Truyền Thông
Truyền ThôngvàvàCông
CôngNghệ ThôngTin
Nghệ Thông Tin(ECIT
(ECIT2015)
2015)
Điểm kỳ dị chính là điểm kết thúc vùng gần và bắt đầu vùng
xa, nghĩa là để xác định đƣợc điểm kỳ dị cần xem xét điều
kiện cân bằng giữa phƣơng trình (1) và phƣơng trình (3):
PLFS(dB) = PLRec(dB) (8)
Bảng 1 và bảng 2 là kết quả tính toán và đo đạc điểm kỳ dị
trong một số trƣờng hợp khác nhau. Điểm kỳ dị mà chúng tôi
đo đƣợc trong các trƣờng hợp gần nhƣ trùng với điểm kỳ dị
tính toán theo mô hình đề xuất. Kết quả trong hai bảng số liệu
trên cho thấy điểm kỳ dị phụ thuộc mạnh vào tần số thông tin,
vị trí antenna thu phát trong đƣờng hầm và kích thƣớc đƣờng
hầm mỏ, trong khi sự phân cực của antenna có ảnh hƣởng ít
đến vị trí của điểm kỳ dị.
V. KẾT LUẬN
Mô hình dự báo suy hao truyền sóng hai vùng trong đƣờng
hầm mỏ than chữ nhật phân biệt nhau bởi điểm kỳ dị đƣợc đề
xuất và đƣợc kiểm nghiệm bởi đo kiểm thực tế với tần số
2.45GHz. Mô hình đƣợc sử dụng để đánh giá mức độ ảnh
hƣởng của tần số thông tin, vị trí antenna trong đƣờng hầm,
kích thƣớc mặt cắt của đƣờng hầm chữ nhật và phân cực của
antenna đến suy hao truyền sóng và điểm kỳ dị. Ở tần số cao
hơn, kích thƣớc mặt cắt của đƣờng hầm lớn hơn và vị trí
antenna đặt cách xa so với thành hầm hơn thì điểm kỳ dị có
khoảng cách lớn hơn giữa antenna phát và antenna thu.
[1] H. H. Xia, H. L. Bertoni, “Radio Propagation Characteristics for Line-
of-sight Microcellular and Personal Communications”, IEEE
transactions on Antennanas and Propagation, Vol.41, No.10, October
1993.
[2] Y. P. Zhang, “Novel Model for Propagation Loss Prediction in
Tunnels”, IEEE Transactions On Vehicular Technology, Vol.52, No.5,
September 2003.
[3] A. Hrovat, G. Kandus and T. Javornik, “Path Loss Analyes in Tunnels
and Underground Corridors”, International Journal of communications,
Issue 3, Volume 6, 2012.
[4] J. Li, B. Whisner, and J. A. Waynert, “Measurements of Medium-
Frequency Propagation Characteristics of a Transmission Line in an
Underground Coal Mine”, IEEE Transactions on Industry Applications,
Vol.49, No.5, Septemnber/October 2013.
[5] C. Briso-Rodríguez, J. M. Cruz, and J. I. Alonso, member IEEE,
“Measurements and modeling of distributed antennana systems in
railway tunnels”, IEEE Transactions on Vehicular Technology, Vol.56,
No.5, Septemnber 2007.
[6] A. G. Emslie, R. L. Lagace and P. F. Strong, "Theory of the propagation
of UHF radio waves in coal mine tunnels", IEEE Trans. Antennanas
Propag., Vol.AP-23, No.2, pp. 192-205, Mar.1975.
[7] Y. P. Zang, Y. Hwang, “Enhancement of Rectangular Tunnel
Waveguide Model”, Asia Pacific Microwave Conferrence, 1997.
[8] S. R. Saunders, “Antennanas and Propagation for Wireless
Communication Systems”, John Wiley and Sons, ltd, Second Edition
2007.
424
424
HộiHội
Thảo Quốc
Thảo GiaGia
Quốc 2015
2015vềvềĐiện
ĐiệnTử,
Tử,Truyền
ThôngTinTin (ECIT
(ECIT 2015)
2015)
Thiết Kế Hệ Thống Giám Sát Dây Chuyền Sản Xuất

Công Nghiệp Thời Gian Thực Sử Dụng Công Nghệ
PLC Tích Hợp Trên Nền Giao Thức IP
Đỗ Trọng Tuấn1†, Phạm Gia Điềm2†, Phạm Hoàng Anh1, Đào Văn Toàn1,
Nguyễn Việt Đức1, Phạm Tiến Đạt1, Lê Bảo Sơn1, Lê Anh Tuấn Dương1
1
Viện Điện tử Viễn thông, Trường Đại học Bách khoa Hà Nội
2
Viện Cơ khí Động lực, Trường Đại học Bách khoa Hà Nội
†
Emails: {tuan.dotrong, diem.phamgia}@hust.edu.vn
Abstract— Trong bài báo này, chúng tôi đề xuất giải pháp thực - Hệ thống phần cứng trên nền công nghệ PLC tích hợp
thi một mô hình hệ thống giám sát dây chuyền sản xuất công với các IC số nhằm cập nhật sản phẩm, hiển thị các số liệu liên
nghiệp EMS (Electronic Monitoring System) theo thời gian thực quan của mỗi dây truyền sản xuất lên bảng điện tử, đồng thời
sử dụng công nghệ PLC (Programable Logic Control) tích hợp cung cấp toàn bộ các số liệu về hệ thống quản lý cơ sở dữ liệu
trên nền giao thức IP. Các kết quả kiểm thử hệ thống lắp đặt và
thông qua qua mạng LAN.
thực nghiệm tại nhà máy cho thấy giải pháp đề xuất là khả thi và
đáp ứng được các yêu cầu kỹ thuật khi hoạt động trong môi - Hệ thống quản lý cơ sở dữ liệu: Giám sát, quản lý
trường thực tế của các dây chuyền sản xuất công nghiệp. toàn bộ hệ thống bằng cơ sở dữ liệu SQL, giao tiếp với hệ
thống phần cứng qua mạng LAN sử dụng giao thức Modbus
Keywords- PLC, hệ thống thời gian thực, giao thức IP TCP/IP [8][9][10].
- Giao diện người dùng trên nền Web: Kết nối tới cơ sở
I. GIỚI THIỆU dữ liệu, cho phép người dùng nhập kế hoạch sản xuất, theo dõi
Trong những năm gần đây, công nghệ PLC [1][2][3] được các số liệu trong thời gian thực và xuất số liệu ra định dạng
áp dụng rất phổ biến trong các hệ thống công nghiệp do tính ổn Excel thuận tiện cho việc theo dõi quản lý theo chu kỳ.
định, đồng bộ, dễ sửa chữa, độ tin cậy cao. PLC thông thường
được sử dụng để giải quyết các bài toán điều khiển tự động.
Trong bài báo này, chúng tôi đề xuất và thực thi một mô hình
hệ thống giám sát dây chuyền sản xuất công nghiệp theo thời
gian thực EMS sử dụng công nghệ PLC tích hợp trên nền giao
Hình 1. Kiến trúc hệ thống EMS
thức IP. Ưu điểm của giải pháp PLC tích hợp trên nền giao
thức IP so với các phương thức truyền thống sử dụng MCU B. Các thành phần chức năng
(Micro Controller Unit) là tốc độ truyền thông cao, các thông Trong phần này, chúng tôi mô tả các thành phần chức năng
số cập nhật tức thời; hoạt động tốt trong môi trường độ ẩm chi tiết trong đã được triển khai thực tế tại nhà máy như thể
nhiệt độ cao, nhiều nhiễu điện từ trường [4][5][6][7]. Hệ thống hiện hình 2. Hệ thống gồm có 4 khối chức năng: khối cập nhật
thiết kế thực hiện các chức năng: theo dõi số lượng sản phẩm số liệu tại mỗi dây chuyền sản xuất, khối hiển thị số liệu, khối
sản xuất được tại các dây chuyền sản xuất trong nhà máy công xử lý phân tán theo cụm, và khối quản lý theo dõi thông tin.
nghiệp, hiển thị trực quan các thông số lên bảng điện tử, đồng
thời lưu và quản lý tất cả thông số thu được trên cơ sở dữ liệu
đặt tại máy chủ theo thời gian thực.
Phần nội dung của bài báo được tổ chức như sau: phần II
trình bày mô hình hệ thống EMS và phân tích các thành phần
chức năng của hệ thống. Phần III đưa ra thiết kế chi tiết dựa
trên kiến trúc mô hình đề xuất. Mô hình thực nghiệm và kết
quả đã triển khai được trình bày trong mục IV. Cuối cùng, kết
luận về giải pháp thiết kế được thể hiện trong phần V.
II. MÔ HÌNH HỆ THỐNG EMS
A. Kiến trúc hệ thống EMS
Mô hình thiết kế kiến trúc hệ thống EMS bao gồm 3 thành
phần chính theo như hình 1:
Hình 2. Các thành phần chức năng của hệ thống
425
ISBN: 978-604-67-0635-9 425

HộiHội
Thảo Quốc
Thảo Gia
Quốc 2015
Gia 2015về
vềĐiện
Điện Tử,
Tử,Truyền
Nghệ Thông
Thông TinTin (ECIT
(ECIT 2015)
2015)
- Khối cập nhật số liệu tại các dây chuyền sản xuất: Tại bộ phận nhập kho, một thiết bị nhập liệu chuyên dụng
khi hoàn thành một sản phẩm (đáp ứng đúng và đủ các tiêu chí cho phép nhập số lượng sản phẩm, thiết bị này cũng không trực
do mỗi nhà máy đưa ra) thì tại mỗi dây chuyền sản xuất hệ tiếp thực hiện xử lý dữ liệu. Bộ xử lý được sử dụng là PLC của
thống sẽ cập nhật thông số lên bảng hiển thị. hãng Siemens [11], là thiết bị duy nhất xử lý số liệu, mỗi bộ xử
- Khối hiển thị các số liệu: sau khi các thông số được lý cho phép quản lý và điều khiển nhiều dây chuyền sản xuất
truyền từ dưới các dây chuyền lên thì sẽ được hiển thị ngay tại cùng lúc. Các bộ xử lý được nối với nhau và nối vào cùng
đầu mỗi dây chuyền sản xuất (Production Line). Đồng thời mạng LAN với máy chủ “Server” thông qua các bộ chia mạng
các số liệu này sẽ được truyền về “cụm xử lý phân tán”. hợp chuẩn công nghiệp.
- Khối xử lý phân tán theo cụm: do một nhà máy có rất
nhiều dây chuyền sản xuất, nên việc chia các dây chuyền về
từng cụm để đảm bảo khả năng đáp ứng và khoanh vùng xử lý
lỗi khi có phát sinh. Trong hệ thống triển khai thực tế tại nhà
máy có 35 dây chuyền sản xuất và được chia thành “5 cụm xử
lý phân tán”
- Khối quản lý theo dõi thông tin: sau khi luồng dữ liệu
được xử lý tại các cụm phân tán thì sẽ được truyền về Server
để tiến hành quản lý theo dõi thông tin tại trung tâm điều hành
hoặc theo dõi từ xa qua giao diện web.
III. THIẾT KẾ CHI TIẾT
A. Hệ thống phần cứng
Hình 4: Các lớp chương trình lập trình cho PLC
Trong phần này sẽ trình bày mô hình thiết kế chi tiết phần
cứng của hệ thống phần cứng và khối PLC. Hệ thống phần Theo Hình 4, PLC điều khiển hệ thống được lập trình để
cứng gồm có bảng điện tử hiển thị, bộ phận ghép nối với dây thực hiện nhiều công việc song song, do đó đáp ứng được việc
chuyền sản xuất, bộ xử lý được thể hiện Hình 3. Bảng điện tử giám sát nhiều dây chuyền cùng lúc, đồng thời cũng điều khiển
có chức năng nhận dữ liệu từ bộ xử lý để hiển thị số liệu, ghép số bảng hiển thị tương ứng và giao tiếp với server qua mạng.
nối với dây chuyền để đếm sản phẩm. Bảng điện tử được thiết Việc điều khiển hiển thị và đếm sản phẩm hay giao tiếp được
kế sử dụng các IC số thực hiện giải mã dữ liệu, không thực thực hiện song song, cũng có nghĩa là việc cập nhật giá trị qua
hiện chức năng xử lý nào, do đó giảm nguy cơ lỗi do nhiễu tác mạng hay điều khiển hiển thị không làm ảnh hưởng đến quá
động đến linh kiện điện tử. Bộ phận ghép nối được ghép với trình đếm sản phẩm tại dây chuyền.
dây chuyền tại vị trí máy kiểm tra ở cuối dây chuyền, cho phép
B. Phần mềm
đếm khi sản phẩm đạt chất lượng.
Phần mềm của hệ thống gồm có 2 phần chính: phần mềm
điều khiển và phần giao diện người dùng trên nền website,
được đồng bộ với nhau bằng cơ sở dữ liệu SQL được trình bày
như Hình 5.
Hình 5. Sơ đồ kiến trúc phần mềm

- Phần mềm điều khiển (phần mềm Server) có chức
năng giao tiếp với các PLC qua giao thức Modbus TCP/IP.
Cập nhật và kiểm tra các thông số trên PLC ghi vào cơ sở dữ
liệu SQL [12][13][14]. Cũng như kiểm tra các yêu cầu thiết
lập từ Website đã được lưu trong database để đưa lên PLC.
Phần mềm Server thực thi chức năng kết nối phía người giám
sát thông qua website và hệ thống giám sát phần cứng (PLC).
- Phần giao diện người dùng trên nền website có chức
năng nhập/sửa kế hoạch, theo dõi số liệu dây chuyền trong
thời gian thực trên giao diện web, xuất dữ liệu ra dạng file
Excel.
- SQL database được sử dụng để lưu trữ các thông số
sản xuất của mỗi dây chuyền. SQL có khả năng lưu trữ an toàn
và tương thích với phần mềm Server cũng như Website. Có
Hình 3. Sơ đồ kiến trúc phần cứng
426
426
HộiHội Thảo
Thảo QuốcGia
Quốc Gia2015
2015về
vềĐiện
Điện Tử,
Tử,Truyền
Truyền Thông
Thông và
vàCông
CôngNghệ
NghệThông TinTin
Thông (ECIT 2015)
(ECIT 2015)
khả năng chia sẻ khi cần thiết. Mô hình được minh họa theo điểm là có thể dễ dàng để người dùng hiểu được dữ liệu đang
Hình 5. Theo tính toán toàn bộ hệ thống hoạt động sẽ đáp ứng truyền (Bảng 3).
các ràng buộc về thời gian như Bảng 1.
Bảng 3. Định dạng Modbus ASCII [18]
Bảng 1. Chỉ tiêu đáp ứng của hệ thống
Tên Độ dài (byte) Chức năng
STT Chỉ tiêu kỹ thuật Thông số Start 1 Bắt đầu bằng 0x3a
1 Thời gian trễ đáp ứng đối với 1 dây 100 ms Address 2 Địa chỉ node cần tác động
chuyền Function 2 Mã chức năng
2 Thời gian trễ đáp ứng đối với 7 dây 500 ms
Data nx2 Dữ liệu phụ thuộc loại bản tin.
chuyền (tương ứng với 1 PLC)
3 Thời gian trễ đáp ứng đối với 35 dây 2000 ms LRC 2 Checksum
chuyền (tương ứng với 7 PLC) End 2 Kết thúc là 0x0d và 0x0a
4 Khoảng cách truyền thông sử dụng dây 100 m
CAT5
Modbus TCP [9]: Định dạng được thiết kế để sử dụng trên
mạng Ethernet. Dữ liệu truyền được định dạng dưới dạng mã
B.1. Giao thức Modbus hexadecimal (Bảng 4).
Được phát triển từ 1979, Modbus là một giao thức truyền Bảng 4. Định dạng Modbus TCP [9]
thông nối tiếp được phát triển và ứng dụng nhiều trên PLC
Độ dài
[16]. Với lợi thế về sự đơn giản, linh hoạt và độ tin cậy, Tên Chức năng
(Byte)
Modbus hiện nay được xem như là một trong các phương tiện
kết nối phổ biến trên các thiết bị điện tử công nghiệp. Modbus Transaction Đồng bộ bản tin giữa
2
identifier server và client
hoạt động theo cơ chế “Master/Slave”. Mỗi node mạng được
gán một địa chỉ duy nhất. Trong đường truyền nối tiếp và Protocol identifier 2 0 đối với Modbus/TCP
Modbus+, chỉ “node master” có thể ra lệnh. Với mạng Số byte còn lại trên
Length field 2
Ethernet, bất kỳ thiết bị nào cũng có thể gửi lệnh Modbus. Tuy khung
nhiên, thường sẽ có một thiết bị được gán là master. Một lệnh Dữ liệu phụ thuộc loại
Unit identifier 1
Modbus sẽ chứa địa chỉ của node được chỉ định (từ 1 - 247). bản tin.
Chỉ thiết bị ở node đó hoạt động theo lệnh, mặc dù các node Function code 1 Mã chức năng
khác cũng có thể nhận được lệnh. Tất cả các lệnh Modbus chứa Data bytes n Dữ liệu phản hồi/lệnh
thông tin checksum cho phép phía nhận phát hiện lỗi truyền.
Dữ liệu được truyền trên giao thức Modbus tuân theo một định
dạng được chuẩn hóa, bao gồm một đơn vị dữ liệu giao thức
(PDU), gán trên một đơn vị dữ liệu ứng dụng (ADU):
PDU = Mã chức năng (Function code) + dữ liệu
ADU = Địa chỉ + PDU + Mã sửa sai
Tất cả các biến thể Modbus đều sử dụng một trong 3 loại
định dạng bản tin sau:
Modbus RTU [17]: Dữ liệu được truyền đi theo bus nối
tiếp, sử dụng chủ yếu trên các đường truyền 8 bit không đồng
bộ như RS-485 (Bảng 2).
Bảng 2. Định dạng Modbus RTU [17]
Tên Độ dài (bit) Chức năng
Start 28
Address 8 Địa chỉ node cần tác động
Function 8 Mã chức năng
Data nx8 Dữ liệu phụ thuộc loại bản tin
CRC 16 Mã CRC Hình 6. Sự khác biệt giữa định dạng Modbus TCP với Mobbus truyền
End 28 thống [16] [17] [18]
Mã CRC của định dạng Modbus RTU có đa thức sinh là

x16 + x15 + x2 + 1
Modbus ASCII [18]: Dữ liệu được truyền đi theo bus nối
tiếp, sử dụng chủ yếu trên các đường truyền 7 hoặc 8 bit không
đồng bộ. Dữ liệu truyền được định dạng dưới dạng mã
hexadecimal (theo bảng mã ASCII). Modbus ASCII có ưu
427
427
HộiHội
Thảo Quốc
Thảo Gia
Quốc 2015
ĐiệnTử,
Tử,Truyền
NghệThông
ThôngTinTin (ECIT
(ECIT 2015)
2015)
Application
server
PLCs
SQL database
manager
Website
Hình 7. Đóng gói dữ liệu trên mô hình TCP/IP [9]
Hình 9: Sơ đồ tổng quan hệ thống phần mềm

B.3. Phần mềm Server
Phần mềm Server sử dụng giao tiếp với các PLC bằng giao
thức Modbus TCP/IP. Các PLC được đánh địa chỉ nằm trong
dải địa chỉ cho phép của mạng LAN trong nhà máy. Phần mềm
Server nằm trên máy chủ cùng mạng do đó có thể giao tiếp
đồng thời với nhiều PLC với độ chính xác và tốc độ theo chuẩn
Ethernet. Phần mềm hoạt động tốn ít tài nguyên hệ thống của
máy tính, quản lý tài nguyên tốt giúp nó có thể hoạt động lâu
dài trên máy chủ. Phần mềm Server thực hiện các chức năng
hoạt động sau:
Hình 8. Cấu trúc gói tin TCP. ADU đóng vai trò là phần dữ liệu của  Gửi các thông báo trạng thái Run hay Stop cho từng dây
gói tin này [9] chuyền dựa trên thời gian sản xuất được thiết lập trước.
Định dạng gói tin Modbus TCP không chứa phần mã sửa  Gửi các tham số để PLC theo dõi và tính toán ứng với từng
lỗi (CRC hay checksum). Theo như mô hình TCP/IP (hoặc mô dây chuyền khi bắt đầu một phiên sản xuất mới.
hình OSI), gói tin Modbus TCP thuộc về lớp ứng dụng  Ngược lại trong quá trình sản xuất phần mềm sẽ đọc các
(Application Layer). Phần mã sửa sai của gói tin được chuyển giá trị về sản lượng và một số thông tin phụ khác để đánh
xuống các lớp bên dưới đảm nhiệm. giá tốc độ/năng suất của dây chuyền.
 Tính toán một số thông số sẽ được hiển thị trên website để
B.2. Sơ đồ hoạt động tổng quan hệ thống phần mềm
người giám sát có đánh giá trực quan về tiến độ sản xuất
Toàn bộ phần mềm của hệ thống được mô tả như trong hình của từng dây chuyền.
12. Gồm có các tầng: tầng ứng dụng Server, tầng SQL  Tính năng khác còn cho phép người giám sát (được bảo
database, tầng giao diện người dùng. mật chỉ cho người giám sát) có thể điều khiển thay đổi một
 Tầng ứng dụng Server: số thông số trên thiết bị hiển thị mà PLC điều khiển.
 Thiết lập thông số cho PLC

 Cập nhật giá trị từ PLC trong ca sản xuất
 Cập nhật database
 Tính toán các giá trị theo dõi trực quan…
 Tầng SQL database
 Lưu trữ dữ liệu thiết lập cho từng dây chuyền
 Trung gian giữa website và phần mềm
 Tầng giao diện người dùng
 Nhập các thông số cho dây chuyền
 Hiển thị thông số theo dõi
 Xem và xuất báo cáo
Hình 10. Giao diện chương trình Server
428
428
HộiHội
Giao diện phần mềm Server được thiết kế hoạt động đơn giản hay giám sát nhập trước thông số cho các dây chuyền trước
và giảm thiểu lỗi quy trình vận hành cho nhân viên kỹ thuật nhiều ngày. Ngoài việc nhập liệu trực tiếp từ giao diện
(Hình 10). Mặc định chương trình sẽ được chạy với chế độ tự Website quản lý thì có thể nhập bằng form mẫu cho trước
động (Auto mode), người vận hành chỉ cần bật phần mềm và bằng Excel. Điều này tạo thuận tiện cho người quản lý. Phần
cập nhật dữ liệu thông qua website mà không cần tác động mềm cũng hỗ trợ chức năng xem lại các thông số sản xuất của
thêm đến phần mềm ngoài một số lựa chọn về thời gian cho ca sản xuất trước đã được lưu trữ trong database hoặc xuất kết
các ứng dụng xuất file excel và thời gian khởi động ca làm việc quả giám sát của ngày trước hoặc thời điểm hiện tại ra file
mới nếu muốn thay đổi. Chế độ vận hành thủ công cho phép Excel cũng như khả năng tùy chỉnh một vài thông số trong quá
nhân viên kỹ thuật có thể vận hành từng khâu thiết lập trước ca trình sản xuất.
sản xuất và theo dõi phản hồi trực tiếp trên giao diện phần mềm
để biết được tình trạng hệ thống và có phương án khắc phục. IV. THỰC NGHIỆM VÀ ĐÁNH GIÁ
Sau khi đã tiến hành nghiên cứu và đưa ra mô hình phần
cứng và phần mềm chúng tôi đã tiến hành thực thi toàn bộ hệ
thống trên dây truyền thực. Bộ xử lý được sử dụng là PLC S7-
1200 1214C của hãng Siemens (Hình 13a), với thông số cơ
bản: Bộ xử lý PLC gồm có 14 đầu vào, 10 đầu ra (có thể mở
rộng lên tới 144 đầu vào, 140 đầu ra tùy vào các modun mở
rộng mà hãng Siemens hỗ trợ. Tốc độ thực hiện 40ns/lệnh.
Trong mô hình hệ thống, PLC là thiết bị chịu trách nhiệm xử lý
số liệu phân tán. Mỗi bộ xử lý hiện cho phép quản lý và điều
khiển tối đa 7 dây chuyền cùng lúc.
Hình 11. Giao diện trang nhập liệu

B.4. Phần mềm quản trị và theo dõi thông tin
Phần mềm quản trị và theo dõi thông tin thực hiện trên nền
(a) PLC Siemens S7-1200 [2] (b) Bộ chuyển mạch IP
Website có 2 chức năng chính là nhập liệu và xuất dữ liệu.
Khâu nhập liệu (Hình 11) nhằm thực thi chức năng nhập các Hình 13. PLC Siemens S7-1200 [2]
thông số sản xuất của từng dây chuyền trước mỗi ca sản xuất Các bộ xử lý được nối với nhau và nối vào cùng mạng LAN
cũng như hiệu chỉnh các thông số trong ca sản xuất. Các thông với máy chủ (server) thông qua các bộ chuyển mạch IP đạt
số này bao gồm: thời gian hoạt động của các kíp sản xuất trong chuẩn công nghiệp của hãng Siemens [3] (Hình 13b).
ca, sản lượng yêu cầu từng dây chuyển, số dây chuyền tham gia
vào quá trình sản xuất theo, các thông số về mục tiêu sản
lượng.
Hình 14. Thử nghiệm hệ thống tại phòng thí nghiệm
Hình 12. Giao diện trang theo dõi sản lượng

Khâu xuất dữ liệu (Hình 12) thể hiện chức năng hiển thị thông
số sản xuất được cập nhật từ phần mềm Server và lưu trên
database trong quá trình sản xuất từ các dây chuyền như: sản
lượng hiện thời, tốc độ sản xuất so với dự kiến (tính theo %),
sản lượng trong từng khung giờ và tiến độ làm việc của từng
dây chuyền, thông số này được thể hiện trực quan bằng màu Hình 15. Lắp đặt hệ thống tại nhà máy
sắc (xanh, vàng và đỏ). Phần mềm cho phép người vận hành
429
429
Hệ thống được xây dựng kiểm thử tại phòng thí nghiệm (Hình V. KẾT LUẬN
14) và lắp đặt, thực nghiệm tại nhà máy (Hình 15) có môi PLC là giải pháp công nghệ có ưu điểm dễ tích hợp và hoạt
trường nhiệt độ cao, chịu ảnh hưởng của nhiễu điện từ trường động ổn định trong môi trường công nghiệp. Bài báo trình bày
do các máy biến tần, động cơ trong nhà máy gây ra trong kết quả nghiên cứu triển khai thiết kế hệ thống giám sát thời
khoảng thời gian 6 tháng (2/2015-8/2015). Kết quả hệ thống gian thực dây chuyền sản xuất công nghiệp sử dụng công nghệ
họat động ổn định (không bị mất kết nối trong thời gian chạy PLC tích hợp trên nền giao thức IP. Các kết quả kiểm thử cho
thử nghiệm), tính tự động hóa cao (chỉ cần nhập kế hoạch sản thấy giải pháp đề xuất là khả thi, đáp ứng được các chỉ tiêu kỹ
xuất 1 lần cho 1 tháng và lưu giữ bởi cơ sở dữ liệu trực tuyến), thuật khi hoạt động trong môi trường thực tế của các dây
sai số <0,01% (đếm sai dưới 10sp/100.000sp). chuyền trong nhà máy công nghiệp.
Kịch bản 1: Kiểm thử khả năng kết nối TÀI LIỆU THAM KHẢO
Máy tính Server và các PLC cùng lớp mạng. Có tất cả 7 [1] Rihar, M.; Godena, G., "Automation of specification process for PLC
PLC được sử dụng trong hệ thống, mỗi PLC được gán 1 địa control systems software," in Emerging Technologies and Factory
chỉ cố định trong mạng LAN. Với việc kết nối thành công, Automation, 1999. Proceedings. ETFA '99. 1999 7th IEEE International
Conference on , vol.2, no., pp.1289-1294 vol.2, 1999
phần mềm sẽ tự động thực hiện kết nối với PLC bằng giao doi: 10.1109/ETFA.1999.813137
thức Modbus ngay sau đó. Khoảng cách từ các PLC đến [2] U. Schunemann "Programming PLCs with an object-
Switch mạng trong khoảng từ 15 đến 30m. Khoảng cách từ orientedapproach", Autom. Technol. Practice, no. 2, pp.59 -63 2007
Swtich đến Modem trung tầm là 40m. Khởi động hệ thống, [3] Basile, F.; Chiacchio, P.; Gerbasio, D., "Progress in PLC programming
phần mềm Server sẽ Ping kiểm tra kết nối tới tất cả các PLC, for distributed automation systems control," in Industrial Informatics
(INDIN), 2011 9th IEEE International Conference on , vol., no., pp.621-
kết quả thu thập thời gian hồi đáp cho tín hiệu Ping của 7 PLC 627, 26 -29 July 2011 doi: 10.1109/ INDIN.2011.6034950
RoundTripTime < 5ms. [4] Joon Heo; Choong Seon Hong; Seong Ho Ju; Yong Hun Lim; Bum Suk
Lee; Duck Hwa Hyun, "A Security Mechanism for Automation Control
Kịch bản 2: Kiểm thử khả năng đáp ứng của hệ thống in PLC-based Networks," in Power Line Communications and Its
Mô hình triển khai hệ thống thực được mô tả như trong Applications, 2007. ISPLC '07. IEEE International Symposium on , vol.,
no., pp.466-470, 26-28 March 2007 doi: 10.1109/ISPLC.2007.371169
Hình 16. Hệ thống gồm 7 PLC được ấn định theo dải địa chỉ
[5] Zhang Hao, Tan Keqin, Zhu Shouyun. Field Bus and Industrial Ethernet
từ 192.168.1.31 đến 192.168.1.37. Trong đó, việc đọc ghi tất Application Manual (Volume 1)[M] Shanghai: Science and Technology
cả các PLC được thiếp lập với vòng lặp cố định, trong trường Press, 2002
hệ thống hiện thời đang để vòng lặp 5s cho một phiên đọc và [6] Hang Hao, Peng Daogang, Li Hui, Xia Fei. Embedded Power
ghi tất cả các PLC. Thời gian đáp ứng hệ thống dưới 1s, 4s Generation Equipment Condition Monitoring Based on Industrial
Network[M]. Beijing: China Electric Power Press, 2009
còn lại để dự trữ cho các tác vụ hiển thị giao diện phần mềm
và đề phòng trường hợp cần Ping và tự động kết nối lại tới các [7] IEC/PAS 62409 Ed. 1. 0, Real-time Ethernet for Plant Automation
(EPA), 2015
PLC điện hoặc đứt đường truyền.Việc tạo một chu trình cố [8] Bao Weihua, Zhang Qingjun, Zhang Hao. The Development of
định giúp hệ thống hoạt động ổn định và dễ kiểm soát tác vụ. Instrumentations Based on EPA Specification[J]. China Instrumentation,
(6): 44-48, 2006
[9] Sima Liping, He Guiming, Chen Mingbang. Industrial Control
Communication Based on MODBUS/TCP[J]. Computer Applications,
25(12): 29-31 , 2005
[10] Acromag Inc, Technical Reference – Modbus TCP/IP, Copyright 2005.
[11] Siemens, “User Manual S7 1200”, http://w3.siemens.com/, 2014
[12] K. Kline, SQL in a nutshell, 3rd ed. O'Reilly Media, November 2008.
Hình 16. Mô hình hệ thống triển khai thực tế [13] P. Warden, Big Data Glossary. O'Reilly Media, September 2011.
[14] F. Chang, J. Dean, S. Ghemawat, W. C. Hsieh, D. A. Wallach, M.
Qua quá trình triển khai hệ thống thực tế, thời gian trễ đáp ứng Burrows, T. Chandra, A. Fikes, and R. E. Gruber, "Bigtable: a
từ PC đến PLC nằm trong khoảng 4 đến 200 ms theo như distributed storage system for structured data," in Proceedings of the 7th
Hình 17 (thời gian này hoàn toàn đáp ứng các chỉ tiêu kỹ thuật USENIX Symposium on Operating Systems Design and Implementation
- Volume 7, ser. OSDI '06. Berkeley, CA, USA: USENIX Association,
đã nêu ra trong Bảng 1). 2006, pp. 15-15.
[15] Siemens, “User Manual Switch”, http://w3.siemens.com/, 2014
[16] Moore Industries worldwide, “Using Modubus for Process Control and
Automation”. 2014
[17] Daogang Peng; Hao Zhang; Jiannian Weng; Li, Hui; Fei Xia, "Design
and development of Modbus/RTU master monitoring system based on
embedded PowerPC platform," in Industrial Electronics, 2009. ISIE
2009. IEEE International Symposium on , vol., no., pp.2148-2152, 5-8
July 2009 doi: 10.1109/ISIE.2009.5222605
[18] Morris, T.; Vaughn, R.; Dandass, Y., "A Retrofit Network Intrusion
Detection System for MODBUS RTU and ASCII Industrial Control
Systems," in System Science (HICSS), 2012 45th Hawaii International
Conference on , vol., no., pp.2338-2345, 4-7 Jan. 2012
doi: 10.1109/HICSS.2012.78
[19] FENG Dong-qin, JIN Jian-xiang, and CHU Jian, "Study On Industrial
Hình 17. Kiểm tra trễ đường truyền từ PC đến các PLC Ethernet", Information and Control, vol. 32, no. 3, 2003, pp.219-224
430
430
HộiHội
Mô hình tính toán và Kiến trúc mảng tái cấu hình cấu
trúc thô cho các ứng dụng điều khiển hiệu năng cao
Nguyễn Đức Nam, Trần Quang Vinh, Nguyễn Kiêm Hùng
Khoa Điện tử - Viễn thông, Trường Đại học Công nghệ, Đại học Quốc gia Hà Nội
Email: kiemhung@vnu.edu.vn
Abstract— Trong bài báo này, chúng tôi đề xuất mô hình tính nghiêm trọng của loại cấu trúc này là công suất tiêu thụ,
toán và kiến trúc một mảng tái cấu hình cấu trúc thô CGRA
(Coarse-Grained Reconfigurable Architecture) cho các ứng dụng
trễ lan truyền tín hiệu và diện tích thực thi lớn [1].
điều khiển đòi hỏi hiệu năng tính toán cao. Đây là một mô hình - Kiến trúc thô tập trung vào khả năng xử lý dữ liệu và
tính toán mới nhằm giải quyết các vấn đề liên quan tới thông thiết lập cấu hình theo nhóm bit với các khối chức năng
lượng tính toán lớn trong khi vẫn phải cân bằng các yếu tố: độ
phức tạp, tính mềm dẻo và hiệu năng hoạt động của hệ thống. phức tạp (ví dụ ALU (Arithmetic-logic Unit), bộ nhân,
Mảng CGRA được đề xuất trong bài báo có thể được tích hợp …). Các cấu trúc này thường được thiết kế nhắm tới
như một phần tử tính toán trong các hệ thống SoC (System-on-
chip) có khả năng cấu hình động ứng dụng trong kỹ thuật điều một dải các ứng dụng xác định thay vì bất kỳ một ứng
khiển. Kiến trúc được đề xuất đã được mô hình hóa bằng ngôn dụng nào như cấu trúc tinh. Các cấu trúc thô đạt được
ngữ VHDL nhằm mục đích mô phỏng và kiểm thử trên FPGA.
Một số ứng dụng đã được ánh xạ và chạy trên kiến trúc CGRA sự dung hòa giữa các chỉ tiêu về tính mềm dẻo, hiệu
nhằm kiểm chứng khả năng ứng dụng linh hoạt của kiến trúc năng và công suất tiêu thụ.
được đề xuất cho một dải các ứng dụng điều kiển khác nhau.
Hiện nay trên thế giới đã có nhiều nghiên cứu khác nhau
Keywords- kỹ thuật tái cấu hình, tính toán song song, vi mạch về các kiến trúc mảng tái cấu hình cấu trúc thô CGRA
lập trình, kiến trúc mảng tái cấu hình cấu trúc thô, CGRA
(Coarse-Grained Reconfigurable Architecture). Mỗi nghiên
cứu đưa ra một kiến trúc đặc trưng riêng với các ưu nhược
I. GIỚI THIỆU
điểm khác nhau, hướng tới một số ứng dụng cụ thể. Hai mô
Tư duy sử dụng cấu trúc mảng gồm nhiều phần tử xử lý
hình chính nhóm tác giả tham khảo là REMUS[2][3] và
trong tính toán song song được tiếp cận từ nhiều năm nay.
ADRES[4].
Trong một mảng tính toán như vậy, các phần tử xử lý có thể
có cấu trúc và tính năng rất đa dạng và phong phú. Ở một hệ
thống lớn, các phần tử này có thể là các vi mạch như DSP
(Digital Signal Processor), bộ xử lý, hay thậm chí là các hệ
máy tính. Ở mức vi mạch, các phần tử trong mảng là các khối
xử lý có cấu trúc ở mức thấp hơn (ví dụ: các lõi CPU (Central
Processing Unit) trong GPU (Graphics Processor Unit), các tế
bào logic trong FPGA (Field Programable Gate Array), hay
các tế bào thô trong trong PSoC (Programable System-on-
Chip, …). Ở mức thứ hai, cấu trúc của các phần tử xử lý có
thể tiếp tục được phân chia thành loại cấu trúc tinh (fine-
grained fabrics) và loại cấu trúc thô (coarse-grained fabrics).
Mỗi loại cấu trúc này có những đặc trưng cơ bản riêng như:
- Cấu trúc tinh tập trung vào khả năng xử lý dữ liệu và Hình 1: Kiến trúc ADRES
thiết lập cấu hình ở mức bit (ví dụ LUT (Look-up
Table), cổng logic, …). Loại cấu trúc này có ưu điểm là ADRES (Architecture for Dynamically Reconfigurable
tính mềm dẻo rất cao, nó cho phép có thể thực thi hầu Embedded System) là một kiến trúc hướng tới các ứng dụng
như bất cứ loại mạch số nào. Tuy nhiên nhược điểm nhúng với các hệ thống tích hợp trên một chip đơn SoC
(Sytem-on-Chip). Bộ vi xử lý VLIW (Very Large Instruction
ISBN: 978-604-67-0635-9 431
431
Hội Thảo
Hội Thảo Quốc
Quốc GiaGia 2015
ĐiệnTử,
Tử,Truyền
TruyềnThông
Thông và
vàCông
CôngNghệ
Thông (ECIT 2015)
(ECIT 2015)
Word) là thành phần chính của hệ thống, mảng tái cấu hình Phần còn lại của bài báo được tổ chức như sau: phần II
đóng vai trò là một phần của vi xử lý, giúp gia tốc tính toán. miêu tả cách tiếp cận xây dựng mô hình của CGRA; phần III
Hình 1 minh họa một kiến trúc ADRES gồm một mảng các trình bày một kiến trúc CGRA đang thử nghiệm; phần IV là
khối chức năng FU (Functional Unit) kết hợp với các tệp kết quả kiểm thử trên phần mềm mô phỏng và trên vi mạch
thanh ghi kết nối với nhau thông qua hệ kết nối định tuyến FPGA. Cuối cùng, chúng tôi đưa ra một số kết luận trong phần
(được tạo bởi dây nối, bộ ghép kênh, bus dữ liệu). Việc kết V.
hợp CGRA trực tiếp với bộ vi xử lý làm tăng khả năng làm
II. XÂY DỰNG MÔ HÌNH
việc của hệ thống nhưng lại buộc cấu trúc CGRA phải tương
Trong kỹ thuật điều khiển, các phép toán vector với vòng
thích với một kiến trúc vi xử lý cố định, không được linh hoạt
lặp không có rẽ nhánh được thực hiện phổ biến (ví dụ: phép
so với cách thực hiện dưới dạng IP core như cách thực hiện
nhân ma trận, phép nhân chập, tính trung bình, …). Những
của kiến trúc REMUS trình bày ở dưới đây.
phép toán này thường chiếm phần lớn tài nguyên tính toán của
hệ thống. Do đặc trưng của các vi xử lý truyền thống, các phép
toán mà ALU hỗ trợ thường chỉ hỗ trợ phép toán với hai số
hạng, nên cách thực hiện đơn giản nhất là sử dụng các vòng
lặp FOR lồng vào nhau. Khi đó để hoàn thành một phép toán
vector thường phải mất rất nhiều xung nhịp hệ thống. Xét một
số đoạn giả mã C thực hiện các phép toán đơn giản sau:
(1) Phép nhân vô hướng
For (i=0; i++; i<=N)
{dot_produc= dot_produc +x(i) * y(i)}
(2) Phép tính tích chập
For (i=0; i++; i<=N)
Hình 2: Kiến trúc RSoC của bộ xử lý REMUS { Output(i) = 0;
For (j=0;j++;j<L)
REMUS (REconfigurable MUltimedia System) là một { Output(i) = Output(i)+x(i+j)*h(j) }
kiến trúc CGRA hướng tới các ứng dụng xử lý đa phương tiện Dễ nhận thấy rằng, với một cấu trúc vi xử lý truyền
và xử lý tín hiệu băng gốc trong truyền thông. Kiến trúc này thống, để thực hiện các vòng lặp đơn giản trên, hệ thống phải
kết nối trong một hệ thống SoC như mô tả Hình 2. Hệ thống thực hiện lặp lại nhiều lần việc kiểm tra điều kiện khi nào
gồm hai RPU được sử dụng kết hợp với một lõi vi xử lý ARM, vòng lặp kết thúc. Như vậy một phần lớn thời gian tính toán
cùng với các module khác. Các phần tử trong hệ thống liên kết phải dùng cho việc kiểm tra điều kiện dừng của vòng lặp. Hơn
với nhau qua bus AHB. Ngoài bus AHB, các RPU còn có thể thế trong mô hình tính toán phân chia thành nhiều giai đoạn
giao tiếp qua hệ thống chia sẻ dữ liệu dành riêng, cũng như lệnh, vi xử lý cũng cần thực hiện lặp đi lặp lại việc nạp và giải
qua giao diện với bộ nhớ ngoài EMI (External Memory mã cùng một mã lệnh trong tính toán của thân vòng lặp. Điều
này dẫn đến hiệu quả thực thi của các vòng lặp trên vi xử lý là
Interface). Khối PU là một mảng gồm tám vi xử lý RISC có
rất thấp.
nhiệm vụ giám sát hoạt động của RPU, đồng thời cũng có thể
Với mô hình thực thi tuần tự của các vi xử lý, thiết kế hệ
hỗ trợ xử lý trong những trường hợp các phép toán không phù
thống tính toán thường sẽ tương đối đơn giản vì vi xử lý có thể
hợp với thiết kế của RPU.
chia sẻ giữa nhiều nhiệm vụ tính toán khác nhau. Tuy nhiên,
Việc thiết kế CGRA dưới dạng IP-core như REMUS tạo
khi tốc độ tính toán yêu cầu phải tăng cao, lúc này hệ thống
thuận tiện cho việc sử dụng lại thiết kế trong các hệ thống
tính toán cần phải thực hiện theo phương án song song để tăng
khác nhau, không bị phụ thuộc nhiều vào kiến trúc vi xử lý.
thông lượng tính toán (trong khi có thể vẫn giữ nguyên tốc độ
Mô hình CGRA nhóm tác giả lựa chọn dựa trên hướng phát
xung nhịp đồng hồ, vì thực tế việc tăng tốc độ xung nhịp chỉ
triển này.
có thể đạt một tới một giới hạn nhất định do giới hạn bởi công
Bài báo này đề xuất một số cải tiến về mô hình tính toán
nghệ chế tạo vi mạch hiện nay).
và kiến trúc cho mảng tái cấu hình cấu trúc thô [2] nhắm tới
Việc thực hiện song song nhiều phép toán cùng lúc có
các ứng dụng điều khiển hiệu năng cao mà nhóm tác giả đang
nhiều cách tiếp cận khác nhau. Trong bài báo này, với mục
xây dựng và phát triển tại Trường Đại học Công nghệ, Đại học
tiêu cân bằng giữa tài nguyên, tính mềm dẻo, tốc độ tính toán,
Quốc gia Hà Nội.
432
432
HộiHội
phương án được lựa chọn để thực hiện tính toán song song là RCA là một mảng hai chiều của các phần tử xử lý PE.
kiến trúc mảng tái cấu hình cấu trúc thô. Điểm phân biệt chính Để thuận tiện cho việc mở rộng thiết kế, các PE sẽ được sắp
giữa các mảng tái cấu hình kiến trúc thô CGRA là: xếp thành các hàng (RCA_row). Các phần tử cơ bản của RCA
- Cách đưa luồng dữ liệu đầu vào, được mô tả như Hình 3.
- Các toán tử được hỗ trợ bởi mỗi phần tử Trong quá trình hoạt động của RCA, việc cấu hình của
- Cách thực thi luồng dữ liệu giữa các phần tử. RCA có thể thực hiện lại thường xuyên. Khi đó, thời gian cấu
Theo đó, các toán tử sẽ được thực hiện bởi các phần tử hình cho một mảng RCA chiếm một tỷ trọng không nhỏ trong
xử lý PE (Processing Element). Một phần tử PE có thể thực toàn bộ thời gian hoạt động. Để giải quyết vấn đề này, tệp
hiện chức năng của nhiều toán tử khác nhau tùy thuộc theo thanh ghi cấu hình RCA_REG_FILE được sử dụng. Trong quá
thông tin cấu hình. Tổ chức của mảng CGRA được thực hiện trình ghi thông tin vào tệp thanh ghi này (quá trình cấu hình),
bằng cách sắp xếp các PE theo các hàng nối tiếp nhau. Việc RCA vẫn có thể thực hiện chức năng tính toán của cấu hình
định tuyến dữ liệu vào các toán tử sẽ được điều khiển bởi các cũ. Nói cách khác, quá trình cấu hình có thể thực thi song song
bộ định tuyến (router). Các bộ định tuyến này có nhiệm vụ lựa với quá trình thực thi tính toán, xử lý số liệu. Chỉ khi nào quá
chọn đầu vào cho các toán tử. trình ghi vào tệp thanh ghi kết thúc, lúc đó mới thực hiện nạp
toàn bộ cấu hình mới vào các thanh ghi cấu hình có sẵn trong
III. KIẾN TRÚC MẢNG CGRA
mỗi PE.
Trên cơ sở tiếp cận phương án thiết kế CGRA trình bày ở
Một phần tử PE bao gồm bốn thành phần chính:
mục II, chúng tôi xây dựng kiến trúc tổng thể của một mảng
- Router: làm nhiệm vụ định tuyến đầu vào dữ liệu
tái cấu hình kiến trúc thô CGRA như chỉ ra trong Hình 3 cơ
cho DATAPATH;
bản bao gồm hai phần:
- DATAPATH: thực hiện chức năng tính toán dữ liệu
- Phần lõi tính toán RCA (Reconfigurable Cell
dựa trên đầu vào được lựa chọn bởi bộ định tuyến
Array): làm nhiệm vụ xử lý các phép toán theo một cấu
Router;
hình đã định trước.
- ACC: thực hiện một trong hai chức năng: đệm dữ
- Phần điều khiển chung CGRA_CTRL: thực hiện các
liệu đầu ra cho PE, cộng tích tích lũy dữ liệu đầu ra
nhiệm vụ cơ bản sau:
của DATAPATH;
o Cung cấp giao diện làm việc của CGRA: bao gồm
- CONF_REG: lưu thông tin cấu hình của PE
các tín hiệu đồng bộ, điều khiển (CLK, Reset_n,
Pre_Row
…), các đầu vào/ra dữ liệu; DATA_A DATA_B DATA
o Lưu trữ tệp tin cấu hình thường dùng trong vùng
nhớ Context_CONF_MEM; Router
o Điều khiển quá trình ghi/đọc dữ liệu (bao gồm dữ
liệu cấu hình, số liệu cần xử lý, các lệnh điều
CONF_REG
khiển, …) với giao diện bên ngoài; CONF_DATA DATAPATH

o Điều khiển giao tiếp với RCA để thực hiện quá
trình tính toán, xử lý số liệu.
CGRA ACC
CGRA_CTRL
FIFO_A
CACHE
FIFO_B DATA_O
FIFO_O RCA Hình 4: Cấu trúc một phần tử PE
RCA_row_#0 Một trong những tính năng quan trọng của CGRA là phải
RCA_row_#1
có khả năng tái cấu hình trong quá trình hoạt động. Quá trình
RCA_REG_FILE
FSM RCA_row_#2
tái cấu hình này có thể chiếm một phần lớn thời gian trong quá
RCA_row_#3
RCA_row_#4 trình làm việc của CGRA. Trong khi đó, số phép toán trong
CONTEXT_CONF_ RCA_row_#5 một ứng dụng thường không quá nhiều. Để giảm thiểu thời
MEM RCA_row_#6
gian cho việc cấu hình lại hệ thống, bộ nhớ cấu hình ngữ cảnh
RCA_row_#7
CONTEXT_CONF_MEM sẽ lưu sẵn được tối đa 128 cấu hình
Hình 3: Cấu trúc của một CGRA khác nhau thường lặp lại trong quá trình tính toán. Các cấu
433
433
HộiHội
Thảo Quốc
Thảo Gia
Quốc 2015
Gia 2015về
vềĐiện
Điện Tử,
Tử,Truyền
Nghệ Thông
Thông TinTin (ECIT
(ECIT 2015)
2015)
hình này sẽ được lưu theo từng khối nhớ quy định sẵn. Việc Set-Point Kp Ki
phân biệt, ghi đọc cấu hình được phân biệt qua ID đánh dấu
thứ tự của cấu hình trong bộ nhớ. Khi có lệnh điều khiển từ
bên ngoài, CGRA_CTRL chỉ cần nạp dữ liệu sẵn có này sang
tệp thanh ghi cấu hình RCA_REG_FILE của RCA.
SUB
IV. MÔ PHỎNG ĐÁNH GIÁ HIỆU NĂNG

Để đánh giá khả năng tái cấu hình của CGRA, chúng tôi MUL
MUL
ACC
đã thực hiện mô phỏng hoạt động CGRA có kích thước mảng

RCA là 44 với các cấu hình thực thi phép toán khác nhau SUB
như phép toán tính tích vô hướng (Hình 5), tính tổng trong cửa
RCA 4x4
sổ trượt (Hình 6), vòng điều khiển PI (Hình 7), bộ lọc FIR
(Hình 8),... Đây là những phép toán cơ bản thường gặp trong Đầu ra
Hình 7: Cấu hình vòng điều khiển PI

kỹ thuật điều khiển. Trên cơ sở cấu hình thực thi như trên, các
phép toán này có thể tùy biến thành các phép toán có cấu trúc
tương đương khác (như tính trung bình, tính công suất, nội suy x[6]
InputFIFO
x[5]
đa thức, …) x[4]
x[3]
x[2]
x[1]
x1 y1 x2 y2 x3 y3 x4 y4 x[0]
x x x x Mức 1
h[3]

+ + Mức 2 h[2]
MAC
h[1]
+ Mức 3
MAC
<X, Y> h[0]

Hình 5: Mô hình thực thi phép tính tích vô hướng MAC
Constant_REG
Đầu vào
z[n]
Hình 8: DFG thực hiện một bộ lọc FIR bậc 4

ACC D D
Chúng tôi đã mô hình hóa kiến trúc CGRA được đề xuất
bằng ngôn ngữ VHDL để mô phỏng đánh giá và tiến hành
D D D kiểm thử. Mô hình kiểm thử CGRA trên nền tảng vi mạch
FPGA được thực hiện như
Hình 9.
ACC D D D
ALTERA FPGA SoC
uP NIOS EXT.MEM
SUB D D
ALTERA AVALON BUS
RCA 4x4 CGRA_WRAPPER ETHERNET PERIPHERAL

CGRA CONTROLLER INTERFACE
Đầu ra CGRA_CTRL
Hình 6: Mô hình thực thi phép tính tổng trong cửa sổ trượt
RCA
PC Sensors
Motor driver
...
Hình 9: Mô hình kiểm thử trên kit FPGA
434
434
Để đánh giá hiệu năng hoạt động của CGRA, chúng tôi bằng cách sử dụng vòng lặp “FOR” truyền thống so với việc
thực hiện việc so sánh số lượng xung nhịp cần thực hiện cho xử lý từng khối dữ liệu lớn trên CGRA. Khi đó, yêu cầu
các phép toán thường gặp trong kỹ thuật điều khiển: phép toán CGRA phải đáp ứng được yêu cầu tái cấu hình trong lúc hệ
tính tổng, phép toán tính tích vô hướng và phép tính tích chập thống đang chạy.
Tín hiệu đầu vào có Tín hiệu đầu sau bộ Tín hiệu đầu vào trước lọc Tín hiệu đầu ra sau lọc đã
nhiễu cộng theo cửa sổ trượt có thành phần tần số cao loại bỏ tần số cao
Hình 10: Kết quả mô phỏng tính tổng theo cửa sổ trượt Hình 11: ết quả mô phỏng bộ lọc FIR bậc 4
với mô hình RTL trên ModelSim với mô hình RTL trên ModelSim
Bảng 1. Kết quả mô phỏng thử nghiệm các vòng lặp trên các nền tảng xử lý khác nhau.
Vòng lặp Kích Lõi NIOS DSP DSP CGRA

thước dữ (Altera) (dùng code C (dùng thư (ModelSim)
liệu thông viện riêng)
thường)
Phép tổng SUM N=1024 29 148 24 117 X 1045
N=2048 58 142 48 181 X 2096
N=4096 116 128 96 301 X 4117
Tích vô hướng N=1024 64 622 30 827 555 2096
N=2048 128 864 61 827 1 067 4117
N=4096 257 344 122 987 2 083 8213
FIR (8 tap) N=1024 407 765 X 7 216 1043
N=2048 816 384 X 14 384 2067
N=4096 1 641 778 X 29 736 4115
Kết quả đánh giá số chu kỳ thực thi của các vòng lặp trên của việc cân bằng giữa các yếu tố thiết kế hệ thống (sự mềm
các nền tảng tính toán khác nhau (gồm lõi vi xử lý NIOS của dẻo, sự phức tạp của hệ thống và hiệu năng hoạt động của hệ
Altera, bộ xử lý DSP và mảng CGRA) được thống kê trong thống).
Bảng 1. Hình 10 và Hình 11 chỉ ra kết quả mô phỏng tính
V. KẾT LUẬN
tổng theo cửa sổ trượt và kết quả mô phỏng của bộ lọc FIR
Trong bài báo này chúng tôi trình bày mô hình và kiến
bậc 4 với mô hình RTL của mảng CGRA trên phần mềm mô
trúc của một mảng phần cứng có thể tái cấu hình lõi thô cho
phỏng ModelSim.
các ứng dụng điều khiển hiệu năng cao. Chúng tôi cũng chỉ ra
Kết quả mô phỏng CGRA trên ModelSim cho thấy tốc độ
mô hình hoạt động của hệ thống thông qua việc ánh xạ một số
thực hiện tương đương với DSP, ở một số kết quả thực hiện có
ví dụ cụ thể lên kiến trúc mảng nhằm mục đích kiểm chứng
thể tốt hơn. Tốc độ tính toán của CGRA được cải thiện do
đánh giá mảng phần cứng được đề xuất. Kết quả mô phỏng chỉ
thực hiện song song quá trình nạp dữ liệu và tính toán cùng
ra rằng, mảng CGRA được đề xuất có thể tái cấu hình rất linh
lúc.
hoạt với khả năng khai thác tốt các cơ chế song song và tính
Trong bài báo này, qua kết quả đánh giá thử nghiệm trên
cục bộ dữ liệu của thuật toán nhằm tăng hiệu năng xử lý và
phần mềm mô phỏng và chạy thử nghiệm trên nền tảng vi
giảm băng thông truy xuất bộ nhớ. Trong tương lai chúng tôi
mạch FPGA, chúng tôi thấy rằng kiến trúc thô CGRA có
sẽ tiếp tục tối ưu hóa kiến trúc được đề xuất, đồng thời tiến
những ưu điểm nhất định đối với các bài toán có yếu tố sử
hành đánh giá kiến trúc với các ứng dụng điều khiển phức tạp
dụng vòng lặp với dữ liệu đầu vào có kích thước lớn. Kỹ thuật
hơn.
tính toán trên CGRA không phải là tối ưu nhất mà là kết quả
435
435
TÀI LIỆU THAM KHẢO Coarse- grained Reconfigurable Computing System”, Journal of
computers, Vol. 8, No. 3, March 2013.
[1] G. Theodoridis, D. Soudris and S. Vassiliadis: “A Survey of Coarse-
Grain Reconfigurable Architectures and Cad Tools Basic Definitions, [4] Frank Bouwens, Mladen Berekovic, Bjorn De Sutter, and Georgi
Gaydadjiev: “Architecture Enhancements for the ADRES Coarse-
Critical Design Issues and Existing Coarse-grain Reconfigurable
Grained Reconfigurable Array” HiPEAC 2008, LNCS 4917, pp. 66–81,
Systems”, Springer 2008, p89-149.
2008..
[2] Hung K. NGUYEN, Quang-Vinh TRAN, and Xuan-Tu TRAN: Data
[5] Frank Bouwens, Mladen Berekovic, Andreas Kanstein, and Georgi
Locality Exploitation for Coarse-grained Reconfigurable Architecture in
a Reconfigurable Network-on-Chip, The 2014 International Conference Gaydadjiev: “Architectural Exploration of the ADRES, Coarse-Grained
on Integrated Circuits, Design, and Verification (ICDV 2014), Hanoi 14- Reconfigurable Array”, ARC 2007, LNCS 4419, pp. 1–13, 2007
15/2014.3 [6] Andy Lambrechts, Praveen Raghavan, Murali Jayapala, Francky
[3] Kiem-Hung Nguyen, Peng Cao and Xue-Xiang Wang: “An Efficient Catthoor, and Diederik Verkest: “Energy-Aware Interconnect
Optimization for a Coarse Grained Reconfigurable Processor”, 21st
Implementation of H.264/AVC Integer Motion Estimation Algorithm on
International Conference on VLSI Design, 2008, Hyderabad, India.
436
436
Mô Hình Nghiên Cứu Thực Nghiệm Về Truyền Dữ

Liệu Thời Gian Thực Sử Dụng Ánh Sáng Đèn LED
Đỗ Trọng Tuấn1†, Hà Duyên Trung1†, La Văn Thiện1, Phan Van Huy1, Lương Tuấn Hải2
1
Viện Điện tử Viễn thông, Trường Đại học Bách khoa Hà Nội
2
Cục Thông tin liên lạc, Tổng cục Hậu cần kỹ thuật, Bộ Công an
†
Emails: {tuan.dotrong, trung.haduyen}@hust.edu.vn
Abstract— Trong bài báo này, chúng tôi đề xuất và thực thi một thông bằng ánh sáng nhìn thấy lần đầu tiên được đề xuất bởi
mô hình thực nghiệm truyền thông dữ liệu song công qua kênh Toshihiki Komine, Nhật Bản vào năm 2004 [1], sau khi ông có
truyền ánh sáng trắng giữa hai thiết bị đầu cuối như một nghiên cứu cơ bản về các đặc tính của đèn LED trong
PC/Embedded Computer, smartphone/tablet. Các thiết bị này chiếu sáng [2]. Và từ đó đến nay, công nghệ VLC được các
được kết nối với các Front-End qua cổng Universal Serial Bus
nhóm nghiên cứu trên thế giới tiếp tục phát triển mạnh mẽ như
(USB) 2.0 và một bộ chuyển đổi từ chuẩn USB sang RS232. Ở
phân lớp ứng dụng, chúng tôi phát triển một phần mềm được cài hiệp hội truyền thông bằng ánh sáng nhìn thấy tại Nhật Bản
trên thiết bị đầu cuối cho phép cấu hình các tham số và truyền (Visible Light Communications Consortium – VLCC) [3],
các dữ liệu (gồm chuỗi văn bản, ảnh) tới front-end. Ngoài ra, nhóm dự án OMEGA châu Âu [4], diễn đàn nghiên cứu thế
chúng tôi sẽ trình bày kiến trúc hệ thống truyền thông bằng ánh giới vô tuyến (the Wireless World Research Forum - WWRF)
sáng nhìn thấy (VLC-Visible Light Communications), nguyên [5] và rất nhiều nhóm nghiên cứu khác trên toàn thế giới. IEEE
mẫu thiết kế một testbed VLC song công sử dụng môi trường đã đưa ra chuẩn 802.15 dành cho một thế hệ mạng không dây
trong nhà. Các kết quả thực nghiệm đã đánh giá độ trễ truyền mới trong đó có VLC [6]. Có thể khái quát một số định hướng
thời gian thực phụ thuộc vào tốc độ và kích thước dữ liệu. Ngoài nghiên cứu chính của các nhóm VLC trên toàn thế giới như cải
ra, khoảng cách truyền dẫn sẽ được tăng lên nếu mô hình chuyển
thiện tốc độ và khoảng cách truyền dữ liệu [7-8], nghiên cứu về
tiếp đa chặng VLC được áp dụng.
các đặc tính kênh truyền [9-10], nghiên cứu các phương pháp
Keywords- Kênh truyền ánh sáng, truyền thông thời gian thực, điều chế [11] và một số định hướng nghiên cứu khác.
mô hình thực nghiệm. Trong bài báo này, chúng tôi trình bày về kiến trúc hệ thống
truyền dữ liệu (chuỗi văn bản, hình ảnh) thời gian thực bằng
I. GIỚI THIỆU ánh sáng đèn LED trắng. Một nguyên mẫu đã được thiết kế
Trong những năm trở lại đây, công nghệ truyền thông bằng testbed VLC song công để truyền dữ liệu môi trường trong nhà.
ánh sáng nhìn thấy (Visible Light Communications – VLC) Các kết quả thực nghiệm về tốc độ, kích thước dữ liệu và
ngày càng được các nhà khoa học quan tâm và nghiên cứu. Ý khoảng cách truyền dẫn dữ liệu thời gian thực qua kênh truyền
tưởng sử dụng Diode phát quang (Light Emitting Diode – ánh sáng trắng
LED) cho cả triển khai hạ tầng chiếu sáng và truyền tin xuất Phần còn lại của bài báo được tổ chức như sau: phần II
phát từ rất nhiều yếu tố thực tiễn. Hiện nay, LED được kỳ vọng trình bày mô hình hệ thống VLC bao gồm kiến trúc hệ thống,
sẽ thay thế các nguồn chiếu sáng truyền thống như đèn sợi đốt kênh truyền lý thuyết và mô hình thực nghiệm hệ thống VLC
và đèn huỳnh quang bởi chúng có rất nhiều điểm ưu việt như: môi trường trong nhà. Phần III đưa ra thiết kế chi tiết dựa trên
công suất tiêu thụ thấp, bền, tính thẩm mỹ cao và linh hoạt mô hình thực nghiệm trong thực tế và kết quả đạt được của mô
trong quá trình triển khai hạ tầng chiếu sáng… Do vậy, LED hình đã triển khai. Cuối cùng, chúng tôi kết luận bài báo trong
hứa hẹn sẽ là thiết bị chiếu sáng thế hệ mới trong tương lai, phần IV.
thay thế hoàn toàn các đèn sợi đốt và huỳnh quang. Bên cạnh II. MÔ HÌNH HỆ THỐNG VLC
đó, công nghệ sử dụng sóng tần số vô tuyến (Radio Frequency
- RF) đang bộc lộ rất nhiều nhược điểm như cạn kiệt tài nguyên
A. Kiến trúc hệ thống VLC
vô tuyến, băng thông hẹp và ảnh hưởng tới sức khỏe con
người, máy móc thôi thúc chúng ta đi tìm công nghệ mới giải Mô hình thiết kế kiến trúc hệ thống VLC song công được
quyết các vấn đề trên. Ngoài ra, LED là thiết bị bán dẫn có khả biểu diễn trên Hình 1. Hệ thống bao gồm các front-ends được
năng bật tắt ở tốc độ siêu cao. Bằng cách sử dụng ánh sáng kết nối với thiết bị đầu cuối để nhận dữ liệu từ lớp trên được
trắng để truyền tin, chúng ta có thể giải quyết được rất nhiều đưa xuống dưới dạng các tín hiệu điện hoặc đưa các tín hiệu
vấn đề còn tồn đọng của công nghệ RF và mở rộng băng thông thích hợp để các đầu cuối xử lý và giải mã tín hiệu. Mỗi front-
được xuống cho các thiết bị đầu cuối. Như vậy, LED không chỉ end cũng được kết nối với một LED và một Photodiode (PD)
được sử dụng như một thiết bị chiếu sáng thông minh mà còn để phát và thu tín hiệu quang. Dữ liệu được truyền nhận giữa
được sử dụng như một thiết bị truyền thông băng siêu rộng. hai đầu cuối qua các front-ends.
Hiện tại có rất nhiều dự án nghiên cứu khoa học trên thế Các đầu cuối cho phép người dùng truyền và nhận dữ liệu ở
giới về VLC đã và đang được triển khai. Công nghệ truyền là các chuỗi văn bản hoặc ảnh. Đầu cuối ở đây có thể là một
ISBN: 978-604-67-0635-9 437
437
HộiHội
Thảo Quốc
Thảo Gia
Quốc 2015
ĐiệnTử,
Tử,Truyền
NghệThông
ThôngTinTin (ECIT
(ECIT 2015)
2015)
PC (Personal Computer), máy tính nhúng hay thậm chí là các n

smart phone. Một phần mềm được cài đặt tại mỗi thiết bị đầu Pr   Pri (3)
cuối truyền, nhận và hiển thị dữ liệu. Phần mềm này có nhiệm i 1
vụ tạo ra các luồng bit nhị phân từ dữ liệu của người dùng và
đưa xuống lớp vật lý thành tín hiệu điện, qua một bộ chuyển
đổi chuẩn USB sang RS232 và đưa vào bộ phát của front-end.
Ở phía ngược lại, phần mềm có nhiệm vụ nhận luồng bit từ bộ
thu và khôi phục dữ liệu để hiển thị cho người dùng. Ngoài ra,
phần mềm này có khả năng tính toán trễ và thông lượng trễ khi
người dùng truyền một đoạn dữ liệu.
Terminal
Model for VLC Full-Duplex Terminal
Circuit
Bits Stream Bits Stream
Channel 1
LED Lens 01010101010 Concentrator PD
Hình 2: Mô hình kênh truyền VLC
VLC Frontend VLC Frontend
Sự phân bố năng lượng điện tại máy thu phụ thuộc vào sự
phân bố độ rọi của nguồn sáng. Độ rọi thể hiện độ sáng trên
PD Concentrator 01010101010 Lens LED một bề mặt được chiếu sáng. Cường độ sáng tại góc  được
Channel 2 tính theo (4) dựa trên định luật Lambert’s Cosine [12]
Hình 1. Kiến trúc hệ thống VLC
I    I  0  cos m   (4)
Front-end là phần cứng bao gồm một bộ phát và một bộ Trên thực tế, phần lớn các LED thương mại được sản xuất
thu. Bộ phát nhận tín hiệu điện dạng xung theo dữ liệu truyền theo định luật Lambert’s Cosine. Cường độ sáng giảm khi góc
đi, chuyển đổi sang tín hiệu điện phù hợp để điều khiển cường tới  tăng. Trong đó I(0) là cường độ sáng trung tâm của LED,
độ sáng của LED thay đổi theo tín hiệu đầu vào. Bộ thu nhận  là góc bức xạ và m là bậc của sự phát thải Lumberton.
tín hiệu quang và chuyển đổi sang tín hiệu xung để đưa vào bộ Độ rọi ngang Ehor tại điểm A(x,y) cho bởi [12]
chuyển đổi RS232 sang USB. Ngoài ra, chúng tôi sử dụng I  0  cos m   cos  
LENs cho đèn LED để tập trung ánh sáng vào một góc khối Ehor  (5)
nhỏ hơn nhằm tăng hiệu suất phát quang. Ở phía thu, một bộ Dd2
tập trung quang sử dụng ngay trước PD để giới hạn FOV (Field Trong đó Dd là khoảng cách giữa LED và bề mặt đặt máy thu.
of View) của PD nhằm hạn chế các nguồn ánh sáng không
mong muốn từ bên ngoài. C. Mô hình kênh truyền thực nghiệm
Trong phần này, chúng tôi tiến hành khảo sát kênh truyền ở
B. Kênh truyền VLC hai môi trường khác nhau nhằm đánh giá sự phụ thuộc của chất
Trong phần này, chúng tôi sẽ phân tích về lý thuyết về mô lượng hệ thống VLC vào môi trường thí nghiệm. Từ đó, có thể
hình kênh LOS trong nhà (Hình 2). Các thông số như suy hao rút ra kết luận về ưu nhược điểm của các môi trường kênh
đường và công suất quang nhận được rút ra dựa vào các thông truyền để điều chỉnh thiết kế hợp lý. Hình 3 và Hình 4 thể hiện
số đo sáng. Đây là đại lượng quan trọng cho việc lựa chọn đặc hai môi trường thí nghiệm thực tế.
tính của các đèn LEDs thích hợp được sử dụng trong thử
nghiệm thực tế sau này.
Mối liên hệ giữa công suất thu và công suất phát cho kênh
truyền VLC được biểu thị qua công thức sau:
Pr  Pt LL (1)
Trong đó: LL hệ số suy hao trên đường truyền, được xác định
bởi [1]
(m  1) Ar
LL  cos cos m  (2)
2 D 2
Trong đó Ar là diện tích vật lý bề mặt photodiode, D là khoảng Hình 3. LED và PD đặt trong mặt phẳng nằm ngang
cách thu phát,  là góc bức xạ tại máy phát,  là góc tới phía Hình 3 cho thấy LED và PD được đặt trên cùng một mặt
phẳng. Với môi trường này, chúng ta phải che chắn để tạo ra
thu, m là bậc của LED Lumberton, 1/ 2 là bán góc tại nửa công một điều kiện thí nghiệm lý tưởng. Vì vậy, chúng có một số
suất phát, và nó xác định chiều rộng của chùm tia sáng của nhược điểm như: (1) hệ thống không thể hoạt động nếu PD
LED. hướng ra ngoài cửa sổ và chịu ảnh hưởng của các nguồn ánh
Trong trường hợp có nhiều kênh LOS, công suất nhận được sáng không mong muốn. (2) Mặt phẳng thí nghiệm phải ít bị
bằng tổng các công suất thu của mỗi đường LOS
438
438
phản xạ và rất bằng phẳng để thỏa mãn điều kiện thẳng hàng muốn. Cuối cùng, tín hiệu đầu ra của mô-đun thu chính là xung
thu phát. Chính vì những lý do đó, rất khó để thiết lập thí điện để đưa vào bộ chuyển đổi RS232 sang USB (Hình 10).
nghiệm và nếu có thể sẽ tốn rất nhiều thời gian. TTL Signal
Differential signal
Receiver
Optical Channel
PD Decision 01010101 USB to COM Data
DC 5V-2A
Hình 10. Sơ đồ khối thiết kế phía thu

Sau khi thiết kế, Front-End được chế tạo và đóng gói như
minh họa trên Hình 11 để thuận tiện cho quá trình thí nghiệm
và di chuyển.
Hình 8. LED và PD đặt trong mặt phẳng dọc

Chính vì vậy, mô hình kênh truyền được thay đổi như trên
Hình 8. Trong mô hình này, các nguồn nhiễu từ bên ngoài được
hạn chế đi vào phía thu do: (1) LED và PD được đặt theo trục
đứng, (2) PD được đặt trong một ống PVC với độ sâu 8cm. Với
mô hình kênh truyền này, thí nghiệm có thể được thiết lập
nhanh chóng ở nhiều môi trường. Điều này vô cùng quan trọng
trong việc triển khai và đánh giá các testbed mới thiết kế.
III. THIẾT KẾ CHI TIẾT VÀ KẾT QUẢ ĐẠT ĐƯỢC
Hình 11. Front-end VLC song công
A. Đầu cuối thu phát VLC song công
B. Mô hình thực nghiệm và kết quả đạt được
Trong phần này sẽ trình bày mô hình thiết kế chi tiết của
front-end (đầu cuối thu phát) VLC song công có khả năng
truyền các dữ liệu đa phương tiện như văn bản hoặc hình ảnh. USB to TTL
Converter
0101010101 VLC Front - End
Như đã đề cập ở các mục trước, front-end gồm hai phần: mô-
đun phát và mô-đun thu nên thiết kế sẽ được trình bày lần lượt
theo hai khối như vậy.
Dữ liệu đầu vào của mô-đun phát là các xung tín hiệu điện
0V-3.3V từ bộ chuyển đổi USB sang RS232 (Prolific PL2303) COM PORT #1
biểu diễn luồng bit dữ liệu. Tín hiệu đi vào mô-đun phát được Full-duplex
khuếch đại (OPA211-TI) và tạo thành tín hiệu điều khiển LED PC or Embedded VLCTransfer
Testbed
1W Luxeon bật tắt. Đầu ra mô-đun phát là tín hiệu quang của
Computer
@ASELab
between 2 PC
đèn LED bật tắt theo xung đầu vào (Hình 9).
Transmitter Module
COM PORT #2
Differential signal TTL Signal
Channel
Data USB to COM 01010101 Amplifier LED
TTL to USB
0101010101 VLC Front - End
Converter
DC 5V-2A
Hình 12. Mô hình truyền tin sử dụng một đầu cuối

Hình 9. Sơ đồ khối thiết kế phía phát
Hình 12 chỉ ra mô hình thiết lập thí nghiệm cho testbed đã
Dữ liệu đầu vào của mô-đun thu là tín hiệu quang nhận thiết kế. Hai front-ends khác nhau được kết nối với hai cổng
được từ phía phát. Qua một đổi chuyển quang điện (PD RS232 riêng biệt của cùng một máy tính. Do vậy, có thể xem
Hamamastu S6968), tín hiệu sau đó đi qua một khối so sánh PC này mô hình hóa hai PC ảo riêng biệt. Dữ liệu dạng văn bản
(LM393 - TI) và quyết định để đưa ra dạng tín hiệu điện mong và hình ảnh được truyền trong thời gian thực giữa hai PC này.
439
439
vào file log (Hình 15); (3) Truyền hình ảnh song công với định
dạng khác nhau, độ phân giải và tốc độ bit khác nhau, hiện thị
hình ảnh nhận được, đo độ trễ truyền dẫn và lưu vào file log.
Hình 15. Nội dung của tập tin logPing.txt

Sau đây là các kịch bản thí nghiệm khác nhau đã được thực
hiện để đánh giá khả năng truyền tin của hệ thống testbed
Hình 13. Giao diện phần mềm được cài trên đầu cuối: Text-transfer VLC song công thời gian thực.
mode Kịch bản 1: Đo độ trễ bằng lệnh PING
Gửi lệnh “Ping” tại các tốc độ bit khác nhau. Tại mỗi tốc
độ bit, lặp lại 20 lần và lưu dữ liệu vào một file log theo định
dạng transmit_time; receive_times; transmission_delay.
Kịch bản 2: Truyền gói tin (văn bản, hình ảnh)
Truyền văn bản ở tốc độ bit khác nhau trên cả hai kênh
truyền VLC. Tại mỗi tốc độ bit, lặp lại 10 lần với mỗi kênh
VLC đoạn văn bản “Visible Light Communications” và lưu dữ
liệu vào một file log theo định dạng: transmit_time;
receive_time; transmission_delay.
Truyền hai hình ảnh phổ biến: Foreman có dung lượng
7.7kB; độ phân giải 248×203 pixels, và Lena có dung lượng
31.6kB; độ phân giải 200×200 pixels. Tại mỗi tốc độ bit, thí
nghiệm được lặp lại 10 lần truyền và lưu giữ liệu vào một file
log với định dạng: transmit_time; receive_time;
transmission_delay.
3
Hình 14. Giao diện phần mềm được cài trên đầu cuối: Image-transfer Baud rate=19,2 (kbps)
mode Baud rate=28,8 (kbps)
Mô hình sử dụng một đầu cuối có một số ưu điểm ban đầu 2.5
như: (1) Dễ dàng thiết lập thí nghiệm, (2) dễ dàng lập trình để
tính toán trễ và thông lượng chính xác vì hai máy tính ảo (từ 2
một máy tính thật) sử dụng cùng một đồng hồ vật lý. Tuy
nhiên, chúng ta có thể thiết lập thí nghiệm với mô hình hai đầu
Delay (s)
1.5
cuối một cách đơn giản bằng cách thay đổi giao thức tính trễ
của phần mềm sử dụng cơ chế phản hồi (feedback). Lúc này
chúng ta sẽ vẫn tính toán trên một đồng hồ vật lý của đầu cuối 1
phát dữ liệu và nhận feedback trở về.
Phần mềm được sử dụng trong các thí nghiệm VLC (Các 0.5
Hình 13 và Hình 14) được thiết kế cho thí nghiệm truyền dữ
liệu thời gian thực với những chức năng chính sau đây: (1) đo
0
độ trễ truyền thông qua lệnh “Ping”. Các nhãn thời gian của 0 1 2 3 4 5 6 7
các gói tin “Ping” tại thời điểm bắt đầu phát gói tin ở máy phát Data (kbyte)
và thời điểm nhận được gói tin ở máy thu được ghi lại. Các giá Hình 16. Độ trễ gói tin theo kích thước dữ liệu ở các tốc độ baud rate
trị độ trễ được tính toán dựa trên các nhãn thời gian và lưu vào khác nhau 19,2 kbps và 28,8 kbps, khoảng cách truyền dẫn 80 cm
các file log, với mô hình hai đầu cuối, chúng ta se thay đổi
giao thức bằng cách phía thu gửi một bản tin feedback về máy Thực hiện đo độ trễ của quá trình truyền dữ liệu các gói tin
phát, sau đó máy phát nhận được và ghi lại thời gian nhận truyền với hai tốc độ khác nhau lần lượt là 28,8kbps và
được gói feedback và tín hành tính toán; (2) Truyền văn bản 19,2kbps. Với mỗi tốc độ chúng tôi thực hiện thí nghiệm 7 lần.
song công với tốc độ bit khác nhau, đo độ trễ truyền và lưu Kích thướng gói tin tăng từ 1kbyte đến 7kbyte. Từ đó ta thu
440
440
HộiHội
Thảo Quốc
Thảo Gia
Quốc 2015
ĐiệnTử,
Tử,Truyền
NghệThông
ThôngTinTin (ECIT
(ECIT 2015)
2015)
được đồ thị để so sánh độ trễ gói tin theo kích thước dữ liệu ở chung và VLC nói riêng khi tín hiệu có ích trên đường truyền
2 baud rate trên. Kết quả được thể hiện Hình 16 cho thấy sự bị suy hao và can nhiễu theo khoảng cách.
sai khác về độ trễ truyền tin ở các tốc độ baud rate khác nhau.
Điều này được giải thích là khi tốc độ cao hơn cho ta độ trễ Baud rate 19,2 (kbps)
nhỏ hơn vì bộ thu thực hiện tách dữ liệu nhanh hơn, kênh 3.5
Single-hop
truyền ít bị nhiễu hơn và ngược lại đối với tốc đọ baud rate Two-hop
thấp hơn thì độ trễ sẽ tăng lên. 3
C. Đề xuất mô hình đa chặng song công sử dụng nút chuyển 2.5
tiếp
Trong các công nghệ truyền thống như vô tuyến (RF) hay 2
Delay (s)
cáp sợi quang, mô hình đa chặng được sử dụng rất nhiều để
tăng khoảng cách và chất lượng truyền tin. Đây là một giải 1.5
pháp rất hay vì chúng ta không cần phải thiết kế lại front-end
mà vẫn có thể kéo dài khoảng cách truyền tin. Vì vậy, sử dụng 1
các nút chuyển tiếp nhằm tăng khoảng cách truyền tin trong
công nghệ VLC là xu hướng tất yếu. 0.5
FRONT-END PC/Embedded Device FRONT-END 0

0 1 2 3 4 5 6 7
COM #1 COM #2
Transmitter Transmitter
Data (kbyte)
Hình 18. Độ trễ gói tin theo kích thước dữ liệu cho hệ thống đơn chặng
Receiver RELAY Device Receiver
có khoảng cách truyền dẫn 80 cm và đa chặng (2 chặng) có khoảng cách
truyền dẫn 160 cm, ở cùng tốc độ baud rate 19,2 kbps.
OPTICAL Channel OPTICAL Channel
PC/Embedded Device
FRONT-END VLC RELAY FRONT-END PC/Embedded Device
IV. KẾT LUẬN
Transmitter MODEL Transmitter VLC là giải pháp công nghệ truyền thông hứa hẹn nhiều
triển vọng, giải quyết được nhiều vấn đề về tài nguyên, băng
Source Device Receiver Receiver Dest Device
thông hay tính an toàn của công nghệ RF. VLC có thể trở thành
Hình 17. Mô hình chuyển tiếp đa chặng (2 chặng) song công sử dụng công nghệ truyền tin/chiếu sáng thể hệ mới và sẽ sớm được
nút chuyển tiếp trong VLC ứng dụng vào thực tiễn. Trong bài báo này, chúng tôi đã đưa ra
Hình 17 là thể hiện của mô hình đa chặng sử dụng nút kiến trúc một hệ thống VLC cơ bản, mô hình kênh truyền môi
chuyển tiếp trong VLC. Trong mô hình này, hai đầu cuối là trường trong nhà của VLC nhằm phân tích và đánh giá các tác
“Source Device” và “Dest Device” sẽ không truyền thông trực động môi trường ảnh hưởng đến chất lượng hệ thống. Tiếp
tiếp mà thông qua một nút chuyển tiếp là “RELAY Device”. theo, chúng tôi nghiên cứu và thiết kế front-end nhằm chứng
Dữ liệu từ “Source Device” được đẩy xuống Front-End sau đó minh khả năng truyền tin của ánh sáng trắng, một số kết quả
được thu bởi front-end của “RELAY Device” từ cổng COM thực nghiệm đã đánh giá độ trễ truyền thời gian thực phụ thuộc
#1. “RELAY Device” không trực tiếp chuyển tín hiệu điện môi trường, tốc độ và kích thước dữ liệu. Cuối cùng mô hình
này sang cổng COM #2 mà sẽ giải mã sau đó mới truyền dữ đa chặng song công được đề xuất nhằm làm tăng khoảng cách
liệu xuống cổng COM #2 nhằm giảm thiểu sai sót tối đa. Quá truyền tin.
trình tương tự khi “RELAY Device” truyền dữ liệu sang “Dest
Device”. Dữ liệu từ “Dest Device” được truyền sang “Source
Device” cũng bằng cách như vậy tuy nhiên theo hướng ngược [1] T. Komine, M. Nakagawa, “Fundamental analysis for visible light
communication system using LED lights”, IEEE Trans. on Consumer
lại. Elec. 50 (2004) 100–107.
Thực hiện truyền dữ liệu gói tin trên cùng 1 tốc độ baud [2] T. Komine, Y. Tanaka, S. Haruyama, “Basic study on visible-light
rate 19,2kbps với hai kịch bản khác nhau: đơn chặng (80cm) communication using light emitting diode illumination”, In: Proceedings
và hai chặng (160cm). Truyền dữ liệu đa chặng dựa trên đặc of 8th International Symposium on Microwave and Optical Technology,
tính chuyển tiếp khôi phục dữ liệu và bù công suất phát. 2001, pp. 45–48.Haruyama, S.: Visible light communication. IEEE
Trans. on IEICE J86-A (2003) 1284–1291.
Chúng tôi thực hiện 7 lần truyền gói tin trong mỗi kịch bản
[3] VLCC, “Visible Light Communications Consortium”, Japan 2008.
với kích thước gói tin tăng dần từ 1kbyte đến 7kbyte. Sau đó,
[4] “Home Gigabit Access project”, funded by European Framework 7,
kết quả thu được như trên Hình 18 so sánh độ trễ giữa hai kịch http://www.ict-omega.eu/.
bản truyền dữ liệu đơn chặng và đa chặng khi tốc độ dữ liệu [5] “Wireless World Research Forum.” http://www.wireless-world-
cố định tại 19.2kbps. Nhìn vào đồ thị có sự khác biệt ở độ trễ research.org/.
là do khoảng cách truyền nhận, nhiễu và khoảng thời gian khôi [6] IEEE, “IEEE P802.15 Working Group for Wireless Per-sonal Area
phục , bù công suất gây ra. Networks (WPANs)” 2008.
Nhìn chung. mô hình đa chặng là giải pháp để tăng khoảng [7] J. Vucic, C. Kottke, S. Nerreter, K. Habel, A. Buttner, K. D. Langer and
J. W. Waleski, “125 Mbit/s over 5 m Wireless Distance by Use of OOK-
cách đối với bất cứ hệ thống thông tin vô tuyến/hữu tuyến nói
441
441
HộiHội
Modulated Phosphorescent White LEDs”, Processing of 35th European [12] Z. Ghassemlooy, W. Popoola, S. Rajbhandari. Optical Wireless
Conf. of Opt. Commun. (2009). Communication: System and Channel Modelling with Matlab. 2012,
[8] G. Cossu, A. M. Khalid, “3.4 Gbit/s Visible Optical Wireless CRC Press.
Transmission Based on RGB LED”, Optics Express, Vol. 20, No. 26,
2012, pp. B501-B506.Y. Zheng and M. Zhang, Visible Light
Communications Recent Progresses and Future Outlooks, Proc. of
Photonics and Optoelectronics Conf. (2011) 1-6.
[9] X. Zhang, K. Cui, “Experimental Characterization of Indoor Visible
Light Communcation Channels” 8th IEEE International Symposium on
Communications Systems, 2011.
[10] R. Cheng, X. Yan, “Indoor multi-source channel characteristic for
visible light communication”, The Jounal of China University of Posts
and Telecommunications, 2013.
[11] R. Mesleh, H. Elgala and H. Hass, “Optical Spatial Modulation,”
Journal of Optical Communications and Networking, Vol. 3, No. 3,
2011.
442
442
Hội Thảo Quốc
Hội Thảo GiaGia
2015 Điện
ĐiệnTử,
Tử,Truyền
TruyềnThông
Thôngvà
Tin(ECIT
(ECIT2015)
2015)
Phát hiện và bám đuổi cá bằng phương pháp GMM

kết hợp Frame-Differencing
Nguyễn Đình Minh Nhật, Huỳnh Nhƣ Kiên, Võ Ngọc Phạm Văn Tuấn
Nhân Trung Tâm Xuất Sắc, Trƣờng Đại Học Bách Khoa – Đại
Trung Tâm Xuất Sắc, Trƣờng Đại Học Bách Khoa – Đại Học Đà Nẵng
Học Đà Nẵng Đà Nẵng, Việt Nam
Đà Nẵng, Việt Nam Email: pvtuan@dut.udn.vn
Email: ndmnhat71@gmail.com,
vongocnhan4292@gmail.com,
nhukienhuynh6392@gmail.com
Tóm tắt— Phát hiện và bám đuổi cá (FDT) là một bước quan là bám đuổi Mean shift (MS) [6, 7] và lọc Particle (PF) [8, 9].
trọng trong nghiên cứu hải dương học, đặc biệt là trong việc dự Hai phƣơng pháp này đã chứng minh thích hợp cho việc bám
đoán những thay đổi chất lượng nguồn nước và những biến động đuổi các vật thể có hình dạng thay đổi.
về số lượng cá trong quần thể. Trong bài báo này, thuật toán với
sự kết hợp giữa Mô hình hỗn hợp Gauss và Frame Differencing Trong một vài trƣờng hợp nhất định, một vài trong số bốn
(CGMMFD) được đề xuất. Phương pháp này được mong đợi cho phƣơng pháp này cho ra các hiệu suất phát hiện và bám đuổi cá
kết quả khả quan đối với các tình huống bám đuổi khác nhau. cao. Tuy nhiên, không một phƣơng pháp nào có thể phù hợp
Cũng trong bài báo này, các tiêu chí đánh giá được xây dựng cụ cho tất cả mọi trƣờng hợp đặt ra. Do đó, trong bài báo này,
thể để đánh giá sự hiệu quả của mỗi phương pháp cho từng phƣơng pháp mới CGMMFD đƣợc đề xuất. Phƣơng pháp mới
trường hợp cụ thể. Các kết quả thực nghiệm đã chỉ ra rằng này kết hợp GMM, lọc Kalman và Frame-Differencing. Frame-
phương pháp này cho ra sự chính xác trong bám đuổi lớn hơn Differencing đƣợc sử dụng bởi vì kĩ thuật này có thể phát hiện
khí so với bốn phương pháp khác đó là Trừ nền, Mô hình hỗn vị trí con cá cho những khung hình mà GMM không thể. Đặc
hợp Gauss, Bám đuổi Mean shift và Lọc particle. Trong khí các biệt là trong khoảng từ 10 đến 15 khung hình đầu tiên khi mô
phương pháp có những khó khăn để bám đuổi cá trong một vài hình nền chƣa đƣợc hoàn thành bởi GMM. Đối với vấn đề
trường hợp nhất định thì phương pháp được đề xuất này có thể bóng xuất hiện, GMM sẽ tạo ra nhiều hơn một khối mà có thể
hoạt động tốt cho các tình huống khác nhau. là cá. Trong trƣờng hợp này, khối gần nhất với tọa độ trọng
tâm trƣớc đó của con cá sẽ đƣợc chọn nhƣ là khối thật sự của
Từ khóa—Phát hiện và bám đuổi cá, CGMMFD, Mean Shift,
Lọc particle.
con cá. Nhƣ vậy, tất cả các vấn đề có thể xảy ra trong hệ thống
FDT đã đƣợc khắc phục bởi phƣơng pháp CGMMFD.
I. GIỚI THIỆU Phần còn lại của bài báo đƣợc trình bày nhƣ sau. Trong
Trong những năm gần đây, bám đuổi vật thể đang nhận đƣợc phần II, phƣơng pháp CGMMFD đƣợc giới thiệu. Phần III cho
nhiều sự quan tâm. Đối với ứng dụng Phát hiện và bám đuổi thấy các kết quả thực nghiệm và sự phân tích đánh giá 5
cá, Lọc Alpha-Beta and Lọc Kalman [1] là các kĩ thuật phổ phƣơng pháp dựa trên những kết quả đó. 5 phƣơng pháp đó là
biến đƣợc sử dụng cho bám đuổi vật thể. Phƣơng pháp bám MB, GMM, MS, PF và phƣơng pháp đƣợc đề xuất CGMMFD
đuổi khối đƣợc sử dụng để bám đuổi cá. Do đó, phƣơng pháp trong các ngữ cảnh bám đuổi khác nhau.
này đƣợc sử dụng trong các ứng dụng thống kê số lƣợng cá [2].
Đối với việc phát hiện cá tự động [3], các phƣơng pháp dựa II. SỰ KẾT HỢP GIỮA GMM VÀ FRAME-DIFFERENCING
vào các thuật toán phân loại thuộc tính Haar-like xếp lớp đƣợc Kết quả thực nghiệm cho thấy rằng hai phƣơng pháp là
tạo ra bằng cách sử dụng các ảnh dƣới nƣớc từ thiết bị điều GMM và Ƣớc lƣợng nền trung bình (MB) không thích hợp cho
khiển từ xa dƣới các điều kiện khảo sát đại dƣơng. trƣờng hợp cá đứng yên. Trong khi đó, Bám đuổi Mean shift và
Trong hệ thống FDT này, các vấn đề gây khó khăn nhất là sự Lọc particle tạo ra hiệu quả bám đuổi không cao khi xuất hiện
xuất hiện bóng của cá, là khi cá không di chuyển hay là khi cá bóng của con cá trong video. Do đó, bốn phƣơng pháp này
di chuyển với các vận tốc khác nhau. Để giải quyết các vấn đề không hiệu quả khi áp dụng vào ứng dụng FDT. Từ đó, trong
trên, trong bài báo này, bốn phƣơng pháp bám đuổi mà đƣợc sử nghiên cứu này, sự kết hợp GMM và Frame-Differencing với
dụng rộng rãi trong nhiều ứng dựng bám đuổi thời gian thực Lọc Kalman đƣợc kiểm nghiệm. Phƣơng pháp này cho ra các
đƣợc kiểm thử. Phƣơng pháp đầu tiên là sự kết hợp giữa Trừ kết quả đầy khả quan trong tất cả các trƣờng hợp có thể. Các
nền và bộ lọc Kalman. Trong đó, ảnh nền đƣợc tạo ra bằng chi tiết giải thuật sẽ đƣợc trình bày trong các phần tiếp theo.
phƣơng pháp ƣớc lƣợng nền trung bình (MB). Trong phƣơng A. Thuật toán Frame-Differencing
pháp thứ hai, Mô hình hỗn hợp Gauss (GMM) [3] đƣợc sử
Phát hiện vật thể chuyển động từ một chuỗi các khung hình
dụng để phát hiện cá, sau đó, bộ lọc Kalman [4, 5] sẽ bám đuổi
đƣợc thực hiện rộng rãi bằng thuật toán Frame-Differencing.
cá. Độ chính xác của cả hai phƣơng pháp này phụ thuộc nhiều
Nguyên lý của phƣơng pháp này là phát hiện các vận thể
vào chất lƣợng nền đƣợc tạo ra. Phƣơng pháp thứ ba và thứ tƣ
ISBN: 978-604-67-0635-9 443
443
chuyển động từ sự khác nhau giữa khung hình hiện tại và ( ) ( )
khung hình quy ƣớc. Phƣơng pháp này thiết lập một giá trị ( ) ( ) { (7)
( ) ( )
ngƣỡng sau khi trừ hai khung hình và xem các điểm ảnh nhƣ là
phần của mục tiêu chuyển động miễn là sự khác nhau tại những Hình 2 minh họa nguyên tắc của thuật toán Frame-
điểm ảnh này lớn hơn giá trị ngƣỡng. Trong bài báo này, Differencing. Hình 2a, 2b, 2c lần lƣợt là các khung hình thứ k-
Frame-Differencing có thể phát hiện cá vì máy quay đƣợc đặt 10, k, k+10 với bƣớc nhảy là 10. Các kết quả trừ hai khung
cố định. Phƣơng pháp này gồm có hai bƣớc là phát hiện chuyển hình đƣợc thể hiện trong hình 2d và 2e. Và, kết quả của thuật
động và phát hiện cá. three-frame difference đƣợc thể hiện trong hình 2f.
1) Phát hiện chuyển động Kết quả của thuật toán này rất hứa hẹn. Tuy nhiên, kết quả
phụ thuộc nhiều vào bƣớc nhảy L. Nếu bƣớc nhảy nhỏ (ví dụ
Trong bƣớc phát hiện chuyển động, sự khác nhau giữa
L=5) thì kết quả của phép giao hai ảnh nhị phân Ik-L(x,y) và
khung hình thứ k Fk(x,y) và khung hình thứ k+1 Fk+1(x,y) đƣợc
Ik+L(x,y) không phải là con cá mà là một khối nhỏ cái có thể
tính để cho ra ảnh Dk(x,y):
đƣợc hiểu là nhiễu. Mặt khác, nếu bƣớc nhảy L quá lớn thì rất
( ) | ( ) ( )| (1) có khả năng con cá ở khung hình thứ k-L hoặc k+L trùng vị trí
với nó ở khung hình thứ k. Điều này dẫn tới không phát hiện
Sau đó, giá trị ngƣỡng T đƣợc thiết lập cho ảnh Dk(x,y) để đƣợc con cá nhƣ đƣợc trình bày trong hình 3 (L=30).
tạo ảnh nhị phân Ik(x,y):
( )
( ) ( ) { (2)
( )
a) b) c)
Hình 1. Sự minh họa cho Frame-Differencing

Khi giá trị các điểm ảnh trong ảnh ( ) lớn hơn giá trị d) e) f)
ngƣỡng T thì các điểm ảnh đó đƣợc xem là vật thể. Ngƣợc lại Hình 2. Minh họa Phát hiện cá bằng Frame-Differencing
đƣợc xem là nền. Sau đó, khối có diện tích lớn hơn ngƣỡng S
(S=50 trong bài báo này) đƣợc xem nhƣ là vật thể di chuyển.
Tuy nhiên, quá trình này cũng có thể tạo ra các lỗi trong phát
hiện chuyển động khi con cá đứng yên và đồng thời xuất hiện
nhiễu trong khung hình nhƣ ánh sáng thay đổi, hồ lắc lƣ dẫn
đến nƣớc dao động…Do đó, chỉ khu vực có diện tích lớn hơn
diện tích hình chữ nhật bao quanh khối thu đƣợc từ khung hình
trƣớc 2.25 lần đƣợc xem xét. Vì vậy, sự khởi tạo vị trí ban đầu a) b) c)
của cá là cần thiết.
Mặc dù có độ phức tạp thấp và hiệu quả phát hiện cao
nhƣng phƣơng pháp này vẫn cho thấy một số hạn chế. Các giá
trị ngƣỡng T và S thƣờng đƣợc chọn thủ công tùy theo mỗi
trƣờng hợp thực nghiệm. Nếu giá trị T quá lớn thì có thể không d e f
phát hiện đƣợc chuyển động. Ngƣợc lại, sẽ phát hiện ra nhiều Hình 3. Không phát hiện cá khi L lớn
chuyển động trong khi thực tế chỉ có một (trƣờng hợp nhiễu B. Trường hợp bóng xuất hiện và khởi tạo vị trí ban đầu
xuất hiện).
Nhƣ đƣợc đề cập ở trên, bốn phƣơng pháp bám đuổi là MB,
2) Phát hiện cá GMM, MS và PF cho hiệu quả bám đuổi không cao khi xuất
Trong bƣớc phát hiện cá, thuật toán Three-Frame hiện bóng (khi cá bơi gần mặt nƣớc hay gần thành hồ bằng
Difference [10] đƣợc áp dụng. Bƣớc thứ nhất của thật toán là gƣơng). Sự xuất hiện của bóng dẫn tới sự phát hiện cá sai. Do
trừ ba khung hình khác nhau theo lần lƣợt, với bƣớc nhảy vậy, một kĩ thuật so sánh đơn giản đƣợc đề xuất để khắc phục
khung hình là L, sau đó ta lấy hiệu của hai kết quả tìm đƣợc ở vấn đề này. Cụ thể, trong bƣớc BlobAnalysis, số lƣợng khối tối
trên để phát hiện đƣợc cá. Cụ thể, khung hình thứ k trừ khung đa đƣợc ấn định là 5. Sau đó, tại khung hình đang xét, khối nào
hình thứ k-L cho ra ảnh nhị phân Ik-L(x,y). Tƣơng tự, khung gần nhất với vị trí cá ở khung hình trƣớc đó đƣợc chọn. Trong
hình k+L trừ khung hình k cho ra ảnh nhị phân Ik+L(x,y). Tiếp hầu hết trƣờng hợp, các khối của bóng ở vị trí xa hơn đóm của
theo, ảnh Ik-L(x,y) giao với ảnh Ik+L(x,y) tạo ra ảnh kết quả của cá. Vì vậy, các lỗi do sự xuất hiện của bóng gây ra đƣợc loại
thuật toán. Quy trình của thuật toán đƣợc tóm tắt theo các bỏ. Nguyên lý đơn giản này đƣợc minh họa trong hình 4a:
phƣơng trình dƣới đây:
( ) | ( ) ( )| (3)
( ) | ( ) ( )| (4)
( )
( ) ( ) { (5)
( )
a b
( ) Hình 4. Bounding box and Centroid of Current Frame
( ) ( ) { (6)
( )
444
444
Nhƣ đƣợc minh họa trong hình 4b, khoảng cách d1 (khoảng trọng là Mean Square Error (MSE) và Phƣơng sai (Var) đƣợc
cách từ tọa độ trọng tâm trƣớc đó tới khối của cá) ngắn hơn giới thiệu: cách tính, lý do sử dụng và hai số liệu đƣợc sử dụng
khoảng cách d2 (khoảng cách từ tọa độ trọng tâm trƣớc đó tới để đánh giá sự thực hiện của các thuật toán nhƣ thế nào. Tiếp
khối của bóng). Bằng cách áp dụng phƣơng pháp này, vấn đề theo, trong phần III.B là sự đánh giá năm thuật toán bám đuổi
bóng xuất hiện đƣợc giải quyết một cách hiệu quả. và những kết luận đƣợc rút ra. Loài cá đƣợc sử dụng trong bài
báo này là cá ngựa vằn. Các đoạn phim về cá ngựa vằn đƣợc
Một vấn đề của GMM cần đƣợc giải quyết là tại những quay lại dƣới định dạng avi trong khoảng thời gian 10 giây.
khung hình đầu tiên của video, sự ƣớc tính hình nền chƣa đƣợc Tốc độ quay là 15 khung hình trên giây. Kích thƣớc khung
hoàn thành. Điều này làm cho vị trí của cá không đƣợc phát hình là 640x480. Nƣớc đƣợc sử dụng là nƣớc sinh hoạt đƣợc
hiện đúng. Vấn đề càng nghiêm trọng hơn khi cá không di thêm vào chất ô nhiễm với các nồng độ khác nhau.
chuyển trong những khung hình đầu tiên này. Thuật toán
Frame-Differencing, nhƣ đƣợc trình bày trƣớc, không hiệu quả A. Phương pháp đánh giá
bởi vì không có vị trí của cá trong khung hình trƣớc đó. Do đó, Trong đề tài này, nhóm nghiên cứu đánh giá chất lƣợng của
thật cần thiết để khởi tạo vị trí ban đầu cho cá tại khung hình thuật toán Phát hiện và Bám đuổi cá bằng cách so sánh kết quả
đầu tiên. Trong phƣơng pháp đƣợc đề xuất này, bƣớc khởi tạo bám đuổi từ các thuật toán với bộ dữ liệu Ground Truth tƣơng
đƣợc thực hiện bằng cách vẽ một đƣờng bao quanh cá ứng. Do vậy, bộ dữ liệu này phải đƣợc xây dựng trƣớc cho tất
(Bounding Box). Sau đó, trọng tâm của cá đạt đƣợc bằng cách cả các video. Sau đó, hai đại lƣợng phổ biến trong thống kê là
tính trọng tâm của hình chữ nhật đó. Bƣớc khởi tạo đƣợc minh Mean Square Error (MSE) và Phƣơng sai (Var) đƣợc chọn để
họa trong hình dƣới đây: đánh giá các kết quả.
1) Cơ sở dữ liệu Ground Truth
Để có thể đánh giá đƣợc các phƣơng pháp Phát hiện và
Bám đuổi cá, chúng ta có thể so sánh quỹ đạo của kết quả bám
đuổi với dữ liệu Ground Truth đã đƣợc xây dựng từ trƣớc. Do
đó, việc xây dựng bộ dữ liệu này là một phần thiết yếu trong đề
tài nhằm đánh giá đƣợc chất lƣợng các thuật toán. Ở đây, các
video đƣợc chọn dựa trên sự xuất hiện của bộ kết hợp các tình
huống điển hình trong đề tài. Thông qua việc đánh giá chất
lƣợng bám đuổi cá theo các tình huống trên, chúng ta có thể
kiểm nghiệm tính hiệu quả của mọi thuật toán khi phải giải
quyết các tình huống khác nhau, từ dạng thông thƣờng đến
Hình 5. Bƣớc khởi tạo
những dạng tình huống lạ. Cụ thể, mỗi video sẽ là sự kết hợp
C. Chi tiết thuật toán giữa các tình huống có thể xảy ra nhƣ màu sắc của cá (Fish
Sơ đồ thuật toán đƣợc trình bày phía dƣới cho thấy sự bổ Color), Nồng độ (Concentration), Tốc độ bơi của cá (Velocity),
sung cho nhau của GMM và Frame-Differencing. Sự thực thi Số lƣợng bóng xuất hiện (Illusion), và Thứ tự mẫu video
của phƣơng pháp này sẽ đƣợc trình bày trong phần III. (Sample) tức là mỗi sự kết hợp này đƣợc quay 3 lần nhằm đảm
bảo tính khách quan. Bảng I dƣới đây minh họa cho việc chọn
các video theo tình huống vừa trình bày ở trên
BẢNG I: VIDEO TÌNH HUỐNG
Fish Color Concentration Velocity Illusions Order
B (Black) C (Clean) F (Fast) 1 (Top) 1
O (Orange) P (Pollution) I (Immobile) 2 (Top-Right) 2
S (Slow) 3( Right) 3
4 (None)
Ví dụ, một tình huống video mà xuất hiện cá màu đen (B),
di chuyển chậm (S) trong môi trƣờng nƣớc sạch (C), không
xuất hiện bóng của cá (4), và là mẫu video thứ nhất (1), sẽ
đƣợc ký hiệu là BCS41. Các video tình huống khác đƣợc ký
hiệu tƣơng tự. Theo Bảng 1, có thể có tổng cộng 2x2x3x4x3 =
144 video, chẳng hạn OPF11, OCI43, BPS33… Bộ dữ liệu
thực nghiệm cho từng video đƣợc làm bằng tay, do đó, công
việc này khó lòng thực hiện đƣợc với các video dài. Nhóm
nghiên cứu đã quyết định chỉ sử dụng các video có thời lƣợng
10 giây trong nghiên cứu này. Sau khi đã xây dựng đƣợc bộ dữ
liệu này, chúng ta có thể so sánh các kết quả bám đuổi cho từng
Hình 6. Sơ đồ thuật toán CGMMFD thuật toán để có thể đánh giá một cách hiệu quả các thuật toán
III. KẾT QUẢ THỰC NGHIỆM VÀ PHÂN TÍCH này. Có đƣợc điều này là vì bộ dữ liệu thực nghiệm có tính
chính xác cao, theo từng khung hình một.
Phần này tập trung miêu tả các tiêu chí đƣợc sử dụng cho
phần đánh giá. Cụ thể, phần III.A miêu tả việc xây dựng 2) Tiêu chí đánh giá
Ground Truth. Ground Truth sẽ bao gồm đầy đủ các trƣờng a) Mean Square Error
hợp, tình huống khác nhau. Sau đó, hai số liệu thống kê quan
445
445
Chỉ số MSE đƣợc tính bằng công thức dƣới đây: Normal MSE 60.9 2113.2 106.1 182.4 155.1
Var 17.8 1182.4 32.9 51.9 53.9
∑( )
(8) Fast MSE 369.5 1464.7 5524.0 6735.9 283.8
Var 217.4 828.4 2399.5 2739.8 113.0
với là tọa độ của trọng tâm cá phát hiện và bám đuổi Immobi MSE 38351.0 116607.1 198.9 256.2 120.2
đƣợc ở khung hình thứ i, là tọa độ trọng tâm chuẩn đƣợc lấy le Var 3180.4 3358.8 58.3 15.6 28.4
từ bộ dữ liệu Ground Truth ở cùng khung hình, và m là tổng số Illusion MSE 9805.7 25872.8 3635.9 3888.3 260.9
khung hình trong video. Var 817.2 2852.1 1654.6 1162.1 94.1
Từ bảng trên, ta thấy rằng thuật toán nhóm nghiên cứu đề
Trong thống kê, chỉ số MSE cho biết trung bình của bình xuất (CGMMFD) cho giá trị thấp hơn trong 5 thuật toán cho
phƣơng lỗi sai, tức là độ khác biệt giữa kết quả với giá trị mong hầu hết các nhóm video. Vì vậy, thuật toán này có thể giải
muốn đạt đƣợc. Trong trƣờng hợp này, chỉ số MSE cho thấy độ quyết tốt các tình huống có thể xảy ra trong nghiên cứu này.
lệch (hoặc khoảng cách) từ tọa độ trọng tâm tính ra từ các thuật Trong khi CGMMFD cho kết quả MSE và Var thấp một cách
toán với tọa độ chuẩn. Nói chung, chỉ số MSE nhỏ đồng nghĩa ổn định, các thuật toán khác có thể tốt cho một vài tình huống
với việc ít xảy ra lỗi bám đuổi, tức là thuật toán cho kết quả tốt. nhƣng lại không tốt cho các tình huống khác.
Tuy nhiên, chỉ số này chỉ đánh giá trung bình các lỗi sai, Phần tiếp theo của bài báo sẽ trình bày về kết quả và phân
dẫn đến việc các sai số lớn ở một vài khung hình ảnh hƣởng tích chi tiết cho từng nhóm tình huống. Một điểm đáng lƣu ý là
nghiêm trọng tới chỉ số cuối cùng. Chẳng hạn, trong khi hầu trong những biểu đồ dƣới đây, các chỉ số đƣợc hiển thị ở dạng
hết các khung hình đạt kết quả bám đuổi tốt, với độ lệch vài log của các kết quả MSE và Var. Bởi vì các giá trị này thay đổi
đơn vị, sự xuất hiện một sai số lớn trên 1000 đơn vị ở bất kỳ từ vài đơn vị cho tới hàng trăm nghìn đơn vị, gây khó khăn cho
khung hình nào sẽ tạo thành chỉ số MSE ở khoảng 1000 thay vì việc hiển thị trên biểu đồ.
chỉ vài đơn vị. Điều này xảy ra là vì tổng số khung hình chƣa 1) Nhóm video Bình thường
thật sự lớn, chỉ vào khoảng 150 khung hình cho 10 giây. Dó Trong các video này, cá bơi với vận tốc chậm, và không
đó, chỉ số MSE không thể xác định thuật toán bám đuổi này thay đổi vận tốc đột ngột. Bóng của cá cũng không xuất hiện
cho chất lƣợng tốt hơn thuật toán khác, nếu chỉ sử dụng MSE. trong các video này. Kết quả chi tiết đƣợc hiển thị ở Hình 7 và
Để giải quyết vấn đề này, nhóm nghiên cứu sử dụng thêm một Hình 8 dƣới đây.
chỉ số khác, đó là Phƣơng sai, để có thể đánh giá một cách tối
ƣu hơn.
b) Phương sai
Phƣơng sai đƣợc tính bằng công thức:
∑( ̅)
(9)
với d là độ lệch (khoảng cách) giữa trọng tâm cá phát hiện

đƣợc với trọng tâm chuẩn từ bộ dữ liệu thực nghiệm, ̅ là giá
trị trung bình của d; m tổng số khung hình trong video.
Phƣơng sai (Var) cho thấy độ phân tán của lỗi sai. Một giá
trị nhỏ của chỉ số này cho thấy lỗi sai tập trung rất gần nhau, và
gần giá trị trung bình của chúng. Ngƣợc lại, chỉ số phƣơng sai
cao chỉ ra các lỗi sai rất phân tán. Tóm lại, một thuật toán Phát Hình 7. MSE của nhóm video Bình thƣờng
hiện và Bám đuổi đạt hiệu quả tốt nghĩa là nó phải cho thấy cả
hai chỉ số MSE và Var có giá trị thấp.
B. Kết quả đánh giá
Trong phần này, nhóm nghiên cứu sẽ trình bày các phân
tích và so sánh từ các kết quả của các thuật toán khác nhau cho
từng video tình huống một cách tổng quan. Các video đƣợc
nhóm thành 4 nhóm theo các tiêu chí đặc trƣng nhằm tiện cho
việc phân tích nhƣ sau: Bình thƣờng (Normal) là các video tình
huống mà cá bơi chậm, không có bóng, Nhanh (Fast) các video
mà cá bơi với tốc độ nhanh, Bất động (Immobile) là các tình
huống mà cá không di chuyển, Bóng (Illusion) các video có sự
xuất hiện bóng của cá. Trong sự đánh giá tổng quan này, các
chỉ số MSE và Var đƣợc lấy từ kết quả trung bình cho các
video trong nhóm. Bảng II minh họa cho các giá trị trung bình Hình 8. Phƣơng sai của nhóm video Bình thƣờng
của MSE và Var đối với 5 thuật toán khác nhau là Ƣớc lƣợng
nền trung bình (MB), GMM, Mean Shift (MS), Lọc Particle Trong nhóm video này, MB là thuật toán cho kết quả MSE
(PF) và thuật toán đƣợc đề xuất (CGMMFD) tƣơng ứng với và Var tốt nhất. Trong khi đó, 4 thuật toán còn lại không cho
từng nhóm video. thấy một ƣu thế đáng kể nào. Kết quả này phản ánh đúng tính
BẢNG II: HIỆU SUẤT HỆ THỐNG
chất của các thuật toán ở trên. Với sự di chuyển với tốc độ
MB GMM MS PF CGM
không thay đổi đột ngột và không có bóng, kết quả tạo nền
MFD trung bình sẽ cho kết quả tốt, hệ quả là việc phát hiện và bám
446
446
đuổi cá cho độ chính xác cao, MSE thấp nhất. Lỗi sai chỉ xảy
ra khi cá đôt ngột bơi ngƣợc hƣớng đang di chuyển, tạo thành
lỗi bám đuổi đối trong thời gian ngắn đối với bộ lọc Kalman.
Trong Hình 8, Phƣơng sai của mỗi thuật toán ứng với từng
video đặc trƣng đƣợc chọn và hiển thị. Kết quả Var trong nhóm
này cũng cho thấy chất lƣợng tốt của thuật toán MB, với chỉ số
thấp. Ngƣợc lại, thuật toán GMM lại cho kết quả tệ nhất trong
cả 5 thuật toán đối với cả chỉ số MSE và Var. Trong khi đó kết
quả MSE và Var của CGMMFD cho thấy sự ổn định khi hầu
hết chỉ số ở các video nằm trong khoảng dƣới 2 (tức 100 đơn
vị).
Tóm lại, thuật toán MB có thể xem là thuật toán phù hợp
nhất cho các video nhóm Bình thƣờng, còn thuật toán
Hình 10. Phƣơng sai của các video Bất động
CGMMFD cũng cho thấy chất lƣợng bám đuổi ổn định và
tƣơng đối tốt. Hình 10 cho thấy giá trị Var từ các thuật toán có giá trị
2) Nhóm video Bất động tƣơng đối thấp, đặc biệt hơn, ở vài video tình huống, chúng có
Khi cá nằm yên do tác động của độc chất trong môi trƣờng thể thấy đƣợc giá trị bé hơn 10 đơn vị (giá trị âm trên thang
nƣớc. Các thuật toán Phát hiện và Bám đuổi cá gặp phải đồng log). Điều này xảy ra chính là do cá hầu nhƣ không di chuyển,
thời những thuận lợi và bất lợi. Nhóm video này cũng bao gồm dẫn đến kết quả bám đuổi hầu nhƣ không cho lỗi sai đối với
các trƣờng hợp mà cá di chuyển rất ít. Kết quả chi tiết đƣợc những thuật toán nhƣ MS, PF và CGMMFD. Nhƣng ở video
trình bày ở Hình 9 và 10. mã OPI21, chỉ số Var lại cao đột biến, lý do là vì ở video này,
cá có sự di chuyển đột ngột trong khoảng thời gian nhỏ sau một
thời gian dài bất động, chính điều này gây ra sai lêch ở kết quả
bƣớc Phát hiện cá, làm cho thuật toán GMM có kết quả Var
cao bất thƣờng.
Tóm lại, trƣờng hợp Bất động của cá có thể đƣợc giải quyết
tốt bằng cách dùng thuật toán Mean Shift, lọc Particle và
CGMMFD, nhƣng không thể là GMM hoặc MB.
3) Nhóm video Nhanh
Trong các video này, cá di chuyển với vận tốc nhanh hơn
bình thƣờng, đồng thời, lúc di chuyển ra các cạnh của hồ, cá
cũng gây ra các bóng ảnh ảo trên các khu vực này. Tốc độ này
của cá gây ảnh hƣởng hầu nhƣ giống nhau đối với các thuật
Hình 9. MSE của các video Bất động toán. Hình 11 cho thấy, không có nhiều sự sai biệt ở kết quả
MSE từ các thuật toán tƣơng ứng với các video tình huống.
Kết quả MSE của thuật toán GMM và MB rất cao Thuật toán Mean Background cho kết quả khả quan trong các
(trên10000 đơn vị) cho thấy 2 thuật toán này không thể giải video này nhƣ đã đề cập từ trƣớc: khi cá di chuyển nhanh, nền
quyết đƣợc tình huống xảy ra trong nhóm các video này. Điều tạo ra cũng đạt chất lƣợng cao hơn, từ đó kết quả Phát hiện cá
này là do khi cá không di chuyển, hoặc di chuyển rất ít, thì cũng tốt hơn. Bên cạnh đó, cá di chuyển nhanh cũng tạo ra điều
thuật toán GMM sẽ xem cá là nền và không thể trích xuất đƣợc kiện thích hợp cho phƣơng pháp Frame Differencing. Vì thế,
khối cá, dẫn đến sai số cực lớn và liên tục. Tƣơng tự, thuật toán thuật toán CGMMFD cũng hiệu quả trong trƣờng hợp này. Trái
MB cũng không thể tạo ảnh nền chính xác, bởi vì trong thuật lại kết quả MSE của Mean Shift và lọc Particle lại không tốt
toán này, ảnh nền đƣợc tạo ra phụ thuộc vào độ dài của video bằng. Lý do là vì trong các video này, tốc độ của cá di chuyển
và sự di chuyển của cá. Kết quả là không thể phát hiện đƣợc cá nhanh, histogram thay đổi nhiều hơn, làm cho hai thuật toán
khi trừ nền, dẫn đến sai số khi bám đuổi. Trong khi đó, kết quả này bám trƣợt trọng tâm của cá. Nhƣng nhìn chung thì hai
bám đuổi từ thuật toán Mean Shift, lọc Particle, và CGMMFD thuật toán này vẫn có thể hữu dụng vì chúng cho giá trị MSE
lại đạt chất lƣợng khả quan hơn. Với Mean Shift và lọc khá thấp, chỉ vào khoảng 100 trong hầu hết các video trong
Particle, hai thuật toán này có thể bám đuổi đƣợc chính xác hơn nhóm này.
bởi vì histogram [8],[9] trong các trƣờng hợp này thay đổi rất
Nhƣ vậy, tốc độ cao của cá ảnh hƣởng tƣơng đối ít tới kết
ít. Bên cạnh đó, thuật toán đƣợc đề xuất CGMMFD cũng cho
quả của các thuật toán kể trên. Do đó, trong nhóm video này,
kết quả MSE và Var thấp một cách tƣơng đối ổn định nhờ có
không có thuật toán nào thật sự tối ƣu hơn thuật toán nào.
bƣớc khởi tạo cùng với phát hiện bất động.
447
447
Tuy nhiêm, ở trƣờng hợp xuất hiện bóng cá này, thuật toán
đƣợc đề xuất CGMMFD vẫn cho kết quả MSE và Var có thể
chấp nhận đƣợc, với giá trị tƣơng đối thấp.
Nói chung, trƣờng hợp nhóm video có sự xuất hiên của
bóng cá thì chỉ số MSE và Var có xu hƣớng tăng với tất cả năm
thuật toán. Tuy nhiên, thuật toán CGMMFD có lợi thế hơn nhờ
độ đơn giản của thuật toán, và tính ổn định kết quả MSE và
Var ở tất cả cá video.
Hình 11. MSE của các video nhanh
Hình 14. Phƣơng cho các video có bóng

IV. KẾT LUẬN
Trong nghiên cứu này, chúng to đã nâng cao chất lƣợng của
việc Phát hiện và Bám đuổi cá bằng cách khai thác thuật toán
GMM và bộ lọc Kalman, cùng với Frame-Differencing. Sau
Hình 12. Phƣơng của các video nhanh khi xây dựng thuật toán trên, chúng tôi cũng đã tiến hành kiểm
4) Nhóm video có Bóng thử chất lƣợng bằng hai chỉ số là MSE và Var đƣợc tạo ra từ
Một điều hiển nhiên là sự xuất hiện của bóng (ảnh ảo của thuật toán đề xuất CGMMFD cùng với bốn thuật toán khác.
cá) trong các video này ở trên mặt nƣớc (trƣờng hợp 1), góc Kết quả cho thấy, thuật toán chúng tôi đề xuất cho kết quả khả
bên phải bể cá (trƣờng hợp 2) hay ảnh ở cả hai vị trí nhƣ trên quan trong việc Phát hiện và Bám đuổi cá nhờ cho ra giá trị
(trƣờng hợp 3), đều làm tăng chỉ số MSE và Var một cách đáng MSE và Var thấp. Có đƣợc điều này là vì thuật toán này bao
kể. Các loại bóng này ảnh hƣởng nghiêm trọng nhất đến thuật gồm hai thuật toán khác nhau nhƣng có thể bổ sung cho nhau
toán Mean Shift và lọc Particle, bởi vì các bóng này làm sai một cách hợp lý là GMM và FD. Tuy nhiên, phƣơng pháp này
lệch kết quả histogram ở hai thuật toán này, từ đó gây ra sự vẫn chƣa thể giải quyết việc Phát hiện và Bám đuổi cá ở môi
bám đuổi sai đối tƣợng, tức là thay vì bám theo cá thật thì hai trƣờng thời gian thực vì nó cần ảnh của các khung hình kế tiếp.
thuật toán này dễ dàng bị bám lệch sang bóng cá. Do đó, trong những nghiên cứu tiếp theo, nhóm sẽ tập trung
tìm ra những cách kết hợp khác hiệu quả hơn, nhằm nâng cao
chất lƣợng của việc Phát hiện và Bám đuổi cá một cách ổn định
và hiệu suất cao hơn.
LỜI CẢM ƠN
Nghiên cứu này đƣợc hỗ trợ chính thức bởi Bộ Khoa học
và Công nghệ, nằm trong dự án nghiên cứu cấp bộ năm 2014-
2015. Nhóm nghiên cứu cũng xin chân thành cảm ơn nhóm
nghiên cứu TRT3DCS của trƣờng ĐH Bách Khoa Đà Nẵng
trong quá trình nghiên cứu này.
THAM KHẢO
[1] Vinaykumar, M.,Jatoth, R.K. " Performance evaluation of Alpha-Beta
and Kalman filter for object tracking." (2014).
[2] Fier, R., Albu, A.B., Hoeberechts, M., " Automatic fish counting system
Hình 13. MSE cho các video có bóng for noisy deep-sea videos", 14-19 Sept. 2014, pp. 1-6.
[3] Stauffer, C., Grimson, W. (1999) “Adaptive Background Mixture
Bên cạnh đó, trong trƣờng hợp 3 của bóng cá, MSE và Var Models for Real-Time Tracking”. IEEE Computer Society Conf. on
của thuật toán MB cũng rất cao, bởi vì xuất hiện đến 3 bóng Computer Vision and Pattern Recognition, 246-252.
của cá, tạo ra sự xác định sai lệch về đối tƣợng để bám đuổi [4] Ramsey Faragher. (September, 2012) “Understanding the Basis of the
tƣơng tự nhƣ trƣờng hợp của thuật toán Mean Shift và lọc Kalman Filter Via a Simple and Intuitive Derivation”.
Particle [5] C. Ridder, O. Munkelt, and H. Kirchner, “Adaptive background
estimation and foreground detection using Kalman filtering”, In Proc.
ICAM, 1995.
448
448
[6] Ning J., Zhang L., Zhang D., and Wu C.;. (2010). “Robust Mean Shift
Tracking with Corrected Background-Weighted Histogram”.
[7] Comaniciu D., Ramesh V., and Meer P.: “Real-Time Tracking of Non-
Rigid Objects Using Mean Shift”. Proc. IEEE Conf. Computer Vision
and Pattern Recognition, Hilton Head, SC, USA, June, 2000, pp. 142-
149.
[8] K. Nummiaro, E. Koller-Meier, L. V. Gool. “A Color-based Particle
Filter.” In First International Workshop on Generative- Model- Based
Vision, 2002.
[9] M. Fotouhi, A. R. Gholami, and S. Kasaei. (2011) “Particle Filter-Based
Object Tracking Using Adaptive Histogram.”
[10] Singla Nishu.: Motion Detection Based on Frame Difference Method.
International Journal of Information & Computation Technology.
Volume 4, Number 15 (2014), pp. 1559-1565.
449
Điều Khiển Dẫn Đường Hành Vi Cho Robot Di Động

Hai Bánh Vi Sai
Nguyễn Thị Thanh Vân, Phùng Mạnh Dương, Đặng Anh Việt, Quách Công Hoàng, Trần Quang Vinh
Khoa Điện tử - Viễn thông, Đại học Công nghệ, Đại học Quốc Gia Hà nội
144 Xuân Thủy, Cầu Giấy, Hà nội. Email: vanntt@vnu.edu.vn
Abstract— Bài báo đề xuất cấu trúc điều khiển dẫn đường hành hành vi khác nhau. Một số kỹ thuật trộn lệnh như sơ đồ chuyển
vi mới BBFM cho robot di động. Cấu trúc BBFM là sự kết hợp mạch [8], tổng hợp véc tơ [9], sử dụng bộ lọc thông tin phân
giữa logic mờ để thiết kế các bộ điều khiển mờ thực thi các hành tán [10] hay logic mờ [11].
vi độc lập và lý thuyết quyết định tối ưu đa mục tiêu để lựa chọn Khi logic mờ được sử dụng cả trong kỹ thuật lựa chọn hành vi
giá trị điều khiển thỏa mãn tốt nhất tất cả các mục tiêu. Cách
và trộn lệnh thì phương pháp này được gọi là kết hợp phụ
thức kết hợp này có ưu điểm khi sử dụng logic mờ thiết kế các
hàm mục tiêu dễ dàng, hiệu quả và phù hợp với đặc điểm của thuộc vào ngữ cảnh – CDB [12, 13] và đã ứng dụng nhiều
môi trường hoạt động chứa nhiều yếu tố bất định, trong khi tối trong các hệ thống dẫn đường robot di động hiện nay [14-16].
ưu đa mục tiêu cho phép lựa chọn giá trị điều khiển cuối cùng Phương pháp CDB đã tạo nên cấu trúc điều khiển hành vi linh
thỏa mãn tốt nhất tất cả các mục tiêu đặt ra. Hiệu quả của cấu hoạt, đáp ứng nhanh với những biến động của môi trường chưa
trúc điều khiển đề xuất được kiểm chứng qua chương trình mô biết, tuy nhiên khi sử dụng kỹ thuật trộn lệnh để xác định giá
phỏng, so sánh và đánh giá với các cấu trúc điều khiển dẫn trị điều khiển cuối cùng sẽ gặp một số hạn chế do phương pháp
đường hành vi có trước. giải mờ đem lại. Bên cạnh đó, cấu trúc MOASMs được đề xuất
bởi P. Pirjanian [17] được xem như là một kỹ thuật trộn lệnh
Keywords – Điều khiển dẫn đường hành vi, logic mờ, tối ưu đa
mục tiêu, robot di động
sử dụng khái niệm hành vi tối ưu. Phương pháp này đã áp dụng
lý thuyết quyết định đa mục tiêu để xác định hành vi phù hợp
và tối ưu theo quan điểm Pareto từ một tập các hành vi khác
I. GIỚI THIỆU nhau. Phương pháp này tỏ ra hiệu quả khi kết quả tìm được là
Dẫn đường được xem như với một phần hiểu biết về môi tối ưu Pareto nhưng cũng thể hiện hạn chế trong việc xác định
trường và một vị trí đích hoặc một số vị trí cùng với giá trị thu hàm mục tiêu của hành vi.
được của cảm biến, robot có khả năng đạt tới vị trí đích một Để khắc phục hạn chế của vấn đề trộn lệnh trong các kỹ thuật
cách hiệu quả và tin cậy [1, 2]. Cấu trúc điều khiển dẫn đường trên, bài báo đề xuất một cấu trúc điều khiển dẫn đường hành
có thể được phân thành ba loại [3]: cấu trúc thứ bậc hoạt động vi kết hợp logic mờ và lý thuyết quyết định tối ưu đa mục tiêu,
tuần tự với các bước cảm nhận, lập kế hoạch và hành động dựa gọi tắt là BBFM. Trong cấu trúc điều khiển này, hành vi dẫn
trên mô hình chính xác của môi trường toàn cục sẽ điều khiển đường phức tạp được chia thành các hành vi nhỏ và mỗi hành
robot theo một đường đi tối ưu; cấu trúc phản ứng hay hành vi vi sẽ được thực thi bằng một bộ điều khiển mờ. Hàm thuộc lối
chia nhiệm vụ phức tạp thành các nhiệm vụ nhỏ để thực hiện vì ra của mỗi bộ điều khiển được xem như là hàm mục tiêu của
thế đáp ứng nhanh với môi trường động và không biết trước; mỗi hành vi do thể hiện mức độ mong muốn đạt được của biến
cấu trúc lai là sự kết hợp của hai cấu trúc trên để tận dụng ưu điều khiển theo mục tiêu của hành vi đó. Giá trị cuối cùng của
điểm lập kế hoạch của cấu trúc thứ bậc và đáp ứng nhanh của các biến điều khiển sẽ được xác định bằng lý thuyết quyết định
cấu trúc phản ứng trong môi trường động. tối ưu đa mục tiêu với các hàm mục tiêu của các hành vi đã
Trong ba cấu trúc điều khiển dẫn đường trên thì cấu trúc hành được thiết lập từ các bộ điều khiển. Cấu trúc BBFM đề xuất
vi được sử dụng nhiều trong các ứng dụng của robot hoạt động phát huy được ưu điểm khi sử dụng logic mờ để thiết kế các bộ
trong môi trường chưa biết bởi tính đơn giản nhưng hiệu quả điều khiển mờ một cách dễ dàng, hiệu quả, thích hợp với các
đạt được cao. Việc chia nhiệm vụ dẫn đường phức tạp thành yếu tố bất định của robot cũng như môi trường hoạt động.
các nhiệm vụ nhỏ đã làm tăng hiệu suất hoạt động của toàn hệ Đồng thời, việc sử dụng lý thuyết quyết định tối ưu đa mục tiêu
thống. Vấn đề quan trọng trong cấu trúc điều khiển hành vi là cho phép xác định giá trị điều khiển tối ưu Pareto.
cách kết hợp hiệu quả hay cách giải quyết xung đột giữa các Bài báo được trình bày thành 6 phần. Phần 2 giới thiệu về mô
loại hành vi khác nhau để đạt được kết quả tốt. Các kỹ thuật hình hệ thống robot di động hai bánh vi sai hệ thống điều khiển
này được phân thành hai phần chính trong cấu trúc điều khiển dẫn đường. Cấu trúc điều khiển dẫn đường hành vi BBFM đề
hành vi: lựa chọn hành vi và trộn lệnh. Lựa chọn hành vi sẽ xuất được trình bày chi tiết trong phần 3. Phần 4 trình bày ví
quyết định một hay nhiều hành vi tham gia điều khiển tại cùng dụ thiết kế hệ thống dẫn đường cho robot di động sử dụng cấu
một thời điểm. Một số các kỹ thuật lựa chọn hành vi điển hình trúc điều khiển đề xuất cùng với hai cấu trúc điều khiển khác là
như: cấu trúc xếp gộp của Book [4], cấu trúc ưu tiên của Dupre MOASMs và CDB điển hình nhằm mục đích so sánh và đánh
[5], hay siêu luật mờ [6,7]. Kỹ thuật trộn lệnh sẽ được sử dụng giá. Mô phỏng kiểm chứng và đánh giá so sánh được trình bày
khi có nhiều hành vi được lựa chọn, khi đó nó sẽ quyết định ở phần 5. Cuối cùng là kết luận và hướng phát triển tiếp theo
lệnh điều khiển duy nhất từ nhiều lệnh được sinh ra bởi nhiều trong phần 6.
ISBN: 978-604-67-0635-9 450

450
II. MÔ HÌNH HỆ THỐNG

Mô hình robot di động được xem xét trong nghiên cứu này là
loại robot có hai bánh vi sai với ràng buộc không khả tích có
cấu hình và tham số được thể hiện trên Hình 1 dưới đây.
  
xi , yi , i
Hình 2: Sơ đồ khối hệ thống điều khiển dẫn đường

III. BỘ ĐIỀU KHIỂN DẪN ĐƯỜNG HÀNH VI BBFM
Phần này sẽ trình bày phương pháp thiết kế bộ điều khiển dẫn
đường hành vi BBFM đề xuất. Cấu trúc điều khiển dẫn đường
hành vi BBFM mô tả như hình 3 và được chia thành 3 bước
như sau:
Hình 1: Mô hình robot di động hai bánh vi sai
Trong đó, (OG, XG, YG) biểu diễn hệ tọa độ toàn cục, (OR,
XR,YR) biểu diễn hệ tọa độ cục bộ gắn liền với robot, R ký hiệu O1 (y1 )
bán kính bánh xe và L là khoảng cách giữa hai bánh. (x, y, θ) O1 (yn )
là tọa độ và góc hướng hiện tại của robot trong hệ tọa độ toàn O (y1 )
2
yˆ1  arg max[  O (y1 ),..., O (y1 )]
1 N
cục. ρ là khoảng cách từ tâm robot tới vị trí đích và α là góc  O (yn )
2 ...
lệch giữa véctơ nối tâm của robot với điểm đích và véctơ góc O (y1 )
yˆ n  arg max[ O (y n ),..., O (y n )]
1 N
hướng θ. Phương trình động học của robot di động hai bánh vi N
 O (y n )
sai sẽ là: N
 x  u cos  Hình 3: Cấu trúc điều khiển dẫn đường hành vi BBFM
 Bước 1: Phân tích vấn đề
 y  u sin  (1)
Từ mục tiêu phức tạp cần thực hiện, chia thành một tập các

    hành vi độc lập. Xác định biến điều khiển của các hành vi: y =
u là vận tốc dài và ω là vận tốc góc của tâm robot. Quan hệ (y1, y2, …,yN), yi Є Yi, Yi: tập giá trị của các biến điều khiển
ràng buộc không khả tích rút ra được từ phương trình trên tương ứng.
được biểu diễn bởi: Bước 2: Thiết kế các hàm mục tiêu:
y cos   x sin   0 (2) Hàm mục tiêu để thực hiện các hành vi tương ứng được thiết
Mô hình rời rạc tại thời điểm tiếp theo i+1 thu được từ giá trị kế thông qua 2 bước của quá trình thiết kế bộ điều mờ: mờ
tại thời điểm hiện tại i và phương trình động học liên tục (1) ở hóa, suy luận mờ. Kết quả của quá trình suy luận mờ sẽ thu
trên với thời gian lấy mẫu Ts sẽ là: được hàm mục tiêu của biến điều khiển:
O ( y ), O ( y ),..., O ( y ) (4)
 xi 1  xi  uiTs cos( i ) 1 2 N
 (3)
Bước 3: Lựa chọn lệnh
 yi 1  yi  uiTs sin( i ) Quá trình trộn lệnh để xác định giá trị điều khiển cuối cùng sử
     T dụng lý thuyết tối ưu đa mục tiêu. Khi đó giá trị tham số điều
 i 1 i i s 
Sơ đồ khối của hệ thống điều khiển dẫn đường phản hồi được khiển tối ưu Pareto y i  Yi phù hợp nhất với tất cả các mục
trình bày ở Hình 2. Điểm đích (xd, yd, θd) cho trước trong
không gian làm việc. Với dữ liệu về môi trường và trạng thái tiêu đề ra theo lý thuyết lựa chọn tối ưu đa mục tiêu:
hiện tại của robot thu được thông qua các cảm biến, bộ điều yˆ  arg max[  O (yi ),O (yi ), ..., O (yi )],yi  Yi
i
(5)
1 2 N
khiển dẫn đường sẽ đưa ra giá trị vận tốc dài u và vận tốc góc
ω phù hợp để điều khiển robot di động hai bánh vi sai có A. Phân tích vấn đề
phương trình động học ở (3) về vị trí đích một cách an toàn. Mục tiêu phức tạp được chia thành các quá trình ra quyết định
Để tăng thêm hiệu quả của hệ thống điều khiển thì bộ lọc độc lập nhỏ được gọi là các hành vi Bk (k =1…N). Biến điều
EKF-FNN đã được nhóm tác giả đề xuất trong bài toán định vị khiển y được định nghĩa là y = {y1, y2, …,yN}, yi Є Yi, Yi: tập
robot trong một nghiên cứu khác [18] sử dụng trong vòng giá trị của các biến điều khiển tương ứng hay còn gọi là không
phản hồi. Bộ lọc cho phép ước tính chính xác hơn tư thế hiện gian tác động của biến điều khiển. Mỗi hành vi được thực thi
tại của robot dựa trên mô hình động học của hệ thống và phép thông qua các hàm mục tiêu của biến điều khiển tương ứng
đo trong trường hợp hệ thống bị ảnh hưởng bởi nhiễu quá Ok(y) (k =1…N).
trình và nhiễu đo. Khi đó giá trị lối vào bộ điểu khiển dẫn
đường là giá trị ước tính từ bộ lọc EKF-FNN. B. Thiết kế hàm mục tiêu
Hàm mục tiêu Ok để thực thi hành vi Bk được định nghĩa là sự
ánh xạ từ không gian tác động Yi tới khoảng giá trị [0, 1]:
Ok : Yi → [0, 1] (6)
451
451
Phép ánh xạ gán mỗi tác động yi Є Yi một giá trị thỏa mãn, tác Như vậy, với N hàm mục tiêu thì tham số điều khiển yˆ i  Yi
động thích hợp nhất sẽ được gán bằng 1 và không thích hợp
nhất gán bằng 0. Hàm mục tiêu Ok được xác định thông qua tốt nhất phù hợp với tất cả các hàm mục tiêu được xác định
hai bước mờ hóa và suy luận mờ. Phần dưới đây sẽ mô tả chi theo cách sau:
tiết cách thức thiết kế hàm mục tiêu thông qua hai bước thiết yˆ i  Yi  arg max[ O (yi ),O (yi ), ..., O (yi )] (12)
1 2 N
kế bộ điều khiển mờ với cấu trúc tổng quát MIMO.
Bước 1: Mờ hóa Nghiệm tối ưu Pareto [19]: yˆ i là nghiệm không trội của
Một bộ điều khiển mờ F có m biến ngôn ngữ lối vào {x1, phương trình (12) nếu không tồn tại bất kỳ giá trị yi  Yi nào
x2,…, xm} với các tập nền X1, X2…Xm và n biến ngôn ngữ lối
ra {y1, y2,…yn } với tập nền Y1, Y2,…,Yn. Biến lối ra yi chính để O ( yˆ i  Yi )  O (y i ) với mọi i và
là các biến điều khiển và tập nền Yi (i=1…n) là các không O (y i )  [O (yi ), O (y i ),..., O (y i )] ít nhất với một j.
gian tác động của các biến điều khiển. 1 2 N
Mỗi biến ngôn ngữ có các giá trị ngôn ngữ được xác định
bằng một tập mờ định nghĩa trên tập nền của biến ngôn ngữ: IV. VÍ DỤ DẪN ĐƯỜNG CHO ROBOT DI ĐỘNG
x1   A11 , A12 ,  , A1a  y1  B11 , B12 ,  , B1b  Bài toán dẫn đường yêu cầu robot di động hai bánh vi mô hình
như (3) có khả năng về đích và tránh vật cản an toàn trên
x2  A21 , A22 ,  , A2 a  y2  B21 , B22 ,  , B2b  đường đi trong môi trường chưa biết dựa trên thông tin thu
(7) được từ các cảm biến. Phần này trình bày cụ thể quá trình thiết
... ... kế bộ điều khiển dẫn đường hành vi theo cấu trúc BBFM đề
xm   Am1 , Am1 ,  , Ama  yn  Bn1 , Bn 2 ,  , Bnb  xuất.
Hàm thuộc tương ứng tại giá thực của biến vào/ra được xác A. Phân tích vấn đề
định bởi: Nhiệm vụ dẫn đường của robot từ bất kỳ điểm nào tới đích
x1: A11 ( x1 ),...,  A1a ( x1 ) y1: B11 ( y1 ),...,  B1b ( y1 ) một cách an toàn được chia thành ba hành vi: tránh vật, duy trì
x2 : A21 ( x1 ),.., A2 a ( x2 ) y2 : B21 ( y2 ),...,  B2b ( y2 ) hướng đích và chuyển động nhanh. Hành vi tránh vật sẽ thực
(8) hiện nhiệm vụ tránh vật cục bộ bất ngờ gặp phải trên đường
... ... di chuyển về đích. Hành vi duy trì hướng đích sẽ thực hiện
xm : Am1 ( xm ),.., Ama ( xm ) yn : B ( yn ),..., Bnb ( yn ) việc điều khiển robot luôn tiến thẳng tới đích và tốc độ về đích
n1
nhanh nhất có thể sẽ được thực hiện bởi hành vi chuyển động
Bước 2: Suy luận mờ
Luật điều khiển thứ k (mệnh đề hợp thành) với m mệnh đề nhanh. Nhiệm vụ của mỗi hành vi được thực thi bởi một bộ
điều khiển mờ. Hai hành vi duy trì hướng đích và chuyển
điều kiện có dạng:
Rk: Nếu x1=Aij và x2 = Aij và ….xm = Aij thì y1 = Bij và y2 = Bij động nhanh có thể gộp vào trong một bộ điều khiển do mỗi
và … yn = Bij hành vi chỉ liên quan đến một biến điều khiển. Biến điều
khiển cho robot di động là vận tốc dài u và vận tốc góc ω do
Trong đó: Aij, Bij: j Є {1…a/b}: tập mờ của các giá trị ngôn
ngữ vào/ra, i Є {1…m/n}: biến ngôn ngữ lối vào vào/ra đó đây cũng chính là biến lối ra của mỗi bộ điều khiển mờ:
y = {u, ω}, U = [umin umax], W = [ωmin ωmax]
Giá trị của mệnh đề hợp thành k cho một biến lối ra yi là một
tập mờ Rk định nghĩa trên tập nền Yi có hàm thuộc: Hai hàm mục tiêu của biến điều khiển để thực hiện ba hành vi
trên là O1(u, ω) và O2(u, ω).
 R ( yi )  min(H,  B (y i ))
k ij
(9) B. Thiết kế hàm mục tiêu
H  min{ A ( x1 ),  A ( x2 ),....,  A ( xm )}
ij ij ij 1) Bộ điều khiển tránh vật
Với k luật hay k mệnh đề hợp thành của bộ điều khiển thì giá Để thực hiện hành vi tránh vật cục bộ, robot nhận dữ liệu từ
trị của luật hợp thành R cho một biến lối ra yi được xác định cảm biến siêu âm được mô tả như hình dưới đây.
theo luật max-min sẽ là:
 R ( yi )  max(  R ( yi ),  R ( yi ), ...,  R ( yi )) (10)
1 2 M
Hàm thuộc lối ra của biến điều khiển yi được xác định theo
(10) trên đây chính là hàm mục tiêu của biến điều khiển yi.
C. Lựa chọn lệnh Hình 4: Mô hình cảm biến siêu âm
Bước này sẽ xác định giá trị rõ cuối cùng của các tham số điều Phạm vi quét của cảm biến là từ 0 đến 4m. 8 cảm biến này
khiển yi thông qua N hàm mục tiêu. Như đã khẳng định ở trên, được chia thành 3 nhóm: Phải (cảm biến 1, 2, 3) Trước (cảm
hàm mục tiêu Ok thực thi hành vi Bk chính là các tập mờ R lối biến 4, 5) và Trái (cảm biến 6, 7, 8). Giá trị của 3 nhóm cảm
ra (10) của mỗi bộ điều khiển mờ F tương ứng với các tham số biến được tính bằng giá trị của khoảng cách nhỏ nhất trong
điều khiển yi trên các tập nền Yi. nhóm. Bộ điều khiển gồm 4 biến lối vào và 2 biến lối ra như
hình 5.
 O ( yi )   R ( yi ) (11)
  a tan(y d  y, x d  x)   ,   [-  ] (13)
452
452
Trong đó ρ là khoảng cách từ vị trí hiện tại (x,y) của robot tới
vị trí đích (xd, yd) được xác định bằng công thức (16), giá trị
ngôn ngữ và hàm thuộc được miêu tả như hình 8.
2 2
  (x d  x)  (y d  y) (16)
Hình 5: Bộ điều khiển mờ tránh vật ρ = {Gần (G), Trung bình (TB), Xa (X)}, ρ:[0 20] m.
Giá trị ngôn ngữ và miền giá trị của các biến vào/ra được xác
định như sau:
- dtrai, dtruoc, dphai = {Gần (G), Trung bình (TB), Xa
(X)}. [0.2 4] m.
- α = {Âm Nhiều (AN), Âm (A), Không (K), Dương
(D), Dương Nhiều (DN)}
- u = {Nhỏ (N), Trung bình (TB), Lớn (L)}, U = [0
1.3] m/s Hình 8: Hàm thuộc của biến ρ
- ω = {Âm Nhiều (ANo), Âm (Ao), Không (Ko), Dương Biến ngôn ngữ α, và ω của bộ điều khiển về đích có giá trị
(DO), Dương Nhiều (DNo)}, W = [-4.33 4.33] rad/s ngôn ngữ, miền giá trị và hàm thuộc giống như của bộ điều
Hàm thuộc của các biến ngôn ngữ vào/ra là các hàm thuộc có khiển tránh vật. Các luật điều khiển về đích được trình bày
dạng Gauss và Sigmoid với biểu thức và dạng hàm được biểu trong bảng 2. Giá trị của mệnh đề hợp thành theo luật max-
diễn như hình 6. min cho biến lối ra u và ω của bộ điều khiển mờ về đích được
 ( x  c )2 xác định theo bằng công thức 17 như sau.
2 1  R _GR (u )  max(  R (u ),  R (u ), ...,  R (u )
Gauss ( x )  e 2 Sigmoid ( x )   a ( xb)
(14) 1 2 k
1 e
 R _GR ( )  max(  R ( ),  R ( ), ...,  R ( )) (17)
1 2 k
k  1, ...,15
Trường hợp STT Lối vào Lối ra
va chạm vật dtrai dtruoc dphai α u ω
(a) (b) 1 G X G L KO
2 X G G TB DO
3 TB G G TB DO
4 X G TB TB DNO
(c) 5 G G X TB ANO
(d)
6 G G TB TB AO
Hình 6: Hàm thuộc của các biến: (a): lối vào khoảng cách dtrai,
dtruoc và dphai, (b): góc lệch α, (c): vận tốc dài u, (d) vận tốc góc 7 X G X TB DNO
ω 8 TB G X TB AO
Bảng 1 thể hiện các luật điều khiển tránh vật thường gặp. Giá 9 X G TB TB DO
trị của mệnh đề hợp thành theo luật max-min cho biến lối ra u 10 TB TB TB N KO
và ω của bộ điều khiển mờ tránh vật được xác định theo. 11 G TB TB N DO
12 TB G TB N DO
 R _ OA (u )  max(  R (u ),  R (u ), ...,  R (u )
1 2 k 13 G TB TB TB AO
14 G TB X TB AO
 R _ OA ( )  max(  R ( ),  R ( ),...,  R ( )) (15)
1 2 k 15 G X TB TB AO
16 G X X AN N ANO
k  1,..., 28
17 G X X A N AO
Với Rk là giá trị của mệnh đề hợp thành thứ k được xác định 18 G X X K L KO
theo (9). 19 G X X DN L KO
2) Bộ điều khiển về đích 20 G X X D L KO
Bộ điều khiển về đích tương đương với việc thực hiện hai 21 TB TB G TB DO
hành vi duy trì góc hướng đích và hành vi điều khiển tốc độ 22 X TB G TB DO
nhanh nhất có thể. Sơ đồ khối của bộ điều khiển về đích với 23 TB X G L KO
hai biến lối vào ρ, α và hai biến lối ra u, ω được thể hiện như 24 X X G AN L KO
trên hình 7. 25 X X G A L KO
26 X X G K L KO
27 X X G DN N DNO
28 X X G D N DNO
G: Gần, TB: Trung Bình, X: Xa, K/KO: Không, A/AO: Âm,
Hình 7: Bộ điều khiển mờ về đích AN/ANO: Âm Nhiều, D/DO: Dương, DN/DNO: Dương Nhiều.
Bảng 1: Luật điều khiển tránh vật
453
453
STT Lối vào Lối ra A. Trường hợp 1

Môi trường hoạt động có cấu trúc được chọn giống như trong
ρ α u ω
1 G K N KO
bài báo đề xuất sử dụng bộ điều khiển MOASMs. Từ cấu hình
2 G A N AO xuất phát ban đầu (-2, -1.8, 180o), robot sẽ di chuyển tránh vật
3 G AN N ANO an toàn về đích tại vị trí (-6, -4.8, 0o). Đường đi và đáp ứng
4 G D N DO vận tốc u, ω của robot trong trường hợp sử dụng ba bộ điều
5 G DN N DNO khiển dẫn đường khác nhau MOASMs, BBFM và CBD được
6 TB K TB KO thể hiện trong hình 9. Một số thông số từ hoạt động dẫn đường
7 TB A TB AO
của robot nhằm mục đích so sánh thể hiện trong bảng 3. Trong
8 TB AN TB ANO
9 TB D TB DO đó quãng đường đi thể hiện độ dài mà robot đã đi. Thời gian
10 TB DN TB DNO tới đích là thời gian thực thi thuật toán điều khiển từ điểm bắt
11 X K L KO đầu đến khi robot đạt tới đích. Sai số khi về đích là khoảng
12 X A L AO cách dừng của robot khi tới đích, thông số này sẽ đánh giá khả
13 X AN L ANO năng đạt được vị trí đích của cấu trúc điều khiển. Hình 9 cho
14 X D L DO
thấy đường đi khi sử dụng cấu trúc điều khiển BBFM tốt hơn
15 X DN L DNO
so với trường hợp sử dụng hai cấu trúc còn lại. Điều này được
G: Gần, TB: Trung Bình, X: Xa, K/KO:
Không, A/AO: Âm, AN/ANO: Âm Nhiều, khẳng định trong bảng 3 với các thông số đạt được của cấu
D/DO: Dương, DN/DNO: Dương Nhiều. trúc BBFM so với MOASMs và CDB là: quãng đường đi
Bảng 2: Luật điều khiển về đích ngắn hơn, thời gian tới đích nhanh hơn và sai số về đích nhỏ
hơn. Cấu trúc MOASMs có thời gian thực hiện lâu nhất do
C. Lựa chọn lệnh
hàm mục tiêu là hàm 2 biến O(u,ω) phải thực hiện hết với giá
Công thức (15) và (17) là hàm mục tiêu thực hiện hành vi trị của tập các tham số điều khiển cho hai biến. Mặt khác do
tránh vật và về đích đối với hai biến điều khiển u và ω. Giá trị hàm mục tiêu thực thi hành vi tránh vật thực hiện theo nguyên
cuối cùng của biến điều khiển û  U và ˆ  W phù hợp nhất lý robot chuyển theo đường cong quanh tâm quay ICC và giao
với cả ba mục tiêu được xác định bởi: với vật nên chiếm nhiều thời gian khi xác định vị trí của vật.
uˆ  arg max[  R _ OA (u), R _ GR (u)] Chính nguyên lý xác định hàm mục tiêu này làm robot khó về
(18) đích với sai số nhỏ. Điều này thể hiện trong đáp ứng vận tốc u
ˆ  arg max[  R _OA ( ), R _ GR ( )] và ω ở hình 9(d) với giá trị vận tốc chưa đạt tới 0 tại khoảng
cách rất gần đích. Trong khi hàm mục tiêu xây dựng bằng
Nghiệm tối ưu Pareto uˆ, ˆ được tìm theo phương pháp
logic mờ cho phép robot đạt tới vị trí đích với sai lệch nhỏ
Lexicographic [19] như sau: nhất, đáp ứng vận tốc tiến tới 0 khi ở vị trí gần đích như trong
 Hành vi theo thứ tự quan trọng giảm dần: tránh vật, hình 9(b) và 9(f). Cấu trúc điều khiển CDB sử dụng siêu luật
về đích (duy trì hướng đích và chuyển động nhanh). mờ xác định trọng số của các bộ điều khiển phụ thuộc vào
 Quá trình loại bỏ tuần tự được thực hiện song song kinh nghiệm và trộn lệnh theo phương pháp giải mờ do đó
đối với hai biến u và ω trên tập U và W cho đến khi nhiều khi đạt hiệu quả không cao. Vì thế mặc dù cấu trúc
tìm được 1 nghiệm duy nhất hoặc giải hết cả P1 và CDB cho phép robot tới đích nhưng đường đi dài hơn và thời
P2: gian xử lý lâu hơn so với khi sử dụng cấu trúc BBFM.
uˆ : P1 : max  R _ OA (u), Thông số BBFM MOASMs CDB
uU Quãng đường đi (m) 10.3587 11.0180 11.0171
P2 : max  R _ GR (u), U1 {u|u la nghiem cua P1} Thời gian tới đích (s) 28.262 414.542 36.4367
uU1 Sai số về đích (m) 0.05 0.2 0.05
(19) Bảng 3: So sánh kết quả của trường hợp 1
ˆ : P1: max  R _ OA ( ),
W B. Trường hợp 2
P2 : max  R _ GR ( ), W1 { | la nghiem cua P1} Trường hợp 2 mô phỏng hoạt động của robot trong phòng thí
W1 nghiệm với mô hình các vật cản là tường và vách ngăn. Robot
xuất phát ban đầu với cấu hình (-7, -6, 0o) và yêu cầu di
V. MÔ PHỎNG
chuyển an toàn đến vị trí đích (-2.5, -1.5, 0o). Kết quả đạt
Mô phỏng Monte-Carlo được thực hiện để đánh giá hiệu quả được thể hiện trên hình 10 với các đường đi khác nhau của ba
của cấu trúc điều khiển dẫn đường hành vi BBFM đề xuất và cấu trúc điều khiển BBFM, MOASMs và CDB. Chỉ có cấu
so sánh với các cấu trúc MOASMs và CDB điển hình. Các trúc điều khiển BBFM và CDB là đạt được yêu cầu dẫn đường
tham số mô phỏng được thiết lập cho robot di động hai bánh đề ra, còn cấu trúc MOASMs không thực hiện được nhiệm vụ
vi sai như sau: đường kính của bánh xe R = 0,05 m; khoảng dẫn đường về đích an toàn do xuất phát hướng đích ngay từ
cách giữa hai bánh xe L = 0,6 m; vận tốc dài u trong khoảng ban đầu dẫn đến bị mắc vào góc kẹt. Hình 10(a) và một số
[0, 1.3] m/s do đó vận tốc góc cực đại là ω = [-4.3 4.3] rad/s; thông số so sánh trong bảng 4 cho thấy đường đi của robot khi
thời gian lấy mẫu của hệ thống TS = 100 ms; sai số cho phép sử dụng cấu trúc BBFM dễ dàng đạt tới đích với quãng đường
của hệ thống khi về đích là khoảng cách  = 10-1 m. Mô hình đi ngắn và thời gian tới đích nhanh hơn so với khi sử dụng cấu
cảm biến siêu âm được thiết lập như ở phần IV. trúc CDB.
454
454
Thông số BBFM CDB được tạo nên bởi sự kết hợp giữa logic mờ và lý thuyết tối ưu
Quãng đường đã đi (m) 9.3569 15.6649 đa mục tiêu thông qua ba bước thiết kế: phân tích vấn đề, thiết
Thời gian tới đích (s) 12.092 24.153384 kế hàm mục tiêu và lựa chọn lệnh điều khiển. Hiệu quả hoạt
Sai số về đích 0.1 0.1 động của cấu trúc điều khiển dẫn đường hành vi BBFM đề
Bảng 4: So sánh kết quả của trường hợp 2 xuất đã được khẳng định qua chương trình mô phỏng có đánh
0 1.5
u
giá so sánh với hai cấu trúc điều khiển dẫn đường hành vi điển
-1
1 w hình MOASMs và CDB trong một số trường hợp dẫn đường
-2
Start
0.5
khác nhau. Tính mô đun hóa, tính kế thừa và cài đặt dễ dàng
-3 của cấu trúc BBFM cho phép mở rộng thêm các hành vi khác
Y(m)
-4
0
như deadend hay khẩn cấp...cùng với việc sử dụng thêm các
-5 T arget
-0.5 cảm biến khác như cảm biến ảnh, cảm biến địa bàn... để tăng
-6 -1 cường khả năng dẫn đường trong môi trường phức tạp và hoàn
-7
toàn áp dụng được cho các hệ thống dẫn đường thực tế.
-10 -8 -6 -4 -2 0 -1.5
0 100 200 300 400
X(m)
(a) (b)
[1] D.Driankov, H.Hellendoorn, M.Reinfrank, An introduction to fuzzy
0 4
u control, Springer, 2010
-1 3
w [2] Siegwart Roland and Nourbakhsh Illah R – Introduction to Autonomous
-2
Start 2 Mobile Robots, The MIT Press Cambridge, Massachusetts London,
1 England, 2004.
-3
[3] D. Nakhaeinia, S. H. Tang, S. B. Mohd Noor, and O. Motlagh, A review
Y(m)
0
-4
-1
of control architectures for autonomous navigation of mobile robot,
-5 T arget International Journal of the Physical Sciences, Vol 6(2), pp 169-174,
-2
-6
January, 2011.
-3 [4] R.A.Brooks, A robust layered control system for a mobile robot, IEEE
-7
-10 -8 -6 -4 -2 0 -4 Journal of Robotics and Automation, 1986, pp14-23
0 50 100 150
X(m) [5] Dupre, M.E, GA optinized fuzzy control of an autonomous mobile
(c) (d) robot, Faculty of Graduate Studies, University of Guelph, 2007
[6] M. Sugeno, Fuzzy hierarchical control of an unmanned helicopter, Proc
0 1.5
u of Int. Fuzzy System Association Conference, pp179-182, 1993
-1
1 w [7] A.Safiotti, A multivalued logic approach to integrating planning and
-2
Start control, Artificial Intelligent, 481-526, 1995
0.5
-3
[8] Dorigo, M, Comombetti, M, Robot shaping: an experiment in behavior
engineering, MIT Press/Bradford Books, 1997
Y(m)
0
-4
[9] R.C. Arkin, Motor-schema based mobile robot navigation, Int. J. Robot.
-5 T arget
-0.5 Res. 8 (4) (1989) 92–112.
-6 -1
[10] Eduardo Freire, Teodiano Bastos- Filho, Mario Sarcinelli- Filho and
Ricardo Carelli, A new mobile robot control approach via fusion of
-7
-10 -8 -6 -4 -2 0 -1.5
0 100 200 300 400
control signals, IEEE transactions on system, mam and cybernetics –
X(m) part B: cybernetics, Vol. 34, No.1, February 2004.
(e) (f) [11] Aguirre E. & Gonzales A, Fuzzy behaviors for mobile robot navigation:
Hình 9: Đường đi và đáp ứng vận tốc của robot với các cấu design, coordination and fusion, Int.J. of Approximate Reasoning, Vol,
25 pp, 255-289.
trúc điều khiển khác nhau trong trường hợp 1: (a) và (b): [12] E.H.Ruspini, Fuzzy logic in the Flakey robot, In Proco of the Int.Conf
BBFM, (c) và (d): MOASMs, (e) và (f): CDB on Fuzzy Logic and Neural Networks, 767-770, Iizuka, Japan, 1990
0 0 0 [13] A. Saffiotti, The uses of fuzzy logic in autonomous robot navigation,
-1 -1 -1 Soft Computing, 180-197, Springer – Verlag 1997
-2
T arget
-2
T arget
-2
T arget [14] Andi Adriansyah, Shamsudin H. M. Amin, Genetic fuzzy system in
-3 -3 -3 behavior based mobile robot, Politeknik Elektronika Negeri Surabaya –
ITS, IES 2004
Y(m)
Y(m)
Y(m)
-4 -4 -4
-5 -5 -5
[15] Amur S. Al Yahmedi and Muhammed A. Fatmi, Fuzzy Logic Based
-6
St art
-6
St art
-6
St art Navigation of Mobile Robot, Recent Advances in Mobile Robotics,
-7 -7 -7
ISBN: 978-953-307-909-7, InTech, DOI: 10.5772/25621, December, 14,
-10 -8 -6
X(m)
-4 -2 0 -10 -8 -6
X(m)
-4 -2 0 -10 -8 -6
X(m)
-4 -2 0
2011
[16] Hongwei Mo, Qirong Tang, and Longlong Meng, Behavior - based
(a) BBFM (b) MOASMs (c) CDB fuzzy control for mobile robot navigation, Mathematical Problems in
Hình 10: Đường đi của robot trong các cấu trúc điều khiển dẫn Engineering, Volume 2013, Article ID 561451, 2013
đường khác nhau trong trường hợp 2 [17] P. Pirjanian, Multiple objective behavior-based control, Robotics and
Kết quả mô phỏng cùng đánh giá so sánh với các cấu trúc điều Autonomous Systems 31 (2000) 53–60, Elsevier.
[18] Nguyen Thi Thanh Van, Phung Manh Duong, Tran Thuan Hoang, Tran
khiển điển hình khác trong môi trường hoạt động khác nhau ở Quang Vinh, “Mobile Robot Localization using fuzzy neural network
trên đã khẳng định hiệu quả của cấu trúc điều khiển dẫn based extended kalman filter”, Journal of Computer Science and
đường hành vi BBFM đề xuất Cybernetics, vol.29 no.2, 2013, p119-131.
[19] Adrian Gambier, Essameddin Badreddin, Multi objective optimal
VI. KẾT LUẬN control, 16th IEEE International Conference on Control Applications,
Part of IEEE Multi conference on systems and control, Singapore,
Một cấu trúc điều khiển dẫn đường hành vi BBFM cho Octerber, 2007.
robot di động đã được đề xuất trong bài báo. Cấu trúc BBFM
455
455
Nghiên cứu tác động của phương pháp điều chỉnh mức sáng dựa trên cắt mức
năng lượng biên sau lên đối tượng đèn sợi đốt, đèn huỳnh quang và đèn compact
Nguyễn Phan Kiên (1,*), Nguyễn Mạnh Cường (2), Hoàng Anh Dũng (3), Trần Đức Hưng (1), Đỗ Chí Hiếu (1)
(1)
Viện Điện tử Viễn thông, Đại học Bách Khoa Hà nội,
(2)
Học viện kỹ thuật Quân sự
(3)
Khoa Điện tử Viễn thông, Viện Đại học Mở Hà nội
Email: knguyenp@gmail.com*1, cuong.tung@gmail.com2, kinhcan81@gmail.com3, tranhung201222@gmail.com1,
dochihieu1994@gmail.com1
Abstract- Phương pháp điều chỉnh mức sáng dựa trên cắt mức nhiều như trong các thiết bị điều chỉnh cho đèn, quạt trần,…
năng lượng biên trước đã phổ biến trên thị trường từ lâu nhưng Các bộ điều chỉnh dạng này thường rẻ nhưng lại có tuổi thọ
lại gặp một số nhược điểm như gây ra nhiễu điện từ, và giảm tuổi không cao. Nguyên lý cắt mức năng lượng biên trước được chỉ
thọ của đèn sợi đốt hoặc đèn compact. Tuy nhiên các nhược điểm ra trong hình 1.
này có thế khắc phục nhờ phương pháp điều chỉnh mức sáng dựa
trên cắt mức năng lượng biên sau. Khác với mạch điều chỉnh mức
sáng dựa trên cắt mức năng lượng biên trước được điều khiển
dựa trên tín hiệu tương tự, mạch cắt mức năng lượng biên sau
trong bài viết được điều khiển dựa trên tín hiệu số. Khi áp dụng
phương pháp điều chỉnh mức sáng dựa trên cắt mức năng lượng
biên sau với 3 loại đèn trên, tín hiệu đo trên oscillo cho thấy đèn
sợi đốt và đèn compact phù hợp với phương pháp này trong khi
đèn huỳnh quang chấn lưu từ không thể áp dụng.
Keywords- điều chỉnh mức sáng, cắt biên sau, cắt biên trước, đèn
sợi đốt, đèn huỳnh quang, đèn compact.
Hình 2: Cắt mức năng lương biên sau
I. GIỚI THIỆU
Mạch điều chỉnh mức sáng mục đích cuối cùng là điều khiển
công suất cho tải tiêu thụ điện và phương pháp phổ biến điều Nguyên lý cắt mức năng lượng biên sau được chỉ ra trong hình
chỉnh mức sáng của đèn trong chiếu sáng dân dụng hiện nay là 2. Phương pháp điều chỉnh mức sáng dựa trên cắt mức năng
dựa trên cắt mức năng lượng biên trước [6]. Phương pháp này lượng biên sau mà bài viết này tập trung tới sẽ giải quyết các
sử dụng khóa điện tử là Triac (thường được kích bởi một Diac) nhược điểm nói trên của phương pháp cắt mức năng lượng biên
chỉ cho dòng chạy qua tại một thời điểm nhất định sau điểm 0 trước (bao gồm sự sinh nhiễu điện từ và sự giảm tuổi thọ của
của tín hiệu sin và chỉ đóng khi dòng điện đảo chiều. Việc điều bóng đèn) và đồng thời chúng tôi cũng khảo sát sự tác động
chỉnh thời gian mở trong mỗi nửa chu kì dựa trên điều chỉnh của phương pháp này lên các đối tượng đèn khác nhau, cụ thể
thời gian phóng nạp của một tụ điện qua một biến trở [5,6]. là đèn sợi đốt, đèn huỳnh quang chấn lưu từ và đèn compact vì
bản chất của các loại đèn này rất khác nhau. Cụ thể, với các
Do đó trong mỗi nửa chu kì dòng điện bắt đầu từ 0 rồi tăng vọt loại đèn sợi đốt thì tải được coi là tải thuần trở trong khi đèn
lên một giá trị nhất định trong vòng cỡ 1us, và điều này gây ra huỳn quang chấn lưu sắt từ và đèn compact thì có dạng tải phi
sốc nhiệt cho bóng sợi đốt làm giảm tuổi thọ bóng, đồng thời tuyến (vừa dạng tải cảm, vừa dạng tải dung tùy thuộc vào quá
với bóng compact sẽ luôn có một tụ điện được nạp với dòng trình phóng điện (khởi tạo ban đầu) và quá trình ổn định khi
điện có cường độ tăng rất nhanh trong mỗi nửa chu kỳ và hiện đèn đã sáng). Trên thực tế, các nghiên cứu về cắt mức năng
tượng này cũng sẽ làm giảm tuổi thọ của bóng nhanh chóng lượng biên sau đã được thực hiện bởi một số hãng trên thế giới
[5]. Thêm vào đó là sự tăng vọt của dòng điện trong mỗi lần và đã được áp dụng đối với một số loại đèn sợi đốt, đèn sử
dụng biến áp điện tử [9]. Và một số nghiên cứu khác chỉ đưa ra
khuyến nghị là không sử dụng đối với các tải cảm hoặc động
cơ,..[5,6]. Tuy nhiên, xét về bản chất của bóng đèn huỳnh
quang và đền compact như đã đề cập ở trên thì đặc tuyến của
những bóng này không phải dạng tải cảm cũng không phải
dạng tải dung thuần túy mà nó là sự kết hợp của hai dạng tải
này với đặc tính tải là dạng phi tuyến. Do đó, nghiên cứu chỉ ra
khả năng ứng dụng đối với đặc tính tải phi tuyến này là cần
thiết cho việc khẳng định khả năng áp dụng phương pháp cắt
mức năng lượng biên sau đối với các bóng đèn điện dạng này
Hình 1: Cắt mức năng lương biên trước (bóng đèn huỳnh quang chấn lưu sắt từ, bóng đèn compact,
bóng đèn cao áp (natri hoặc metal halide), …).
đóng ngắt của Triac cũng gây ra nhiễu điện từ [5], và nhiễu này
tăng lên đáng kể theo chiều dài dây nối từ tải tới mạch này. Mạch điều chỉnh mức sáng của đèn theo phương pháp này
Trong thự tế, Nguyên lý cắt mức biên trước được sử dụng khá được thiết kế dựa trên nguyên lý: điều khiển đóng mở IGBT
456
456
bằng vi điều khiển Atmega 16 dựa trên tín hiệu bắt điểm 0 của PD4 của vi điều khiển thông qua opto (PC817, Sharp). Diode
dòng điện. Thời gian cho dòng chạy qua IGBT trong mỗi nửa zenner (1N4744, General Semiconductor) và TVS diode
chu kỳ được dễ dàng điều chỉnh bằng núm vặn, do đó tác dụng (P6KE400CA, Fairchild Semiconductor) giúp bảo vệ IGBT
điều khiển công suất cũng giống như phương pháp cắt biên khỏi xung quá áp.
trước. Thêm vào đó phương pháp này cho phép dòng qua
IGBT tăng từ từ theo sườn hình sin, và thời gian đóng IGBT Mỗi khi có tín hiệu ngắt ngoài đưa vào vi điều khiển
cũng có thể kiểm soát dễ dàng, chính điều này làm giảm tối đa (Atmega16, Atmel) từ mạch bắt điểm không, chân PD4 xuất tín
nhiễu điện từ sinh ra do quá trình đóng ngắt trong mỗi nửa chu hiệu mức cao kích cho driver mở IGBT, sau một khoảng thời
kỳ. gian nhất định (nhỏ hơn 10ms), chân PD4 xuất tín hiệu mức
II. CÁC VẤN ĐỀ QUAN TÂM TRONG THIẾT KẾ CHẾ

TẠO MẠCH ĐIỀU KHIỂN
Sơ đồ khối của thiết kế được chỉ ra trong hình 3. Trong đó,

nguồn cung cấp 220V, 50Hz được lấy mẫu để xác định điểm
không thông qua khối bắt điểm không. Tin hiệu bắt điểm
không được đưa vào vi điều khiển, đồng thời tín hiệu xác định
thời gian ngắt trong mỗi nửa chu kì cũng được đọc từ điện áp
trên triết áp vào vi điều khiển. Từ 2 tín hiệu này vi điều khiển
xuất ra tín hiệu kích cho driver của IGBT, từ đó khối cắt pha sẽ Hình 4: Khối bắt điểm không
thực hiện cắt mức năng lượng chảy vào tải.
thấp kích cho driver đóng IGBT. Khi nào có tín hiệu ngăt ngoài
Hình 3: Sơ đồ khối mạch điều chỉnh mức sáng của đèn dựa trên thì quá trình trên lại đc lặp lại. Như vậy thời gian dòng điện
phương pháp cắt mức năng lượng sau chảy qua tải trong mỗi nửa chu kì phụ thuộc vào thời gian
delay, và thời gian này được điều chỉnh bằng một triết áp thông
Để bắt điểm không có nhiều phương pháp [2], nhưng phương qua chân ADC của vi điều khiển.
pháp mà bài viết này sử dụng dựa trên một cầu diode được chỉ Khối cắt pha được chỉ ra trong hình 5. Do IGBT chỉ đóng ngắt
ra trong hình 4. Trong đó, nguồn AC được đưa vào A1 A2. Sau được với dòng một chiều nên để IGBT hoạt động được ở cả
khi được chỉnh lưu qua cầu diode và hạn bớt bởi trở 100k sẽ bán kì âm và dương ta cần cầu diode chỉnh lưu.
được đưa vào opto (PC817, Sharp). Opto sẽ giúp chuyển hóa
dòng chỉnh lưu thành tín hiệu 0 và 1 đi vào chân ngắt ngoài Về kiểm soát thời gian đóng của IGBT ta có nhiều cách bao
PD3 của vi điều khiển. Khi dòng điện chỉnh lưu về 0 opto gồm điều chỉnh dV/dt (bằng điện trở cực G hoặc mắc song
không dẫn, từ đó PD3 đang ở mức cao sẽ chuyển sang mức song một tụ điện giữa cực G và E) hoặc điều chỉnh di/dt (bằng
thấp. cuộn cảm nhỏ ở cực E) [3,4]. Cách thức sử dụng trong bài viết
Hình 5: Khối driver cho IGBT và khối cắt pha (gồm IGBT và cầu diode)
Mạch driver cho IGBT được chỉ ra trong hình 5. Trong đó cặp này là dùng điện trở cực G. Điện trở này càng lớn thì thời gian
transistor kéo đẩy D468 và B562 (Renesas) có vai trò đóng mở đóng của IGBT càng tăng. Tuy nhiên điện trở này cũng không
cho IGBT (FGA25N120ANTD, Fairchild Semiconductor) được phép quá lớn bởi thời gian đóng ngắt lâu cũng đồng nghĩa
[1,7]. Tín hiệu kích cho cặp transistor này được truyền từ chân với mất mát nhiệt trên IGBT càng lớn làm nóng IGBT [3,4,7].
457
457
Ta có thể ước lượng thời gian đóng mở của IGBT theo công Khi driver nhận tín hiệu mở, transistor D468 thông trong khi
thức [3]: transistor B562 đóng, lúc này tụ 𝐶𝐶𝐺𝐺𝐺𝐺 được nguồn nạp tới 15V
thông qua điện trở R8. Do có trị số nhỏ, nên thời gian mở của
IGBT ngắn. Khi driver nhận tín hiệu đóng, transistor B562
thông trong khi transistor D468 đóng, lúc này tụ 𝐶𝐶𝐺𝐺𝐺𝐺 được xả
dV 𝑉𝑉𝑡𝑡𝑡 qua điện trở R8 và R9 nối tiếp. Do tổng trở R8 và R9 lớn, nên
=
dt 𝑅𝑅𝑔𝑔 ∗ 𝐶𝐶𝑖𝑖𝑖𝑖𝑖𝑖 quá trình mở của IGBT diễn ra chậm lại cỡ vài chục micro giây
.
Lưu đồ thuật toán điều khiển của vi điều khiển Atmega 16
V: điện áp cực C được trình bày trong hình 7. Khi dòng điện xoay chiều từ
𝑉𝑉𝑡𝑡𝑡 : điện áp plateau của cực G (thường xấp xỉ 7V) nguồn 220V về 0, tín hiệu ngắt ngoài được gửi tới chân PD3.
𝑅𝑅𝑔𝑔 : điện trở cực G Khi đó Chân PD4 được đưa lên mức cao để kích mở IGBT và
𝐶𝐶𝑖𝑖𝑖𝑖𝑖𝑖 : dung kháng giữa cực G và E trạng thái này được giữ trong khoảng thời gian t ms, sau đó
PD4 lại được đưa về mức thấp để đóng IGBT. Tín hiệu điện áp
Trong mạch này với mục đích làm cho thời gian đóng không trên chân PA0 được đưa vào bộ ADC để tính ra thời gian t
quá nhanh, và thời gian mở không cần chậm (do điện áp tăng tương ứng muốn delay.
từ từ sau điểm 0 của mỗi nửa chu kì) nên ta chọn điện trở R8
(22R) nhỏ, và điện trở R9 (2k2) lớn. Trong mạch điện ta nhìn III. THỰC NGHIỆM ĐO ĐẠC VÀ KẾT QUẢ
đầu vào cực G của IGBT như một tụ điện như trong hình 6, và
thời gian đóng mở IGBT bị ảnh hưởng trực tiếp bởi thời gian Mạch sau khi hoàn thành như hình 8, sẽ được cắm các nguồn
nạp xả của tụ này [1,8]. và chưa cắm tải. Để xác minh hoạt động của mạch, ta sử dụng
oscillo đo tín hiệu bắt điểm 0 được đưa vào chân PD3 của vi
điều khiển song song với tín hiệu điện áp 220V/50Hz, sau đó
đo tín hiệu xuất ra từ khối driver của IGBT khi điều chỉnh triết
áp tăng từ 0 đến 100%. Kết quả đo chỉ ra trong hình 9 và hình
Hình 6: Các dung kháng kí sinh của IGBT
Hình 8: Mạch hoàn thành
10 phản ánh khối bắt điểm 0 và khối driver cho IGBT hoạt
động tốt.
Hình 9: Tín hiệu bắt điểm 0 đưa vào chân PD3 của vi điều khiển
(các xung có đỉnh 5V)
Hình 7: Lưu đồ thuật toán điều khiển của vi điều khiển
458
458
HộiHội
ThảoThảo Quốc
2015 ĐiệnTử,
Tử,Truyền
TruyềnThông
Thông và
và Công
CôngNghệ
NghệThông
ThôngTinTin
(ECIT 2015)
(ECIT 2015)
Hình 12: Điện áp trên đèn huỳnh quang chấn lưu từ khi điều chỉnh
triết áp giảm dần từ 100% (thứ tự từ trái sang phải, từ trên xuống
dưới)
Hình 10: Tín hiệu xuất ra từ driver cho IGBT khi điều chỉnh triết áp
tăng 0-100% (thứ tự từ trái sang phải, từ trên xuống dưới)
Tiếp theo thực nghiệm đo đạc tại đầu ra với các đối tượng đèn
khác nhau khi điều chỉnh triết áp giảm dần từ 100%, cụ thể là
bóng sợi đốt (25W/220V, Rạng Đông), bóng huỳnh quang
(18W/0.6m, Philips ) chấn lưu từ và bóng compact
(15W/220V, Rạng Đông). Kết quả điều khiển công suất với
bóng sợi đốt, bóng huỳnh quang chấn lưu từ và bóng compact
được chỉ ra trong hình 11, 12, 13 tương ứng.
Hình 13: Điện áp trên đèn compact khi điều chỉnh triết áp giảm từ
100% (thứ tự từ trái sang phải, từ trên xuống dưới)
-Với bóng sợi đốt, khi điều chỉnh triết áp giảm 100-0% thời
gian có dòng chạy qua đèn trong mỗi nửa chu kì cũng giảm
theo (từ 10-0ms) đồng thời độ sáng của bóng giảm từ tối đa về
0. Đèn tắt hẳn khi triết áp về 0%
-Với bóng huỳnh quang chấn lưu từ, khi điều chỉnh triết áp
giảm từ 100% thời gian có dòng chạy qua đèn cũng giảm theo,
đồng thời độ sáng của bóng giảm dần từ mức tối đa đến 0. Đèn
bắt đầu tắt hẳn khi triết áp vẫn chưa về mức 0%. Ngay sau mỗi
thời điểm đóng IGBT ở mỗi nửa chu kì luôn xuất hiện một
Hình 11: Điện áp trên đèn sợi đốt khi điều chỉnh triết áp giảm dần từ xung ngược rất lớn, IGBT nóng rất nhanh và hỏng sau một thời
100% (thứ tự từ trái sang phải, từ trên xuống dưới)
459
459
gian ngắn sử dụng. Đồng thời nhiễu điện từ sinh ra rất lớn thậm sợi đốt và bóng compact, tuyệt đối không thích hợp với bóng
chí phát ra cả tiếng ồn. huỳnh quang chấn lưu từ.
-Với bóng compact, khi điều chỉnh triết áp giảm từ 100% thời Lời cảm ơn:
gian có dòng chạy qua đèn gần như không thay đổi, thay vào Nhóm tác giả trân trọng cảm ơn công ty TNHH Công nghệ ứng
đó đường biên xuống của mỗi nửa chu kì bị cắt vát giảm dần, dụng Bách Khoa (BKAT Co., Ltd.) đã hỗ trợ cho việc thực
dẫn tới điện áp cực đại cũng giảm theo. Cùng với đó là sự hiện nghiên cứu này.
giảm độ sáng của đèn từ mức tối đa về 0. Đèn bắt đầu tắt hẳn
khi triết áp vẫn chưa về mức 0%. TÀI LIỆU THAM KHẢO
[1] A.Mahesh Kumar, B. R. (2013). Design of fast switching IGBT driver for
high rated modules. American International Journal of Research in Science,
IV. KẾT LUẬN
Technology, Engineering & Mathematics , 2 (2), 144-148.
Dựa trên kết quả đo được ta thấy dạng tín hiệu điện áp của các [2] Ankita Gupta, R. T. (2013). An Efficient Approach to Zero Crossing
loại đèn rất khác nhau. Điều này là do bản chất loại tải của các Detection Based On. Journal of Engineering Research and Applications , 3 (5),
đèn này khác nhau.Tín hiệu điện áp đèn sợi đốt phản ánh sát 834-838.
[3] B. Maurice, L. W. (1994, September). Drive circuits for power MOSFETs
với lý thuyết của phương pháp này do đèn này là tải thuần trở.
and IGBTs.
Tín hiệu điện áp của đèn huỳnh quanh chấn lưu từ dù có phần [4] Charreton, J. M. (1993, July). Soft light dimmer.
phản ánh lý thuyết nhưng lại xuất hiện xung ngược rất lớn dội [5] Elliott, R. (n.d.). Dimmers. Retrieved august 2015, 18, from Elliott Sound
về. Điều này là do thành phần cảm kháng của chấn lưu rất lớn Products: http://sound.westhost.com/lamps/dimmers.html
[6] Engdahl, T. (n.d.). Light Dimmer Circuits. Retrieved August 18, 2015,
nên ngay sau mỗi thời điểm đóng của IGBT sẽ có xung cảm
from ePanorama.net:
ứng điện từ dội về IGBT. Trong khi đó, bóng compact là tải kết http://www.epanorama.net/documents/lights/lightdimmer.html
hợp RLC, dạng tín hiệu điện áp không phản ánh lý thuyết của [7] Hermwille, M. (2008, November-December). The use of gate resistors to
phương pháp điều chỉnh mức sáng này. Dù thời gian có dòng control IGBT switching.
[8] Rahul Chokhawala, J. C. Gate Drive Considerations for IGBT Modules. El
chạy qua bóng không thay đổi khi điều chỉnh triết áp nhưng Segundo: International Rectifier Corporation.
thay vào đó là sự thay đổi của điện áp cực đại trong mỗi nửa [9] Philips. (n.d.). Dimmer controllers. Retrieved November 11, 2015, from
chu kỳ, do đó vẫn có hiệu quả điều chỉnh mức sáng. Philips:
http://www.lighting.philips.com/main/subsites/dynalite/products/load_controlle
rs/dimmer_controllers.wpd
Như vậy phương pháp điều chỉnh mức sáng của đèn dựa trên
cắt mức năng lượng biên sau chỉ khuyến nghị sử dụng với bóng
460
460
Kiến Trúc Vi Mạch FFT Cơ Số Hai Với Số Điểm

Linh Động Và Độ Chính Xác Cao Với
Công Nghệ 130nm
Phạm Đăng Lâm, Nguyễn Trọng Ngô Nhật Du, Ngô Thành Đạt và Hoàng Trang
Khoa Điện-ĐiệnTử,
Đại Học Bách Khoa Thành Phố Hồ Chí Minh
Email: lamd.pham@hcmut.edu.vn, nhatdu.bentre@gmail.com, thanhdat5494@gmail.com, hoangtrang@hcm.edu.vn
Abstract— Thuật toán biến đổi FFT (Fast Fourier Transform) trúc FFT là hệ thống OFDM được đề cập trong [5-9]. Một khảo
được áp dụng một cách rộng rãi trong nhiều ứng dụng khác nhau sát khác được thực hiện cho các hệ thống này qua bảng 2 cho
bao gồm phân tích phổ tín hiệu trong các hệ thống OFDM thấy hầu hết các cấu hình FFT với số điểm nhỏ với dấu chấm
(Orthogonal Frequency Division Multi-plexing), trích đặc trưng tĩnh. Đối với các ứng dụng FFT với số điểm lớn từ 128 điểm
âm thanh MFCC (Mel Frequency Cepstral Coefficients) trong hệ
trở lên, chủ yếu các ứng dụng sử dụng khả năng lập trình với
thống nhận dạng giọng nói hay trong các hệ thống xử lý số tín
hiệu cần phân tích trên miền tần số nói chung. Tuy nhiên, hầu với các máy tính hiệu suất cao. Chỉ một số ít kiến trúc FFT với
hết các nghiên cứu gần đây đa phần tiếp cận dựa trên phần mềm số điểm lớn được đề cập với xu hướng giảm thiểu phần cứng
hoặc những kiến trúc phần cứng với số điểm cố định. Ngoài ra, tối đa có thể. Cụ thể khối kiến trúc FFT 128 điểm cấu hình dấu
việc sử dụng phương pháp xấp xỉ hay dấu chấm tĩnh trong việc chấm tĩnh được đề cập trong [5], trong khi đó một kiến trúc
thực thi phần cứng cũng cho thấy hạn chế với sai số lớn khi mà FFT khác với số điểm là 256 được giới thiệu trong [9]. Từ
chuỗi tính toán trở nền dài hơn với số điểm trở nên lớn hơn những khảo sát trên có thể cho thấy các ứng dụng sử dụng các
nhiều. Để có thể khắc phục được những yếu điểm này, một kiến cấu hình phần cứng FFT cứng nhắc và chủ yếu tiếp cận dấu
trúc vi mạch cho thuật toán FFT cơ số hai không chỉ với số điểm chấm tĩnh. Đối với các thuật toán đòi hỏi số điểm FFT lớn,
có thể thay đổi tuỳ ý mà còn áp dụng dấu chấm động với độ
không chỉ việc thực thi hiệu quả trên phần cứng với tốc độ cao
chính xác cao theo quy trình sản xuất ASIC (Application-Specific
Integrated Circuit) được giới thiệu. Một số kết quả thực nghiệm mà độ chính xác trở thành những yêu cầu không thể thiếu đối
trên nền công nghệ 130nm cho thấy những ưu thế khi so sánh với với các hệ thống thời gian thực. Để có thể đáp ứng được những
các thiết kế khác cũng được thực hiện. điều kiện này, một kiến trúc phần cứng FFT với số điểm linh
động có thể cấu hình được ở cấp độ lớp cổng một cách dễ dàng
Keywords- FFT (Fast Fourier Transform), MDC (Multipath trong giới hạn từ 8-4096 với cấu hình dấu chấm động được đề
Delay Commutator), OFDM (Orthogonal Frequency Division nghị.
Multi-plexing), MFCC (Mel Frequency Cepstral Coefficients), dấu
chấm động Bảng 1. Khảo sát cấu hình FFT trong trích đặc trưng MFCC
Tác giả Cấu hình Thử Ứng dụng Thời
I. GIỚI THIỆU nghiệm gian
trên thực thi
Cùng với sự phát triển không ngừng của lĩnh vực xử lý tín
FFT
hiệu số, khối kiến trúc FFT, một thành phần không thể thiếu GIN-DER 256 điểm ASIC MFCC trong 10,4 µs
trong hệ thống xử lý tín hiệu số, cũng được yêu cầu khắt khe WU [2] Cơ số 2 (0.18µm) nhận dạng
hơn nhằm tạo ra các tiện lợi nhất có thể. Khá nhiều giải thuật tiếng nói
thực thi FFT được tiếp cận và đạt được thành công bởi sự hỗ Chin-Teng 256 điểm ASIC MFCC trong -
trợ của ngôn ngữ lập trình cũng như các máy tính hiệu suất cao Lin [3] Cơ số 16 (0.13µm) nhận dạng
[1]. Ngoài ra, với sự phát triển mạnh mẽ của phần cứng khi mà tiếng nói
yêu cầu mật độ tích hợp ngày càng cao, một số kiến trúc phần Dongsuk 1024 ASIC MFCC trong 6,7 µs
cứng FFT cũng đã được tiếp cận. Cụ thể, trong ứng dụng nhận Jeon điểm (65 nm) nhận dạng
dạng giọng nói mà trong đó kiến trúc trích đặc trưng MFCC [4] Cơ số 4 tiếng nói
tích hợp thuật toán FFT là một ví dụ tiêu biểu. Các kết quả [2-
4] cho thấy các ứng dụng đặc thù khác nhau về ngôn ngữ nhận Phần còn lại của bài báo được trình bày như sau, phần II
dạng, số từ nhận dạng và độ tích hợp của hệ thống yêu cầu mô tả kiến trúc chi tiết phần cứng FFT đề nghị. Tiếp đó, phần
thuật toán FFT với số điểm khác nhau. Một khảo sát được thực III mô tả kết quả thiết kế với sự linh hoạt, độ chính xác, tốc độ
hiện ở bảng 1 cho thấy một số thống kê tiêu biểu nhất về các và sự tiêu hao về tài nguyên cũng như các so sánh với các thiết
cấu hình FFT khác nhau trong kiến trúc trích đặc trưng giọng kế khác. Cuối cùng phần IV kết luận tổng thể và trình bày
nói MFCC. Một trong những ứng dụng không thể thiếu kiến những công việc dự kiến sau bài báo này.
ISBN: 978-604-67-0635-9 461

Hội Hội
Thảo Quốc
Thảo GiaGia
2015 ĐiệnTử,
Tử,Truyền
TruyềnThông
ThôngTinTin (ECIT
(ECIT 2015)
2015)
Bảng 2. Các cấu hình FFT trong hệ thống OFDM N

1  2  2 n  k 
N
1  2  2 n 1 k 
2   j  2   j 
Thời
     
N N
Cấu
Thử
Giải Ứng gian
 x 2 n e  
 x 2n  1 e  
(2)
Tác giả nghiệm  n 0 n 0
hình Thuật dụng thực thi
trên
FFT
   
128  2 nk   2 nk 
Kiểu N  j  N  j 
Lihong Jia điểm ASIC 3 µs 1  N   2 k  2 1  N 
đường OFDM 2    j   
(3)
[5] Cơ số (0.6µm)
ống   x  2n  e  2 
e  N 
x  2n  1 e  2 
2/4/8 n 0n 0
Atin 8
FPGA Cánh
Mukherjee điểm 19,598
[6] Cơ số
(Xilinx bướm OFDM
ns  DFTN   x  0  , x  2  ,  , x  N  2    
Virtx-6) đơn vị
2 2
0,33 µs W DFTN   x 1 , x  3 ,  , x  N  1  

k (4)
N
(64
64 – 2
điểm)
Jungmin 8K FPGA Cánh
~
Park điểm (Xilinx bướm OFDM Tiếp tục phân tích biểu thức (4) thành tổng của DFT cho chuỗi
96,20
[7] Cơ số Virtex-5) đơn vị dữ liệu chỉ số chẵn và DFT cho chuỗi dữ liệu chỉ số lẻ theo
µs
8 N N N N
(8K
, , ... cho đến khi p  2 , thu được biểu thức (5)
điểm)
4 8 16 2
128
K.
điểm ASIC
Kiểu
MIMO-  DFTN  xeven  n  WNk DFTN  xodd  n  (5)
Umapathy đường 40 µs
Cơ số (90 nm) OFDM 2 2
[8] ống
2/4
256 Với giá trị của k 0,1, 2,, N  1 , và tính chất
Cánh
Ediz Çetin điểm ASIC N N
bướm OFDM 102,4 µs k
[9] Cơ số (0.7µm)
đơn vị WN 2
 WNk W N
2
 WNk , biểu thức cho khung cánh bướm đơn
2
N

vị được hình thành như (5) với k 0,1, 2,, . Để mô tả
2
II. KIẾN TRÚC PHẦN CỨNG THUẬT TOÁN FFT cho công thức (5), hình 1 cho thấy thứ tự bố trí cũng như các
tầng tính toán tương ứng một cách tổng quát. Chi tiết hơn, tại
2.1 Thuật toán FFT. tầng thứ p bất kỳ, với 1 ≤ p ≤ m, với m=log2N, các phần tử của
N
FFT là một trong những thuật toán dùng để tính nhanh DFT chuỗi đầu vào được sắp xếp thành p nhóm, mỗi nhóm chứa
2
trong các hệ thống số. Trong các hệ thống hiện nay, việc tính
2p phần tử và 2p-1 phép tính khối cánh bướm đơn vị. Với thuật
toán DFT sử dụng thuật toán FFT với nhiều lợi thế so với các
toán cơ số 2, hai phần tử tham gia khối tính cánh bướm này ở
phương pháp tính toán trực tiếp. Có hai phương pháp chính để
tầng thứ p cách nhau một chỉ số 2p-1.
thực hiện thuật toán FFT, một là phân huỷ theo thời gian và
hai là phân huỷ theo tần số. Trong đó, có thể chọn các cơ số X(0)
khác nhau như 2, 4, 8 hay các cơ số lớn hơn. Bài báo lựa chọn
thuật toán FFT cơ số 2 phân huỷ theo thời gian đã được áp X(1)
dụng rộng rãi trong các hệ thống và ứng dụng khác nhau như X(2)
đã trình bày thông qua các khảo sát ở bảng 1 và bảng 2. Cụ

thể, đặc tả việc tính toán DFT – N điểm sẽ được thực thi thông X(3)
qua thuật toán FFT cơ số 2 bởi m tầng tính toán (với N = 2m) , X(4)
trong đó mỗi tầng có giá trị đầu vào và giá trị đầu ra riêng biệt. X(5)
Giá trị đầu ra của tầng hiện tại là giá trị đầu vào của tầng kế X(6)
tiếp. Thuật toán FFT cơ số 2 phân huỷ theo thời gian sẽ phân
bổ phương trình DFT thành tổng của hai phần, một phần là X(7)
DFT cho chuỗi dữ liệu có chỉ số chẵn n = [0,2,4,…, N-2] và

một phần còn lại là DFT cho chuỗi dữ liệu có chỉ số lẻ n = X(N-2)
[1,3,5,…, N-1] như các biểu thức được biến đổi từ (1) đến (4).
N 1 X(N-1)
X  k   x  n  WNnk , k 0,1, 2, , N  1
n 0
 2 
j
(1)
 nk
với WNnk  e  N 
Hình 1. Mô hình cánh bướm tổng quát FFT N điểm
462
462
HộiHội
Thảo Quốc
Thảo QuốcGia
Gia2015
2015về
Nghệ Thông
(ECIT 2015)
2015)
2.2 Kiến trúc phần cứng thuật toán FFT đề nghị. vị được hoàn tất, cặp giá trị tương ứng được lưu trữ trên các
bộ nhớ nội Mem_imag_3 và Mem_real_ 3. Các giá trị này sau
đó được lưu trữ ngược lại các bộ nhớ nội Mem_real_1,
Mem Mem
Mem
real real Mem_rea_2, Mem_imag_1, Mem_imag_2 và trở thành dữ liệu
Input
1 3 đầu vào cho cánh bướm đơn vị được tính toán ở các tầng tiếp
theo. Kết thúc quá trình FFT, kết quả được lưu trữ trên hai bộ
Mem Mem nhớ nội Mem_imag_3 và Mem_real_3 với các giá trị phần
Mem real
w Imag thực và phần ảo riêng biệt. Việc truy xuất hai giá trị này từ hai
real
2 FFT 3 bộ nhớ nội cũng thông qua giao thức đọc dữ liệu từ bộ nhớ
Mem CORE thông thường với nhóm tín hiệu cho phép ghi wr_ena, địa chỉ
Mem Imag addr_out và dữ liệu ngõ ra data_out. Cụ thể giao diện FFT
w 1 được mô tả chi tiết qua bảng 3.
imag
Mem
Bảng 3. Chi tiết chức năng của các thành phần trong khối FFT
Imag
2
Tên Loại Số Bit Mô tả
addr_input input 12 Địa chỉ của tín hiệu vào
data_input input 32 Tín hiệu vào
FFT Control rd_ena_input input 1 Chân cho phép đọc bộ nhớ chứa
dữ liệu ngõ vào
fft_ena input 1 Chân cho phép khối FFT thực
Hình 2. Kiến trúc tổng quát khối FFT
thi
addr_w_r input 12 Địa chỉ phần thực của hệ số
addr_input addr_out_r xoay W
12 12 data_w_r input 32 Dữ liệu phần thực của hệ số
data_input data_out_r xoay W
32 32 addr_w_i input 12 Địa chỉ phần ảo của hệ số xoay
addr_out_i W
rd_ena 12 data_w_i input 32 Dữ liệu phần ảo của hệ số xoay
data_out_i W
32 rd_ena_w output 1 Chân cho phép đọc bộ nhớ chứa
hệ số xoay W
addr_w_r
addr_out_r output 12 Địa chỉ phần thực của tín hiệu ra
12 FFT wr_ena
data_out_r output 32 Dữ liệu phần thực của tín hiệu ra
data_w_r addr_out_i output 12 Địa chỉ phần ảo của tín hiệu ra
end_fft data_out_i output 32 Dữ liệu phần ảo của tín hiệu ra
addr_w_i wr_ena output 1 Chân cho phép ghi kết quả vào
bộ nhớ nội
data_w_i end_fft input 1 Chân cho phép khối FFT kết
32 thúc
rd_ena Về chi tiết bên trong, các khối cơ bản được giới thiệu cụ thể
như sau.
Hình 3. Mô hình sơ đồ chi tiết khối FFT
a/ Các khối bộ nhớ nội
Dựa trên mô hình cánh bướm có thể thấy được việc lặp đi lặp
lại các phép toán cộng và nhân của một cánh bướm là như
nhau. Sự khác biệt giữa các cánh bướm chính là cách truyền Mem Control
các giá trị ngõ vào khác nhau trên từng tầng cũng như trên
từng hàng tính toán như hình 1. Dựa trên yếu tố này, kiến trúc Int addr_rd
FFT đề xuất được mô tả với kiến trúc tổng quát như hình 2 và 12 32
giao diện như hình 3. Kiến trúc tổng quan cho thấy các giao Reg
diện ngõ vào và ra của kiến trúc FFT đề xuất. Trước hết, dữ Int addr_wr
clk 12 MEM
liệu mong muốn tính FFT được lưu trữ thông qua việc ghi dữ 32
Reg 32 BIT
liệu lên bộ nhớ nội. Cụ thể giá trị N điểm FFT trên bộ nhớ rst_n
ngoài Mem_Input sẽ được lần lượt ghi vào bộ nhớ nội
Mem_real_1. Sau đó, số điểm FFT được thiết lập thông qua ena_rd Logic
rd/wr
thanh ghi nội. Kết thúc việc thiết lập, tín hiệu ena_fft được ena_wr Block
kích thích và quá trình tính FFT được bắt đầu. Trong quá trình
thực hiện thuật toán FFT, khối FFT_CORE đảm nhận việc
tính toán cho nửa cánh bướm đơn vị. Khi một cánh bướm đơn Hình 4. Kiến trúc khối bộ nhớ nội
463
463
Khối bộ nhớ nội đơn giản là các kiến trúc bộ nhớ thư viện có được chính xác, mô hình điều khiển với các trạng thái chi tiết
sẵn của công nghệ 130nm mà bài báo tiếp cận, tuy nhiên để có được mô tả bởi hình 7 và bảng 4.
thể sử dụng linh hoạt các khối kiến trúc này, một bộ điều
khiển đi kèm được thiết kế cho phép việc đọc và ghi được hiệu
quả. Hình 4 cho thấy giao diện cũng như sự kết hợp chi tiết
giữa khối điều khiển và kiến trúc bộ nhớ nội trong thư viện có
sẵn.
b/ Khối cánh bướm đơn vị (FFT CORE)
Hình 7. Mô hình chuyển trạng thái cho khối FFT
Bảng 4. Mô tả quá trình chuyển trạng thái

Trạng thái Mô tả
RESET Reset toàn bộ khối kiến trúc FFT.
Hình 5. Mô tả cánh bướm đơn vị INITIAL Bắt đầu quá trình lấy dữ liệu từ bộ nhớ.
FIRST_ARRANGE Thực hiện phép toán đảo bit để sắp xếp
Các phép tính cấu thành khối cánh bướm đơn vị được thực chuỗi dữ liệu đầu vào ban đầu.
BUTTERFLY Thực hiện phép toán trên một cánh bướm
hiện trên số dấu chấm động 32 bit theo chuẩn IEEE 754. Tính
đơn vị.
toán một cánh bướm bản chất bao gồm một bộ cộng phức, một WAIT Tạo khoảng đợi khi cánh bướm đơn vị được
bộ trừ phức và một bộ nhân phức. Chi tiết phép toán một cánh thực thi.
bướm được thực hiện bởi hình 5 và công thức (5). Cụ thể, bộ LOOP_ARRANGE Sắp xếp chuỗi dữ liệu đầu ra sau phép toán
cộng phức có thể được tạo ra từ 2 bộ cộng thông thường, một cánh bướm.
cho phần thực và một cho phần ảo. Bộ cộng phức cũng thực
hiện được cho bộ trừ phức bằng việc đảo bit đầu tiên của số
dấu chấm động 32 bit để tiết kiệm diện tích. Bộ nhân phức bao III. THỰC NGHIỆM VÀ ĐÁNH GIÁ KẾT QUẢ
gồm một bộ cộng thực, một bộ trừ thực và 4 bộ nhân thực. Theo quy trình thiết kế ASIC, trước hết đặc tả kiến trúc FFT
Tóm lại, trong cánh bướm đơn vị có 4 bộ cộng thực và 4 bộ được thực thi bởi ngôn ngữ mô tả phần cứng Verilog ở cấp độ
nhân thực và được mô tả bởi thứ tự thực thi phép toán cho bởi
RTL. Sau đó, thiết kế được kiểm tra với tập các tín hiệu ngõ
hình 6 và các phép toán tương ứng ở công thức (5). Tương
ứng mỗi phép toán số dấu chấm động 32 bit tốn 10 chu kỳ. Do vào ngẫu nhiên thay đổi. Các kết quả tương ứng được so sánh
đó, với kiến trúc tương ứng như hình 6 cho thấy ước lượng với kết quả phần mềm Matlab cho thấy mức độ chính xác của
mỗi cánh bướm hoàn tất yêu cầu 30 chu kỳ bao gồm quá trình thiết kế. Cụ thể bảng 5 khảo sát thuật toán FFT trên phần cứng
điều khiển việc đọc ghi các giá trị ngõ vào và ngõ ra. từ 8 điểm đến 1024 điểm cho thấy kết quả sai số chính xác của
thực thi phần cứng so với công thức chính xác trên Matlab.
Kết quả sai số nhỏ cho thấy hiệu năng của việc áp dụng dấu
chấm động.
Bảng 5. So sánh kết quả mô phỏng phần cứng và phần mềm

Sai số trung bình của Sai số trung bình của
Số điểm
phần thực (Er) phần ảo (Ei)
8 điểm 1,034 .10-7 2,649 .10-7
-7
16 điểm 2,915 .10 6,786 .10-7
32 điểm 5,278 .10-8 2,930 .10-8
-7
64 điểm 1,286 .10 2,459 .10-8
-7
128 điểm 3,083 .10 1,326 .10-8
256 điểm 1,009 .10-7 1,351 .10-8
-7
512 điểm 1,107 .10 7,432 .10-8
-7
1024 điểm 1,138 .10 9,462 .10-9
Hình 6. Mô tả chi tiết các phép toán trong cánh bướm đơn vị
Với công thức tính sai số trung bình được trình bảy ở (6) mà
c/ Khối điều khiển
trong đó n là số điểm FFT, x là kết quả mô phỏng phần cứng
Để có thể điều khiển nhịp nhàng các giá trị ngõ vào và ra bởi ngôn ngữ Verilog và y là giá trị mô phỏng phần mềm bởi
tương ứng sao cho thứ tự thực hiện ở một cánh bướm đơn vị ngôn ngữ Matlab.
464
464
n đề xuất đạt tần số vượt trội so với các thiết kế khác nhờ vào
/x y /i i việc thiết kế FFT_CORE đơn giản. Trong khi đó nếu so sánh
E i
(6) về mặt thời gian thực thi, với tần số tối đa đạt được tối ưu hơn
n các kiến trúc khác nhưng thời gian thực thi chỉ cải thiện một
phần nhỏ cho thấy việc lặp đi lặp lại quá trình tính toán một
T 10  [TFIRST ARRANGE   log 2 N - 2  cánh bướm có những hạn chế nhất định. Một trong những lợi
TBUTTERFLY &WAITE & LOOP ARRANGE  TLOOP ARRANGE ] thế khác đối với kiến trúc thiết kế đề nghị là việc mở rộng giới
hạn số điểm tính FFT lớn nhất được thực hiện một cách dễ
 10  3N  15    log 2 N - 2    2 N  13   N  2   (7) dàng ở cấp độ mức cổng mà không ảnh hưởng nhiều đến toàn
 10[ 2 N  13  log 2 N - 9] bộ hệ thống. Điều này cho thấy khả năng tái sử dụng và tính
linh động trong thiết kế phần cứng. Mặt khác, việc mở rộng số
điểm không ảnh hưởng đến diện tích thiết kế khối FFT_CORE
Với N từ 8 đến 4096 tương ứng số chu kỳ và thời gian tương
mà chỉ ảnh hưởng đến dung lượng bộ nhớ nội. Tổng cộng có 9
ứng tần số 500Mhz như bảng 6.
bộ nhớ nội được đề xuất với dung lượng là như nhau. Cụ thể
nếu thiết kế đề xuất tối đa 4096 điểm thì tương đương cần 9 bộ
Bảng 6. Số xung clock trì hoãn và thời gian tương ứng
Số điểm FFT Số chu kỳ trì hoãn Thời gian trì hoãn (ns)
nhớ nội với mỗi bộ có dung lượng 128Kb tương đối nhỏ.
8 780 1560 IV. KẾT LUẬN
16 1710 3420
32 3760 7520 Một kiến trúc vi mạch FFT động với độ chính xác cao được
64 8370 16740 giới thiệu và phân tích chi tiết. Các kết quả thu được từ quy
128 18740 37480 trình thiết kế ASIC cho thấy hiệu quả của thiết kế so với các
256 41910 83820 thiết kế tham khảo khác trong việc so sánh độ chính xác và tốc
512 93240 186480 độ cũng như độ linh động ứng dụng. Việc thiết kế FFT động là
1024 206010 412020 bước đầu cho việc hoàn chỉnh một kiến trúc trích đặc trưng
2048 451900 903800 MFCC động mà có thể áp dụng cho hầu hết các hệ thống nhận
4096 984510 1969020 dạng giọng nói mà thích nghi với các chất giọng khác nhau
cũng như số lượng nhận dạng sẽ là các công việc sắp tới cần
Bảng 7. So sánh kết quả tổng hợp xuống lớp cổng thực hiện.
Số Công Thời gian
Công Tần Số
Tác Giả Điểm suất thực thi Acknowledgement - Nghiên cứu này được tài trợ bởi Bộ Khoa
Nghệ (MHz)
FFT (mW) FFT Học và Công Nghệ qua đề tài có mã số KC.01.23/11-15.
GIN-DER ASIC 256 100 89,18 10.4 µs
WU [2] (0.18µm) TÀI LIỆU THAM KHẢO
Chin-Teng ASIC 256 100 22.37 - [1] Teo Cupaiuolo, Daniele Lo Iacono, "A Flexible and Fast Software
Lin [3] (0.13µm) Implementation of FFT on the BPE platform" in Design, Automation &
Dongsuk ASIC 1024 19 - 6,7 µs Test in Europe Conference & Exhibition, March 2012, pp.1467-1470.
Jeon [4] (65 nm) [2] Gin-der Wu, Ying Lei, "A Register Array Based Low Power FFT
Lihong Jia ASIC 128 50 400 3 µs Processor" in Journal of Information Science and Engineering, vol.24,
[5] (0.6µm) Issue 3, pp. 981-991, 2008.
[3] Chin-Teng Lin, Yuan-Chu Yu, Lan-Da Van, "Cost-Effective Triple-
Atin FPGA 8 51 - 19.598 ns Mode Reconfigurable Pipeline" in IEEE Transactions On Very Large
Scale Integration (VLSI) Systems, vol. 16, no. 8, pp. 1058-1071, 2008.
Mukherjee[6] (Xilinx
Virtx-6) [4] Dongsuk Jeon, Mingoo Seok, Chaitali Chakrabarti, David Blaauw,
Dennis Sylvester, "Energy-Optimized High Performance FFT
K. Umapathy ASIC 128 40 - 40 µs Processor" in ICASSP, 2011, pp. 1701-1704.
[8] (90 nm)
[5] Lihong Jia, Bingxin Li, Yonghong Gao, Hannu Tenhunen,
Ediz Çetin ASIC 256 40 - 102,4 µs "Implementation of A Low Power 128-Point FFT" in Solid-State and
[9] (0.7µm) Integrated Circuit Technology, Beijing, 1998, pp.369-372.
FFT đề nghị ASIC 8- 500 3.44 1.5µs- [6] Atin Mukherjee, Amitabha Sinha, Debesh Choudhury, "A Novel
(130nm) 4096 1.969ms Architecture of Area Efficient FFT" in ACM SIGARCH Computer
Architecture News, December 2014.
Dựa trên bảng 6 cho thấy số chu kỳ gần như tăng hơn gấp hai [7] Jungmin Park, "Design of a radix-8/4/2 FFT processor for OFDM" in
lần khi mà số điểm cần tính FFT tăng gấp đôi. Tuy nhiên với Iowa State University of Science and Technology, Ames, Iowa, 2011.
tần số đạt được trong quá trình tổng hợp ở lớp cổng vật lý ở [8] K. Umapathy, D. Rajaveerappa, "Low Power 128-Point Pipeline FFT
Processor using Mixed Radix 4/2 for MIMO OFDM Systems" in
công nghệ 130nm là 500 Mhz, thời gian trì hoãn lớn nhất International Journal of Soft Computing and Engineering (IJSCE), vol.
tương ứng cấu hình lớn nhất 4096 tương đương 2 ms cho thấy 2, no. 5, pp. 177-179, November 2008.
tính khả thi đáp ứng thời gian thực. Các kết quả tổng hợp được [9] Ediz Çetin, Richard C. S. Morling, Izzet Kale, "An Integrated 256-point
so sánh với các thiết kế tham khảo khác được thống kê như Complex FFT Processor for Real-time Spectrum Analysis and
Measurement" in IEEE Proceedings of Instrumentation and
bảng 7. Dựa trên các giá trị so sánh ở bảng 7 cho thấy thiết kế MeasurementTechnology Conference, Canada, May 1997, pp.96-101.
465
465
Đánh Giá Hiệu Năng Bảo Mật của Mạng Vô Tuyến

Nhận Thức Chuyển Tiếp Đa Chặng
Chu Tiến Dũng∗ , Võ Nguyễn Quốc Bảo† , Nguyễn Lương Nhật† và Hồ Văn Cừu‡
∗ Đại Học Thông Tin Liên Lạc, Khánh Hòa
Email: chutiendung@tcu.edu.vn
† Học Viện Công Nghệ Bưu Chính Viễn Thông, TP. Hồ Chí Minh
Email: {baovnq,nhatnl}@ptithcm.edu.vn
‡ Đại Học Sài Gòn, TP. Hồ Chí Minh
Email: cuuhovan@gmail.com
Tóm tắt—Trong bài báo này, chúng tôi đánh giá hiệu tăng khả năng bảo mật của hệ thống, ví dụ [6], [7], [8],
năng bảo mật của mạng vô tuyến nhận thức chuyển tiếp [9], [10].
đa chặng sử dụng kỹ thuật lựa chọn nút chuyển tiếp tốt Trong khi các nghiên cứu nói trên chỉ đề cập đến hệ
nhất tại mỗi chặng. Cụ thể, chúng tôi đưa ra các biểu
thống vô tuyến chuyển tiếp hai chặng thì bài báo [11] đã
thức xác suất dừng bảo mật - Secure Outage Probability
(SOP) và dung lượng bảo mật khác không - Probability of đánh giá khả năng bảo mật lớp vật lý của mạng thông
Non-zero Secrecy Capacity (PrNZ) cho giao thức chuyển tin vô tuyến với nhiều chặng chuyển tiếp. Các kết quả
tiếp ngẫu nhiên-và-chuyển tiếp - Randomize-and-Forward phân tích trong bài báo đã chỉ ra các ưu điểm vượt trội
(RF) sử dụng kỹ thuật lựa chọn nút chuyển tiếp tốt nhất ở của kỹ thuật chuyển tiếp đa chặng trong bảo mật thông
mỗi chặng. Cuối cùng, các kết quả mô phỏng Monte-Carlo tin của hệ thống.
sẽ được trình bày để kiểm chứng phương pháp phân tích
Ngày nay, với sự phát triển rất nhanh của thiết bị di
và biểu thức phân tích đạt được.
Từ khóa—Vô tuyến nhận thức, Chuyển tiếp có lựa chọn, động đã làm cho nhu cầu sử dụng phổ tần vô tuyến
Dung lượng bảo mật khác không, Xác suất dừng bảo mật. gia tăng nhanh chóng. Với chính sách phân bổ phổ tần
hiện nay, các dải phổ được cấp phép theo từng nhóm
thiết bị và có phần nào đó gây khó khăn cho việc triển
I. GIỚI THIỆU khai các công nghệ vô tuyến mới [12]. Trong các giải
Mục tiêu của bảo mật thông tin ở lớp vật lý trong hệ pháp tiềm năng thì vô tuyến nhận thức là giải pháp tốt
thống thông tin vô tuyến là khai thác các đặc tính vật lý để giải quyết bài toán hạn chế về phổ tần [13], [14].
của kênh truyền vô tuyến để đảm bảo tin tức được truyền Trong hệ thống vô tuyến nhận thức, người dùng thứ cấp
an toàn đến đích [1]. Trong bảo mật thông tin lớp vật lý, - Secondary Users (SUs) có thể sử dụng tạm thời tần số
có ba tham số hiệu năng quan trọng dùng để đánh giá của người dùng sơ cấp - Primary Users (PUs) khi PUs
khả năng bảo mật của hệ thống thông tin vô tuyến, đó là: không sử dụng. Với cơ chế này, các khoảng phổ trắng
i) xác suất dừng bảo mật - Secrecy Outage Probability được tận dụng cho SUs và dẫn đến hiệu suất sử dụng
(SOP), ii) xác suất dung lượng bảo mật khác không - của toàn bộ giải tần được cải thiện đáng kể. Kết hợp
Probability of Non-zero Secrecy capacity (PrNZ) và iii) mạng vô tuyến nhận thức với truyền thông chuyển tiếp
dung lượng bảo mật - Secrecy Capacity (CS) là các tham sẽ mang lại nhiều lợi ích như mở rộng phạm vi truyền
số để [2]. tải thông tin, giảm can nhiễu cho các hệ thống khác mà
Tuy nhiên, khả năng bảo mật của hệ thống vô tuyến vẫn đảm bảo được chất lượng truyền tải tin tức từ nguồn
có thể không đảm bảo khi các điều kiện vật lý của đến đích [15], [16], [17].
kênh truyền hợp pháp kém hơn điều kiện vật lý của Trong bài báo này, chúng tôi quan tâm đến mô hình
kênh truyền không hợp pháp. Để khắc phục tình trạng nghiên cứu tổng quát của bài [11] và khảo sát khả năng
này, truyền thông chuyển tiếp hay truyền thông hợp tác bảo mật lớp vật lý khi sử dụng kỹ thuật lựa chọn nút
thường là một giải pháp tốt mà ở đó các nút chuyển tiếp chuyển tiếp tốt nhất ở từng chặng. Để đánh giá khả
sẽ hợp tác và trợ giúp để cải thiện điều kiện vật lý của năng bảo mật của hệ thống, chúng tôi phân tích và đánh
kênh truyền hợp pháp nhằm nâng cao khả năng bảo mật giá các tham số SOP và PrNZ của hệ thống trên kênh
của hệ thống thông tin vô tuyến, ví dụ: [3], [4], [5]. Một truyền fading Rayleigh. Các kết quả phân tích được đánh
xu hướng khác gần đây là sử dụng nhiễu nhân tạo nhằm giá thông qua mô phỏng Monte-Carlo trên phần mềm
466
466
Matlab. Rbi+1 là nút đích D, Rbi+1 ≡ D. Ta có thể viết

Phần còn lại của bài báo được tổ chức như sau. Mục Rbi+1 = arg max γRi ,Ri+1 . (1)
II trình bày mô hình hệ thống; Mục III trình bày chi tiết j=1,2,...,Ni+1 b j
các phân tích đánh giá hiệu năng bảo mật của hệ thống; Xét chặng thứ i với i = 1, 2, . . . , K, công suất phát của
Mục IV trình bày kết quả mô phỏng bằng phần mềm nút được chọn để chuyển tiếp là [18], [19]
Matlab, và cuối cùng Mục V là tóm tắt kết luận thông
Ith
qua các phân tích, đánh giá đã được trình bày ở trên. PRi−1 = , (2)
b γRi−1 ,P
b
II. MÔ HÌNH HỆ THỐNG với Ith là mức can nhiễu tối đa cho trước mà máy thu
sơ cấp có thể chịu đựng được.
E PU Ta ký hiệu γRi−1 ,P là độ lợi kênh truyền giữa Rbi−1
b
và PU, γRi−1 ,Ri là độ lợi kênh truyền giữa Rbi−1 và Rbi ,
b b
và γRi−1 ,E là độ lợi kênh truyền giữa Rbi và E. Ở kênh
b
truyền fading Rayleigh, các độ lợi kênh truyền γRi−1 ,P ,
b
γRi−1 ,Ri và γRi−1 ,E có phân phối mũ với thông số đặc
b b b
trưng lần lượt là λi−1,P , λi−1,i và λi−1,E .
Theo [1], dung lượng chuẩn hóa tức thời của kênh dữ
liệu là
( )
Ith γRi−1 ,Ri
b b
CRi−1 ,Ri = log2 1 +
D N0 γRi−1 ,P
S
b b
( b
)
γRi−1 ,Ri
= log2 1 + Q b b
(3)
Cluster 1 Cluster 2 Cluster K γRi−1 ,P
b
N1 Relays N 2 Relays N K Relays với Q = Ith /N0 và N0 là phương sai của nhiễu cộng.
Dung lượng chuẩn hóa tức thời của kênh nghe trộm là
Hình 1. Mô hình hệ thống chuyển tiếp đa chặng sử dụng kỹ thuật lựa ( )
chọn nút chuyển tiếp từng phần. γRi−1 ,E
CRi−1 ,E = log2 1 + Q b
. (4)
b γRi−1 ,P
b
Mô hình đề xuất xem xét của bài báo này là một hệ
Dung lượng bảo mật ở chặng thứ i là một đại lượng
thống chuyển tiếp đa chặng trong môi trường vô tuyến
lớn hơn không và được định nghĩa là sự chênh lệch
nhận thức như trình bày ở Hình 1. Trong đó, hệ thống
giữa dung lượng chuẩn hóa tức thời của kênh dữ liệu và
mạng thứ cấp bao gồm một nút nguồn (S) và một nút
kênh nghe trộm, cụ thể [1]
đích (D), có sự tồn tại một nút nghe trộm (E). Nút ( )
nguồn truyền thông tin đến nút đích thông qua nhiều i
Csec = max 0, CRi−1 ,Ri − CRi−1 ,E
b
cụm (cluster) chuyển tiếp. Chúng tôi giả sử có K cụm   b b
γRi−1 ,Ri 
giữa nút nguồn và nút đích. Mỗi cụm có số nút lần lượt  
1 + Q γ bi−1 b
R ,P 
là: N1 , N2 , ..., NK . Nút chuyển tiếp trung gian tốt nhất 
= max 0, log2  b 
γRi−1 ,E  . (5)
được lựa chọn ở mỗi cụm giải mã hoàn toàn các thông 1 + Q γ i−1
b
tin bí mật nhận được và sau đó mã hóa lại rồi chuyển

R ,P
b
tiếp đến nút đích qua kênh vô tuyến fading. Giả sử rằng Trong hệ thống truyền thông đa chặng, chặng yếu nhất
tất cả các nút được trang bị một antena và hoạt động sẽ quyết định hiệu năng của hệ thống [11]. Do đó, ta có
ở chế độ bán song công. Trong mô hình này chúng tôi thể viết dung lượng bảo mật của hệ thống như sau:
sử dụng phương pháp chuyển tiếp RF để nút nghe lén Csec = min i
Csec
không kết hợp được dữ liệu ở các chặng. i=1,2,...,K
  
γRi−1 ,Ri
1+Q γ b b
III. ĐÁNH GIÁ HIỆU NĂNG BẢO MẬT   R
i−1
,P 
= min max  
0, log2 
b
γRi−1 ,E
 .

Gọi Rbi+1 với i = 0, 1, 2, . . . , K là nút chuyển tiếp tốt i=1,2,...,K
1 + Qγ b
i−1
nhất được chọn ở cụm thứ i + 1. Với hai trường hợp đặc R
b
,P
biệt: i = 0 thì Rb0 là nút nguồn S, Rb0 ≡ S và i = K thì (6)
467
467
A. Xác suất dừng bảo mật Sử dụng phương pháp tương tự như cho (7), ta có thể
viết lại PrNZ như sau
Xác suất dừng bảo mật được định nghĩa là xác suất ( )
dung lượng bảo mật nhỏ hơn một giá trị dương cho trước ∏K γRi−1 ,Ri γRi−1 ,E
b b b
Cth . Viết theo biểu thức toán học, ta có PrNZ = Pr 1 + Q >1+Q
i=1
γRi−1 ,P γRi−1 ,P
b b
SOP = Pr (Csec < Cth ) K

∏ ( )
( ) = Pr γRi−1 ,Ri > γRi−1 ,E . (15)
i
(7)
b b b
= Pr min Csec < Cth . i=1
i=1,2,...,K ( )
Xét xác suất Pr γRi−1 ,Ri > γRi−1 ,E trong (15), sử
Giả sử rằng kênh truyền giữa các chặng là độc lập với b b b
nhau, ta viết lại (7) như (8) được trình bày ở đầu trang dụng xác suất điều kiện, ta có [20]:
( )
sau. Để tìm được SOP, ta cần phải tính Ii trong (8). Đặt Pr γRi−1 ,Ri > γRi−1 ,E
ρ = 2Cth , ta viết lại Ii như sau [20], [11] ∫ +∞
b b b
[ ]
 γRi−1 ,Ri 
= fγRi−1 ,E (x) 1 − FγRi−1 ,Ri (x) dx
1 + Q γ bi−1 b 0 b b b
 
Ii = Pr 
R
b
,P
< 2Cth  Ni
∑ ( )∫ +∞
 γR
i−1
,E  n+1 Ni
1 + Q γ bi−1 = (−1) λi−1,E
R
b
,P
n=1
n 0
∫∞ ( ) × exp (−λi−1,E x) exp (−nλi−1,i x) dx
ρ−1
= FγRi−1 ,Ri x + ρy Ni ( )
b b Q ∑ n+1 Ni λi−1,E
0 = (−1) . (16)
× fγRi−1 ,P (x) fγRi−1 ,E (y) dxdy. (9) n=1
n λ i−1,E + nλi−1,i
b b
Thay thế (16) vào (15), ta được công thức dạng tường
Khi sử dụng kỹ thuật lựa chọn nút chuyển tiếp từng phần minh của xác suất dung lượng bảo mật khác không của
ở từng chặng [21], ta có thể viết hệ thống.
γRi ,Ri+1 = max γ i i+1 (10) IV. KẾT QUẢ MÔ PHỎNG
b j j=1,2,...,i+1 Rb ,Rj
Trong phần này, chúng tôi sẽ thực hiện mô phỏng
nên hàm phân bố xác suất tích lũy của γRi−1 ,Ri , trên phần mềm Matlab để kiểm chứng các kết quả phân
( ) b b
FγRi−1 ,Ri ρ−1 x + ρy , có dạng như (11) được trình tích ở phần trên. Xem xét mô hình hệ thống ở không
Q
b b gian hai chiều với nút nguồn đặt ở vị trí (0, 0), nút đích
bày ở đầu trang sau.
đặt tại vị trí (1, 0), các nút chuyển tiếp của cụm i đặt
Thay thế (11) vào (9) và thực hiện tích phân, ta có ở vị trí (i/K, 0). Nút E được đặt tại vị trí (xE , yE ),
biểu thức dạng đóng cho Ii như (12). Cuối cùng, kết nút PU ở vị trí (xP , yP ). Khoảng cách giữa hai nút
hợp (12) và (8), ta tìm được biểu thức dạng đóng của Rbi−1 và Rbi là di−1,i = 1/K,
SOP như ở công thức (13). Trong phần tiếp theo, chúng √( khoảng )cách giữa nút
i−1 2 2
ta sẽ khảo sát xác suất dung lượng bảo mật khác không Rb và P sẽ là di−1,P = i−1
K − xP + (yP ) và
√( )2
của hệ thống. i−1 2
+ (yE ) . Độ lợi kênh truyền
di−1,E = K − xE
sử dụng mô hình suy hao đường truyền đơn giản như sau:
B. Xác suất dung lượng bảo mật khác không β β
λi−1,P = (di−1,P ) , λi−1,i = (di−1,i ) và λi−1,E =
β
Xác suất dung lượng bảo mật khác không là thông số (di−1,E ) với β là hệ số suy hao đường truyền.
bảo mật của hệ thống thể hiện xác suất mà dung lượng Trong Hình 2, chúng ta khảo sát xác suất dừng bảo
Shannon của kênh truyền dữ liệu lớn hơn kênh truyền mật theo Q. Kết quả chỉ ra rằng khi Q tăng, xác suất
nghe trộm, cụ thể: dừng bảo mật hội tụ về một hằng số và đồng thời kết
quả mô phỏng trùng khít với kết quả phân tích lý thuyết
PrNZ = Pr (Csec > 0) (14) chứng tỏ rằng phương pháp và kết quả phân tích lý thuyết
   γRi−1 ,Ri  
1+Q γ b b là hoàn toàn đúng đắn.
   i−1
R ,P   Hình 3 khảo sát mối quan hệ giữa dung lượng bảo
= Pr min max
i=1,2,...,K

0, log2 
b  > 0 .
 
γRi−1 ,E
mật khác không của hệ thống theo số lượng nút chuyển
1+Q b
γRi−1 ,P
b
tiếp có trong mỗi cụm (cluster) với giả sử rằng số nút
468
468
   γRi−1 ,Ri  
1+Q γ b b
   R
i−1
,P  
SOP = Pr 
 min max  
0, log2 
b
γRi−1 ,E
 < Cth 
 
i=1,2,...,K
1+Q b
γRi−1 ,P
b
 
    γRi−1 ,Ri  
K 
 1 + Q γ bi−1 b 
∏      
=1 − 1 − Pr  max  0, log2 
R
b
,P
 < Cth  (8)
    γRi−1 ,E  
i=1  1 + Q γ bi−1 
 R
b
,P 
� ��
Ii
( ) [ ( )]Ni
ρ−1 ρ−1
FγRi−1 ,Ri x + ρy = 1 − exp −λi−1,i x − λi−1,i ρy
b b Q Q
∑N i ( ) ( )
n Ni ρ−1
=1+ (−1) exp −nλi−1,i x exp (−nλi−1,i ρy) (11)
n=1
n Q
∫ +∞
Ii = λi−1,P exp (−λi−1,P x) λi−1,E exp (−λi−1,E y)
0
[ Ni ) ( ( ) ]
∑ Ni n ρ−1
× 1+ (−1) exp −nλi−1,i x exp (−nλi−1,i ρy) dxdy
n=1
n Q
∑Ni ( )
n Ni λi−1,P λi−1,E
=1 + (−1) ρ−1 λ (12)
n=1
n λ i−1,P + nλ i−1,i Q i−1,E + nλi−1,i ρ
K
[N ( ) ]
∏ ∑ i
n+1 Ni λi−1,P λi−1,E
SOP = 1 − (−1) (13)
i=1 n=1
n λi−1,P + nλi−1,i ρ−1
Q
λi−1,E + nλi−1,i ρ
trong các cụm ngoại trừ cụm cuối cùng chứa nút đích bảo mật khác không của mô hình khảo sát trên kênh
là bằng nhau và bằng N , cụ thể N1 = · · · = NK = N . truyền Rayleigh fading. Các kết quả tính toán được kiểm
Quan sát trên hình ta thấy rằng dung lượng bảo mật khác chứng bằng những mô phỏng máy tính. Các kết quả đã
không của hệ thống tăng khi số nút tại mỗi cụm tăng. thể hiện rằng số nút tại mỗi cụm ảnh hưởng đáng kể lên
Kết quả này cho thấy với nhiều nút chuyển tiếp tại mỗi hiệu năng bảo mật của hệ thống.
cụm sẽ có nhiều cơ hội để lựa chọn nút chuyển tiếp tốt LỜI CẢM ƠN
nhất dẫn đến hiệu năng bảo mật của mô hình được cải
thiện đáng kể. Nghiên cứu này được tài trợ bởi Bộ Giáo Dục và Đào
Tạo và Trường Đại Học Sài Gòn trong đề tài mã số
V. KẾT LUẬN B2014-45-02.
Trong bài báo này, chúng tôi đã khảo sát hiệu năng TÀI LIỆU THAM KHẢO
bảo mật của mạng vô tuyến nhận thức chuyển tiếp đa [1] C. Shannon, “Communication theory of secrecy systems,” Bell
chặng sử dụng kỹ thuật lựa chọn nút chuyển tiếp ở từng system technical journal, vol. 28, no. 4, pp. 656–715, 1949.
[2] P. K. Gopala, L. Lifeng, and H. El Gamal, “On the secrecy
chặng. Cụ thể, chúng tôi đã đưa ra các biểu thức dạng capacity of fading channels,” IEEE Transactions on Information
đóng tính xác suất dừng bảo mật và xác suất dung lượng Theory, vol. 54, no. 10, pp. 4687–4698, 2008.
469
469
schemes for dual-hop networks under security constraints with

0.56
multiple eavesdroppers,” IEEE Transactions on Wireless Com-
Mo phong munications, vol. 12, no. 12, pp. 6076–6085, 2013.
0.55 [6] I. Krikidis, J. S. Thompson, P. M. Grant, and S. McLaughlin,
Ly thuyet
“Power allocation for cooperative-based jamming in wireless
0.54 networks with secrecy constraints,” in Proc. of 2010 IEEE
GLOBECOM Workshops (GC Wkshps), pp. 1177–1181.
Xac suat dung bao mat
0.53
[7] Z. Ding, K. Leung, D. Goeckel, and D. Towsley, “Opportunistic
relaying for secrecy communications: Cooperative jamming vs.
relay chatting,” IEEE Transactions on Wireless Communications,
0.52
vol. 10, no. 6, pp. 1725 – 1729, 2011.
[8] T. Koike-Akino and D. Chunjie, “Secrecy rate analysis of jam-
0.51 ming superposition in presence of many eavesdropping users,”
in Proc. of 2011 IEEE Global Telecommunications Conference
0.5 (GLOBECOM 2011), pp. 1–6.
[9] Y. Liu, J. Li, and A. Petropulu, “Destination assisted cooperative
0.49 jamming for wireless physical layer security,” IEEE Transactions
on Information Forensics and Security, vol. 8, no. 4, pp. 682 –
0.48
694, 2013.
−5 0 5 10 15 20 25 [10] T. Tran and H. Kong, “CSI-secured orthogonal jamming method
Q (dB) for wireless physical layer security,” IEEE Communications
Letters, vol. 18, no. 5, pp. 841 – 844, 2014.
[11] V. N. Q. Bao and N. L. Trung, “Multihop decode-and-forward re-
Hình 2. Xác suất dừng bảo mật biểu diễn theo giá trị Q khi β = 3,
lay networks: Secrecy analysis and relay position optimization,”
xE = 1, yE = 0.25, xP = −0.5, yP = −0.5, Cth = 0.75, K =
REV Journal on Electronics and Communication, vol. 2, no. 1-2,
2, N1 = 2, N2 = 2.
2012.
[12] I. F. Akyildiz, L. Won-Yeol, M. C. Vuran, and S. Mohanty, “A
survey on spectrum management in cognitive radio networks
1 [cognitive radio communications and networks],” IEEE Trans-
actions on Communications, vol. 46, no. 4, pp. 40–48, 2008,
0.95 0163-6804.
Xac suat dung luong bao mat khac khong
[13] R. Berry, M. L. Honig, and R. Vohra, “Spectrum markets: mo-

0.9 tivation, challenges, and implications,” IEEE Communications
Magazine, vol. 48, no. 11, pp. 146–155, 2010.
0.85 [14] W. Webb, “On using white space spectrum,” IEEE Communica-
tions Magazine, vol. 50, no. 8, pp. 145–151, 2012.
0.8 [15] V. N. Q. Bao and T. Q. Duong, “Outage analysis of cognitive
multihop networks under interference constraints,” IEICE Trans
0.75 Commun, vol. E95-B, no. 03, pp. 1019–1022, 2012.
[16] V. N. Q. Bao, T. Q. Duong, and C. Tellambura, “On the perfor-
0.7
mance of cognitive underlay multihop networks with imperfect
channel state information,” IEEE Transactions on Communica-
0.65
tions, vol. 61, no. 12, pp. 4864–4873, 2013.
Mo phong [17] T.-T. Tran, V. N. Q. Bao, V. Dinh Thanh, and T. Q. Duong,
0.6
Ly thuyet “Performance analysis and optimal relay position of cognitive
spectrum-sharing dual-hop decode-and-forward networks,” in
0.55
1 2 3 4 5 6 7 8 9 10 Proc. of the 2013 International Conference on Computing,
N Management and Telecommunications (ComManTel), pp. 269–
273.
[18] V. N. Q. Bao and B. Dang Hoai, “A unified framework for
Hình 3. Xác suất dung lượng bảo mật khác không biểu diễn theo giá performance analysis of DF cognitive relay networks under
trị N khi β = 3, xE = 1, yE = 0.25, xP = −0.5, yP = −0.5, interference constraints,” in Proc. 2011 International Conference
K = 2, N1 = N2 = 1 ÷ 10. on ICT Convergence (ICTC), pp. 537–542.
[19] T. Q. Duong, D. Benevides da Costa, M. Elkashlan, and
V. N. Q. Bao, “Cognitive amplify-and-forward relay networks
[3] I. Krikidis, “Opportunistic relay selection for cooperative net- over Nakagami-m fading,” IEEE Transactions on Vehicular
works with secrecy constraints,” IET Communications, vol. 4, Technology, vol. 61, no. 5, pp. 2368–2374, 2012.
no. 15, pp. 1787–1791, 2010. [20] A. Papoulis and S. U. Pillai, Probability, random variables, and
[4] E. Ekrem and S. Ulukus, “Secrecy in cooperative relay broadcast stochastic processes, 4th ed. Boston: McGraw-Hill, 2002.
channels,” IEEE Transactions on Information Theory, vol. 57, [21] V. N. Q. Bao and H. Y. Kong, “Diversity order analysis of dual-
no. 1, pp. 137–155, 2011. hop relaying with partial relay selection,” IEICE Trans Commun,
[5] V. N. Q. Bao, N. Linh-Trung, and M. Debbah, “Relay selection vol. E92-B, no. 12, pp. 3942–3946, 2009.
470
470
Hội
Hội ThảoQuốc
Thảo QuốcGia
Gia 2015
2015 về
về Điện
ĐiệnTử,
Tử, Truyền
TruyềnThông
ThôngvàvàCông
CôngNghệ Thông
Nghệ Tin (ECIT
Thông 2015)
Tin (ECIT 2015)
Khảo Sát Sự Ảnh Hưởng Của Phần Cứng Không

Hoàn Hảo Lên Mạng Chuyển Tiếp Đa Chặng Trong
Các Môi Trường Fading Khác Nhau
Phạm Minh Quang, Trần Trung Duy và Võ Nguyễn Quốc Bảo
Phòng Thí Nghiệm Thông Tin Vô Tuyến
Học Viện Công Nghệ Bưu Chính Viễn Thông.
Email: {phamminhquang,trantrungduy,baovnq}@ptithcm.edu.vn.
Tóm tắt nội dung—Trong bài báo này, chúng tôi khảo sát tuyến là không hoàn hảo trong thực tế, bởi sự nhiễu pha, sự
hệ thống mạng vô tuyến chuyển tiếp đa chặng với sự ảnh hưởng không cân bằng I/Q và sự không tuyến tính trong bộ khuếch
của phần cứng không hoàn hảo. Thông tin trong hệ thống truyền đại [9]–[13]. Các nghiên cứu công bố của tác giả Björnson
thông đa chặng được truyền từ nguồn tới đích thông qua các nút
và các tác giả khác thực hiện đánh giá hiệu năng của các mô
chuyển tiếp sử dụng kỹ thuật giải mã-chuyển tiếp DF (Decode-
and-Forward). Hiệu năng của hệ thống khảo sát được phân tích hình chuyển tiếp hai chặng dưới sự tác động của phần cứng
và đáng giá thông qua tham số xác suất dừng OP và dung lượng không hoàn hảo [9], [10]. Sự không hoàn hảo của phần cứng
kênh Shannon trung bình trong mô hình kênh truyền Nakagami- thiết bị sẽ gây ra can nhiễu đến các tín hiệu thu phát, do đó
m và kênh truyền Rician. Kết quả mô phỏng Monte-Carlo cho sẽ ảnh hưởng đến hiệu năng của các hệ thống truyền thông
thấy phù hợp chính xác với kết quả phân tích lý thuyết. vô tuyến [14]–[16]. Ảnh hưởng của phần cứng không lý tưởng
Index Terms—chuyển tiếp đa chặng, xác suất dừng, dung lượng lên hiệu năng bảo mật của hệ thống MIMO nhận thức đã được
kênh Shannon, phần cứng không hoàn hảo. phân tích, nút chuyển tiếp sử dụng kỹ thuật truyền bán song
công và song công trong mô hình kênh truyền Rayleigh [17].
Trong [18], hiệu năng của mạng truyền thông chuyển tiếp
I. GIỚI THIỆU
sử dụng kỹ thuật khuếch đại-chuyển tiếp AF (Amplify-and-
Ngày nay, mạng truyền thông không dây đem lại nhiều ứng Forward) hai chiều đã được phân tích trong trường hợp phần
dụng cho người dùng nhờ vào những tiện ích mà nó mang cứng không hoàn hảo. Trong bài báo này, chúng tôi trình bày
lại, do đó yêu cầu mở rộng vùng phủ sóng và chất lượng dịch khảo sát mô hình mạng chuyển tiếp đa chặn trong các môi
vụ ngày càng được nâng cao. Nhiều kỹ thuật được áp dụng trường fading với phần cứng không hoàn hảo. Các công trình
để nâng cao hiệu năng của hệ thống mạng truyền thông vô nghiên cứu trước đây tập trung chủ yếu vào nghiên cứu hiệu
tuyến như: vô tuyến nhận thức, truyền thông hợp tác, mạng năng của hệ thống truyền thông trên kênh truyền Rayleigh.
chuyển tiếp, kỹ thuật thu thập năng lượng. Kỹ thuật vô tuyến Trong báo cáo [13], các tác giả đã nghiên cứu hiệu năng của
nhận thức được đề xuất bởi tác giả Mitola [1], nhằm mục đích hệ thống truyền thông vô tuyến hai chặn có sự ảnh hưởng phần
nâng cao dung lượng cho những hệ thống mạng vô tuyến khan cứng không hoàn hảo và nhiễu đồng kênh CCI (Co-Channel
hiếm tài nguyên phổ [2]. Vô tuyến nhận thức cho phép chia Interference) trong mô hình kênh truyền fading Rayleigh. Tuy
sẻ một cách linh hoạt tài nguyên phổ giữa các nút mạng với nhiên, trong thực tế, hệ thống tryền thông chuyển tiếp có thể
nhau, dựa trên những thông tin kênh truyền được biết trước. có các kênh truyền có các phân phối thống kê khác nhau. Vì
Bên cạnh đó, một phương pháp được sử dụng để tăng chất vậy, chúng tôi trình bày kết quả nghiên cứu đánh giá hiệu năng
lượng dịch vụ QoS trong việc truyền dữ liệu ở lớp vật lý là kỹ hệ thống vô tuyến chuyển tiếp đa chặng trong mô hình kênh
thuật truyền thông cộng tác [3]. Các nút chuyển tiếp (relay) truyền fading Nakagami-m và kênh Rician, hai mô hình kênh
được sử dụng trong hệ thống truyền thông vô tuyến nhằm mục truyền có phân bố mang tính tổng quát hóa. Chúng ta có thể
đích mở rộng vùng phủ sóng, tăng độ tin cậy và cải thiện chất xác định hiệu năng của kênh truyền vô tuyến đơn giản như
lượng dịch vụ đến người dùng, nhờ vào giá thành rẻ và có thể kênh truyền Rayleigh là một trường hợp đặc biệt của mô hình
triển khai linh hoạt hệ thống các nút mạng chuyển tiếp. Nhiều kênh truyền fading Nakagami-m hay kênh Rician. Để đánh giá
nghiên cứu lý thuyết và thực tế về mạng vô tuyến chuyển tiếp hiệu năng của hệ thống khảo sát, chúng tôi giả sử đơn giản
đã được công bố trong thập niên vừa qua [4]–[8]. Trong báo rằng các nút chuyển tiếp được đặt ở những khoảng cách đều
cáo [5], hiệu năng của hệ thống truyền thông vô tuyến với nhau từ nút nguồn đến nút đích. Thông tin từ nguồn truyền
các nút chuyển tiếp có độ lợi cố định được trình bày. Các loại đích qua tất cả các nút chuyển tiếp, trong đó các nút chuyển
relay khác nhau đã được nghiên cứu và khảo sát sử dụng cho tiếp sử dụng kỹ thuật giải mã-chuyển tiếp DF (Decode-and-
mạng WiMAX và hệ thống thông tin di động LTE [7]. Tuy Forward) [4]. Do đó, để hệ thống truyền thông xuyên suốt, bất
nhiên, các nghiên cứu liên quan đến truyền thống vô tuyến kỳ một nút chuyển tiếp nào thuộc hệ thống phải đảm bảo thành
hầu hết đều giả sử rằng phần cứng của các thiết bị là hoàn công trong việc thu nhận và phát chuyển tiếp thông tin đến
hảo. Thực tế là, phần cứng của các thiết bị truyền thông vô nút chuyển tiếp tiếp theo hướng về đích cuối cùng. Hiệu năng
471
ISBN: 978-604-67-0635-9 471

HộiHội
Thảo Quốc
Thảo Gia
Quốc 2015
ĐiệnTử,
Tử,Truyền
NghệThông
ThôngTinTin (ECIT
(ECIT 2015)
2015)
và thiết bị thu nút Ni không hoàn hảo, công thức (1) được
1 2 M
viết lại như sau:
0 1 2 M-1 M

1 2 M yi = P d−β t r
i hi x + ηi−1 + ηi + νi , (3)
Hình 1. Mô hình chuyển tiếp đa chặng. Trong công thức (3), ηi−1t
và ηi−1
t
lần lượt là nhiễu gây ra do
méo dạng từ phần cứng của thiết bị phát nút Ni−1 và thiết
bị thu nút Ni . Nhiễu ηi−1
t
và ηi−1
t
có thể được mô hình bằng
của hệ thống khảo sát đã được phân tích để đánh giá thông nhiễu Gauss với giá trị trung bình bằng 0 và phương sai lần
qua hai thông số quan trọng của hệ thống là xác suất dừng và lượt là κti−1 và κri P |hi |2 (xem các tài liệu [13], [17]), trong
dung lượng kênh. Chúng tôi thực hiện mô phỏng Monte-Carlo đó, κti−1 và κri lần lượt là các hằng số dương mô tả độ suy
để thẩm tra kết quả phân tích lý thuyết. hao phần cứng của thiết bị phát ở nút Ni−1 và thiết bị thu ở
Phần còn lại của bài báo được tổ chức như sau: trong phần II, nút Ni . Khi đó, tỷ số công suất tín hiệu trên nhiễu tức thời
chúng tôi mô tả mô hình hệ thống được đề xuất. Trong phần được viết ra tương tự như trong [19], [20]:
III, chúng tôi đánh giá hiệu năng của hệ thống đề xuất. Phần
Ψd−β
i |hi |
2
IV cung cấp các kết quả mô phỏng và phân tích lý thuyết. γi = , (4)
Cuối cùng, chúng tôi kết luận bài báo trong phần V. θi Ψd−β 2
i |hi | + 1
trong đó, θi = κti−1 + κri là tổng suy hao phần cứng. Nghiên
II. MÔ HÌNH KHẢO SÁT cứu trình bày trong bài báo này khảo sát mô hình chuyển tiếp
đa chặng sử dụng kỹ thuật giải mã và chuyển tiếp. Do đó, tỷ
Đầu tiên, chúng ta cùng xem xét mô hình hệ thống mạng
số công suất tín hiệu trên nhiễu từ đầu cuối đến đầu cuối được
vô tuyến nhận thức chuyển tiếp được mô tả trong Hình. 1. Hệ
tính bởi công thức sau:
thống bao gồm nút nguồn (N0 ), nút đích (NM ) và các nút
chuyển tiếp Ni , trong đó chỉ số i chạy từ 1 đến M − 1 thể γe2e = min (γi )
hiện vị trí của các nút chuyển tiếp từ gần với nguồn nhất N1 i=1,2,...,M

đến xa nguồn nhất NM −1 . Các nút chuyển tiếp Ni thực hiện Ψd−β
i |hi |
2
= min . (5)
việc thu nhận tiến hiệu, giải mã, và sau đó phát chuyển tiếp θi Ψd−β 2
i |hi | + 1
i=1,2,...,M
đến nút Ni+1 . Để hệ thống truyền thông xuyên suốt, thông tin
từ nguồn truyền thành công đến đích, tất cả cách nút chuyển Kế tiếp ta xét đến dung lượng kênh Shanon tức thời C của hệ
tiếp Ni phải đảm bảo sự tiếp nhận dữ liệu của nguồn thành thống sử dụng M chặng được định nghĩa bởi:
công. Nói cách khác, mô hình hệ thống không thể truyền dữ
1
liệu từ nguồn N0 đến đích NM khi có bất kỳ một sự truyền dữ Ce2e = log2 (1 + γe2e ) , (6)
M
liệu nào từ nút Ni đến nút Ni+1 là không thành công. Bài báo
này tác giả xem xét mô hình chuyển tiếp sử dụng kỹ thuật giải trong đó, hệ số 1/M cho biết hệ thống sử dụng M khe thời
mã và chuyển tiếp DF (Decode-and-Forward). Nút N0 truyền gian để truyền dữ liệu.
dữ liệu đến nút N1 trong khe thời gian thứ nhất. Nếu nút N1
giải mã thành công, nút này sẽ thực thiện việc gửi dữ liệu đến III. ĐÁNH GIÁ HIỆU NĂNG HỆ THỐNG
nút N2 trong khe thời gian thứ hai. Quá trình này cứ lặp lại
như thế qua toàn bộ các nút chuyển tiếp và đến đích. Trong bài báo nghiên cứu này, hiệu năng của hệ thống sẽ
Xét sự truyền nhận dữ liệu ở chặng thứ i giữa nút Ni−1 và được nghiên cứu và đánh giá thông qua hai tham số quan
Ni , sử dụng mô hình suy hao đơn giản, tín hiệu nhận được tại trọng: xác suất dừng (Outage Probability (OP)) và dung lượng
Ni với phần cứng hoàn hảo có thể được biểu diễn bằng công kênh Shanon trung bình (Average Channel Capacity (CC)) trên
thức sau: các kênh truyền fading khác nhau.

yi = P d−βi hi x + ν i , (1)
A. Xác suất dừng (OP) và dung lượng kênh Shannon trung
trong đó, P là công suất phát của nút Ni−1 và cũng là công bình (CC)
suất phát của tất cả các nút khác), β biểu diễn hệ số suy hao Một trong những tham số đánh giá hiệu năng quan trọng
đường truyền, hi và di lần lượt biểu diễn hệ số kênh truyền cho hệ thống là xác suất dừng, được định nghĩa xác suất mà
và khoảng cách giữa các nút Ni−1 và Ni , νi là nhiễu Gauss dung lượng kênh tức thấp hơn một tốc độ cho phép. Xác suất
cộng vào tín hiệu nhận được ở nút Ni . dừng từ đầu cuối đến đầu cuối của hệ thống truyền thông đa
Từ công thức (1), ta có thể xây dựng biểu thức tỷ số công suất chặng được tính một cách tổng quát như sau:
tính hiệu trên nhiễu giữa Ni−1 và Ni như sau:
OP = Pr [Ce2e < Rth ] = Fγe2e (ρth ) . (7)
P d−β
i |hi |
2
γi = = Ψd−β 2
i |hi | , (2) Trong công thức (7), Rth là ngưỡng tốc độ dừng, ρth =
N0
2M Rth − 1 là ngưỡng dừng của tỷ số tín hiệu trên nhiễu và
với Ψ = P/N0 là tỷ số công suất phát và phương sai của Fγe2e (ρth ) là ký hiệu của hàm phân phối tích luỹ (CDF) của
nhiễu Gauss N0 . Nếu phần cứng của thiết bị phát nút Ni−1 biến ngẫu nhiên γe2e . Giả sử các chặng từ nguồn đến đích là
472
472
Hội
Hội Thảo
Thảo Quốc Gia2015
Quốc Gia 2015vềvềĐiện
Điện Tử,Truyền
Tử, Truyền Thông
Thông và và Công
Công Nghệ
Nghệ Thông
Thông Tin (ECIT
Tin (ECIT 2015)2015)
độc lập, thay kết quả trong công thức (5) vào trong công thức B. Kênh truyền Fading
(7), xác suất dừng của hệ thống được viết lại: 1) Kênh Nakagami-m: Trong mô hình kênh truyền này,
OP = Fγe2e (ρth ) hi là hệ số kênh truyền fading Nakagami-m và độ lợi kênh
truyền là biến ngẫu nhiên có phân bố Gamma. Hàm CDF CDF
Ψd−β
2
i |hi | Fγe2e (x) có thể được đưa ra như sau:
= Pr min < ρth
θi Ψd−β
2
i=1,2,...,M |hi | + 1
i γ (mi , mi x)
Fγi (x) = , (13)
Ψd−β
2
i |hi | Γ(mi )
= 1 − Pr min ≥ ρth
θi Ψd−β
2
i |hi | + 1
i=1,2,...,M
trong đó, Γ(.) và γ (., .) lần lượt là kí hiệu của hàm
M
Ψd−β
i |hi |
2
Gamma [21, eq. (8.310.1)] và hàm Gamma không hoàn
=1− 1 − Pr < ρth chỉnh [21, eq. (8.350.1)]; với mi là hệ số của kênh fading
θi Ψd−β
2
i=1 i |hi | + 1
Nakagami-m tại chặng i. Trong bài báo này, để đơn giản
M
dβ ρth tính toán, ta giả sử rằng giá trị trung bình của γi bằng 1
=1− 1 − Pr (1 − θi ρth ) γi < i , (8)
Ψ (E {γi } = 1). Thay (13) vào (10), xác suất dừng OP của mô
i=1
hình khảo sát được tính bằng một biểu thức dạng tường minh
trong đó, γi = |hi |2 là độ lợi kênh truyền của chặng thứ i. như sau:
Xét riêng xác suất trong công thức (8), ta có:
OP = Fγe2e (ρth )

dβi ρth ρth ≥ 1/θmax ,
Pr (1 − θi ρth ) γi < 1,
 β
Ψ =
mi d ρth
i

M γ mi ,
Ψ(1−θi ρth )

1 − 1− , ρth < 1/θmax .
1, ρth ≥ 1/θi ,
Γ(mi )
i=1
= dβ
i ρth
(9) (14)
Fγi Ψ(1−θi ρth ) , ρth < 1/θi ,
ở đây, Fγi (.) là hàm CDF của biến ngẫu nhiên γi . Sử dụng (14) cho (12), ta có thể tính chính xác dung lượng
Thay (9) vào trong (8), ta có: kênh trung bình CC như trong công thức số (15)

1/θ

M γ (mi ,mi dβ
i x/Ψ/(1−θi x))
OP = Fγe2e (ρth ) max 1 − Γ(mi )
 1 i=1
1, ρth ≥ 1/θmax , CC = dx .
M M ln 2 1+x
= dβ ρ
i th 0
1 − 1 − Fγi Ψ(1−θ i ρth )
, ρth < 1/θmax , (15)
i=1
(10)
Ở đây, tích phân trong công thức (15) có thể dễ dàng tính
với θmax = max (θi ) là mức suy hao phần cứng lớn nhất được bằng các phần mềm máy tính như MATLAB hay
i=1,2,...,M
MATHEMATICA.
trên toàn chặng. Công thức (10) cho thấy rằng một khi ngưỡng
2) Kênh Rician: Đối với kênh truyền Rician, hàm CDF của
dừng ρth lớn hơn 1/θmax , hệ thống khảo sát sẽ luôn bị dừng
độ lợi kênh γi có thể được xác định như sau:
bất chấp các thông số còn lại.

Tiếp theo, dung lượng kênh trung bình của hệ thống CC được Fγi (x) = 1 − Q1 2Ki , 2 (1 + Ki ) x , (16)
biểu diễn bởi công thức (11) bên dưới

+∞ với Ki là hệ số Rician tại chặng thứ i và Q1 (., .) là hàm
1 Marcum-Q. Kết hợp (16) và (10), OP được đưa ra như bên
CC =E {Ce2e } = ln (1 + x) fγe2e (x) dx , (11)
M ln 2 dưới:
0
OP = Fγe2e (ρth )
với E {.} là ký hiệu của toán tử tính giá trị trung bình và 
fγe2e (x) là hàm mật độ xác suất của biến ngẫu nhiên γe2e . 


1,   ρth ≥ 1/θmax ,
Để đánh giá hiệu năng của hệ thống, việc quan trọng nhất
= M √ 2 (1 + Ki )
là tìm hàm CDF Fγe2e (x). Nếu xác định được hàm CDF 
 1− Q1 2Ki ,
dβ
i ρth
, ρth < 1/θmax .
 i=1 × Ψ(1−θ
Fγe2e (x), hàm mật độ xác suất (PDF) fγe2e (x) sẽ tính được ρ i th )
bằng cách lấy đạo hàm Fγe2e (x) theo x . Tuy nhiên, một khi (17)
chúng ta đã có được hàm CDF Fγe2e (x), sử dụng tích phân
từng phần cho (11), ta có thể viết lại CC dưới dạng sau: Rồi thì, dung lượng kênh trung bình được đưa ra dưới dạng
1/θmax tích phân một lớp:
1 1 − Fγe2e (x)
CC = dx . (12)
M √ dβ
M ln 2 0 1+x 1/θ i x
max Q1 2Ki , 2 (1 + Ki ) Ψ(1−θ i x)
1 i=1
Ở phần tiếp theo, chúng tôi sẽ khảo sát các kênh truyền fading CC = dx.
M ln 2 1+x
khác nhau như kênh Nakagami-m và kênh Rician. Đây là 0
những kênh truyền tổng quát và thông dụng trong thực tế. (18)
473
473
HộiHội
Thảo Quốc
Thảo Gia
Quốc 2015
ĐiệnTử,
Tử,Truyền
NghệThông
ThôngTinTin (ECIT
(ECIT 2015)
2015)
Hình 2. Xác suất dừng (OP) được vẽ là một hàm của Ψ = P/N0 (dB) khi Hình 3. Dung lượng kênh trung bình (CC) được vẽ là một hàm của Ψ =
M = 3 , Rth = 0.8, κ = 0.05 và m = 1, 1.5, 2. P/N0 (dB) khi M = 2 , κ ∈ {0, 0.02, 0.05} và m = 2.
Cuối cùng của phần này, chúng ta xét một trường hợp đặc biệt thiết lập như sau: số chặng bằng 3 (M = 3), tốc độ ngưỡng
đó là kênh fading Rayleigh. Ta dễ dàng thấy rằng khi các hệ số bằng 0.8 (Rth = 0.8), hệ số suy hao phần cứng (κ = 0.05)
mi = 1 (hoặc Ki = 0), kênh truyền Nakagami-m (hoặc kênh và hệ số kênh Nakagami-m là 1, 1.5 và 2 (m = 1, 1.5, 2).
Rician) sẽ trở thành kênh Rayleigh. Lúc đó, xác suất dừng và Quan sát từ hình vẽ, ta có thể thấy rằng xác suất dừng OP
dung lượng kênh Shannon trung bình được thu gọn như trong giảm theo chiều tăng của tỷ lệ công suất tín hiệu trên nhiễu
(19) và (20): Ψ. Hơn nữa, OP của mô hình khảo sát cũng giảm khi hệ số
OP = Fγe2e (ρth ) kênh Nakagami-m (m) tăng.
 Hình vẽ 3 khảo sát sự ảnh hưởng của mức độ suy hao phận
1, M ρth ≥ 1/θmax , cứng lên dung lượng kênh trung bình của hệ thống trên kênh
= dβ
i ρth
(19)
1 − exp − Ψ(1−θi ρth ) , ρth < 1/θmax .
Nakagami-m. Các thông số mô phỏng của hình vẽ được cố
i=1 định như sau: M = 2, κ = 0, 0.02, 0.05 và m = 2. Từ hình
vẽ, ta có nhận xét rằng dung lượng CC giảm đáng kể với sự
1/θ

M
dβ
i x gia tăng của hệ số κ. Hơn thế nữa, hình vẽ số 3 cho ta thấy
max exp − Ψ(1−θi x)
1 i=1 rằng một khi hệ số κ khác 0, dung lượng CC sẽ bị bão hoà ở
CC = dx . (20)
M ln 2 1+x các giá trị Ψ lớn. Trong hình vẽ 4, chúng tôi vẽ giá trị OP theo
0
sự gia tăng của hệ số suy hao phần cứng κ trên kênh truyền
Rician với các thông số thiết kế M = 3, Rth = 1, Ψ = 5 dB
IV. KẾT QUẢ và K = 1.5. Nhìn vào hình vẽ 4, ta thấy rằng giá trị OP tăng
Trong phần này, chúng tôi thực hiện các mô phỏng Monte- theo giá trị của κ và OP giảm khi hệ số kênh Rician tăng.
Carlo để kiểm chứng các công thức đã được trình bày ở phần Hơn thế nữa, như đã được chứng minh ở trên khi κ lớn hơn
III. Môi trường mô phỏng là một hệ trục tọa độ một chiều tỷ lệ nghịch của ngưỡng dừng (1/θmax ) thì hệ thống sẽ luôn
Ox, trong đó ta đặt các nút N0 , N1 , ..., NM sao cho hai nút luôn dừng. Đó là lý do tại sao ở các giá trị κ lớn thì OP của
kề nhau cách nhau một khoảng 1/M . Tức là, tọa độ của nút hệ thống luôn bằng 1.
Ni (i = 0, 1, 2, ..., M ) trong hệ trục tọa độ này là i/M và Hình vẽ cuối cùng, hình vẽ số 5, miêu tả dung lượng kênh
khoảng cách giữa hai nút Ni và Ni+1 là di = 1/M . Để đơn trung bình CC theo số chặng M trong môi trường fading
giản cho tiến trình mô phỏng, chúng tôi giả sử hệ số suy hao Rayleigh với các thông số hệ thống Ψ = −5.5 dB và κ = 0.05.
đường truyền bằng 4 (β = 4), hệ số kênh truyền Nakagami-m Rõ ràng rằng, số chặng M ảnh hưởng đến hiệu năng của hệ
tại các chặng bằng nhau và bằng m (mi = m), hệ số kênh thống. Thứ nhất, nếu số chặng là nhỏ thì khoảng cách giữa hai
Rician tại tất cả các chặng bằng nhau và bằng K (Ki = K) nút gần kề sẽ tăng (1/M tăng) và như vậy sẽ giảm hiệu năng
và tổng suy hao phần cứng tại các chặng bằng nhau và bằng truyền dữ liệu tại mỗi chặng. Ở chiều ngược lại, khi tăng số
θ (θi = θ). chặng M lên, ta có thể nâng cao độ tin cậy của việc truyền
Trong hình vẽ 2, xác suất dừng hệ thống được vẽ theo sự dữ liệu tại mỗi chặng, tuy nhiên dung lượng của toàn trình sẽ
biến thiên của Ψ (P/N0 )(từ -10 dB đến 10 dB) trên kênh giảm vì tốc độ truyền dữ liệu được chia cho số chặng M (xem
truyền Nakagami-m. Các thông số khác trong hình vẽ được công thức số (6)). Như đã được thấy từ hình vẽ số 5, dung
474
474
HộiHội
Thảo Quốc
Thảo Gia
Quốc Gia2015
2015về
vềĐiện
Điện Tử,
Tử,Truyền
Nghệ Thông
Thông TinTin (ECIT
(ECIT 2015)
2015)
chuyển tiếp đa chặng sử dụng các nút mạng giải mã và chuyển

tiếp. Cụ thể, chúng tôi đưa ra các biểu thức tính chính xác hiệu
năng xác suất dừng và dung lượng kênh Shannon trung bình
trên các kênh truyền tổng quát như Nakagami-m và Rician. Sự
chính xác của các phân tích lý thuyết được kiểm chứng bằng
mô phỏng máy tính. Hơn nữa, các kết quả đưa ra những đặc
tính của hệ thống mà từ đó giúp cho những nhà thiết kế mạng
sử dụng trong việc tối ưu hệ thống. Cuối cùng, bởi vì nghiên
cứu này chỉ tập trung vào hệ thống đa chặng một đường từ
nguồn tới đích, vì thế việc triển khai hệ thống đa chặng nhiều
đường (multi-path) trên các mô hình kênh tổng quát sẽ là công
việc tương lai của chúng tôi.
LỜI CẢM ƠN
Nghiên cứu này được tài trợ bởi Quỹ Phát triển khoa học và
công nghệ Quốc gia (NAFOSTED) trong đề tài mã số 102.01-
2014.33.
Hình 4. Xác suất dừng (OP) được vẽ là một hàm của κ khi M = 2 ,
TÀI LIỆU
M = 3, Rth = 1, Ψ = 5 dB và K = 1.5. [1] J. Mitola and J. Maguire, G.Q., “Cognitive radio: making software radios
more personal,” Pers. Commun., IEEE, vol. 6, no. 4, pp. 13–18, Aug.
1999.
[2] A. Goldsmith, S. Jafar, I. Maric, and S. Srinivasa, “Breaking spectrum
gridlock with cognitive radios: An information theoretic perspective,”
Proc. of the IEEE, vol. 97, no. 5, pp. 894–914, May 2009.
[3] J. Laneman and G. W. Wornell, “Distributed space-time-coded protocols
for exploiting cooperative diversity in wireless networks,” Inf. Theory,
IEEE Trans. on, vol. 49, no. 10, pp. 2415–2425, Oct. 2003.
[4] J. Laneman, D. Tse, and G. W. Wornell, “Cooperative diversity in
wireless networks: Efficient protocols and outage behavior,” Inf. Theory,
IEEE Trans. on, vol. 50, no. 12, pp. 3062–3080, Dec. 2004.
[5] M. Hasna and M.-S. Alouini, “A performance study of dual-hop trans-
missions with fixed gain relays,” Wireless Commun., IEEE Trans. on,
vol. 3, no. 6, pp. 1963–1968, Nov. 2004.
[6] ——, “Harmonic mean and end-to-end performance of transmission
systems with relays,” Commun., IEEE Trans. on, vol. 52, no. 1, pp.
130–135, Jan. 2004.
[7] Y. Yang, H. Hu, J. Xu, and G. Mao, “Relay technologies for wimax and
lte-advanced mobile systems,” Commun. Mag., IEEE, vol. 47, no. 10,
pp. 100–105, Oct. 2009.
[8] Y. Hua, D. W. Bliss, S. Gazor, Y. Rong, and Y. Sung, “Guest editorial
theories and methods for advanced wireless relays, issue i,” Sel. Areas
in Commun., IEEE J. on, vol. 30, no. 8, pp. 1297–1303, Sept. 2012.
[9] E. Bjornson, A. Papadogiannis, M. Matthaiou, and M. Debbah, “On the
impact of transceiver impairments on af relaying,” in Acoustics, Speech
and Signal Process. (ICASSP), 2013 IEEE Int. Conf. on, May 2013, pp.
4948–4952.
Hình 5. Dung lượng kênh trung bình (CC) được vẽ là một hàm của M (dB) [10] E. Bjornson, J. Hoydis, M. Kountouris, and M. Debbah, “Hardware
khi Ψ = −5.5 dB và κ = 0.05. impairments in large-scale miso systems: Energy efficiency, estimation,
and capacity limits,” in Digital Signal Process. (DSP), 2013 18th Int.
Conf. on, Jul. 2013, pp. 1–6.
[11] E. Bjornson, M. Matthaiou, and M. Debbah, “A new look at dual-hop
lượng trung bình biến thiên theo sự thay đổi của số chặng. relaying: Performance limits with hardware impairments,” Commun.,
Hơn thế nữa, luôn tồn tại một giá trị M mà ở đó dung lượng IEEE Trans. on, vol. 61, no. 11, pp. 4512–4525, Nov. 2013.
[12] E. Bjornson, J. Hoydis, M. Kountouris, and M. Debbah, “Massive mimo
của hệ thống là lớn nhất. Cụ thể, khi Ψ = −5 dB thì số chặng systems with non-ideal hardware: Energy efficiency, estimation, and
tốt nhất là 3, trong khi ở trường hợp còn lại số chặng tối ưu capacity limits,” Inf. Theory, IEEE Trans. on, vol. 60, no. 11, pp. 7112–
là 1. 7139, Nov. 2014.
[13] T. T. Duy, T. Duong, D. Benevides da Costa, V. N. Q. Bao, and
Cuối cùng, chúng tôi muốn nhấn mạnh rằng trên tất cả các M. Elkashlan, “Proactive relay selection with joint impact of hardware
hình vẽ đã được thể hiện, kết quả mô phỏng và kết quả lý impairment and co-channel interference,” Commun., IEEE Trans. on,
thuyết trùng với nhau, điều đó minh chứng cho những phân vol. 63, no. 5, pp. 1594–1606, May 2015.
tích của chúng tôi trong phần III là chính xác. [14] L. Feng and W. Namgoong, “Spc09-4: A hardware impairment compen-
sation scheme with cascaded adaptive filters,” in Global Telecommun.
Conf., 2006. GLOBECOM ’06. IEEE, Nov. 2006, pp. 1–6.
V. KẾT LUẬN [15] U. Gustavsson, C. Sanchez-Perez, T. Eriksson, F. Athley, G. Durisi,
P. Landin, K. Hausmair, C. Fager, and L. Svensson, “On the impact
Trong bài báo này, chúng tôi nghiên cứu kỹ sự ảnh hưởng of hardware impairments on massive mimo,” in Globecom Workshops
của phần cứng không hoàn hảo lên hiệu năng của hệ thống (GC Wkshps), 2014, Dec. 2014, pp. 294–300.
475
475
[16] M. Lei, I. Lakkis, C.-S. Sum, T. Baykas, J.-Y. Wang, M. Rahman,

R. Kimura, R. Funada, Y. Shoji, H. Harada, and S. Kato, “Hardware
impairments on ldpc coded sc-fde and ofdm in multi-gbps wpan (ieee
802.15.3c),” in Wireless Commun. and Networking Conf., 2008. WCNC
2008. IEEE, Mar. 2008, pp. 442–446.
[17] T. T. Duy, V. N. Q. Bao, and T. Duong, “Secured communication in
cognitive mimo schemes under hardware impairments,” in Advanced
Tech. for Commun. (ATC), 2014 Int. Conf. on, Oct. 2014, pp. 109–112.
[18] N. H. Nhat, V. N. Q. Bao, N. L. Trung, and M. Debbah, “Relay selection
in two-way relaying networks with the presence of hardware impairment
at relay transceiver,” in Advanced Tech. for Commun. (ATC), 2014 Int.
Conf. on, Oct. 2014, pp. 616–620.
[19] T. T. Duy, N. Q. Dien, L. G. Thien, V. N. Q. Bao, and T. Hanh, “Down-
link cooperative transmission with transmit antenna selection, hardware
noises and non-independent co-channel interferences,” in The Nafosted
Conf. on Inf. and Comp. Scien. (NICS), 2015 Int. Conf. on, Sept. 2015,
pp. 316–321.
[20] T. T. Duy, P. M. Quynh, V. N. Q. Bao, T. Hanh, and D. T. Hung, “An
incremental cooperative solution for multicast cognitive network under
joint impact of hardware impairment and interference constraint,” in
The Nafosted Conf. on Inf. and Comp. Scien. (NICS), 2015 Int. Conf.
on, Sept. 2015, pp. 310–315.
[21] I. S. Gradshteyn and I. M. Ryzhik, Table of integrals, series, and
products, 7th ed. Elsevier/Academic Press, Amsterdam, 2007, translated
from the Russian, Translation edited and with a preface by Alan Jeffrey
and Daniel Zwillinger, With one CD-ROM (Windows, Macintosh and
UNIX).
476
476
HộiHội
Thảo Quốc
Thảo QuốcGia
Gia2015
2015về
Nghệ Thông
(ECIT 2015)
2015)
Đánh Giá Hiệu Năng Mạng Vô Tuyến Nhận Thức

Dạng Nền Với TAS/SC và Suy Hao Phần Cứng
Phạm Thị Đan Ngọc1,2, Tran Trung Duy2,Võ Nguyễn Quốc Bảo2, Hồ Văn Khương1 và Nguyễn Lương Nhật2
1
Đại Học Bách Khoa Thành Phố Hồ Chí Minh.
2
Học Viện Công Nghệ Bưu Chính Viễn Thông,
Email: {ngocptd, trantrungduy, baovnq, nhatnl}@ptithcm.edu.vn và khuong.hovan@gmail.ca
Tóm tắt— Trong bài báo này, chúng tôi đề xuất phương pháp lựa chặng. Hơn nữa, trong công trình [6], các tác giả đề xuất hệ
chọn cặp anten thu-phát tối ưu trong mạng MIMO vô tuyến nhận thống vô tuyến nhận thức dạng nền (underlay cognitive radio)
thức dạng nền (Multiple Input Multiple Output underlay cognitive kết hợp kỹ thuật phân tập đa người dùng hay trong công trình
radio) kết hợp kỹ thuật lựa chọn anten phát TAS (Transmit Antenna [7], nhóm các tác giả thực hiện đánh giá hiệu năng hệ thống
Selection) ở nút nguồn và kỹ thuật kết hợp chọn lựa SC (Selection
Combining) ở nút đích dưới sự tác động của phần cứng không hoàn
hai chặng chuyển tiếp cùng kỹ thuật khuếch đại và chuyển tiếp
hảo. Hiệu năng của hệ thống khảo sát được đánh giá thông qua tham (Amplify-and-forward). Bên cạnh đó, cũng còn nhiều công
số xác suất dừng của hệ thống thứ cấp (secondary system) hoạt động trình quan tâm đến vấn đề này như trong [8] và [9]. Cụ thể, bài
trên kênh truyền fading Rayleigh. Sau quá trình phân tích và đánh giá báo [8] đánh giá chính xác hiệu năng trong mạng vô tuyến
hiệu năng hệ thống, kết quả cho ta thấy rằng phương pháp đề xuất nhận thức dạng nền kết hợp kỹ thuật giải mã và chuyển tiếp
(PPDX) cho hiệu năng tốt hơn so với phương pháp thông thường (Decode-and-forward) với sự lựa chọn nút chuyển tiếp tốt
(PPTT). Bên cạnh đó, hệ thống sẽ ngừng hoạt động nếu mức độ suy nhất. Trong bài báo [9], các tác giả đã quan tâm đến việc tối
hao phần cứng cao hơn một ngưỡng xác định trước. Việc kiểm chứng ưu vị trí các nút chuyển tiếp để đạt được hiệu năng tối đa cho
tính chính xác của kết quả phân tích đối với bài toán đã đặt ra được các hệ thống khảo sát.
chúng tôi thực hiện thông qua mô phỏng Monte-Carlo trên phần mềm
Matlab.
Tuy nhiên, trong hầu hết các ấn phẩm được công bố, các
tác giả đều giả sử rằng phần cứng thu/phát của các thiết bị là
Từ khóa—Vô tuyến nhận thức, phần cứng không lý tưởng, lựa lý tưởng. Thế nhưng trong thực tế, phần cứng thường không lý
chọn anten phát, kết hợp chọn lựa, xác suất dừng. tưởng bởi sự không tuyến tính của các bộ khuếch đại, do sự
nhiễu pha hay sự mất cân bằng I/Q [10]-[12]. Ngoài ra, các tác
I. GIỚI THIỆU giả trong bài báo [13] còn xem xét hiệu năng hệ thống chuyển
tiếp hai chiều (two-way) với yếu tố phần cứng không lý tưởng.
Ngày nay, việc thông tin liên lạc đã và đang trở thành vấn Cũng khảo sát bộ thu/phát không hoàn hảo, nhóm các tác giả
đề cấp bách cũng như là thánh thức lớn đối với các nhà khoa [14] thực hiện phân tích và đánh giá hiệu năng trong mạng vô
học trên thế giới nói chung cũng như trong lĩnh vực thông tin tuyến nhận thức kết hợp kỹ thuật giải mã và chuyển tiếp.
truyền thông nói riêng. Cụ thể, trong tài liệu [1], các thống kê Trong [15], sự tác động chung của suy hao phần cứng và giao
cho thấy phổ tần dành cho thông tin truyền thông đã có nguy thoa đồng kênh đã được đánh giá nghiên cứu trong khi [16]
cơ cung vượt quá cầu. Điển hình tại những nơi có mật độ con nêu lên sự ảnh hưởng của suy hao phần cứng lên hiệu năng
người sinh sống, làm việc hay du lịch đòi hỏi chất lượng về bảo mật thông tin của hệ thống chuyển tiếp.
tốc độ phủ sóng của mạng vô tuyến phải cao, bên cạnh số Trong bài báo này, chúng tôi quan tâm đến việc đánh giá
lượng đủ khả năng cung cấp cho người dùng. Điều này cũng hiệu năng xác suất dừng của mạng MIMO vô tuyến nhận thức
đồng nghĩa với việc sử dụng tài nguyên phổ tần càng lớn. Thế dạng nền (Multiple Input Multiple Output underlay cognitive
nhưng ta biết rằng tài nguyên là hữu hạn trong khi nhu cầu con radio). Trong mô hình khảo sát, hai kỹ thuật chọn anten phát
người là vô hạn. Đây cũng là một thách thức lớn cho những TAS (Transmit Antenna Selection) và kết hợp chọn lựa SC
nhà khoa học trong và ngoài nước. (Selection Combining) được kết hợp để nâng cao hiệu năng
Đối với khó khăn vừa nêu, trong [2], Mitola đã đề xuất ra xác suất dừng OP (Outage Probability) của hệ thống. Đóng
giải pháp khắc phục tình trạng khan hiếm phổ tần khả thi đó là góp chính của bài báo này là việc đưa ra các biểu thức chính
vô tuyến nhận thức (Cognitive Radio). Trong mạng này, hệ xác và tường minh cho đại lượng OP trên kênh truyền fading
thống thứ cấp (hệ thống không có bản quyền sử dụng phổ tần Rayleigh. Cuối cùng, chúng tôi tiến hành các mô phỏng máy
số) có thể hoạt động trên cùng dải tần của hệ thống sơ cấp (có tính để kiểm chứng độ chính xác của các phân tích lý thuyết.
bản quyền sử dụng phổ tần số). Tuy nhiên, mạng thứ cấp cần Các kết quả của bài báo cũng cho thấy được ưu điểm của mô
phải hiệu chỉnh công suất phát như thế nào để đảm bảo không hình đề xuất khi so sánh với mô hình TAS/SC thông thường.
nguy hại đến chất lượng dịch vụ của mạng sơ cấp [3]. Phần còn lại của bài báo này được sắp xếp như sau: việc
Trong [4]-[5], các tác giả đã đưa ra các giải pháp nhằm cải xây dựng mô hình và phân tích hiệu năng của hệ thống lần
thiện vùng phủ sóng bị giới hạn ở mạng thứ cấp, bằng cách sử lượt được trình bày ở phần II và III. Kết quả phân tích sẽ được
dụng các kỹ thuật chuyển tiếp phân tập với hai chặng và đa
ISBN: 978-604-67-0635-9 477
477
HộiHội
Thảo Quốc
Thảo Gia
Quốc 2015
ĐiệnTử,
Tử,Truyền
NghệThông
ThôngTinTin (ECIT
(ECIT 2015)
2015)
kiểm chứng trong phần IV bởi kết quả mô phỏng thông qua Trong công thức số (2), b * và c * lần lượt là anten tốt
phần mềm Matlab. Sau cùng của bài báo là phần V, trong nhất tại nút nguồn và nút đích.
phần này chúng tôi sẽ đưa ra kết luận của bài báo.
B. Phương pháp đề xuất (PPDX)
II. MÔ HÌNH HỆ THỐNG Ta thấy rằng, công thức số (2) vẫn chưa tối ưu khi mà
công suất phát tại các anten phát là khác nhau (xem công thức
TAS (b) SC số (1)). Vì vậy, chúng tôi đề xuất một phương pháp lựa chọn
h1 cặp anten thu-phát tối ưu mới mà trong đó độ lợi kênh truyền
(b) giữa S và PU sẽ được tính đến:
S hND D 
γ cb~~  γ ij  
= max  max  , (3)
(b) γ= b~ i 1,...,
= NS  j 1,..., N D  γ i  
NS hP ND P   P 
với b ~ và c ~ lần lượt là anten tốt nhất tại nút nguồn và nút
Đường truyền dữ liệu đích trong PPDX.
PU Đường truyền can nhiễu Từ công thức (2), ta có thể đưa ra biểu thức tỷ số tín hiệu trên
nhiễu nhận được tại nút đích trong mô hình PPTT như sau:
Hình 1. Mô hình hệ thống.
PPTT I γ b* / γ b* Qγ cb** / γ Pb*
Ψ SD = maxb* c* b* P = , (4)
Trong Hình 1, chúng ta xem xét hệ thống mạng vô tuyến κ I maxγ c* / γ P + N 0 κ Qγ cb** / γ Pb* + 1
nhận thức, trong đó, mạng thứ cấp hoạt động trên những dãi tần ở đây, N 0 là phương sai của nhiễu cộng tại anten thu ở nút
số có bản quyền bởi mạng sơ cấp. Mạng sơ cấp chỉ gồm một
(PU) được trang bị một anten. Riêng đối với mạng thứ cấp bao đích, Q = I max / N 0 là tỷ số công suất giao thoa định mức trên
gồm nút nguồn (S), nút đích (D), mỗi nút được trang bị một tập công suất nhiễu và κ chính là tổng suy hao phần cứng tại
anten tương ứng là NS và N D . Bên cạnh đó, nút nguồn thực anten phát và anten thu (bởi vì các anten là cùng loại nên ta có
thể giả sử tổng suy hao phần cứng là không đổi cho bất kỳ một
hiện phát tín hiệu sử dụng kỹ thuật chọn lựa anten phát TAS.
cặp anten thu-phát được chọn nào).
Tại nút đích, các tín hiệu nhận được sẽ được kết hợp dựa vào
Tương tự, biểu thức tỷ số tín hiệu trên nhiễu cho liên kết giữa
kỹ thuật kết hợp chọn lựa (Selection Combining (SC)).
anten phát b ~ và anten thu c ~ trong mô hình PPDX được
Chúng ta ký hiệu hcb là hệ số kênh truyền từ anten phát thứ đưa ra dưới dạng sau:
b của nút nguồn đến anten thu thứ c của nút đích, hPb là hệ số PPDX Qγ b ~ / γ b ~
Ψ SD = bc~~ bP~ , (5)
kênh truyền giữa anten phát thứ b của nút nguồn và nút PU của κ Qγ c ~ / γ P + 1
mạng sơ cấp, với b ∈ {1, 2,..., NS } và c ∈ {1, 2,..., N D } . Chúng
ta giả sử rằng, tất cả các kênh truyền đều là kênh fading III. ĐÁNH GIÁ HIỆU NĂNG HỆ THỐNG
Rayleigh. Như đã được chứng minh trong [17], các độ lợi kênh Quá trình đánh giá hiệu năng của hệ thống đang xem xét được
truyền, như γ cb =| hcb |2 và γ Pb =| hPb |2 , là những biến ngẫu nhiên thể hiện qua nhiều tham số khác nhau, trong đó, xác suất dừng
có phân phối mũ (exponential random variable). Giả sử rằng là một trong những tham số quan trọng và được định nghĩa là
xác suất mà tỷ số công suất tín hiệu trên nhiễu tương đương
γ cb và γ Pb là độc lập và đồng nhất, vì vậy, ta có thể ký hiệu
của hệ thống, thấp hơn mức ngưỡng γ th cho trước. Tổng quát,
λ và Ω lần lượt là những đại lượng đặc trưng cho các biến
ta có thể đưa ra một biểu thức chung của xác suất dừng cho cả
ngẫu nhiên này, với λ = 1/ E {γ cb } và Ω =1/ E {γ Pb } , ở đây
hai mô hình khảo sát như sau:
E { X } là kỳ vọng toán học của biến ngẫu nhiên X.  γ b$ γ 
XSD Y = Pr ( Ψ SDY
< γ th ) = Pr  (1 − κγ th ) cb$$ < th 
Trong mạng vô tuyến nhận thức dạng nền, công suất phát  γP Q
tại anten thứ b của nút nguồn phải thoả mãn ràng buộc về giao
1; khi1 ≤ κγ th (6)
thoa định mức sau:
 b$
PSb = I max / γ Pb , (1) =  γ c$
 γ b $ < ρ ; khi1 > κγ th
với I max là mức can nhiễu tối đa được quy định bởi nút PU.  P
Trong công thức (6), Y là ký hiệu giao thức được sử dụng
A. Phương pháp thông thường (PPTT)
Theo thông thường, nút nguồn và nút đích sẽ chọn lựa cặp
( Y ∈ {PPTT,PPDX}) , b$ và c$ là cặp anten thu-phát được
anten tốt nhất để đạt được độ lợi kênh truyền tối đa giữa hai chọn trong hai mô hình khảo sát $ ∈ {*, ~} và ρ là giá trị
nút này. Về mặt toán học, phương pháp này có thể được biểu
=
được tính bởi ρ γ th / (1 − κγ th ) / Q .
diễn bởi công thức sau:
γ cb** = max
=i 1,...,
= ( max (γ )).
NS j 1,..., N D
i
j (2)
Nhận xét đầu tiên từ công thức số (6) cho thấy rằng cả hai hệ
thống sẽ luôn dừng khi giá trị κγ th lớn hơn 1 hay tổng mức
suy hao phần cứng κ lớn hơn nghịch đảo ngưỡng dừng 1/ γ th .
478
478
A. Chuẩn bị toán học B. Phương pháp thông thường (PPTT)

b$
Đầu tiên, bởi vì kênh truyền h P có phân phối Rayleigh nên Bổ đề 1: Xác suất dừng của mô hình PPTT luôn bằng 1 khi
độ lợi kênh γ b$
P sẽ có phân phối mũ. Do đó, hàm phân phối 1 ≤ κγ th và khi 1 > κγ th thì
tích luỹ (CDF) và hàm mật độ xác suất (PDF) của γ Pb $ lần lượt NS N D
Ω
∑ ( −1)
m
được xác định bởi XSD PPTT
= CNmS ND . (13)
Ω + mλρ
Fγ b $ ( x ) = 1 − exp ( −Ωx ) , fγ b $ ( x ) = Ω exp ( −Ωx ) . (7) m=0
P P
Chứng minh
Tiếp đến, ta xét đến biến ngẫu nhiên γ cb** trong công thức (2),
hàm PDF của biến này có thể được tìm thấy như trong công Từ công thức (6), khi 1 > κγ th , ta có
thức (8) bên dưới XSD
= PPTT
Pr ( γ cb** < ργ Pb* )
c*
y ) Pr ( γ cb** < =
Fγ b* ( = y ) Pr  max max ( γ ij ) < y 
=  i 1,...,
= NS j 1,..., N D  (8) ( ) =∫
+∞
0
Fγ b* ( ρ x ) fγ b* ( x ) dx.
c* P
(14)
(1 exp ( −λ y ) )
NS N D
=− . Rồi thì, sử dụng hàm PDF fγ b* ( x ) trong (7) và hàm CDF
P
Để thuận lợi cho việc tính toán sau này, ta có thể khai triển (8) Fγ b* ( ρ x ) trong (9), ta có
theo khai triển Newton như sau: c*
NS N D NS N D
∑ ( −1)
m
∑ ( −1) CNmSND exp ( −mλ y ) .
Fγ b* ( y ) =
m
(9) XSD PPTT
= CNmS ND
c*
m =0 m=0 (15)
Tiếp đến, ta xét đến biến ngẫu nhiên T1 = max ( γ ij / γ Pi ) , hàm
+∞
j =1,..., N D
× ∫ Ω exp ( −Ωx ) exp ( − mλρ x )dx.
0
CDF của T1 được xác định theo công thức sau: Sau khi tính tích phân trong (15), ta sẽ ra được công thức (13).
) Pr (T1 < t=) Pr max (γ ij ) < tγ Pi

FT1 ( t= ( j =1,..., N D ) (10)
Bổ đề 2: Xác suất dừng của mô hình với PPDX luôn bằng
1 khi 1 ≤ κγ th và với trường hợp 1 > κγ th , ta có thể đạt được
+∞
fγ i ( x ) F
( )( )
=∫ tx dx,
γ ij
NS
0 P max
 ND Ω 
XSD =  ∑ ( −1) CNn D
j =1,..., N D PPDX n
 . (16)
với hàm PDF fγ i ( x ) được xác định như trong (7)  n=0 Ω + nλρ 
P
(f γ Pi
( x) = )
Ω exp ( −Ωx ) , và hàm CDF F max
j =1,..., N D
(γ ) (
i
j
tx ) được Chứng minh
xác định tương tự (9) Trong trường hợp 1 > κγ th ta có thể viết lại công thức (6) bằng
 ND
 biểu thức sau:
 F max (γ ij ) ( tx ) =∑ ( −1) CNn D exp ( −nλtx )  . Kết hợp các kết
n
 γ b~ 
 j=1,...,ND n =0  XSD PPDX =  cb~~ < ρ = Fγ b~ / γ b~ ( ρ ) . (17)
quả đạt được, ta có thể tính (10) như bên dưới:
γ
 P 
c~ P
ND
+∞ Áp dụng kết quả của (12), ta dễ dàng đạt được (16).
FT1 (=
t) ∑ ( −1) CNn D Ω ∫ exp ( −nλtx ) exp ( −Ωx ) dx
n
n =0
0
IV. KẾT QUẢ
ND
(11)
Ω Trong phần này của bài báo, chúng tôi thực hiện các mô phỏng
= ∑ ( −1) CND
n n
.
n =0 Ω + nλt Monte Carlo để kiểm chứng các kết quả lý thuyết, cũng như để
Từ kết quả của (11), ta dễ dàng tìm ra hàm CDF cho biến ngẫu khảo sát và so sánh hiệu năng xác suất dừng của hai phương
nhiên γ cb~~ / γ Pb ~ được định nghĩa trong công thức (3): pháp PPTT và PPDX. Với mỗi mô phỏng, chúng tôi chạy 105
mẫu thử và xác suất dừng của từng mô hình chính là số trường
   γ ij   hợp mà hệ thống bị dừng chia cho tổng số phép thử.
Fγ b~ /γ b~ ( z ) = Pr  max  max  i   < z  Để đơn giản cho việc mô phỏng, chúng tôi cố định một số tham
c~ P =  i 1,...,
= NS  j 1,..., N D  γ  
   P   số như sau: λ = Ω = 1 và γ th = 2. Trên các hình vẽ, các kết quả
(
= Pr max (Ti ) < z
i =1,..., NS ) (12) mô phỏng bằng phương pháp Monte Carlo sẽ được hiển thị
bằng các hình tam giác, hình vuông, hình tròn, và các kết quả
NS
 ND Ω  lý thuyết sẽ được vẽ bằng đường thẳng liền nét. Chúng tôi cũng
=  ∑ ( −1) CNn D
n
 . phân biệt hai giao thức PPTT và PPDX bằng các màu khác
 n =0 Ω + nλt 
nhau như màu xanh cho PPTT và màu đỏ cho PPDX.
Kế tiếp, xác suất dừng của các mô hình PPTT và PPDX sẽ Trong Hình 2, xác suất dừng của hai mô hình được biểu diễn
được đưa ra dưới dạng các biểu thức tường minh. Bởi vì các theo sự thay đổi của Q ( Q = I max / N 0 ) dB. Trong mô phỏng
biểu thức tường minh rất dễ dàng trong việc tính toán nên các
biểu thức đưa ra phía dưới sẽ hữu ích trong việc thiết kế và tối này, các thông số còn lại được cố định bởi các giá trị sau:
ưu hệ thống.
479
479
HộiHội
Thảo Quốc
Thảo Gia
Quốc 2015
ĐiệnTử,
Tử,Truyền
NghệThông
ThôngTinTin (ECIT
(ECIT 2015)
2015)
NS = 2 , N D = 2 và κ ∈ {0, 0.4} . Qua đây, ta thấy rằng khi hơn mặc dù số anten phát giảm so với trường hợp
nhìn tổng thể, xác suất dừng của hệ thống trong phương pháp N
= S N= D 3.
đề xuất (PPDX) cho chất lượng tốt hơn so với phương pháp Trong Hình 4, chúng tôi nghiên cứu sự tác động của mức độ
thông thường (PPTT). Mặt khác, yếu tố về suy hao phần cứng suy hao phần cứng lên hiệu năng xác suất dừng. Chúng tôi cố
cũng được thể hiện thông qua Hình 2 này, cụ thể khi κ = 0.4 , định giá trị của Q bởi 2.5 dB và thay đổi giá trị của cặp
hiệu năng của hệ thống bị suy giảm đáng kể so với trường hợp ( NS , N D ) bởi (2, 1) và (2, 3). Kết quả đạt được chỉ ra rằng xác
lý tưởng là κ = 0 . suất dựng của hệ thống sẽ luôn bằng 1 khi hệ số suy hao phần
cứng κ ≥ 0.5 . Điều này cũng đồng nghĩa với việc ngưng hoạt
động của hệ thống khi chất lượng của các phần cứng không
đảm bảo. Bên cạnh đó, ta cũng dễ nhận thấy rằng hiệu năng
của hệ thống giảm mạnh khi hệ số suy hao phần cứng nằm
trong khoảng 0.3 ≤ κ < 0.5 .
Hình 2. Xác suất dừng (XSD) được vẽ là một hàm của Q (dB) khi
λ = Ω = 1 , γ th = 2 , N=
S N=
D 2 và κ ∈ {0,0.4} .
Hình 4. Xác suất dừng (XSD) được vẽ là một hàm của κ khi
λ = Ω = 1 , γ th = 2 , ( NS , N D ) ∈ {(2,1), ( 2,3)} và Q = 2.5 dB.
V. KẾT LUẬN
Trong bài báo này, chúng tôi thực hiện đánh giá hiệu năng hệ
thống vô tuyến nhận thức dạng nền với kỹ thuật lựa chọn kết
hợp/ lựa chọn anten phát bên cạnh yếu tố không lý tưởng của
phần cứng trong các thiết bị thu phát. Chi tiết hơn, chúng tôi
thực hiện bài toán xác suất dừng hệ thống với kênh truyền
fading Rayleigh. Kết quả đạt được cho thấy hiệu năng của
phương pháp được đề xuất được cải thiện tốt hơn so với
phương pháp thông thường. Bên cạnh đó, mức độ suy hao phần
cứng cũng tác động mạnh làm suy giảm hiệu năng của hệ
thống. Ngoài ra, số lượng anten được sử dụng ở trạm thu-phát
cũng ảnh hưởng đáng kể đến chất lượng của hệ thống.
Hình 3. Xác suất dừng (XSD) được vẽ là một hàm của Q (dB) khi
λ = Ω = 1 , γ th = 2 , ( NS , N D ) ∈ {(2, 4), ( 3,3)} và κ = 0.25 . LỜI CÁM ƠN
Nghiên cứu này được tài trợ bởi Quỹ Phát triển khoa học và
Trong Hình 3, chúng tôi đưa ra các trường hợp khác nhau mà công nghệ Quốc gia (NAFOSTED) trong đề tài mã số 102.01-
trong đó số anten ở nguồn và đích sẽ thay đổi. Cụ thể trường 2014.33.
hợp 1, số anten ở nguồn và đích lần lượt là 2 và 4, trong khi
trường hợp 2 là 3 và 3. Tham số mô phỏng còn lại được thiết TÀI LIỆU THAM KHẢO
lập như sau: κ = 0.25 , γ th = 2 . Ở đây, xác suất dừng của hệ
[1] FCC, “Spectrum policy task force report,” ET Docket 02-155, no. 11,
thống cũng biểu diễn theo hàm của Q trong Hình 3 này. Kết 2002.
[2] I. Mitola, J. and J. Maguire, G. Q., “Cognitive radio: making software
quả xác suất dừng của hệ thống còn cho thấy rằng, hiệu năng radios more person l,” IEEE Pers. Commun., vol. 6, no. 4, pp. 13–18,
của hệ thống trong trường hợp=NS 2,= N D 4 được nâng cao Apr. 1999.
480
480
[3] V. N. Q. Bao and T. Q. Duong, “Outage analysis of cognitive multihop Noises and Non-independent Co-channel Interferences", in Proc. of
networks under interference constraints,” IEICE Trans. Commun., vol. NICS 2015, Ho Chi Minh city, Viet Nam, pp. 316 - 321, Sept. 2015.
95, no. 3, pp. 1019–1022, Mar. 2012. [12] E. Bjornson, J. Hoydis, M. Kountouris, and M. Debbah, “Hardware
[4] V.N.Q. Bao and T. T. Duy, "Performance Analysis of Cognitive impairments in large-scale MISO systems: Energy efficiency,
Underlay DF Relay Protocol with Kth Best Partial Relay Selection", in estimation, and capacity limits,” in Proc. 2013 18th International
Proc. of ATC 2012, Ha Noi, Viet Nam, pp. 130-135, Oct. 2012. Conference on Digital Signal Processing (DSP), Conference
[5] T. T. Duy and Vo Nguyen Quoc Bao, "Multi-hop Transmission with Proceedings, pp. 1–6.
Diversity Combining Techniques Under Interference Constraint", in [13] M. Matthaiou, A. Papadogiannis, E. Bjornson, and M. Debbah, “Two-
Proc. of ATC 2013, Ho Chi Minh City, pp. 131-135, Otc. 2013 way relaying under the presence of relay transceiver hardware
[6] B. Tae Won, C. Wan, J. Bang Chul, and S. Dan Keun, “Multi-user impairments,” IEEE Commun. Lett., vol. 17, no. 6, pp. 1136–1139, Jun.
diversity in a spectrum sharing system,” IEEE Trans. Wirel. Commun., 2013.
vol. 8, no. 1, pp. 102–106, Jan. 2009. [14] P.T.D. Ngoc, T.L. Thanh, T. T. Duy, V.N.Q. Bao, "Đánh giá ảnh hưởng
[7] T. Q. Duong, V. N. Q. Bao, and H. J. Zepernick, “Exact outage của phần cứng không lý tưởng lên mạng vô tuyến nhận thức dạng nền
robability of cognitive AF relaying with underlay spectrum sharing,” hai chặng giải mã và chuyển tiếp", Hội thảo Quốc gia 2014 về điện tử,
Electron. Lett., vol. 47, no. 17, pp. 1001–1002, 2011. Truyền thông và Công nghệ Thông tin (ECIT2014), pp. 249-253, Nha
[8] V. N. Q. Bao and D. Q. Trung, “Exact outage probability of cognitive Trang, Viet Nam, 09/2014.
underlay DF relay networks with best relay selection,” IEICE Trans. [15] T. T. Duy, Trung Q. Duong, D.B. da Costa, V.N.Q. Bao, M. Elkashlan,
Commun., vol. E95-B, no. 06, pp. 2169–2173, Jun. 2012. "Proactive Relay Selection with Joint Impact of Hardware Impairment
[9] T.-T. Tran, V. N. Q. Bao, V. Dinh Thanh, and T. Q. Duong, and Co-channel Interference", IEEE Transactions on Communications,
“Performance analysis and optimal relay position of cognitive spectrum vol. 63, no. 5, pp. 1594-1606, May 2015.
sharing dual-hop decode-and-forward networks,” in Proc. ComManTel [16] T. T. Duy, Vo Nguyen Quoc Bao, Duong, T.Q., “Secured communication
2013, pp. 269–273, 2013. in cognitive MIMO schemes under hardware impairments”, Advanced
[10] T. T. Duy, P. M. Quynh, V.N.Q. Bao, T. Hanh and D. T. Hung, "An Technologies for Communications (ATC), pp. 109 – 112, Oct. 2014.
Incremental Cooperative Solution for Multicast Cognitive Network [17] T. T. Duy, T.V. Hieu, T.L. Thanh, P.T.D. Ngoc và V.N.Q. Bao, "Mô
Under Joint Impact of Hardware Impairment and Interference hình truyền đa chặng sử dụng truyền thông cộng tác tăng cường trong vô
Constraint", in Proc. of NICS 2015, Ho Chi Minh city, Viet Nam, pp. tuyến nhận thức dạng nền ", Hội thảo Quốc gia về điện tử, Truyền thông
310 - 315, Sept. 2015. và Công nghệ Thông tin, pp. 238-243, Nha Trang, Viet Nam, 09/2014.
[11] T. T. Duy, N.Q. Dien, L.G. Thien, V.N.Q. Bao and T. Hanh, "Down-link
Cooperative Transmission with Transmit Antenna Selection, Hardware
481
481
HộiHội
ThảoThảo Quốc
2015 ĐiệnTử,
Tử,Truyền
TruyềnThông
Thông và
và Công
CôngNghệ
NghệThông
ThôngTinTin
(ECIT 2015)
(ECIT 2015)
Nâng Cao Hiệu Năng Bảo Mật Mạng Thứ Cấp

Với Kỹ Thuật Chọn Nhiều Nút Chuyển Tiếp
Đơn Phần
Đặng Thế Hùng∗ , Trần Trung Duy† , Lưu Gia Thiện† và Võ Nguyễn Quốc Bảo†
∗Trường Sỹ Quan Thông Tin Nha Trang, Khánh Hòa, Việt Nam
† Học Viện Công Nghệ Bưu Chính Viễn Thông
Cơ sở TP. Hồ Chí Minh, Việt Nam

Email: danghung8384@gmail.com, (trantrungduy, lgthien, baovnq)@ptithcm.edu.vn
Tóm tắt nội dung—Trong bài báo này, chúng tôi đề xuất hiệu quả của việc lựa chọn nút chuyển tiếp tối ưu trong
mô hình chuyển tiếp hai chặng, sử dụng kỹ thuật chọn lựa mạng truyền thông hợp tác sử dụng giao thức giải mã-
nhiều nút chuyển tiếp đơn phần (Partial Relay Selection) và-chuyển tiếp (DF) để đạt được hiệu năng bảo mật
để nâng cao hiệu năng bảo mật ở lớp vật lý (Physical Layer tốt nhất. Các vấn đề về kết nối bảo mật với các giao
Security) cho mạng thứ cấp (secondary network) trong môi thức giải mã-và-chuyển tiếp (Decode-and-forward (DF))
trường vô tuyến nhận thức dạng nền (Underlay Cogntive và ngẫu nhiên-và-chuyển tiếp (Randomize-and-forward
Radio). Các biểu thức dạng tường minh chính xác của (RF)) cũng đã được nghiên cứu [4], [5], [6]. Đặc biệt,
xác suất dừng bảo mật trên kênh truyền fading Rayleigh
trong các tài liệu [7], [8], [9], các tác giả đã đề xuất các
đã được đưa ra. Chúng tôi cũng thực hiện các mô phỏng
Monte Carlo để kiểm chứng sự chính xác của các phân
phương pháp lựa chọn nút chuyển tiếp để đánh giá xác
tích lý thuyết. suất dừng bảo mật và dung lượng bảo mật nhằm nâng
cao hiệu năng bảo mật của hệ thống. Vấn đề phân tích
Keywords—Bảo mật lớp vật lý, vô tuyến nhận thức dạng hiệu năng bảo mật và tối ưu số lượng các chặng của
nền, chuyển tiếp cộng tác, xác suất dừng bảo mật, kênh hệ thống chuyển tiếp đa chặng cũng được đề cập trong
truyền fading Rayleigh. [10]. Các kết quả nghiên cứu đã chứng minh rằng, sử
dụng phương pháp truyền chuyển tiếp đa chặng cho hiệu
năng bảo mật tốt hơn so với phương pháp truyền trực
I. GIỚI THIỆU
tiếp. Vô tuyến nhận thức được định nghĩa trong [11], là
Ngày nay, việc đảm bảo an toàn thông tin là một một hệ thống vô tuyến thông minh, có khả năng nhận
trong những yêu cầu bắt buộc đối với các hệ thống thông biết môi trường xung quanh và từ đó điều chỉnh các
tin hiện đại. Tuy nhiên, hầu hết các thuật toán mã hóa, tham số thu phát để tối ưu hệ thống. Ý tưởng này lần
ví dụ như DES, RSA. . . đều là các thuật toán chạy ở đầu tiên được đề xuất bởi Joseph Mitola [12] vào năm
lớp ứng dụng, với giả sử rằng kênh truyền giữa máy 1999, cho phép các hệ thống không có giấy phép sử
phát và máy thu đã được thiết lập, đồng thời không lỗi, dụng tần số (Secondary Network (SN)) sử dụng chung
không trễ. Vậy nên, việc áp dụng các thuật toán mã hóa dải tần số với hệ thống được cấp phép sử dụng tần số
này trở nên khó khăn, phức tạp và không hiệu quả, đặc (Primary Network (PN)), với điều kiện ràng buộc là hoạt
biệt trong môi trường vô tuyến fading nhanh. Để giải động truyền phát dữ liệu của hệ thống SN không được
quyết vấn đề này, gần đây kỹ thuật bảo mật thông tin gây ảnh hưởng đến hiệu năng của hệ thống PN. Công
lớp vật lý (Physical Layer Security) [1], [2] đã thu hút nghệ này đang được xem như là một giải pháp đầy hiệu
được nhiều sự quan tâm của các nhà nghiên cứu trong quả để cải thiện hiệu suất sử dụng phổ tần số [13], [14].
và ngoài nước. Trong phương pháp này, một hệ thống Mạng vô tuyến nhận thức được chia ra làm ba loại, bao
được đánh giá là có khả năng bảo đảm an toàn thông gồm: dạng nền (Underlay), dạng xen kẽ (Overlay) và
tin khi mà dung lượng kênh chính lớn hơn dung lượng dạng chồng (Interwave). Trong các phương thức trên,
kênh của kênh nghe trộm. Đây là một kỹ thuật đơn giản thì phương thức truyền dạng nền đã thu hút sự quan
để đạt được hiệu quả bảo mật mà không cần sử dụng tâm của rất nhiều nhà nghiên cứu [15], [16], trong đó
các kỹ thuật mã hoá phức tạp. hệ thống thứ cấp (SN) được truyền phát dữ liệu song
Cho đến nay, đã có một số công trình nghiên cứu về song với hệ thống sơ cấp (PN) miễn là can nhiễu mà nó
vấn đề bảo mật thông tin lớp vật lý dưới nhiều góc gây ra phải nhỏ hơn mức ngưỡng chịu đựng cho phép
độ khác nhau. Cụ thể, trong [3], tác giả đã nghiên cứu của máy thu sơ cấp (Primary Receiver). Do bị giới hạn
482
ISBN: 978-604-67-0635-9 482

về mức can nhiễu gây ra, phương thức truyền dạng nền
có nhược điểm là vùng phủ sóng giới hạn do công suất
SE
phát của các nút thứ cấp bị giới hạn. Một trong những SR SR
giải pháp để giải quyết vấn đề này là sử dụng kỹ thuật
truyền chuyển tiếp phân tập hay truyền thông cộng tác
(cooperative communication) [17]. Do đó, quá trình kết SR SR
nối giữa nút nguồn và nút đích được cải thiện rõ rệt và SS SR SD
các nút mạng thứ cấp có thể sử dụng công suất phát SR
thấp hơn trong khi vẫn bảo đảm được yêu cầu về chất SR SR
lượng dịch vụ, cũng như làm giảm đáng kể can nhiễu
lên hệ thống sơ cấp. Kênh Chính
Theo sự hiểu biết tốt nhất của chúng tôi, cho đến nay chỉ Kênh Nghe Lén
có vài công trình nghiên cứu quan tâm đến việc nâng PU Kênh Can Nhi u
cao hiệu năng bảo mật của mạng thứ cấp trong môi
Nhóm các nút
trường vô tuyến nhận thức dạng nền. Cụ thể trong [18], chuy n ti p
các tác giả đã đánh giá hiệu năng bảo mật của hệ thống c ch n
chuyển tiếp dựa vào biểu thức xác suất dừng hệ thống
dạng tường minh trong môi trường vô tuyến nhận thức Hình 1. Mô hình hệ thống.
dạng nền trên kênh truyền Rayleigh Fading. Trong [19],
hiệu năng bảo mật đối với các phương thức lựa chọn
nút chuyển tiếp trong mạng vô tuyến nhận thức hợp tác số m chạy từ 1 đến M. Giả sử kênh truyền giữa hai nút
(CCRNs) dạng nền cũng đã được phân tích. bất kỳ trong mạng là kênh fading Rayleigh, vì thế các
Trong bài báo này, chúng tôi đánh giá hiệu năng bảo độ lợi kênh γ1m , γmD , γ0E , γmE , γ0P và γmP là các
mật mạng thứ cấp trong môi trường vô tuyến nhận thức biến ngẫu nhiên có phân bố mũ với tham số đặc trưng
dạng nền, với kỹ thuật lựa chọn nhiều nút chuyển tiếp lần lượt được ký hiệu như λ1 , λ2 , Ω1 , Ω2 , ∆1 và ∆2 .
đơn phần, thông qua việc tính toán biểu thức xác suất Để đưa suy hao đường truyền vào trong các phân tích,
dừng bảo mật với giao thức ngẫu nhiên-và-chuyển tiếp ta có thể mô hình các tham số đặc trưng bằng hàm của
(RF) trên kênh truyền fading Rayleigh. Tiếp theo, các
khoảng cách và hệ số suy hao như sau: λ1 = dβSS−SRm ,
kết quả mô phỏng được tiến hành để kiểm chứng các
biểu thức phân tích lý thuyết. Kết quả mô phỏng và kết λ2 = dβSRm −SD , Ω1 = dβSS−SE , Ω2 = dβSRm −SD , ∆1 =
quả phân tích lý thuyết là trùng khít nhau, thể hiện tính dβSS−PU và ∆2 = dβSRm −PU [20], với d là ký hiệu của
chính xác của kết quả phân tích. khoảng cách Euclid giữa hai nút và β là hệ số suy hao
Phần còn lại của bài báo được tổ chức như sau: Trong đường truyền.
phần II, chúng tôi miêu tả mô hình hệ thống được đề Sự truyền dữ liệu từ SS đến SD thông qua SR được thực
xuất. Trong phần III, chúng tôi đánh giá hiệu năng bảo hiện qua hai khe thời gian trực giao: trong khe thời gian
mật của hệ thống đề xuất. Phần IV cung cấp các kết thứ nhất SS truyền dữ liệu đến một nhóm các SR được
quả mô phỏng và phân tích lý thuyết. Cuối cùng, chúng chọn trước, trong khe thời gian thứ hai, một trong các
tôi kết luận bài báo trong phần V. SR được chọn sẽ chuyển tiếp dữ liệu của SS đến SD.
Ta cũng giả sử rằng, hệ số kênh truyền thay đổi sau
mỗi khe thời gian, vì thế các phương pháp chọn lựa nút
II. MÔ HÌNH HỆ THỐNG chuyên tiếp tối ưu cho toàn trình như đã đề xuất trong
Hình 1 miêu tả sơ đồ hệ thống của mô hình đề xuất, [21] là không thể áp dụng được.
trong đó mạng sơ cấp được biểu thị bởi bằng một người Đầu tiên, không mất tính tổng quát ta có thể giả sử rằng
dùng sơ cấp PU trong khi mạng thứ cấp bao gồm một γ11 > γ12 > γ13 > ... > γ1M −1 > γ1M và trong M
nút nguồn thứ cấp SS, M nút chuyển tiếp thứ cấp SR nút SR sẵn có, chỉ K nút SR đầu tiên được đưa vào
và một nút đích thứ cấp SD. Giả sử rằng, không có liên danh sách các nút chuyển tiếp tiềm năng, cụ thể các nút
kết trực tiếp giữa SS và SD bởi vì khoảng cách và vật này nằm trong tập W: W = {SR1 , SR2 , ..., SRK }. Ta
cản. Vì vậy, nguồn SS cần sự giúp đỡ từ các nút chuyển cần chú ý rằng K là một số nguyên dương có giá trị từ
tiếp SR để đưa dữ liệu mong muốn đến đích. Hơn nữa, 1 đến M và là thông số đã được thiết kế trước của hệ
mạng thứ cấp còn xuất hiện có một nút nghe lén SE, thống.
đang cố gắng nghe lõm dữ liệu được phát đi từ nguồn Trước khi truyền dữ liệu, nút nguồn SS điều chỉnh công
SS và từ các nút chuyển tiếp SR. suất phát để thoả mãn mức giao thoa tối đa Ith được
Chúng tôi ký hiệu γ1m , γmD , γ0E , γmE , γ0P và γmP lần quy định bởi mạng sơ cấp [19], cụ thể như sau:
lượt là độ lợi kênh truyền của các liên kết SS − SRm ,
SRm − SD, SS − SE, SS − PU và SRm − PU, với chỉ PS = min (Pth , Ith /γ0P ) , (1)
483
483
với Pth là công suất phát lớn nhất mà nguồn có thể phát giá như sau:
được.
Tương tự, nếu nút chuyển tiếp SRk (k ∈ {1, 2, ..., K}) SOP = Pr (C < Cth )
được chọn để truyền dữ liệu nhận được đến SD, công K
suất phát lớn nhất của nút này là: 1
=1 − 1 − Pr
K
b=1
PRk = min (Pth , Ith /γkP ) , (2)
1 + Ψ min (1, µ/γ0P ) γ1b
× <ρ
Bây giờ, chúng tôi sẽ đề cập đến vấn đề chọn nút SR 1 + Ψ min (1, µ/γ0P ) γ0E

tốt nhất. Thật vậy, trong các ứng viên tiềm năng, nút có 1 + Ψ min (1, µ/γbP ) γ2b
× 1 − Pr <ρ
độ lợi kênh truyền đến đích SD lớn nhất sẽ được chọn 1 + Ψ min (1, µ/γbP ) γbE
để chuyển tiếp dữ liệu. Về mặt toán học, ta có thể biểu K

diễn phương pháp chọn lựa này bằng công thức sau: 1
=1 − 1 − Ib (1 − Jb ) (7)
K
b=1
Rb : γbD = max (γkD ) (3)
k=1,2,...,K
với ρ = 22Cth , Ib = Pr 1+Ψ 1+Ψ min(1,µ/γ0P )γ1b
min(1,µ/γ 0P )γ0E
< ρ và
Trong bài báo này, giả sử rằng các nút SS và SR không
có thông tin trạng thái kênh truyền (CSI) đến nút nghe Jb = Pr 1+Ψ min(1,µ/γbP )γbE < ρ .
1+Ψ min(1,µ/γbP )γ2b
lén SE. Vì vậy, các nút SS và sử dụng phương pháp Ta có thể giải thích công thức (7) như sau: đầu tiên ta
ngẫu nhiên và chuyển tiếp RF để tránh SE kết hợp các thấy rằng bởi vì vai trò như nhau của các nút nên xác
dữ liệu nhận được. Với kỹ thuật này, dung lượng bảo suất để một nút thuộc tập W trở thành nút chuyển tiếp
mật của hệ thống đề xuất được tính như sau: tốt nhất là bằng 1/K. Hơn nữa, xác suất dừng bảo mật ở
chặng thứ nhất (Ib ), theo định lý tổng xác suất, sẽ bằng
C = min (C1 , C2 ) , (4) xác suất dừng bảo mật trung bình của tất cả các trường
hợp mà nút chuyển tiếp tốt nhất là nút SR1 hoặc SR2
với C1 và C2 lần lượt là dung lượng bảo mật tại chặng hoặc SR3 hoặc . . . hoặc SRK . Cuối cùng, đại lượng thứ
thứ nhất và chặng thứ hai, và được tính như bên dưới: hai trong công thức (7) (Jb ) chính là xác suất dừng bảo
+ mật của chặng thứ hai. Bây giờ, ta sẽ lần lượt tính Ib
1 PS γ1b 1 PS γ0E và Jb . Đầu tiên, Ib được viết lại như sau:
C1 = log 1 + − log2 1 +
2 2 N0 2 N0
+ Ib =
1 1 + Ψ min (1, µ/γ0P ) γ1b
= log , (5) µ ρ−1 µ
2 2 1 + Ψ min (1, µ/γ0P ) γ0E Pr min 1, γ1b < +ρ min 1, γ0E .
γ0P Ψ γ0P
(8)
+
1 PRb γbD 1 PRb γbE
C2 = log2 1+ − log2 1+ Hơn nữa, ta có:
2 N0 2 N0
+ ρ−1
1 1 + Ψ min (1, µ/γbP ) γbD Ib = Pr (γ0P < µ) Pr γ1b + ργ0E
= log . (6) <
Ψ
2 2 1 + Ψ min (1, µ/γbP ) γbE
I1
Trong các biểu thức số (5) và (6), hệ số 1/2 chỉ ra rằng
ρ−1
hệ thống phải sử dụng 2 khe thời gian trực giao để truyền + Pr γ0P ≥ µ, γ1b < γ0P + ργ0E . (9)
dữ liệu, N0 là phương sai của nhiễu cộng tại các thiết Ψ

bị thu của SRb và SD, Ψ = Pth /N0 , µ = Ith /Pth và I2
hàm số [.]+ được định nghĩa: [x]+ = max (0, x)
Mặt khác, I1 trong (9) có thể được tính như sau:
III. ĐÁNH GIÁ HIỆU NĂNG BẢO MẬT I1 = (1 − exp (−∆1 µ))
+∞
Trong bài báo này, chúng tôi quan tâm đến một × fγ0E (x) Fγ1b
ρ−1
+ ρx dx. (10)
thông số hiệu năng quan trọng đó là xác suất dừng bảo 0 Ψ
mật (Secrecy Outage Probability (SOP)). SOP được định
nghĩa như xác suất mà dung lượng bảo mật toàn trình với fγ0E (x) = Ω1 exp (−Ω1 x)là hàm mật độ xác suất
nhỏ hơn một giá trị ngưỡng giá trị dương cho trước Cth . (PDF) của biến ngẫu nhiên phân phối mũ γ0E , trong khi
Từ định nghĩa này, SOP của mô hình đề xuất được đánh Ψ + ρx là hàm phân phối tích luỹ (CDF) được
Fγ1b ρ−1
484
484
xác định theo thống kê bậc thứ b như trong [22]: Rồi thì ta thay các kết quả đạt được vào (13) và sau khi
biến đổi ta có:

ρ−1 b M
−u+1
Fγ1b + ρx I2 =
t
u−1 t
(−1) CM CM −u+1
Ψ
b u=1 t=0
Ω1
u−1
= CM ×
u=1 Ω1 + (t + u − 1) λ1 ρ
M −u+1 ∆1
ρ−1 ×
× 1 − exp −λ1 + ρx ∆1 + (t + u − 1) λ1 ρ−1
Ψ Ψ
ρ−1
ρ−1 × exp − (t + u − 1) λ1 µ . (15)
× exp − (u − 1) λ1 + ρx Ψ
Ψ
b M−u+1
t u−1 t Cuối cùng, chúng ta sẽ tính giá trị của Jb . Đầu tiên, ta
= (−1) CM CM −u+1
cần viết lại Jb dưới dạng sau:
u=1 t=0

ρ−1 1 + Ψ min (1, µ/γbP ) γbD
× exp − (t + u − 1) λ1 + ρx . (11) Jb = Pr <ρ
Ψ 1 + Ψ min (1, µ/γbP ) γbE

ρ−1
= Pr (γbP < µ) Pr γbD < + ργbE
Thay các kết quả vừa đạt được vào (10), sau một số biến Ψ

đổi ta đạt được: J1

ρ−1
+ Pr γbP ≥ µ, γbD < γbP + ργbE . (16)
I1 = (1 − exp (−∆1 µ)) Ψ
b M

−u+1
t u−1 t J2
× (−1) CM CM −u+1
u=1t=0
Để tính Jb như trong (16), ta cần chú ý rằng, hàm CDF
Ω1 exp − (t + u − 1) λ1 ρ−1 của γbD là:
× Ψ
. (12)
Ω1 + (t + u − 1) λ1 ρ
Fγ2b (z) = Pr max (γkD ) < z
k=1,2,...,K
Tiếp đến, ta xét I2 : = (1 − exp (−λ2 z))
K
K

(17)
k k
ρ−1 = (−1) CK exp (−kλ2 z).
I2 = Pr γ0P ≥ µ, γ1b < γ0P + ργ0E
Ψ k=0
+∞ +∞
= fγ0P (x) fγ0E (y) Với cùng một phương pháp như trên, ta lần lượt có được:
µ 0
J1 = (1 − exp (−∆2 µ))
ρ−1
× Fγ1b x + ρy dxdy. (13) K ρ−1
Ψ n n Ω2 exp −nλ1 Ψ
× (−1) CK , (18)
n=0
Ω1 + nλ2 ρ
Tương tự, ta cũng có fγ0P (x) = ∆1 exp (−∆1 x),
fγ0E (y) = Ω1 exp (−Ω1 y) và K
n Ω2 ∆2
n
J2 = (−1) CK
Ω 1 + nλ 2 ρ ∆2 + nλ2 ρ−1
ρ−1 n=0
Ψ
Fγ1b x + ρy ρ−1
Ψ × exp −nλ2 µ . (19)
b M
−u+1 Ψ
t u−1 t
= (−1) CM CM −u+1
Như vậy, thay các kết quả đạt được trong (9), (12), (15),
u=1 t=0
(16), (18) và (19) vào trong (7), chúng ta đạt được biểu
ρ−1
× exp − (t+ u− 1) λ1 x + ρy . (14) thức chính xác cho xác suất dừng bảo mật của mô hình
Ψ đề xuất.
485
485
IV. KẾT QUẢ MÔ PHỎNG

0.65
Trong phần IV, chúng tôi thực hiện các mô phỏng 0.6
Mo phong xR = 0.5
Monte-Carlo để kiểm chứng các công thức đã được trình 0.55

Ly thuyet xR = 0.5
bày ở phần III. Môi trường mô phỏng là một hệ trục tọa Mo phong xR = 0.7
độ hai chiều Oxy, trong đó nút nguồn SS được đặt tại vị 0.5 Ly thuyet xR = 0.7
trí (0,0), các nút chuyển tiếp được đặt tại vị trí (xR , 0) 0.45
(với 0 < xR < 1), nút đích ở vị trí (1,0), nút nghe lén
SOP
được đặt ở (1,0.25) và nút sơ cấp PU ở vị trí (0.5, -0.5). 0.4
Trong tất cả các mô phỏng, hệ số suy hao đường truyền 0.35

được cố định bởi 4 (β = 4).
Trong hình 2, xác suất dừng bảo mật (SOP) được vẽ theo 0.3
sự thay đổi của giá trị Ψ (Ψ = Pth /N0 ) đơn vị dB. Các 0.25
thông số được thiết lập trong mô phỏng này là K = 2,
xR = 0.7, µ = 0.5 và Cth = 0.2. Như chúng ta có thể 0.2
quan sát, giá trị của SOP giảm khi ta tăng giá trị Ψ. Tuy
1 2 3 4 5 6 7 8 9 10
nhiên, khi Ψ lớn, hiệu năng SOP dường như bảo hoà. K
Đó là bởi vì, khi ta tăng công suất phát thì dung lượng
của kênh chính và cả của kênh nghe lén cũng tăng theo.
Hình 3. Xác suất dung lượng bảo mật khác không biểu diễn theo giá
Một điều đáng lưu ý trong hình vẽ này là hiệu năng bảo trị N khi β = 3, xE = 1, yE = 0.25, xP = −0.5, yP = −0.5,
mật của hệ thống sẽ tốt hơn nếu có nhiều nút chuyển K = 2, N1 = N2 = 1 ÷ 10.
tiếp sẵn sàng phục vụ nguồn truyền dữ liệu đến đích.
Hình vẽ 3, biểu diễn SOP theo sự thay đổi của giá trị K
V. KẾT LUẬN
Trong bài báo này, chúng tôi đề xuất và khảo sát
1
hiệu năng của mô hình chuyển tiếp cộng tác để nâng
Mo phong (M=2)
0.9
cao hiệu năng bảo mật của mạng thứ cấp trong vô tuyến
Ly thuyet (M=2)
Mo phong (M=5) nhận thức dạng nền. Các kết quả trong bài báo cho thấy
0.8 Ly thuyet (M=5) rằng bằng cách chọn lựa số nút chuyển tiếp đơn phần
Mo phong (M=7) thích hợp, ta có thể nâng cao hiệu năng bảo mật của hệ
0.7 Ly thuyet (M=7)
thống. Công việc tiếp theo của nhóm chúng tôi là khảo
0.6 sát hiệu năng bảo mật của hệ thống trên các kênh truyền
tổng quát hơn như kênh Nakagami-m và kênh Rician.
SOP
0.5
0.4 LỜI CẢM ƠN

0.3 Nghiên cứu này được tài trợ bởi Quỹ Phát triển khoa
học và công nghệ Quốc gia (NAFOSTED) trong đề tài
0.2
mã số 102.01-2014.33.
0.1
−20 −15 −10 −5 0 5 10 15
Ψ (dB) TÀI LIỆU
[1] A. Wyner, “The wire-tap channel,” Bell System Technical Jour-
Hình 2. Xác suất dừng bảo mật SOP là một hàm của Ψ = Pth /N0 nal, The, vol. 54, no. 8, pp. 1355–1387, Oct 1975.
(dB) khi K = 2, xR = 0.7, µ = 0.5 và Cth = 0.2. [2] P. K. Gopala, L. Lai, and H. El Gamal, “On the secrecy capacity
of fading channels,” Information Theory, IEEE Transactions on,
vol. 54, no. 10, pp. 4687–4698, Oct 2008.
khi Ψ = 5(dB), µ = 0.25, M=10 và Cth = 0.2. Từ hình [3] I. Krikidis, “Opportunistic relay selection for cooperative net-
vẽ ta có thể thấy rằng, hiệu năng bảo mật của hệ thống works with secrecy constraints,” Communications, IET, vol. 4,
biến thiên khi ta thay đổi giá trị của số nút chuyển tiếp no. 15, pp. 1787–1791, Oct 2010.
đơn phần K. Hơn nữa, ta cũng quan sát được rằng tồn [4] J. Mo, M. Tao, and Y. Liu, “Relay placement for physical layer
tại một giá trị tối ưu của K để giá trị SOP là nhỏ nhất. security: A secure connection perspective,” Communications
Letters, IEEE, vol. 16, no. 6, pp. 878–881, June 2012.
[5] P. N. Son and H. Kong, “Exact outage probability of a decode-
Trong các hình vẽ 2 và 3, các kết quả lý thuyết và and-forward scheme with best relay selection under physical
mô phỏng trùng với nhau. Điều này chứng minh sự đúng layer security,” Wireless Pers. Commun., vol. 74, no. 2, pp. 325–
đắn trong các phân tích lý thuyết. 342, Jan 2014.
486
486
[6] ——, “Exact outage probability of two-way decode-and-forward 894–914, May 2009.
scheme with opportunistic relay selection under physical layer [15] P. T. D. Ngoc, T. L. Thanh, T. T. Duy, and V. N. Q. Bao, “Đánh
security,” Wireless Pers. Commun., vol. 77, no. 4, pp. 2889– giá ảnh hưởng của phần cứng không lý tưởng lên mạng vô tuyến
2917, Aug 2014. nhận thức dạng nền hai chặng giải mã và chuyển tiếp,” Hội thảo
[7] I. Krikidis, J. Thompson, and S. Mclaughlin, “Relay selection Quốc gia 2014 về điện tử, Truyền thông và Công nghệ Thông
for secure cooperative networks with jamming,” Wireless Com- tin (ECIT2014), pp. 249–253, 09 2014.
munications, IEEE Transactions on, vol. 8, no. 10, pp. 5003– [16] T. T. Duy, T. V. Hieu, T. L. Thanh, P. T. D. Ngoc, and V. N. Q.
5011, October 2009. Bao, “Mô hình truyền đa chặng sử dụng truyền thông cộng
[8] L. Dong, Z. Han, A. Petropulu, and H. Poor, “Improving tác tăng cường trong vô tuyến nhận thức dạng nền,” Hội thảo
wireless physical layer security via cooperating relays,” Signal Quốc gia 2014 về điện tử, Truyền thông và Công nghệ Thông
Processing, IEEE Transactions on, vol. 58, no. 3, pp. 1875– tin (ECIT2014), pp. 238–243, 09 2014.
1888, March 2010. [17] J. Laneman, D. Tse, and G. W. Wornell, “Cooperative diversity
[9] V. N. Q. Bao, N. Linh-Trung, and M. Debbah, “Relay selec- in wireless networks: Efficient protocols and outage behavior,”
tion schemes for dual-hop networks under security constraints Information Theory, IEEE Transactions on, vol. 50, no. 12, pp.
with multiple eavesdroppers,” Wireless Communications, IEEE 3062–3080, Dec 2004.
Transactions on, vol. 12, no. 12, pp. 6076–6085, December [18] T. T. Duy and V. N. Q. Bao, “Secrecy outage performance
2013. of relay networks under interference constraint,” in Advanced
[10] V. N. Q. Bao and N. L. Trung, “Multihop decode-and-forward Technologies for Communications (ATC), 2014 International
relay networks: Secrecy analysis and relay position optimiza- Conference on, Oct 2014, pp. 125–130.
tion,” REV Journal on Electronics and Communications, vol. 2, [19] T. Duong, T. T. Duy, M. Elkashlan, N. Tran, and O. Dobre,
no. 1-2, pp. 33–41, June 2012. “Secured cooperative cognitive radio networks with relay se-
[11] I. Akyildiz, W.-Y. Lee, M. C. Vuran, and S. Mohanty, “A lection,” in Global Communications Conference (GLOBECOM),
survey on spectrum management in cognitive radio networks,” 2014 IEEE, Dec 2014, pp. 3074–3079.
Communications Magazine, IEEE, vol. 46, no. 4, pp. 40–48, [20] T. T. Duy, H. N. Vu, T. T. Truc, and H. Y. Kong, “Minimum-
April 2008. energy cooperative routing with equal gain combining in static
[12] J. Mitola and J. Maguire, G.Q., “Cognitive radio: making soft- wireless networks,” KICS Winter Conference, Korea, pp. 206–
ware radios more personal,” Personal Communications, IEEE, 207, 01 2011.
vol. 6, no. 4, pp. 13–18, Aug 1999. [21] T. Duy and H. Kong, “Exact outage probability of cognitive two-
[13] A. Mody, S. R. Blatt, D. G. Mills, T. P. McElwain, N. B. way relaying scheme with opportunistic relay selection under
Thammakhoune, J. Niedzwiecki, M. Sherman, C. S. Myers, interference constraint,” Communications, IET, vol. 6, no. 16,
and P. Fiore, “Recent advances in cognitive communications,” pp. 2750–2759, November 2012.
Communications Magazine, IEEE, vol. 45, no. 10, pp. 54–61, [22] T. T. Duy and H. Kong, “Performance analysis of incremental
October 2007. amplify-and-forward relaying protocols with nth best partial
[14] A. Goldsmith, S. Jafar, I. Maric, and S. Srinivasa, “Breaking relay selection under interference constraint,” Wireless Personal
spectrum gridlock with cognitive radios: An information theo- Communications (WPC), vol. 71, no. 4, pp. 2741–2757, Aug
retic perspective,” Proceedings of the IEEE, vol. 97, no. 5, pp. 2013.
487
487
HộiHội Thảo
Thảo QuốcGia
Quốc Gia2015
2015 về
về Điện
CôngNghệ
Thông (ECIT 2015)
(ECIT 2015)
Phân Tích Hiệu Năng của Hệ Thống Truyền Thông Chuyển

Tiếp Đường Lên với Thu Thập Năng Lượng và Kết Hợp Lựa
Chọn tại Nút Đích
Trần Mạnh Hoàng∗ , Nguyễn Thị Thái Hòa † , Trần Trung Duy ‡ , Võ Nguyễn Quốc Bảo ‡
∗
Học Viện Kỹ Thuật Quân Sự (email: hoangsqtt@gmail.com)
†
Đại Học Thông Tin Liên Lạc, Khánh Hòa (email: thaihoa.nhatrang@gmail.com)
‡ Phòng Thí Nghiệm Thông Tin Vô Tuyến (WCOMM)
Học Viện Công Nghệ Bưu Chính Viễn Thông Cơ Sở tại TP. Hồ Chí Minh (e-mail: {trantrungduy,baovnq}@ptithcm.edu.vn)
Tóm tắt nội dung—Trong bài báo này, chúng tôi đề xuất mô (Multi Input Multi Output) chuyển tiếp, và nghiên cứu sự cân
hình truyền thông hai chặng đường lên với phương thức giải mã bằng tối ưu, giữa biến đổi năng lượng và tốc độ thông tin tiền
và chuyển tiếp (Decode and Forward-DF), ở đó nút chuyển tiếp mã hóa. Với bài toán tối ưu phân chia công suất (cho xử lý
hoạt động dựa trên cơ sở thu thập năng lượng bức xạ từ tần
thông tin và mức năng lượng thu thập) thì hệ thống đạt hiệu
vô tuyến (RF) để cấp nguồn sử dụng cấu trúc chuyển mạch thời
gian (TS). Nút đích được cấu hình nhiều anten và sử dụng kỹ suất năng lượng tối đa cho cả nút nguồn và nút chuyển tiếp.
thuật kết hợp lựa chọn (Selection Combining - SC) để nâng cao Nhưng ở đây, các tác giả chưa đánh giá các thông số hiệu
hiệu năng của hệ thống. Chúng tôi phân tích xác suất dừng hệ suất của hệ thống, theo phương diện truyền dẫn như là xác
thống trên kênh truyền pha-đinh Rayleigh và sử dụng phương suất lỗi và dung lượng kênh. Trong bài báo [9], các tác giả
pháp mô phỏng Monte Carlo trên phần mềm Matlab được thực đã khảo sát hệ thống đa người dùng và nhiều chặng, với việc
hiện để kiểm chứng kết quả phân tích lý thuyết. biến đổi năng lượng và thông tin đồng thời. Bài báo [9] đã
Từ khoá - Truyền thông chuyển tiếp, thu thập năng lượng, giả sử rằng, nút chuyển tiếp có thể thực hiện đồng thời, xử lý
nguồn một chiều. thông tin và trích một phần tín hiệu thu được để chuyển đổi
thành năng lượng cung cấp nguồn cho hệ thống hoạt động.
I. GIỚI THIỆU
Nghiên cứu mô hình chuyển tiếp đơn giản hai chặng đã được
Hiện nay, thông tin vô tuyến di động ngày càng được sử đề xuất trong [10] sử dụng phương thức giải mã và chuyển
dụng rộng rãi và trở thành nhu cầu thiết yếu của con người. tiếp (Decode and Forward-DF), kết hợp thu thập năng lượng
Các thiết bị này nhỏ gọn và được trang bị nhiều cảm biến cho từ sự can nhiễu từ môi trường xung quanh. Như vậy, tín hiệu
phép hỗ trợ con người trong nhiều hoạt động hàng ngày. Một can nhiễu vào hệ thống trong khoảng thời gian thu thập sẽ
trong những khó khăn cho các thiết bị thông tin di dộng là trở nên có ích, nhưng khoảng thời gian tiếp theo dành cho xử
nguồn năng lượng sử dụng. Công nghệ pin hiện tại chỉ có thể lý thông tin thì bài báo chưa xem xét đến sự can nhiễu đó.
giúp thiết bị hoạt động trong một khoản thời gian giới hạn Bài báo [11], [12] lần lượt nghiên cứu giao thức lựa chọn nút
[1]. chuyển tiếp trong mạng thu thập năng lượng và giải bài toán
Để giải quyết bài toán trên, các nhà khoa học trong những xác định vị trí tối ưu của nút chuyển tiếp trong mạng hai chặng
năm gần đây quan tâm đến kỹ thuật thu thập năng lượng từ nhằm mục đích cực đại hiệu suất hệ thống. Cụ thể trong [11],
sóng vô tuyến [2], [3]. Ý tưởng chính của kỹ thuật này là sử các tác giả đã phân tích hệ thống lựa chọn nút chuyển tiếp, để
dụng năng lượng của tín hiệu ở băng tần vô tuyến, thu được ở cân bằng hiệu suất năng lượng tại máy thu với đại lượng cân
máy thu, chuyển đổi thành nguồn điện một chiều (DC), cung bằng là lượng tin và năng lượng thu thập được. Bài báo này
cấp năng lượng cho thiết bị thu/phát [4]. Công nghệ này cho đã giải quyết được bài toán tối ưu hiệu suất hệ thống; đặc biệt,
phép hệ thống có thể duy trì hoạt động bình thường hoặc kéo các tác giả đã đưa ra những biểu thức toán học tường minh để
dài thời gian sống của mạng vì không phụ thuộc vào việc cấp đánh giá hiệu năng hệ thống. Kế thừa và phát triển ý tưởng
nguồn như hiện nay, đặc biệt lý tưởng cho các mạng vô tuyến của hệ thống truyền thông điểm-điểm, trong bài báo [13], các
hoạt động trong những môi trường khắc nghiệt mà việc thay tác giả đã xem xét phương thức khuếch đại và chuyển tiếp
thế hoặc nạp lại pin gặp nhiều khó khăn [5]. Tuy nhiên, do (Amplify and Forward-AF), ở đó, nút chuyển tiếp có nguồn
hiệu suất chuyển dổi cũng như do hiệu ứng suy hao đường năng lượng hữu hạn, và thực hiện thu thập năng lượng từ tín
truyền, năng lượng thu thập được là không lớn dẫn đến vùng hiệu vô tuyến, dùng năng lượng tái tạo này để cấp nguồn cho
phủ sóng của các máy phát thu thập năng lượng là không lớn hoạt động chuyển tiếp thông tin đến đích. Trên cơ sở hai cấu
[5]. trúc máy thu chuyển mạch theo thời gian và phân chia công
Khi đó, việc sử dụng kỹ thuật truyền thông hợp tác [6] hoặc suất, hai giao thức chuyển tiếp được đề xuất trong bài báo này
kỹ thuật chuyển tiếp [7] cho mạng thu thập năng lượng là cần có tên là: giao thức chuyển tiếp dựa vào chuyển mạch thời gian
thiết với một số nghiên cứu tiêu biểu như [8]–[13]. Cụ thể, (Time Switching Relay) và giao thức chuyển tiếp dựa trên cơ
trong bài báo [8], các tác giả đã xem xét hệ thống MIMO sở phân chia công suất (Power Splitting Relay). Gần đây, các
488
ISBN: 978-604-67-0635-9 488

HộiHội Thảo
Thảo QuốcGia
Quốc Gia2015
2015về
vềĐiện
Điện Tử,
Tử,Truyền
Truyền Thông
Thông và
vàCông
CôngNghệ
NghệThông TinTin
Thông (ECIT 2015)
(ECIT 2015)
tác giả trong bài báo [14] đã đề xuất giao thức lựa chọn nút Nút đích được cấu hình với M anten và sử dụng kỹ thuật kết
chuyển tiếp thu thập năng lượng dựa trên tiêu chí năng lượng hợp phân tập lựa chọn trước khi giải điều chế tín hiệu.
mà nút chuyển tiếp thu thập được. Các kết quả phân tích chỉ Trong hệ thống này, giả sử rằng tác động của fading không
ra rằng giao thức lựa chọn nút chuyển tiếp đã cải thiện đáng thay đổi trong một khung dữ liệu, nhưng sẽ thay đổi một cách
kể hiệu năng của hệ thống. độc lập trong những khung dữ liệu tiếp theo. Thông tin trạng
Trong bài báo này, chúng tôi đề xuất mô hình truyền thông thái kênh của từng chặng giả sử được biết tại các nút chuyển
hai chặng cho đường truyền lên sử dụng kỹ thuật thu thập năng tiếp và nút đích.
lượng vô tuyến với kỹ thuật lựa chọn anten phát ở nút đích. Cụ Gọi h và gm với m = 1, 2, . . . , M lần lượt là hệ số kênh
thể trong bài báo này, chúng tôi thực hiện phân tích hệ thống truyền từ nút nguồn đến nút chuyển tiếp và từ nút chuyển tiếp
truyền thông chuyển tiếp, trong đó nút trung gian có nguồn đến anten thứ m tại nút đích. Xem xét ở kênh truyền fading
2 2
năng lượng hữu hạn, và phải thực hiện thu thập năng lượng Rayleigh, độ lợi kênh truyền tương ứng, |h| và |gm | , là các
từ tín hiệu vô tuyến để sử dụng cho hoạt động chuyển tiếp dữ biến ngẫn nhiên có phân[ bố]hàm mũ với[ tham ] số đặc trưng là
liệu. Hơn nữa, nút đích được trang bị nhiều anten và sử dụng λh và λg , với λh = E |h|2 , λg = E |gm |2 và E [.] là toán
kỹ thuật kết hợp chọn lựa để nâng cao hiệu quả giải mã dữ tử kỳ vọng.
liệu [15], [16]. Bài báo đã đề xuất phương pháp mới cho phép Nút chuyển tiếp thực hiện theo phương thức giải mã và
xấp xỉ xác suất dừng của hệ thống trên kênh truyền fading chuyển tiếp, tức là bản tin mà nút chuyển tiếp thu được từ nút
Rayleigh. Hơn nữa, chúng tôi còn thực hiện các mô phỏng hệ nguồn ở pha thứ nhất, sẽ được giải mã, mã hóa lại và phát
thống trên máy tính bằng phần mềm Matlab để kiểm chứng đến nút đích bằng nguồn năng lượng thu được. Giả sử rằng
các biểu thức toán học. Các kết quả phân tích và mô phỏng năng lượng tiêu tốn cho quá trình giải mã và mã hóa lại tín
cho thấy mô hình đề xuất với kỹ thuật lựa chọn anten thu ở hiệu tại nút chuyển tiếp là không đáng kể so với năng lượng
phía nút đích cho phép cải thiện đáng kể hiệu năng của hệ để chuyển tiếp tín hiệu.
thống ở kênh truyền fading Rayleigh. Hình 2 minh họa cấu trúc thu thập năng lượng thực hiện
Phần còn lại của bài báo được trình bày như sau. Phần II theo phương thức chuyển mạch thời gian khung dữ liệu (Time
trình bày mô hình của hệ thống. Phần III là phần đánh giá hiệu Switching-TS) với thời gian αT được sử dụng cho thu thập
năng của hệ thống dưới dạng xác suất dừng. Đây cũng là phần năng lượng và thời gian còn lại (1 − α)T được dùng cho xử lý
đề xuất phương pháp xấp xỉ mới cải thiện độ chính xác của thông tin. Khi hệ thống là đơn công, (1 − α)T /2 đơn vị thời
xác suất dừng hệ thống ở vùng tỷ lệ nhiễu thấp. Phần IV là gian dùng cho truyền dữ liệu từ S đến R và (1 − α)T /2 đơn vị
phần sử dụng mô phỏng Monte Carlo bằng phần mềm Matlab thời gian còn lại dùng cho truyền dữ liệu từ R đến D. Sơ đồ
để kiểm chứng kết quả phân tích ở Phần III và Phần V là phần khối máy thu năng lượng và thông tin được minh họa trong
kết luận của bài báo. Hình 3. Tín hiệu ở tần số vô tuyến (Radio Frequency-RF) tại
ngõ vào máy thu, được phân chia thành hai phần, bởi cấu trúc
II. MÔ HÌNH HỆ THỐNG chuyển mạch thời gian như đã giới thiệu ở trên, một phần đưa
về mạch thu thập năng lượng và một phần dành cho xử lý
thông tin1 .
 
 Thu th năng lưng
Nhn d liu t nút
ngun
Chuyn ti d liu đn
nút đích
Hình 1. Mô hình hệ thống truyền thông hai chặng thu thập năng lượng.
Xem xét hệ thống truyền thông vô tuyến như được biểu diễn
ở Hình 1, trong đó nút nguồn S truyền dữ liệu tới nút đích D Hình 2. Cấu trúc chuyển mạch thời gian khung dữ liệu.
thông qua sự trợ giúp của nút chuyển tiếp R. Giả sử rằng, hệ
thống không có đường truyền trực tiếp từ nút nguồn đến nút Máy thu năng lượng thực hiện chỉnh lưu tín hiệu RF, thông
đích do vùng phủ sóng của nút nguồn bị giới hạn hoặc do tồn qua các cấu trúc chỉnh lưu như được trình bày trong [3], và
tại vật cản giữa nguồn và nút đích. Giả sử nút chuyển tiếp hoạt đưa trực tiếp đến mạch nạp nguồn của bộ pin. Tín hiệu thu
động hoàn toàn dựa vào năng lượng thu thập nghĩa là không được tại nút chuyển tiếp là yr (t) được mô hình bằng biểu thức
có thiết bị cung cấp nguồn cố định (ví dụ như sử dụng các toán học như sau:
bộ pin mà định kỳ phải thay thế hoặc nạp lại) và thực hiện √
thu thập năng lượng từ tần số vô tuyến và chuyển đổi thành yr (t) = Ps hs(t) + νR , (1)
dòng một chiều để cấp nguồn. Nút nguồn và nút chuyển tiếp
được trang bị một anten hoạt động ở chế độ bán song công. 1 Chi tiết của cấu trúc này đã được trình bày kỹ trong
489
489
HộiHội
Thảo Quốc
Thảo Gia
Quốc Gia2015
2015về
vềĐiện
Điện Tử,
Tử,Truyền
Nghệ Thông
Thông TinTin (ECIT
(ECIT 2015)
2015)
III. PHÂN TÍCH XÁC SUẤT DỪNG

Xác suất dừng hệ thống là một thông số hiệu năng quan
trọng được định nghĩa là xác suất mà tỉ số tín hiệu trên nhiễu
đầu cuối của hệ thống thấp hơn ngưỡng cho trước, γth . Biểu
diễn theo biểu thức toán học, ta có
OP = Pr(γe2e < γth ), (8)
2R
trong đó γth = 2 1−α − 1 với R là tốc độ truyền mong muốn
của hệ thống. Thay thế (7) vào (8), ta có
OP = 1 − Pr [min (γ1 , γ2 ) ≥ γth ]
[ ]
γth γth (1 − α)
Hình 3. Sơ đồ khối máy thu thông tin và năng lượng. = 1 − Pr |h|2 > , |g̃|2 > . (9)
Ps /N0 2αηPs /N0 |h|2
Đặt X = |h|2 và Y = |g̃|2 và sử dụng [19, (6-37)], ta viết lại
trong đó Ps là công suất phát trung bình của nút nguồn, s(t)
(9) như sau:
là tín hiệu mã hóa tại nguồn và νR là nhiễu nội tại máy thu ∫ ∞ ∫ ∞
chuyển tiếp. Giả sử rằng nhiễu tại tất cả các máy thu, như nút OP = 1 − fX (x)fY (y)dxdy, (10)
chuyển tiếp R và nút đích D, là nhiễu trắng cộng tính chuẩn γth
Ps /N0
ϕ
x
(AWGN) với trung bình bằng không và phương sai bằng N0 .
Từ (1), ta có xác định được mức năng lượng thu thập, Eh , trong đó ϕ = γth (1 − α) / (2αηPs /N0 ). Trong (10), fX (x)
tại nút chuyển tiếp trong khoảng thời gian αT là và fY (y) lần lượt làm hàm mật độ phân bố xác suất của X
và Y , được cho sau đây [20, (2)]:
Eh = ηPs |h|2 αT, (2) ( )
1 x
với η ∈ (0, 1) là hiệu suất của mạch điện tái tạo năng lượng fX (x) = exp − , (11)
λh λh
với giả thiết rằng năng lượng dùng cho mạch điện tái tạo là
không đáng kể. Với năng lượng nhận được như trong (2), công M
∑ ( ) ( )
M m my
suất phát mà nút chuyển tiếp sử dụng trong khoảng thời gian fY (y) = (−1) m−1
exp − . (12)
(1 − α)T /2 để truyền dữ liệu đến nút đích là m=1
m λg λg
Pr = 2αηPs |h|2 /(1 − α). (3) Thay thế các biểu thức (11) và (12) vào (10) và triển khai tích
phân hai lớp, ta có thể viết lại (10) thành (13) ở đầu trang phía
Xem xét anten thứ m của nút đích, ta có tín hiệu nhận được
sau. Chú ý rằng tích phân Ω trong (13) không tồn tại dạng
viết ở dạng như sau:
√ đóng2 . Sử dụng phương pháp tương tự như ở [13], ta quan sát
yD,m = Pr gm ŝ(t) + νm thấy rằng tại vùng tỷ lệ trên nhiễu lớn thì Psγ/Nth
→ 0, nên ta
√ 0
có thể xấp xỉ Ω bằng cách thay đổi cận dưới của tích phân từ
2αηPs |h|2 γth
= gm s(t) + νm , (4) Ps /N0 về 0 như sau:
(1 − α)
M ( )
trong đó νm là nhiễu trắng tại anten thứ m của D và ŝ là 1 ∑ m−1 M
OP ≈1 − (−1)
phiên bản giải điều chế của s tại R. λh m=1 m
Từ biểu thức (1), ta xây dựng được biểu thức tỷ số công ∫ ∞ ( ) ( )
x mϕ
suất tín hiệu trên nhiễu của chặng từ S đến R như sau: × exp − exp − dx . (14)
0 λh λg x
Ps |h|2 � ��
γ1 = . (5) Ω
N0
Sử dụng biến đổi [21, (3.324.1)], ta có
Sử dụng với kỹ thuật kết hợp chọn lựa tại nút đích, tỷ số tín
M ( )
hiệu trên nhiễu ở chặng thứ hai được đưa ra bởi: 1 ∑ m−1 M
OP ≈1 − (−1)
2αηPs |h|2 |g̃|2 γ̄1 m=1 m
γ2 = , (6) √ ( √ )
(1 − α) N0 λh mϕ
2 × 2 mϕ K1 2 , (15)
với |g̃| = max |gm |2 . λg λh λg
m=1,2,...,M
Trong hệ thống chuyển tiếp DF, chặng yếu hơn sẽ quyết với Kn (.) là hàm Bessel điều chỉnh loại hai [21, (8.407.1)].
định hiệu năng của hệ thống, do đó ta có thể viết tỷ số tín Xấp xỉ cho OP (15) sẽ hợp lý khi hệ thống hoạt động ở
hiệu trên nhiễu tương đương của hệ thống như sau [7], [17], vùng tỷ lệ tín hiệu trên nhiễu cao, cụ thể là Ps /N0 ≫ γth .
[18]:
2 Closed-form expression hay một số tài liệu còn gọi là dạng tường minh,
γe2e = min (γ1 , γ2 ) . (7) nghĩa là biểu diễn dưới dạng những hàm cơ bản.
490
490
HộiHội Thảo
Thảo QuốcGia
Quốc Gia2015
2015về
vềĐiện
Điện Tử,
Tử,Truyền
Truyền Thông
Thông và
vàCông
CôngNghệ
NghệThông TinTin
Thông (ECIT 2015)
(ECIT 2015)
M ( ) ∫ ∞ ∫ ∞ ( ) ( )
1 ∑ m−1 M m x my
OP = 1 − (−1) exp − exp − dxdy
λh m=1 m λg P γ/N th ϕ
x
λh λg
s 0
M ( )∫ ∞ ( ) ( )
1 ∑ m−1 M x mϕ
=1− (−1) exp − exp − dx . (13)
λh m=1 m γth
Ps /N0
λh λg x
� ��
Ω
Khi mà thực tế hiện nay, hệ thống thu thập năng lượng hầu
hết hiệu suất còn chưa cao dẫn đến công suất thu thập được 10 0
rất thấp gây ra những sai lệch lớn cho OP ở vùng tỷ lệ tín
hiệu trên nhiễu thấp [22]. Trong bài báo này, tôi đề xuất một
phương pháp tính mới dựa trên khai triển hàm mũ theo chuỗi
vô hạn cụ thể như sau [21, (1.211.1)]
( ) ∑ 10 -1
∞ t( )t
mϕ (−1) mϕ
exp − = . (16)
λg x t=0
t! λg x
Thay thế (16) vào Ω, ta viết lại Ω như sau:

Nt = 1
∑ ∞ t( )t ∫ ∞ ( ) ( )t 10 -2
(−1) mϕ x 1 Nt = 5
Ω= exp − dx.
t=0
t! λg γ th
Ps /N0
λh x Nt = 10
(17) Nt = 15
Nt = 20
Sử dụng [21, (3.351.4)], ta có được biểu thức của Ω theo chuỗi 10 -3

0 5 10 15 20 25 30 35 40
vô hạn như công thức (18) được trình bày ở đầu trang sau với
Ei(., .) là hàm tích phân mũ [21, (3.351.2)].
Cuối cùng, thay Ω ở vừa tính được ở (18) vào (13), ta được Hình 4. Khảo sát ảnh hưởng của số lượng thành phần trong chuỗi lên xác
biểu thức xác suất dừng hệ thống như ở (19). Tuy nhiên, biểu suất dừng hệ thống, α = 0.3, η = 0.75, R = 1, λh = λg = 1, và M = 3.
thức (19) trong thực tế không thể dùng để tính toán trên các
phần mềm vì chứa chuỗi vô hạn. Trong tính toán thực tế, chúng
ta phải xấp xỉ biểu thức (19) như (20) bằng cách chỉ sử dụng 10 0
Nt thành phần đầu tiên của chuỗi. Số lượng Nt thành phần
hợp lý sẽ được khảo sát ở phần sau.
IV. KẾT QUẢ MÔ PHỎNG

Trong phần này, chúng tôi sẽ thực hiện mô phỏng Monte 10 -1
Carlo nhằm hai mục đích: i) kiểm chứng tính chính xác của
phương pháp đề xuất và kết quả phân tích ở các phần trên ii)
so sánh mô hình để xuất so với mô hình truyền thống để từ
đó chứng minh ưu điểm của mô hình đề xuất và iii) khảo sát M = 1, 3, 5
ảnh hưởng của số lượng anten ở phía máy thu lên hiệu năng 10 -2
hệ thống.
Trong Hình 4, chúng tôi khảo sát ảnh hưởng số lượng thành
phần đầu tiên trong chuỗi đến độ chính xác của kết quả xấp
Phân tích
xỉ và đồng thời so sánh kỹ thuật xấp xỉ đề xuất với kỹ thuật
xấp xỉ truyền thống. Số lượng thành phần khảo sát lần lượt là 10 -3
0 5 10 15 20 25 30 35 40
1, 5, 10, 15 và 20. Quan sát trên Hình 4, ta thấy rằng trường
hợp Nt = 1 và Nt = 5 thì xác suất xấp xỉ đạt được không
tốt bằng kỹ thuật truyền thống. Tuy nhiên, khi số lượng thành Hình 5. Ảnh hưởng của số lượng anten ở nút đích lên xác suất dừng hệ
phần từ 10 trở lên, thì kết quả xác suất xấp xỉ gần như trùng thống, α = 0.3, η = 0.75, R = 1, λh = λg = 1, và Nt = 20.
với kết quả mô phỏng ở toàn miền tỷ số tín hiệu trên nhiễu
khảo sát và đồng thời tốt hơn kỹ thuật truyền thống.
Trong Hình 5, chúng tôi khảo sát ảnh hưởng của số lượng anten từ 1 lên 3 và 5. Quan sát trên hình, chúng ta dễ dàng
anten lên xác suất dừng hệ thống bằng cách tăng số lượng nhận thấy rằng, khi tăng từ 1 lên 3 anten ở nút đích, xác suất
491
491
Hội Hội
 
t( )t ( )t−1 ( ) ( )ℓ
γth N0
∞
∑ t − t−2
∑
(−1) mϕ  (−1) 1 γth N0 e Ps λh
1 γth N0 
Ω=  Ei − +( )k−1 − 
t=0
t! λg (t − 1)! λh Ps λh γth N0 (t − 1)(t − 2) . . . (t − 1 − ℓ) Ps λh
ℓ=0
Ps λh
(18)
M ( )∑ ∞ t[ ]t
1 ∑ m−1 M (−1) mγth (1 − α)
OP =1 − (−1)
γ̄h m=1 m t=0 t! 2αηλg Ps /N0
 
t ( )t−1 ( ) ( )ℓ
γ N0
− Pth ∑t−2
 (−1) 1 γth N0 e s h λ
1 γth N0 
× Ei − +( )k−1 −  (19)
(t − 1)! λh P s λh γth N0 (t − 1)(t − 2) . . . (t − 1 − ℓ) Ps λh
ℓ=0
Ps λh
M ( )∑ Nt t[ ]t
1 ∑ m−1 M (−1) mγth (1 − α)
OP ≈1 − (−1)
γ̄h m=1 m t=0 t! 2αηλg Ps /N0
 
t ( )t−1 ( ) ( )ℓ
γ N0
− Pth ∑t−2
 (−1) 1 γth N0 e s λh
1 γth N0 
× Ei − +( )k−1 −  (20)
(t − 1)! λh P s λh γth N0 (t − 1)(t − 2) . . . (t − 1 − ℓ) Ps λh
ℓ=0
Ps λh
dừng của hệ thống được cải thiện đáng kể so với trường hợp
10 0
tăng từ 3 lên 5 anten. Bên cạnh đó, độ dốc của đồ thị cũng P s = {10 dB, 15 dB, 20 dB}
chỉ ra rằng, khi tăng số lượng anten ở nút đích chỉ cải thiện độ
lợi mã của hệ thống mà không cải thiện độ lợi phân tập. Bên
cạnh đó, kết quả mô phỏng trùng khít với kết quả phân tích
chứng minh rằng phương pháp xấp xỉ đề xuất là hoàn toàn
đúng đắn.
10 0
10 -1
0 0.1 0.2 0.3 0.4 0.5 0.6 0.7 0.8 0.9
10 -1
α
M = 1, 3, 5 Hình 7. Ảnh hưởng của Ps lên giá trị α tối ưu, η = 0.75, R = 1,
λh = λg = 1, Nt = 20, và M = 2.
giữ nguyên tham số kênh truyền trong khi thay đổi số lượng
10 -2 anten thu ở nút đích. Chúng ta thấy rằng tồn tại một giá trị α
0 0.1 0.2 0.3 0.4 0.5 0.6 0.7 0.8 0.9
α làm cho xác suất dừng hệ thống nhỏ nhất, và chúng ta gọi giá
trị này là giá trị α tối ưu. Chúng ta cũng thấy rằng số lượng
Hình 6. Ảnh hưởng của số lượng anten lên giá trị α tối ưu, η = 0.75,
anten sẽ làm thay đổi giá trị tối ưu của α. Khi số lượng anten
Ps = 20 dB, R = 1, λh = λg = 1, và Nt = 20. tăng lên thì giá trị α có xu hướng nhỏ lại. Cụ thể với trường
hợp N = 5, giá trị tối ưu của α là xấp xỉ 0.3. Hình 7 khảo
Trong Hình 6 và 7, chúng tôi khảo sát ảnh hưởng của giá sát ảnh hưởng của Ps lên giá trị tối ưu của α. Chúng ta khảo
trị α lên hiệu năng của hệ thống. Trong Hình 6, chúng tôi sát với 3 trường hợp: Ps = 10 dB, Ps = 15 dB, và Ps = 20
492
492
HộiHội
ThảoThảo Quốc
Quốc Gia
2015 ĐiệnTử,
Tử,Truyền
TruyềnThông
Thông và
và Công
CôngNghệ
NghệThông
ThôngTinTin
(ECIT 2015)
(ECIT 2015)
dB. Ngược với những gì quan sát được ở Hình 6, giá trị Ps [8] B. K. Chalise, Y. D. Zhang, and M. G. Amin, “Energy harvesting in an
tăng sẽ làm giá trị α tối ưu tăng. OSTBC based amplify-and-forward MIMO relay system,” in Proc. of
IEEE Int. Conf. Acoustics, Speech and Sig Proc. (ICASSP), Mar. 2012,
V. KẾT LUẬN pp. 3201–3204.
[9] A. M. Fouladgar and O. Simeone, “On the transfer of information and
Trong bài báo này, chúng tôi đã đề xuất được mô hình truyền energy in multi-user systems,” IEEE Commun. Lett., vol. 16, no. 11, pp.
1733–1736, Nov. 2012.
thông chuyển tiếp sử dụng kỹ thuật thu thập năng lượng tại [10] Y. Gu and S. Aissa, “Interference aided energy harvesting in decode-
nút chuyển tiếp áp dụng cho trường truyền lên. Bài báo đã and-forward relaying systems,” in Proc. IEEE Int. Conf. Commun. (ICC),
đề xuất kỹ thuật phân tích xác suất dừng. Các kết quả phân Jun. 2014, pp. 5378–5382.
[11] D. S. Michalopoulos, H. Suraweera, and R. Schober, “Relay selection
tích chứng minh rằng mô hình đề xuất là tốt hơn mô hình đơn for simultaneous information transmission and wireless energy transfer:
anten và số lượng anten tại đích cho phép cải thiện đáng kể A tradeoff perspective,” IEEE Journal Selected Areas Commun., Aug.
hiệu năng của hệ thống. 2015.
[12] D. Mishra and S. De, “Optimal relay placement in two-hop RF energy
ACKNOWLEDGMENT transfer,” IEEE Trans. Commun, May. 2015.
[13] A. A. Nasir, Z. Xiangyun, S. Durrani, and R. A. Kennedy, “Relaying
Nghiên cứu này được tài trợ bởi Quỹ Phát triển khoa học và protocols for wireless energy harvesting and information processing,”
công nghệ Quốc gia (NAFOSTED) trong đề tài mã số 102.04- IEEE Transactions on Wireless Communications, vol. 12, no. 7, pp.
3622–3636, 2013.
2014.32. [14] N. T. Do, V. N. Q. Bao, and B. An, “A relay selection protocol for
wireless energy harvesting relay networks,” in Proc. 2015 International
TÀI LIỆU Conference on Advanced Technologies for Communications (ATC), 2015.
[1] J. M. Dilhac and M. Bafleur, “Energy harvesting in aeronautics for [15] B. Barrow, “Diversity combination of fading signals with unequal mean
battery-free wireless sensor networks,” IEEE Aerospace and Electronic strengths,” IEEE Transactions on Communications Systems, vol. 11,
Systems Magazine, vol. 29, no. 8, pp. 18–22, 2014. no. 1, pp. 73–78, 1963, 0096-1965.
[2] L. R. Varshney, “Transporting information and energy simultaneously,” [16] V. N. Q. Bao, K. Hyung Yun, and H. Seong Wook, “Performance anal-
in Proc. of 2008 IEEE International Symposium on Information Theory ysis of M-PAM and M-QAM with selection combining in independent
(ISIT’08), 2008, pp. 1612–1616. but non-identically distributed rayleigh fading paths,” in Proc. IEEE 68th
[3] P. Grover and A. Sahai, “Shannon meets Tesla: Wireless information and 2008 Veh. Tech. Conf. (VTC 2008-Fall), pp. 1–5.
[17] V. N. Q. Bao and K. Hyung Yun, “Error probability performance for
power transfer,” in Proc. of the 2010 IEEE International Symposium on
multi-hop decode-and-forward relaying over Rayleigh fading channels,”
Information Theory Proceedings (ISIT), 2010, pp. 2363–2367.
in Proc. 11th 2009 International Conference on Advanced Communica-
[4] H. Yejun, C. Xudong, P. Wei, and G. L. Stuber, “A survey of energy
tion Technology (ICACT’09), vol. 03, pp. 1512–1516.
harvesting communications: models and offline optimal policies,” IEEE
[18] V. N. Q. Bao and T. Q. Duong, “Outage analysis of cognitive multihop
Communications Magazine, vol. 53, no. 6, pp. 79–85, 2015.
networks under interference constraints,” IEICE Trans. Commun., vol.
[5] M. Yuyi, L. Yaming, Z. Jun, and K. B. Letaief, “Energy harvesting small
E95-B, no. 03, pp. 1019–1022, 2012.
cell networks: feasibility, deployment, and operation,” IEEE Communi-
[19] A. Papoulis and S. U. Pillai, Probability, random variables, and stochas-
cations Magazine, vol. 53, no. 6, pp. 94–101, 2015.
tic processes, 4th ed. Boston: McGraw-Hill, 2002.
[6] J. N. Laneman, D. Tse, and G. Wornell, “Cooperative diversity in
[20] V. N. Q. Bao and H. Y. Kong, “Diversity order analysis of dual-hop
wireless networks: Efficient protocols and outage behavior,” IEEE Trans.
relaying with partial relay selection,” IEICE Trans Commun, vol. E92-
Inf. Theory, vol. 50, no. 12, pp. 3062–3080, Dec. 2004.
B, no. 12, pp. 3942–3946, 2009.
[7] M. O. Hasna and M.-S. Alouini, “End-to-end performance of transmis-
[21] D. Zwillinger, Table of integrals, series, and products. Elsevier, 2014.
sion system with relays over Rayleigh-fading channels,” IEEE Transac-
[22] C. Xiaoming, Z. Zhaoyang, C. Hsiao-Hwa, and Z. Huazi, “Enhancing
tions on Wireless Communications, vol. 2, no. 6, pp. 1126–1131, 2003.
wireless information and power transfer by exploiting multi-antenna
techniques,” IEEE Commun. Mag., vol. 53, no. 4, pp. 133–141, 2015.
493
493
Điều Khiển Xe Lăn Dựa Trên Nhận Dạng Ảnh Trạng

Thái Của Bàn Tay Với Board Intel Galileo
Trương Phong Tuyên, Phạm Hoàng Lượm và Phạm Thanh Hùng
Bộ môn Điện tử - Viễn thông,
Khoa Công Nghệ, Trường Đại học Cần Thơ.
Email: tptuyen@ctu.edu.vn, luom117984@student.ctu.edu.vn, hung117970@student.ctu.edu.vn.
Hiện nay trên thế giới có nhiều phiên bản xe lăn được
Abstract— Trong những năm gần đây, ở nước ta số ca đột quỵ
đang có xu hướng ngày càng tăng và hầu hết bệnh nhân phải nghiên cứu với các phương pháp điều khiển đặc trưng riêng
gánh chịu các di chứng bại liệt dẫn đến gặp khó khăn trong đi lại. biệt như:
Trong một số trường hợp nhẹ, để di chuyển họ có thể tự điều − Xe điều khiển bằng joystick đòi hỏi người dùng phải
khiển xe lăn. Tuy nhiên, với các trường hợp bị liệt bán thân và điều khiển bằng tay hoặc một chi bị tật mà chi còn lại
tay còn lại cũng bị yếu không thể thao tác với cần điều khiển xe khỏe mạnhh thì mới có thể điều khiển xe lăn bằng
thì những người này phải điều khiển xe thông qua các giải pháp phương pháp này. Nó không phù hợp cho người bị liệt,
hỗ trợ như: nhận dạng sự di chuyển của mắt, cử động đầu v.v... yếu tất cả các chi [3].
Hiện tại hầu hết các giải pháp trên đều chạy trên máy tính do đó
− Xe điều khiển bằng “hớp và thổi” như cách mà
tiêu tốn nhiều điện năng và giá thành cao. Bên cạnh đó, Intel vừa
cho ra mắt board Intel Galileo sử dụng chip Intel Quark X1000 Christopher Reeve . Theo đó, ông thổi vào một ống hút
được sản xuất dựa trên dây chuyền công nghệ 14 nm phù hợp để làm xe lăn di chuyển, tuy nhiên phương pháp này
cho các ứng dụng nhúng di động. Với mục tiêu thiết kế một hệ gây ra khó khăn trong việc hô hấp của chính người
thống điều khiển xe lăn có giá thành hợp lý, nghiên cứu này đề khiển [4].
xuất giải pháp điều khiển thông qua việc nhận dạng các cử động − Xe lăn điều khiển bằng lưỡi của các chuyên gia tại Viện
tay sử dụng board Intel Galileo. Thành phần chính của hệ thống Công nghệ Georgia của Mỹ đã nghiên cứu năm 2011,
bao gồm: một webcam làm nhiệm vụ chụp, gởi ảnh được kết nối theo đó người sử dụng đeo bộ tai nghe có trang bị cảm
qua cổng microUSB với board Intel Galieo chạy hệ điều hành
biến nhằm thu nhận tín hiệu từ trường phát ra từ khuyên
Linux. Ngôn ngữ Python được sử dụng trong việc lập trình cài
đặt các giải thuật nhận dạng ảnh. Kết quả nhận dạng các trạng ở lưỡi [5].
thái của bàn tay sẽ được dùng để điều khiển hoạt động của xe − Xe lăn có thể điều khiển bằng sự chuyển động của đầu
lăn. và sóng não con người được xem là một trong những
phát minh hàng đầu ở Úc được đề xuất bởi GS Nguyễn
Keywords- Điều khiển xe lăn, cử động tay, Intel Galileo, Hùng, Khoa Kỹ thuật và Công nghệ thông tin, Đại học
Python, xử lý ảnh. Công nghệ Sydney, với chi phí lên đến khoảng 15.000
USD [6][19][23][25].
I. GIỚI THIỆU − Xe lăn điều khiển bằng đầu do Phòng Thí nghiệm Điều
Mỗi năm tại Việt Nam có hơn 200.000 người bị đột quỵ (tai khiển Tự động, Khoa Điện-Điện tử, Đại học Bách Khoa
biến mạch máu não), hơn 50% trong số đó tử vong và 90% số TPHCM thực hiện năm 2013 lại có khuyết điểm là gây
người sống sót sau đột quỵ phải sống chung với các di chứng khó khăn trong việc quan sát cho người điều khiển [7].
về thần kinh và vận động… Hiện Việt Nam có khoảng 486.000 − Xe lăn điều khiển bằng mắt được nghiên cứu và thực
người còn sống sau đột quỵ, tuy nhiên chỉ có khoảng 25-30% hiện tại trường Đại học Cần Thơ của Nguyễn Hữu
tự đi lại phục vụ bản thân được, 20-25% đi lại khó khăn, cần sự Cường, Bộ môn Tự động hóa, Khoa Công Nghệ năm
hỗ trợ của người khác trong sinh hoạt, 15-25% phải phụ thuộc 2011 thì lại có giá thành cao vì cần một máy tính xách
hoàn toàn vào sự phục vụ của người khác [1]. Đối với hầu hết tay để điều khiển và cũng rất bất tiện trong việc quan sát
các bệnh chịu các di chứng do đột quỵ thì xe lăn là phương xung quanh [8][20][21].
tiện di chuyển phù hợp. Ở mức độ bị liệt bán thân hoặc nặng Vào tháng 10 năm 2013, Intel cho ra mắt board Intel
hơn thì sức lực của bàn tay không còn đủ để có thể thao táo với Galileo [9], có giá bán khoảng hai triệu đồng tại Việt Nam, sử
cần điều khiển của các xe lăn truyền thống, khi đó họ phải dụng chip Intel Quark X100 với 16K Cache, 400MHz. Đây là
dùng các giải thuật khác hỗ trợ việc điều khiển như: nhận dạng chip đầu tiên thuộc dòng Santa Clara của Intel được sản xuất
sự di chuyển của mắt, cử động đầu, bằng ý nghĩ v.v... dựa trên dây chuyền công nghệ 14 nm với mức độ tiêu thụ điện
[22][24][26][27]. Tuy nhiên những giải thuật này phải thực rất thấp, hỗ trợ tốt cho việc phát triển các ứng dụng nhúng di
hiện trên máy tính do đó là có giá thành cao [2]. động [10].
ISBN: 978-604-67-0635-9 494

494
HộiHội
Thảo Quốc
Thảo Gia
Quốc 2015
Gia 2015về
vềĐiện
ĐiệnTử,
Tử,Truyền
NghệThông
ThôngTinTin (ECIT
(ECIT 2015)
2015)
Từ thực tế trên, chúng tôi đã quyết định thực hiện nghiên sẽ xuất các tín hiệu điều khiển thông qua các chân I/O. Các tín
cứu “Điều khiển xe lăn dựa trên nhận dạng ảnh trạng thái của hiệu trên sẽ điều khiển các mạch công suất cấp nguồn cho hai
bàn tay với board Intel Galileo”. Mục tiêu của nghiên cứu là động cơ hoạt động đưa xe đi thẳng hoặc rẽ trái, phải theo trạng
thiết kế một hệ thống điều khiển xe lăn với kích thước nhỏ gọn, thái tay điều khiển. Bên cạnh đó, board Intel Galileo còn kết
nhẹ, có giá thành hợp lý. Việc điều khiển xe chỉ bằng những cử nối với các module khác như: module LED hiển thị, module
chỉ đơn giản của bàn tay không cần dùng nhiều sức lực và bàn cảm biến chạm. Ngoài ra, Board điều khiển trung tâm còn kết
tay chỉ cần đặt trong một phạm vi khu vực cố định dưới sự ghi nối với card âm thanh để phát các thông báo hướng dẫn, thông
nhận của webcam. tin về hoạt động của hệ thống.
Trong thiết kế này, thành phần chính của hệ thống là board
xử lý trung tâm Intel Galileo. Một webcam kết nối với board
xử lý qua cổng microUSB để chụp và truyền ảnh bàn tay điều
khiển. Board Intel Galileo chạy hệ điều hành Linux rút gọn từ
thẻ nhớ. Trên hệ điều hành này, ngôn ngữ Python đã sử dụng
trong việc lập trình cài đặt giải thuật nhận dạng ảnh trạnh thái
của bàn tay. Kết quả nhận dạng các trạng thái của bàn tay sẽ
được dùng để điều khiển hoạt động của xe lăn.
Phần còn lại của bài viết được tổ chức như sau: trong phần
II, chúng tôi mô tả các bước thực hiện của hệ thống. Việc kiểm
tra, thực nghiệm trong vận hành của hệ thống sẽ được trình bày
trong phần III. Cuối cùng, các kết quả đạt được, cũng như đề
xuất hướng phát triển của nghiên cứu được tóm tắt trong phần
kết luận.
II. THIẾT KẾ HỆ THỐNG
II.1 Phân tích hệ thống
Hình 2. Sơ đồ luồng dữ liệu và nối kết của hệ thống.

II.3 Phần cứng của hệ thống
Hình 3 trình bày sơ đồ khối thiết kế phần cứng của hệ
thống, bao gồm:
• Board xử lý trong tâm: sử dụng board Intel Galileo
với thẻ nhớ 8 GB để lưu trữ hệ điều hành Linux Image
Galileo phục vụ việc chạy chương trình, đồng thời lưu trữ
các hình chụp từ webcam. Do hệ thống rung lắc trong quá
trình di chuyển nên đã được cố định board Galileo như
Hình 4.
• Bộ phận thu nhận ảnh: sử dụng webcam Logitech
Hình 1. Sơ đồ tổng quát của hệ thống. C920, chụp hình ở chế độ Full HD 1080, ảnh có độ phân
Sơ đồ Hình 1 mô tả hệ thống điều khiển xe lăn dựa trên giải 15 Mpixel. Đây là webcam trang bị ống kính Carl
nhận dạng ảnh trạng thái bàn tay thực hiện trong nghiên cứu Zeiss, hỗ trợ chế độ lấy nét tự động và chống rung. Bên
này. Ảnh bàn tay điều khiển xe lăn được chụp với độ phân giải cạnh đó webcam còn hỗ trợ kết nối qua cổng microUSB,
15 MPixel bởi một webcam, sau đó được truyền về board điều tương thích tốt với hệ điều hành Linux chạy trên board Intel
khiển trung tâm, Intel Galileo, qua cổng microUSB. Trên Galileo. Một khung kim loại được sử dụng để cố định vị trí
board điều khiển này, chương trình nhận dạng ảnh để xác định webcam, như Hình 5.
trạng thái của bàn tay từ đó điều khiển xe lăn hoạt động. • Module biến đổi nguồn và ắc quy: do board Intel sử
II.2 Thiết kế luồng dữ liệu dụng điện áp trong khoảng 3,3-5V nên module biến đổi
Board Intel Galileo có thể kết nối và giao tiếp với 128 thiết điện áp sử dụng chip LM2596 của TI [13] được sử dụng để
bị ngoại vi nhưng cần có một HUB USB để chia sẻ cổng kết hạ điện áp 12V của ắcquy xuống 5V với dòng tải 3A. Ắc-
nối [11]. Hướng đi của luồng dữ liệu trong thiết kế này được quy được sử dụng là loại 12V – 7Ah dùng phổ biến cho xe
mô tả như sau: xuất phát từ webcam Logitech C920 [12], dữ gắn máy.
liệu ảnh được truyền đến board Galileo thông qua cổng Micro • Module điều khiển động cơ và động cơ gạt nước:
USB Host trên board và được đưa và lưu trữ trong SD card module điều khiển công suất có điện áp điều khiển từ 12V-
8GB trên board. Sau đó chương trình xử lý ảnh viết bằng 26V, dòng tải lớn nhất là 10A, có hồi tiếp dòng và hỗ trợ
Python sẽ đọc ảnh và phân thích ảnh này thành ảnh nhị phân, chế độ PWM được sử dụng để điều khiển cấp nguồn cho
so sánh với các ảnh mẫu để xác định trạng thái hiện tại của bàn các động cơ. Do cần lực kéo mạnh để di chuyển xe, đặc biệt
tay. Từ trạng thái nhận dạng được này, board xử lý trung tâm là ừ trạng thái đứng yên, nên chúng tôi đã chọn động cơ gạt
495
495
Hội
HộiThảo
ThảoQuốc
Quốc Gia 2015 về
Gia 2015 vềĐiện
ĐiệnTử,
Tử,Truyền
TruyềnThông
Thôngvàvà Công
Công Nghệ
Nghệ Thông
Thông Tin (ECIT
Tin (ECIT 2015)
2015)
nước của ô tô bán trên thị trường. Động cơ này đã có sẵn bộ

giảm tốc nên có lức kéo lớn và điện thế sử dụng là 12V.
Các động cơ này có lực kéo lớn đảm bảo cho xe hoạt động
tốt với trọng lượng của một người trường thành khoảng 75
– 90Kg (với trọng lượng của xe và ắc quy là 35 Kg). Trong
thiết kế này, hai động cơ gạt nước được sử dụng để thuận
tiện trong việc điều khiển rẽ trái, phải của xe. Tuy nhiên, do
không tồn tại hai động cơ hoàn toàn giống nhau về lực kéo Hình 6. Bố trí và lắp đặt động cơ gạt nước vào xe lăn.
nên cần sử dụng điều khiển động rộng xung (PWM) để điều
• Module âm thanh: gồm một card âm thanh kết nối vối
chỉnh lại lực kéo giúp xe giữ thăng bằng và chạy thẳng,
board điều khiển qua cổng USB và loa dùng để phát thông
hoặc rẽ trái, phải một cách chính xác. Bố trí và lắp đặt các
báo hướng dẫn người sử dụng. Do hệ điều hành Linux chạy
động cơ xem ở Hình 6.
trên board Intel Galileo là bản rút gọn nên chỉ hỗ trợ
chương trình phát các file âm thanh theo các định dạng:
wav, voc, raw và au với tần số mẫu là 48 KHz [15].
II.4 Phần mềm và giải thuật
• Chương trình chính
Dựa trên phân tích luồng dữ liệu của hệ thống, chúng tôi đã
lập trình phần mềm nhận dạng và điều khiển xe lăn xe the lưu
đồ giải thuật như ở Hình 7.
Bắt
Lời chào
Hình 3. Sơ đồ kết nối các khối trong khối hệ thống. Người dùng
có muốn lấy
mẫu tay lại
không ? Đ
S
Lấy mẫu tay
Xử lý ảnh mẫu
Hình 4. Bộ xử lý chính là board Intel Galileo [14].
Chụp lấy mẫu tay
Tính toán giá trị sai lệch

giữa ảnh mẫu gốc và ảnh
Kiểm tra các giá trị đã tính

toán với dữ liệu gốc
Xuất GPIO điều khiển
Hình 7. Lưu đồ giải thuật chương trình chính.

Hình 5. Bộ phận thu nhận ảnh sử dụng webcam Logitech C920 Chương trình bắt đầu bằng lời chào được phát từ file audio
được đặt cố định với một bàn điều khiển. thu âm sẵn. Tiếp theo đó là file audio hướng dẫn, người sử
dụng có thể tiến hành điều khiển xe ngay hoặc lấy lại các ảnh
496
496
mẫu bằng cách đặt tay lên cảm biến. Ở đây cần lưu ý là việc đó cần phải đơn giản, đòi hỏi ít tài nguyên của hệ thống. Vì thế
lấy lại ảnh mẫu các trạng của tay dùng cho mục đích điều khiển giải thuật so sánh hai ảnh bằng phương pháp trừ ảnh đã được
là cần thiết đối với một người sử dụng mới. Nếu người sử dụng chọn sử dụng trong trong thiết kế này với mục tiên có thể nhận
chọn lấy lại mẫu chương trình sẽ thực hiện lấy mẫu tay liên tục dạng các ảnh trạng thái bàn tay cho phép điều khiển xe lăn di
bằng cách gọi chương trình con lấy mẫu, ngược lại chương chuyển.
trình sẽ tự động lấy file ảnh mẫu trong thẻ SD có sẵn và tiến Để việc nhận dạng cử chỉ tay cho kết quả tốt hơn ảnh sẽ
hành xử lý tiếp. Giai đoạn tiếp theo là chương trình sẽ được tách làm 4 phần: trên, dưới, trái và phải; sau đó việc so
liên tục thực hiện các lệnh so sánh giữa ảnh nhận từ webcam sánh sẽ tiến cho từng phần. Kết quả so sánh giữa ảnh chụp bàn
chụp tay người điều khiển và tập các ảnh mẫu nhằm cho kết tay điều khiển và ảnh mẫu không thể trùng khớp với nhau. Sự
quả điều khiển hoạt động của xe như mong muốn. sai biệt này là không thể tránh khỏi do đó trong thực tế ta cần
• Chương trình nhận dạng ảnh định giá trị ngưỡng cho sai số này để có được kết nhận dạng
Trong thiết kế này, chúng tôi đã chọn các trạng thái của hợp lý. Tuy nhiên để có kết quả nhận dạng tốt, tương ứng với
bàn tay như bảng 1, dùng trong điều khiển xe lăn phù hợp với ngưỡng của sai số nhỏ, trong thiết kế này chúng tôi đã thực
phương pháp xử lý ảnh cho mục đích nhận dạng. hiện một số cách nhằm hạn chế các nguyên nhân dẫn đến sai số
Bảng 1. Thư viện ảnh mẫu các trạng thái của bàn tay. này. Các cách này sẽ được trình bày trong quá trình thiết kế và
Tên trạng Điều Hình ảnh thực hiện hệ thống nhằm giải quyết những khó khăn phát sinh ,
Mô tả
thái khiển mô tả nâng cao độ tin cậy của hệ thống đước thiết kế.
Đây là Quá trình chụp ảnh bàn tay và nhận dạng ảnh để điều
trạng thái khiển xe lăn được tiến hành theo 3 bước sau:
Xe
Không có ban đầu
không di
gì không có
chuyển
tay người
điều khiển
Bàn tay
duỗi thẳng
Xe đi
Tay các ngón Nắm đấm Đấm cái
thẳng
tay khép (a) (b)
lại Hình 8. Hai trạng thái của bàn tay được so sánh.
Bàn tay - Bước 1: Tiến hành xuất nhị phân và làm mịn ảnh.
duỗi thẳng
ngón cái
mở ra một Xe rẽ
Tay cái
góc 600- phải
750 và các
ngón còn
lại khép (a) (b)
Các ngón Hình 9. Hai cử chỉ được xử lý sang ảnh nhị phân.
tay co lại - Bước 2: Tiến hành cắt ảnh làm 4 phần được mô tả
sát vào như Hình 10.
lòng bàn
Xe rẽ
Đấm cái tay riêng
trái
ngón cái
mở ra một
góc 600-
750
Các ngón
tay co lại Hình 10. Hai cử chỉ được xử lý sang ảnh nhị phân
Xe dừng
Nắm đấm sát vào và được cắt ảnh từng vùng với đơn vị pixel.
và có còi
lòng bàn Hai ảnh được chụp và lưu lại với kích thước 480x640 pixel
tay sau đó ảnh được phân thành 4 vùng như trên Hình 10.
- Bước 3: Tiến hành so sánh từ các phần của ảnh có được ở
Hiện nay có nhiều giải thuật cho kết quả tốt trong nhận bước 2 với dữ liệu của ảnh mẫu tương ứng. Dựa vào kết quả so
dạng ảnh cử chỉ của người để điều khiển các thiết bị như: hand sánh chương trình sẽ điều khiển xe di chuyển.
tracking [16], leap montion [17], nhận dạng cử động của bàn Ở Hình 10, phần ảnh ở góc trái và phía trên hoàn toàn
tay người theo thời gian thực [18]…Tuy nhiên để thực hiện giống nhau và phần ảnh bên dưới gần giống nhau. Trong khi
được trên một board điều khiển như Intel Galileo thì giải thuật phần ảnh bên góc phải khác nhau hoàn toàn nên qua phép trừ
497
497
HộiHội
Thảo Quốc
Thảo Gia
Quốc Gia2015
2015về
vềĐiện
Điện Tử,
Tử,Truyền
Nghệ Thông
Thông TinTin (ECIT
(ECIT 2015)
2015)
ảnh sẽ cho giá trị khác nhau rất nhiều. Dựa vào kết quả này ta sáng khác nhau sẽ cho ra hai ảnh nhị phân khác nhau. Vì thế
có thể kết luận hai ảnh này không giống nhau. Chương trình khi tiến hành phép trừ ảnh sẽ cho các giá trị khác nhau và hệ
nhận dạng được cài đặt trong nghiên cứu này cũng thực hiện thống sẽ xác định hai ảnh này là khác nhau. Ngoài ra cần chú ý
theo cách trên để tìm ra ảnh mẫu gần nhất với ảnh của bàn tay bố trí các LED sáng này hợp lý để có được độ sáng nền cho
điều khiển từ đó điều khiển các động của xe lăn. ảnh ổn định, tránh tình trạng ánh sánh không đều như Hình 14
dưới đây.
III. THỰC NGHIỆM
Biện pháp đầu tiên để giảm nhiễu, sai trong quá trình nhận
dạng ảnh như đã trình bày ở phần II có thể kể đến là thực hiện
bàn để tay. Mục đích của việc làm này là nhằm tránh chụp
thêm các sự vật không mong muốn dẫn đến nhiều, sai không
cần mong muốn trong quá trình nhận dạng. Bên cạnh đó bàn để (a) (b)
tay cũng là nơi đặt tay của người điều khiển. Như thế người Hình 14. Ảnh bàn để tay khi được chiếu sáng không tốt do các
điều khiển sẽ thực hiện các cử chỉ điều khiển xe trong phạm vi LED được vì đặt quá gần.
bàn để tay giúp webcam có thể chụp ảnh chính xác. Ngoài ra Ảnh nhị phân ở Hình 14 (b) cho thấy độ chiếu sáng không
đây còn là điểm tựa đặt tay giúp tránh mỏi tay cho người sử tốt. Nguyên nhân là do các LED được đặt quá gần.
dụng. Tiếp theo chúng tôi tiến hành thực nghiệm chụp ảnh và so
sánh các trạng thái của bàn tay với tập ảnh mẫu.
− Thực nghiệm 1: khi so sánh một cử chỉ điều khiển
không đúng với tập các ảnh mẫu.
(a) (b)
Hình 11. Bàn để tay có bố trí LED chiếu sáng. Hình 15. Hình ảnh mẫu đặt tay không đúng so với các mẫu gốc
Trong trường hợp ảnh chụp được từ webcam ở những điều và đã được xử lý.
kiện khác nhau có thể gây ra sai số rất lớn trong quá trình so Ảnh chụp bàn tay từ webcam sẽ được chuyển sang ảnh nhị
sánh ảnh. Vì thế bàn để tay bố trí thêm các LED làm nhiệm vụ phân. Ảnh nhị phân thu được sẽ bị nhiễu do ảnh hưởng của môi
chiếu sáng giúp ổn định độ sáng nền của ảnh chụp. Để có được trường do đó ta cần làm mịn ảnh. Hình 16 mô tả kết quả ảnh
các ảnh chụp thuận lợi cho việc so sánh thông qua phép trừ ảnh nhị phân trước và sau khi làm mịn để giảm bớt
thì các LED cần bố trí hợp lý. Kết quả thực nghiệm khi bố trí nhiễu.
đèn LED như Hình 16.
(a) (b)
Hình 16. (a) Ảnh nhị phân chưa làm mịn.
Ảnh có LED nền Ảnh không có LED nền (b) Ảnh sau khi làm mịn.
Ảnh nhị phân sau khi được làm mịn, loại bớt nhiễu sẽ được
(a) (b)
chia làm 4 phần như trình bày ở phần II. Sau đó các phần của
Hình 12. Hai ảnh thực tế giữa có LED nền và không có LED nền.
ảnh sẽ được so sánh lần lượt dữ liệu tương ứng trong tập các
ảnh mẫu. Các kết quả so sánh ở các hình từ Hình 17 đến Hình
20 cho trình bày việc so sánh ảnh chụp tay điều khiển khi so
sánh với tập các ảnh mẫu.
(a). Ảnh có LED nền (b). Ảnh không có LED nền

đã được xử lý. đã được xử lý.
Hình 13. Hai ảnh nền đã được xử lý.
Hình 13 là ảnh chụp bàn để tay ở Hình 12 sau khi xử lý (a) (b)
chuyển sang ảnh nhị phân. Dựa vào các ảnh nhị phân này ta Hình 17. (a) Ảnh mẫu trạng thái “tay”.
thấy, mặc dù là 2 ảnh cùng 1 vị trí nhưng ở 2 điều kiện ánh (b) Ảnh chụp từ webcam.
498
498
Hình 17 cho kết quả so sánh hai ảnh này không giống nhau lệch về vị trí đôi chút. Khi đó chương trình nhận dạng ảnh sẽ
ở các phần: trên, dưới, trái và phải. xử lý như sau:
Sử dụng hàm đếm các pixel khác 0 (countNonZero) cho các
phần của ảnh chụp tay người sử dụng ta có:
A=countNonZero(GocTraiAnhNguoiDung)= 3740
B= countNonZero(GocPhaiAnhNguoiDung)=3560
C= countNonZero(GocTreniAnhNguoiDung)= 63605
D= countNonZero(GocDuoiAnhNguoiDung)= 11348
Ta có các phần ảnh mẫu của tay:
A1=countNonZero(GocTraiAnhMauGoc)= 3740
(a) (b) B1= countNonZero(GocPhaiAnhMauGoc)= 3560
Hình 18. (a) Ảnh mẫu trạng thái “tay cái”.
C1= countNonZero(GocTreniAnhMauGoc)= 61500
(b) Ảnh chụp từ webcam .
D1= countNonZero(GocDuoiAnhMauGoc)=11800
Hình 18 cho kết quả so sánh hai ảnh này không giống nhau
Thực hiện việc trừ ảnh ch từng phần ảnh tương ứng và lấy
ở các phần: trên, dưới, trái và phải.
giá trị tuyệt đối ta được:
SoSanhTrai = A − A1 = 0 (1)
SoSanhPhai = B − B1 = 0 (2)
SoSanhTren = C − C1 = 2105 (3)
SoSanhDuoi = D − D1 = 452 (4)
(a) (b)
Hình 19. (a) Ảnh mẫu trạng thái “đấm cái”.
(b) Ảnh chụp từ webcam.
Hình 19 cho kết quả so sánh hai ảnh này không giống nhau
ở các phần: trên, dưới, trái và phải.
(a) (b)
Hình 20. (a) Ảnh mẫu trạng thái “nắm đấm”. Hình 21. (a), (c) Ảnh tay người sử dụng.
(b) Ảnh chụp từ webcam. (b), (d) Ảnh mẫu.
Hình 20 cho kết quả so sánh hai ảnh này không giống nhau Theo Hình 21 ta thấy phần ảnh trái và phải của 2 ảnh là hoàn
ở các phần: trên, dưới và trái. toàn giống nhau nên khi lấy giá trị tuyệt đối của hiệu số 2 giá
Dựa vào tất cả các kết quả so sánh với 5 mẫu tay gốc . Ta trị pixel khác không ta được kêt quả là 0 (công thức (1) và (2)).
kết luận ảnh mẫu đặt không đúng với bất kì mẫu gốc nào. Ở Kết quả cho phần ảnh trên và dưới có sự sai lệch so với ảnh
trạng thái này hệ thống sẽ tính toán, nếu số lần sai lệch liên tục mẫu nên khi tính giá trị SoSanhTren và SoSanhDuoi sẽ cho ra
3 lần sẽ phát đoạn âm thanh cảnh báo cho người dùng và cho 2 kết quả khác 0 (công thức (3) và (4)). Kết quả thực nghiệm
phép người dùng điều chỉnh lại tay điều khiển. cho thấy các giá trị này nằm trong khoảng sai lệch cho phép
Tương tự với trạng thái tay đặt không đúng, nếu trên bàn nhận dạng cử chỉ trong Bảng 2.
điều khiển có bất kì vật thể lạ nào thi sau khi được xử lý cũng Bảng 2. Phạm vi nhận dạng chuẩn của hiệu hai góc ảnh.
sẽ cho kết quả tương tự và sẽ cảnh báo nếu liên tục 3 lần lấy
mẫu liên tiếp vẫn không nhân dạng được cử chỉ. Phần ảnh Giá trị sai số cho phép (pixel)
Trong thực tế ảnh tay người dùng điều khiển và ảnh mẫu Góc trên < 5500
gốc mặc dù đặt đúng trạng thái như yêu cầu nhưng vẫn có sự Góc dưới < 500
sai lệch về vị trí cũng như ảnh hưởng của môi trường khác Góc trái < 4000
nhau. Thực nghiệm Hình 21 sẽ cho ta thấy rõ sự sai lệch đó. Góc phải < 2500
Trên Hình 21 ta có (a) ảnh tay người sử dụng và (b) ảnh Nếu lấy một ảnh bất kì so sánh với chính nó thi các giá trị
mẫu gốc. Hai ảnh này tương đối giống nhau vì người sử dụng so sánh trên, dưới, trái, phải sẽ là 0. Nhưng trong thực tế do có
mặc dù để tay đúng trạng thái yêu cầu nhưng nhưng còn sai sự sai lệch vị trí đặt tay nên những giá trị so sánh thường không
499
499
HộiHội
ThảoThảo Quốc
Quốc Gia
Gia 2015về
2015 vềĐiện
ĐiệnTử,
Tử,Truyền
TruyềnThông
Thông và
và Công
CôngNghệ
NghệThông
ThôngTinTin
(ECIT 2015)
(ECIT 2015)
bằng không. Dựa vào điều này, để có thể so sánh 2 ảnh chúng − Phần cứng: nâng cấp thêm cảm biến siêu âm xung
ta cần đặt khoảng giới hạn cho từng vùng ảnh so sánh một quanh nhằm cảnh báo cho người dùng khi có vật cản bất
khoảng tương đối. Khoàng giới hạn này được tính toán dựa ngờ hay đường rẽ bị giới hạn. Tiếp tục khảo sát tính toán,
trên thực nghiệm để có được độ chính xác cao nhất. chọn lựa sử dụng động cơ chuyên dụng có công suất cao
hơn giúp xe hoạt động tốt hơn.
IV. KẾT QUẢ − Phần mềm: tiếp tục nghiên cứu, áp dụng các giải thuật
Nghiên cứu đã thực hiện thành công xe lăn được điều khiển nhận dạng ảnh tốt hơn phù hợp với tài nguyên của hệ
bằng trạng thái của bàn tay. Hình ảnh thực tế của xe lăn được thống.
thiết kế như Hình 22.
V. KẾT LUẬN
Nội dung bài viết đã trình bày việc thiết kế, chế tạo và thử
nghiệm xe lăn được điều khiển dựa trên việc nhận dạng ảnh
trạng thái của bàn tay. Thiết kế sử dụng Intel Galileo chạy hệ
điều hành Linux làm board xử lý trung tâm, kết hợp với một
webcam làm nhiệp vụ chụp ảnh bàn tay điều khiển. Chương
trình nhận dạng ảnh và điều khiển hệ thống viết bằng ngữ
Python. Xe lăn được thiết kế hoạt động ổn định, ít phụ thuộc
vào điều kiện chiếu sáng và có giá thành hợp lý (khoảng 10
triệu đồng). Tuy nhiên sản phẩm cần được tiếp tục hoàn thiện
thêm để có thể đáp ứng nhu cầu tự đi lại của của những người
gặp khó khăn trong di chuyển.
Hình 22. Hệ thống xe lăn trong thực tế. [1] Báo Việt Nam Net - vietnamnet.vn, 17/04/2015. URL:
http://vietnamnet.vn/vn/doi-song/232841/dot-quy--nhung-con-so-am-
Những khó khăn trong quá trình thực nghiệm, vận hành hệ anh-o-viet-nam.html
thống đã được chúng tôi lần lượt giải quyết. Kết quả thực [2] Báo Khoa Học TV – khoahoc.tv, URL:
nghiệm việc nhận dạng trạng thái của tay phục vụ mục đích http://khoahoc.tv/timkiem/%C4%91i%E1%BB%81u+khi%E1%BB%83
điều khiển xe lăn như Hình 23. n+xe+l%C4%83n/index.aspx
[3] NCBI, URL:
http://www.ncbi.nlm.nih.gov/pmc/articles/PMC2788504/
[4] Geni, 10/11/2014, URL:
http://www.geni.com/people/Christopher-Reeve/6000000000558881209
[5] Báo Thanh Niên – thanhnien.com, 12/06/2011, URL:
http://www.thanhnien.com.vn/khoa-hoc/dieu-khien-xe-lan-bang-luoi-
401069.html
[6] Báo Đà Nẵng điện tử – baodanang.vn, 21/04/2014, URL:
http://www.baodanang.vn/channel/5418/201404/gs-nguyen-hung-mong-
xe-lan-thong-minh-som-den-viet-nam-2322983/
[7] Báo Tuổi Trẻ online – tuoitre.vn, 30/03/2014, URL:
http://tuoitre.vn/tin/giao-duc/khoa-hoc/20140330/xe-lan-da-nang-dieu-
khien-bang-dau/600556.html
Hình 23. Biểu đồ xác suất nhận dạng đúng trong 20 lần thực nghiệm [8] Báo Cần Thơ online – baocantho.com.vn, 06/12/2011, URL:
với mỗi mẫu trạng thái của bàn tay điều khiển. http://baocantho.com.vn/?mod=detnews&catid=185&id=93361
Quan sát biểu đồ trên có thể thấy xác suất nhận dạng đúng [9] Wikipedia – en.wikipedia.org, 17/10/2013, URL:
cử của tất cả các cử chỉ đều trên 90%, xác suất nhận biết đúng https://en.wikipedia.org/wiki/Intel_Galileo
cử chỉ giữa việc điều khiển bằng tay trái và tay phải là tương [10] Semiconvn – semiconvn.com, URL:
đối giống nhau, do có sự sai khác vị trí khi đặt tay và điều kiện http://www.semiconvn.com/home/tin-tuc-vi-mach/san-pham-cong-nghe-
ánh sáng môi trường nên xác suất nhận dạng đúng không đạt vi-mach/6964-tren-tay-bo-mach-galileo-cua-intel-tai-ces-2014-.html
100%. [11] Arduino in Cộng đồng Việt Nam – arduino.vn, URL:
Các đoạn video ghi lại quá trình thử nghiệm xe lăn có thể http://arduino.vn/bai-viet/254-bai-1-gioi-thieu-so-luoc-ve-intel-galileo
xem tại: [12] Logitech – logitech.com, URL:
https://www.youtube.com/watch?v=XhlKb4x9CVU http://www.logitech.com/en-us/product/hd-pro-webcam-c920
https://www.youtube.com/watch?v=G8I8Egqgkbo [13] Texas Intruments – ti.com, URL:
http://www.ti.com/lit/ds/symlink/lm2596.pdf
Hướng cải tiến, tiếp tục hoàn thiện hệ thống mà chúng tôi
sẽ tiếp tục thực hiện như sau: [14] Intel – intel.com, URL:
http://newsroom.intel.com/docs/DOC-4413
[15] Stackoverflow – stackoverflow.com, URL:
500
500
HộiHội
http://stackoverflow.com/questions/2546273/play-a-wave-file-in-linux [23] Srishti, Prateeksha Jain, Shalu, Swati Singh, "Design and Development
[16] People csail, URL: of Smart Wheelchair using Voice Recognition and Head Gesture Control
System", International Journal of Advanced Research in Electrical,
http://people.csail.mit.edu/rywang/handtracking/s09-hand-tracking.pdf Electronics and Instrumentation Engineering Vol. 4, Issue 5, pp.4790-
[17] Endadget – endadget.com, 22/07/2013, URL: 4798, May 2015.
http://www.engadget.com/2013/07/22/leap-motion-controller-review/ [24] Rakhi A. Kalantri, D.K. Chitre, "Automatic Wheelchair using Gesture
[18] Nasati, URL: Recognition", International Journal of Engineering and Innovative
Technology (IJEIT) Volume 2, Issue 9, pp. 216-218, March 2013.
http://data.vista.gov.vn:9000/kqnc/kq_chitiet.asp?id=12423
[25] Vijendra P. Meshram, Pooja A. Rajurkar, Mohini M. Bhiogade,
[19] Pei Jia, Huosheng H. Hu, Tao Lu, Kui Yuan, "Head gesture recognition Arundhati C. Kharabe, Dhiraj Banewar, "Wheelchair Automation Using
for hands‐free control of an intelligent wheelchair", Industrial Robot: Head Gesture", International Journal of Advanced Research in
An International Journal, Vol. 34 Iss: 1, pp.60 - 68, 2007. Computer Science and Software Engineering, Volume 5, Issue 1, pp.
[20] Gunda Gautam, Gunda Sumanth, Karthikeyan K C, Shyam Sundar, 641-646, January 2015.
D.Venkataraman, "Eye Movement Based Electronic Wheel Chair For [26] Bhaurao Patil, Disha Tharval, Rajendra Pawar, Aditya Datar, Akanksha
Physically Challenged Persons, International Journal Of Scientific & Bhargawa, 'Microcontroller Based Wheelchair", International Journal of
Technology Research Volume 3, Issue 2, pp. 206-212, February 2014. Electrical and Electronics Research, Vol.3, Issue 2, pp.99-101, April -
[21] Neena Mani, Aby Sebastian, Alen Mathews Paul, Alex Chacko, Anupa June 2015.
Raghunath, "Eye Controlled Electric Wheel Chair" International Journal [27] Chhaya.G.Patil, Sayali.K.Gharge, Sonal.V.Modhave, Y.S.Angal,
of Advanced Research in Electrical, Electronics and Instrumentation "Design Of Wheelchair Using Finger Operation With Image Processing
Engineering Vol. 4, Issue 4, pp 2494-2497, April 2015. Algorithms", International Journal of Research in Engineering and
[22] Sandeep, Supriya, "Gesture Controlled Wheel-Chair: A Review", Technology, Volume: 03 Issue: 02, pp.232-237, February 2014.
International Advanced Research Journal in Science, Engineering and
Technology (IARJSET) Vol. 2, Special Issue 1, pp. 27-31, May 2015.
501
501
DANH SÁCH TÁC GIẢ
A Hoàng Xuân Dậu 348

Nguyễn Thiện An 159 Nguyễn Trọng Ngô Du 461
Nguyễn Quốc Anh 18 Nhật
Lưu Hồng Dũng 112,232
Trần Quang Anh 30
Lương Thế Dũng 327
Trần Minh Anh 96, 276
Hoàng Anh Dũng 456
Chế Viết Nhật Anh 125
Chu Tiến Dũng 466
Nguyễn Hoàng Tú Anh 130
Phùng Mạnh Dương 450
Nguyễn Thị Kim Anh 253
Nguyễn Hà Dương 92
Lê Tuấn Anh 18, 293
Lê Anh Tuấn Dương 425
Nguyễn Tuấn Anh 327
Trịnh Thanh Duy 206
Lê Thị Ngọc Anh 348
Trần Trung Duy 152, 471, 477,
Sử Kim Anh 388 482, 488
Phạm Hoàng Anh 425 Lê Đình Duy 130
B Đ
Lương Đức Bằng 1 Hoàng Đình Đại 140
Võ Nguyễn Quốc Bảo 466, 471, 477, Huỳnh Tấn Đạt 24
482, 488 Phạm Tiến Đạt 425
Journeet Bernard 394
Ngô Thành Đạt 461
Ngô Huy Biên 212
Phạm Gia Điềm 425
Nguyễn Bình 240
Đinh Điền 206, 336
Phùng Phú Bình 273
Phan Ngọc Điệp 282
Nguyễn Quốc Bình 303
Hoàng Văn Đông 399
C Huỳnh Quang Đức 71
Nguyễn Doãn Cường 194
Trịnh Quang Đức 262
Hà Xuân Cường 330
Nguyễn Việt Đức 425
Nguyễn Lê Cường 399
Lê Quốc Cường 403,409 G
Trần Phú Cường 415 Nguyễn Tiền Giang 112
Nguyễn Mạnh Cường 456 Đặng Thị Hương Giang 257
Hồ Văn Cừu 77,466 H
Nguyễn Thanh Hà 30
D
Ung Nho Dãi 119 Lương Quang Hải 36
Lương Xuân Dẫn 41 Trần Thị Thanh Hải 45
Lương Vinh Quốc Danh 107 Vũ Hải 45
502
502
Chu Văn Hải 165 Nguyễn Thị Thanh Hương 1

Nguyễn Nam Hải 384 Trịnh Thị Hương 394
Nguyễn Hoàng Hải 420 Phan Văn Huy 437
Lương Tuấn Hải 437
J
Đỗ Thị Thu Hằng 358 Meunier Jean 222
Tân Hạnh 152
K
Đỗ Đức Hào 369 Hà Hoàng Kha 309
Hoàng Ngọc Hiển 60 Trần Văn Khẩn 267
Huỳnh Xuân Hiệp 60 Nguyễn Trương Khang 175
Đỗ Xuân Hiếu 140 Nguyễn Xuân Khánh 51
Nguyễn Trung Hiếu 248 Đặng Lê Khoa 175
Đỗ Chí Hiếu 456 Hồ Văn Khương 477
Nông Thị Hoa 288 Nguyễn Phan Kiên 358
Nguyễn Thị Thái Hòa 488 Huỳnh Như Kiên 443
Đoàn Quang Hoan 13 Nguyễn Phan Kiên 456
Nguyễn Quang Hoan 45 Trương Trung Kiên 1
Phạm Khắc Hoan 322 Tăng Chí Kiệt 403
Chử Đức Hoàng 140
L
Trần Văn Hoàng 200 Phạm Đăng Lâm 461
Võ Đức Hoàng 222
Đồng Thị Ngọc Lan 82
Quách Công Hoàng 450
Nguyễn Ngọc Lan 394
Trần Mạnh Hoàng 488
Đào Văn Lân 178
Nguyễn Văn Huân 353
Đào Duy Liêm 41, 236
Đỗ Công Hùng 7
Trần Lê Tâm Linh 71
Nguyễn Quốc Hùng 45
Nguyễn Thuỳ Linh 288
Trần Công Hùng 66
Trần Hoài Linh 146
Phạm Trọng Hùng 182 Trịnh Văn Loan 342
Tạ Quang Hùng 309 Nguyễn Thế Lộc 194
Nguyễn Kiêm Hùng 431 Lê Đức Lộc 200
Đặng Thế Hùng 482 Bùi Xuân Lộc 24
Phạm Thanh Hùng 494 Phạm Hoàng Lượm 494
Huỳnh Hữu Hưng 222
M
Nguyễn Xuân Hưng 288 Nguyễn Ngọc Minh 136
Huỳnh Hữu Hưng 378
N
Lê Duy Hưng 409
Hoàng Văn Nam 45
Trần Đức Hưng 456
503
503
Phạm Văn Nam 146 Võ Quế Sơn 309

Nguyễn Tất Nam 303 Nguyễn Đạt Sơn 363
Nguyễn Đức Nam 431 Nguyễn Thanh Sơn 415
Lê Nguyên Ngân 363 Lê Bảo Sơn 425
Nguyễn Thái Nghe 159, 388
T
Trương Công Nghi 125 Nguyễn Văn Tài 420
Dung
Trần Đức Tân 36
Trịnh Bảo Ngọc 30
Nguyễn Văn Tảo 87, 353
Phạm Thị Đan Ngọc 477
Lâm Hồng Thạch 394, 420
Nguyễn Trọng Nguyên 378
Lê Văn Thái 322
Nguyễn Tấn Nhân 102
Lê Nhật Thăng 87
Võ Ngọc Nhân 443
Nguyễn Xuân Thắng 30
Nguyễn Lương Nhật 41, 236, 466,
477 Vũ Chiến Thắng 87
Nguyễn Đình Minh Nhật 443 Nguyễn Toàn Thắng 227
Lê Thị Như 140 Cao Minh Thắng 240
P Hoàng Mạnh Thắng 240
Lâm Tấn Phát 363 Huỳnh Việt Thắng 253
Nguyễn Xuân Phi 66 Trần Trọng Thắng 262
Lê Quang Phú 152 Nguyễn Trọng Thắng 273
Nguyễn Quang Phúc 130 Ngô Đức Thành 130
Hoàng Văn Phúc 178, 267 Lê Đình Thành 165
Võ Văn Phúc 314 Nguyễn Trung Thành 297
Trần Thanh Phước 206 Vũ Đình Thành 369
Võ Thị Lưu Phương 18 Nguyễn Thị Hương Thảo 136, 206
Nguyễn Hữu Phương 186 Vũ Thị Thuý Thảo 288
Q Nguyễn Thị Thanh Thảo 336
Nguyễn Ngọc Quân 240 Huỳnh Lê Minh Thiện 77
Nguyễn Hồng Quang 342 Lưu Gia Thiện 152, 482
Phạm Minh Quang 471 Ngô Đức Thiện 227
Trần Cao Quyền 318 La Văn Thiện 437
S Huỳnh Quốc Thịnh 190
Vũ Văn San 87, 136 Nguyễn Trường Thọ 253
Hà Văn Sang 82 Nguyễn Duy Thông 262
Nguyễn Hồng Sang 222 Nguyễn Thị Anh Thư 130
Lê Đình Sơn 112 Trần Đan Thư 212
504
504
Truong Duc Thuan 358 Trương Phong Tuyên 494

Sái Văn Thuận 267
U
Nguyễn Đức Thụy 112, 232 Lê Ngọc Uyên 297, 314
Nguyễn Thị Minh Thy 236
V
Hồ Phước Tiến 125 Nguyễn Năng Vân 119
Vũ Hữu Tiến 136 Hùng
Nguyễn Thị Thanh Vân 450
Vũ Hỏa Tiễn 178
Hoàng Văn Việt 232
Phan Thanh Toàn 194
Đặng Anh Việt 450
Đoàn Văn Toàn 425
Hồ Xuân Vinh 336
Nguyễn Thị Trâm 107
Ngô Quang Vinh 369
Ngô Thị Thu Trang 82
Trần Quang Vinh 431, 450
Hoàng Trang 200, 369, 461
Trần Thanh Vũ 77
Nguyễn Thị Trang 327
Cao Văn Vũ 314
Phạm Minh Triển 257
Phan Thanh Vy 293
Nguyễn Chiến Trinh 96, 276
Đỗ Đăng Trình 77 Y
Vũ Văn Yêm 394
Nguyễn Linh Trung 36
Hứa Thị Hoàng Yến 175
Hồ Đức Trung 330
Hà Duyên Trung 437
Đinh Văn Trường 314
Quách Xuân Trưởng 288
Bùi Thế Truyền 232
Trần Minh Tú 140
Nguyễn Thanh Tú 175
Bùi Trọng Tú 186, 190
Tran V. Tuan 169
Pham V. Tuan 169
Phạm Minh Tuấn 119
Đỗ Hồng Tuấn 125
Huỳnh Văn Tuấn 175
Hoàng Anh Tuấn 186
Phạm Văn Tuấn 282, 330, 443
Nguyễn Quang Tuấn 309
Đinh Văn Tuấn 399
Đỗ Trọng Tuấn 425, 437
Nguyễn Anh Tuấn 13
505
505

về ĐIỆN TỬ, TRUYỀN THÔNG
và CÔNG NGHỆ THÔNG TIN
Proceedings of The 2015 National Conference
ECIT 2015
Chịu trách nhiệm xuất bản

GIÁM ĐỐC - TỔNG BIÊN TẬP
PHẠM NGỌC KHÔI
Biên tập và sửa bản in: Nguyễn Minh Châu

Họa sĩ bìa: Đặng Nguyên Vũ
NHÀ XUẤT BẢN KHOA HỌC VÀ KỸ THUẬT

70 Trần Hưng Đạo - Hoàn Kiếm - Hà Nội
ĐT: 04 3942 2443 Fax: 04 3822 0658
Website: http://www.nxbkhkt.com.vn Email: nxbkhkt@hn.vnn.vn
CHI NHÁNH NHÀ XUẤT BẢN KHOA HỌC VÀ KỸ THUẬT

28 Đồng Khởi - Quận 1 - TP. Hồ Chí Minh
ĐT: 08 3822 5062
In 200 bản, khổ 20.5 x 29 cm, tại Công ty TNHH In Thanh Bình.
Địa chỉ: Số 234 - Đường K2 - Phường Cầu Diễn - Quận Nam Từ Liêm - TP. Hà Nội.
Số ĐKXB: 3736 - 2015/CXBIPH/01 - 147/KHKT.
Quyết định XB số: 166/QĐXB - NXBKHKT, ngày 03/12/2015.
Mã ISBN: 978-604-67-0635-9.
In xong và nộp lưu chiểu Quý IV năm 2015.
506
Đ ÍNH CHÍNH
KỶ YẾU HỘI THẢO QUỐC GIA 2015 VỀ ĐIỆN TỬ,

TRUYỀN THÔNG VÀ CÔNG NGHỆ THÔNG TIN
TT Số trang Đã in Đính chính
1 62
2 64
Đ ÍNH CHÍNH

1 62
2 64
Đ ÍNH CHÍNH

1 62
2 64

Ecit15proceedings 151211020048

Uploaded by

Document Information

Original Title

Copyright

Available Formats

Share this document

Share or Embed Document

Sharing Options

Did you find this document useful?

Is this content inappropriate?

Copyright:

Available Formats

Ecit15proceedings 151211020048

Uploaded by

Copyright:

Available Formats

HỘI VÔ TUYẾN ĐIỆN TỬ VIỆT NAM HỌC VIỆN CÔNG NGHỆ BƯU CHÍNH VIỄN THÔNG

SÁCH KHÔNG BÁN NHÀ XUẤT BẢN KHOA HỌC VÀ KỸ THUẬT

Proceedings of The 2015 National Conference

Tối ưu hoá lưu trữ nội dung trong mạng ICN

Thủy vân trên mô hình 3D

Gán nhãn ngữ nghĩa trong song ngữ Anh-Việt

Phát triển lược đồ chữ ký số mù

Một Phương Pháp Dịch Từ Mới Trong Dịch Máy Hoa-Việt

Về một phương pháp xây dựng hệ mật mã lai ghép

Mạng thế hệ mới – Tương lai của Internet và truyền thông

Phân tích tỷ số tín hiệu/ tạp của hệ thống radar mimo

Hiệu năng mã hóa với tập lệnh AES-NI

Đánh giá bộ nhãn ngữ nghĩa LLOCE

Dự báo dịch tả dựa trên mô hình học máy phân lớp

Thiết kế chế tạo thiết bị sưởi ấm máu và dịch truyền

Nghiên cứu và thiết kế chip xử lý đa nhân sử dụng Multi2Sim

Hệ Thống Gợi Ý Bài Báo Khoa Học

Danh sách tác giả...................................................................................................................... 502

TS. Vũ Văn San

BAN CHỈ ĐẠO

BAN CHƯƠNG TRÌNH

Lê Tuấn Anh, Đại Học Thủ Dầu Một

Quy Hoạch Tần Số Cho Hệ Thống Thông Tin Di Động

Mr. Đoàn Quang Hoan

Cục Trưởng Cục Tần Số Vô Tuyến Điện,

Enabling Technologies for Future Sustainable Optical

Dr. Tetsuya Miyazaki

Photonic Network Research Institute (PNRI)

Prof. Huỳnh Hữu Tuệ

Build Tomorrow’s 5G Systems Today

Kỹ sư ứng dụng,

Hiệu quả sử dụng năng lượng của

[3] J. Hoydis, S. ten Brink, and M. Debbah, “Massive MIMO in

Giải pháp ánh xạ thích nghi cho hệ thống OFDM

2.3. Thiết kế các bộ ánh xạ tín hiệu 16-QAM

CU LY BIT 1 CU LY BIT 2 CU LY BIT 3 CU LY BIT 4

1101 1011 1000 1100 1101 1011 1000 1100

Gray modified mapping

0100 0101 0110 0111

(b) SP mapping [1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16]

Hình 4. Các sơ đồ ánh xạ 16-QAM truyền thống

hiệu quả của giải pháp thích nghi trên.

0101 0001 0000 0100 0101 0001 0000 0100

Gauss tại SNR=10 dB, constellation của bộ tín hiệu bị xoay

Hệ thống AOFDM-BICM-ID được thích nghi trên cơ sở các

BICM-ID so sánh với việc sử dụng mã Convolution hay Turbo

Science ISSN 1009-3095.

Quy hoạch tần

Macro Micro Pico Hot

Điều kiện sử dụng Bit/s/Hz Tốc độ

Nhu cầu Nhu cầu phổ tần cho

TӔI ѬU HÓA LѬU TRӲ NӜI DUNG TRONG

NguyӉn Quӕc Anh1, Võ Thӏ Lѭu Phѭѫng2, Lê Tuҩn Anh3

và min_transit. Ǥ ෍ ‫ݏ‬௠ ‫ݔ‬௠ ൑ ܵǡ

dung ÿѭӧc tính bҵng “

dung có giá trӏ

Hình 1. T͑ l͏ hit theo ߙ

Hình 3. L˱u l˱ͫng n͡i dung theo ߙ.

ACKNOWLEDGMENT forest for the trees,” in ACM Workshop on Hot Topics in

iu Phi Tác V Trong H Thng MAP-REDUCE

Hình 3: Kt qu trưng hp  = 100

Ứng dụng tối ưu hóa đa mục tiêu trong bài toán tự

Phương pháp SOOA

và min_transit. Ǥ ෍ ‫ݏ‬௠ ‫ݔ‬௠ ൑ ܵǡ